Saiba Por que o Facebook Usa o Hadoop e o HBase

Dhruba Borthakur, um engenheiro Hadoop no Facebook, está preparando um paper que explica os requerimentos do Facebook para armazenamento de dados para a sua aplicação, o Facebook Messages, e os motivos pelos quais ele escolheu o Apache Hadoop para o processo. O documento será publicado na SIGMOD 2011.

Os requerimentos:

  • Elasticidade
  • Alta taxa de transferência
  • Eficiência e baixa latência de semântica de consistência forte dentro de um data center
  • Eficiência em leituras aleatórias de um disco
  • Alta disponibilidade e recuperação de desastres
  • Isolamento de falhas
  • Primitivas atômicas de leitura-modificação-escrita
  • Range Scans

Os não-requerimentos:

  • Tolerância de partições de rede em um único data center
  • Inatividade zero em caso de falha individual do data center
  • Capacidade ativa de servidor em direfentes data centers

Você pode conferir uma prévia do paper aqui. Ele foi escrito por Dhruba Borthakur, Kannan Muthukkaruppan, Karthik Ranganathan, Samuel Rash, Joydeep Sen Sarma, Jonathan Gray, Nicolas Spiegelberg, Hairong Kuang Dmytro Molkov, Aravind Menon, Rodrigo Schmidt e Amitanand Aiyer.

4 responses to “Saiba Por que o Facebook Usa o Hadoop e o HBase

  1. Nesses posts um poucos técnicos que tem coisas que não são muito triviais de traduzir vocês podiam pedir opinião de alguém mais da área.

    Eu me disponho a ajudar/tirar dúvidas nesses casos.

  2. Vim até esse post por causa do HBase do título, porém no texto não vi nada sobre…

    HBase não seria uma base NoSQL? por isso do meu interesse, pois até o pouco que sei a base NoSQL utilizada pelo Facebook é o Apache Cassandra Oo

    []´s

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *