Saiba Por que o Facebook Usa o Hadoop e o HBase
Dhruba Borthakur, um engenheiro Hadoop no Facebook, está preparando um paper que explica os requerimentos do Facebook para armazenamento de dados para a sua aplicação, o Facebook Messages, e os motivos pelos quais ele escolheu o Apache Hadoop para o processo. O documento será publicado na SIGMOD 2011.
Os requerimentos:
- Elasticidade
- Alta taxa de transferência
- Eficiência e baixa latência de semântica de consistência forte dentro de um data center
- Eficiência em leituras aleatórias de um disco
- Alta disponibilidade e recuperação de desastres
- Isolamento de falhas
- Primitivas atômicas de leitura-modificação-escrita
- Range Scans
Os não-requerimentos:
- Tolerância de partições de rede em um único data center
- Inatividade zero em caso de falha individual do data center
- Capacidade ativa de servidor em direfentes data centers
Você pode conferir uma prévia do paper aqui. Ele foi escrito por Dhruba Borthakur, Kannan Muthukkaruppan, Karthik Ranganathan, Samuel Rash, Joydeep Sen Sarma, Jonathan Gray, Nicolas Spiegelberg, Hairong Kuang Dmytro Molkov, Aravind Menon, Rodrigo Schmidt e Amitanand Aiyer.
Ta meio zuado o post ;/
Nesses posts um poucos técnicos que tem coisas que não são muito triviais de traduzir vocês podiam pedir opinião de alguém mais da área.
Eu me disponho a ajudar/tirar dúvidas nesses casos.
Vim até esse post por causa do HBase do título, porém no texto não vi nada sobre…
HBase não seria uma base NoSQL? por isso do meu interesse, pois até o pouco que sei a base NoSQL utilizada pelo Facebook é o Apache Cassandra Oo
[]´s
me redimindo do comentário anterior, me confundi com os nomes das bases no SQL… o HBase é uma implementação de Hadoop 😛