НовостиОбзорыСобытияIT@WorkРеклама
Идеи и практики автоматизации:

Блог

JBoss против Hadoop

Хочу дополнить статью Сергея Стельмаха о выходе Red Hat на рынок NoSQL-систем техническими деталями.
Кстати, несмотря на оборот в миллиард долларов, к концу июня акции Red Hat сильно просели, так как ее прибыль пока не соответствует ожиданиям. Однако несмотря на падеж курса, эта компания не намерена отказываться от намерения набрать до конца года еще тысячу(!) сотрудников.

[spoiler]Напомню, что платформа Red Hat JBoss Data Grid 6 теперь позиционируется как Big Data решение и включает СУБД-в-памяти, а разработчикам предлагаются REST-интерфейсы, memcache API, а также внутренний интерфейс Red Hat под названием HotRod -- двоичный протокол, работающий, как утверждается, быстрее чем memcached.

Важное отличие JBoss Data Grid 6 от других популярных систем -- принципиально другая архитектура, качественно отличная от тех, где применяется Hadoop, причем в лучшую сторону. Red Hat Data Grid обеспечивает полноценную транзакционную работу, к чему Hadoop сам по себе пока не способен (он ориентирован на пакетную обработку), и это делает JBoss пригодным для использования в э-коммерции и др. А базируется Data Grid на замечательной опенсорсной NoSQL-системе Infinispan, написанной, конечно, на Java.
Сергей Стельмах
Ох, прочитал Ваш пост, Сергей. От такого обилия технических деталей у меня закружилась голова :) Что-то похожее на интуицию мне подсказывает, что Вы не понаслышке знакомы с программированием. Отчего не пишите статьи? Но это вопрос может быть личным, на него необязательно отвечать. Если будет у Вас желание, хотелось бы еще узнать о Hbase из Вашего поста, а то мои гуманитарные представления об этой технологии никак не позволяют мне понять в чем ее отличие от Hadoop.
Сергей Бобровский
Ну да, занимаюсь и программированием, и проектированием... Статьи не пишу, потому что они требуют значительно больших, в разы, временных усилий, нежели пост аналогичного объема в блоге. Расценки же на статьи, увы, давным давно отстали от темпов роста зарплаты программистов.

Hadoop -- это фреймворк, набор тесно интегрированных подсистем, оптимизированных для работы в распределенном режиме. В число этих подсистем входит HBase -- движок базы данных.
Сергей Стельмах
Понятно. Теперь знаю больше о HBase :)