Компания Pivotal, занимающаяся цифровой трансформацией предприятий, объявила о выпуске обновлений пакета Pivotal Big Data Suite: был обновлен корпоративный дистрибутив Pivotal HD для Apache Hadoop, и до 100 раз была ускорена производительность решений для аналитики, в том числе решения Pivotal Greenplum Database, поставляемое с Pivotal Query Optimizer — современным оптимизатором для больших данных. Доработки помогут заказчикам справиться с резким ростом объемов наборов данных вследствие использования мобильных устройств, социальных сетей, облачных технологий и «Интернета вещей», а также выполнять сложные запросы этих наборов данных с беспрецедентно высоким уровнем скорости, масштабируемости и гибкости.

Пакет Pivotal Big Data Suite — это ПО с открытым кодом, доступное по подписке. В пакет входят современные программные продукты для вертикального масштабирования и поддержки новых эффективных моделей архитектур данных. Pivotal соединяет в одном пакете ведущие функции обработки данных, продвинутые системы аналитики и набор специализированных приложений, помогающих предприятиям получить значимую аналитическую информацию и улучшить работу пользователей, обеспечивая необходимую стабильность и безопасность.

Для существенного повышения производительности Pivotal Greenplum Database и Pivotal HAWQ в пакет добавлен новый инструмент Pivotal Query Optimizer — современный оптимизатор запросов для больших данных. Тесты показывают, что Pivotal Query Optimizer позволяет существенно повысить производительность Pivotal HAWQ, подсистемы SQL-on-Hadoop, и Pivotal Greenplum Database.

Пакет Pivotal Big Data Suite включает первую версию Pivotal HD на базе ядра Open Data Platform (ODP), а также важные обновления компонентов Apache Hadoop (включая Apache Spark). Пакет Pivotal Big Data Suite предоставляет заказчикам более высокий уровень стабильности, управляемости, безопасности, мониторинга и обработки данных в системе Hadoop. Теперь предприятия смогут перенести в Hadoop больше критически важных рабочих нагрузок, хранить и обрабатывать большие объемы данных с меньшими затратами и в строгом соответствии с нормативными требованиями и корпоративными политиками.

Теперь Pivotal HD основан на стандартизированном ядре Open Data Platform, включающем Apache Hadoop 2.6 и Apache Ambari. Pivotal HD обновляет существующие компоненты Hadoop для создания сценариев и обработки запросов (Apache Pig и Apache Hive), нереляционных баз данных (Apache HBase), а также базовой координации и оркестрации рабочих процессов (Apache Zookeeper и Apache Oozie). Pivotal HD дополнен ядром Apache Spark и библиотекой машинного обучения.

Pivotal HD содержит дополнительные компоненты Hadoop для обеспечения безопасности (Apache Ranger (инкубация), Apache Knox), мониторинга (Nagios, Ganglia в дополнение к Apache Ambari) и обработки данных (Apache Tez).

Пакет Pivotal Big Data Suite позволяет компаниям модернизировать инфраструктуру данных, получить новую значимую информацию при помощи современных средств аналитики и создавать приложения с использованием ряда ведущих продуктов для управления данными, предлагаемых по стандартной цене подписки. В него включены недавно выпущенные сервисы приложений, которые дают разработчикам возможность использовать базы данных SQL и NoSQL, обработку в памяти и среды обработки в реальном времени для обеспечения высокой доступности и отказоустойчивости стратегически важных инновационных приложений. Компоненты пакета Pivotal Big Data Suite могут быть развернуты на стандартном оборудовании, специальных программно-аппаратных комплексах, в виртуальной среде, а также в публичном, частном или гибридном облаках.