Панорама

Сетевой адаптер LR-LINK PCIE 100GB позволяет добавить в конфигурацию системы два порта 100GbE

Современные приложения и сервисы предъявляют достаточно высокие требования к скорости, производительности …

«Нейронные сети и машинное обучение приведут к ускорению развития»: ведущий IT-эксперт Аралтан Горяев оценивает будущее индустрии

Недавно в Дубае на Всемирном правительственном саммите один из крупнейших предпринимателей заявил …

Сетевые фильтры Powercom: оптимальная защита вашей электроники

Сложно представить себе современную квартиру или офис без большого количества электрических розеток. Их всегда …

Корпоративная мобильность: тренды, подходы, реализация

Возможность мобильной работы с документами удобна для сотрудников, но также экономически выгодна компании …

МТС запустил сервис для работы с документами SmartDocs

ПАО «МТС» цифровая экосистема, объявила о запуске сервиса SmartDocs. Новое решение повысит эффективность …

IBM Content Analytics доступен в России

PC Week/RE №17 (767) 21 июня 2011

Сергей Свинарев | 03.06.2011

Дмитрий Лактионов: “Требования Content Analytics к аппаратным ресурсам нельзя назвать экстраординарными”

Все алармистские заявления об экспоненциальном росте объемов собираемых и хранимых данных мало связаны с ростом объемов традиционных БД, хотя и этот фактор играет здесь свою роль. В основном же накапливаются огромные массивы неструктурированной информации: текстов, аудио- и видеозаписей, фотографий, результатов медицинской диагностики и т. д. Анализ неструктурированной информации, в частности текстовой, реализован в целом ряде продуктов. Один из них — IBM Content Analytics был представлен руководителем направления ECM московского офиса IBM Дмитрием Лактионовым.

Продукт этот появился на рынке в ноябре 2010 г., а с марта нынешнего года стал доступен в России. Он объединяет функции известной системы Cognos Content Analytics, средства корпоративного поиска информации в разнородных источниках IBM OmniFind и построен на базе архитектуры UIMA (Unstructured Information Management Architecture). Поддерживается широкий спектр типов сырых данных, включая реляционные БД разных вендоров, системы управления контентом, порталы, форумы, блоги, системы обмена сообщениями, корреспонденцию e-mail и т. д. Анализ текстов позволяет выделить в них определенные сущности, выявить взаимосвязи между ними, произвести классификацию и на этой основе оценивать успешность маркетинговых кампаний, узнавать эмоциональный характер откликов на те или иные инициативы компании либо государственного органа. Руководитель IBM по направлению ECM в Центральной и Восточной Европе Мартин Свик даже привел пример анализа эффективности работы call-центра, для проведения которого записи речевого обмена были автоматически преобразованы в текст и затем обработаны инструментами Content Analytics. Впрочем, как пояснил г-н Свик, подобное преобразование не является стандартной функциональностью продукта IBM, а выполняется с помощью дополнительного модуля, созданного независимым разработчиком.

Аналогичные модули потребуются и для анализа, учитывающего особенности предметной области или отраслевую специфику исследуемого контента. Еще одна задача, которая может быть решена подобным образом, — это извлечение метаданных (автор, название, продолжительность, ключевые слова) из мультимедийных файлов с целью их вовлечения в аналитическую обработку. По словам Дмитрия Лактионова, требования Content Analytics к аппаратным ресурсам нельзя назвать экстраординарными: как правило, используются 2–4-процессорные серверы стандартной архитектуры с 8 Гб оперативной памяти. Стоимость готовой системы во многом будет определяться сложностью ее настройки на конкретную область применения, которую обычно осуществляют либо сами специалисты заказчика, либо квалифицированные партнеры IBM. Продукт локализован для русского языка на базовом лексическом уровне. С учетом новизны продукта неудивительно, что внедрений систем на его основе в нашей стране пока нет.

Печать Печать без изображений

IBM Content Analytics доступен в России

Дмитрий Лактионов: “Требования Content Analytics к аппаратным ресурсам нельзя назвать экстраординарными”

Комментарии