Блог

Тест Тьюринга назначен на 14 февраля

Сергей Бобровский
11.02.2011 10:02:19
Теги: AI, IBM Watson, UIMA

На следующей неделе за приз в миллион долларов два профессиональных игрока будут биться с суперкомпьютером IBM Watson. Противостоять ему будут сильнейшие американские интеллектуалы: Ken Jennings, выигравший подряд 74 тура телевикторины Jeopardy для всезнаек, заработав на этом 2,5 млн. долл., и его коллега Brad Rutter -- рекордсмен по сумме призовых (3,25 млн. долл.). Предварительные туры в январе уже прошли, и компьютер победил достаточно убедительно.

Машина быстро отвечает на вопросы из самых разных сфер знаний. Она выполняет сложный поиск и производит весьма глубокий анализ текстовой базы. Ее потенциальный объем -- 15 Тб, хотя реальное количество информации, конечно, меньше (по неофициальным сведениям, до 500 Гб). Объем Интернета на сегодня составляет около 1 Тб, а человеческий мозг умещает 1000 Тб.

Видео январского тура.
А в этом ролике на 30-й секунде видно, как на фоне игрового зала по русски написано ДУМАЙ.

Справочно-энциклопедическая информация Watson проиндексирована по тематическим областям. Получив вопрос на обычном английском, система пытается понять его смысл, генерирует около сотни гипотез, и начинает параллельный аналитический поиск в базе, проверяя тысячи возможных ответов, и дополняя их статистическими оценками. До финиша добирается пятерка вариантов, которая для наглядности показывается зрителям шоу, и из нее Watson выбирает наиболее подходящий, по его мнению, ответ -- с учетом возможного штрафа за неверную попытку, то есть требуется еще как следует оценить игровые риски.

Интернетом Watson не пользуется, полностью автономен и связан с внешним миром только через модуль текстового ввода вопроса в ANSII-формате (некоторые СМИ поспешили заявить, что Watson распознает разговорную речь, сам выделяет вопросы ведущего и т. д., но это не так). Кроме того, для нажатия на сигнальную кнопку используется несложный автоматический механизм.

Watson поверхностно критикуют, что, дескать он больше похож на гигантский справочник, нежели на действительно рассуждающий комплекс. Но этот комплекс как раз весьма эффективно моделирует важные логические способности человека -- не просто выдает готовый шаблонный ответ, а как и все нормально рассуждающие люди, разумно пользуется своей памятью для нахождения подчас весьма нетривиальных ответов на свободно сформулированные вопросы на естественном языке. Наверняка в будущем Watson будет дополнен различными прикладными модулями логического вывода. Более того, Watson неплохо понимает и метафоры и неоднозначно или нечетко сформулированные вопросы.

Watson составлен из 90 Linux-кластеров Power 750 и насчитывает 2880 процессоров Power 7 суммарной производительностью 80 Тфлопс. На создание этого аппаратно-программного комплекса подразделение IBM Research потратило сто человеко-лет.

На первый взгляд, непонятно, зачем нужна такая вычислительная производительность, если система вроде бы преимущественно выполняет поиск по массиву текстов, пусть и весьма сложный. Дело в том, что Watson для нахождения достоверного ответа рассматривает множество вариантов, и для каждого из них запускает собственный аналитический процесс. С учетом того, что реагировать на вопрос надо быстро (люди отвечают за две-три секунды), и приходится организовывать интенсивный параллельный обсчет.

Более подробно про Watson и технологию поиска ответов deep question-answering можно почитать на сайте лаборатории.
В этой технологии, кстати, применяются наработки, вошедшие в открытую среду Apache UIMA для анализа неструктурированного контента, которая стандартизована консорциумом OASIS. Для нее также имеется масштабируемое расширение UIMA-AS для асинхронных middleware-архитектур.

Комментариев: 0

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

Интересно

Статьи

Руководство по блокчейн для руководителя
Технологии, лежащие в основе биткоина, являются наиболее перспективной линией развития Интернета. Расскажем, каким …

Цифровая трансформация: что нужно знать ИТ-директорам
Пока одни ИТ-директора разбираются с тем, что же такое цифровая трансформация и зачем она нужна, другие …

ИТ-департамент предприятия атомной отрасли — сам себе интегратор
Далеко не всем советским научно-производственным предприятиям удалось сохранить свои позиции в новых рыночных …

Большинство аналитиков по-прежнему составляют отчеты. И это не так уж плохо…
Несмотря на распространение гибких аналитических инструментов и платформ, в подавляющем большинстве …

“Наш принцип — ошибаться чаще”
Цифровая трансформация стала сегодня очередной мантрой аналитиков и консультантов, рассказывающих нам …

Мы в социальных сетях

PC Week/RE в Facebook PC Week/RE в Контакте PC Week/RE в Google+ PC Week/RE в Одноклассниках PC Week/RE в Twitter

Решения

Сборник статей «Как определить ценность Интернета вещей для бизнеса»
Internet of Things — тренд, который уже сейчас кардинально меняет бизнес во всем мире. И хотя некоторые до сих пор с …

Сервис — это наше «все» в прошлом, настоящем и будущем!
Сервисные центры ГК «Паладин» осуществляют различные виды обслуживания вычислительной техники Hewlett-Packard …

HP SM соединяет лучшие практики с жизнью
Множественный опыт российских и зарубежных компаний показали, что ПО для управления ИТ-услугами помогает упростить …

Администрация Стрежевого подключает к корпоративному документальному серверу eDocLib муниципальные учреждения
Единая информационная система Администрации городского округа Стрежевой (Томская область), базой для которой стали …

Распределительная теплосетевая компания «ОмскРТС» внедрила СЭД «ДЕЛО» в первый месяц своей хозяйственной деятельности
«Территориальная генерирующая компания № 11» (ОАО «ТГК-11»), одна из крупнейших теплоэнергетических бизнес-структур в …

Блог

Наступает ЭРА ГЛОНАСС
С 1 января 2017 года наступил новый этап в работе российской государственной системы Экстренного реа ...

"Гаражное" подразделение Microsoft идет по следам Google
Компания Microsoft представила "умный поиск" в персональном почтовом архиве - Email Insights. С его ...

Gitea предлагает разработчикам ПО совместное "чаепитие" в системе Git
Сразу после Нового года у программистов появилась возможность использования еще одной облачной систе ...

Google отказался от собственного беспилотного автомобиля
Руководство Google приняло решение прекратить разработку собственного беспилотного автомобиля.

В Мичигане могут ездить автомобили без водителей
Губернатор штата Мичиган Рик Снайдер (Rick Snyder) подписал в конце прошлого недели целый набор зако ...

 

Лидеры читательского рейтинга

Статьи

Записи в блогах

Панорама

Panasonic KX-NSX: UC-платформы повышенной актуальности
UC-платформы Panasonic KX-NSX с расширенной пятилетней гарантией позволяют обеспечить современной связью до 2000 и …
Принципиально новое унифицированное хранилище (NAS и SAN) от Infortrend. Вся система на двух юнитах
Хранение данных на сегодняшний день — это задача, которая не имеет стандартного решения. Современные технологии …

Интересно

 

Создание сайта - студия iMake
© 2017 АО «СК ПРЕСС».
Информация об авторских правах и порядке использования материалов сайта.
Правила поведения на сайте.

На главную PC Week/RE  |  Об издании  |  Архив номеров  |  Подписка на бумажную версию
Другие проекты «СК ПРЕСС»ITRNБестселлеры IT-рынкаByte/РоссияCRN/REIntelligent Enterprise/REPC Magazine/RE.