Новые продукты помогают переводить основной смысл содержания глобальных интрасетей

Джефф Моуд

По свидетельству биографов, выдающийся математик XIX века Чарльз Бэббидж пытался убедить британское правительство в необходимости финансировать его исследования по разработке “вычислительной машины”. В числе прочих благ он обещал, что когда-нибудь эта машина сможет автоматически переводить разговорную речь. Но, хотя сегодня Бэббидж и считается признанным автором множества идей, лежащих в основе работы компьютера, он так и не сумел ни построить свою машину, ни выполнить обещания по поводу машинного перевода.

И сегодня эта идея по-прежнему остается в значительной степени нереализованной. Однако в последнее время благодаря появлению Интернет как платформы глобальной связи она вновь начала привлекать широкое внимание и инвестиции. Крупные публичные Web-узлы и службы, такие, как Alta Vista и CompuServe, приступают к масштабному эксперименту с технологиями машинного перевода (МП), которые позволят переводить документы и содержимое Web “на лету”. ИТ-менеджеры многих транснациональных корпораций и учреждений, как, например, World Bank, начинают использовать ПО МП для перевода содержания глобальных интрасетей. И хотя технологии машинного перевода по-прежнему страдают множеством недостатков, многие организации вновь стали серьезно относиться к обещанию Бэббиджа.

“Машинный перевод все еще далек от совершенства, но любой желающий с его помощью сможет по крайней мере понять основной смысл документа”, - считает Луи Монье, технологический директор Alta Vista, крупного поискового Web-узла, который начал эксперимент с машинным переводом в онлайновом режиме.

Сейчас пользователи Alta Vista имеют возможность бесплатно получать онлайновый перевод первых 250 слов, содержащихся на выбранном ими Web-узле или в документе. Для этой цели используется работающее на 10-процессорном сервере Sun ПО фирмы Systran S.A. (Суасису-Монморанси, Франция), являющейся пионером в области МП. По словам Монье, эта система, расположенная в Сан-Матео (шт. Калифорния), позволяет обслуживать несколько сот запросов в день, причем спрос на услуги службы перевода в первый же день превысил все ожидания работников Alta Vista. “Мы были просто ошеломлены. Люди жаждут узнать, что делается вокруг, даже если об этом написано на другом языке”, - говорит он.

Еще раньше экспериментами с МП занялась служба CompuServe (Колумбус, шт. Огайо). Она предложила услуги по переводу на некоторых своих онлайновых форумах. Впервые это было сделано еще в 1994 г. на форуме MacCIM, посвященном обсуждению общей информационной модели Macintosh. Сейчас CompuServe обеспечивает переводом шесть форумов (которых всего около тысячи), используя для этого ПО Transcend фирмы Transparent Language (Холлис, шт. Нью-Гэмпшир). Мери Флэнеган, менеджер CompuServe по передовым технологиям, утверждает, что услуги по переводу пользуются спросом там, где предлагаются, и к тому же они помогают решить проблему роста трафика на подобных форумах. Компания также предлагает онлайновый машинный перевод документов по требованию при цене 1 цент за слово. (Компании, привлекающие для аналогичных целей людей-переводчиков, берут сейчас около 25 центов за слово.)

Программные механизмы машинного перевода, такие, как Systran и Transcend, работают примерно по тому же принципу, что и программы распознавания речи. Обычно функционирующие на базе серверов, они разбивают слова, фразы и предложения на части, выделяют их значение и контекст, а затем воссоздают их на другом языке. Менее сложные механизмы перевода, подобные тем, что используются в портативных устройствах, как правило, просто переводят слова или фразы и больше подходят для работы с короткими предложениями. Изощренные же механизмы, в том числе Systran, разработка которого в 50-х годах в значительной мере финансировалась из бюджета вооруженных сил США, основываются на более сложных методах вычислительной лингвистики и подходят для перевода довольно длинных и сложных предложений. В состав таких механизмов обычно входят объемные словари. Как правило, эти продукты работают на мэйнфреймах или других больших и дорогих машинах.

Но если методы, лежащие в основе МП, за последние сорок лет почти не изменились, то вычислительные платформы за это время значительно подешевели, а последние годы, кроме того, ознаменовались появлением World Wide Web. Поставщики систем МП, такие, как Systran, Transparent Language, фирма Globalink (Файрфакс, шт. Вирджиния) и корпорация Logos (Санта-Клара, шт. Калифорния), включили в свои продукты Web-интерфейсы, обеспечив при этом их интеграцию с ПО групповой работы и электронной почтой. Это позволяет им применять механизмы МП для перевода Web-страниц, электронных писем и онлайновых разговорных сеансов. Globalink и Transparent Language, кроме того, перевели свои продукты на 32-разрядную платформу Windows NT, а новый механизм Barcelona фирмы Globalink к тому же позволяет легко осуществлять тонкую настройку правил и словарей, что способствует повышению точности перевода.

Несомненно, средства машинного перевода никогда не смогут улавливать все смысловые нюансы оригинального текста. Различия в синтаксисе и семантике, особенно между западными и восточными языками, - скажем английским и китайским - слишком велики для этого. Даже сторонники МП признают, что он способен в лучшем случае передать основную суть документа.

“Мы обеспечиваем примерно 80-процентную точность”, - говорит Дэвид Греко, вице-президент фирмы Linguistix (Сан-Франциско), специализирующейся на МП (недавно эту фирму приобрела компания Bowne).

Однако встречаются и такие машинные переводы, об адекватности которых просто не приходится говорить. Не так давно еженедельник PC Week запросил английский перевод одного немецкого пресс-релиза. Результат нас весьма озадачил.

Английский вариант выглядел примерно так: “В третий раз за 15 месяцев фирма Sytek, которая задумала в числе прочих дел ПК для сети IBM и к также вовлеченному Голубому Гиганту, должна была сократить свой штат. Число служащих недавно уменьшилось приблизительно на 46 человек, дойдя до 450. Краткий комментарий представителя сотрудников фирмы: Мы не могли достигнуть всех наших коммерческих целей”.

Для некоторых заказчиков такой уровень перевода просто неприемлем. “Машинный перевод - это миф, - считает Линн Сешедри, консультант одной из служб корпорации Electronic Data Systems (Плейно, шт. Техас), принимавший участие в создании глобальной интрасети компании. - Возможно, он годится для технической документации, но во всех остальных случаях вы получаете 15% смысла и 85% ерунды”. Для перевода содержания своей интрасети EDS пользуется услугами профессиональных переводчиков на контрактной основе.

Однако других машинный перевод вполне устраивает, в значительной степени потому, что часто ему просто нет реальных альтернатив. Парижский фонд “За развитие гуманизма” (FPH) в свое время также стоял перед выбором: тратить ли существенную часть своего бюджета на переводчиков или испробовать средства машинного перевода. Эта организация, финансируемая из частных источников, выпускает доклады по экологии, экономике и ряду других областей, привлекая для их создания интернациональные коллективы ученых. Ее выбор пал на технологию машинного перевода, а точнее, на продукт фирмы Globalink, представляющий собой вполне качественное и недорогое приложение для ПК. FPH установил его на сервер электронной почты, чтобы общение специалистов, говорящих на разных языках, было проще и эффективнее.

“Это хорошее решение, - считает Марина Урквиди, консультант из FPH. - Многие люди предпочли бы работать не на английском, а на своем родном языке. Теперь у них есть такая возможность”.

Она не отрицает, что машинный перевод имеет свои недостатки, однако убеждена, что если человек захочет, он сможет понять перевод, сделанный машиной. “Если вы немного подумаете, то сумеете понять, о чем идет речь”.

Таким образом, если не требовать от МП слишком многого, то, возможно, обещание Бэббиджа о машинном переводе все же исполнится.    

Переведите, пожалуйста

Когда речь идет о бизнесе, территориальный фактор не имеет значения, важно понимать друг друга. Поэтому при создании межнациональных многоязычных интра- и экстрасетей нужно иметь надежное средство перевода текстов. Приведем некоторые Web-узлы, которые могут помочь вам больше узнать о технологии машинного перевода (МП).

Американская ассоциация машинного перевода (The Association for Machine Translation in the Americas). Содержит коллекцию сведений о корпорациях и научных организациях, работающих в области технологий машинного перевода. Включает информацию о ежегодных конференциях AMTA по проблемам МП.

www.isi.edu/natural-language/amta.html

Корпорация Language Engineering. Провайдер услуг по онлайновому переводу с английского языка на японский. Тариф: три цента за английское слово. Компания также располагает работающими на ПК системами машинного перевода с японского языка на английский и обратно.

www.lec.com

MCB Systems. Американский дистрибьютор систем машинного перевода фирмы Trados (Штуттгарт, Германия). В сентябре прошлого года корпорация Microsoft приобрела 20% акций фирмы Trados.

www.mcbsys.com

Машинный перевод. Вводный курс (Machine Translation: An Introductory Guide). Онлайновый вариант книги о концепциях машинного перевода; включает словарь терминов и дополнительные ссылки.

CLessex.ac.uk/~doug/book/

Comprende. Новый узел фирмы Globalink, где предлагаются услуги по онлайновому переводу. Позволяет интерактивно переводить Web-страницы, сообщения, передаваемые по электронной почте и системам проведения тематических онлайновых конференций. Будет доступен по подписке, в настоящее время находится в свободном доступе на условиях онлайнового бета-тестирования.

http://comprende.globalink.com

Ссылки на тему МП. Коллекция ссылок на узлы производителей систем МП и университетов, ведущих исследования в этой области.

www.ife.dk/url-mt.htm