Машинный перевод: достаточно ли он правилен для работы правительства?
Даже такие программы для пользователей как Skype Translator облегчают общение людей, которые разговаривают на разных языках, правительство пытается сделать информацию доступной для всех, независимо от знания английского языка.
В прошлом году Департамент занятости заакцентировал внимание на том, что соблюдение законов в борьбе с дискриминацией включает в себя предоставление информации на языках, на которых общаются меньшины в обществе, включая и малоизвестные языки. Эти требования могут включать в себя перевод бумажных документов, веб-страниц, интернет-приложений, тектов, твитов и других социальных средств массовой информации.
"Очень редко, если вообще такое случалось, чтоб мы использовали машинный перевод без помощи квалифицированного переводчика, который проверяет перевод, чтоб убедиться правильно ли он переводит главный смысл сообщения", - отмечает предъявитель.
Но это не всегда можно из-за дефицита трудовых ресурсов в агенствах.
Все больше растет количество государственных орагнов, от федеральных до муниципальных, которые используют машинный перевод для своих производств и сотрудников.
И Департамент налоговой администрации Нью-Хемпшира, и департамент для слепых и слабовидящих в Вирджинии (DBVI) используют технологию машинного перевода, включая ссылки на Google Translate, чтоб помочь пользователям перемещаться по веб-сайтам. Вы можете отказаться от таких услуг, а для безопасности пользователей существует предупреждение, что такие переводы не являются официальными. В случае с Нью-Хемпширом, сайт отмечает, что "переводы предоставляются так как есть", отмечая, что некоторые страницы могут быть неточно переведены из-за ограничений программного обеспечения. DBVI находится на шаг впереди, утверждая, что "будет учитывать только английскую версию при принятии решений в суде".
Государственные органы Фейрфакс используют Google Translate, чтоб обеспечить своим веб-сайтам информацию на 90 языках, от африкаанс до зулу. Но отмечают, что нет полной гарантии в точности перевода текста, и некоторые файлы, к примеру, графические с текстом и PDF-файлы не могут быть переведены.
Однако, в некоторых случаях машинного перевода недостаточно. Армия достигла определенных успехов в применении компьютерной помощи для переводчика медицинских процедур.
Когда-то военные начали подготовку докторов в Афганистане, было всего лишь несколько медицинских пособий, на местном языке, дари, и несколько людей, которые знали английский и афганский языки, учитывая несколько медицинских терминов и это очень мешало осуществлению надлежащего медицинского обслуживания.
Используя машинный переводчик, ученых по компьютерным наукам и афганских докторов, армия смогла собрать 6000 медицинских фраз на языке дари и вложить их в медицинские справочники для афганских медицинских бригад. Книги напечатали и распространили с помощью андроид-приложения "Army Phrase Book", который был сделан с целью расширения уже известной базы.
"Компьютеры никогда не заменят переводчиков, но мы ищем методы, чтоб облегчить их труд, особенно когда малоизвестные языки, такие как дари, пушту и сербский", - рассказала Мелисса Холланд, глава многоязычных вычислительных исследований армии США в исследовательской лаборатории программ.
По базам данных перевода, предложениями можно будет обмениваться и использовать повторно, экономя время и усилия, и зависеть это будет от небольшого числа двуязычных экспертов, рассказал Стив ЛаРокка, ученый и глава команды ARL.
"Наши люди ежедневно переводили в Кореи приблизительно с 1951 года, но мы не сохранили данные за то время", - рассказывает ЛаРокка. "Знания, полученные всеми теми людьми за все те года пропали".
Многословное содержание
Некоторые сайты, такие как сайт Всемирной цифровой библиотеки, не переводят содержание, они предоставляют информацию на нескольких языках. Все навигационные инструменты, метаданные, описание контента и Twitter-каналы предоставляются на семи языках: арабском, китайском, английском, французском, португальском, русском и испанском.
Сайт получает данные и описание информации на разных языках, но использует английский язык для своей работы, рассказывает Джейсон Эснер, производственный директор для МЦБ, DigitalGov.
"Таким образом, мы столкнулись с тем, что мы называем подготовительным этапом в процессе перевода, когда мы переводим все неанглийские данные на английский язык", - рассказывает Эснер. Этот переведенный материал пересматривают и отправляют профессиональным переводчикам для перевода на дополнительные шесть языков мировой цифровой библиотеки. Книги, рукописи, карты и другие первичные материалы на сайте, не переведены, поскольку представлены на языке оригинала.
Некоторые рекомендуют остерегаться технологий машинного перевода. CapturaGroup, компания, которая концентрируется на испаноязычной цифровой связи, рекомендует использовать и оригинал, и перевод материалов - иногда это называют творческой адаптацией - то есть пересказ содержания и адаптация перевода к реалиям страны, для которой осуществляется перевод.
Для людей, которые пытаются выучить испанский язык в США, CapturaGroup рекомендует двуязычные сайты с оригинальными испанскими текстами, написанные специально для испаноязычного населения США, и в дальнейшем при необходимости адаптируется к местному рынку, к примеру мексиканской испанской в Южной Калифорнии. В качестве примера веб-сайта, который использует английский и испанский языки, компания CapturaGroup приводит сайт www.GobiernoUSA.gov.
Несмотря на то, что машинный перевод все еще не может заменить переводчика, стоит отметить значительный прогресс в этой сфере. Национальный институт науки и техники оценивает машинный перевод, уделять особое внимание исследованию ограничений системы перевода, а также ограничениями в оценке неофициальной лексики.
Сначала Открытая оценка машинного перевода NIST в 2015 году оценит аудио и письменные переводы с арабского и китайского языков на английский, в том числе SMS/чат и телефонные разговоры. В отличие от предыдущих лет, не будет никаких официальных правил оценки.