машинный перевод « ABBYY Language Services

Статьи, отмеченные тегом ‘машинный перевод’

Гуртовщики по вызову

Мы регулярно публикуем в этом блоге статьи о прогрессе в сфере машинного перевода. Однако не менее регулярно машинные переводчики производят перлы, над которыми потешается весь Рунет. Классика жанра – «гуртовщики мыши», «наша кошка родила трех котят – двух белых и одного афроамериканца», «Obama is to blame». В общем, неисчерпаемый источник интернет-мемов.

Около года назад большой отклик в Сети получила шедевральная переозвучка фильма Стивена Содерберга «The Girlfriend Experience» («Девушка по вызову»), выполненная питерской студией «Кубик в кубе». Произошло примерно следующее: заказчик, решив сэкономить, сделал машинный перевод субтитров фильма на русский и отправил озвучивать. Ребята из студии долго доказывали заказчику, что присланный перевод – это «тупо набор слов», заказчик говорил, что все ОК, что так и надо и все там хорошо. Тогда «Кубики» озвучили этот набор слов. Получилось настолько смешно, что про эту переозвучку написали десятки блогов, а ролик с кусочком фильма на Youtube собрал 114 тысяч просмотров. Читать далее…

SDL + Language Weaver: машинный перевод наступает!

На прошлой неделе в мировой индустрии языковых услуг произошла очередная важная сделка – SDL купила Language Weaver. Напомню, что SDL входит в пятерку крупнейших в мире переводческих компаний, а Language Weaver – один из известных разработчиков коммерческого ПО для машинного перевода.

В течение года перед объединением SDL и Language Weaver были стратегическими партнерами. Компании имели несколько крупных общих клиентов (Adobe, Dell, Intel и Siemens), работая с которыми, приобрели большой опыт интеграции своих продуктов. Читать далее…

Стратегия Google в сфере лингвистических технологий

Любопытное видео – два гуру лингвистических технологий, Майк Коэн и Франц Ох, рассказывают об исследованиях Google, связанных с распознаванием речи и машинным переводом. Речь идет не о каких-то конкретных продуктах, а о том, зачем вообще Google вкладывается в лингвистические технологии и какие задачи собирается с их помощью решать. Читать далее…

Как Google Translate увеличивает спрос на профессиональный перевод

Не боитесь ли вы, что в один прекрасный день машинный перевод оставит профессиональных переводчиков без работы? Мне, как сотруднику переводческой компании, часто приходится отвечать на этот вопрос. Особенно часто – после сообщений о совместном машинном переводчике IBM и Lionbridge, который, как ожидается, будет стабильно выдавать перевод «приемлемого качества».

Нет, мы не боимся. Машинный перевод в обозримом будущем не вытеснит профессиональный, поскольку они не конкурируют, а дополняют друг друга. И повсеместная доступность бесплатного машинного перевода «приемлемого качества» парадоксальным образом увеличивает спрос на профессиональный человеческий перевод. Постараюсь объяснить почему. Читать далее…

IBM совершает прорыв в области машинного перевода

Неделю назад IBM и Lionbridge (одна из крупнейших в мире переводческих компаний) объявили о стратегическом партнерстве в сфере лингвистических технологий. Такое сотрудничество с большой вероятностью приведет к заметному скачку в качестве машинного перевода, и в перспективе может оказать на нашу повседневную жизнь влияние не меньше, чем появление Google Translate. К сожалению, в России эту новость не заметил вообще никто – мне не удалось найти ни одного упоминания в российских блогах или СМИ. Постараюсь восполнить этот пробел.

IBM является разработчиком перспективного движка для статистического машинного перевода (в конце концов, именно в IBM в конце 1980-х изобрели эту технологию). Статистический перевод основан на анализе больших объёмов параллельных текстов на разных языках; чем больше в распоряжении имеется параллельных текстов, и чем точнее они соответствуют друг другу, тем лучше результат статистического машинного перевода. Для того чтобы «обучить» свою систему переводить лучше Google (а всё, что хуже Google, невозможно монетизировать), IBM нужны параллельные тексты. Много параллельных текстов. Читать далее…