Человек и машина: заменит ли Google Translate профессионального переводчика?

Рэй Курцвейл, изобретатель и футуролог, предсказал, что машины, способные выполнять автоматический устный перевод, появятся в 2019 году. В 2029-м, по его мнению, машина-переводчик заменит человека, однако людям все равно придется изучать иностранные языки.

Первые шаги к этой реальности сделаны: в начале 2017 года компания Google презентовала новый переводчик на основе нейросети — искусственного интеллекта, способного к самообучению и работающего по принципу живого мозга. Впрочем, пока речь идет о мозге мыши. Но масштабировать такую сеть — дело не столь сложное.

 

На презентации нового переводчика Сундар Пичаи, генеральный директор Google, привел литературный пример — афоризм Борхеса:

«Uno no es lo que es por lo que escribe, sino por lo que ha leído».

Старый Google Translate перевел бы эту фразу на русский язык так:

«Одним из них является не то, что за то, что он пишет, но за то, что он прочитал».

Новый переводчик — так:

«Ты — не то, что ты пишешь, но то, что ты прочел».

Машинный переводчик «учится» на художественной литературе. Учитывая многозначность слов, оттенки смыслов, обилие художественных приемов, это непростая задача, и результат выдающийся. Вопрос в том, сможет ли Google Translate заменить «живых» переводчиков и как изменится рынок, если машинный перевод достигнет такого уровня?

 

Скорость, автоматизация процесса, удешевление перевода — важные для бизнеса преимущества

Автоматизированные решения для бизнеса уже разрабатывают: так, ABBYY LS и Xerox запустили совместный проект — сервис Xerox Easy Translator Service — и «научили» МФУ не только распознавать, но и переводить отсканированный текст.

Однако ни Google Translate, ни сервис Xerox пока не способны обеспечить достаточную точность перевода узкоспециальных текстов. Кто понесет ответственность за качество машинного перевода?

Перевод — это, прежде всего, ответственность. Неправильно истолкованные условия многомиллионного контракта повлекут существенный убыток для компании и могут привести к судебному разбирательству.

 

Человек vs. машина?

С развитием нейросетей отпадет потребность в первую очередь в низкоквалифицированных переводчиках: программа уже способна понять текст и в будущем будет только совершенствовать свой «навык». Она минимизирует человеческий фактор и выполнит основную работу. Но, как и за неопытным переводчиком, за результатом ее «труда» придется следить. Эту задачу возьмут на себя переводчики-редакторы, эксперты в конкретной отрасли.

 

Причины есть:

 

  1. На машину и ее разработчика нельзя возложить ответственность за неправильно подобранный синоним или слишком размытую формулировку. Ответственность несет переводчик или эксперт, редактирующий текст.
  2. Автоматический переводчик «учится» на том материале, который предлагают ему разработчики. В случае с Google Translate это художественная литература и тексты Канадского парламента. Для точного перевода юридической документации необходимы реальные договоры, служебные записки и другие подобные тексты. Даже обезличенные, без конкретных названий и имен, они представляют ценность и — нередко — коммерческую тайну. Согласятся ли юридические фирмы пожертвовать этой тайной и предоставить документы Google?

 

Пока технологии недостаточно развиты, машинный перевод не заменит человека при работе с юридическими, техническими, медицинскими текстами. Клиенты бюро переводов пока не готовы доверить искусственному интеллекту перевод многомиллионного контракта.

 

Человек & машина

Программные решения уже применяются в работе переводчика.

Для крупных проектов — от 2000 страниц — мы используем переводческую среду и системы автоматического перевода (CAT). Это технический инструментарий с унифицированной в рамках одного проекта терминологической базой и переводческой памятью. В ней хранятся все обработанные тексты проекта. Использование этого инструментария обеспечивает единообразный перевод терминов. Например, применительно к тексту договора “article” правомерно перевести как «пункт» и как «статья», но как только будет выбран один из этих вариантов, все переводчики и редакторы, задействованные на проекте, смогут его придерживаться.

 

Такие программы упрощают работу с текстами, но требуют участия человека. С их помощью можно перевести отдельно взятые слова и фразы. Если фраза, для которой уже составлен перевод, совпадает с другой, требующей обработки, на 70–80%, последнюю придется переводить заново.

 

С Google Translate работу можно было бы упростить, но тут снова возникает проблема обеспечения конфиденциальности: перевод, которому машина научилась на конкретных документах, будет доступен всем пользователям сервиса! А к переводческой памяти проекта получают доступ только те, кто работает над ним.

 

На наш взгляд, развитие технологий перевода корпоративных документов зависит в первую очередь от клиентов. Дело не только в финансах: компании смогут внести вклад в обучение локальной переводческой среды, предоставив свои тексты. Возможно, это будут крупные корпорации, заинтересованные в оптимизации бюджета. Возможно, и переводческие агентства, которые предоставят экспертов и станут технологическими партнерами.

 

Но даже решив проблему конфиденциальности, перевод нельзя полностью доверить машине. Переводчик станет выпускающим редактором, отвечающим за точность формулировок. Как это прокомментировали в статье в New York Times:

«Однако важно заметить, что из-за вероятностной природы нейросетей они подходят не для каждой задачи. Нет ничего страшного в том, чтобы определить 1% кошек как собак или отправить вас не на тот фильм, но когда дело доходит до самоуправляемых машин, мы не хотим рисковать».

Мы видим, что машинный перевод становится новой реальностью, и эта реальность нам нравится. У переводческого агентства в ней роль поставщика экспертных кадров и технологического партнера.