Так ли страшен машинный перевод?
Так ли страшен машинный перевод?

И клиенты, и переводчики относятся к нему с опаской, а он развивается бурными темпами и потихоньку завоевывает мир. Будем учиться жить с этим?

Последние 10 лет мы в агентстве переводов «Таск Форс» работали исключительно с ручным переводом, беспощадно наказывая исполнителей за читинг в сторону машинного.

Еще бы: согласно международному переводческому стандарту ISO 17100, по которому мы сертифицированы, полноценный ручной перевод должен быть выполнен тремя лингвистами, работающими «паровозиком», – переводчиком, профессиональным редактором, разбирающимся в тематике перевода, и корректором, который просматривает текст на наличие описок и возможных грамматических ошибок.

Но изучив мировые тенденции и общаясь с глобальными лидерами отрасли, мы поняли, что ландшафт изменился и что за границей давно уже предлагают некий гибридный продукт – translation with a human touch, в котором участие человека есть, но оно минимально. Куда же движется мир и чего ожидать клиентам?

Все серьезно: качество работы с машинным переводом текста регулируется отдельным ISO

Хорошая новость в том, что качество машинного перевода растет из года в год, как и количество провайдеров, предлагающих машинные движки. Однако без участия человека машины еще делают серьезные смысловые и другие ошибки, поэтому human touch, то есть участие постредактора, (пока) обязателен.

В мире с 2017 года уже даже есть специальный стандарт ISO 18587, который стандартизирует предоставление услуг постредактирования машинного перевода. В данный момент есть разные подходы к качеству постредактирования. Лайт-версия (light post-editing) предполагает корректировку грамматики и пунктуации без углубления в стилистику и может хорошо подойти для текстов, которые нужны только для ознакомления. А полная версия (full post-editing) помимо этого включает в себя и частичную корректировку стилистических ошибок. Этот результат уже вполне можно использовать в объемных и срочных проектах, где человеческий перевод слишком дорого стоит либо нецелесообразен с точки зрения сроков. Ведь скорость работы постредактора – в три раза выше скорости работы переводчика.

Движки машинного перевода – стоковые и кастомные

Вы же, правда, не думали, что машинный перевод – это только Google-переводчик? Правильно. Он не один, их много. Недавно глобальная компания-агрегатор, Intento, выпустила свой ежегодный отчет по развитию машинного перевода и в нем замеряла результаты работы 15 движков в различных языковых парах и тематиках. Эти самые движки – это, по сути, искусственный интеллект, который, оказывается, можно обучать и получать лучшие результаты работы.

Есть стоковые, а есть кастомные (которые поддаются кастомному обучению) движки. Массивы данных, накапливаемые компаниями, могут использоваться для тренировки внутренних движков, качество работы которых после такой тренировки существенно растет. Эти улучшения (в виде редакторской дистанции, то есть сколько изменений необходимо внести человеку-редактору после машинного перевода) замеряются и автоматически (по принятым метрикам hLEPOR, BLEU, TER, BERTscore, ROUGE), и вручную, оценщиками. Все это делается для того, чтобы из многих движков-кандидатов выбрать самый лучший или несколько хороших движков под компанию, отрасль и ее специфический текст. В общем, все очень серьезно и технологично, не сомневайтесь. Еще и дорого с точки зрения инвестиций.

Мы в «Таск Форс» уже начали проект тренировки машинных движков под себя в определенных, самых популярных языковых парах и тематиках. Это позволит в скором времени предложить идеальное по скорости и качеству решение для срочных и объемных проектов. Когда есть необходимость перевести много и быстро, человеческий перевод становится проблемой, ведь все, что переводчики могут перевести по-разному, они и переведут по-разному. И глоссарий не всегда спасает, ведь невозможно зарегулировать им каждый мельчайший термин. Выход в том, чтобы перевести машиной (желательно тренированной машиной, хотя успех мероприятия сильно зависит от языковой пары и тематики) весь объем и далее перевод уже однородного качества передать на вычитку постредактору или постредакторам. Теперь 100 страниц за 3 дня в нормальном качестве – больше не проблема!

Что переводить машинным переводом?

Тут мнения расходятся. Согласно отчету Intento от 5 августа 2020 года, лучше всего поддаются машинному переводу в большинстве языковых пар юридические тексты, тексты сферы телекоммуникаций и ИT. Маркетинговые и PR-тексты, описательные, художественные – те самые крепкие орешки, которые пока не удается раскусить. Именно поэтому ручной перевод, по нашему мнению, в ближайшее время никуда не денется и только прибавит в цене, так как станет штучным hand made. А большинство переводчиков сменят профессию на постредакторскую. Тем не менее на недавней конференции LocWorld представители Ebay в своем докладе говорили о том, что практически весь контент платформы переводят машинным переводом (и даже используют «сырой» вариант для заголовков объявлений и другого контента, который молниеносно устаревает или меняется), но юридические тексты по старинке переводят исключительно вручную и каждый такой текст вычитывает юридический отдел компании.

Касательно языковых пар Intento сообщает, что в большинстве  движков можно получить предсказуемое и более-менее сравнимое качество перевода в парах с испанским, русским, китайским и французским языками. А вот для турецкого, японского и финского нужен более осторожный выбор движка. От себя добавим, что украинский язык тоже нельзя отнести к простым, поэтому качество его сырого перевода обычными стоковыми движками, которые мы в «Таск Форс» пробовали, оставляло желать лучшего.

Как не обжечься на машинном переводе?

Мы считаем, что выбор сценария перевода (ручной или машинный с различными уровнями контроля качества) полностью зависит от цели, стоящей перед текстом, и обязательно уточняем у клиента эту цель, прежде чем предложить варианты. Свою роль также играют языковая пара и тематика текста. Изучив документ и оценив его внутренними силами, мы обычно рекомендуем клиенту наиболее походящие в его случае опции перевода.

Если клиент выбирает опцию машинного перевода, а не ручного, обязательно предоставляем первую готовую страницу перевода на ознакомление и подтверждение продолжения работы. Как и всегда, неизменная фишка «Таск Форс» – партнерский подход и вовлечение клиента в процесс.

А как вы относитесь к машинному переводу? Есть ли уже опыт его использования? И как он вам?

Оставить комментарий