Как известно, во время краш-тестов автомобили погибают. С объектами наших
предыдущих краш-тестов ничего подобного, к счастью, пока не произошло. Но что если
мы дадим движкам совершенно невыполнимое задание — попытаться выудить смысл из
бессмыслицы? Машинный перевод — это алгоритм, нацеленный на поиск смысла даже в
тексте, полном опечаток. А значит, будет изо всех сил пытаться найти порядок в хаосе. Что
из этого выйдет?
Нам поможет знаменитый сочинитель текстов в жанре «нонсенс» Льюис Кэрролл и
его стихотворение из «Алисы в Зазеркалье». Оно неоднократно переведено на русский.
Но известнее всех перевод Дины Орловской, впервые опубликованный в 1967 г. Там
стихотворение называется «Бармаглот».
Его анализ может быть интересен по нескольким причинам.
Во-первых, любопытно, насколько системы МП будут ориентироваться на
привычные переводы имен персонажей этого стихотворения (кроме Бармаглота, там
фигурирует Брандашмыг).
Во-вторых, посмотрим, сколько смысла получится вытащить из несуществующих
слов у разных движков.
И в-третьих, в сегодняшнем краш-тесте впервые участвует китайский продукт —
система Baidu. Посмотрим, какие результаты она даст. Как и в автомобильной сфере, это с
некоторых пор стало особенно интересно.
Напоминаем: краш-тест изначально смертельный, так что мы не ждем от движков
совершенно гладкого результата. Итак, поехали!
Первым заподозрил неладное Google. И уже название стихотворения Jabberwocky
он перевел как Бессмыслица. А вот Яндекс и DeepL учли сложившуюся традицию и
предложили перевод Бармаглот. Позже, когда название этого существа встречается
немного в другой форме (Jabberwock), Google тоже переводит его как Бармаглот, к тому
же он единственный опознал Брандашмыга. Baidu же решил, что надо дать что-то в
американском стиле, и назвал чудище Джабер Уокер.
В первом четверостишии у автора особенно много бессмыслицы. Так что DeepL,
PROMT и ModernMT (частично Google и Baidu) вообще решили с ней не связываться и
оставить как есть (вдруг это вставка из другого языка?). Что ж, разумный и осторожный
выбор. Microsoft и Яндекс неизвестные слова частично транслитерировали. Это все же
лучше, чем гладкая шляпа или скользкие булочки, как Baidu и Google перевели слова
slithy toves. Хотя надо отдать должное Google (а вместе с ним и Яндексу), slithy очень
похоже на скользкие.
Интересен перевод заключительной строчки: And the mome raths outgrabe. По
мнению Google и Microsoft, это кого-то перехитрила мама. DeepL посчитал, что это
переиграли крыс (вероятно, кошки?). По мнению PROMT, это ополчились кротовые венки
(что в мире Шалтая-Болтая, конечно, может быть). А вот ModernMT просто выдал
медицинско-философское и мумие превзойдет истину.
Во втором четверостишии интересны попытки движков найти перевод
прилагательному frumious в словосочетании frumious Bandersnatch (у Орловской
злопастный Брандашмыг):
- для Google он яростный (furious),
- для Microsoft и Яндекса — жуткий и отвратительный (от hideous?),
- для DeepL и PROMT — фрустрированный и ошеломленный (но откуда, Холмс?!),
- для ModernMT — сумасшедший (правильно, чего мелочиться!).
И, наконец, Baidu перевел все словосочетание емкой фразой чертов оркестр.
Красивый перевод для vorpal sword (в недавнем голливудском фильме — вострый
меч) предложил DeepL. Для него это меч-скорпион. Все остальные ограничились
транслитерацией.
Далее, для врага в словосочетании manxome foe движки предложили такие
эпитеты:
- Google и Яндекс — мужественный/человекоподобный (mansome?),
- DeepL— злобный (meansome?),
- ModernMT — маневренный (дорогой Human-in-the-Loop, расскажи почему, очень интересно);
- Baidu — могущественный (логика непонятна, но красиво).
В четвертом четверостишии наконец появляется главный антигерой стиха,
Бармаглот. В оригинале это происходит так: Came whiffling through the tulgey wood, // And
burbled as it came! Любопытно, что в последней строчке (глагол burbled) Google слышит
бормотание, Microsoft и DeepL — рычание, Яндекс — бульканье, ModernMT бурчание. А
Baidu безапелляционно и грамматически неверно (хоть и логично, см. глагол burp)
заявляет: Идите, отрыгните!
Как погиб пресловутый Бармаглот? У автора так: The vorpal blade went snicker-snack!
Лучше всего здесь DeepL: Лезвие пронзило его насквозь! У Google лезвие пошло
наперекосяк. У ModernMT клинок пошалил, а Яндекс поясняет, как именно пошалил: он
стал хихикать-закусывать. С последним более или менее согласны и Microsoft с PROMT,
которые тоже обратили внимание на snack. Baidu вообще решил наплевать на остатки
грамматики (почему нет, раз автору можно?) и вместо изъявительного использовал
побудительное наклонение, превратив фразу в призыв к клинку: подкрадывайся к
закускам! Речь, видимо, о Джабер Ворке (он же Джабер Уокер в начале перевода), т. е. о
Бармаглоте.
Когда Бармаглот повержен, его победителя поздравляют, называя beamish boy.
Красивые и очевидные переводы для beamish дают Google и Яндекс (лучезарный
мальчик), Microsoft и ModernMT (сияющий мальчик). Для Baidu мальчик просто милый, а
для DeepL почему-то это мальчик-лучник.
Интересно, что движки по-разному оценивают гибель Бармаглота. Фразу O frabjous
day! Google, Microsoft и DeepL считают выражением радости. Для них этот день чудный,
прекрасный и великий, что лучше вяжется с общим тоном стиха. А для Яндекс, PROMT и
ModernMT этот же день ужасный, чертов и безумный. Baidu вообще понял все по-
своему: «Ааа, День Брата!», — говорит он, что бы это ни значило.
Сам победитель выражает свою радость так: He chortled in his joy. Глагол chortled,
на наш взгляд, лучше всего передать словом хохотнул. Примерно так и делают Google,
Яндекс и ModernMT: у них мальчик захохотал, захихикал и хмыкнул (последний вариант
удачнее). Для PROMT победитель хохотал, у DeepL и Baidu смеялся. И только у Microsoft
появилось бурлил.
Подведем итоги:
1) Сложившуюся традицию перевода полнее всех учел Google. Близки к нему
оказались результаты Яндекса и DeepL. Остальные движки не нашли в сети
многочисленные упоминания о Бармаглоте.
2) Если движки не могут ни найти перевод слов, ни предположить опечатку
(ошибку в 1–2 буквах), они чаще всего считают такие слова вставками на другом
языке и не переводят их. Как вариант, они могут их транслитерировать. Упорнее
всего транслитерацией занимался Microsoft (похоже, его девиз Translit them
all!). Baidu, наоборот, так активно стремится найти перевод, что лучше бы он
этого не делал.
3) Если движки все же предполагают опечатку, то стараются угадать перевод.
Отдельные интересные результаты получаются у всех (даже у Baidu). Но в
целом результат, наиболее похожий на работу человека, показали Google и
Яндекс. DeepL и ModernMT иногда срабатывают удачно, но иногда их «заносит
на поворотах», и появляются непонятно откуда взятые варианты.
4) Baidu очень старался, иногда даже больше, чем нужно. Но пока все же отстает
от конкурентов. Впрочем, он работал не в своей основной языковой паре, так
что надеемся, что с китайским у него получится точнее. Пока он дает неточный
русский перевод даже совершенно понятных и неискаженных английских слов.