Личные инструменты
Счётчики
Рекламодателям

Машинный перевод

Материал из Lurkmore

(Перенаправлено с Promt)
Перейти к: навигация, поиск
«

— !tr en*ru I fucking LOVE machine translation! — [ Promt ] (Англо-Русский :: Общая лексика) :: Я трахающий машинный перевод ЛЮБВИ!

»

Машинный перевод — условное общее название для группы мемов, которые связаны с неправильным машинным переводом англоязычных слов, фраз, выражений или идиом на русский язык, или так называемых «переводов с русского на русский» — с русского на произвольный иностранный язык и обратно любой системой машинного перевода.

Отличие машинного перевода от перевода надмозга в том, что надмозг — всё же человек, поэтому текст у него получается хоть и с искажениями, но всё же более-менее внятный, в то время как у электронного переводчика, работающего по своим собственным, малопонятным алгоритмам — полный бред в духе известной копипасты про гастроном на улице Герцена. Вы бы никогда не догадались, например, что это за ЩИПКИ ЖУКОВ или ТО ЧТО ГУДИТ ИГРОКА, но так «Сократ» перевел bug fixes и zoom player!

Сократ персональный как бы намекает нам…

Содержание

[править] История

«

Наконец один из инопланетян заговорил. По экрану немедленно побежали строчки автоматического перевода. — Слышь, Михеич, — сказал инопланетянин. — Кажись, обратно нам какая-то хреновина попалася. На экране тут же высветилось: «Слушай меня, сын Михея! По всей вероятности, в нашем распоряжении вновь оказалось… (тут автопереводчик на секунду запнулся, но бодро продолжал)… нечто, имеющее отношение к растению рода многолетних трав семейства крестоцветных…»

»
— Олег Чарушников, «Пункт проката»
Былинный отказ

История плохого компьютерного перевода так же стара, как сами компьютеры. По легенде, ещё на ЭНИАК одна добрая душа переводила поговорки туда-обратно, с результатом, немало доставлявшим окружающим. А возможно, и ещё старше: человек, не понимающий языка, переводит ровно по тем же формальным алгоритмам, как и самый тупой автопереводчик (осторожно, при хорошем владении английским возможен разрыв мозга; при плохом — что-то из этого может запомниться и осесть, что чревато в будущем смирительной рубашкой).

На заре эры машинного перевода одним из первых мемов подобного рода была фраза из Священного Писания: «Крепок дух, хоть немощна плоть» (греч. τὸ μὲν πνεῦμα πρόθυμον ἡ δὲ σὰρξ ἀσθενής, лат. Spiritus quidem promptus est caro autem infirma) (Матф. 26:41). Переведенная с русского на русский, она стала выглядеть следующим образом: «Водка крепка, а закуска протухла». Из тех же времён — превращение «С глаз долой, из сердца вон» в «Бессердечный слепец» (либо в «Невидимый идиот», в зависимости от рассказчика, правда, «Невидимый идиот» чаще возникает в мемах как перевод на русский поговорки «Out of sight, out of mind») и фраза «Мухи времени любят стрелы» (англ. Time flies like arrows, «Время летит, как стрелы»)

[править] Типичные примеры

Четвёртый закон робототехники
Гламурное кисо в чятике тоже умеет им пользоваться
  • Былинный отказ
  • Нет пути!
  • Двиньте вперед
  • Блджад
  • Покрытия
  • Гуртовщики мыши
  • Squirrel Institute же!
  • Былинная нить — машинный перевод выражения EPIC THREAD
  • Remember — перечлен
  • Reboot — переботинок
  • тупые хуесосы убивают куст мира → глупый мира орального секса, чтобы убить Буша (рус.-китайск.-рус.)
  • Эй вязанки — машинный перевод фразы Hey faggots
  • Все единицы стоят в стороне — машинный перевод фразы All units stand by
  • Гнуть — нечто из ряда вон выходящее битый тот, кто стрижет — фраза «Собака бывает кусачей» на tranexp (рус.-англ.-рус.)
  • Потребитель был запрещен для этого столба (вариант в InterTran: Потребитель быть знамя для этот столб)
  • Восстановлений Данных НАБЕГА — IDE СОВЕРШАЕТ НАБЕГ на Контроллеры
  • «ыыыыы» (рус.) → «Саша» (укр.)
  • Немцы делаю толчок, держите свои основания — germans are making a push, hold your basements (CoD2)
  • Доставать грамматический определенный член совокупляться из — так tranexp перевёл Get the fuck out
  • То же самое по версии Гугла — получить черту.
  • Частный, выньте этот полуслед! — private, take out that half track! — оттуда же
  • Зухвалий пристрій (читаем, как зухвалый прыстрий) — машинный перевод словосочетания «вызывающее устройство» на украинский. Прикол в том, что, в отличие от русского, на украинском «зухвалий» может означать только «наглый», когда на русском «вызывающий» имеет 2 значения.
  • Bite my shiny metal ass — Сдержите моего глянцеватого ишака металла — от babelfish.
  • Fucking hostile — враждебное траханье
  • Fast food — пища рухляди
  • Не учи учёного — Научите вашего бабушка сосать яйца
  • В древней игрушке Empires Earth банальная пушка-гаубица превратилась в «пушку Ховитцер», пугавшую своим названием.
  • Kick ass — удар осла
  • Засада квашеной капусты — из игры Company of Heroes, когда отряд ВНЕЗАПНО натыкается на немцев. Видимо, имелось в виду бытовавшее в реальности прозвище немцев — «Капустники» (фаш. Sauerkraut, «Квашеная капуста», национальная баварская еда).
  • Школа людей — из CoD: UO (наверное, имелась в виду «Народная школа», то есть «People’s school»).
  • «Освободите небеса!» — говорит советский генерал из World in Conflict. Субтитры гласят: «Зенитки к бою!!!».
  • Городская ласточка, нравиться, открытый грамматический определенный член дверь — Martin, please, open the door.
  • Adobe Photoshop — кирпичи воздушной сушки photoshop.
  • Internet Explorer — смертельный исследователь.
  • Я попал под серьёзное дерьмо! — Bad Company 2
  • Американцы делают попытку! — Call of Duty: Modern Warfare.
  • «Ты хочешь со мной поговорить? Спроси далеко.» — из Dragon Age: Origins.
  • «До какого дурачества ты народ?» — оттуда же.
  • «…подверни детей в их кровати…» — оттуда же.
  • «Скажи мне своё имя, а я скажу тебе шахта» — имелось в виду, «Скажи мне своё имя, а я скажу тебе своё (mine)». Оттуда же.
  • Предательство мужа и пьяные охранники сделали нашу Torakutadoraiba — Наша доярка изменила мужу-трактористу с пьяным сторожем (яп.-кит.-арм.-рус.)
  • Free Space Wizards — свободные космические волшебники
  • Город бесов («city imp-s», городские улучшения (improvements))
  • Новое вновь никакое — перевод в Fallout 2 названия города NewReno.
  • Препарат-наркотик «Эго» Magic Goody переводит именем Egor.

[править] ПРОМТ

b
Лесной болван
b
Прощай, изящество!
b
Мякоть беллетристики. Вслушайтесь в этот одухотворенный диалог
b
Приятные Святые дока. Правильный перевод, у Гоблина не так.
b
Святое дерьмо, что это? Кованые в очень пламя Бога.

ПРОМТ, ранее известный как STYLUS, ранее известный как ПРОМТ — это компьютерный переводчик. Один из немногих объектов во вселенной, позволяющих получить перевод хуже, чем у надмозга. Some argue, что надмозги поголовно пользуются Промтом. В народном сознании ПРОМТ прочно закрепился как эталон безграмотного перевода.

Вопреки распространённому мнению, Промт — не единственный из представителей класса промтов. Также имелись чудесные переводчики Magic Gooddy, Сократ и другие. Люди, использовавшие Magic Gooddy, впоследствии часто использовали фразу «Закинуть в Гуся». Хотя иногда — особенно при правильном выборе темы текста из списка — эти чудеса техники действительно выдавали что-то, похожее по смыслу на исходный текст, но главным образом все они в своё время использовались для генерации хорошей, годной копипасты.

[править] Примеры

  • Яркий пример от онлайн-переводчика PROMT 7.0:

Execute installer by tray icon and insert ms windows binaries or another os with custom mouse driver support in current boot drive.

Перевод:

Казните монтажника изображением подноса и вставьте наборы из двух предметов окон госпожи или другой рот с таможенной поддержкой водителя мыши в текущем двигателе ботинка

или:

Выполняйте программу установки иконой подноса и insert наборы ms окон из двух предметов или другая кость с водителем таможенной мыши поддерживают в текущей boot езде.

PROMT 9.0:

Выполните установщик значком лотка и вставьте двоичные файлы ms windows или другой рот с пользовательской поддержкой драйвера мыши в текущем диске начальной загрузки.

Допускаем перевод той же фразы из ПРОМТ 10.0:

Выполните инсталлятор изображением подноса и вставьте наборы из двух предметов окон миллисекунды или другой рот с таможенной поддержкой водителя мыши в текущем двигателе ботинка.

Ту же фразу — в InterTran:

Выполнять официально вводить в должность у поднос икона и вставлять ms окно бинарный или еще один os с привычка мышь кучер поддерживать в ходячий ботинок гнать.

Как видим, всё довольно мило.

Сравните с переводом по алгоритму Google:

Выполните установки, панели задач и вставить файлы MS Windows или другой ОС с поддержкой пользовательских драйвер мыши в текущем загрузочного диска.

  • Ещё пример: итальянское прилагательное carino (милый, симпатичный) ПРОМТ переводит как «вызовите кариес».
  • Другой яркий пример «правильного» промтовского пегевода: «You have my ear, citizen!» → «Гражданин, вы имеете мое ухо!». Алсо, tranexp переводит эту фразу как «Ты вспомогательный глагол для образования сложных времен принадлежащий мне ухо, гражданин!»
  • Или элементарное выражение «Do you love postrock?», перевод: «Вы являетесь скалой почты любви?»
  • Простую польскую фразу «śmierć Serbom», которую русскому человеку и переводить-то не надо (на всякий случай всё же — «Смерть сербам»), сей драгоман толмачил как «Сербы убили». Три года назад, во всяком случае, было так.
  • Великие высказывания ПРОМТ и вовсе превращает в пронские. Например: «Ахиллы должны опасаться лижущих им пятки» → «Ахиллы пятка должна быть испуганным облизыванием этого»
  • Безумно интересно переводится предложение «У меня жидкий стул». ПРОМТ говорит: «Во мне жидкий стул», причем стул в значении мебели.
  • Кирпичи поставленные стоймя — так перевели «стражников» из Gothic 2 и кого-то аналогичного из KOTOR 2
  • Как это выглядит? — фраза «приветствия», оттуда же.
  • Также, Промт периодически переводит слово black (черный) как «афроамериканский», чем немало доставляет. Например, строчка из песни:

The ones who I confide were gone in the black of the night

после Промта стала выглядеть так:

Те, кого я доверяю, ушли в афроамериканце ночи

Тем не менее, большинство переводчиков ГОРАЗДО хуже Промта. Попробуйте, например, эти: isa.ru или reverso.net. Самый худший, без сомнения, tranexp. Переведите что-нибудь на нём, и вы сами поймёте.

К тому же, выходной текст ПРОМТа качественно улучшается при использовании специализированных тематических словарей, которые стоят не дешево, но мы-то знаем где их брать…

[править] Google Translate

«

Google tries to Transleyt epta, you're ohuel. He did not rummages in kosher translation and drives eopanuyu bullshit instead of text.

»
— Анонимус

Гугл — единственный автопереводчик, дающий вполне вменяемый текст. Большинство лулзов, обозначенных в этой статье, дать не сможет, а выдаст более-менее нормальный перевод.

[править] Примеры переводов от Гугля

Несмотря на все его минусы, очень люблю и уважаю переводчик Гугла. Внимание, полезнейшая информация: 弗拉基米爾普京吃胡蘿蔔因為它是美味和營養 в переводе с китайского значит «Владимир Путин ест морковь, потому что это вкусно и полезно». Сука, как же красиво! Крючочки, закорючечки, палочки. Это знание, конечно, вряд ли может чем-то помочь на практике, но настроение каким-то магическим образом поднимает. С другой стороны, вышеупомянутый переводчик из-за своей универсальности зачастую ошибается, и в результате перевода в ряде случаев можно получить довольно забавный бред. Пример русско-китайско-русского перевода: «Я не люблю рис» -> 我不喜歡賴斯 -> «Мне не нравится Кондолиза Райс». Ещё один клёвый пример: «хуй хуй» -> 迪克•切尼 -> «Дик Чейни». Вообще нечто магическое: «Блядь, рисовый куст с хуем!» -> «哎呀賴斯與布什切尼!» -> «Ах, Кондолиза Райс, и Буш и Чейни!». Натурально, формат сжатия с потерями. А потерями, к сожалению, в данном случае становится такая малость, как смысл. И напоследок — будьте осторожны при использовании гугловского переводчика в реальных путешествиях. Например, фразу «Меня преследуют грабители» он переводит на китайский как 我有小偷, то есть — «Я вор» :) ОПС: До самого недавнего времени пресловутый сервис переводил на язык Шекспира фразу «Вы говорите по-русски?» как «Do you speak English?». ППС: 阿爾泰米傑沙格山羊和驢子, ня! ^__^ Примечание: Гугл постоянно меняет алгоритмы перевода, поэтому многие фразы уже переводятся не так смешно (или вообще непонятно).

http://nelebedev.livejournal.com/35049.html
  • «Ты манда и я манда, ну а вместе мы — пизда -> あなた意気地のない、私お尻が、何一緒に我々が猫を持って -> Вы бесхребетных, осел, у меня есть кот, что мы» — полная потеря смысла. «Бабушка твоя — писька безмозглая -> 阿爾泰米傑沙格山羊和驢子 -> Хироси Йон козел случае гармонии 驴子 杰 Ша Али ключей» — то же самое. Но это японский.
  • Если скормить GT «Ты че мне дверь выпилил? Кто буйный? Ты буйный епть бля?», перевести на китайский и обратно, на выходе мы получим «Вы тория двери для меня, чтобы пить? Кто упрям? EPT вы упрямы фекалии собак?». Ту же фразу с армянского GT перевел так: «Th дверь ко мне в ваш напиток: Кто упрям? Ты упрямый ГАГИК EПT?»
  • «Михаил Шуфутинский» → Anybody
  • Фразу «Уважаемый Дмитрий» GT переводит как «Mr President»
  • Слово «нахуй» переводится на большинство языков как «forum» или «forums» (за исключением украинского и белорусского). Особые случаи: гуджарати — «нахуй => મંચ => этап», идиш — «нахуй => גרופּעס => Группы», исландский — «нахуй => Málefnin.com»
  • «Город прек» → «City Zvenigorod's».
  • «Ни фига себе!» → «Эти ребята есть!» (русский => китайский => русский)
  • Особый национальный колорит придает перевод слова «говно» — «ГАГИК».
  • Доверим GT перевод с иврита: веселый => הומוסקסואל => Gay. Ниже мы видим надпись «Словарь», где написано «ГОМОСЕКСУАЛИСТ».
  • С аглицкого на рашкинский, потом на китайский и снова на русский: HAHAHA DISREGARD THAT, I SUCK COCKS → Хахаха не учитывать, я сосать петухи → 哈哈哈,没有考虑到,我吸公鸡 → Ха-ха-ха, не принимать во внимание, я сосать хуй.
  • А разговорная фраза «ну ни фига себе!» на аглицком становится «well, a fig yourself!».
  • В логике GT не откажешь. «Power play» (игра в большинстве) один раз было переведено как «пьеса власти».
  • Кроме того, слово «мдя» великий Гугл переводит как «Opensource projects, eh». Обратное тоже верно.
  • Украинскую гривну Гугл по-английски величает USD.
  • Men are men and men should clean the house -> Мужчины мужчины и женщины должны убрать дом. Феминизм опасносте!!
  • Чорный (именно с о) Гугль переводит как Nintendo.
  • Раньше GT переводил «Signed artist» как «Палёный художника»
  • Популярный «жанр» в музыке — смазывать жиром ступеньку — dubstep.

За несколько месяцев Гугл изменился. На данный момент знаменитую фразу «Execute installer by tray icon and insert ms windows binaries or another os with custom mouse driver support in current boot drive.» он переводит как «Выполните установки на панели задач и вставки файлов MS Windows или другой ОС с пользовательской поддержкой драйвера мыши в текущем загрузочного диска.»

[править] Причины

Если вглядеться, становится очевидно, что алгоритм перевода «русский-китайский» и «китайский-русский» на деле реализуется как «русский-английский-китайский» и «китайский-английский-русский» соответственно. И правильно, что заморачиваться и составлять новые словари, когда старый добрый способ многократной прогонки-перегонки текста работает?

Кроме того, в отличие от многих других автопереводчиков, Гугл активно применяет статистический поиск, то есть проходит по своей внушительной базе документов и их переводов и смотрит, как нужные слова и словосочетания переводятся чаще всего. От этого часто страдают популярные имена, названия и фразы вроде «уважаемого Дмитрия», России вместо страны Х или русского (английского) языка вместо языка Х.

[править] Советы

Какие можно дать рекомендации, чтобы недоперевод был понятным?

Во-первых, иметь доступ к английскому оригиналу. В принципе, при наведении на непонятное место перевода появляется хинт с соответственным куском оригинала (от 2-3 слов до пары предложений), но это реализовано на яваскрипте и, смешиваясь с яваскриптом самой переведенной страницы, работает не всегда. Однако в адресной строке содержится адрес страницы оригинала, и с опытом её оттуда достать проще пареной репы.

По поводу оригинала. Например, ту самую фразу «Execute installer by tray icon and insert ms windows binaries or another os with custom mouse driver support in current boot drive.» вряд ли вообще переведет хоть один автопереводчик из известных науке. Но 90-95% остального текста будет понятно и из гугл-перевода, так как большинство среднестатистических конструкций языка намного проще, а обыкновенные падежи он склоняет вполне корректно, для своих-то кремниевых мозгов.

Во-вторых, наилучшее понимание сгенерированного текста достигается на какой-то излюбленной теме. Привык луркать через гугл-транслейт техдокументацию — лучше всего будешь понимать в автопереводе техдокументацию. Привык читать Дейла Карнеги или того же Терри Дина и прочую «художественную литературу» в оригинале — лучше всего будешь понимать литературу или там разговорный стиль. При специализации интересов на протяжении 2-3 месяцев автоперевод излюбленной темы вдруг начинаешь понимать ДОСЛОВНО, а не только общий смысл.

Читать через переводчик, конечно, напряжней, чем в нормальном переводе. Но лишь поначалу. Привыкая, уже можно читать совершенно свободно, или например, мельком пробегать глазами по длинному рулону текста, ища что-то конкретное. А там, глядишь, научишься различать матрицу.

Да, и перевод, конечно же, должен быть однократный. Никаких переводов с венгерского или французского на русский сделать не удастся (через два перевода пройдет), только английский.

Естественно, интересно переводить только то, что интересно, а не то, что учительница в школе задала. Чтобы было, что луркать в автопереводе, есть «поиск с переводом» (там же, на translate.google.ru — ссылочка «поиск с переводом» слева). Инструмент более сложный в использовании (поисковые слова задаешь по-английски, найденные страницы просматриваешь в автопереводе).

[править] Галерея


[править] См. также

[править] Ссылки

[править] Примечания

  1. А всё потому, что надо знать язык. Правильно — «get a ride» («поймать такси», скажем) или «get rid» («избавиться»). Машинный переводчик ни в чем не виноват.