О насПереводы. Бюро переводов
  На главную     Цены     Услуги     Примеры     Контакты     Статьи     Форум

О нас  Статьи

Непреодолимые трудности машинного перевода

Норберт Винер, который без подготовки мог сделать доклад на английском, немецком, французском и испанском, свободно говорил по-китайски, по-датски, по-итальянски - в общей сложности, на тринадцати языках, писал:

"...Что касается проблемы механического перевода, то, откровенно говоря, я боюсь, что границы слов в разных языках слишком расплывчаты, а эмоциональные и интернациональные слова занимают слишком большое место в языке, чтобы какой-нибудь полумеханический способ перевода был многообещающим... В настоящее время механизация языка... представляется мне преждевременной".

Время подтвердило правоту ученого. Уже к 1958 году во всем мире существовали три программные системы для машинного перевода технических текстов. Самая совершенная - советская (ну конечно, а какая же еще?!) - обладала запасом в 952 слова, которому позавидовала бы Эллочка-людоедка. Статьи того времени были полны наивной веры в компьютерный разум.

«Итак, появилась машина-переводчик? Погодите радоваться. Для практического использования машин не хватит... людей», - утверждалось в одной статье.

Далее в статье раскрывалась суть проблемы: машина могла бы прочесть 1 800 000 букв в минуту, но «...чтобы снабдить ее перфорированными карточками, понадобилось бы двенадцать тысяч машинисток, работающих со скоростью десять тысяч букв в час. Кроме того, для проверки и редактирования потребовалось бы десять - двенадцать тысяч редакторов и, пожалуй, еще столько же машинисток. Выходит, что одну только переводческую машину обслуживал бы целый город с населением в пятьдесят - сто тысяч человек».

Авторы тогдашних статей делали заключения, что только эта сугубо техническая проблема ввода информации на тогдашних носителях (интересно, помнит ли кто-нибудь сейчас, как выглядят перфокарты?) и отделяет нас от появления полноценных машин-переводчиков.

Увы, за минувшие годы компьютеры усовершенствовались до неузнаваемости, информация вводится моментально и в огромных объемах - а машинный перевод столь же примитивен, как и раньше. Какие же трудности испытывают его разработчики и пользователи? Продолжим цитировать статью, написанную на заре кибернетической эры.

«Прежде всего - искажения. Какова степень точности перевода с одного языка на другой? Остроумный эксперимент французских лингвистов показал результат, очень похожий на игру в испорченный телефон. Четырнадцать опытных переводчиков сели за круглый стол так, чтобы каждый знал язык соседа справа. Первый переводчик, немец, написал на листке бумаги предложение "Искусство пивоварения так же старо, как и история человечества" и передал листок соседу слева. Сосед перевел с немецкого на испанский, написал это на другом листке и тоже передал соседу слева. Так, предложение пошло по кругу, и каждый переводил его на свой родной язык. Наконец, оно вернулось к немцу на венгерском языке. Он перевел его и с удивлением прочитал: "С давних времен пиво является одним из любимейших напитков человечества".

Большое препятствие для машины - идиоматические выражения. Английское слово charleyhorse машина переводит как "лошадь (по имени) Чарли", тогда как оно означает "судорога в икре ноги". Foolproof - "защищенный от нежелательного воздействия" - дословно переводится как "защищенный от дурака".

Французская фраза: "Absorption comfortable des vibrations - "комфортабельное поглощение колебаний", а в действительности в технике фраза означает "гашение колебаний, обеспечивающее комфортабельность езды". Das d’anes - "возвышенные дорожные неровности" - буквально переводится "ослиные спины". Coups des raquettes - "колебания в вертикальной плоскости" - дословно "взлеты ракет".

Если машина спотыкается на фразах, то что же она сделает с таким текстом, как окончание повести Гоголя "Нос"? "...А однако же, при всем том, хотя, конечно, можно допустить и то, и другое, и третье, может даже... ну да и где же не бывает несообразностей? А все, однако же, как поразмыслишь, во всем этом, право, есть что-то. Кто что ни говори, а подобные происшествия бывают на свете; редко, но бывают".

Как здесь не вспомнить слова Н. Некрасова, о трудностях перевода: "Передавать близко стихи иностранного поэта русскими стихами вообще трудно, часто труднее, чем прямо писать русские стихи".

Машинам пока еще не до переводов сложного текста.

Сколько ошибок они делают, работая над самыми простыми переводами!

Так, один из первых переводов с английского на русский содержал следующую фразу: "...это верно безусловно для обширной категории задач, связанных с силой и движением, так что хочем ли мы знать будущий путь Юпитера в небесах или путь "электрона..."

Однажды машина перепутала слова "один" и "два". И вместо "двух" выдала в первый раз "однух", во второй - "однум".

Электронная машина допустила ошибку, которой устыдился бы даже посредственный школьник. Делая грамматический разбор предложения "Дочь генерала читала книгу", машина причислила слово "генерала" к глаголам, указав даже его время. Казус произошел из-за того, что в конечном звукосочетании существительного машина увидела распространенное глагольное окончание. Конечно, виноваты ученые. Это они не познакомили машину с явлениями в языке, которые лингвисты называют ложной омонимией флексий.

Любопытный случай произошел с машиной, когда она переводила статью из английской газеты "Тайме", в которой шла речь о переводах с помощью электронной вычислительной техники. Машине встретились слова "железный занавес". Она "задумалась" и, опустив этот непонятный термин, продолжала переводить дальше.

Другой случай. Американская машина при переводе названия статьи академика С. Н. Вернова "Знать тайны Космоса" исказила смысл до неузнаваемости - "Откроем тайный Космос" (?!)».

Завершалась статья, тем не менее, с изрядной долей оптимизма, выраженным словами “пока еще”: «...Конечно, за минувшие годы многое изменилось в машинном переводе. Но трудностей еще много. Скажем прямо, настоящего машинного перевода пока еще нет».

Так вот, с высоты сегодняшнего времени мы можем сказать, что все те причины, которые, по мнению авторов тех лет, препятствовали широкому применению компьютерного перевода (трудности ввода информации машинистками с перфокарт и т.п.) кажутся полным анахронизмом - но тем не менее, ошибки машинного перевода до сих пор “пока еще” примерно того же порядка, что и в шестидесятых годах!

Автору данных строк кажется, что причина более глубока: все дело в переоценке возможностей компьютерного “разума”. С конца 19 века люди считали (и многие до сих пор считают), что сознание является продуктом механической деятельности нервных клеток, которые можно было с успехом заменить микросхемами – и получить думающую машину. Увы, практика показывает обратное. Видимо, неживая материя не способна создать разумный дух. А значит, хлеб у переводчиков-людей будет всегда!

Оставить заявкуНа главную
WEBWIND - websupport Rambler's Top100 Рейтинг@Mail.ru Яндекс цитирования