От Вавилонской башни до Google Translate: как люди научили машины переводить тексты
Потребность в переводе появилась лишь немногим позже возникновения языка как такового. С развитием общества, технологий и культуры потребность эта только росла, побуждая ученых к созданию универсальных лингвистических систем. Однако разрушить языковой барьер, не прибегая к услугам профессиональных переводчиков, получилось только благодаря машинному переводу. Далее расскажем, как появились всем знакомые сервисы и приложения и какой путь им пришлось пройти от абстрактной идеи до рабочего инструмента, доступного каждому.
Идеи, с которых начался машинный перевод
Задумываться о происхождении языка и о том, почему жители соседних стран общаются на непонятных наречиях, люди стали еще в глубокой древности — во времена становления первых крупных цивилизаций на Ближнем Востоке. Об этом говорится в старейшей части Ветхого Завета — Книге Бытия, где описывается, как Адам дал названия «всем животным и птицам небесным» и как священный язык, на котором были даны эти названия, оказался разделен на множество других после разрушения Вавилонской башни.
Эксперименты по восстановлению праязыка — тоже дело древнее. В частности, как писал Геродот, вопрос этот интересовал египетского фараона Псамметиха (VII век до н. э.), который приказал своим слугам растить двух младенцев, не произнося ни слова. Правитель ожидал, что дети вскоре заговорят на том самом изначальном наречии, однако успехом этот эксперимент (как и все последующие тому подобные) не увенчался.
Впрочем, из-за ряда неудач поиски первоязыка Адама не прекратились. В Средневековье многие философы полагали таковым древнееврейский язык, на котором был написан Ветхий Завет. Эта точка зрения была особенно популярна среди еврейских мудрецов, и именно она стала фундаментом Каббалы — иудейского мистико-эзотерического учения, возникшего в Европе в XII веке. Согласно одному из его главных постулатов, текст Торы (библейского Пятикнижия Моисея) считался священным зашифрованным посланием Всевышнего, поняв которое, можно было познать божественную мудрость. Важно здесь то, что в качестве одного из методов дешифровки предлагалось присвоить буквам или даже целым словам числовые значения со своим сакральным смыслом, а после — искать в тексте Торы совпадения этих чисел. Проще говоря, определенный набор цифр по этой системе можно было превратить в осмысленное предложение. Через много столетий эта идея ляжет в основу первых алгоритмов машинного перевода.
Розеттский камень (196 год до н. э.) стал по своем обнаружении в 1799 году настоящим подарком переводчикам и лингвистам: на нем один и тот же текст II века до н. э. записан на древнегреческом и двух вариантах египетского, благодаря чему в XIX веке удалось расшифровать древнеегипетские иероглифы. Тоже своего рода веха в истории перевода
Еще одним источником вдохновения для создания автоматических переводчиков стала криптография — наука о расшифровке текста. Люди во все времена уделяли большое внимание безопасности секретных сведений, поэтому специальные шифры, помогающие скрыть информацию, были известны еще с Античности. Однако первая теоретическая работа, излагающая основные криптографические принципы и классификацию известных шифров, была написана лишь в IX веке — арабским философом и математиком Абу Юсуфом Аль-Кинди. В своем «Трактате о дешифровке криптографических сообщений» он предлагал взламывать моноалфавитные шифры (когда каждой букве сообщения соответствует другая буква из того же алфавита) с помощью частотного анализа — сравнивая частоту употребления букв в обычном языке с частотой использования символов в зашифрованном тексте. Иными словами, Аль-Кинди впервые использовал статистические методы, ставшие впоследствии одними из важнейших в машинном переводе.
Наконец, в XVII веке — в эпоху научной революции — одному из ее главных творцов Рене Декарту пришла в голову идея универсального языка. В нем каждому слову соответствует только одно понятие, а грамматика строится на основе универсальных правил. В теории это должно было разрушить языковой барьер и вернуть людей в мифологические времена до Вавилонского смешения. На практике же, несмотря на все усилия таких умов, как Декарт и Лейбниц, привело это лишь к созданию огромного количества нежизнеспособных лингвистических проектов, которые так и не могли составить конкуренцию языкам естественным. Однако эти работы дали толчок развитию специальных систем, с помощью которых можно было зашифровать текст, а затем расшифровать и одновременно перевести сразу на несколько языков.
Такой, в частности, была система Афанасия Кирхера (немецкого ученого и изобретателя XVII века), изложенная в трактате 1663 года Polygraphia nova et universalis ex combinatoria arte detecta («Новая и универсальная полиграфия, выведенная из комбинаторного искусства», где слово «полиграфия» обозначает не производство печатной продукции, а является синонимом слова «криптография»).
Галерея
«Таким образом, если говорящий по-немецки получает сообщение I.2, он ищет в таблице I словаря В слово под номером 2 в колонке немецкого языка и узнает, что отправитель хотел сказать verbergen („прятать“ — прим. ред.). Пожелав узнать, как это слово переводится на испанский язык, он с легкостью найдет esconder, — пишет итальянский ученый и писатель Умберто Эко в своей книге „Поиски совершенного языка в европейской культуре“, разбирая систему Кирхера. — <…> Чтобы понять следующий пример, предположим, что именительный падеж обозначается буквой N, а третье лицо единственного числа прошедшего отдаленного для удобства пометим как D. И вот перед нами образец шифра: XXVII.36N (Petrus) XXX.21N (noster) II.5N (amicus) XXIII.8D (venit) XXVIII. 10 (ad) XXX.20 (nos) (лат. „К нам пришел наш друг Петр“, — прим. ред.). Кирхер не устает расхваливать достоинства своего изобретения: с помощью словаря шифровки можно выразить мысль на любом языке, зная только родной, а прибегнув к словарю дешифровки, можно понять на родном языке текст, задуманный на языке незнакомом. Но эта система имеет и еще одно преимущество: получив текст, написанный без всякого шифра, но на языке, которого мы не знаем, находим в словаре A номера, соответствующие незнакомым словам, открываем словарь В и обнаруживаем соответствующие слова на нашем родном языке».
К несчастью, система эта, как и все ее аналоги (от универсального языка Джона Уилкинса до эсперанто), была далека от совершенства. «Мало того что эта система громоздка, она еще и предполагает, что грамматика всякого языка может быть сведена к латинской, — отмечает Умберто Эко, — с другой стороны, послание, зашифрованное согласно немецкому синтаксису, получит любопытнейший вид, если его дословно перевести на французский».
И уж тем более далека была эта система и ее аналоги от автоматизации. Ситуация оставалась таковой вплоть до начала XX века.
Первые устройства для перевода
Проекты автоматических устройств для перевода появились лишь в 30-х годах прошлого столетия. Упомянуть тут нужно о двух главных концептах: оба были запатентованы в 1935 году и оба были не электронными, а механическими.
Первый из них — «Механический мозг» армянского инженера Георгия Арцруни, эмигрировавшего во Францию после 1922 года. Этот прибор представлял собой банк данных (они записывались на бумажной ленте) и систему поиска, позволяющую эти данные использовать. Машина могла применяться для многих целей (шифрования, составления справочников и расписаний, работы с банковскими данными
- оператор вводил нужное слово на клавиатуре, активируя определенный код в виде последовательности штырьков, которая соответствовала конкретному понятию;
- понятия и их переводы записывались на ленте памяти и также имели свой код — в виде отверстий;
- когда включался механизм поиска, машина сравнивала расположение штырьков и отверстий и, как только они совпадали, выдавала перевод на один или несколько (максимум — три) языков.
Устройство заинтересовало государственные службы Франции и даже было отмечено дипломом на Всемирной выставке в Париже в 1937 году, однако разразившаяся вскоре Вторая мировая война помешала планам по его повсеместному внедрению.
Вторая модель устройства Арцруни — «Механического мозга» — из парижского Музея искусств и ремесел
Другую систему изобрел советский ученый Петр Троянский. Называлась она чуть менее поэтично — «Машина для подбора и печатания слов при переводе с одного языка на другой». Устройство представляло собой наклонный стол, на котором располагались «глоссарное поле» (широкая пластина со словами и их переводом на несколько языков), фотоаппарат и печатная машинка. Оператор находил необходимое слово, совмещал с ним печатную ленту и с помощью специального кода указывал нужные грамматические признаки (род, число, падеж, роль в предложении и прочее). После всё это фотографировалось и передавалось редактору.
В отличие от «Механического мозга» Арцруни, проект Троянского так и не был воплощен в жизнь из-за недостаточной, по мнению Академии наук СССР, эффективности, и идеи ученого оказались надолго забыты.
Джорджтаунский эксперимент и его последствия
Новый этап в истории машинного перевода начался в конце 1940-х годов с появлением компьютеров, способных обрабатывать большие объемы информации. В теоретическом аспекте также наметился значительный прогресс благодаря работам таких американских ученых, как Клод Шеннон и Норберт Винер (они занимались криптографией, кибернетикой и теорией обработки данных). Именно Винеру в 1947 году адресовал свое письмо другой знаменитый криптограф — Уоррен Уивер (Warren Weaver). В том письме он впервые предложил применить к тексту методы криптоанализа и уже в 1949 году, после двух лет кропотливой работы совместно с математиком Эндрю Бутом, инженером Кэтлин Бриттен и редактором научного журнала Ричардом Риченсом, представил на суд научной общественности свой меморандум «Перевод» (Translation), в котором сформулировал четыре принципа, призванные вывести машинный перевод на новый уровень:
1. Для точной интерпретации многозначных слов (как, например, английское nails,
2. Язык следует рассматривать как систему, к которой применимы законы формальной логики. Иными словами, при наборе определенных условий (например, при характерной структуре предложения) компьютер может делать соответствующие логические выводы в процессе перевода, корректируя его по необходимости.
3. При работе с иностранным текстом предлагалось рассматривать его как зашифрованное сообщение, для декодирования которого следует использовать криптографические методы.
4. В основе любого языка лежат лингвистические универсалии — общие принципы грамматики и семантики текста. С их помощью можно упростить переводимое сообщение, сохранив исходный смысл.
Меморандум Уивера имел большой общественный резонанс и вдохновил многих ученых из самых разных областей на активную работу по созданию электронных переводчиков, результатом которой стал знаменитый Джорджтаунский эксперимент.
Состоялся он 7 января 1954 года в штаб-квартире корпорации IBM в Нью-Йорке. Руководил процессом профессор Джорджтаунского университета Леон Достер (организатор системы синхронного перевода для Нюрнбергского процесса и ООН), совместно с которым также работали лингвист Пол Гарвин и специалисты компании IBM Катберт Херд и Питер Шеридан. В результате их труда компьютер смог перевести 60 предложений с русского языка на английский со скоростью 2,5 строки в секунду.
Происходило это так: оператор печатал на перфокартах русские фразы латинскими буквами, эти фразы кодировались, после чего вводились в компьютер, а тот, в свою очередь, печатал перевод. Несмотря на впечатляющие результаты (все предложения на тему органической химии были переведены верно и с соблюдением грамматических правил) система имела довольно ограниченные, особенно по сегодняшним меркам, возможности: она обладала словарным запасом в 250 слов, знала 6 грамматических правил, а также умела выделять морфемы, ставить артикли и выбирать нужные значения у многозначных слов. Сам компьютер при этом занимал помещение размером с теннисный корт.
Переводчиком в ходе Джорджтаунского эксперимента выступил компьютер IBM 701 — 9,3‑тонный комплекс из 14 элементов. На фото два из них: консоль оператора (слева) и процессор на 1071 вакуумной лампе
Джорджтаунский эксперимент вызвал всплеск интереса к технологиям машинного перевода по всему миру, однако многочисленные исследования так и не дали ожидаемого результата. Поэтому спустя 10 лет после эксперимента в США создали Консультативный комитет по автоматической языковой обработке (Automatic Language Processing Advisory Committee, или ALPAC), который занимался оценкой дальнейших перспектив. В 1966 году комиссия подвела неутешительный итог: выполнять перевод надлежащего качества компьютеры все еще не могли и при этом требовали огромного финансирования и постоянной работы большого числа специалистов (тот же IBM 701, созданный тиражом в 19 экземпляров, нельзя было купить — в 1953‑м его сдавали в аренду по $15 000 в месяц при 40‑часовой рабочей смене — это 171,5 тыс. долларов США 2023 года; для сравнения: средняя месячная зарплата мужчины в США в 1953‑м выросла до $3 200, а у женщин осталась на уровне $1 200). Проще говоря, цель не оправдывала вложенных затрат, а с задачами куда лучше справлялись обычные переводчики.
В последующие 20 лет интерес к машинному переводу существенно снизился, хотя определенные разработки все еще продолжались. Так, в 1968 году бывший сотрудник Джорджтаунского университета создал компанию Systran, занимавшуюся технологиями перевода на основе правил (Rule-based Machine Translation). Параллельно похожие исследования проводились и в Советском Союзе.
Разработка систем машинного перевода в СССР и появление PROMT
Работа по созданию машин-переводчиков началась в СССР почти сразу после Джорджтаунского эксперимента, в 1955 году. Тогда Академия наук CCCР организовала две исследовательские группы: одну — при Математическом институте имени В. А. Стеклова (ей руководил известный математик и кибернетик Алексей Ляпунов), другую — при Институте точной механики и вычислительной техники. Первые проекты устройств и их рабочие прототипы появились уже спустя пару лет работы советских ученых, а в 1958 году в Москве была проведена первая в Союзе научная конференция по машинному переводу.
Исследования продолжались, и в 1972 году в московском институте «Информэлектро» началась разработка системы ЭТАП (электротехнического автоматического перевода). Параллельно в Ленинграде, при Пединституте имени Герцена, заработала Научно-исследовательская лаборатория инженерной лингвистики, занимавшаяся системами автоматической обработки текста. В 1991 году бывшая работница лаборатории Светлана Соколова вместе с коллегами организовала компанию PROMT (Project Machine Translation), которая впоследствии на время заняла лидирующие позиции на отечественном и международном рынке программ машинного перевода.
Первая программа-переводчик с русского на английский от PROMT появилась на MS-DOS в том же 1991 году, а еще через год компания стала поставлять свои системы НАСА. В дальнейшем отечественные разработчики создали еще несколько приложений (на этот раз уже для Windows), количество языков в которых возросло, а алгоритмы работы усовершенствовались. Программы создавались совместно с зарубежными партнерами, а конечный продукт использовался крупными государственными структурами — как отечественными, так и международными.
Софт от PROMT был на пике популярности (особенно в России) вплоть до конца нулевых, однако после, с появлением мощного и доступного интернета, ему на смену пришли онлайн-переводчики.
Первый онлайн-переводчик от ПРОМТ появился в 1998 году
Создание новых принципов перевода
Если первые электронные переводчики работали на основе лингвистических правил, то большинство систем, начиная с 1990-х и заканчивая 2016 годом (в частности, описанный выше PROMT, Candide от IBM или появившиеся позже Google Translate и «Яндекс.Переводчик») использовали принцип статистического машинного перевода: компьютер анализировал множество параллельных текстов на разных языках, сравнивал их и на основе уже этого сопоставления самостоятельно выделял необходимые правила. Такие алгоритмы позволяли куда лучше работать со значениями слов, идиомами и омонимами, да и в целом давали значительно более точный результат. К тому же система могла обучаться: чем больше становились ее базы данных, тем больше статистики собирала программа и тем качественнее был текст. А с развитием статистических принципов компьютер научился сопоставлять не только отдельные слова, но и целые фразы — например, устойчивые выражения. Однако такие системы все еще были далеки от идеала. Лучшее тому доказательство — пиратские переводы игр в нулевые, знакомые, пожалуй, каждому геймеру в нашей стране.
Проблемы требовали современного решения, и оно пришло в 2016 году — с возникновением нейронного перевода. Его принципы сформулировала команда инженеров Google, и уже в 2017 компания представила инновационную архитектуру нейросетей Transformer. Она позволяла рассматривать в качестве единицы смысла не слова или фразы, как это было раньше, а целые предложения, а также могла учитывать контекст всех этих единиц в процессе работы, что увеличивало качество контента в нескольких раз.
Архитектура Transformer показала впечатляющие результаты и очень быстро получила широкое распространение. Так, уже в 2017 году она стала использоваться в «Яндекс.Переводчике» наряду со статистическими алгоритмами. Плюсы системы оценили быстро: тексты стали более точными, учитывался контекст и стилистические особенности автора, а умные нейросети предлагали варианты слова еще до того, как пользователь успевал его закончить.
В дальнейшем использование нейросетей только набирало обороты. Так, в 2021 году в «Яндекс Браузер» добавили функцию синхронного перевода видеороликов с английского, немецкого, французского, испанского и итальянского языков, а в 2022 году такая функция стала доступна для прямых онлайн-трансляций. Всё это оказалось возможно благодаря слаженной работе нескольких нейросетей: одна превращает речь в текст, другая анализирует содержание и переводит его с учетом множества аспектов, а третья озвучивает полученный текст.
В скором времени подобные технологии станут доступны и для устного общения, позволяя людям, говорящим на разных языках, мгновенно слышать речь друг друга — такие разработки уже тестируются инженерами Microsoft, работающими с программой Skype.
Еще по теме
Выглядит это примерно так, но это далеко не предел возможностей. Так, применение ИИ-инструментов уже совсем скоро позволит не только осуществлять синхронный перевод, но и имитировать движение губ говорящего в соответствии с языком, на который осуществляется перевод
Технологии, которые помогают переводчикам
Говоря о современных технологиях, нельзя не упомянуть CAT tools (Computer-Assisted Translation) — программы, предназначенные для помощи переводчикам — на этот раз не электронным, а вполне обычным. По сути эти инструменты представляют собой текстовый редактор (или специальный модуль для текстовых редакторов) с определенным набором функций и инструментов. К самым частым относятся:
- встроенный словарь, тематический глоссарий и личный глоссарий, в который можно добавлять часто встречающиеся слова и фразы;
- возможность сохранять варианты перевода слов или предложений и предлагать их, как только в тексте попадется похожая конструкция;
- инструменты для форматирования и возможность объединять разные документы в один проект;
- возможность совместной работы нескольких переводчиков над одним текстом.
Впрочем, набор этот может меняться в зависимости от каждой конкретной программы, которых на данный момент существует множество — платных и бесплатных, онлайн- и офлайн-, для Windows, Linux или Java
Пример CAT-средства перевода — MateCat, open-source-сервис онлайн-перевода, профинансированный Евросоюзом
Выбирать тут следует исходя из задач и целей специалиста, а также из финансовых возможностей, поскольку некоторые приложения стоят весьма недешево.
Наконец, остается главный вопрос: нужны ли профессиональные переводчики сейчас, когда прогресс шагнул так далеко? Ответ здесь будет скорее положительным, так как, несмотря на технологический рывок в развитии машинного перевода, произошедший за последние несколько лет, полностью заменить человека компьютер все еще не может. Правда, касается это только работы над сложными текстами — например, научной или художественной литературой. А вот с менее трудными задачами умные нейросети справляются без особых проблем. Поэтому вполне возможно, что уже через пару десятилетий техника сможет исполнить заветную мечту мудрецов древности и позволит людям во всех уголках мира понимать друг друга.
Понравилась статья?
Теги статьи
Похожие статьи
Нам нравится, что вам нравится
Уверены, вы можете не хуже! Напишите статью и получите Бонусы.
Спасибо, что вам есть что сказать
Попробуйте расширить свою мысль и написать статью — и получите за это Бонусы.
Комментарии
Авторизуйтесь, чтобы иметь возможность писать комментарии:
Войти