Как работают компьютерные переводчики

Как так получается, что в кино и по телевизору столько инопланетных видов живых существ с невероятной легкостью говорят на безупречном английском? Проще всего сказать, что никто не хочет смотреть, как экипаж звездолета тратит годы на изучение инопланетных языков. Но создатели “Star Trek” и других миров научной фантастики, рассуждая последовательно, ввели концепцию универсального переводчика – переносного прибора, способного мгновенно переводить с одного языка на все иные. Так может ли на самом деле существовать универсальный переводчик?

На сегодняшний день у нас уже имеется множество программ, позиционирующихся именно так. В программу вводится слово, предложение или целая книга, и компьютер переводит их фактически на любой язык, будь то современный английский или древний санскрит. И если бы перевод был просто делом поиска слов в словарях, такие программы на голову опережали бы людей. Однако реальность немного сложнее.

Основанные на правилах программы-переводчики используют лексическую базу данных, включающие в себя все слова, что вы можете найти в словарях, все их грамматические формы и набор правил для распознавания простых лингвистических элементов введенного текста. В таком, казалось бы, простом предложении, как это: «Дети едят кексы», программа сначала разбирает синтаксис – грамматическую структуру, идентифицируя, что «дети» — это подлежащее, а оставшаяся часть предложение – сказуемое, состоящее из глагола «есть» и прямого дополнения «кексы», После этого программе нужно распознать морфологию, то, как язык может быть разбит на мельчайшие смысловые части, как, например, на слово «кекс» и окончание «ы», использующееся для обозначения множественного числа.

В конце компьютеру нужно понять семантику текста, то есть что в смысловом плане обозначают разные части предложения. Чтобы перевести это должным образом, программе приходится обращаться к различным словарям и правилам для распознания каждого элемента языка, на котором переводится текст. Но здесь компьютер находит затруднение. Синтаксис некоторых языков позволяет осуществлять инверсии – меня слова местами, когда в других языках подобные перестановки приведут к тому, что кексы съедят детей.

Морфология тоже может создавать проблемы. Словенский язык делает различие между двумя, тремя или большим количеством детей, используя двойное окончание, не существующее во многих других языках. В то время как отсутствие в языке определенных артиклей, заставляет вас гадать – едят ли дети какие-то особенные кексы или едят кексы вообще.

В конце концов, даже когда все семантические значения будут технически корректны, программа может упустить из виду их более узкие смыслы, как, к примеру, дети едят кексы или пожирают их.

Другой метод перевода – это статистический машинный перевод, анализирующий базу данных, составленную из книг, статей и документов, что уже были переведены людьми. Такие программы работают, находя соответствия между источником и переведенным текстом, которые едва ли могут быть случайными. Программа может распознать соответствующие фразы и структуры и использовать их для дальнейшего перевода. Однако качество такого вида переводчиков зависит от размера изначальной базы данных, от доступности образцов текстов определенного языка или стилей письма.

Затруднения, испытываемые компьютерами относительно исключений и изменяющихся языковых единиц, и оттенков значений в силу того, что, кажется, понимается человеком инстинктивно, дает некоторым исследователям основание считать, что понимание языка – это уникальный продукт нашей биологической структуры мозга. По сути один из самых знаменитых действующих универсальных переводчиков – «Вавилонская рыбка» из книги «Автостопом по Галактике». Это вовсе не машина, а маленькое существо, переводящее мозговые сигналы и нервные импульса чувствительного вида посредством телепатии.

На данный момент старомодный способ – обычное изучение языка, — приносит несравненно лучшие результаты, чем любые существующие компьютерные программы. Пусть это и не самое простое занятие, но огромнейшее число языков в мире, ровно как и расширяющее взаимодействие между людьми, которые говорят на них, будет только подгонять лучшие достижения в сфере автоматического перевода.

Возможно, к моменту, когда мы столкнемся с межгалактическими формами жизни, мы уже будем способны общаться с ними с помощью такой крошечной штуки с незапоминающимся названием или составим такой словарь сами, в конце концов.