Microsoft ведет к совершенству универсальный коммуникатор

Около 40 000 людей пользуются Skype Translator в надежде, что скоро перевод в реальном времени станет доступен всем.

Корпоративный вице-президент Skype был уверен, что программа автоматического перевода Skype должна сработать. Но когда Гурдип Пол уже был готов впервые открыто продемонстрировать программу, он начал не на шутку волноваться: «Чтобы распознать любой звук, воспринимаемый микрофоном, и понять, что было сказано, системе приходится как следует трудиться, используя свою логику. В основном приходит перевод, но иногда можно услышать кашель, захваченный микрофоном, звуки каких-то посторонних движений на заднем плане, скрип подошвы…».

Беспокойство Гурдипа Пола было безосновательным. Аудитория из нескольких сотен журналистов и представителей индустрии наблюдала за тем, как Пол и коренной носитель немецкого языка вели почти безупречный разговор через детище компании — прототип программы Skype Translator. Реплика Пола — и уже почти через секунду внизу экрана появляются субтитры на немецком и английском, а электронный голос прочитывает слова вслух для удобства немецкого собеседника. Аудитория начинает перешептываться в изумлении, а программа все так же бесперебойно выдает теперь перевод с немецкого на английский. Но волнение вице-президента было таким сильным, что оно по воздуху передалось двум комментаторам, которые шептались друг с другом от удивления всю презентацию. «Я думал: ‘Уж лучше б я сбежал отсюда!’», — со смехом вспоминает Гурдип.

Исследователям, трудящимся над подобными технологиями автоматического перевода, не понаслышке знакомо это смешение надежды и волнения. Понятие универсального передатчика уже давным-давно было предметом научной фантастики, не говоря уже о мечтах изобретателей и языковедов еще задолго до того, как стали существовать компьютеры. В 1930-х годах два изобретателя запросили патенты по своим «механическим словарям», которые обещали переводить слова в реальном времени. В последние десятилетия многие компании тоже периодически пытались справиться с этой задачей. Но как практическую реальность эту идею постоянно отодвигали.   

Что же происходит сегодня в сфере так называемого машинного или компьютерного обучения (то есть компьютерных программ, которые могут осуществлять самообучение при условии достаточного вовлечения в процесс устной речи)? Сейчас надежда на универсальный передатчик, или переводчик, все больше замещает прежние опасения. 

Что изменилось с прошлых поколений, так это то, что теперь мы понимаем, что технологии совершенствуются в процессе их использования, то есть методом проб и ошибок через фиксирование новой информации и ее анализ, что называется, «до посинения». Программисты подмечают, что масса имеющегося ПО с функцией перевода становится тем умнее и развитее, чем больше информации программы поглощают. Так же, как и у людей: чем больше у вас данных, тем большего успеха вы можете достичь.

Поэтому в прошлом декабре Microsoft выпустил предварительную версию Skype Translator только для ограниченного количества пользователей. В начале этого года ожидалось, что программа достигнет крупных результатов к концу марта. В конце прошлого года Google объявил о выпуске своего переводческого приложения для текстов с возможностью разговорного режима для перевода устной речи. У компании Baidu (так называемый Google Китая) на территории рынка страны уже несколько лет есть подобная функция. Часы Apple Watch также внушают большие надежды с их почти моментальным переводом, что, кстати, как считают специалисты, может больно ударить по рынку обычных часов.
Все это заставляет горстку поисковых гигантов, таких как Microsoft, Google и Baidu, соревноваться между собой, чтобы не отставать от последних тенденций в мире развития технологий. Дело не идет, если у вас огромный двигатель и мало топлива. И точно так же нет прогресса, если топлива много, а двигатель крошечный.

Откуда пошел Skype Translator

Результаты глубинного исследования касательно нейронных взаимодействий в рамках языковых приложений удивили исследовательскую группу Microsoft в 2011 году. К примеру, процент ошибки в транскрипции резко упал на 50% — с 1 на каждые 4 слова до 1 на каждые 8 слов. До этого неверное понимание слова было одним из самых больших и несдвигаемых препятствий машинного перевода вообще. Система не могла его преодолеть, потому что переводила, воспринимая слово в его номинальном значении. Таким образом, процент ошибки стал значительно ниже благодаря предпринятым попыткам глубинного изучения темы распознавания голоса. 

И теперь те, кто уже опробовал на себе возможности Skype Translator — коммерческого лица столь длительных лингвистических изысканий Microsoft — видят, насколько далеко зашло дело. Звук голоса попадает в облако сервисов Microsoft, где множество разработанного компанией ПО производит его грамматический разбор. Группа программистов, придумавших и внедривших те зеленые изогнутые линии под словами с речевыми, лексическими или пунктуационными ошибками в документах Word, положили начало автоматической пунктуации. Группа, создавшая переводческое приложение Microsoft, которое применяется сейчас для перевода на Facebook, заложила основу перевода текста. А группа, разработавшая голос для программы Cortana — активируемого голосом персонального помощника от Microsoft — помогла создать голос для Skype.

И что же дальше?

Но вернемся к Skype Translator. Как убеждаются те, кто уже успел попользоваться сервисом, отмечают, что с базовыми прелестями разговора программа справляется отлично. У некоторых даже всплыли те самые надежды на универсальный передатчик-переводчик в духе «Звездных войн». Тем не менее, сервис сначала был на стадии развития новорожденного, поэтому иногда пропускал слова, а иногда выдавал странности дословного перевода. Но все мы растем. Сейчас он уже на этапе подростка, поэтому знает не в пример больше своего прежнего уровня.

40 000 людей подписались на пользование Skype Translator с момента начала его функционирования. Благодаря этому сервис прошел интенсивный курс обучения искусству разговора, в ходе которого было получено огромное количество слов, сотворивших чудо и резко уменьшивших процент ошибок.

Странная ирония систем машинного перевода в том, что они в свое время слишком много обрабатывали документов, касающихся парламентских процедур Евросоюза. Таким образом, в течение длительного периода ЕС создавала для программ богатый тренировочный материал: целую серию речей, профессионально переведенных на десятки языков.

Но Microsoft быстро накапливает свой собственный архив разговоров на повседневные темы. Пользователи предварительной версии в курсе, что их высказывания могут быть записаны и сохранены в базе анонимных смешанных данных, поэтому, как подчеркивает Microsoft, проследить источник речи невозможно. Компания ожидает, что процент ошибок будет неуклонно снижаться, пока Skype Translator вбирает в себя сленг, имена собственные и устойчивые выражения. Лишь несколько компаний могут позволить себе такую массивную базу проговоренных слов.

Сейчас команда Skype активно добавляет пользователей и тем самым снижает вероятность ошибок. Долгосрочная цель — отработать функцию моментального перевода к моменту увеличения числа пользователей до 300 миллионов.

По словам вице-президента компании, перевод должен быть доступен для каждого и притом бесплатно. К чему разработчики и стремятся. А для профессиональных устных переводчиков это довольно неловкий и даже больной вопрос. Угрожают ли нам такие программы, как Skype Translator? Основная часть игроков рынка утверждает, что бояться переводчикам нечего. Поживем — увидим.