Голосовий перекладач в Skype

Деякий час назад компанія Microsoft запустила в Skype тестову версію автоматичного перекладу - як для повідомлень, так і для розмов. Відповідна піктограма з'явилася в правому верхньому куті, там функцію перекладу можна активувати для кожного абонента, вказавши при цьому, якою мовою спілкуєтеся ви і на якому абонент.

Відповідна піктограма з'явилася в правому верхньому куті, там функцію перекладу можна активувати для кожного абонента, вказавши при цьому, якою мовою спілкуєтеся ви і на якому абонент

У технічних виданнях, автори яких в курсі сучасного стану справ з машинним перекладом, про цю новину писали дуже спокійно, тому що розуміли, що тут не тільки ніякої "революції" не відбулося, а й говорити про нововведення можна хіба що тільки як про іграшку, в яку спочатку трохи пограються, а потім закинуть через майже повну непридатність.

Зате в глянцевих виданнях і в телевізорі понеслася разлюлі-малина з серії "більше не потрібно вчити іноземні мови", "всі межі спілкування стерті", "професія перекладача стала незатребувана" та інша цілковита нісенітниця.

Мені як би наплювати на все це, однак друзі і родичі начиталися і наслухалися передач на дану тему і тепер всерйоз вважають, що цим автоматичним перекладачем можна користуватися.

Ну, гаразд, вирішив подивитися, як це все працює. Спочатку поганяв автоматичний переклад чату - це найпростіше.

З одного боку - російська, з іншого - іспанська. Виходить звичайний машинний переклад. Цитую з прес-релізу MS:

На відміну від інших перекладачів, даний сервіс переводить непоодинокі слова, а цілком пропозиції, враховуючи морфологію і принцип побудови фраз.

Так ось. По-перше, морфологію і принцип побудови фраз перекладач Google почав враховувати мінімум років за п'ять до того, як був написаний даний прес-реліз. По-друге, та й Google до сих пір все це справа враховує більш ніж криво, а вже у MS перекладач ще більш примітивний (ну, воно і зрозуміло). Що в підсумку виходить? Найпростіші ідіоми не розуміє (фраза зверху - "¡A tomar por culo!"; Втім, Google її ще крутіше переводить - "Для того, щоб дупу!"), Елементарні фрази, як правило, переводить нормально, як тільки текст трохи складніше - вже пливе або зовсім спливає. Якась морфологія тут проявляється вкрай рідко. У Google з цією справою, до речі, злегка краще.

У Google з цією справою, до речі, злегка краще

Так що, як зазвичай з машинними перекладачами, все це справа можна використовувати для розуміння хоча б загального сенсу, однак тут все сильно залежить від початкового тексту. Найпростіші тексти - так, можна зрозуміти, але коли текст вже більш складний - починаються проблеми. А якщо співрозмовник буде використовувати будь-які ідіоми, скорочення, молодіжний сленг і так далі - все це перетворюється в зовсім нечитабельним кашу.

Ну, загалом, це знають всі, хто більш-менш щільно працював з машинними перекладачами.

Так, ну і ще, звичайно, багато що залежить від вихідних мов. Тому що, наприклад, англійський-іспанська і навпаки - працює набагато краще, ніж англійська-російська / російська-англійська.

Але з перекладами чатів - і так все зрозуміло. Мені цікаво було спробувати широко розрекламовану можливість автоматичного голосового перекладу. Але ось тут почалася веселуха. Тому що тут распознавалка голосу працювала, м'яко кажучи, дуже криво.

Для чистоти експерименту спочатку ми включили просто розпізнавання з російської на російську. Програма намагалася зрозуміти, що ми говоримо, і видавала це у вигляді тексту. Розмова вийшла, як бачите, більш ніж змістовний.

Розмова вийшла, як бачите, більш ніж змістовний

А це вже з того боку йде іспанська, який розпізнається і робиться переклад на російську. Краса!

Ну, в загальному, якщо з чатом ще туди-сюди, то з перекладом з голосу - вила повні і перш за все - через системи розпізнавання, яка працює дуже криво. Що дивно: у того ж Google клавіатурна распознавалка працює більш-менш пристойно, я її іноді використовую, коли текст зовсім простий.

Так що тут про переведення живого тексту не може бути й мови. Ну, звичайно, крім ситуацій, коли ви просто хочете чисто поржать. Тому що дуже криве розпізнавання, а потім ще й дуже кривою переклад-підрядник - на виході буде тільки Чак в Бразилії і лижі Бога, я розумію.

За Мережі в рекламних цілях ганяють всякі смішні ролики, на зразок того, з діточками , Де англоговорящая дівчинка легко пояснюється з іспаномовної. Ну, таких роликів, як ви розумієте, назнімав можна хоч тисячу, тільки й того. Більш того, якщо довго посидіти, то можна скласти, наприклад, іспано-англійський діалог, в якому перекладач буде працювати майже ідеально. Якщо дуже-дуже довго посидіти. Але для живої мови - поки взагалі ніяк. А вже радісні ролики про бесіди англомовних з китайцями - це, звичайно, ржачка цілковита.

А ви спробуйте, це все досить забавно.

Що в підсумку виходить?