Acasă Păreri Graalul sfânt al traducerii vocale, acum pe skype | Ioan c. Dvorak

Graalul sfânt al traducerii vocale, acum pe skype | Ioan c. Dvorak

Video: How to export chat / files history in Skype 2019 (Octombrie 2024)

Video: How to export chat / files history in Skype 2019 (Octombrie 2024)
Anonim

Dacă ați urma revoluția computerului de la începutul microprocesorului, știți că există o serie de promisiuni timpurii care încă nu au fost îndeplinite.

Unul dintre acestea este discursul tradus în zbor, unde spui ceva în engleză și se repetă în altă limbă, precum spaniola, în timp real. Deși este încă un lucru în desfășurare, Microsoft este acum cu un pas mai aproape cu Skype Translator, a cărui primă fază a început în această săptămână.

Dacă acest lucru se apropie de funcționare și nu este o glumă, acesta este produsul deceniului. Momentan, Skype Translator acceptă traduceri din spaniolă în engleză și engleză în spaniolă, dar mai multe limbi urmează să fie urmate.

Problema tipică cu aceste tipuri de lucruri este nivelul de dificultate scandalos. Încă am văzut un pachet de traduceri decent, care face traduceri text-text care funcționează bine. Traducerea vorbirii are un nivel de dificultate cu totul diferit, mai ales în timp real.

Microsoft are un film care arată doi copii care vorbesc în spaniolă și engleză, ceea ce face să pară că funcționează bine. Dar am văzut un sistem similar demonstrat de IBM acum aproape 20 de ani, care nu a văzut niciodată lumina zilei. Versiunea IBM a fost dezvoltată în anii’90, când a existat o manie de recunoaștere a discursului condusă de Lernout & Hauspie, o companie care s-a declanșat pentru rupere - înainte de a trece peste un scandal de fraudă în 2001. Înainte de asta, totuși, cumpăra fiecare tehnologie de vorbire. compania pe care ar putea-o, inclusiv Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone și altele. Microsoft a avut o participație de 8% în L&H și a încheiat cu unele dintre tehnologii ca un cadou de despărțire de faliment.

Acum apare Skype Translator. Coincidență? Oricare ar fi cazul, întreaga tehnologie a durat prea mult pentru a ajunge la acest punct.

Uită-te la traducerile mizerabile pe computer de la text la Google realizate de Google și de alții. Textul nu și nu poate evita cea mai evidentă dintre greșeli. Nimic din toate acestea nu abordează complexitatea traducerii vorbirii, ceea ce implică o prelucrare intensă a semnalului.

Sunt colecționar de vinuri și vizitez frecvent site-urile vinicole franceze. Limba franceză este în regulă, așa că activez adesea traducerea pentru a accelera citirea site-ului. Iată-ne în 2014 și niciunul dintre traducători nu își poate da seama că traducerea lui Château Margaux este Château Margaux, nu Castle Margaux. Cât de dificil este să vă abțineți și să nu traduceți în cuvântul castel un cuvânt obișnuit folosit într-un nume propriu, cum ar fi château, care se referă de obicei la o vină specifică? Se pare că este imposibil. Toți o fac.

Cât de greu este să scrieți unele excepții în codul care îi spune traducătorului că se află pe un site web despre vinul Bordeaux? În timp ce pe acel site cuvântul château nu înseamnă castel. Adesea, traducătorul va încerca să decodeze și restul numelui de castel, cu rezultate ridicole. Cel mai bun lucru pe care îl puteți face în general cu traducerea textului este să faceți o idee despre ceea ce spune site-ul.

Întrebați-vă: dacă textul este atât de dificil, cum va gestiona Microsoft vorbirea?

Este aproape imposibil, chiar și în aceeași limbă. Luați serviciul de telefon Google Voice. Are o funcție de preluare a mesajelor prin vorbire pe text. Nu am primit niciodată un mesaj vocal-text care să se apropie chiar de ceea ce persoana a spus de fapt. Nu o singură dată.

Voi recunoaște că într-o cameră liniștită când vorbești distinct și clar, recunoașterea vocii merge bine. Îl folosesc pentru mesaje text pe telefonul meu Android. Dar într-o adevărată conversație, nimeni nu vorbește așa. Admir Microsoft pentru că a lansat asta. Dar nu va funcționa la fel de publicitate.

Acestea fiind spuse, este cel puțin ceva de jucat. Ar putea chiar să declanșeze o nouă generație de cercetare. Deci nu mă voi plânge prea mult.

Toată lumea vrea asta. Să revenim la lucrări.

Graalul sfânt al traducerii vocale, acum pe skype | Ioan c. Dvorak