Acasă Păreri Cum ai, ml va transforma vorbirea în text, traducerile de limbă | tim bajarin

Cum ai, ml va transforma vorbirea în text, traducerile de limbă | tim bajarin

2024

Video: Explainable AI for Science and Medicine (Noiembrie 2024)

Unul dintre cele mai impresionante demonstrații de la Google I / O a fost Duplex, o informație artificială care a făcut apeluri la locuri de afaceri - în acest caz, un salon de coafură și un restaurant - pentru a rezerva întâlniri. Oamenii de pe celălalt capăt al liniei nu păreau mai înțelepți, iar Duplex a rezolvat provocările cu ușurință, ca atunci când restaurantul a spus că nu acceptă rezervări pentru petreceri mici.

Acest anunț special de AI a obținut multă acoperire la Google I / O, dar învățarea AI și învățarea automată a fost predominantă în toate produsele și serviciile prezentate la conferința dezvoltatorilor. Uitați-vă la acest grafic, pe care Google l-a afișat la un eveniment de analiză centrat în AI cu o zi înainte de deschiderea I / O.

La acel eveniment s-au arătat alte două lucruri pe care le consider potențiali schimbători de joc.

Primul este modul în care se aplică AI la traducerea voce-text. Obiectivul este de a obține o precizie de 99 la sută folosind AI și ML în următorii ani. Acestea fiind spuse, demonstrațiile în care au dictat comentarii pentru diverse aplicații G-Suite erau deja destul de precise. Am văzut, de asemenea, o demonstrație mai detaliată a Smart Compose, în care o persoană scrie o propoziție în Gmail, iar Smart Compose scrie următoarea propoziție pentru dvs. pe baza contextului primei propoziții.

Diferite produse de recunoaștere vocală, cum ar fi Dragon Dictate, sunt pe piață de ani buni. Dar aceste programe s-au bazat pe software localizat și au profitat de puterea curentă de procesare disponibilă la momentul fiecărei versiuni. Aceste programe s-au îmbunătățit de-a lungul anilor, dar dacă anunțați AI și ML, rata de precizie va fi mai bună.

Google înțelege importanța vorbirii cu textul în legătură cu viața noastră de zi cu zi. O interfață voce-text precisă este esențială atunci când răspundeți la un mesaj în timp ce conduceți. Este o modalitate semnificativă de a răspunde la un e-mail sau la un mesaj text pe purtătoare sau smartphone-uri. În cele din urmă, va deveni o contribuție valoroasă atunci când folosiți ochelari cu realitate mixtă, unde utilizarea vocii ca parte a procesului de navigare și voce-text este necesară pentru diferite tipuri de aplicații AR.

Al doilea este modul în care se folosesc AI și ML în Google Translate, ceea ce va fi cu adevărat transformator atunci când traducerile vor avea loc în timp real. În calitate de călător internațional care vorbește doar engleza, acest tip de traducere ar fi un zeu. Există unele dispozitive portabile care încearcă să traducă ceea ce spui într-o limbă locală, dar în prezent au multe limitări.

Google are ochii asupra acestui tip de traducere, așa că este sigur să spunem că în scurt timp am putea vedea câteva descoperiri reale în traducerea mai exactă a limbii pe telefoanele Android. Apple are, de asemenea, cercetări AI și ML care se ocupă de diferite aspecte ale traducerii vocale și text, astfel că, împreună cu potențiali parteneri, ar putea livra o soluție de traducere a limbii mobile pe iOS într-o zi.

AI și ML vor avea un impact dramatic asupra traducerii voce-text, iar efectul său cel mai proeminent poate fi ca parte a UI în AR și VR sau ochelari cu realitate mixtă. Personal, traducerile din limbi mă entuziasmează cel mai mult, întrucât mi-ar ușura călătoriile prin lume.