Acasă Gândire înainte Asistenți inteligenți: ce vine după siri?

Asistenți inteligenți: ce vine după siri?

Video: Что такое ICE WINE? Обзор FANAGORIA ICE WINE (Фанагория Айсвайн) (Octombrie 2024)

Video: Что такое ICE WINE? Обзор FANAGORIA ICE WINE (Фанагория Айсвайн) (Octombrie 2024)
Anonim

Asistenții inteligenți - Siri, Google Now, Cortana și altele asemenea - au trecut de la curiozități și trucuri de salon în urmă cu câțiva ani, la instrumente esențiale pe care mulți oameni le folosesc în viața lor de zi cu zi. Săptămâna trecută, am renunțat la Conferința Asistenților Inteligenți de la New York, prezentată de Opus Research și am fost impresionat de progresul pe care îl înregistrează software-ul într-o varietate de industrii, inclusiv progresul companiilor financiare, de asigurări și medicale în construirea agenților specifici..

Fondatorul Opus Research, Dan Miller, a explicat că multe dintre tehnologiile de bază, cum ar fi recunoașterea vorbirii, sunt de peste 20 de ani. Deși a văzut recent unele îmbunătățiri majore, mai degrabă decât o revoluție, el a spus „suntem pe o cale evolutivă”, cu o mulțime de produse pe un continuum cu capacități diferite. El a menționat că există sute de asistenți inteligenți ai întreprinderii care pot fi folosiți pentru o conversație simplă bazată pe text în engleză simplă, folosind un set de date fixe și pentru lucruri precum navigarea pe un site web sau o întrebare frecventă. Pe celălalt capăt al spectrului, există probabil doar câteva zeci de „aplicații dinamice, cu simțire umană”, care sunt mai mult conversaționale și conștiente de context.

Miller a indicat aplicațiile care au câștigat premii în cadrul conferinței. Julie a lui Amtrak a început ca agent de servicii de telefonie vocală cu răspuns interactiv în urmă cu ani, dar acum a evoluat într-un agent care lucrează pe site-ul web pentru a ghida călătorii prin Amtrak.com, bazat pe un agent de la Next IT. Telefonica Mexico are un agent pe nume Nico, care are un avatar și oferă, de asemenea, suport prin Twitter și Facebook, pe baza platformei AgentBot. ING Netherlands are Inge, o aplicație care vă permite să verificați soldul contului dvs. bancar sau să transferați bani prin voce, folosind tehnologia biometrică vocală de la Nuance, pentru a vă autentifica identitatea.

Mențiunile de onoare includ aplicații de asistență medicală, cum ar fi o aplicație care vă ajută să alegeți un plan de asistență medicală. Alte aplicații despre care am auzit în cadrul emisiunii includ Domino's Pizza, care are o aplicație numită Dom care vă permite să folosiți voce pentru a comanda pizza; și BMW, care are un agent virtual ca parte a brațului său de finanțare auto Up2drive.

Brett Beraneck de la Nuance a vorbit despre modul în care progresele în rețelele neuronale de învățare profundă au îmbunătățit lucruri precum înțelegerea limbajului natural, precum și recunoașterea vocală și cum se reunesc acum pentru a permite un interes mult mai mare în domeniu. Asistentul Nina de la Nuance a fost un exemplu timpuriu și, de atunci, a crescut la o mulțime de aplicații specifice, de la sisteme interactive de răspuns vocal la companiile de asigurări până la aplicații de cumpărături. Fiecare dintre aceste aplicații are o personalitate diferită, în funcție de ceea ce încearcă să vă ajute.

O nouă funcție nouă despre care a discutat a fost biometria vocală, în care vocea dvs. înlocuiește o parolă. El a vorbit despre cum companii precum ING în Europa dezvoltă agenți care nu numai că folosesc recunoașterea vocală și procesarea limbajului natural, dar încep și să folosească vocea pentru a recunoaște persoana care apelează. El a spus că acest lucru este atât mai sigur, cât și mai natural decât o parolă tradițională.

În timp ce studiile recente s-au îngrijorat că înregistrările vocale ar putea păcăli astfel de sisteme, Nuance a menționat că tehnologia actuală include funcții care vizează preluarea anomaliilor de la vocea înregistrată și a indicat alte studii care au luat un punct de vedere diferit. În plus, a spus el, proiectanții pot utiliza diferite niveluri de biometrie vocală pentru diferite funcții, cum ar fi utilizarea unei recunoașteri simple pentru a verifica soldul contului sau a vă cere să repetați o secvență aleatorie de cuvinte pentru transferuri semnificative de bani.

Biometria vocală pare cu siguranță că câștigă un pic de tracțiune. În cadrul Simpozionului Gartner de săptămâna trecută, o sesiune despre „cazuri de clienți misto” din serviciile financiare a inclus o aplicație Citibank care a folosit această caracteristică.

MyWave are un asistent numit Frank, care este menit să fie activat de mai multe întreprinderi pentru a vă permite să interacționați cu ele într-un mod mai conversațional, mai degrabă decât ca fiecare afacere să își dezvolte propria. Primele utilizări includ o bancă din Noua Zeelandă și o aplicație numită Saveawatt concepută pentru a vă ajuta să alegeți furnizorul de energie electrică.

CEO Geraldine McBride a explicat că compania încearcă să creeze asistenți care să pună capăt decalajului dintre clienți și aplicații de servicii, cu ceea ce numește „relații gestionate de clienți” sau CMR, un spin pe aplicațiile tradiționale CRM. O diferenta mare, a spus ea, este ca clientul este responsabil de toate datele sale, mai degrabă decât de afaceri.

O altă companie relativ nouă, Expect Labs are un produs numit MindMeld care funcționează ca un backend pentru o serie de companii care doresc să ofere o interfață vocală pentru a înlocui interfețele tradiționale și pentru a trata întrebările și răspunsurile. Aceasta poate fi folosită pentru o varietate de aplicații, cum ar fi vizionarea de emisiuni TV doar solicitând numele și având interogarea sistemului mai multe sisteme. (Amazon TV Fire are unele dintre aceste caracteristici, dar nu este integrat cu set-top box-ul dvs., în timp ce unul dintre investitorii în Expect Labs este compania de cablu Liberty Global.)

CEO-ul Tim Tuttle a explicat că MindMeld tinde să folosească recunoașterea vorbirii deja disponibilă în majoritatea dispozitivelor și, în schimb, se concentrează pe înțelegerea limbajului natural și construirea unui grafic al cunoștințelor informațiilor disponibile. El a spus că firma încearcă să extindă sistemul pentru a include mai multe informații din surse multiple și pentru a descompune ierarhiile diferitelor categorii de informații care fac parte din majoritatea acestor sisteme. Înțelegerea cu adevărat a întrebărilor înseamnă a fi capabil să înțelegeți intenția într-o varietate de categorii, a spus el.

Un lucru pe care l-am auzit de la un număr de participanți au fost statistici care sugerează că aproximativ 10 la sută din toate căutările pe Web se fac acum prin intermediul agenților de informații. (Pionierul AI, Andrew Ng, a spus că acest lucru a fost valabil pentru căutarea vocală la Baidu anul trecut, iar mai multe persoane au spus că acest lucru este valabil și la Google, dar nu am auzit nicio confirmare de prima mână.)

Așteptând cu nerăbdare, Millerul Opus Research a declarat că mai sunt multe de făcut. Precizia de bază a sistemelor are mult spațiu pentru îmbunătățiri, în special în trecerea de la ceea ce spui la ceea ce vrei să spui la ce să faci ca urmare. El a menționat o conferință a CEO-ului Xerox PARC, Stephen Hoover, în cadrul conferinței, care a spus că sistemele de astăzi sunt cu până la 90 la sută exacte în a înțelege ce înseamnă noi, dar că 10 la sută este încă o problemă pentru că este ceea ce își amintesc majoritatea oamenilor atunci când se ocupă un sistem. Iar Miller a spus că este loc pentru o mai bună personalizare, deoarece dacă sistemul știe cu cine vorbește, poate da rezultate mai bune. De exemplu, el a menționat că Facebook știe cine folosește sistemul pentru că sunteți autentificat; și a spus că a face acest lucru perfect cu mai mulți agenți va deveni mai important.

Cu siguranță este o categorie fascinantă și mă aștept să petrecem cu toții mai mult timp vorbind cu telefoanele și calculatoarele noastre și să interacționăm cu agenți care nu sunt destul de umani. Îl consider una dintre cele mai interesante tendințe în calcul în aceste zile.

Asistenți inteligenți: ce vine după siri?