Acasă Păreri Ai este (de asemenea) o forță pentru bine | ben dickson

Ai este (de asemenea) o forță pentru bine | ben dickson

2024

Cuprins:

Cum generează învățarea profundă vocile umane
Recreația vocii unei persoane fără glas
Echilibrarea utilizărilor negative ale sintetizatorilor AI

Video: F.Charm feat. Elena Gheorghe - MAMA (By Lanoy) [Videoclip oficial] (Noiembrie 2024)

În 2017, Scleroza laterală amiotrofică (ALS), o tulburare neurologică devastatoare, l-a jefuit pe Pat Quinn, fondatorul celebrei Ice Bucket Challenge, din capacitatea sa de a vorbi.

În 2018, inteligența artificială l-a ajutat să-l recupereze.

Datorită progreselor în învățarea automată și a învățării profunde, algoritmii de inteligență artificială au devenit foarte buni la imitarea oamenilor. Dar, deși multe dezvoltări proeminente în spațiu au fost negative, puterea de imitație a AI a fost o forță de schimbare pozitivă pentru Quinn.

"Majoritatea persoanelor care trăiesc cu ALS (cunoscută și sub denumirea de boală cu neuroni motorii) sfârșesc paralizate și incapabile să comunice cu nimic altceva decât vocale" computerizate "artificiale", spune Oskar Westerdal, cofondatorul Project Revoice, o inițiativă care își propune să ajute pacienții cu ALS ca Quinn.

Pentru a reda vocea lui Quinn, Project Revoice a colaborat cu Lyrebird, una dintre o serie de companii care folosesc AI pentru a clona vocea unei persoane - un grup care include, de asemenea, WaveNet și Voicery Google, o pornire susținută de Y Combinator, care folosește AI pentru a crea înregistrări vocale sintetizate..

Cum generează învățarea profundă vocile umane

În spatele acestor aplicații se află algoritmi de învățare profundă, o ramură populară a AI care utilizează seturi mari de date pentru perspective și tipare care nu pot fi capturate cu un software tradițional bazat pe reguli. Când antrenați un sintetizator vocal de învățare profundă, cu suficiente înregistrări vocale, creează un model digital care reprezintă vocea persoanei și poate genera noi mostre vocale.

Înainte de apariția tehnologiei de sinteză vocală bazată pe AI, pacienții ALS trebuiau să utilizeze voci digitale generice care nu erau ale lor. Alte tehnologii ar putea îmbina propoziții înregistrate în prealabil cu vocea pacientului, dar rezultatele au fost prea artificiale și au necesitat zeci de ore de înregistrări vocale pentru a fi de o utilizare minimă.

Aplicațiile de învățare profundă, pe de altă parte, necesită date mult mai puține și oferă rezultate mai bune. „Ceea ce poate obține Lyrebird cu doar câteva ore de audio este remarcabil - le oferă oamenilor o clonă vocală digitală completă, astfel încât să poată spune orice își doresc”, spune Westerdal.

Recreația vocii unei persoane fără glas

Una dintre limitele aplicațiilor de învățare profundă este dependența lor de eșantioane de date de înaltă calitate pentru a-și antrena rețelele neuronale. Problema cu pacienții cu ALS este că, odată ce își pierd vocea, înregistrarea probelor vocale este imposibilă. Din fericire, Quinn a avut ore întregi de note și interviuri înregistrate.

„Cea mai mare provocare a fost calitatea. Această tehnologie depinde complet de înregistrări consistente și de înaltă calitate, care urmează și un script exact - așa că a trebuit să lucrăm cu un studio de sunet pentru a„ remasteriza ”manual și a transcrie fiecare linie de dialog pe care am putea găsi de Pat ", spune Westerdal.

"Ne-am cam speriat că nu vom fi capabili să oferim o calitate excelentă pentru a crea vocea lui Pat", spune Jose Sotelo, cofondatorul Lyrebird. "Întrucât nu am reușit să obținem înregistrări curate, calitatea finală a vocii artificiale nu este perfectă. Credem că putem face o treabă mult mai bună cu înregistrări curate."

Rezultatele încă sună puțin nefiresc și sintetic. Dar pentru Quinn, care folosise o voce generică pentru a comunica, diferența era dramatică. "Dupa ce mi-am auzit vocea prin aceasta noua tehnologie, am fost suflat! Pentru ca pacientii sa stie ca pot avea propria lor voce dupa ce ALS o ia, aceasta va schimba modul in care oamenii traiesc cu ALS", spune el.

Quinn recomanda pacientilor cu ALS sa-si inregistreze vocile inainte de a fi prea tarziu. "După ce am auzit din nou propria mea voce, am nevoie de pacienți cu ALS pentru a ști că înregistrarea vocii lor este incredibil de importantă", spune el.

Echilibrarea utilizărilor negative ale sintetizatorilor AI

La începutul acestui an, FakeApp, o aplicație de schimbare a feței care funcționează AI, a declanșat un atac de videoclipuri pornografice false cu vedete și politicieni. Există îngrijorare că aplicații precum FakeApp și Lyrebird vor crea o nouă eră de știri false, fraude și falsuri.

Pagina de etică de pe site-ul Lyrebird a recunoscut anterior că tehnologia ar putea „avea potențial consecințe periculoase, cum ar fi diplomații înșelători, frauda și, în general, orice altă problemă cauzată de furtul identității altcuiva”.

Pentru a stabili acest punct, site-ul companiei oferă mai multe înregistrări sintetizate create cu vocile lui Donald Trump și Barack Obama.

@realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk
- Lyrebird AI (@LyrebirdAi) 4 septembrie 2017

Povestea lui Quinn ar putea ajuta să arunce o lumină asupra aspectelor pozitive ale unei industrii care a preluat flăcări pentru utilizările potențial înfiorătoare și neetice ale aplicațiilor sale. „Este important ca oamenii să realizeze partea strălucitoare a acestei tehnologii”, reamintește Sotelo de Lyrebird.

În afară de utilizările medicale, aplicațiile sintetizatoare AI pot servi alte obiective productive. Voicery oferă brandurilor voci digitalizate personalizate, alimentate de algoritmi AI. De asemenea, Google face experimente cu WaveNet pentru a oferi o experiență mai naturală utilizatorilor dispozitivelor sale Google Assistant. Alte domenii în care tehnologia este utilă includ automatizarea cărților audio sau simplificarea duplicării vocale în filme.

Obstacolele etice și legale vor apărea fără îndoială și dezbaterile vor continua. Dar pentru Quinn, AI este o forță spre bine. „Nu vreau să sune ca un computer”, spune el. „Vreau să sun ca mine”.