Acasă Afaceri 7 sfaturi pentru succesul învățării automate

7 sfaturi pentru succesul învățării automate

Cuprins:

Video: Ce Factori Ne Decid Succesul? | Sadhguru (Noiembrie 2024)

Video: Ce Factori Ne Decid Succesul? | Sadhguru (Noiembrie 2024)
Anonim

Prima parte a Ghidului nostru de afaceri pentru învățare automată (ML) a dezvăluit modul în care conceptul umbrelă de ML este mult mai nuanțat într-un mediu de afaceri. Cele mai eficiente strategii privesc ML în sens practic, folosind atât tehnici complexe de învățare profundă, cât și tehnici de „învățare ieftină” mai puțin intensive, pentru a optimiza procesele întreprinderii și pentru a obține informații de afaceri tangibile.

Scopul implementării ML în aplicațiile dvs. de afaceri este de a îmbunătăți linia de jos sau de a apărea avantajul competitiv al companiei dvs. Însă, în schema mai mare a organizației dvs., profitarea la maximum a timpului și resurselor pe care le investiți în acest proces depășește cu mult algoritmii. Factorii de decizie IT din afacerea dvs. trebuie să se asigure că tot factoring-ul este afectat de ML - de la date și logistică la modul în care interacționezi cu utilizatorii - lucrează coerent împreună pentru a maximiza eficacitatea.

Ted Dunning, Ph.D., este Arhitectul principal de aplicații la MapR, o companie software de software care oferă diverse distribuții Big Data și instrumente de gestionare a datelor. Dunning a mai co-autor două cărți despre ceea ce el se referă la „Practical Machine Learning” și a dezvoltat tehnologii ML pentru o serie de companii de-a lungul anilor, inclusiv sistemul de detectare a fraudei ID Analytics (achiziționat de LifeLock) și software-ul Musicmatch Jukebox, care a devenit ulterior Yahoo Music. În prezent, el este și vicepreședinte al incubării pentru Apache Software Foundation.

Dunning a urmărit evoluția spațiului ML de-a lungul deceniilor și a învățat multe despre ce funcționează și ce nu într-un mediu de afaceri practic. Mai jos, Dunning prezintă șapte cele mai bune practici de urmat atunci când dezvoltăm soluții de afaceri înrădăcinate în ML.

1. Nu uita logistica

ML de succes nu înseamnă doar alegerea instrumentului sau algoritmului potrivit. Dunning a spus că, de asemenea, trebuie să vă dați seama ce abordare este potrivită și să o proiectați pentru situația particulară pe care o abordați. De exemplu, Dunning a vorbit despre ML într-o campanie de marketing online, spre deosebire de scenarii mult mai complicate, cum ar fi algoritmi care ghidează o mașină autonomă. Cheltuielile cu resursele dvs. pentru o îmbunătățire a algoritmului incremental merită probleme pentru mașină, dar în scenariul de marketing, veți vedea un profit mult mai bun din optimizarea întregii logistici din jurul său.

"Deseori, pentru companii, logistica, nu învățarea, vă oferă valoarea. Aceasta este partea pe care ar trebui să vă petreceți timpul și resursele", a spus Dunning. "Ajustarea algoritmului vă va aduce o mică îmbunătățire. Dar ajustarea acestor date, GUI și modul în care ascultați și interacționați cu utilizatorii dvs. vă pot oferi cu ușurință o îmbunătățire de 100 la sută. Petrecerea timpului prin reglarea algoritmului valorează o fracție ca mult pentru întreprinderi, precum ascultă utilizatorii dvs."

Pentru a ilustra acest punct, Dunning a explicat cum a construit odată un model pentru identificarea fraudei din aplicații (deschiderea de conturi false cu identități furate) în baza de date a clienților unei companii. Modelul pe care l-a construit a obținut rezultate grozave, dar Dunning a observat că a ponderat foarte mult genul solicitantului.

S-a dovedit că logistica era oprită. În modul în care a funcționat procesul de depunere a cererii, solicitantul și-a completat sexul doar după ce au devenit deja clienți și au trecut o serie de pași de depistare pentru a filtra fraudatorii. Așadar, folosind domeniul de gen, modelul ML a înșelat logistica întregului proces de fraudă. Asta nu are nicio legătură cu algoritmul și totul are legătură cu modul în care compania își primea datele în primul rând.

2. Îndepărtați-vă datele

Dunning-ul este plin de înțelegeri atrăgătoare de înțelepciune. După ce a început cu „este logistica, nu învățarea”, a spus că cealaltă jumătate a acestei idei este „este datele, nu algoritmii”. O mare parte din asigurarea algoritmilor dvs. ML furnizează informații valoroase vă asigură că le alimentați datele corecte. Dunning a spus, dacă nu obțineți rezultatul pentru care căutați, atunci este mai des, nu pentru că nu utilizați datele corecte.

„Oamenii se împotrivesc și se leagă de ego la algoritmi anumiți, dar în zilele noastre, din cauza instrumentelor de acolo, toată lumea și mama lor pot și vin cu tot felul de algoritmi noi”, a spus Dunning. „Datele sunt mult mai importante și îți vor oferi mult mai mult ridicare decât să-ți modifici la nesfârșit algoritmii. Dacă lucrezi la o problemă grea, cum ar fi recunoașterea vorbirii sau viziunea computerului, acesta este un lucru. Dar acesta este un câmp condus de date. În majoritatea scenariilor, veți beneficia mult mai mult de la ajustarea datelor obținute și schimbarea întrebării."

Asta a făcut Dunning la mijlocul anilor 2000 când a construit un motor de recomandări video la o companie numită Veoh Networks. Echipa lucra pentru a identifica perechi de videoclipuri generate de utilizatori, pe care oamenii au dat clic pe mai mult decât era de așteptat, dar algoritmul nu funcționa. Se gândeau în ceea ce privește muzica, unde utilizatorii își cunosc artiștii și melodiile preferate pe nume. Așa că au schimbat întrebarea prin modificarea interfeței de utilizator fără a atinge algoritmul în sine.

"În videoclipurile generate de utilizatori, nimeni nu știe că artiștii și o mulțime de videoclipuri aveau titluri cu adevărat spam pentru a obține mai multe vizualizări. Ciclismul pe modificările algoritmului nu ne-ar fi dat niciodată rezultate bune", a spus Dunning. "Ceea ce am făcut a fost schimbată interfața de utilizator pentru a emite un semnal de balans la fiecare 10 secunde. Am constatat că dacă am utilizat beacon-ul în loc de clicuri pentru datele brute ale recomandatorului, am obținut rezultate nemaipomenite. Ridicarea acestei modificări a fost de câteva îmbunătățirea sută la sută a implicării datorită recomandărilor, fără modificări algoritmice."

3. Algoritmii nu sunt gloanțe magice

Implementările ML prospera în încercări și erori continue. Oricât de buni sunt algoritmii dvs., dacă sistemul dvs. interacționează cu oamenii, atunci va trebui să fie ajustat în timp. Dunning a subliniat că întreprinderile ar trebui să măsoare constant eficiența generală a implementării lor și să identifice modificările și variabilele care o îmbunătățesc și o înrăutățesc. Acest lucru poate părea o platitudine, dar Dunning a spus, în ciuda cât de evident sună, foarte puține persoane fac asta sau o fac bine.

„Mulți oameni doresc să implementeze un sistem sau să ia măsuri și vor ca algoritmul lor să funcționeze perfect pentru totdeauna”, a spus Dunning. "Niciun algoritm nu va fi un glonț magic. Nici un design al interfeței utilizatorului nu va rămâne pentru totdeauna. Nici o metodă de colectare a datelor nu va fi înlocuită niciodată. Toate acestea se pot întâmpla și se vor întâmpla, iar întreprinderile trebuie să măsoare vigilent, să evalueze și să reevalueze modul în care sistemul funcționează ".

4. Utilizați un set de instrumente divers

Există zeci de instrumente ML disponibile, multe dintre care le puteți utiliza gratuit. Aveți biblioteci cadru open-source populare precum Caffe, H20, Shogun, TensorFlow și Torch și ML, într-o serie de proiecte Apache Software Foundation (ASF), inclusiv Mahout, Singa și Spark. Apoi există opțiuni bazate pe abonamente, inclusiv Amazon Machine Learning, BigML și Microsoft Azure Machine Learning Studio. Microsoft are de asemenea un set gratuit de instrumente cognitive.

Există nenumărate resurse disponibile. Dunning a vorbit cu numeroase companii, oameni de știință de date și practicieni în domeniul ML și îi întreabă întotdeauna câte cadre și instrumente diferite folosesc. În medie, Dunning a spus că cei mai mulți spun că folosesc minimum 5-7 instrumente și adesea mult mai mult.

"Nu poți fi lipit de un singur instrument. Va trebui să folosești mai multe, și ca atare, ar fi bine să-ți construiești sistemul într-un mod care să fie agnostic", a spus Dunning. „Oricine încearcă să te convingă că acest instrument este singurul de care ai nevoie vreodată îți va vinde o factură de bunuri.

"S-ar putea să se întâmple ceva care să supăreze căruța de mere, și la ritmul inovației pe care îl vedem, asta se va întâmpla cel puțin încă cinci-zece ani", a continuat Dunning. "Uitați-vă la un exemplu de învățare ieftin, unde poate reutilizați un clasificator de imagini existent pentru a analiza imaginile dintr-un catalog. Asta este învățarea profundă cu viziunea computerizată. Dar există instrumente care au ambalat-o. pentru a măsura, evalua și vacila între diferite instrumente, iar infrastructura dvs. trebuie să fie binevenită în acest sens."

5. Experimentați cu învățare hibridă

Dunning a spus că puteți amesteca și învățarea ieftină și cea profundă împreună într-un hibrid. De exemplu, dacă luați un model de viziune computer existent și reconstruiți primele câteva straturi în care se ia o decizie, atunci puteți coopta un cadru existent pentru un caz de utilizare complet nou. Dunning a indicat o competiție Kaggle în care concurenții au făcut exact așa ceva; au luat un set de date și au scris un nou algoritm pentru a ajuta un computer să distingă pisicile de câini.

"Distingerea pisicilor și câinilor este un lucru foarte subtil pentru un algoritm de ML. Gândește-te la logica: pisicile au urechi sensibile, dar la fel și păstorii germani. Câinii nu au pete, cu excepția dalmaților, etc. Acest lucru poate fi destul de dificil de recunoscut în sine și în sine ”, a spus Dunning. "Tipul care a câștigat a dezvoltat un sistem care a făcut acest lucru cu o precizie de 99 la sută. Dar am fost mai impresionat de persoana care a venit pe locul al treilea. În loc să construiască de la zero, a luat un program de recunoaștere a imaginii existent dintr-o sarcină diferită, a decolat stratul superior și a pus acolo un clasificator simplu. I-a dat câteva exemple și, în curând, a fost exact 98 la sută în diferențierea pisicilor de câini. Întregul proces a luat tipul trei ore."

6. ieftin nu înseamnă rău

În ciuda conotației excesive, Dunning a spus că învățarea ieftină nu înseamnă învățare proastă. Perioada de timp petrecută pentru o implementare ML nu se corelează în mod direct cu valoarea activității sale. Calitatea mai importantă, a spus el, este să vă asigurați că procesul este repetabil și fiabil. Dacă afacerea este capabilă să realizeze asta fără a investi o sumă nejustificată de resurse, atunci este cu atât mai bine.

"Ieftin nu înseamnă rău. Dacă funcționează, funcționează. Dacă este ieftin și funcționează, asta este grozav. Dar efortul pe care îl depuneți pentru a construi nu definește valoarea. Aceasta este o eroare de costuri", a spus Dunning.. "Ceea ce definește valoarea este modul în care îmbunătățește afacerea. Dacă îmbunătățește profiturile sau scade costurile sau îți îmbunătățește situația concurențială. Este efectul, nu efortul."

7. Nu-l numiți AI

Dunning a subliniat că, atunci când vorbim despre aceste tehnici, întreprinderile ar trebui să utilizeze terminologia precisă: ML, viziunea computerului sau învățarea profundă. Toate acestea tind să se încadreze sub termenul „inteligență artificială”, dar, pentru Dunning, definiția AI este pur și simplu „chestii care nu funcționează încă”.

"Cea mai bună definiție pe care am auzit-o vreodată pentru AI este că nu sunt încă lucrurile pe care nu le putem explica. Lucrurile pe care nu le-am dat seama", a spus Dunning. "De fiecare dată când avem ceva de lucru, oamenii spun„ Oh, nu este AI, ci doar software. Este doar un motor de reguli. Este chiar o regresie logistică. " Înainte de a ne da seama de ceva, îl numim AI, după care îl numim întotdeauna altceva. În multe privințe, AI este mai bine folosit ca cuvânt pentru următoarea frontieră, iar în AI, va exista întotdeauna o următoare frontieră. unde mergem, nu unde am ajuns deja ”.

7 sfaturi pentru succesul învățării automate