Acasă Păreri Datele mari sunt doar o mare înșelătorie | Ioan c. Dvorak

Datele mari sunt doar o mare înșelătorie | Ioan c. Dvorak

Video: NAVI.V-Tune: Игра Just Error смотрится очень жадно @ EPIC League (Octombrie 2024)

Video: NAVI.V-Tune: Игра Just Error смотрится очень жадно @ EPIC League (Octombrie 2024)
Anonim

Memeul „big data” nou apărut nu a fost niciodată definit într-un mod semnificativ și definitiv. Este cel mai amoros nou termen buzz pe care l-am văzut de un deceniu. Este unul dintre acei termeni „ochiul privitorului” folosit pentru a amenaja un seminar și în cele din urmă să înmoați investitorii.

Să începem să ne întrebăm ce înseamnă datele mari? O mulțime de date? Mai multe date decât puteți gestiona? Date amorfe? În afara datelor de control? Date utile pentru analiză? Date inutile? Supraîncărcare informațională?

Dacă citiți destul despre date mari, este vorba de toate cele de mai sus și multe altele. Cheia nu este data, ci provocarea modalității de gestionare a datelor și ce trebuie făcut cu datele în sine.

Cu alte cuvinte, cum putem face ca această grămadă uriașă de date, pe care am reușit să o acumulăm, să fie utilă în moduri noi și profitabile? Grupurile de date pot veni de oriunde prin diferite mecanisme de calcul, cum ar fi postări Facebook, jurnalele NSA, liste de corespondență, clienți etc.

Aș susține că majoritatea cititorilor acestei coloane sunt ei înșiși depozite de date mari. Tocmai am cumpărat o unitate de 3 Terabyte pentru backup. Am o mulțime de date pentru a face backup! Date mare!

Un instrument util pe care mi-l pot imagina ar fi un instrument de analiză a datelor pe care poliția l-ar putea folosi pentru a vă găsi vinovat de unele crime aleatorii, parcurgând fișierele dvs. Sau cel puțin să găsești ceva care să te jeneze. Date mare!

Acest lucru se întoarce la un comentariu făcut de un fost CEO al American Express, care a spus unei audiențe că, dacă compania dorește (și aceasta se aplică tuturor companiilor de carduri de credit), poate folosi obiceiurile și tendințele dvs. personale de cumpărare pentru a pune la cale un complet dosar și spuneți cu siguranță dacă aveți o aventură sau nu. Date mare!

Din câte pot să spun, aceasta este exact ceea ce datele mari fac cel mai bine, spionează persoane.

Comentariul popular al industriei este că bazele de date uriașe care conțin informații despre tine vor fi utilizate în beneficiul tău. Da, știi, așa că vei primi lucruri pentru care te interesează de fapt. Publicitate vizată. Acest lucru aduce beneficii tuturor!

Iată cum funcționează acest lucru. Sunt interesat să cumpăr un nou aparat foto și să aud despre noul Bogus One. Am citit un articol pe PCMag.com despre aparatul foto, apoi merg pe Amazon și verific prețurile și recenziile utilizatorilor. Apare ca și cum nimănui nu i-ar plăcea camera. Este o bucată evidentă de prostii. Toți recenzorii au umbrit camera. Cumpărătorii urăsc camera foto. Nu este un aparat foto pe care mi-l doresc. Însă software-ul de analiză a datelor mari decide să-mi ofere sute de reclame, pe fiecare pagină web pe care o vizitez, toate arătând aparatul foto Bogus One. Date mare!

Este mai rău de atât. Dacă lucrurile merg în cealaltă direcție și aș fi decis că îmi place și vreau camera și am cumpărat efectiv camera, tot aș primi reclame care mă încurajează să cumpăr camera. Date mare!

Publicitatea „big data” vizată este cea mai mare încărcătură de baloney, vreodată.

OK, deci uităm că fiasco și trecem la utilizarea datelor mari pentru tendințe. Datele mari ar putea găsi diverse ace în diferite căldări de fân. Așadar, veți obține ceva de genul acesta: patruzeci la sută dintre cumpărătorii Subaru sunt vegetarieni / vegani, iar 80 la sută dintre ei sunt democrați. Dar acest număr a crescut la 60 la sută, respectiv 90 la sută, dacă vorbim despre un Outaru Subaru. Mai mult, crește până la 99 la sută vegetarian / vegan și 99 la sută democrat dacă mașina este vopsită în verde.

Teoreticienii de date mari ar avea o zi de teren la seminar cu aceste informații. Dar ignoră toate variabilele care pot schimba calculele și tendințele, care sunt nesfârșite. Cât timp va rezista vreuna din aceste date mari, dacă CEO-ul Subaru va conduce la o adunare într-un Outback verde și va declara că „Toate balenele trebuie anihilate!”?

Nici măcar nu necesită atât de mult pentru a schimba dinamica concluziilor de date mari. În ciuda a ceea ce spune tipul American Express, datele sunt de fapt oarbe. De aceea, primiți reclame pentru produsele pe care le-ați cumpărat deja.

Date mari ar trebui să sari la concluzii.

Dacă cineva cumpără zece cărți despre cum să faci o bombă, înseamnă că vrea să arunce în aer clădirea federală? Ce se întâmplă dacă era un expert în eliminarea bombelor și că nu era inclus în titlul său de post de consultant de poliție? Datele mari nu pot ști încă totul. Nu poate ști ce gândești. Mă gândesc, de exemplu, că aparatul de fotografiat Bogus One se sinucide. Datele mari nu pot ști asta decât dacă sunt interogat. Și s-ar putea să mint despre asta.

Nimic din toate acestea nu sună bine sau sănătos pentru societate. Sari la concluzii, făcând presupuneri, acționând pe presupuneri false. Hounding the public with ineless s.

Datele mari ca un concept înalt nu se vor defini niciodată pe sine și vor muri o moarte mizerabilă. Sper.

Datele mari sunt doar o mare înșelătorie | Ioan c. Dvorak