Cuprins:
Video: Уроки SQL для начинающих / #3 - Добавление и обновление записей в БД (Noiembrie 2024)
Google a adăugat acum capabilități de învățare automată (ML) la Google BigQuery, oferirea de baze de date cloud pe scară largă a companiei petabyte (PB). Acum denumită BigQuery ML, noua versiune vă permite să folosiți instrucțiuni SQL Structed Query Language (SQL) pentru a construi și implementa modele ML pentru analitice predictive.
Nu este doar o veste bună pentru oamenii de știință care utilizează Google. De asemenea, este bine pentru operatorii de afaceri interesați să-și dezvolte capacitățile de analiză a datelor, deoarece adaugă un concurent mai eficient unei liste destul de mici de furnizori capabili să ofere acest nivel de sofisticare prin cloud. Celelalte două nume cele mai cunoscute sunt Serviciul de baze de date relaționale al Amazon și SQL Azure SQL și puteți găsi mai multe în recentul nostru serviciu de bază de date cloud.
Interdicția tuturor vânzătorilor și cumpărătorilor de produse de date a fost întotdeauna diferența de competențe. Acest lucru a fost valabil mai ales pentru cei interesați de analiza ML și predictivă, deoarece aceste discipline necesită adesea cunoașterea noilor tehnologii și a limbajelor de interogare.
"Pentru fiecare om de știință de date, există sute de analiști care lucrează cu date, iar majoritatea folosesc SQL", a declarat pentru PCMag Sudhir Hasbe, directorul Product Management al Google Cloud. Ceva trebuia să dea dacă puterea unei armate de analiști de date ar trebui să fie deconectată de la gâtul creat de prea puțini și prea supraevaluati oameni de știință de date.
Răspunsul Google la această dilemă nu este nimic remarcabil. În timp ce ML este o tendință fierbinte și apare în toate tipurile de produse de pretutindeni, încă este ferm teritoriul oamenilor de știință. Mulți vânzători au avansat în simplificarea tehnologiei, dar adevărul urât este că îl puteți simplifica mult și este încă prea dificil pentru mai mult de 99 la sută din populația umană. Cu toate acestea, trebuie să-l putem folosi pentru că ML poate face mai mult și o putem face mai repede decât poate un grup de oameni super-deștepți.
Google plantează ML în Google BigQuery, astfel încât să locuiască mai aproape de date. Aplicația va aduce capabilități ML mai rapid decât modelele ML tradiționale, în parte, deoarece analiza datelor poate fi efectuată la sursă. Acum, în versiune beta, BigQuery ML permite analiștilor (și oamenilor de știință de date) să ruleze analize predictive, cum ar fi previziunea vânzărilor și crearea de segmente de clienți chiar deasupra datelor unde sunt stocate. Doar că este un respectabil și un upgrade notabil.
Cu toate acestea, Google a mers mai departe decât aceea prin adăugarea unei capacități care le permite analiștilor de date să utilizeze instrucțiuni SQL simple pentru a construi și implementa modele ML. În acest moment, opțiunile sunt regresia liniară și modelele de regresie logistică pentru analiza predictivă, deoarece acestea sunt cele două modele utilizate cel mai des.
Iată o ilustrație oferită de Google pentru a demonstra modul în care analiștii de date ar utiliza această capacitate:
Google intenționează să adauge mai multe opțiuni ML la această capacitate în timp, potrivit Hasbe. „Trebuie să auzim de la clienții noștri care sunt modelele pe care doresc să le adăugăm, astfel încât să le oferim cele mai utile în primul rând”, a spus el.
Modernizări suplimentare Google BigQuery
Pe baza listei substanțiale de actualizări după ML se numără o capacitate de grupare, BigQuery Geographic Information Systems (BigQuery GIS), un nou conector de date Google Sheets și un nou conector de date Google Sheets.
Clusteringul este, de asemenea, în versiune beta și permite crearea de tabele grupate într-o mișcare de optimizare a datelor care grupează rânduri cu chei de cluster similare. Aceasta reduce costurile, deoarece îmbunătățește performanțele și permite Google BigQuery să încarce utilizatorul numai pentru datele scanate, mai degrabă decât pentru întreaga tabelă sau partiție.
BigQuery GIS este în prezent în alfa și este utilizat pentru analiza datelor geospatiale. În timp ce echipa Google Cloud s-a asociat cu Google Earth Engine pentru a construi GIS BigQuery, trebuie să aduceți propriile date geospatiale pe tabelă. Aceasta nu este o problemă în și în mai multe industrii, inclusiv sisteme auto conectate, Internet of Things (IoT), producție, comerț cu amănuntul, orașe inteligente și telematică. Nu mai vorbim de agențiile guvernamentale care variază de la Agenția pentru Protecția Mediului (EPA) și Agenția Națională de Informații Geospatiale până la Administrația Națională Oceanică și Atmosferică (NOAA) și toate ramurile militare, desigur.
BigQuery GIS folosește biblioteca S2, care acum are peste un miliard de utilizatori printr-o varietate de produse, cum ar fi Google Earth Engine și Google Maps. Dacă aveți nevoie de mai multe date geospatiale, atunci guvernul federal împărtășește o cantitate imensă din GeoPlatform.
Un nou conector de date Google Folii este de natură să încânte mulți analiști de date doar pentru că este atât de practic pentru utilizarea zilnică. Puteți accesa Google BigQuery din Google Sheets (programul de foi de calcul) și puteți utiliza instrumente Google Sheets precum Explore, care este un instrument de colaborare combinat, vizualizarea datelor și instrumentul de interogare a limbajului natural.
Google BigQuery are acum și o nouă interfață de utilizator (UI) în versiune beta. Unul dintre elementele mai interesante este funcționalitatea de vizualizare cu un singur clic, acceptată de Google Data Studio. Toate spus, este o mare rundă de upgrade-uri pentru un serviciu deja elegant. Aceste actualizări vor fi testate în următoarea rundă a bazelor de date a soluției de bază de date (ca serviciu a DBaaS) de la PCMag, după ce s-au rezolvat erorile și produsele s-au mutat dincolo de stările alfa și beta respective.
PCMag EIC Dan Costa discută viitorul datelor: