Video: USR PLUS își lansează programul de guvernare (Noiembrie 2024)
Am scris multe despre rolul datelor în afacerile moderne. De la start-up-uri și întreprinderi mici și mijlocii (IMM-uri) până la întreprinderi mari, informațiile și analiza datelor sunt mai accesibile pentru întreprinderile de toate dimensiunile decât până acum. Acest lucru este, în parte, datorită creșterii informațiilor de afaceri de serviciu (BI) și instrumentelor de vizualizare a datelor.
Cu toate că, înainte de a putea utiliza instrumente BI sau de a rula analize predictive pe un set de date, există o serie de factori care să se distanțeze. Începe prin a înțelege pur și simplu ce este Big Data, ce nu este (indiciu: nu o bilă cristalină) și cum să gestionați stocarea de date, organizarea, permisiunile și securitatea în arhitectura de date a întreprinderii dvs. Aici intervine guvernarea datelor. Procesele prin care vă asigurați guvernanța în cadrul unei întreprinderi diferă în funcție de cine vorbiți. Dar, la baza sa, guvernanța datelor se referă la încrederea și responsabilitatea datelor, căsătorită cu cele mai bune practici de securitate a datelor.
Am vorbit cu Hortonworks și MapR, doi dintre cei mai mari furnizori de companii Hadoop de pe piață. Scott Gnau, director tehnologic la Hortonworks, și Jack Norris, vicepreședinte senior al datelor și aplicațiilor la MapR, au explicat fiecare ce înseamnă guvernarea datelor pentru organizațiile lor. Ei au discutat despre cum să abordăm provocarea complexă de a asigura guvernanța datelor în arhitecturile complexe de date și ierarhiile organizaționale ale unei întreprinderi mari.
Ce este exact Guvernarea datelor și de ce avem nevoie?
Guvernarea înseamnă să vă asigurați că datele întreprinderii sunt autorizate, organizate și autorizate într-o bază de date cu cât mai puține erori posibil, menținând în același timp confidențialitatea și securitatea. Nu este un echilibru ușor de lovit, în special atunci când realitatea locurilor și a procesării datelor sunt găzduite în mod constant. Norris MapR a explicat de ce întreprinderile trebuie să privească guvernanța datelor de la un nivel mai înalt și să se concentreze pe conducta de date mai mare în joc.
"Când începeți să scalizați varietatea și viteza Big Data cu care avem de-a face, trebuie să aveți o guvernare a datelor, dar este într-un context mai larg. Care sunt datele pe care le aveți, cine are acces la acestea și cum sunteți? gestionarea liniei acestor date în timp? " spuse Norris. "Din punct de vedere al guvernării datelor, puteți avea diferite etape ale datelor care există într-un sistem care poate fi surprins, astfel încât să vă puteți întoarce în orice moment al conductei. Este vorba despre construirea controlului de audibilitate și a accesului în platforma de date. sigur că descoperirea și analiza datelor sunt transparente, indiferent dacă sunteți un manager de afaceri care examinează seturi de date financiare sau un om de știință de date care lucrează cu date brute în amonte."
Sursa: Rimes. Faceți clic pe imagine pentru vizualizarea completă.
Gnau de la Hortonworks a introdus un punct similar. Indiferent dacă aveți de-a face cu un depozit de date sau o arhitectură a lacului de date, guvernarea datelor se referă la echilibrarea forțelor opuse. Este vorba despre accesul la date nelimitate pentru a impulsiona inovația și pentru a obține informații și permisiuni granulare și confidențialitate pentru a proteja simultan datele respective.
"Comparați și contrastați lumea veche a guvernării tradiționale în spațiul de date; a fost puțin mai ușor", a spus Gnau. "Datele obișnuiau să fie bine definite în funcție de rol sau aplicație. În lumea nouă, obțineți cea mai mare valoare atunci când oamenii de știință de date au acces la cât mai multe date și este foarte important să găsiți acel mediu fericit.
„Conduce o paradigmă cu totul nouă în modul în care trebuie să abordați guvernanța”, a adăugat Gnau. "În această nouă lume, consider subiecte de guvernanță și securitate care trebuie să fie abordate împreună. Multe companii se luptă în continuare pentru a permite acest lucru pentru ca oamenii de știință ai datelor lor să fie eficienți în găsirea acestor noi cazuri de utilizare., să înțelegeți cum să gestionați securitatea, confidențialitatea, guvernanța - toate lucrurile care sunt importante din perspectiva de jos și, de asemenea, din perspectiva reputației companiei."
Cum se presupune ca un plan de guvernare a datelor întreprinderii să cuprindă și să satisfacă toate acele forțe opuse? Prin abordarea metodică a fiecărei cerințe, cu un pas la un moment dat.
Cum se construiește un plan de guvernare a datelor
Hortonworks, MapR și Cloudera sunt cei mai mari trei jucători independenți din spațiul Hadoop. Companiile au propriile sfere de influență atunci când vine vorba de guvernarea datelor. MapR a lansat o serie de documente albe pe această temă și a creat guvernarea datelor pe toată platforma sa de date convergente, în timp ce Hortonworks are propria soluție de securitate și guvernare a datelor și a co-fondat Inițiativa privind guvernarea datelor (DGI) în 2015. Aceasta a dus la deschiderea -source Apache Atlas proiect care oferă un cadru deschis de guvernare a datelor pentru Hadoop.
Dar când vine vorba despre modul în care fiecare vânzător creează strategii complete de guvernare și securitate a datelor, Gnau și Norris au vorbit amândoi pe linii similare. Următoarele sunt etapele combinate pe care Hortonworks și MapR le recomandă întreprinderilor să le țină cont atunci când construiesc un plan de guvernare a datelor.
Cea mai mare: Accesul și autorizarea datelor granulare
Ambele companii sunt de acord că nu poți avea o guvernare eficientă a datelor fără control granular. MapR realizează acest lucru în principal prin Express Control Expressions (ACE). După cum a explicat Norris, ACE utilizează gruparea și logica booleană pentru a controla accesul și autorizarea flexibilă a datelor, cu permisiuni bazate pe roluri și setări de vizibilitate.
A spus să se gândească la el ca la un model Gartner. Pe axa Y la extremitatea inferioară sunt guvernanță strictă și agilitate scăzută, iar pe axa X la capătul superior sunt agilitate mai mare și guvernare mai mică.
"La nivel scăzut, protejați datele sensibile obfuscându-le. În partea de sus, aveți contracte confidențiale pentru oamenii de știință de date și analiștii BI", a spus Norris. "Avem tendința de a face acest lucru cu capacități de mascare și vizualizări diferite în care blocați datele brute în partea de jos cât mai mult posibil și oferim treptat mai mult acces până când, la capătul superior, veți oferi administratorilor o vizibilitate mai largă. Dar cum vă dați administratorilor acces la persoanele potrivite?
„Dacă te uiți la o listă de control de acces azi, va spune ceva de genul„ toți cei din inginerie pot accesa asta ”, a adăugat Norris. "Dar dacă doriți ca câțiva directori selectați dintr-un proiect din cadrul IT să aibă acces sau toată lumea, cu excepția persoanelor, trebuie să creați un grup special. Este un mod excesiv de complicat și de convertit de a privi accesul."
Acolo vine acordarea drepturilor de acces la diferite niveluri și grupuri, potrivit Norris. "Am combinat ACE cu diferitele moduri prin care poți accesa date - prin fișiere, tabele, fluxuri etc. - și am implementat vizualizări fără copii separate ale datelor. Asadar, oferim Vizualizări pe aceleași date brute și Vizualizări poate avea niveluri de acces diferite. Acest lucru vă oferă o securitate mai integrată, care este mai directă."
Hortonworks se ocupă de acces granular într-o manieră similară. Prin integrarea Apache Atlas pentru guvernare și Apache Ranger, Gnau a declarat că compania se ocupă de autorizarea la nivel de întreprindere printr-un singur geam de sticlă. Cheia, a spus el, este capacitatea de a acorda contextual acces la baza de date și pe anumite etichete de metadate, utilizând politici bazate pe etichete.
"Odată ce cineva este în baza de date, este vorba de ghidarea acestora prin datele la care ar trebui să aibă acces relevant", a spus Gnau. "Politicile de securitate ale Rangerului la nivel de obiect, cu granulație fină și oriunde între ele pot face față. Asta înseamnă că securitatea în guvernare este locul în care lucrurile devin cu adevărat interesante.
„Pentru a face o scară largă în organizații mari, trebuie să integrați rolurile respective cu guvernarea și etichetarea metadatelor”, a adăugat Gnau. "Dacă mă loghez din Singapore, poate există reguli diferite bazate pe legile private de confidențialitate sau strategia corporativă. Odată ce o companie definește, stabilește și înțelege aceste reguli dintr-o perspectivă holistică de sus în jos, puteți secți accesul pe baza seturi de reguli specifice în timp ce executați totul în interiorul platformei de bază."
Sursa: IBM Big Data & Analytics Hub. Faceți clic pe imagine pentru vizualizarea completă.
2. Securitatea perimetrului, protecția datelor și autentificarea integrată
Guvernarea nu se întâmplă fără securitatea finală. Gnau a spus că este important să construiți un perimetru și un firewall bun în jurul datelor care se integrează cu sistemele și standardele de autentificare existente. Norris a fost de acord că, atunci când vine vorba de autentificare, este important ca întreprinderile să se sincronizeze cu sistemele încercate.
"Sub autentificare, este vorba despre modul în care vă integrați cu serviciile de director LDAP, Active Directory și terțe părți", a spus Norris. "De asemenea, sprijinim numele de utilizator și parolele Kerberos. Important este să nu creăm o infrastructură completă separată, ci este modul în care te integrezi cu structura existentă și sistemele de pârghie precum Kerberos."
3. Criptare și Tokenizare
Următorul pas după securizarea perimetrului și autentificarea întregului acces granular de date pe care îl acordați: Asigurați-vă că fișierele și informațiile de identificare personală (PII) sunt criptate și tokenizate de la capăt la capăt prin conducta de date. Gnau a discutat despre modul în care Hortonworks securizează datele PII.
„Odată ce treci de perimetrul și ai acces la sistem, să poți proteja datele PII este extrem de important”, a spus Gnau. "Trebuie să criptați și să tokenizați datele astfel încât, indiferent de cine are acces la ele, să poată rula analizele de care au nevoie fără a expune niciuna din acele date PII de-a lungul liniei."
În ceea ce privește modul în care accesați în siguranță datele criptate atât în mișcare, cât și în repaus, Norris MapR a explicat că este important să țineți cont și de cazuri de utilizare, precum backup și recuperare de dezastre (DR). El a discutat despre un concept al volumelor logice numite MapR, care poate aplica politicile de guvernare într-un grup de fișiere și directoare în creștere.
„La cel mai mic nivel, MapR a arhivat replicarea WAN pentru DR și instantanee în timp, la nivel de date, care pot fi configurate la diferite frecvențe, după director sau volum”, a spus Norris. "Este mai largă decât o simplă guvernare a datelor. Puteți avea un cluster fizic cu directoare, apoi conceptul de volum logic este o unitate de management cu adevărat interesantă și o modalitate de a grupa lucrurile în timp ce controlează protecția și frecvența datelor. Este o altă săgeată în datele administratorului IT renunțarea la guvernare."
4. Audit constant și analize
Analizând imaginea mai largă a guvernanței, atât Hortonworks, cât și MapR au spus că strategia nu funcționează fără audituri. Acest nivel de vsabilitate și responsabilitate în fiecare etapă a procesului este ceea ce permite IT-ului să „guverneze” de fapt datele, spre deosebire de simpla setare a politicilor și controale de acces și de a spera la cele mai bune. Este, de asemenea, modul în care întreprinderile își pot menține strategiile actuale într-un mediu în care modul în care vedem datele și tehnologiile pe care le folosim pentru a le gestiona și analiza se schimbă în fiecare zi.
„Ultima piesă a unei strategii de guvernare modernă este logarea și urmărirea”, a spus Gnau. "Suntem în perioada de început a datelor Big Data și IoT și este esențial să putem urmări accesul și să recunoaștem tiparele din date, astfel încât, pe măsură ce strategia trebuie actualizată, suntem în fața curbei."
Norris a spus că auditul și analiza pot fi la fel de simple ca urmărirea fișierelor JavaScript Object Notation (JSON). Nu fiecare informație va merita urmărită și analizată, dar afacerea dvs. nu va ști niciodată care - până când nu identificați o schimbare a jocului sau o criză se întâmplă și trebuie să rulați un traseu de audit.
„Fiecare fișier de jSON JSON este deschis pentru analiză și avem Apache Drill pentru a interoga fișierele JSON cu schemele, deci nu este un pas IT manual pentru a configura analiza metadatelor”, a spus Norris. "Când includeți toate evenimentele de acces la date și fiecare acțiune administrativă, este posibilă o gamă largă de analize."
5. O arhitectură de date unificată
În cele din urmă, ofițerul tehnologic sau administratorul IT care supraveghează o strategie de guvernare a datelor întreprinderii ar trebui să se gândească la specificul accesului granular, autentificare, securitate, criptare și audit. Dar ofițerul tehnologic sau administratorul IT nu ar trebui să se oprească acolo; mai degrabă, acea persoană ar trebui, de asemenea, să se gândească la modul în care fiecare dintre aceste componente se alimentează în arhitectura de date mai mare. De asemenea, el sau ea ar trebui să se gândească la modul în care această infrastructură trebuie să fie scalabilă și sigură - de la colectarea și stocarea datelor până la BI, analitice și servicii terțe. Gnau a spus că guvernarea datelor se referă la strategia de regândire și la execuție, la fel ca la tehnologia în sine.
„ Depășește un singur geam de sticlă sau o colecție de reguli de securitate”, a spus Gnau. "Este o singură arhitectură în care creați aceste roluri și se sincronizează pe întreaga platformă și pe toate instrumentele pe care le aduceți. Frumusețea infrastructurii guvernate în siguranță este agilitatea cu care se creează noi metode. La fiecare nivel de platformă sau chiar în un mediu cloud hibrid, aveți un singur punct de referință pentru a înțelege modul în care v-ați implementat regulile. Toate datele trec prin acest strat de securitate și guvernare."