Acasă Gândire înainte Summit-ul deschis de calcul arată inovații hardware extraordinare

Summit-ul deschis de calcul arată inovații hardware extraordinare

Video: OCP 2020 Virtual Summit: Open Routing in the Data Center (Octombrie 2024)

Video: OCP 2020 Virtual Summit: Open Routing in the Data Center (Octombrie 2024)
Anonim

Poate că cea mai interesantă tendință în hardware-ul computerului de astăzi este Proiectul Open Compute și eforturile pe care le depune pentru a trece la standarde comune, eficiente pentru echipamentele pentru centre de date, mai degrabă decât hardware și software proprietar pe care îl avem astăzi. Când am auzit prima oară despre Open Compute, mi s-a părut o modalitate bună pentru firmele web hiper-scară de a proiecta servere mai eficiente din punct de vedere energetic, mai ușor de întreținut. Dar de atunci, Open Compute a crescut pentru a cuprinde multe alte forme de hardware - de la stocare la rețea - și devine aplicabil pentru calcularea întreprinderilor, nu doar companiile de software cloud.

Toate acestea au fost destul de evidente la Summit-ul Open Compute Project de săptămâna trecută, unde o varietate de companii au introdus hardware nou conceput să funcționeze cu hardware și specificații Open Compute, de la servere la rețea.

"În 2011 am plantat câteva semințe", a declarat Frank Frankovsky, care prezidează Fundația OCP, în cadrul deschiderii summitului. "Ce s-ar întâmpla dacă am aplica principii open source în spațiul hardware? Munca pe care o facem împreună transformă fundamental industria."

Jetoane și specificații noi Apăsați serverele bazate pe ARM

Unele lucruri anunțate în timpul săptămânii au ieșit în evidență. Marea majoritate a serverelor, în lumea reală și în Proiectul Open Compute, se bazează pe procesoarele Intel Xeon și arhitectura x86. În timp ce este puțin probabil să se schimbe în curând, concurenții precum ARM și AMD au avut câteva alternative interesante.

AMD a anunțat primul său procesor bazat pe ARM pe 64 de biți, seria Opteron A1100 28nm (numită cod Seattle), despre care Andrew Feldman, director general și vicepreședinte corporativ, a declarat că va preleva clienții "în câteva săptămâni", deși este nu este de așteptat să fie disponibil pe scară largă până aproape de sfârșitul anului. A1100 include procesoare ARM Cortex-A57 cu 4 sau 8 nuclee, până la 4 MB de L2 partajat și 8 MB de cache L3 partajat, DDR3 sau DDR4 canale de memorie cu ECC, ARM TrustZone pentru securitate și co-procesoare pentru criptare și date comprimare.

Feldman a vorbit despre un kit de dezvoltare a seriei A cu procesorul A1100 și a declarat că compania a lucrat îndeaproape cu Linaro Enterprise Group și furnizorii de software pentru a dezvolta un sistem de operare Linux compatibil bazat pe Fedora Red Hat, stivă LAMP optimizată, suport Java și altele software inclusiv aplicații, hipervizoare, compilatoare și simulatoare. Feldman a susținut un mic micro-server de proiectare, folosind AMD Opteron A Series și specificația Open Compute Project pentru placa de bază cunoscută sub numele de "Group Hug" și a anunțat că compania îl contribuie la proiect, astfel încât companiile de hardware să poată începe construirea serverelor bazate pe acesta.

În timp ce Feldman a spus că AMD este angajat cu x86 și cu ARM, el a sugerat cu tărie că viitorul centrului de date se îndrepta către serverele bazate pe ARM. "În istoria calculatoarelor au fost întotdeauna câștigătoare procesoarele mai mici, cu costuri mai mici și cu volum mai mare", a spus Feldman. "Nu există nicio excepție de la aceasta." El a menționat că anul trecut au fost livrate 8 miliarde de procesoare ARM în comparație cu 13 milioane de CPU de server x86. (Acest lucru pare o comparație stupidă, deoarece include procesoare ARM utilizate în tot felul de aplicații care nu sunt date-center, dar exclude x86 utilizate în orice altceva decât pe servere.) Feldman a prezis că până în 2019, ARM va comanda un sfert din piața de servere și personalizate. SoC-urile ARM vor fi norma pentru centrele de date mari, în timp ce procesoarele x86 mai mici și mai eficiente vor domina piața serverului x86.

De asemenea, pe partea de cip, Applied Micro a spus că X-Gene 2 va preleva probele în această primăvară cu ceea ce compania spune că va fi prima implementare ARMv8 concepută pentru servere. Feldman a mai spus că acest lucru va fi urmat de anul viitor de un X-Gene 3 cu 16 sau mai multe nuclee ARM realizate pe un procesor FinFET.

O preocupare pe care unii oameni au avut-o cu privire la serverele bazate pe ARM este fragmentarea. Pentru a combate acest lucru, Ian Drew, vicepreședinte executiv de dezvoltare a afacerilor și director de marketing al ARM, a anunțat o nouă arhitectură a sistemelor de baze de server. Ideea este de a avea o specificație hardware de bază pentru dezvoltatorii de sisteme de operare și firmware și o singură imagine de sistem de operare pentru toate serverele bazate pe ARMv8-A. "Este o specificație hardware care a fost scrisă împreună de către tipii de hardware și cei de la software", a spus Drew. El a menționat că aceasta nu este o standardizare în care toată lumea va fi monolitică, ci este în schimb concepută astfel încât diferențierea să se întâmple la nivelul potrivit la momentul potrivit.

Drew a spus că ARM vrea să se asigure că toată lumea este la bord, deci este disponibilă pe site-ul ARM. Are sprijin din partea OEM-urilor și a unui număr de parteneri semiconductori, inclusiv AMD, Applied Micro, Broadcom și Cavium.

Microsoft se alătură OCP

Microsoft a spus că se alătură OCP și contribuie la un set complet de specificații pentru serverele care alimentează Office 365, Windows Azure și Bing. Vicepreședintele companiei, Bill Laing, a declarat că compania vrea să impulsioneze inovația în centrele de date cloud. Acest design inițial este foarte diferit de rack-ul standard de 21 inci contribuit inițial de Facebook, care a definit o mare parte din serverele Open Compute până în prezent. În schimb, este un șasiu de 12U care se încadrează într-un rack standard cu o lamă de calcul, lama de stocare, planul partajat, puterea și răcirea partajate și un nod de gestionare.

Laing a spus că aceste modele pot fi asamblate în prealabil și au o integrare minimă la fața locului, întrucât tăvile complete pot fi îndepărtate și înlocuite. În comparație cu un server de întreprindere tradițional, el a spus că acest design oferă economii de costuri de până la 40 la sută, câștiguri de până la 15 la sută în eficiență energetică și o îmbunătățire de 50 la sută în timpul de desfășurare și al serviciilor. Ideea este de a permite clienților să obțină aceleași avantaje și să „conducă mai departe calcularea în cloud, la fel cum am transformat calcularea în centrul de date a întreprinderii”.

Microsoft operează peste 200 de servicii cloud la nivel global, deservind peste 1 miliard de clienți și peste 20 de milioane de afaceri pe peste 90 de piețe și implementează în prezent peste 1 milion de servere în centrele sale de date, a spus Laing.

Deschideți calculul adaugă rețea

Un nou proiect este rețeaua, care a fost lansată oficial în luna mai. "Este ciudat că sursele deschise au avut acest impact extraordinar de pozitiv asupra software-ului și serverelor și a centrelor de date și de stocare și avem aceste insule cu tehnologie open-source, dar ceea ce leagă aceste insule este încă o cutie neagră proprie", Spuse Frankovski. "Așa că am decis să deschidem acea cutie neagră și să oferim clienților flexibilitate și alegere în rețeaua și transparența lor. Aceleași lucruri care atrag oamenii către software-ul open source este ceea ce ne atrage către hardware-ul open source. Este acea curiozitate naturală umană despre cum face această lucrare și cum ar funcționa altfel dacă aș lua-o și aș pune-o înapoi, așa cum vreau să o pun din nou la un loc?"

În câteva luni, a spus el, OCP a primit contribuții de la Broadcom, Intel, Mellanox, Big Switch și Cumulus Networks.

În timp ce o serie de companii au discutat despre comutatoarele ne-proprietate de top-of-rack, am fost intrigat să văd Dell să anunțe o înțelegere cu Cumulus Networks în cadrul căreia compania hardware ar revinde software-ul de rețea bazat pe Linux al Cumulus în partea de sus a rețelei compatibile OCP hardware.

Alte noutăți hardware interesante la spectacol au inclus anunțul lui Seagate potrivit căruia contribuie platforma sa de stocare Kinetic la OCP, care permite aplicațiilor să se conecteze direct la stocare prin Ethernet, mai degrabă decât să treacă prin servere tradiționale de stocare.

Optimizarea infrastructurii Full-Stack de Facebook

Având în vedere rolul cheie în lansarea Open Compute, nu este surprinzător faptul că Facebook este unul dintre liderii în adoptarea majorității tehnologiilor. Jay Parikh, vicepreședintele Facebook al infrastructurii, a prezentat „de ce contează de fapt toate lucrurile pe care Facebook le face cu infrastructura”. La început, echipa de infrastructură Facebook s-a concentrat doar pe menținerea lucrurilor, a spus Parikh. Dar, pe măsură ce continua să crească, echipa a ajuns repede la limitele hardware și software. Au avut niște „eșecuri spectaculoase”, a spus el, dar în cadrul procesului au învățat un lucru de bază: La scară, toate problemele tale sunt mărite.

De-a lungul drumului, au creat un nou design de server care a fost mai eficient din punct de vedere al costurilor și din punct de vedere energetic și a facilitat gestionarea și repararea serverelor. Astăzi Facebook are un centru de date personalizat cu rafturi personalizate, servere de calcul și stocare și rețea.

„De-a lungul timpului am fost nevoiți să preluăm controlul fiecărei părți a teancului, deoarece a trebuit să ținem pasul cu creșterea”, a spus Parikh. El a vorbit despre conceptul de „optimizare a infrastructurii full stack”, inclusiv software, rețea, servere și stocare. Acum, compania folosește doar hardware Open Compute Project. „De fapt economisim o tonă de bani”, a spus el. În ultimii trei ani, optimizarea full stack a economisit Facebook peste 1, 2 miliarde de dolari.

Parikh a dat apoi o actualizare a stocării la rece a Facebook. El a spus că prima nouă instalație de depozitare la rece a companiei, cu o capacitate de 30 de petabytes, a început să funcționeze și o a doua va fi disponibilă în curând, aducând capacitatea totală de stocare la „mult peste 100 de petabytes” în următoarele luni. Fiecare instalație este proiectată pentru a stoca maxim trei exabytes, astfel încât să existe o mulțime de spațiu pentru creștere.

Pentru prima dată, Parikh a arătat un prototip al serverului de stocare Facebook folosind discuri Blu-ray (idee despre care a vorbit compania la summit-ul de anul trecut). Serverul cabinetului deține 10.000 de discuri Blu-ray pentru un total de 1 petabyte de stocare, iar Facebook intenționează să crească densitatea până la 5 petabytes pe rack. Comparativ cu actualul sistem de stocare la rece bazat pe unitatea de hard disk, serverele Blu-ray ar putea reduce costurile la jumătate și reduce consumul de energie cu 80%, a spus Parikh. Facebook intenționează să testeze un sistem de producție la sfârșitul acestui an și ar folosi serverele Blu-ray pentru stocarea la rece a fotografiilor și videoclipurilor cu acces rar.

Calcule deschise și companii mai mici

Unul dintre lucrurile care m-au intrigat cel mai mult de la summit a fost indicația că nu doar companiile la scară cloud, cum ar fi Facebook, Rackspace și Microsoft, au îmbrățișat conceptul. În schimb, Frankovsky a indicat clienții mari ai întreprinderilor, cum ar fi Bloomberg, Fidelity și Goldman Sachs, că sunt în procesul de implementare a Open Compute.

Este interesant faptul că acum există mai multe modalități de utilizare a componentelor standard de 19 inci cu un container Open Rack de 21 inci și invers. De exemplu, Frankovsky a subliniat că Fidelity a venit cu un Open Bridge Rack la un rack standard EIA într-un Open Rack. Hyve Solutions a luat niște plăci de sistem Open Compute și le-a reambalat în tăvi standard de 19 inci și a contribuit la proiectarea din nou la fundație.

În cadrul unei discuții, Marc Andreessen, co-fondator și partener general la Andreessen Horowitz, și Andy Bechtolsheim, fondator, șef de dezvoltare și președinte Arista Networks, au vorbit despre modul în care tendința către centrele de date mai puțin costisitoare este schimbarea afacerilor.

Andreessen a declarat că există acum o oportunitate radicală de a combina software-ul open-source și hardware-ul open-source la volum mare pentru a reduce semnificativ costurile sistemelor și a furniza servicii bazate pe cloud în domenii precum asistența medicală și educația. Noile companii pot rula aproape în întregime pe cloud, astfel încât 500.000 de dolari cumpără acum o pornire de doi ani de pistă pentru a lansa un produs. În timp ce Facebook (Andreessen este pe consiliu) are un buget mare de capital acum, a spus el, dacă ar fi existat în 1999, ar fi necesitat un buget de capital de 50 până la 100 de ori mai mare decât este acum, poate cheltui 100 de miliarde de dolari pe an pentru capital. echipamente, ceea ce este imposibil. Dezvoltarea hardware-ului cu costuri mai mici și cu un volum mai mare este ceea ce face posibilă servicii precum Facebook sau Google. Dacă îți proiectezi alți 10 ani, a spus el, serviciile care vor fi posibile vor fi minte.

"Toată creșterea este în cloud", a spus Bechtolsheim, cu cheltuielile IT tradiționale plat sau în scădere. Arista Networks dezvoltă echipamente de rețea care răspund nevoilor acestor centre de date la scară cloud. El a spus că are mult sens să standardizezi hardware-ul de rețea. Până la venirea proiectului Open Compute, a spus Bechtolsheim, industria nu a avut niciodată un forum pentru inovația hardware deschisă și colaborativă. Acum, deși există încă câteva companii care își produc propriile cipuri, iar el consideră că acesta este un model de moștenire. Lucrul despre rețea este că aveți nevoie de o stivă software care funcționează de fapt. Hardware este ușor, software-ul este greu, a spus el, motiv pentru care Arista are o echipă software mult mai mare.

Bechtolsheim a spus că sosirea computerelor pe 64 de biți și a ARC SoCs cu frecvențe mai mari (cel puțin 2GHz) este ceea ce va face ARM viabilă în centrul de date. Este probabil să se întâmple atunci când are sens, a spus el. El a mai spus că „în apărarea Intel” a făcut o treabă remarcabilă, folosind tehnologia proceselor sale pentru a furniza procesoare mai severe eficiente din punct de vedere energetic și mai puțin costisitoare. Intel este un concurent formidabil aici și ai nevoie de competiții pentru a continua inovația, a spus el. La ritmul actual de progres, centrul de date care costă astăzi un miliard de dolari va costa doar 10.000 USD într-un deceniu. Aceasta va permite următoarea generație de aplicații.

Pentru a face ca produsele Open Compute să fie mai acceptate, Frankovsky a anunțat un alt tip de licență tehnologică care seamănă mai mult cu GPL, astfel încât orice lucrări derivate vor fi returnate fundației, precum și certificare hardware Open Compute folosind laboratoare noi în Taiwan și la Universitatea din Texas din San Antonio.

Summit-ul deschis de calcul arată inovații hardware extraordinare