Video: ASC20: Largest student supercomputer challenge launched in China (Noiembrie 2024)
Știrile de ieri conform cărora supercomputerul Chinei Tianhe-2 este acum cel mai rapid din lume nu este atât de șocant. La urma urmei, o versiune anterioară a fost în topul listei de supercomputing din 2010.
Ceea ce este ceva mai surprinzător este arhitectura din spatele Tianhe-2 (cunoscută și sub numele de Calea Lactee-2). Se bazează pe noua arhitectură Xeon Phi de la Intel, care combină un număr mare de nuclee x86 într-un singur cip; apoi supercomputerul combină aceste jetoane într-o singură arhitectură. Acest sistem nu era de așteptat să fie implementat încă câțiva ani, așa că am fost surprins să văd un sistem bazat pe Xeon Phi în topul listei. Ceea ce mi se pare cel mai fascinant aici este concurența cu sisteme bazate mai ales pe calculatoare GPU. Într-adevăr, un sistem bazat pe nucleele CUDA GPU ale Nvidia, care a trecut de ultima dată pe listă, este acum pe locul doi.
Lista Top500 a celor mai rapide computere ale lumii apare de obicei de două ori pe an: odată împreună cu Conferința Internațională de Supercomputare (ISC) care se întâmplă acum în Germania și din nou la Conferința de Supercomputare (SC 13) în toamnă.
Tianhe-2, care are sediul la Universitatea Națională de Tehnologie de Apărare din Changsha, China, arată performanțe susținute de peste 33, 8 petaflops (mai mult de 17 500 de trilioane de operații în virgulă pe secundă) și performanță maximă de 54, 9 petaflops pe etalonul LINPACK. Acest lucru îl face cu aproximativ două ori mai rapid decât liderul anterior, sistemul Titan bazat la Departamentul SUA al Energiei Oak Ridge Laboratorul Național (ORNL). Tianhe-2 are 16.000 de noduri, fiecare cu două procesoare Intel Xeon E5-2692 (procesoare cu 12 nuclee, folosind Ivy Bridge) și trei procesoare Xeon Phi pentru un total combinat de 3.120.000 de nuclee de calcul. Nucleele Xeon se bazează pe o viitoare versiune cu 12 nuclee a familiei Xeon # 5-2600, bazată pe arhitectura Bridge Bridge de 22 nm. Sistemul total atrage 17.8MW, cel mai mult din orice sistem de top din lista de top 500, dar, deoarece numărul de performanțe este atât de mare, este încă considerat relativ eficient din punct de vedere al puterii. Lista din iunie a celor mai eficiente supercomputere, Green500, va fi publicată în scurt timp.
Sistemul Titan ORNL, care a trecut de lista anterioară, este acum pe locul doi. Aceasta se bazează pe un sistem Cray XK7 cu 18.688 noduri, fiecare conținând un AMD Opteron 6274 cu 16 nuclee și un accelerator de procesare grafică (GPU) Nvidia Tesla K20x. Acest sistem arată performanța susținută de 17, 5 petaflops (mai mult de 17 500 de trilioane de operații în virgulă flotantă pe secundă) și performanța maximă a peste 27 de petaflops pe etalonul LINPACK. Sistemul Sequoia de la Laboratorul Național Lawrence Livermore, bazat pe sistemul BlueGene / Q de la IBM și procesoarele sale Power, a intrat pe locul doi pe lista Top500 în urmă cu un an, dar a ajuns pe locul trei. Cel de-al patrulea sistem rămâne „computerul K” la RIKEN Advanced Institute for Computational Science bazat pe procesoarele Fujitsu SPARC64.
Primele patru sisteme prezintă patru arhitecturi foarte diferite. Sistemele tradiționale de fier mari, cum ar fi cele bazate pe arhitecturile BlueGene (Power) ale IBM și arhitecturile SPARC ale Fujitsu, continuă să funcționeze foarte mult, dar cea mai mare parte a atenției se adresează noii arhitecturi Intel Xeon Phi și arhitecturii CUDA a Nvidia. Între timp, există în continuare povești că China lucrează la crearea propriului procesor pentru supercomputing.
În mai multe detalii, Nvidia a anunțat ieri că cercetătorii de la Universitatea Stanford folosesc GPU-uri pentru a crea cea mai mare rețea neuronală artificială din lume, concepută să modeleze modul de învățare a creierului uman. De asemenea, a dezvăluit că setul său de instrumente CUDA va suporta acum platforme bazate pe ARM.
În cadrul conferinței de supercomputare, Intel a introdus și noi versiuni ale familiei sale de coprocesoare Xeon Phi, incluzând 7100 cu 61 de nuclee cerate la 1.23GHz, 16 GB de capacitate de memorie și peste 1.2TFlops cu performanțe duble de precizie; familia Xeon Phi 3100 cu 57 de nuclee ceasate la 1, 1 GHz și 1TFlops cu performanțe duble de precizie; și un nou 5100D, proiectat astfel încât prizele să se poată atașa la o mini-placă pentru a fi utilizate în factorii de formă a lamei. Intel spune că următoarea generație, cunoscută sub numele de „Knights Landing” și bazată pe viitoarea tehnologie de proces de 14 nm, va funcționa nu numai ca coprocesor, ci și ca procesor primar, eliminând astfel complexitatea mutării datelor în diferite grupuri de memorie. Aceasta va integra memoria pe pachet pentru a accelera performanța.
Intel numește combinația procesoarelor tradiționale Xeon și Xeon Phi „arhitectură neo-eterogenă”. Arhitectura hardware are mai multe clase de capabilități de calcul la care este accesat un model de programare comun. Compania subliniază că, întrucât este tot x86, ar putea eficientiza dezvoltarea și optimizarea în moduri care ar fi mai dificil atunci când utilizați o combinație de CPU și acceleratoare GPU. Nvidia și celelalte companii care impulsionează calculul GPU nu ar fi de acord cu această evaluare.
Intel a vorbit, de asemenea, despre utilizarea computerelor de înaltă performanță, nu numai pentru utilizări tradiționale, precum cercetarea guvernamentală și militară și aplicații comerciale de înaltă calitate, cum ar fi simularea petrolului și a gazelor, ci și pentru aplicații precum date mari. Scopul este de a face supercomputarea mai mainstream.
Consultați lista completă de supercomputere aici.