Video: Using A Supercomputer (Noiembrie 2024)
Au avut câteva surprize la conferința Supercomputing 17 din această lună, inclusiv o prezentare foarte bună pentru acceleratorul PEZY-SC2, precum și schimbarea de direcție a Intel pentru linia sa Xeon Phi. În plus, am văzut și primele sisteme construite pe procesorul scalabil Xeon Intel (Skylake) și primele care au prezentat acceleratorul Volta Nvidia.
Dar poate cea mai notabilă este știrea că sistemele chineze reprezintă acum 202 din cei 500 de supercomputere din cea mai nouă listă de top 500, comparativ cu doar 143 din SUA. Sistemele americane au dominat lista de la înființare în urmă cu 25 de ani și în urmă cu doar câteva luni, SUA aveau 169 de sisteme la cele 160 ale Chinei. Același lucru este valabil și atunci când vine vorba de performanțe agregate, sistemele chineze reprezentând 35, 4 la sută din performanța totală a sistemelor Top 500.
Cele mai rapide computere din lume continuă să fie cele două masive chinezești care au trecut pe lista de câțiva ani încoace: Sunway TaihuLight, de la Centrul Național de Supercomputare din China din Wuxi, cu o performanță susținută Linpack de peste 93 de petaflops (93 mii trilioane de puncte flotante operații pe secundă), și Tianhe-2, de la Centrul Național Super Computer din China din Guangzhou, cu performanță susținută de peste 33, 8 petaflops. Acestea rămân cele mai rapide mașini și cu o marjă imensă. Sistemul Piz Daint de la Swiss National Supercomputing Center, un sistem Cray care folosește Intel Xeons și Nvidia Tesla P100s, a ocupat locul trei, cu o performanță susținută Linpack de 19, 6 petaflops.
Cea mai mare schimbare în vârf este un nou sistem pe locul patru: o versiune actualizată a supercomputerului Gyoukou, un sistem ZettaScaler-2.2 implementat la Agenția pentru Știință și Tehnologie Marine-Earth. Această mașină folosește acceleratoare PEZY-SC2, un cip de generație a doua generație 2048-core care oferă o performanță de vârf de 4.096 teraflops în dublă precizie, precum și procesoare Intel Xeon convenționale, pentru un total de 19.860.000 de nuclee. (O mașină ZettaScaler anterioară cu PEZY-SC2 a făcut lista la un nivel inferior în versiunea din iunie). Acest lucru îi oferă cel mai mare număr de nuclee utilizate împreună - cunoscut și ca cel mai mare nivel de concurgență - văzut până în prezent, depășind TaihuLight, care are 10, 6 milioane de nuclee. Mașina Gyoukou a obținut o performanță susținută Linpack de 19, 14 petaflops, dar ceea ce este interesant este faptul că folosește 1, 35 megavati de putere, comparativ cu 2, 27 megavati pentru PizDaint, 17, 8 megavati pentru Tinahe-2 și 15, 4 megavati pentru Taihulight. Aceasta este încă multă putere, dar este o reducere mare în comparație cu celelalte sisteme și un indiciu puternic că preocupările de putere sunt importante, chiar și pentru cele mai rapide mașini din lume. De remarcat, de asemenea, că acest lucru arată cum arhitecturile noi pot reduce atragerea de putere dramatic.
Sistemul american de top rămâne supercomputerul Titan de la Oak Ridge National Laboratory, un sistem vechi de cinci ani, care utilizează acceleratoare Nvidia K20x GPU și livrează 17, 59 petaflops, care se află acum pe locul cinci pe listă.
În cea mai recentă listă Green 500 a celor mai performante supercomputere cu eficiență energetică, patru dintre primele cinci sloturi - inclusiv primele trei - au mers la sisteme japoneze recent instalate, toate bazate pe arhitectura ZettaScaler-2.2 și pe acceleratorul PEZY-SC2. Cel mai eficient dintre acestea este Shoubu System B, care este instalat la Centrul avansat de calcul și comunicare al RIKEN. Shoubu System B a obținut 17, 0 gigaflop / watt; Shoubu System B și următoarele două sisteme, care utilizează 16, 8 și respectiv 16, 7 gigaflop / watt, sunt toate în jumătatea de jos a listei Top 500. Al cincilea sistem din clasamentul Green este sistemul Gyoukou menționat mai sus - sistemul numărul patru din lista Top 500, la 14, 2 gigaflops / watt.
Acestea reprezintă descoperiri mari pentru acceleratorul PEZY-SC2 și pot indica direcții viitoare pentru arhitecturi de supercomputare.
Cel de-al patrulea supercomputer cel mai verde este sistemul intern DGX SaturnV Volta al Nvidia, care a obținut 15, 1 gigaflop / watt și vine pe 149 pe lista Top 500. Acest sistem are 22.440 de nuclee Volta (care par a fi considerate într-un mod oarecum diferit pe listă decât unele dintre celelalte nuclee.) Nvidia are un an foarte bun pentru acceleratorul său și are speranțe mari pentru mai multe mașini care folosesc Volta Arhitectura GPU.
Ca de obicei, cei mai mari vânzători au fost pasionați de succesele pe listă, Intel remarcând că procesoarele sale se aflau în șase dintre primele zece sisteme și un nivel record de 471 din 500 de sisteme. Intel a mai remarcat că noile sale procesoare scalabile Xeon erau în 18 supercomputere cu peste 25 de petaflop-uri performante. Dar ceea ce poate fi mai notabil este că Intel a spus că anulează Knights Hill, succesorul planificat de 10 milimetri al procesorului Xeon Phi de 14 nm Knights Landing Xeon Phi. Compania a spus că planifică acum o nouă platformă pentru sisteme exascale (1.000 petaflops) până în 2021, dar nu a divulgat detalii.
Nvidia a subliniat că deține 34 de sisteme noi cu acceleratoarele sale pe listă, aducând numărul total al companiei la 87. Nvidia și partenerul IBM s-au preocupat de posibilitatea ca, până la următoarea listă să aibă loc în iunie, mașina Summit de la Oak Ridge Laboratorul național (ORNL) ar trebui să se numere printre mașinile din partea de sus a listei. Această mașină are 4600 de noduri, fiecare cu două CPU de bază IBM Power 9 și 6 acceleratoare Nvidia Volta, cu o performanță proiectată de aproximativ 200 de petaflops. Acest lucru diferă de soluția internă a Nvidia, prin faptul că procesoarele și GPU-urile comunică prin NVLink 2.0 într-o manieră coerentă în cache folosind OpenCAPI, astfel încât GPU-urile pot accesa direct RAM-ul principal al sistemului. Summit-ul va fi urmat de mașina Sierra de la Laboratorul Național Lawrence Livermore și de mașina AI Bridging Cloud Infrastructure (ABCI) din Japonia.
Am fost interesat să aud Cray anunțând un supercomputer „pregătit pentru producție” bazat pe procesorul Cavium ThunderX2 pe arhitectura Armv8-A pe 64 de biți, disponibil acum ca parte a supercomputerului său XC50. Mașinile bazate pe ARM sunt testate la Barcelona Supercomputer Center (a cărui mașină Mare Nostrum se află acum la numărul 16 din lista Top 500), precum și la supercomputerul „Post-K” din Japonia și la supercomputerul Isambard din Marea Britanie. Cavium a avut câteva repere timpurii asupra ThunderX2, care au arătat cipul de 14 nm performanțe mai bune pe aplicații cu mai multe fire sau legate de memorie decât Skylake Xeons de Intel, deși Intel rămâne lider în monofilme și în teraflopuri brute. Rețineți că, pe lângă designul Cavium, Qualcomm a anunțat și un cip de server bazat pe ARM numit Centriq.
În altă ordine de idei despre procesor, AMD a anunțat că a produs producția de procesare Epyc, cu toate că acestea nu sunt încă în niciun sistem Top 500, în timp ce NEC a anunțat versiuni ale cardului său de accelerator Vector Engine PCIe pentru noua sa serie de supercomputer SX-Aurora TSUBASA, care au o lățime de bandă de memorie deosebit de rapidă.
În ceea ce privește interconectările, Mellanox a spus că 77 la sută dintre noile sisteme din lista Top 500 folosesc InfiniBand, în timp ce Intel a prezentat succese recente cu arhitectura Omni-Path, care este utilizată în cea mai mare parte în sistemele sale Xeon Scalable Processor (Skylake). Între timp, un număr de vânzători caută Gen-Z, conceput pentru a fi o abordare cu o latență mai mică, centrată pe memorie pentru conexiunile cu viteză foarte mare între dispozitivele de calcul și memoria / stocare.
De asemenea, este interesant de menționat că pentru prima dată toate mașinile din Top 500 rulează acum Linux.
Între prima impresie puternică din partea PEZY-SC2, decizia Intel de a arunca Knights Mill pentru o nouă arhitectură, Volvata Nvidia și noua concurență din partea furnizorilor AMD, ARM și NEC, este acum un moment interesant în lumea supercomputării. Listele de anul viitor ar trebui să fie destul de interesante, deoarece vedem care arhitecturi performează cu adevărat și care sunt cele mai eficiente, deoarece mulți dintre furnizori și site-uri de supercomputer încearcă să se poziționeze în cursă pentru a produce un computer exascale (1000 petaflop) cu un sub Putere de 20 megawatt.
Ești curios despre viteza ta de internet în bandă largă? Testează-l acum!