Acasă Gândire înainte Supercomputerul este în mare parte neschimbat, dar stă strâns

Supercomputerul este în mare parte neschimbat, dar stă strâns

Video: The Choice is Ours (2016) Official Full Version (Noiembrie 2024)

Video: The Choice is Ours (2016) Official Full Version (Noiembrie 2024)
Anonim

Cea mai recentă listă a celor mai rapide supercomputere din lume nu s-a schimbat prea mult, dar emisiunea anuală de Supercomputing (SC14) a prezentat multe discuții despre noile sisteme din listă, precum și câteva anunțuri de înaltă performanță, cum ar fi noi acceleratoare de la Intel și Nvidia.

Supercomputerul chinezesc Tianhe-2, care utilizează procesoare Intel Xeon și acceleratoare Xeon Phi, a rămas pe primul loc pe lista Top500, cu performanțe maxime de 54, 9 petaflops (cvadrilaje de operații în virgulă flotantă pe secundă). Anul acesta, de fapt, primele nouă sisteme au fost identice cu cele mai noi adăugări de pe locul 10 - o mașină de sistem guvernamentală din SUA nespecificată, care este un Cray CS-Storm alimentat de procesoare Intel Xeon E5-2660 v2 și GPU Nvidia K40, conectate prin intermediul InfiniBand.

Mai jos în listă, au existat 78 de sisteme noi, deși chiar și acesta este un nou record. Și, în general, se pare că vedem o încetinire a ritmului de creștere a puterii agregate a celor 500 de sisteme.

Clasamentele acestor sisteme se bazează pe etalonul LINPACK, deși acum există o serie de eforturi în jurul creării de noi repere care vizează diferite tipuri de calcul. Mi s-a părut interesant faptul că, într-un discurs la emisiune, Horst Simon, redactorul listei Top500, a spus că, în ciuda obiectivului de a ajunge la un computer exasalat - 1 exaflops pe secundă (aproximativ 1.000 de petaflops) - până în 2020, crede că va fi probabil ne duce până la sfârșitul anului 2024. În parte, acest lucru se datorează faptului că vom avea nevoie de mai multe tehnici de economisire a energiei - cum ar fi fotonica de siliciu și integrarea și ambalarea 3D - pentru a menține puterea necesară pentru un sistem exascal până la 20 de megawati. Acestea sunt sisteme mari.

În ciuda lipsei de schimbări majore în vârf, am auzit câteva anunțuri noi - în special cele de la Intel și Nvidia, care ar putea indica calea către mașini mai rapide.

Nvidia, ale cărui GPU-uri și limbajul de programare CUDA au început cu adevărat mișcarea către acceleratoare și coprocesoare în calcule de înaltă performanță, a fost peste tot în spectacol cu ​​o mulțime de sisteme. În prezent oferă acceleratorul K40, iar în cadrul emisiunii a anunțat următoarea versiune, Tesla K80, care folosește o abordare dual-GPU pentru a oferi ceea ce firma spune că este de două ori mai mare performanță și dublează lățimea de bandă a memoriei predecesorului său.

Nvidia spune că K80 oferă 4.992 nuclee CUDA și 24 megabytes de RAM și are o capacitate de vârf de 2.91 teraflops pe bord. Este interesant faptul că K80 este disponibil acum și că mulți dintre producătorii de sisteme oferă deja sisteme cu placa. De exemplu, Dell și-a afișat noile servere PowerEdge C4130, care vă permit să încadrați până la patru plăci de accelerare Nvidia (sau acceleratoare Intel Xeon Phi) într-un server 1U, versiunea K80 oferind până la 7, 2 teraflop în fiecare cutie. Aceasta este doar o cantitate nebună de putere de calcul într-un rack (deși unul care ar folosi multă energie și ar avea nevoie de multă răcire).

Între timp, Intel a anunțat că următoarea versiune a cipului său Xeon Phi - o versiune cunoscută sub numele de Knight's Landing pentru care primele sisteme comerciale ar trebui să înceapă să fie livrate anul viitor - acum are peste 50 de clienți care intenționează să utilizeze noua versiune de procesor a piesei (unde Xeon Phi acționează ca procesor de sistem) în noile supercomputere. Multe alte sisteme folosesc versiunea de card PCIe a coprocesorului produsului.

Printre clienții pentru Knights Landing se numără supercomputerul Trinity, un efort comun între Los Alamos și Laboratoarele Naționale Sandia, și supercomputerul Cori, anunțat de Centrul Național de Cercetări Energetice (DOE) al Departamentului pentru Energie al SUA (DOE). Se presupune că Knight's Landing va oferi aproximativ 3 teraflopuri de performanță și va integra tehnologia Intel Omni-Path Fabric bazată pe fotonice de siliciu Intel, despre care compania a spus că va oferi viteză de linie de 100 Gbps și cu o latență de schimbare cu până la 56% mai mică decât alternativele InfiniBand. (Rețineți că furnizorii InfiniBand vorbesc acum și despre versiuni noi.)

Intel a spus că urmărirea, cunoscută sub numele de Knight's Hill, va fi construită folosind tehnologia procesului Intel 10nm și va folosi următoarea generație a țesăturii Omni-Path. Va urma Cavalerul debarcare, dar momentul exact nu a fost dezvăluit.

Nu trebuie lăsat în afara ecuației este AMD, care a anunțat și își arăta cardul FirePro S9150 cu un singur procesor, despre care spune că poate oferi 2.53 teraflopuri de performanță. Acest sistem, care este programat folosind OpenCL, este deja livrat.

De fapt, un nou supercomputer numit L-CSC de la GSI Helmholtz Center, bazat pe GPU-urile S9150 și procesoarele cu 10 nuclee Intel Xeon 2690v2, a depășit noua versiune a listei Green500, care listează supercomputere în ordinea puterii de procesare pe watt. Aceasta a marcat prima dată când un sistem a putut depăși 5 gigaflop / watt (miliarde de operații pe secundă pe watt). Notă pe această listă, pe locul doi sistemul Suiren, alimentat de acceleratoarele cu mai multe nuclee PEZY-SC și procesoare Xeon; în timp ce restul primilor 10 utilizează GPU Nvidia Tesla, care arată gama de astfel de sisteme.

Există și alte opțiuni, mai neobișnuite. Micron își prezintă cipul Automata, în esență un cip special destinat proiectării pentru potrivirea modelelor, pentru utilizare în lucruri precum securitatea rețelei și căutarea genomicii. Aceasta este dezvoltată într-o placă PCIe 3 cu 32 de cipuri și este lansată în primul trimestru din 2015, inițial în volume mici. (Compania se află, de asemenea, în spatele Cubului său de memorie hibridă pentru memoria de nouă generație pentru astfel de sisteme.) IBM are procesorul TrueNorth, care speră să indice calea către mai multe „computere similare creierului”. NEC lucrează la următoarea generație a procesorului său vectorial SX-ACE, despre care spune că este mai ușor de programat decât GPU-urile. Și, desigur, ARM încearcă să intre și pe piața serverului, X-Gene1 de la Applied Micro fiind folosit ca procesor care se conectează la diverse carduri de accelerație.

O serie de furnizori arătau sisteme noi. În plus față de sistemul Dell de care am menționat anterior, Lenovo a arătat un sistem cu procesor dual-răcit cu apă, bazat pe un procesor personalizat Intel Xeon E5-2798A (cu 16 nuclee funcționând până la 3, 2 GHz), despre care a spus că oferă 1.083 teraflops. Și a spus că procesorul Kneei Landing Xeon Phi de anul viitor va permite un sistem „peta-cub” care livrează mai mult de un petaflop în doar două rafturi standard 42U.

Serverele One Stop au prezentat un accelerator de calcul de înaltă densitate, care folosește PCIe Gen3 pentru a suporta până la 16 plăci de accelerare de înaltă performanță de pe un singur sau mai multe servere, compania afirmând că furnizează până la 89, 6 teraflops folosind placi Tesla K80. Aceasta poate funcționa cu procesorul Power8 al IBM. Huawei a arătat disponibilitatea SUA a serverului său de date X6800 și o versiune răcită cu lichid a serverului său FusionServer 9000 lame.

Pentru conectarea sistemelor, Obsidian Technologies a lansat inițiativa InfiniCortex, concepută pentru a lua o conexiune 100 Gigabit InfiniBand pe distanțe lungi. Compania a anunțat sprijinul Agenției pentru Știință, Tehnologie și Cercetare din Singapore (A * STAR). Iar Mellanox a arătat 100 de Gigabit Infiniband funcționând peste 100 de metri via fibră și 8 metri prin cupru.

Pentru a crea cele mai mari supercomputere, organizațiile apelează de obicei la companii precum IBM și Cray pentru a pune sistemele la un loc, deși acestea necesită adesea ani de zile pentru a construi. Cel mai mare anunț de acest gen al emisiunii Cray la spectacol a fost un sistem de 80 de milioane de dolari cunoscut sub numele de Shaheen II la Universitatea King of Abdullah de Știință și Tehnologie din Arabia Saudită pentru un Cray XC40, incluzând un aparat de analiză grafică Urika-GD.

Și, desigur, chiar înainte de spectacol, DOE a acordat IBM (și vânzătorilor de componente Nvidia și Mellanox) un contract uriaș pentru ceea ce ar fi cele mai mari două supercomputere din țară, fiecare cu peste 100 de petaflops.

Nota editorului: Această postare a fost actualizată pe 26/11. Tianhe-2 are o performanță de vârf de 54, 9 petaflops, nu teraflops.

Supercomputerul este în mare parte neschimbat, dar stă strâns