The nowego El Capitana w Lawrence Livermore National Laboratory w Kalifornii w USA zadebiutował jako najpotężniejszy system na liście z wynikiem HPL wynoszącym 1,742 EFlop/s. Posiada 11 039 616 połączonych rdzeni procesora i karty graficznej i jest oparty na procesorach AMD EPYC czwartej generacji z 24 rdzeniami o częstotliwości 1,8 GHz i akceleratorach AMD Instinct MI300A. El Capitan korzysta z sieci Cray Slingshot 11 do przesyłania danych i osiąga efektywność energetyczną na poziomie 58,89 GigaFLOPS/wat. Ta ocena efektywności energetycznej pomogła El Capitan zająć również 18. miejsce na liście GREEN500.
System Frontier w Oak Ridge National Laboratory w Tennessee w USA spadł na drugie miejsce. Zwiększył swój wynik HPL z 1,206 Eflop/s na ostatniej liście do 1,353 Eflop/s na tej liście. Frontier zwiększył także całkowitą liczbę rdzeni, z 8 699 904 rdzeni na ostatniej liście do 9 066 176 rdzeni na tej liście. Do przesyłania danych wykorzystuje sieć Cray Slingshot 11.
System Aurora w Argonne Leadership Computing Facility w Illinois w USA zajął 3. miejsce na liście TOP500. Maszyna utrzymała wynik testu porównawczego HPL z ostatniej listy, osiągając 1,012 exaflop/s. Aurora została zbudowana przez firmę Intel w oparciu o HPE Cray EX – Intel Exascale Compute blade, który wykorzystuje procesory Intel Xeon CPU Max Series i akceleratory Intel Data Center GPU Max Series, które komunikują się za pośrednictwem połączenia sieciowego Cray Slingshot-11.
System Eagle zainstalowany w chmurze Microsoft Azure w USA zajął 4. miejsce i pozostaje najwyżej notowanym systemem opartym na chmurze w TOP500. Ma wynik HPL wynoszący 561,2 PFlop/s
Jedynym nowym systemem w TOP 5 jest system HPC6 na miejscu 5. Maszyna ta jest zainstalowana w centrum Eni SpA w Ferrera Erbognone we Włoszech i ma taką samą architekturę jak system nr 2 Frontier. System HPC6 w Eni osiągnął benchmark HPL wynoszący 477,90 PFlop/s i jest obecnie najszybszym systemem w Europie.
Oto podsumowanie systemu w Top 10:
- System El Capitan w Lawrence Livermore National Laboratory w Kalifornii, USA to nowy system nr 1 w TOP500. System HPE Cray EX255a uzyskał wynik 1,742 Exaflop/s w teście porównawczym HPL. El Capitan ma 11 039 616 rdzeni i bazuje na procesorach AMD EPYC czwartej generacji z 24 rdzeniami o częstotliwości 1,8 GHz i akceleratorach AMD Instinct MI300A. Do przesyłania danych wykorzystuje sieć Cray Slingshot 11 i osiąga efektywność energetyczną na poziomie 58,89 Gigaflops/wat.
- Frontier jest obecnie systemem nr 2 w TOP500. Ten system HPE Cray EX był pierwszym systemem w USA o wydajności przekraczającej jeden eksaflop/s. Jest zainstalowany w Narodowym Laboratorium Oak Ridge (ORNL) w Tennessee w USA, gdzie jest obsługiwany przez Departament Energii (DOE). Obecnie osiągnął 1,353 Exaflop/s przy 8 699 904 rdzeniach. Architektura HPE Cray EX łączy procesory AMD EPYC trzeciej generacji zoptymalizowane pod kątem HPC i sztucznej inteligencji, z akceleratorami AMD Instinct 250X i interkonektem Slingshot-11.
- Aurora zajmuje obecnie trzecie miejsce ze wstępnym wynikiem HPL wynoszącym 1,012 exaflop/s. Jest zainstalowany w Argonne Leadership Computing Facility w stanie Illinois w USA, gdzie jest również obsługiwany przez Departament Energii (DOE). Ten nowy system Intel oparty jest na HPE Cray EX – Intel Exascale Compute Blades. Wykorzystuje procesory Intel Xeon CPU Max Series, akceleratory Intel Data Center GPU Max Series i interkonekt Slingshot-11.
- System Eagle nr 4 instaluje Microsoft w swojej chmurze Azure. Ten system Microsoft NDv5 jest oparty na procesorach Xeon Platinum 8480C i akceleratorach NVIDIA H100 i osiągnął wynik HPL na poziomie 561 petaflopów/s.
- Nowy system nr 5 nosi nazwę HPC6 i jest zainstalowany w centrum Eni SpA w Ferrera Erbognone we Włoszech. To kolejny system HPE Cray EX235a z procesorami AMD EPYC 3. generacji zoptymalizowanymi pod kątem HPC i AI, z akceleratorami AMD Instinct 250X i interkonektem Slingshot-11. Osiągnął 477,9 petaflopów/s.
- Fugaku, system nr 6, został zainstalowany w Centrum Nauk Obliczeniowych RIKEN (R-CCS) w Kobe w Japonii. Posiada 7 630 848 rdzeni, co pozwoliło mu osiągnąć wynik testu porównawczego HPL na poziomie 442 petaflopów/s. Pozostaje najszybszym systemem w teście HPCG z 16 TeraFLOPS.
- Po niedawnej modernizacji system Alps zainstalowany w Szwajcarskim Narodowym Centrum Superkomputerowym (CSCS) w Szwajcarii zajmuje obecnie 7. miejsce. Jest to system HPE Cray EX254n z procesorem NVIDIA Grace 72C i NVIDIA GH200 Superchip oraz interkonektem Slingshot-11. Po modernizacji osiągnął 434,9 Petaflop/s.
- System LUMI, kolejny system HPE Cray EX zainstalowany w centrum EuroHPC w CSC w Finlandii, zajmuje 8. miejsce z wydajnością 380 petaflopów/s. Wspólne przedsięwzięcie w dziedzinie europejskich obliczeń wielkiej skali (EuroHPC JU) łączy europejskie zasoby w celu opracowania najwyższej klasy superkomputerów eksaskalowych do przetwarzania dużych zbiorów danych. Jeden z paneuropejskich superkomputerów przedeksaskalowych, LUMI, znajduje się w centrum danych CSC w Kajaani w Finlandii.
- System nr 9 Leonardo jest zainstalowany w innym ośrodku EuroHPC w CINECA we Włoszech. Jest to system Atos BullSequana XH2000 z procesorami Xeon Platinum 8358 32C 2,6 GHz jako akceleratorami, akceleratorami NVIDIA A100 SXM4 i interkonektem Quad-rail NVIDIA HDR100 Infiniband. Osiągnął wydajność HPL na poziomie 241,2 petaflopów/s.
- TOP10 uzupełnia nowy system Tuolumne, który jest również zainstalowany w Lawrence Livermore National Laboratory w Kalifornii, USA. Jest to system siostrzany nowego systemu nr 1 El Capitan o identycznej architekturze. Sam osiągnął 208,1 PetaFLOP.
Inne najważniejsze informacje z TOP500
64. edycja rankingu TOP500 wykazała, że procesory AMD i Intel są preferowaną opcją dla systemów z pierwszej dziesiątki. Pięć systemów korzysta z procesorów AMD (El Capitan, Frontier, HPC6, LUMI i Tuolumne), a trzy systemy korzystają z procesorów Intel (Aurora, Eagle , Leonardo). Alps korzysta z procesora NVIDIA, natomiast Fugaku ma opatentowany procesor Fujitsu A65FX 48c 2,2 GHz oparty na ARM.
Siedem komputerów z pierwszej dziesiątki korzysta z interkonektu Slingshot-11 (El Capitan, Frontier, Aurora, HPC6, Alps, LUMI i Tuolumne), a dwa inne korzystają z Infiniband (Eagle i Leonardo). Fugaku ma swój własny, autorski interkonekt Tofu.
Chociaż Chiny i Stany Zjednoczone po raz kolejny znalazły się na liście krajów, które zdobyły najwięcej wpisów na całej liście TOP500, wydaje się, że Chiny nie uczestniczą w niej w takim stopniu, jak kiedyś. Stany Zjednoczone dodały do listy dwa systemy, zwiększając łączną liczbę systemów do 173. Chiny po raz kolejny zmniejszyły liczbę reprezentatywnych maszyn na liście z 80 do 63 systemów. Podobnie jak poprzednia lista, Chiny nie wprowadziły na listę TOP500 żadnych nowych maszyn. Niemcy szybko doganiają Chiny, mając na liście 41 maszyn.
Jeśli chodzi o kontynenty, zamieszanie na poprzedniej liście, w której Europa wyprzedziła Azję, pozostaje w tym przypadku takie samo. Ameryka Północna miała na liście 181 maszyn, Europa 161 maszyn, a Azja 143 maszyny.
Wyniki GREEN500
W tej edycji GREEN500 pojawiło się kilka dużych zmian w stosunku do nowych systemów znajdujących się na liście Top 3, poza miejscem nr 1.
Na pierwszym miejscu po raz kolejny znalazł się system JEDI – JUPITER Exascale Development Instrument firmy EuroHPC/FZJ w Niemczech. Zajmując 224. miejsce na liście TOP500, firma JEDI była w stanie powtórzyć swoją ocenę efektywności energetycznej z ostatniej listy na poziomie 72,73 GFlops/W, uzyskując jednocześnie wynik HPL na poziomie 4,5 PFlops/s. JEDI to maszyna BullSequana XH3000 z Grace Hopper Superchip 72c 2 GHz, NVIDIA GH200 Superchip, Quad-Rail NVIDIA InfiniBand NDR200 i ma łącznie 19 584 rdzeni.
Drugie miejsce w tej edycji testu GREEN500 zajął nowy system ROMEO-2025 w Centrum ROMEO HPC w Szampanii-Ardenach we Francji. System ten miał swoją premierę ze wskaźnikiem efektywności energetycznej na poziomie 70,91 GFlops/W, a jego benchmark HPL wyniósł 9,863 PFlops/s. Choć jest to nowy system, jego architektura jest identyczna z JEDI, ale jest dwukrotnie większa. Dlatego jego efektywność energetyczna jest nieco niższa.
Trzecie miejsce zajął nowy system Adastra 2 w Grand Equipement National de Calcul Intensif – Centre Informatique National de l’Enseignement Suprieur (GENCI-CINES) we Francji. Adastra 2 po raz pierwszy pojawiła się na liście TOP500 i uzyskała wynik w zakresie efektywności energetycznej na poziomie 69,10 GFlops/W i wynik HPL na poziomie 2,529 PFLop/s. To urządzenie to system HPE Cray EX255a z 24-rdzeniowymi procesorami AMD EPYC czwartej generacji 1,8 GHz, akceleratorami AMD Instinct MI300A, ma łącznie 16 128 rdzeni i procesor Slingshot-11 z systemem RHEL.
Na wyróżnienie zasługują zarówno nowy system El Capitan, jak i system Frontier. Biorąc pod uwagę najwyższy wynik w teście HPL wynoszący 1,742 EFlop/s, imponujące jest to, że maszyna była w stanie zająć 18. miejsce w rankingu GREEN500 z wynikiem efektywności energetycznej wynoszącym 58,89 GigaFLOPS/wat. Frontier – zwycięzca poprzedniej listy TOP500 i numer 2 na tej liście – uzyskał imponujący wynik w zakresie efektywności energetycznej na poziomie 54,98 GigaFLOPS/wat na tej liście GREEN500. Obydwa systemy pokazują, że możliwe jest osiągnięcie ogromnej mocy obliczeniowej, przy jednoczesnym priorytetowym traktowaniu efektywności energetycznej.
Wyniki HPCG
Na liście TOP500 uwzględniono wyniki testu porównawczego High-Performance Conjugate Gradient (HPCG), który stanowi alternatywny miernik oceny wydajności superkomputera. Wynik ten ma na celu uzupełnienie pomiaru HPL i umożliwienie pełniejszego zrozumienia maszyny.
- Superkomputer Fugaku pozostaje liderem w teście porównawczym HPCG z wynikiem 16 PFlop/s. Od czerwca 2020 r. zajmuje czołową pozycję.
- System DOE Frontier w ORNL pozostaje na drugiej pozycji z wynikiem 14,05 HPCG-Pflop/s.
- Trzecie miejsce ponownie zajął system Aurora z wynikiem 5,6 petaflopów HPCG.
- Nie ma jeszcze żadnych zgłoszeń HPCG dla El Capitan.
Wyniki HPL-MxP (dawniej HPL-AI)
Celem testu porównawczego HPL-MxP jest podkreślenie zastosowania obliczeń o mieszanej precyzji. Tradycyjny HPC wykorzystuje 64-bitowe obliczenia zmiennoprzecinkowe. Obecnie widzimy sprzęt o różnych poziomach precyzji zmiennoprzecinkowej – 32-bitowy, 16-bitowy, a nawet 8-bitowy. Test porównawczy HPL-MxP pokazuje, że stosując mieszaną precyzję podczas obliczeń, możliwa jest znacznie wyższa wydajność. Stosując techniki matematyczne, tę samą dokładność można obliczyć w przypadku techniki mieszanej precyzji w porównaniu z prostą precyzją 64-bitową.
Tegorocznym zwycięzcą kategorii HPL-MxP został system Aurora z prędkością 11,6 EFlop/s. Drugie miejsce zajmuje Frontier z notą 11,4, a trzecie miejsce zajmuje LUMI z wynikiem 2,35 EFlop/s.