Platforma Next ma doświadczenie w ujawnianiu intymnych szczegółów dotyczących przełomowych odkryć naukowych opracowanych w Chinach – częściowo powiązany system „Oceanlight” zainstalowany w ich Narodowym Centrum Superkomputerów (Wuxi) był „pojąć” dwa lata temu. Tianhe-3 i Oceanlight stoją w obliczu znaczącej konkurencji w postaci “El Capitan” – to jest premier USA: “superkomputer budowany obecnie w Lawrence Livermore National Laboratory przez firmę Hewlett Packard Enterprise we współpracy z dostawcą silników obliczeniowych AMD . Musimy to wiedzieć, ponieważ chcemy zrozumieć zupełnie inną – a jednocześnie pod pewnymi względami podobną – ścieżkę architektoniczną, jaką Chiny, jak się zdaje, obrały, wprowadzając architekturę Xingyi, aby przełamać barierę eksaskalową.
The Next Platform uważa, że chiński duet jest wystarczająco wydajny, aby zająć czołowe miejsca w światowych rankingach superkomputerów: „plotki mówią o występie Xingyi (AKA Tianhe-3) w NSC Guangzhou – szczytowy wynik 2,05 eksaflopa i utrzymujący się na poziomie 1,57 eksaflopa w High Performance LINPACK – że był to najbardziej potężna maszyna, a mimo to zmontowana na Ziemi. Przypomnieliśmy także wszystkim, że system Oceanlight w NSC Wuxi był drugą najpotężniejszą maszyną na planecie, z szczytową mocą wynoszącą 1,5 eksaflopa i utrzymującą się na poziomie około 1,22 eksaflopa na LINPACK.” Raport zawierał ranking 30 najlepszych superkomputerów (patrz wyżej). Nadchodzące rozwiązanie z siedzibą w USA mogłoby skierować oba na sam szczyt: „Uważamy, że istnieje bardzo duża szansa, że El Capitan osiągnie szczytową wartość 2,3 exaflopa po pełnym uruchomieniu, miejmy nadzieję, że do rankingów z czerwca 2024 r. Można się założyć, że Elon Za ostatniego dolara Muska, najważniejsze laboratorium superkomputerowe w Stanach Zjednoczonych otrzyma wszelką pomoc, jakiej potrzebuje, aby pokonać to, co naszym zdaniem mogą zrobić dwie chińskie maszyny.
Z poprzednich raportów wynikało, że prototypowy superkomputer Tianhe-3 (2019) wykorzystuje procesor „Phytium” oparty na ARM (FT-2000+) oraz „() zaktualizowany akcelerator DSP Matrix-2000+, znany również jako MT-2000 +.” Pełnowartościowy system Tianhe-3 najwyraźniej wykorzystuje zestaw bardzo wydajnego sprzętu wewnętrznego, po czym wprowadzono kilka znaczących zmian konstrukcyjnych – według The Next Platform: „MT-3000 nie jest akceleratorem, ale urządzeniem hybrydowym z procesorem i procesorem akceleracyjnym, a także mocą obliczeniową akceleratora trzy różne rodzaje pamięci, z których dwa znajdują się w kompleksie obliczeniowym. Jest to więc podobne do Procesor graficzny AMD „Antares” MI300A hybryda, która trafi do El Capitan, będzie przypominała oddzielne systemy CPU-GPU, które obecnie widzimy, które powodują błędy w systemach AI i HPC. MT-3000 to coś zupełnie innego i można założyć, że wykorzystuje architekturę pakowania chipletów, biorąc pod uwagę, że rodzima chińska odlewnia Semiconductor Manufacturing International Corp (SMIC) prawdopodobnie nie była w stanie upchnąć wystarczającej liczby tranzystorów w procesie 14 nanometrów, aby stworzyć monolityczny umierać. Ale z drugiej strony może jest to urządzenie wykonane w procesie 10 lub nawet 7 nanometrów. Jeśli firmie NUDT nie zależy na kosztach, wydajność może być straszna, o ile SMIC będzie w stanie znaleźć dziesiątki tysięcy dobrych części MT-3000 do wyprodukowania systemu”.
Wiele tych informacji zostało zaczerpniętych z artykułów płatnych – głównie z streszczenia „MT-3000: A Heterogeneous Multi-Zone Processor For HPC”.
MT-3000„Wraz z ciągłym rozwojem obliczeń o wysokiej wydajności (HPC), mikroprocesor o wysokiej wydajności, będący kluczowym elementem superkomputera, staje się klejnotem w koronie HPC. W tym celu proponujemy MT-3000, heterogeniczny procesor wielostrefowy for HPC, który został w całości zaprojektowany i wdrożony przez Narodowy Uniwersytet Technologii Obronnych. MT-3000 zawiera 16 procesorów ogólnego przeznaczenia, 96 rdzeni sterujących i 1536 rdzeni akceleracyjnych, które są pogrupowane w strefę ogólnego przeznaczenia i strefę akceleracji. Strefa akceleracji to dalej podzielony na cztery klastry.Dzięki wyrafinowanym projektom takiej wielostrefowej organizacji, połączeń wzajemnych i podsystemu pamięci, MT-3000 osiąga wydajność z podwójną precyzją 11,6 teraflopa i efektywność energetyczną 45,4 gigaflopa/wat przy pracy z częstotliwością 1,2 GHz.Na podstawie MT-3000 chipie, wdrożono prototyp superkomputera o szczytowej wydajności prawie 12 petaflopów, osiągając 80% wydajności obliczeniowej dla LINPACK. W artykule omówiono również możliwość budowy superkomputera na większą skalę w oparciu o chip MT-3000. “