Hybrydowy procesor NUDT MT-3000 podobno wykorzystywany przez superkomputer Tianhe-3



Chińskie Narodowe Centrum Superkomputerów (NUDT) przedstawiło swój system Tianhe-3 jako prototyp na początku 2019 r. — był wówczas testowany przez trzydzieści lokalnych organizacji. Do znaczących oceniających należeli Chińska Akademia Nauk i Chińskie Centrum Badań i Rozwoju Aerodynamiki. System Tianhe-2 (poprzedniej generacji) zajmuje obecnie siódme miejsce w światowym rankingu superkomputerów, oferując zmierzoną wydajność na poziomie 33,86 petaFLOPS/s. Wewnętrzny skład jego następcy pozostaje tajemnicą… aż do teraz. Następna platforma uważa, że ​​superkomputer trzeciej generacji nazywany „Xingyi” zawiera procesor MT-3000 z laboratorium w Guangzhou. Autor, Timothy Prickett Morgan, przechwalał się, że zdobył ekskluzywną wiedzę poufną przed międzynarodowymi agencjami wywiadowczymi – wielu będzie mieć oko na NUDT, ponieważ jest on administrowany przez Narodowy Uniwersytet Technologii Obronnych (który sam jest własnością chińskiego rządu).

Platforma Next ma doświadczenie w ujawnianiu intymnych szczegółów dotyczących przełomowych odkryć naukowych opracowanych w Chinach – częściowo powiązany system „Oceanlight” zainstalowany w ich Narodowym Centrum Superkomputerów (Wuxi) był „pojąć” dwa lata temu. Tianhe-3 i Oceanlight stoją w obliczu znaczącej konkurencji w postaci “El Capitan” – to jest premier USA: “superkomputer budowany obecnie w Lawrence Livermore National Laboratory przez firmę Hewlett Packard Enterprise we współpracy z dostawcą silników obliczeniowych AMD . Musimy to wiedzieć, ponieważ chcemy zrozumieć zupełnie inną – a jednocześnie pod pewnymi względami podobną – ścieżkę architektoniczną, jaką Chiny, jak się zdaje, obrały, wprowadzając architekturę Xingyi, aby przełamać barierę eksaskalową.

The Next Platform uważa, że ​​chiński duet jest wystarczająco wydajny, aby zająć czołowe miejsca w światowych rankingach superkomputerów: „plotki mówią o występie Xingyi (AKA Tianhe-3) w NSC Guangzhou – szczytowy wynik 2,05 eksaflopa i utrzymujący się na poziomie 1,57 eksaflopa w High Performance LINPACK – że był to najbardziej potężna maszyna, a mimo to zmontowana na Ziemi. Przypomnieliśmy także wszystkim, że system Oceanlight w NSC Wuxi był drugą najpotężniejszą maszyną na planecie, z szczytową mocą wynoszącą 1,5 eksaflopa i utrzymującą się na poziomie około 1,22 eksaflopa na LINPACK.” Raport zawierał ranking 30 najlepszych superkomputerów (patrz wyżej). Nadchodzące rozwiązanie z siedzibą w USA mogłoby skierować oba na sam szczyt: „Uważamy, że istnieje bardzo duża szansa, że ​​El Capitan osiągnie szczytową wartość 2,3 exaflopa po pełnym uruchomieniu, miejmy nadzieję, że do rankingów z czerwca 2024 r. Można się założyć, że Elon Za ostatniego dolara Muska, najważniejsze laboratorium superkomputerowe w Stanach Zjednoczonych otrzyma wszelką pomoc, jakiej potrzebuje, aby pokonać to, co naszym zdaniem mogą zrobić dwie chińskie maszyny.

Z poprzednich raportów wynikało, że prototypowy superkomputer Tianhe-3 (2019) wykorzystuje procesor „Phytium” oparty na ARM (FT-2000+) oraz „() zaktualizowany akcelerator DSP Matrix-2000+, znany również jako MT-2000 +.” Pełnowartościowy system Tianhe-3 najwyraźniej wykorzystuje zestaw bardzo wydajnego sprzętu wewnętrznego, po czym wprowadzono kilka znaczących zmian konstrukcyjnych – według The Next Platform: „MT-3000 nie jest akceleratorem, ale urządzeniem hybrydowym z procesorem i procesorem akceleracyjnym, a także mocą obliczeniową akceleratora trzy różne rodzaje pamięci, z których dwa znajdują się w kompleksie obliczeniowym. Jest to więc podobne do Procesor graficzny AMD „Antares” MI300A hybryda, która trafi do El Capitan, będzie przypominała oddzielne systemy CPU-GPU, które obecnie widzimy, które powodują błędy w systemach AI i HPC. MT-3000 to coś zupełnie innego i można założyć, że wykorzystuje architekturę pakowania chipletów, biorąc pod uwagę, że rodzima chińska odlewnia Semiconductor Manufacturing International Corp (SMIC) prawdopodobnie nie była w stanie upchnąć wystarczającej liczby tranzystorów w procesie 14 nanometrów, aby stworzyć monolityczny umierać. Ale z drugiej strony może jest to urządzenie wykonane w procesie 10 lub nawet 7 nanometrów. Jeśli firmie NUDT nie zależy na kosztach, wydajność może być straszna, o ile SMIC będzie w stanie znaleźć dziesiątki tysięcy dobrych części MT-3000 do wyprodukowania systemu”.

Wiele tych informacji zostało zaczerpniętych z artykułów płatnych – głównie z streszczenia „MT-3000: A Heterogeneous Multi-Zone Processor For HPC”.

MT-3000„Wraz z ciągłym rozwojem obliczeń o wysokiej wydajności (HPC), mikroprocesor o wysokiej wydajności, będący kluczowym elementem superkomputera, staje się klejnotem w koronie HPC. W tym celu proponujemy MT-3000, heterogeniczny procesor wielostrefowy for HPC, który został w całości zaprojektowany i wdrożony przez Narodowy Uniwersytet Technologii Obronnych. MT-3000 zawiera 16 procesorów ogólnego przeznaczenia, 96 rdzeni sterujących i 1536 rdzeni akceleracyjnych, które są pogrupowane w strefę ogólnego przeznaczenia i strefę akceleracji. Strefa akceleracji to dalej podzielony na cztery klastry.Dzięki wyrafinowanym projektom takiej wielostrefowej organizacji, połączeń wzajemnych i podsystemu pamięci, MT-3000 osiąga wydajność z podwójną precyzją 11,6 teraflopa i efektywność energetyczną 45,4 gigaflopa/wat przy pracy z częstotliwością 1,2 GHz.Na podstawie MT-3000 chipie, wdrożono prototyp superkomputera o szczytowej wydajności prawie 12 petaflopów, osiągając 80% wydajności obliczeniowej dla LINPACK. W artykule omówiono również możliwość budowy superkomputera na większą skalę w oparciu o chip MT-3000. “



Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

Cozy Bear i inne APT zmieniają taktykę wraz ze wzrostem wykorzystania chmury

Podmioty zagrażające powiązane z państwem rosyjskim zmieniają swoją taktykę w miarę migracji coraz większej liczby organizacji do infrastruktury opartej na chmurze, ale dobra...

Sharkoon przedstawia nowy podświetlany wentylator PWM 120 mm Rebel F50 o wysokim zakresie obrotów

Sharkoon Technologies to międzynarodowy dostawca wysokiej jakości, wydajnych podzespołów i urządzeń peryferyjnych do komputerów PC, który obecnie poszerza swoją ofertę wentylatorów chłodzących do...

SolidRun przedstawia moduł komunikacyjny Ryzen V3000 CX7

SolidRun, wiodący deweloper i producent wysokowydajnych rozwiązań System on Module (SOM), komputerów jednopłytkowych (SBC) i rozwiązań brzegowych sieci, ogłosił dzisiaj wprowadzenie na rynek...
Advertisment