Kiedy patrzysz na poszczególne układy, NVIDIA GB200 NVL72 wyraźnie przewyższa Ascend 910C Huawei, dostarczając ponad trzykrotnie wydajność BF16 (2500 teraflops vs. 780 teraflops), więcej pamięci On -Chip (192 GB vs. 128 GB) i Faster Bandwidth (8 tb/s. 3,2 TB/S). Innymi słowy, NVIDIA ma surową moc i wydajność na poziomie układów. Ale przełącz przełącznik na poziom systemu, a CloudMatrix Huawei CM384 zajmuje prowadzenie. Wypada 1,7 × ogólne PEAFLOPS, pakuje 3,6 × większą całkowitą pojemność HBM i obsługuje ponad pięć razy więcej niż GPU i powiązana przepustowość klastra NVL72 NVL72. Jednak skalowalność ta ma kompromis, ponieważ konfiguracja Huawei przyciąga prawie czterokrotnie więcej całkowitej mocy. Pojedynczy GB200 NVL72 pobiera 145 kW mocy, a pojedynczy Huawei CloudMatrix 384 pobiera ~ 560 kW. Tak więc Nvidia jest Twoim przejściem, jeśli potrzebujesz szczytowej wydajności w jednym GPU. Jeśli budujesz masywny superklaster sztucznej inteligencji, w którym najwięcej przepustowości i prędkości połączenia wzajemnego połączenia, rozwiązanie Huawei ma sens. Dzięki swojej topologii, Huawei dostarczył system szkoleń i wnioskowania AI, które warto kupić. Gdy SMIC, producent żetonów Huawei, dociera do bardziej zaawansowanego węzła produkcyjnego, wydajność tych systemów również wzrośnie.