Akceleratory AMD Instinct MI300X dostępne w Oracle Cloud Infrastructure


AMD ogłosiło dziś, że Oracle Cloud Infrastructure (OCI) wybrało akceleratory AMD Instinct MI300X z otwartym oprogramowaniem ROCm do zasilania najnowszej instancji OCI Compute Supercluster o nazwie BM.GPU.MI300X.8. W przypadku modeli AI, które mogą obejmować setki miliardów parametrów, OCI Supercluster z AMD MI300X obsługuje do 16 384 procesorów graficznych w jednym klastrze, wykorzystując tę ​​samą ultraszybką technologię struktury sieciowej, z której korzystają inne akceleratory w OCI. Zaprojektowane do obsługi wymagających obciążeń AI, w tym wnioskowania i szkolenia dużego modelu językowego (LLM), które wymagają wysokiej przepustowości z wiodącą pojemnością pamięci i przepustowością, te instancje OCI bare metal zostały już przyjęte przez firmy, w tym Fireworks AI.

„AMD Instinct MI300X i otwarte oprogramowanie ROCm nadal zyskują na popularności jako zaufane rozwiązania do obsługi najbardziej krytycznych obciążeń OCI AI” — powiedział Andrew Dieckmann, wiceprezes korporacyjny i dyrektor generalny Data Center GPU Business w AMD. „W miarę jak te rozwiązania będą się dalej rozwijać na rosnących rynkach intensywnie korzystających z AI, połączenie to przyniesie korzyści klientom OCI dzięki wysokiej wydajności, efektywności i większej elastyczności projektowania systemów”.

„Możliwości wnioskowania akceleratorów AMD Instinct MI300X uzupełniają szeroki wybór wysokowydajnych instancji bare metal firmy OCI, aby usunąć narzut związany z wirtualizacją obliczeniową powszechnie stosowaną w infrastrukturze AI” — powiedział Donald Lu, starszy wiceprezes ds. rozwoju oprogramowania w Oracle Cloud Infrastructure. „Cieszymy się, że możemy zaoferować większy wybór klientom, którzy chcą przyspieszyć obciążenia AI w konkurencyjnej cenie”.

Zapewniamy zaufaną wydajność i otwarty wybór w zakresie szkolenia i wnioskowania AI
AMD Instinct MI300X przeszedł obszerne testy, które zostały zweryfikowane przez OCI, podkreślając jego możliwości wnioskowania i szkolenia AI w celu obsługi przypadków użycia optymalnych pod względem opóźnienia, nawet przy większych rozmiarach partii, oraz zdolność do dopasowania największych modeli LLM do jednego węzła. Te wyniki wydajności Instinct MI300X przyciągnęły uwagę deweloperów modeli AI.

Fireworks AI oferuje szybką platformę przeznaczoną do budowania i wdrażania generatywnej AI. Dzięki ponad 100 modelom Fireworks AI wykorzystuje zalety wydajności znalezione w OCI przy użyciu AMD Instinct MI300X.

„Fireworks AI pomaga przedsiębiorstwom budować i wdrażać złożone systemy AI w szerokim zakresie branż i przypadków użycia” — powiedział Lin Qiao, CEO Fireworks AI. „Ilość dostępnej pamięci w oprogramowaniu otwartym AMD Instinct MI300X i ROCm pozwala nam skalować usługi dla naszych klientów w miarę rozwoju modeli”.



Source link

Advertisment

Więcej

Advertisment

Podobne

Advertisment

Najnowsze

Photomator dodaje selekcję zdjęć z flagami i ocenami w postaci gwiazdek

Photomator, popularny edytor zdjęć dla systemów iOS i macOS, ogłosił we wtorek aktualizację, która ułatwi użytkownikom porządkowanie biblioteki zdjęć za pomocą flag i...

Odtwarzacz wideo Infuse zaktualizowany o nowy wygląd i aplikację Vision Pro

Napar, A popularny odtwarzacz wideo dostępny dla urządzeń Appleotrzyma dzisiaj dużą aktualizację. Wraz z premierą Infuse 8, aplikacja ma teraz nowy wygląd, a...

Niezależne Dungeon Crawler, Wayfinder, wyjście z wczesnego dostępu z nową mapą, hakiem i grywalną postacią

Po niedawnym ogłoszeniu możliwości rozgrywki krzyżowej na PS5 i PC, firma Airship Syndicate ogłosiła, że ​​jej niezależny, kooperacyjny dungeon crawler ARPG, Wayfinder, oficjalnie...
Advertisment