„Popyt na AI prowadzi do ogromnej transformacji w centrach danych, a branża domaga się wyboru sprzętu, oprogramowania i narzędzi programistycznych” — powiedział Justin Hotard, wiceprezes wykonawczy Intel i dyrektor generalny Data Center and Artificial Intelligence Group. „Dzięki wprowadzeniu na rynek Xeon 6 z rdzeniami P i akceleratorami Gaudi 3 AI firma Intel umożliwia otwarty ekosystem, który pozwala naszym klientom wdrażać wszystkie obciążenia robocze z większą wydajnością, efektywnością i bezpieczeństwem”.
Przedstawiamy procesor Intel Xeon 6 z rdzeniami P i akceleratorami Gaudi 3 AI
Najnowsze osiągnięcia firmy Intel w dziedzinie infrastruktury AI obejmują dwie główne aktualizacje jej oferty centrów danych:
- Intel Xeon 6 z rdzeniami P: Zaprojektowany do obsługi obciążeń wymagających dużej mocy obliczeniowej z wyjątkową wydajnością, Xeon 6 zapewnia dwukrotnie większą wydajność niż jego poprzednik. Oferuje zwiększoną liczbę rdzeni, dwukrotnie większą przepustowość pamięci i możliwości przyspieszenia AI osadzone w każdym rdzeniu. Ten procesor został zaprojektowany tak, aby sprostać wymaganiom wydajnościowym AI od krawędzi do centrów danych i środowisk chmurowych.
- Akcelerator AI Intel Gaudi 3: Gaudi 3, zoptymalizowany specjalnie pod kątem generatywnej sztucznej inteligencji na dużą skalę, oferuje 64 rdzenie procesora Tensor (TPC) i osiem silników mnożenia macierzy (MME), aby przyspieszyć obliczenia głębokich sieci neuronowych. Obejmuje 128 gigabajtów (GB) pamięci HBM2e do treningu i wnioskowania oraz 24 porty Ethernet 200 Gigabit (Gb) do skalowalnej sieci. Gaudi 3 oferuje również bezproblemową zgodność z frameworkiem PyTorch oraz zaawansowanymi modelami transformatora i dyfuzora Hugging Face. Firma Intel niedawno ogłosiła współpracę z IBM w celu wdrożenia akceleratorów Intel Gaudi 3 AI jako usługi w IBM Cloud. Dzięki tej współpracy Intel i IBM mają na celu obniżenie całkowitego kosztu posiadania, aby wykorzystać i skalować sztuczną inteligencję, jednocześnie zwiększając wydajność.
Ulepszanie systemów AI z korzyściami TCO
Wdrażanie AI na dużą skalę wymaga takich rozważań, jak elastyczne opcje wdrażania, konkurencyjne wskaźniki ceny do wydajności i dostępne technologie AI. Solidna infrastruktura x86 firmy Intel i rozległy otwarty ekosystem pozycjonują ją w celu wspierania przedsiębiorstw w budowaniu systemów AI o wysokiej wartości z optymalnym TCO i wydajnością na wat. Co ciekawe, 73% serwerów z akceleracją GPU używa Intel Xeon jako procesora hosta3.
Intel współpracuje z wiodącymi producentami OEM, w tym Dell Technologies i Supermicro, aby rozwijać współprojektowane systemy dostosowane do konkretnych potrzeb klientów w celu efektywnego wdrażania AI. Dell Technologies obecnie współprojektuje rozwiązania oparte na RAG, wykorzystując Gaudi 3 i Xeon 6.
Łączenie prototypów z produkcją dzięki wysiłkom w zakresie współprojektowania
Przejście rozwiązań generatywnej AI (Gen AI) z prototypów do systemów gotowych do produkcji stwarza wyzwania w zakresie monitorowania w czasie rzeczywistym, obsługi błędów, rejestrowania, bezpieczeństwa i skalowalności. Firma Intel rozwiązuje te wyzwania poprzez wspólne działania inżynieryjne z producentami OEM i partnerami w celu dostarczania gotowych do produkcji rozwiązań generacji rozszerzonej pobierania (RAG).
Rozwiązania te, oparte na platformie Open Platform Enterprise AI (OPEA), integrują mikrousługi oparte na OPEA w skalowalnym systemie RAG, zoptymalizowanym pod kątem systemów Xeon i Gaudi AI, zaprojektowanym tak, aby umożliwić klientom łatwą integrację aplikacji z Kubernetes, Red Hat OpenShift AI i Red Hat Enterprise Linux AI.
Rozszerzanie dostępu do aplikacji AI przedsiębiorstw
Portfolio Tiber firmy Intel oferuje rozwiązania biznesowe do radzenia sobie z wyzwaniami, takimi jak dostęp, koszty, złożoność, bezpieczeństwo, wydajność i skalowalność w środowiskach AI, chmury i krawędzi. Intel Tiber Developer Cloud zapewnia teraz systemy podglądu Intel Xeon 6 do oceny technicznej i testowania. Ponadto wybrani klienci uzyskają wczesny dostęp do Intel Gaudi 3 w celu walidacji wdrożeń modeli AI, a klastry Gaudi 3 zaczną być wdrażane w przyszłym kwartale w celu wdrożeń produkcyjnych na dużą skalę.
Nowe oferty usług obejmują SeekrFlow, kompleksową platformę AI firmy Seekr do opracowywania zaufanych aplikacji AI. Najnowsze aktualizacje obejmują najnowszą wersję oprogramowania Intel Gaudi oraz notebooki Jupyter z załadowanymi narzędziami PyTorch 2.4 i Intel oneAPI oraz AI 2024.2, które obejmują nowe możliwości akceleracji AI i obsługę procesorów Xeon 6.