Procesory Intel Xeon przyspieszają obciążenia GenAI dzięki Aible

Intel i Aible, kompleksowe, bezserwerowe rozwiązanie dla przedsiębiorstw generujące sztuczną inteligencję (GenAI) i rozszerzoną analitykę, oferują teraz wspólne klientom rozwiązania umożliwiające uruchamianie zaawansowanych zastosowań GenAI i generacji rozszerzonej z pobieraniem (RAG) na wielu generacjach procesorów Intel Xeon. Współpraca, która obejmuje optymalizacje inżynieryjne i program testów porównawczych, zwiększa zdolność Aible do dostarczania wyników GenAI przy niskich kosztach dla klientów korporacyjnych i pomaga programistom osadzać inteligencję AI w aplikacjach. Firmy wspólnie oferują skalowalne i wydajne rozwiązania AI, które wykorzystują wysokowydajny sprzęt, aby pomóc klientom rozwiązywać problemy związane ze sztuczną inteligencją i technologią Intel.

„Klienci szukają wydajnych rozwiązań klasy korporacyjnej, które pozwolą wykorzystać moc sztucznej inteligencji. Nasza współpraca z Aible pokazuje, jak blisko współpracujemy z branżą, aby dostarczać innowacje w zakresie sztucznej inteligencji i obniżać barierę wejścia dla wielu klientów w celu korzystania z najnowszych Obciążenia GenAI przy użyciu procesorów Intel Xeon” — powiedział Mishali Naik, starszy główny inżynier firmy Intel w dziale Data Center i AI Group.

Rozwiązania Aible pokazują, jak procesory mogą znacznie zwiększyć wydajność w szeregu najnowszych obciążeń AI, od modeli języków roboczych po RAG. Zoptymalizowana pod kątem procesorów Intel technologia Aible wykorzystuje wydajne, bezserwerowe, kompleksowe podejście do sztucznej inteligencji, zużywając zasoby tylko wtedy, gdy istnieją aktywne żądania użytkowników. Na przykład wektorowa baza danych aktywuje się na kilka sekund, aby pobrać informacje istotne dla zapytania użytkownika, a model językowy podobnie uruchamia się na krótko, aby przetworzyć żądanie i odpowiedzieć na nie. Ta operacja na żądanie pomaga obniżyć całkowity koszt posiadania (TCO).

Podczas gdy RAG jest często wdrażany przy użyciu procesorów graficznych (jednostek przetwarzania grafiki) i akceleratorów w celu wykorzystania ich możliwości przetwarzania równoległego, technika bezserwerowa firmy Aible w połączeniu z procesorami Intel Xeon Scalable umożliwia wykorzystanie RAG w całości przez procesory. Dane dotyczące wydajności pokazują, że wiele generacji procesorów Intel Xeon może wydajnie obsługiwać obciążenia RAG.

Aible umożliwia klientom obniżenie kosztów operacyjnych projektów GenAI poprzez wykorzystanie wyłącznie procesorów w formie bezserwerowej w celu bezpieczniejszego udostępniania tych samych podstawowych zasobów obliczeniowych wielu klientom. Dla porównania, obniżone koszty operacyjne można porównać do zakupu energii elektrycznej w momencie jej wykorzystania, zamiast wynajmowania generatora energii elektrycznej. Co więcej, wraz ze wzrostem zapotrzebowania na generatywną sztuczną inteligencję, potrzeba optymalizacji zarówno wydajności, jak i zużycia energii staje się coraz ważniejsza. Usługi Aible oparte na procesorach oferują klientom opłacalne i energooszczędne rozwiązanie.

Według analizy porównawczej Aible klienci mogą uzyskać nawet 55-krotne oszczędności kosztów, uruchamiając modele RAG na swoich rozwiązaniach bezserwerowych opartych na procesorze1. Ta redukcja kosztów świadczy o skuteczności podejścia firmy Aible obejmującego wyłącznie procesor, które pozwala uniknąć konieczności stosowania droższej infrastruktury opartej na procesorach graficznych z usługami współdzielonymi lub serwerami dedykowanymi.

Firma Intel — w tym Intel Labs — współpracowała z firmą Aible w celu optymalizacji obciążeń AI na procesorach Xeon. W szczególności optymalizując kod Aible pod kątem AVX-512, firma Aible odnotowała znaczny wzrost wydajności i poprawiła przepustowość na procesorach Xeon, podkreślając wpływ strategicznych optymalizacji oprogramowania na ogólną wydajność.
Połączenie modeli RAG z procesorami Intel Xeon, ułatwione przez platformy takie jak Aible, może umożliwić zastosowanie takich aplikacji jak:

Reklama

Przetwarzanie języka naturalnego (NLP)
Systemy rekomendacji
Systemy Wspomagania Decyzji
Generowanie treści

Współpraca Intela z Aible rozpoczęła się wraz z wprowadzeniem na rynek procesorów Xeon czwartej generacji. Od tego czasu obie firmy zoptymalizowały obciążenia AI, kod i biblioteki dla procesorów Xeon, aby zwiększyć wydajność produktów Aible.

Intel i Aible zaprezentują swoje rozwiązania na szczycie Amazon Web Services Summit w Waszyngtonie, w dniach 26 i 27 czerwca. Rozwiązania firmy Aible działają na platformie AWS Lambda i są dostępne w sklepie AWS Marketplace.

Source link

Poprzedni artykuł

Essencore KLEVV ogłasza linię pamięci DDR5 FIT V

Następny artykuł

MSI wypuszcza aktualizację oprogramowania sprzętowego modeli MAG 321UPX QD-OLED i MAG 271QPX QD-OLED

Procesory Intel Xeon przyspieszają obciążenia GenAI dzięki Aible

Więcej

Podobne

Najnowsze

Uber i Lyft muszą płacić kierowcom korzystającym z przejazdów w Massachusetts 32 dolary za godzinę

Kindle Paperwhite ostatniej generacji Amazona jest teraz w sprzedaży za 50 dolarów

Jak sprawdzić, czy Twój operator włączył już obsługę RCS w iOS 18

Procesory Intel Xeon przyspieszają obciążenia GenAI dzięki Aible

Więcej

Uber i Lyft muszą płacić kierowcom korzystającym z przejazdów w Massachusetts 32 dolary za godzinę

Kindle Paperwhite ostatniej generacji Amazona jest teraz w sprzedaży za 50 dolarów

Jak sprawdzić, czy Twój operator włączył już obsługę RCS w iOS 18

Podobne

AutoFull ogłasza fotel gamingowy M6 z wentylowaną i podgrzewaną poduszką siedziska

Najnowsze

Uber i Lyft muszą płacić kierowcom korzystającym z przejazdów w Massachusetts 32 dolary za godzinę

Kindle Paperwhite ostatniej generacji Amazona jest teraz w sprzedaży za 50 dolarów

Jak sprawdzić, czy Twój operator włączył już obsługę RCS w iOS 18