„Klienci szukają wydajnych rozwiązań klasy korporacyjnej, które pozwolą wykorzystać moc sztucznej inteligencji. Nasza współpraca z Aible pokazuje, jak blisko współpracujemy z branżą, aby dostarczać innowacje w zakresie sztucznej inteligencji i obniżać barierę wejścia dla wielu klientów w celu korzystania z najnowszych Obciążenia GenAI przy użyciu procesorów Intel Xeon” — powiedział Mishali Naik, starszy główny inżynier firmy Intel w dziale Data Center i AI Group.
Rozwiązania Aible pokazują, jak procesory mogą znacznie zwiększyć wydajność w szeregu najnowszych obciążeń AI, od modeli języków roboczych po RAG. Zoptymalizowana pod kątem procesorów Intel technologia Aible wykorzystuje wydajne, bezserwerowe, kompleksowe podejście do sztucznej inteligencji, zużywając zasoby tylko wtedy, gdy istnieją aktywne żądania użytkowników. Na przykład wektorowa baza danych aktywuje się na kilka sekund, aby pobrać informacje istotne dla zapytania użytkownika, a model językowy podobnie uruchamia się na krótko, aby przetworzyć żądanie i odpowiedzieć na nie. Ta operacja na żądanie pomaga obniżyć całkowity koszt posiadania (TCO).
Podczas gdy RAG jest często wdrażany przy użyciu procesorów graficznych (jednostek przetwarzania grafiki) i akceleratorów w celu wykorzystania ich możliwości przetwarzania równoległego, technika bezserwerowa firmy Aible w połączeniu z procesorami Intel Xeon Scalable umożliwia wykorzystanie RAG w całości przez procesory. Dane dotyczące wydajności pokazują, że wiele generacji procesorów Intel Xeon może wydajnie obsługiwać obciążenia RAG.
Aible umożliwia klientom obniżenie kosztów operacyjnych projektów GenAI poprzez wykorzystanie wyłącznie procesorów w formie bezserwerowej w celu bezpieczniejszego udostępniania tych samych podstawowych zasobów obliczeniowych wielu klientom. Dla porównania, obniżone koszty operacyjne można porównać do zakupu energii elektrycznej w momencie jej wykorzystania, zamiast wynajmowania generatora energii elektrycznej. Co więcej, wraz ze wzrostem zapotrzebowania na generatywną sztuczną inteligencję, potrzeba optymalizacji zarówno wydajności, jak i zużycia energii staje się coraz ważniejsza. Usługi Aible oparte na procesorach oferują klientom opłacalne i energooszczędne rozwiązanie.
Według analizy porównawczej Aible klienci mogą uzyskać nawet 55-krotne oszczędności kosztów, uruchamiając modele RAG na swoich rozwiązaniach bezserwerowych opartych na procesorze1. Ta redukcja kosztów świadczy o skuteczności podejścia firmy Aible obejmującego wyłącznie procesor, które pozwala uniknąć konieczności stosowania droższej infrastruktury opartej na procesorach graficznych z usługami współdzielonymi lub serwerami dedykowanymi.
Firma Intel — w tym Intel Labs — współpracowała z firmą Aible w celu optymalizacji obciążeń AI na procesorach Xeon. W szczególności optymalizując kod Aible pod kątem AVX-512, firma Aible odnotowała znaczny wzrost wydajności i poprawiła przepustowość na procesorach Xeon, podkreślając wpływ strategicznych optymalizacji oprogramowania na ogólną wydajność.
Połączenie modeli RAG z procesorami Intel Xeon, ułatwione przez platformy takie jak Aible, może umożliwić zastosowanie takich aplikacji jak:
- Przetwarzanie języka naturalnego (NLP)
- Systemy rekomendacji
- Systemy Wspomagania Decyzji
- Generowanie treści
Współpraca Intela z Aible rozpoczęła się wraz z wprowadzeniem na rynek procesorów Xeon czwartej generacji. Od tego czasu obie firmy zoptymalizowały obciążenia AI, kod i biblioteki dla procesorów Xeon, aby zwiększyć wydajność produktów Aible.
Intel i Aible zaprezentują swoje rozwiązania na szczycie Amazon Web Services Summit w Waszyngtonie, w dniach 26 i 27 czerwca. Rozwiązania firmy Aible działają na platformie AWS Lambda i są dostępne w sklepie AWS Marketplace.