Procesory Intel Xeon przyspieszają obciążenia GenAI dzięki Aible


Intel i Aible, kompleksowe, bezserwerowe rozwiązanie dla przedsiębiorstw generujące sztuczną inteligencję (GenAI) i rozszerzoną analitykę, oferują teraz wspólne klientom rozwiązania umożliwiające uruchamianie zaawansowanych zastosowań GenAI i generacji rozszerzonej z pobieraniem (RAG) na wielu generacjach procesorów Intel Xeon. Współpraca, która obejmuje optymalizacje inżynieryjne i program testów porównawczych, zwiększa zdolność Aible do dostarczania wyników GenAI przy niskich kosztach dla klientów korporacyjnych i pomaga programistom osadzać inteligencję AI w aplikacjach. Firmy wspólnie oferują skalowalne i wydajne rozwiązania AI, które wykorzystują wysokowydajny sprzęt, aby pomóc klientom rozwiązywać problemy związane ze sztuczną inteligencją i technologią Intel.

„Klienci szukają wydajnych rozwiązań klasy korporacyjnej, które pozwolą wykorzystać moc sztucznej inteligencji. Nasza współpraca z Aible pokazuje, jak blisko współpracujemy z branżą, aby dostarczać innowacje w zakresie sztucznej inteligencji i obniżać barierę wejścia dla wielu klientów w celu korzystania z najnowszych Obciążenia GenAI przy użyciu procesorów Intel Xeon” — powiedział Mishali Naik, starszy główny inżynier firmy Intel w dziale Data Center i AI Group.

Rozwiązania Aible pokazują, jak procesory mogą znacznie zwiększyć wydajność w szeregu najnowszych obciążeń AI, od modeli języków roboczych po RAG. Zoptymalizowana pod kątem procesorów Intel technologia Aible wykorzystuje wydajne, bezserwerowe, kompleksowe podejście do sztucznej inteligencji, zużywając zasoby tylko wtedy, gdy istnieją aktywne żądania użytkowników. Na przykład wektorowa baza danych aktywuje się na kilka sekund, aby pobrać informacje istotne dla zapytania użytkownika, a model językowy podobnie uruchamia się na krótko, aby przetworzyć żądanie i odpowiedzieć na nie. Ta operacja na żądanie pomaga obniżyć całkowity koszt posiadania (TCO).

Podczas gdy RAG jest często wdrażany przy użyciu procesorów graficznych (jednostek przetwarzania grafiki) i akceleratorów w celu wykorzystania ich możliwości przetwarzania równoległego, technika bezserwerowa firmy Aible w połączeniu z procesorami Intel Xeon Scalable umożliwia wykorzystanie RAG w całości przez procesory. Dane dotyczące wydajności pokazują, że wiele generacji procesorów Intel Xeon może wydajnie obsługiwać obciążenia RAG.

Aible umożliwia klientom obniżenie kosztów operacyjnych projektów GenAI poprzez wykorzystanie wyłącznie procesorów w formie bezserwerowej w celu bezpieczniejszego udostępniania tych samych podstawowych zasobów obliczeniowych wielu klientom. Dla porównania, obniżone koszty operacyjne można porównać do zakupu energii elektrycznej w momencie jej wykorzystania, zamiast wynajmowania generatora energii elektrycznej. Co więcej, wraz ze wzrostem zapotrzebowania na generatywną sztuczną inteligencję, potrzeba optymalizacji zarówno wydajności, jak i zużycia energii staje się coraz ważniejsza. Usługi Aible oparte na procesorach oferują klientom opłacalne i energooszczędne rozwiązanie.

Według analizy porównawczej Aible klienci mogą uzyskać nawet 55-krotne oszczędności kosztów, uruchamiając modele RAG na swoich rozwiązaniach bezserwerowych opartych na procesorze1. Ta redukcja kosztów świadczy o skuteczności podejścia firmy Aible obejmującego wyłącznie procesor, które pozwala uniknąć konieczności stosowania droższej infrastruktury opartej na procesorach graficznych z usługami współdzielonymi lub serwerami dedykowanymi.

Firma Intel — w tym Intel Labs — współpracowała z firmą Aible w celu optymalizacji obciążeń AI na procesorach Xeon. W szczególności optymalizując kod Aible pod kątem AVX-512, firma Aible odnotowała znaczny wzrost wydajności i poprawiła przepustowość na procesorach Xeon, podkreślając wpływ strategicznych optymalizacji oprogramowania na ogólną wydajność.
Połączenie modeli RAG z procesorami Intel Xeon, ułatwione przez platformy takie jak Aible, może umożliwić zastosowanie takich aplikacji jak:

Reklama
  • Przetwarzanie języka naturalnego (NLP)
  • Systemy rekomendacji
  • Systemy Wspomagania Decyzji
  • Generowanie treści

Współpraca Intela z Aible rozpoczęła się wraz z wprowadzeniem na rynek procesorów Xeon czwartej generacji. Od tego czasu obie firmy zoptymalizowały obciążenia AI, kod i biblioteki dla procesorów Xeon, aby zwiększyć wydajność produktów Aible.

Intel i Aible zaprezentują swoje rozwiązania na szczycie Amazon Web Services Summit w Waszyngtonie, w dniach 26 i 27 czerwca. Rozwiązania firmy Aible działają na platformie AWS Lambda i są dostępne w sklepie AWS Marketplace.



Source link

Advertisment

Więcej

Advertisment

Podobne

Advertisment

Najnowsze

Uber i Lyft muszą płacić kierowcom korzystającym z przejazdów w Massachusetts 32 dolary za godzinę

Kierowcy współdzielonych przejazdów w Massachusetts wkrótce otrzymają świadczenia zapewniane przez firmę, a także minimalne wynagrodzenie w wysokości 32,50 USD za godzinę, począwszy od...

Kindle Paperwhite ostatniej generacji Amazona jest teraz w sprzedaży za 50 dolarów

Ostatnio wydaje się, że największe wydarzenia w świecie E Ink koncentrują się wokół dużych urządzeń do robienia notatek, takich jak czytnik Kindle i...

Jak sprawdzić, czy Twój operator włączył już obsługę RCS w iOS 18

Jedną z największych zmian w iOS 18 jest obsługa RCS, umożliwiająca znacznie lepszą komunikację między użytkownikami iPhone'a i Androida. Wraz z wydaniem Wersja...
Advertisment