Generatywna sztuczna inteligencja: Databricks przedstawia model dużego języka typu open source


Firma zajmująca się danymi i sztuczną inteligencją (AI). Kostki danych zaprezentowała DBRX, urządzenie ogólnego przeznaczenia model dużego języka (LLM) który, jak twierdzi, może przewyższać inne modele open source.

Firma stwierdziła, że ​​DBRX przewyższa istniejące rozwiązania LLM typu open source, takie jak Llama 2 70B i Mixtral-8x7B na wzorcach branżowych, w tym rozumieniu języka, programowaniu, matematyce i logice.

„DBRX demokratyzuje szkolenie i dostrajanie niestandardowych, wysokowydajnych LLM dla każdego przedsiębiorstwa, dzięki czemu nie muszą już polegać na niewielkiej liczbie zamkniętych modeli” – stwierdziła firma.

Ali Ghodsi, współzałożyciel i dyrektor generalny Databricks, powiedział, że DBRX umożliwia przedsiębiorstwom budowanie „niestandardowych możliwości wnioskowania w oparciu o własne dane”. Ponieważ DBRX bije GPT-3.5 stwierdził, że w przypadku większości testów porównawczych powinno to przyspieszyć trend obserwowany przez firmę Databricks u swoich klientów – polegający na zastępowaniu przez organizacje modeli zastrzeżonych modelami typu open source.

Według Databricks DBRX przewyższa GPT-3.5 w zakresie rozumienia języka (MMLU), programowania (HumanEval) i matematyki (GSM8K).

DBRX został opracowany przez Mosaic AI i przeszkolony w chmurze Nvidia DGX. Databricks zoptymalizował DBRX pod kątem wydajności dzięki architekturze mieszanki ekspertów (MoE) zbudowanej na projekcie open source MegaBlocks. Jak twierdzi firma, powstały model jest nawet dwukrotnie wydajniejszy obliczeniowo niż inne dostępne wiodące rozwiązania LLM.

Reklama

DBRX jest dostępny w GitHubie i Hugging Face do celów badawczych i komercyjnych. Na platformie Databricks przedsiębiorstwa mogą wchodzić w interakcję z DBRX i tworzyć niestandardowe modele DBRX na własnych, unikalnych danych. DBRX jest również dostępny na Amazon Web Services (AWS) i Google Cloud, a także bezpośrednio na Microsoft Azure za pośrednictwem Azure Databricks. Oczekuje się, że DBRX będzie również dostępny poprzez interfejs Nvidia Catalog API i będzie obsługiwany przez mikrousługę wnioskowania Nvidia NIM.

Chociaż model jest modelem typu open source, Databricks oferuje również powiązane z nim usługi, które pomagają przedsiębiorstwom w tworzeniu i wdrażaniu aplikacji generujących sztuczną inteligencję (GenAI) o jakości produkcyjnej.

„To będzie zdecydowanie najlepszy model open source na rynku – przewyższa jakością GPT-3.5 i jest całkowicie open source”

Naveen Rao, Kostki danych

„Będzie to zdecydowanie najlepszy model open source na rynku – przewyższa jakością GPT-3.5 i jest całkowicie open source, a co więcej, wprowadziliśmy innowacje w architekturze obliczeniowej tego modelu” – powiedział Naveen Rao, wiceprezes GenAI w Databricks.

Rao powiedział, że architektura oparta na mieszance ekspertów zastosowana w modelu przypomina 16 modeli w jednym.

„Kiedy zadajesz pytanie modelowi i mówisz „wygeneruj ten wynik”, do utworzenia odpowiedzi potrzebny jest podzbiór – cztery z nich. Jest to przydatne, ponieważ dzielisz się wiedzą pomiędzy różnymi ekspertami i masz wyuczony sposób wyznaczania tras, z którego wynika, że ​​„to ci eksperci mają szukać odpowiedzi” – powiedział.

„Możemy uzyskać szybkość i opóźnienia małego modelu z możliwościami znacznie większego modelu. Jest to coś, co ze względu na swoją architekturę obliczeniową jest niezwykle szybkie. Jest to w pełni otwarte źródło, [so] firmy mogą wykorzystać ten model, mogą na nim budować, udoskonalać model i posiadać własne wagi modelu – to tutaj jest kluczowy element. Otrzymują najlepszą ekonomię w zamian za jakość” – powiedział Computer Weekly.

Otwarte oprogramowanie powinno pozwolić klientom czuć się bardziej komfortowo podczas udostępniania danych, ponieważ mają większą kontrolę nad modelem niż w przypadku modelu o zamkniętym kodzie źródłowym.

„Wierzymy w świat, w którym firmy mogą budować własność intelektualną [intellectual property] dla swoich celów i dzierżą tę własność intelektualną według własnego uznania. Możliwość dostrojenia modelu i udostępnienia go za zaporą ogniową, do której nigdy nie można uzyskać dostępu, nie jest tworzeniem adresu IP. W rzeczywistości jest to tworzenie własności intelektualnej dla dostawcy modelu” – powiedział Rao.

Rao dodał, że regulowane branże niechętnie wykorzystują swoje najważniejsze i najbardziej wrażliwe dane do szkolenia zastrzeżonych modeli, po części dlatego, że nie mają nad nimi kontroli.

Dodał, że udostępnienie modelu jako oprogramowania typu open source stanowi zachętę dla klientów korporacyjnych do korzystania z niego w różnych przypadkach. „Cała ta koncepcja przenośności jest bardzo ważna i bardzo trudno ją zrealizować, jeśli nie jest to oprogramowanie typu open source” – powiedział.

Jeśli klienci będą mogli zastosować ten model gdzie indziej, będzie to dla firmy Databricks zachęta do dodawania wartości swoim klientom, zapewniając im jednocześnie potrzebną elastyczność, powiedział.

Zawarte w ogłoszeniach Databricks były komentarze klientów, w tym Zoomaktóra stwierdziła, że ​​nie może się doczekać „oceny potencjału DBRX w zakresie szybszego i bardziej opłacalnego szkolenia i udostępniania niestandardowych generatywnych modeli sztucznej inteligencji w naszych podstawowych przypadkach użycia”.

Mike O’Rourke, dyrektor ds. sztucznej inteligencji i usług danych w Nasdaq, powiedział: „Połączenie dobrej wydajności modelu i korzystnej ekonomiki obsługi to rodzaj innowacji, którego szukamy w miarę zwiększania wykorzystania generatywnej sztucznej inteligencji w Nasdaq”.

Może się zdarzyć, że po okresie dominacji niewielkiej liczby firm rynek korporacyjnego GenAI zacznie się zmieniać.

Databricks to jedna z wielu firm, dużych i małych, w tym Meta (Llama 2), Google (Gemma), xAI (Grok), Mistral AI, Hugging Face i innych, oferujących różne opcje GenAI typu open source.

Według firmy venture capital (VC). Andreessen Horowitz, narzędzia GenAI o zamkniętym kodzie źródłowym stanowiły w zeszłym roku od 80% do 90% rynku, przy czym większość przypadała na OpenAI. Jednak badania wykazały, że połowa kadry kierowniczej przedsiębiorstw, z którymi rozmawiał, preferuje obecnie modele open source.

„W 2024 r. i później przedsiębiorstwa spodziewają się znacznego przejścia w kierunku open source, a niektóre wyraźnie dążą do podziału 50/50 – w porównaniu z podziałem na 80% zamkniętych i 20% otwartych w 2023 r.” – stwierdziła firma VC.

Stwierdzono, że choć przedsiębiorstwa są w dalszym ciągu zainteresowane dostosowywaniem modeli do własnych potrzeb, wraz z rozwojem wysokiej jakości modeli open source większość decyduje się na korzystanie z nich. pokolenie wspomagane wyszukiwaniem (RAG) lub dopracuj model open source.

Chociaż rzeczywisty wpływ GenAI jest nadal niejasny, niedawne badanie wykazało, że sztuczna inteligencja może pomóc zautomatyzować szeroki zakres pracy wykonywanej przez urzędników państwowych w setkach służb rządowych. Wykazało to inne badanie Zainwestowało 80% liderów biznesu w jakiejś formie sztucznej inteligencji w 2023 r., stwierdził jednak, że największymi barierami w przygotowaniu pracowników do stosowania sztucznej inteligencji jest brak wiedzy organizacyjnej, sceptycyzm pracowników i brak przepisów.



Source link

Advertisment

Więcej

Advertisment

Podobne

Advertisment

Najnowsze

Uzyskaj ograniczoną czasowo zniżkę na ten wielourządzeniowy power bank za 199,99 USD

Grafenowy power bank Flash Pro Plus potrafi po trochu wszystkiego. Ma akumulator o pojemności 25 000 mAh, porty USB-C i USB-A, bezprzewodowe...

Próbkowanie Kioxia Najnowsza generacja UFS Ver. Wbudowane urządzenia pamięci Flash 4.0

Kioxia Corporation, światowy lider w dziedzinie rozwiązań pamięciowych, ogłosiła dzisiaj, że rozpoczęła próbkowanie najnowszej generacji pamięci Universal Flash Storage (UFS) wer. Urządzenia...

Czy Trubbish może być błyszczący w Pokémon Go?

Trubbish, Pokémon w worku na śmieci z Unovy, można znaleźć na wolności w Pokemon Go. Tak, Trubbish może się błyszczeć...
Advertisment