Przed czerwcowym debiutem iOS 18 na WWDC firma Apple udostępniła rodzinę wielkojęzycznych modeli typu open source. Nazywany OpenELM, Apple opisuje je jako: rodzinę otwarty-źródło miwydajny Ljęzyk Modele.
W swoich testach Apple twierdzi, że OpenELM oferuje podobną wydajność jak inne modele języka otwartego, ale z mniejszą ilością danych szkoleniowych.
Apple wyjaśnia:
W tym celu udostępniamy OpenELM, najnowocześniejszy model otwartego języka. OpenELM wykorzystuje strategię skalowania warstwowego, aby efektywnie przydzielać parametry w każdej warstwie modelu transformatora, co prowadzi do zwiększonej dokładności. Na przykład przy budżecie parametrów wynoszącym około miliarda parametrów OpenELM wykazuje poprawę dokładności o 2,36% w porównaniu do OLMo, wymagając jednocześnie 2 razy mniej tokenów przedtreningowych.
Odbiegając od wcześniejszych praktyk, które zapewniały jedynie wagi modeli i kod wnioskowania oraz wstępne uczenie na prywatnych zbiorach danych, nasza wersja zawiera pełną platformę do uczenia i ewaluacji modelu językowego na publicznie dostępnych zbiorach danych, w tym dzienniki szkoleniowe, wiele punktów kontrolnych i wstępne konfiguracje treningowe. Udostępniamy także kod do konwersji modeli do biblioteki MLX w celu wnioskowania i dostrajania na urządzeniach Apple. Celem tej kompleksowej publikacji jest wzmocnienie pozycji społeczności otwartych badaczy i utorowanie drogi przyszłym wysiłkom w zakresie otwartych badań naukowych.
Więcej szczegółów znajdziesz pod linkami poniżej:
iOS 18 będzie zawierał zbiór nowych funkcji sztucznej inteligencji, a dzisiejsza wersja OpenELM to tylko najnowszy fragment przygotowywanych zakulisowych prac Apple.
Bloomberga zgłoszone w zeszłym tygodniu, że funkcje sztucznej inteligencji w iOS 18 będą obsługiwane przez model z dużym językiem, całkowicie dostępny na urządzeniu, który zapewni prywatność i szybkość.
Podążaj za Chancem: Wątki, Świergot, InstagramaI Mastodont.
FTC: Korzystamy z automatycznych linków partnerskich generujących dochód. Więcej.