OpenAI ujawnia GPT-4, który twierdzi, że przewyższa ludzi w niektórych akademickich testach porównawczych


Stworzyliśmy GPT-4, najnowszy kamień milowy w wysiłkach OpenAI na rzecz skalowania głębokiego uczenia się. GPT-4 to duży multimodalny model (akceptujący obraz i tekst wejściowy, emitujący dane wyjściowe tekstowe), który, chociaż ma mniejsze możliwości niż ludzie w wielu rzeczywistych scenariuszach, wykazuje wydajność na poziomie człowieka w różnych profesjonalnych i akademickich testach porównawczych. Na przykład zdaje symulowany egzamin adwokacki z wynikiem zbliżonym do 10% najlepszych zdających; w przeciwieństwie do tego, wynik GPT-3.5 był w okolicy najniższych 10%. Spędziliśmy 6 miesięcy na iteracyjnym dostosowywaniu GPT-4, korzystając z lekcji z naszego programu testowania przeciwników oraz ChatGPT, co zaowocowało naszymi najlepszymi w historii wynikami (choć dalekimi od doskonałych) pod względem faktyczności, sterowności i odmowy wychodzenia poza bariery.

W ciągu ostatnich dwóch lat przebudowaliśmy cały nasz stos głębokiego uczenia się i wspólnie z platformą Azure zaprojektowaliśmy od podstaw superkomputer do naszych zadań. Rok temu trenowaliśmy GPT-3.5 jako pierwszy „test” systemu. Znaleźliśmy i naprawiliśmy kilka błędów oraz poprawiliśmy nasze podstawy teoretyczne. W rezultacie nasz trening GPT-4 był (przynajmniej dla nas!) bezprecedensowo stabilny, stając się naszym pierwszym dużym modelem, którego wyniki treningowe byliśmy w stanie dokładnie przewidzieć z wyprzedzeniem. Ponieważ nadal koncentrujemy się na niezawodnym skalowaniu, dążymy do doskonalenia naszej metodologii, aby pomóc nam przewidywać i przygotowywać się na przyszłe możliwości z coraz większym wyprzedzeniem — coś, co uważamy za kluczowe dla bezpieczeństwa.

Uwalniamy możliwość wprowadzania tekstu GPT-4 przez ChatGPT i API (z listą oczekujących). Aby przygotować możliwość wprowadzania obrazów do szerszej dostępności, na początek ściśle współpracujemy z jednym partnerem. Udostępniamy również open-sourcing OpenAI Evals, naszą platformę do automatycznej oceny wydajności modeli AI, aby umożliwić każdemu zgłaszanie niedociągnięć w naszych modelach, aby pomóc w dalszych ulepszeniach.

W swobodnej rozmowie rozróżnienie między GPT-3.5 i GPT-4 może być subtelne. Różnica pojawia się, gdy złożoność zadania osiąga wystarczający próg — GPT-4 jest bardziej niezawodny, kreatywny i jest w stanie obsłużyć znacznie bardziej szczegółowe instrukcje niż GPT-3.5.

Aby zrozumieć różnicę między tymi dwoma modelami, przetestowaliśmy różne testy porównawcze, w tym symulujące egzaminy, które pierwotnie były przeznaczone dla ludzi. Postąpiliśmy, korzystając z najnowszych publicznie dostępnych testów (w przypadku Olimpiad i pytań z odpowiedzią bezpłatną AP) lub kupując edycje egzaminów praktycznych z lat 2022-2023. Nie odbyliśmy specjalnego szkolenia do tych egzaminów. Mniejszość problemów na egzaminach została dostrzeżona przez modelkę podczas szkolenia, ale uważamy, że wyniki są reprezentatywne — zobacz nasze raport techniczny dla szczegółów.

Reklama

Z niecierpliwością oczekujemy, że GPT-4 stanie się cennym narzędziem poprawiającym życie ludzi, zasilając wiele aplikacji. Nadal jest dużo pracy do wykonania i nie możemy się doczekać ulepszenia tego modelu poprzez wspólne wysiłki społeczności, która buduje, eksploruje i przyczynia się do rozwoju tego modelu.



Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

Współzałożyciel firmy Intel, Gordon Moore, człowiek stojący za prawem Moore’a, umiera w wieku 94 lat

Firma Intel oraz Fundacja Gordona i Betty Moore'ów ogłosiły dzisiaj, że współzałożyciel firmy, Gordon Moore, zmarł w wieku 94 lat. Fundacja poinformowała, że...

Internet Archive przegrało swoją pierwszą walkę o skanowanie i wypożyczanie e-booków jak biblioteka

Sędzia federalny orzekł przeciwko Internet Archive w Hachette przeciwko Internet Archive, wytoczony przeciwko niemu pozew przez czterech wydawców książek, uznając, że serwis nie...

Zmarł Gordon Moore, współzałożyciel firmy Intel i twórca prawa Moore’a

Gordon Moore, jeden ze współzałożycieli Intela i tytan Doliny Krzemowej, zmarł dzisiaj w wieku 94 lat, zgodnie z komunikat prasowy firmy. Był...
Advertisment

Chcesz być na bieżąco z najnowszymi wiadomościami?

Bardzo chcielibyśmy usłyszeć od Ciebie! Podaj swoje dane, a pozostaniemy w kontakcie. To takie proste!