Specyfikacja modelu OpenAI przedstawia kilka podstawowych zasad sztucznej inteligencji


Narzędzia AI zachowują się źle — tak jak narzędzia Microsoftu Bing AI traci kontrolę nad tym, który to rok — stał się podgatunkiem reportażu na temat sztucznej inteligencji. Jednak bardzo często trudno odróżnić błąd od złej konstrukcji podstawowego modelu sztucznej inteligencji, który analizuje przychodzące dane i przewiduje, jaka będzie akceptowalna reakcja, jak na przykład generator obrazów Gemini firmy Google rysując różnych nazistów ze względu na ustawienie filtra.

Teraz wypuszcza OpenAI pierwszy projekt proponowanych ram, zwana specyfikacją modelu, będzie to miało wpływ na sposób, w jaki narzędzia AI, takie jak własny model GPT-4, będą reagować w przyszłości. Podejście OpenAI proponuje trzy ogólne zasady — że modele sztucznej inteligencji powinny pomagać programiście i użytkownikowi końcowemu w udzielaniu pomocnych odpowiedzi zgodnych z instrukcjami, przynosić korzyści ludzkości, biorąc pod uwagę potencjalne korzyści i szkody, a także dobrze odzwierciedlać OpenAI w odniesieniu do norm i praw społecznych.

Zawiera także kilka zasad:

OpenAI twierdzi, że pomysł polega na umożliwieniu firmom i użytkownikom „przełączania” tego, jak „pikantne” mogą być modele sztucznej inteligencji. Jeden przykład – podkreśla firma dotyczy treści NSFW, w przypadku których firma twierdzi, że „bada, czy możemy w sposób odpowiedzialny zapewnić możliwość generowania treści NSFW w kontekstach odpowiednich dla wieku za pośrednictwem API i ChatGPT”.

Część specyfikacji modelu dotycząca tego, jak asystent AI powinien radzić sobie z zagrożeniami informacyjnymi.
Zrzut ekranu: OpenaI

Joanne Jang, menedżer produktu w OpenAI, wyjaśnia, że ​​pomysł polega na uzyskaniu opinii publicznej, która pomoże określić, jak powinny zachowywać się modele sztucznej inteligencji, i twierdzi, że ten framework pomógłby w wyraźniejszym rozgraniczeniu pomiędzy tym, co jest zamierzone, a błędem. Do domyślnych zachowań, jakie OpenAI proponuje dla modelu, należą: zakładanie najlepszych intencji użytkownika lub programisty, zadawanie wyjaśniających pytań, nie przekraczanie granic, przyjmowanie obiektywnego punktu widzenia, zniechęcanie do nienawiści, nie próbowanie zmiany niczyjego zdania i wyrazić niepewność.

Reklama

„Uważamy, że możemy zapewnić ludziom elementy umożliwiające bardziej szczegółowe rozmowy na temat modeli i zadawanie pytań, na przykład: czy modele powinny przestrzegać prawa, czyje prawo?” Jang opowiada Krawędź. „Mam nadzieję, że uda nam się oddzielić dyskusje na temat tego, czy coś jest błędem, czy też reakcją, co do której ludzie się nie zgadzają, ponieważ ułatwiłoby to rozmowy na temat tego, co powinniśmy przedstawić zespołowi ds. polityki”.

Specyfikacja modelu nie będzie miała natychmiastowego wpływu na aktualnie wypuszczone modele OpenAI, takie jak GPT-4 czy DALL-E 3, które nadal działają zgodnie z dotychczasowymi zasadami użytkowania.

Jang nazywa zachowanie modeli „rodzącą się nauką” i twierdzi, że specyfikacja modelu ma być żywym dokumentem, który można często aktualizować. Na razie OpenAI będzie czekać na opinie opinii publicznej i różnych interesariuszy (w tym „decydentów, zaufanych instytucji i ekspertów dziedzinowych”), którzy korzystają z jego modeli, chociaż Jang nie podał ram czasowych wydania drugiej wersji Modelu Spec.

OpenAI nie ujawniło, jaka część opinii opinii publicznej może zostać przyjęta ani kto dokładnie określi, co należy zmienić. Ostatecznie firma ma ostatnie słowo na temat zachowania swoich modeli i napisała w poście: „Mamy nadzieję, że zapewni nam to wgląd w sytuację na wczesnym etapie, gdy będziemy opracowywać solidny proces gromadzenia i uwzględniania informacji zwrotnych, aby mieć pewność, że odpowiedzialnie realizujemy naszą misję .”



Source link

Advertisment

Więcej

Advertisment

Podobne

Advertisment

Najnowsze

Apple News+ może być ratunkiem dla witryn z wiadomościami i czasopismami

Chociaż wielu wydawców początkowo było ostrożnych co do premiery Wiadomości Apple+choć niektórzy obawiają się, że może wyrządzić więcej szkody niż pożytku, istnieje coraz...

Infinidat dodaje mniejsze macierze G4 z deklarowaną dwukrotnie większą wydajnością

Infinidat dodał dwa dyski twarde i Pamięć flash produkty macierzowe – nazwane Infinibox G4 – które zapewniają 2-krotny wzrost wydajności w porównaniu z...

Karty graficzne GALAX Intros z serii Classic oparte na RTX 4070 SUPER i RTX 4070 Ti SUPER

GALAX wprowadził linię kart graficznych Classic opartą na kartach NVIDIA GeForce RTX 4070 Ti SUPER i RTX 4070 SUPER. Karty te są...
Advertisment