Dlaczego modele świata są kolejną wielką rzeczą w sztucznej inteligencji

To jest fragment Źródła: Alex Heathbiuletyn o sztucznej inteligencji i branży technologicznej, dystrybuowany raz w tygodniu tylko dla subskrybentów The Verge.

Mniej więcej w połowie ubiegłego roku Pim de Witte zaczął kontaktować się z kilkoma czołowymi laboratoriami zajmującymi się sztuczną inteligencją, aby sprawdzić, czy byłyby zainteresowane wykorzystaniem danych z Medaljego popularną platformę do wycinania gier wideo, w celu szkolenia swoich agentów.

W ciągu kilku tygodni stało się jasne, że dane Medala były dla laboratoriów cenniejsze, niż się spodziewał. „Bardzo szybko otrzymaliśmy wiele ofert przejęcia” – powiedział mi. (Odmówił podania nazwisk, ale tak zostało zgłoszone że OpenAI zaoferowało 500 milionów dolarów). „Początkowo byliśmy nimi bardzo zainteresowani” – powiedział o ofertach, ale „było to głównie wynikiem tego, że nie rozumieliśmy, na czym siedzimy”.

Czytał Google DeepMind artykuł badawczy pokazując, że dane z gier można wykorzystać do nauczenia sztucznej inteligencji poruszania się w środowisku 3D. Jednak zainteresowanie laboratoriów zajmujących się sztuczną inteligencją uświadomiło mu, że jego dane z firmy Medal, do której co roku przesyłane są około 2 miliardy filmów wideo z dziesiątek tysięcy gier wideo, mogą zostać wykorzystane do opracowania unikalnego, podstawowego modelu rozszerzenia sztucznej inteligencji na rzeczywisty świat.

„To dość duży zakład”.

Dzisiaj Pim de Witte ogłosił, że Medal tworzy nowe laboratorium sztucznej inteligencji o nazwie General Intuition, które zebrało rundę zalążkową o wartości 133,7 miliona dolarów. Pieniądze na rundę pochodzą przede wszystkim od Vinoda Khosli, założyciela Khosla Ventures i jednego z pierwszych inwestorów w OpenAI. Inni inwestorzy to General Catalyst i Raine Group. Moritz Baier-Lentz, który nadzoruje inwestycje Lightspeed w gry, również dołącza do startupu w niepełnym wymiarze godzin jako członek zespołu założycielskiego.

Reklama

Khosla wierzy, że General Intuition może mieć równie wpływ na agentów AI, jak OpenAI na sposób, w jaki ludzie korzystają z dużych modeli językowych. To największa kontrola jego firmy od czasu wsparcia OpenAI w 2018 r. „To dość duże założenie” – powiedział mi. „Mają unikalny zbiór danych i wyjątkowy zespół”.

Jeśli nie jesteś przesiąknięty światem sztucznej inteligencji, prawdopodobnie nie słyszałeś jeszcze zbyt wiele o modelach świata. To dziedzina badań, która szkoli sztuczną inteligencję w zakresie rozumienia przestrzeni jak człowiek. Pomysł jest taki, że robot mógłby na przykład przewidzieć, kiedy szklanka wody zostanie rozlana po strzale ze stołu, i chwycić ją, zanim spadnie. Z praktycznego punktu widzenia badacze sztucznej inteligencji coraz częściej wykorzystują modele świata jako sposób na szkolenie agentów, którzy potrafią niezawodnie generować przestrzeń 3D i wchodzić z nią w interakcję.

Wśród czołowych liderów sztucznej inteligencji najbardziej zagorzałym zwolennikiem światowych modeli i ich znaczenia w osiąganiu AGI jest dyrektor generalny Google DeepMind, Demis Hassabis. Google niedawno pokazałem Genie 3model, który generuje od podstaw środowisko przypominające grę wideo podczas poruszania się po nim. Nad podobnymi modelami pracuje także kilka startupów, w tym World Labs Fei-Fei Li, które w tym tygodniu wydało własne demo modelu generującego interaktywne wideo w czasie rzeczywistym.

Według de Witte’a celem General Intuition jest kontrolowanie dowolnego rodzaju urządzenia, które można przypisać do klawiatury i myszy lub które ma schemat wprowadzania danych podobny do kontrolera gier. Oczekuje, że pierwszy model startupu będzie wykorzystywany przez drony poszukiwawczo-ratownicze, ale widzi potencjał zastosowań w innych obszarach, w tym w robotach humanoidalnych i samochodach autonomicznych.

Tak jak początkowo osoby z wykształceniem wyższym były szkolone w zakresie internetowych danych tekstowych, de Witte wierzy, że środowiska gier odblokują zdolność sztucznej inteligencji do niezawodnego przewidywania właściwych działań, jakie należy podjąć w świecie fizycznym. „Gry są w zasadzie jedyną weryfikowalną dziedziną rozumowania przestrzenno-czasowego” – wyjaśnił. „Można oddzielić dobre działanie od złego, dlatego jest to tak cenne”.

Mimo to jest to ryzykowny zakład. Prawidłowa ścieżka techniczna opracowywania modeli światowych jest przedmiotem gorących dyskusji w branży sztucznej inteligencji i jak zauważył nawet Khosla, nie jest jasne, które dane ostatecznie okażą się najcenniejsze. Członkowie wczesnego zespołu badawczego de Witte’a opublikowały godne uwagi badania w tej dziedzinie, ale startup nadal konkuruje z lepiej finansowanymi gigantami, takimi jak Google. „Ktoś odniesie duże sukcesy na tym rynku” – powiedział Khosla, który powiedział mi, że uważa, że jest to obszar, na którym „zostaną zbudowane firmy warte wieleset miliardów dolarów, a potencjalnie nawet biliony dolarów”.

De Witte przewiduje, że firmy z branży gier staną się głównymi celami przejęć laboratoriów AI w miarę wzrostu zainteresowania modelami świata. Jego decyzja o założeniu General Intuition wynikała ze świadomości, że dzięki danym Medala ma on wyjątkową pozycję, dzięki której może być kimś więcej niż tylko dostawcą danych. Ostrzegł mnie jednak, że innym może być trudno oprzeć się sprawdzaniu licencji i ofertom przejęcia od dużych laboratoriów AI.

„Jesteście w niekorzystnej sytuacji informacyjnej” – powiedział, gdy zapytałem, czy ma rady dla branży gier. „Im lepsze będą te modele, tym mniej danych będą prawdopodobnie potrzebne”.

Śledź tematy i autorów z tej historii, aby zobaczyć więcej takich wydarzeń w swoim spersonalizowanym kanale strony głównej i otrzymywać aktualizacje e-mailem.

Alexa Heatha

Source link

Dlaczego modele świata są kolejną wielką rzeczą w sztucznej inteligencji

Więcej

Podobne

Najnowsze

Moda ZA jest doskonała, ale zbyt ujednolicona

Klęska kasowa Aresa ujawnia większy problem, który sam stworzył Disney

W ten weekend masz ostatnią szansę na zdobycie miesięcznego Disney Plus już od 9,99 USD

Dlaczego modele świata są kolejną wielką rzeczą w sztucznej inteligencji

Więcej

Moda ZA jest doskonała, ale zbyt ujednolicona

Klęska kasowa Aresa ujawnia większy problem, który sam stworzył Disney

W ten weekend masz ostatnią szansę na zdobycie miesięcznego Disney Plus już od 9,99 USD

Podobne

Neon Opery pokazuje, jak zagmatwane są nadal przeglądarki oparte na sztucznej inteligencji

Najnowsze

Moda ZA jest doskonała, ale zbyt ujednolicona

Klęska kasowa Aresa ujawnia większy problem, który sam stworzył Disney

W ten weekend masz ostatnią szansę na zdobycie miesięcznego Disney Plus już od 9,99 USD