Widzieliśmy Spota uruchomić, skoki nawet taniec…ale teraz możemy zobaczyć Spota rozmawiać. W nieco niepokojący sposób wideo opublikowane autorstwa Boston Dynamics widzimy jego-robota-psa z cylindrem, wąsami i wyłupiastymi oczami, który rozmawia z pracownikami z brytyjskim akcentem i zabiera ich na wycieczkę po zakładach firmy.
„Czy możemy rozpocząć naszą podróż?” – pyta Spot. „Naszym pierwszym punktem zainteresowania są stacje ładowania, w których roboty Spot odpoczywają i ładują się. Za mną, panowie. Jak pokazano w wersji demo, Spot potrafi odpowiadać na pytania, a nawet otwiera „usta”, aby sprawiać wrażenie, jakby rzeczywiście mówił.
Aby Spot „mówił”, Używany Boston Dynamics Interfejs API ChatGPT OpenAI wraz z niektórymi dużymi modelami językowymi typu open source (LLM) w celu dokładnego szkolenia jego odpowiedzi. Następnie wyposażył bota w głośnik, dodał funkcje zamiany tekstu na mowę i sprawił, że jego usta – hm… chwytak – naśladują mowę „jak usta marionetki”.
Matt Klingensmith, główny inżynier oprogramowania w Boston Dynamics, twierdzi, że zespół dał Spotowi „bardzo krótki scenariusz” dla każdego pomieszczenia w jego obiektach. Następnie bot połączył ten skrypt ze obrazami uzyskanymi z kamer umieszczonych na chwytaku i korpusie, co pozwoliło mu „uzyskać więcej informacji o tym, co widzi, przed wygenerowaniem odpowiedzi”. Według firmy Spot wykorzystuje modele wizualnego odpowiadania na pytania, aby zasadniczo dodawać podpisy do obrazów i odpowiadać na pytania na ich temat.
„Generator szumi cicho w pokoju pozbawionym radości. Zupełnie jak moja dusza.
„Fantazyjny kamerdyner” nie jest jedyną osobą, którą Spot przybiera podczas filmu. Czteronożny robot wciela się także w osobowość archeologa z lat 20. XX wieku, nastolatka i szekspirowskiego podróżnika w czasie. Przybiera nawet sarkastyczną osobowość, która zapytana o wymyślenie haiku odpowiedziała: „Generator szumi cicho w pomieszczeniu pozbawionym radości. Zupełnie jak moja dusza.
Boston Dynamics twierdzi, że eksperymentując ze Spotem jako przewodnikiem wycieczek, odkryło kilka niespodzianek. W jednym przypadku zespół zapytał Spota, kim są jego „rodzice”, i udał się do miejsca, w którym w biurze firmy wystawione są starsze modele Spota. Firma zauważa również, że w niektórych przypadkach LLM zmyśliła pewne rzeczy, na przykład to sugerując Stretch, jego robot przeznaczony do przenoszenia pudełzostał stworzony do jogi.
„Jesteśmy podekscytowani możliwością dalszego odkrywania skrzyżowania sztucznej inteligencji i robotyki” – pisze Klingensmith w: opublikować na stronie Boston Dynamics. „Te modele [LLMs] może pomóc w zapewnieniu kontekstu kulturowego, ogólnej wiedzy opartej na zdrowym rozsądku i elastyczności, która może być przydatna w wielu zadaniach związanych z robotyką — na przykład możliwość przydzielenia zadania robotowi po prostu poprzez rozmowę z nim pomogłaby skrócić czas uczenia się korzystania z tych systemów.