Kolejny duży projekt dotyczący sztucznej inteligencji Facebooka polega na szkoleniu swoich maszyn na publicznych filmach użytkowników


Nauczenie systemów sztucznej inteligencji, aby rozumiały, co dzieje się w filmach tak dokładnie, jak człowiek może, jest jednym z najtrudniejszych wyzwań – i największym potencjalnym przełomem – w świecie uczenia maszynowego. Dzisiaj Facebook ogłosił nowa inicjatywa że ma nadzieję, że da mu przewagę w tej konsekwentnej pracy: szkoleniu swojej sztucznej inteligencji na publicznych filmach użytkowników Facebooka.

Dostęp do danych szkoleniowych to jedna z największych przewag konkurencyjnych w sztucznej inteligencji, a dzięki gromadzeniu tego zasobu od milionów i milionów użytkowników, giganci technologiczni, tacy jak Facebook, Google i Amazon, byli w stanie osiągnąć postęp w różnych obszarach. I chociaż Facebook już wyszkolił modele wizji maszynowej miliardy obrazów zebrany z Instagrama, nie ogłosił wcześniej projektów o podobnych ambicjach w zakresie zrozumienia wideo.

„Ucząc się z globalnych strumieni publicznie dostępnych filmów, obejmujących prawie każdy kraj i setki języków, nasze systemy sztucznej inteligencji nie tylko poprawią dokładność, ale także dostosują się do szybko zmieniającego się świata i rozpoznają niuanse i wizualne wskazówki w różnych kulturach i regionach” – powiedział firma na blogu. Projekt pt Uczenie się z filmów, jest również częścią „szerszych wysiłków Facebooka na rzecz budowania maszyn, które uczą się tak jak ludzie”.

Powstałe w ten sposób modele uczenia maszynowego zostaną wykorzystane do stworzenia nowych systemów rekomendacji treści i narzędzi moderacyjnych, twierdzi Facebook, ale mogą zrobić o wiele więcej w przyszłości. Sztuczna inteligencja, która potrafi zrozumieć treść filmów, może dać Facebookowi bezprecedensowy wgląd w życie użytkowników, umożliwiając im analizę ich hobby i zainteresowań, preferencji dotyczących marek i ubrań oraz niezliczonych innych danych osobowych. Oczywiście Facebook ma już dostęp do takich informacji poprzez swoją obecną operację targetowania reklam, ale możliwość analizowania wideo za pomocą sztucznej inteligencji dodałaby do jego sklepów niezwykle bogate (i inwazyjne) źródło danych.

Facebook jest niejasny co do swoich przyszłych planów dotyczących modeli sztucznej inteligencji trenowanych na filmach użytkowników. Firma powiedziała The Verge takie modele mogą mieć wiele zastosowań, od tworzenia napisów do filmów po tworzenie zaawansowanych funkcji wyszukiwania, ale nie odpowiadały na pytanie, czy będą używane do zbierania informacji na potrzeby kierowania reklam. Podobnie na pytanie, czy użytkownicy musieli wyrazić zgodę na wykorzystywanie ich filmów do trenowania sztucznej inteligencji Facebooka, czy też mogliby z tego zrezygnować, firma odpowiedziała jedynie, zauważając, że Polityka dotycząca danych Mówi, że treści przesłane przez użytkowników mogą być wykorzystywane do „badań i rozwoju produktów”. Facebook nie odpowiedział również na pytania dotyczące tego, ile dokładnie materiału wideo będzie gromadzone w celu szkolenia jego systemów sztucznej inteligencji ani w jaki sposób będzie nadzorowany dostęp do tych danych przez badaczy firmy.

Jednak w swoim poście na blogu zapowiadającym projekt sieć społecznościowa wskazała na jedno przyszłe, spekulatywne zastosowanie: wykorzystanie sztucznej inteligencji do odzyskania „cyfrowych wspomnień” przechwyconych przez inteligentne okulary.

Reklama

Facebook planuje wypuścić parę inteligentnych okularów dla konsumentów kiedyś w tym roku. Szczegóły dotyczące urządzenia są niejasne, ale prawdopodobnie te lub przyszłe okulary będą zawierały zintegrowane kamery, aby uchwycić punkt widzenia użytkownika. Jeśli uda się wyszkolić systemy sztucznej inteligencji, aby rozumiały zawartość wideo, umożliwi to użytkownikom wyszukiwanie wcześniejszych nagrań, podobnie jak wiele aplikacji do zdjęć umożliwia wyszukiwanie określonych lokalizacji, obiektów lub osób. (Nawiasem mówiąc, są to informacje, które często były indeksowane przez systemy sztucznej inteligencji przeszkolone w zakresie danych użytkownika).

Facebook opublikował zdjęcia przedstawiające prototypowe pary swoich inteligentnych okularów do rzeczywistości rozszerzonej.
Zdjęcie: Facebook

Ponieważ nagrywanie wideo za pomocą inteligentnych okularów „staje się normą”, mówi Facebook, „ludzie powinni mieć możliwość przywoływania konkretnych chwil z ogromnego banku cyfrowych wspomnień tak samo łatwo, jak je utrwalają”. Podaje przykład użytkownika przeprowadzającego wyszukiwanie z frazą „Pokaż mi za każdym razem, gdy śpiewaliśmy babci z okazji urodzin” przed wyświetleniem odpowiednich klipów. Jak zauważa firma, takie wyszukiwanie wymagałoby, aby systemy AI ustanowiły powiązania między typami danych, ucząc je „dopasowywania wyrażenia„ happy birthday ”do ciast, świec, osób śpiewających różne piosenki urodzinowe i nie tylko”. Podobnie jak ludzie, sztuczna inteligencja musiałaby zrozumieć bogate koncepcje obejmujące różne rodzaje bodźców sensorycznych.

Patrząc w przyszłość, połączenie inteligentnych okularów i uczenia maszynowego umożliwiłoby tzw. „Złomowanie świata” – przechwytywanie szczegółowych danych o świecie poprzez przekształcenie użytkowników inteligentnych okularów w wędrujące kamery CCTV. Ponieważ praktyka została opisana w raport z zeszłego roku od Opiekun: „Za każdym razem, gdy ktoś przeglądał supermarket, jego inteligentne okulary zapisywały w czasie rzeczywistym dane dotyczące cen, stanów magazynowych i nawyków przeglądania; za każdym razem, gdy otworzyli gazetę, ich okulary wiedziały, które historie czytają, jakie reklamy oglądali i na których zdjęciach sławnych plażowiczów zatrzymały się ich spojrzenie ”.

To ekstremalny wynik i nie jest to droga badań, którą Facebook twierdzi, że obecnie bada. Ale ilustruje potencjalne znaczenie połączenia zaawansowanej analizy wideo AI z inteligentnymi okularami – do czego najwyraźniej chętnie dąży sieć społecznościowa.

Dla porównania, jedyne wykorzystanie nowych narzędzi do analizy wideo AI, które obecnie ujawnia Facebook, jest stosunkowo przyziemne. Wraz z ogłoszeniem dzisiejszego uczenia się z filmów, Facebook twierdzi, że wdrożył nowy system rekomendacji treści oparty na pracy wideo w swoich kołowrotkach TikTok-clone. „Popularne filmy często zawierają tę samą muzykę z tymi samymi ruchami tanecznymi, ale są tworzone i odtwarzane przez różne osoby” – mówi Facebook. Analizując zawartość filmów, sztuczna inteligencja Facebooka może sugerować użytkownikom podobne klipy.

Takie algorytmy rekomendacji treści nie są jednak pozbawione potencjalnych problemów. ZA ostatni raport z Przegląd technologii MIT Podkreślił, że nacisk sieci społecznościowej na wzrost i zaangażowanie użytkowników powstrzymał zespół zajmujący się sztuczną inteligencją przed pełnym zajęciem się tym, jak algorytmy mogą rozpowszechniać dezinformację i zachęcać do polaryzacji politycznej. Ponieważ Przegląd technologii artykuł mówi: „The [machine learning] modele maksymalizujące zaangażowanie sprzyjają również kontrowersjom, dezinformacji i ekstremizmowi ”. Stwarza to konflikt między obowiązkami badaczy etyki sztucznej inteligencji na Facebooku a credo firmy polegającym na maksymalizacji wzrostu.

Facebook nie jest jedyną dużą firmą technologiczną, która zajmuje się zaawansowaną analizą wideo AI, ani nie jest jedyną, która wykorzystuje do tego dane użytkowników. Na przykład Google utrzymuje publicznie dostępny zbiór danych badawczych zawierający 8 milionów wybrane i częściowo oznaczone filmy YouTube aby „przyspieszyć badania nad zrozumieniem materiałów wideo na dużą skalę”. Operacje reklamowe giganta wyszukiwania mogłyby podobnie skorzystać na sztucznej inteligencji, która rozumie treść filmów, nawet jeśli efektem końcowym jest po prostu wyświetlanie bardziej trafnych reklam w YouTube.

Jednak Facebook uważa, że ​​ma jedną szczególną przewagę nad swoimi konkurentami. Nie tylko ma wystarczające dane szkoleniowe, ale także wpycha coraz więcej zasobów do metody sztucznej inteligencji znanej jako samodzielne uczenie się.

Zwykle, gdy modele sztucznej inteligencji są trenowane na danych, te dane wejściowe muszą być oznaczone przez ludzi: na przykład oznaczanie obiektów na zdjęciach lub przepisywanie nagrań dźwiękowych. Jeśli kiedykolwiek rozwiązałeś CAPTCHA identyfikujące hydranty przeciwpożarowe lub przejście dla pieszych, prawdopodobnie oznaczyłeś dane, które pomogły w trenowaniu sztucznej inteligencji. Jednak samo-nadzorowane uczenie się eliminuje etykiety, przyspieszając proces szkolenia i, jak sądzą niektórzy badacze, skutkuje głębszą i bardziej znaczącą analizą, ponieważ systemy sztucznej inteligencji uczą się łączyć kropki. Facebook jest tak optymistą, jeśli chodzi o samodzielną naukę nazywa to „ciemna materia inteligencji”.

Firma twierdzi, że jej przyszłe prace nad analizą wideo AI będą koncentrować się na metodach uczenia się częściowo i samodzielnie nadzorowanych oraz że takie techniki „poprawiły już nasze systemy widzenia komputerowego i rozpoznawania mowy”. Przy tak dużej ilości treści wideo dostępnych od 2,8 miliarda użytkowników Facebooka pominięcie części szkolenia dotyczącej sztucznej inteligencji dotyczącej etykiet z pewnością ma sens. A jeśli sieć społecznościowa może nauczyć swoje modele uczenia maszynowego, aby bezproblemowo rozumieć wideo, kto wie, czego mogą się nauczyć?



Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

Spoglądanie przez przezroczysty laptop Lenovo w przyszłość science-fiction

Rok po naprężeniu mięśni badawczo-rozwojowych za pomocą a składany laptop Lenovo, które rozszerzyło swój ekran za pomocą prostego naciśnięcia przycisku, powraca do tematu...

MWC 2024: ThinkPady Lenovo stają się szybsze i łatwiejsze w użyciu

Podczas Laptop ThinkBook z przezroczystym wyświetlaczem Lenovo, które zaprezentowało na MWC 2024, to tylko weryfikacja koncepcji, firma zapowiedziała także odświeżone wersje kilku ThinkPadów...
Advertisment