Aplikacja do synchronizacji ruchu warg Wombo pokazuje niechlujny, pełen memów potencjał deepfakes


Prawdopodobnie widziałeś już wideo Wombo krążące w twoich mediach społecznościowych. Może tak było Ryu z uliczny wojownik śpiewanie „Szamana” lub ostatniego trzech szefów Rezerwy Federalnej Stanów Zjednoczonych naśladując jednocześnie „Never Going to Give You Up” Ricka Astleya. Każdy klip zawiera przesadną mimikę i niesamowite, czasem koszmarne animacje. Są głupie, zabawne i oferują przydatne spojrzenie na obecny stan deepfakes.

Z pewnością coraz szybciej i łatwiej jest tworzyć podróbki generowane przez sztuczną inteligencję, ale im bardziej są one przekonujące, tym więcej pracy potrzeba. Realistyczne głębokie podróbki Toma Cruise’a, które stały się wirusowe na przykład na TikTok, wymagały doświadczonego artysty VFX, odtwórcy najwyższej klasy i tygodnie przygotowań do ściągnięcia. Dla porównania podróbki jednym kliknięciem, które można stworzyć przy zerowym wysiłku i wiedzy, nadal wyglądają jak te wykonane przez aplikację Wombo i będą tak wyglądać w najbliższej przyszłości. Przynajmniej na krótką metę deepfakes będą oczywiście sfabrykowane i natychmiastowe przynęty memów.

Aplikacja Wombo została uruchomiona pod koniec zeszłego miesiąca z Kanady po krótkim procesie rozwoju. „W sierpniu 2020 roku wpadłem na pomysł, żeby Wombo palić jointa z moim współlokatorem na dachu” – mówi twórca aplikacji i dyrektor generalny Wombo, Ben-Zion Benkhin The Verge. Wydanie produktu było „ogromną radością” – mówi. „Śledziłem przestrzeń AI, podążałem za przestrzenią memów, podążałem za fałszywą przestrzenią i właśnie zobaczyłem okazję, aby zrobić coś fajnego”. Benkhin szacuje, że w ciągu zaledwie kilku tygodni aplikacja została pobrana około 2 milionów razy.

Wombo jest darmowe i łatwe w użyciu. Po prostu zrób zdjęcie swojej twarzy lub prześlij zdjęcie z rolki aparatu i naciśnij przycisk, aby zsynchronizować obraz z jedną z kilku sąsiadujących z memami piosenek. Oprogramowanie aplikacji będzie działać magicznie na wszystkim, co nawet niejasno przypomina twarz, i na wielu rzeczach, które nie są. Chociaż podobne aplikacje w przeszłości były uparte obawy o prywatność, Benkhin jest nieugięty, dane użytkowników są bezpieczne. „Traktujemy prywatność naprawdę poważnie” – mówi. „Wszystkie dane są usuwane, a my ich nie udostępniamy ani nie wysyłamy nikomu innemu”.

Nazwa aplikacji pochodzi od slang sportowy, konkretnie Super Smash Bros. Melee. „Jeśli gracz wyląduje jak szalona kombinacja, rzucający zaczną krzyczeć„ Wombo Combo! Wombo Combo! ”” Mówi Benkhin. Wombo udowodnił, że jest wierny tym początkom szczególnie popularne wśród graczy którzy używali go do animowania postaci z tytułów takich jak League of Legends, Fallout: New Vegas, i Era Smoka. „Zacząłem się trochę zagłębiać [the origins of the slang]”- mówi Benkhin -„ i najwyraźniej było miejsce na pizzę, od którego wszystko się zaczęło, gdzie na całą pizzę nakładali mnóstwo dodatków i nazywali to Wombo Combo ”.

Benkhin mówi, że aplikacja działa poprzez morfowanie twarzy przy użyciu predefiniowanej choreografii. On i jego zespół nakręcili podstawowe wideo do każdej piosenki w swoim studio („który tak naprawdę jest tylko pokojem w moim mieszkaniu”), a następnie wykorzystali je do animacji każdego obrazu. „Kradniemy ruchy ich twarzy i nanosimy je na Twoje zdjęcie” – mówi. Aplikacja jest również przykładem dynamicznego świata badań nad sztuczną inteligencją, w którym nowe techniki mogą stać się produktami konsumenckimi w ciągu kilku tygodni. Benkhin zauważa, że ​​oprogramowanie jest zbudowane „na podstawie istniejącej pracy”, ale z kolejnymi poprawkami i ulepszeniami, które sprawiają, że jest to „nasz własny zastrzeżony model”.

Reklama

Obecnie Wombo oferuje tylko 14 krótkich klipów piosenek do synchronizacji z ustami, ale Benkhin mówi, że wkrótce planuje rozszerzyć te opcje. Na pytanie, czy aplikacja ma odpowiednie licencje na wykorzystywaną przez nią muzykę, powstrzymuje się od odpowiedzi, ale mówi, że zespół nad nią pracuje.

Jednak podobnie jak w przypadku TikTok, wydaje się, że zasięg oferowany przez Wombo może pomóc złagodzić obawy posiadaczy licencji o prawa. Do Wombo zwrócili się już artyści, którzy chcą umieścić swoją muzykę w aplikacji, mówi Benkhin, i prawdopodobnie może to zaoferować strumień przychodów oprócz obecnego poziomu premium (który płaci za priorytetowe przetwarzanie i brak reklam w aplikacji). „To da [artists] zupełnie nowy sposób angażowania odbiorców ”- mówi. „Daje im to nowe narzędzie marketingu wirusowego”.

Wombo nie jest pierwszą aplikacją, która wykorzystuje uczenie maszynowe do tworzenia szybkich i przyjemnych deepfake’ów. Inne obejmują ReFace i FaceApp. Ale to najnowszy przykład tego, co będzie coraz bardziej widocznym trendem, ponieważ aplikacje deepfake stają się najnowszymi szablonami memów, umożliwiając użytkownikom łączenie ulubionych postaci, popularnych piosenek, tańców choreograficznych, postaci publicznych i wielu innych. Przyszłość deepfake’ów z pewnością zostanie zapamiętana.





Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

Poważny problem BSOD systemu Windows powoduje, że banki, linie lotnicze i nadawcy są offline

Tysiące komputerów z systemem Windows doświadczają dziś problemu z niebieskim ekranem śmierci (BSOD) podczas rozruchu, co wpływa na banki, linie lotnicze, nadawców telewizyjnych,...

OpenAI prowadzi rozmowy z Broadcom na temat opracowywania niestandardowych układów AI do zasilania modeli nowej generacji

Według InformacjaOpenAI podobno prowadzi rozmowy z Broadcom na temat opracowania niestandardowego akceleratora AI, który zaspokoi rosnące zapotrzebowanie OpenAI na rozwiązania o wysokiej wydajności....

Dokumenty regulacyjne firmy Acer ujawniają karty graficzne Radeon RX 7900, RX 7800 i RX 7700 bez układów XT

Dokumenty regulacyjne głównego producenta komputerów PC, Acer, wraz z Eurazjatycką Komisją Gospodarczą (EEC), porzucają niektóre z pierwszych odniesień do trzech nadchodzących modeli kart...
Advertisment