Nowe badania AI umożliwiają klikanie i przeciąganie obrazów w celu manipulowania nimi w ciągu kilku sekund


Nie, to jeszcze nie koniec: możliwości narzędzi AI do manipulowania obrazami wciąż rosną. Najnowszy przykład to na razie tylko praca naukowa, ale bardzo imponująca, pozwalająca użytkownikom po prostu przeciągnąć elementy obrazu, aby zmienić ich wygląd.

Na pierwszy rzut oka nie brzmi to zbyt ekscytująco, ale spójrz na poniższe przykłady, aby zorientować się, co potrafi ten system.

Nie tylko możesz zmienić wymiary samochodu lub zamienić uśmiech w zmarszczenie brwi jednym kliknięciem i przeciągnięciem, ale możesz także obrócić obiekt zdjęcia tak, jakby był modelem 3D — na przykład zmieniając kierunek, w którym ktoś jest zwrócony. Jedna demonstracja pokazuje nawet, jak użytkownik dopasowuje odbicia na jeziorze i wysokości pasma górskiego za pomocą kilku kliknięć.

Oto przegląd różnych tematów:

Oto bliższe spojrzenie na manipulację krajobrazem:

I tak dla zabawy, bawiąc się z lwami:

Reklama

Te filmy pochodzą z strona zespołu badawczegochociaż zdarzało się, że ulegało to awariom ze względu na duży ruch wysyłany do witryny przez Twittera (głównie przez użytkownika @_akhaliq, który wykonuje fantastyczną robotę, podkreślając interesujące dokumenty AI i jest wart obserwowania, jeśli Cię to interesuje). Możesz także przeczytać artykuł badawczy na temat arXiv tutaj.

Jak zauważa odpowiedzialny zespół, tym, co jest naprawdę interesujące w tej pracy, niekoniecznie jest manipulacja obrazem jako taki, ale interfejs użytkownika. Od jakiegoś czasu możemy używać narzędzi sztucznej inteligencji, takich jak GAN, do generowania realistycznych obrazów, ale większości metod brakuje elastyczności i precyzji. Możesz powiedzieć generatorowi obrazów AI, aby „zrobił zdjęcie lwa prześladującego sawannę”, a otrzymasz jeden, ale może to nie być dokładny pozować, którą chcesz lub potrzebujesz.

Ten model, nazwany DragGAN, oferuje jasne rozwiązanie tego problemu. Interfejs jest dokładnie taki sam, jak tradycyjne wypaczanie obrazu, ale zamiast po prostu rozmazywać i miażdżyć istniejące piksele, model generuje obiekt na nowo. Jak piszą badacze: „[O]Twoje podejście może wywołać halucynacje zasłoniętej treści, jak zęby w paszczy lwa, i może odkształcić się pod wpływem sztywności obiektu, jak zgięcie nogi konia”.

Oczywiście na razie jest to tylko demo i nie można całkowicie ocenić technologii. (Na przykład, jak realistyczne są obrazy końcowe? Trudno powiedzieć na podstawie dostępnych filmów o niskiej rozdzielczości). Ale to kolejny przykład ułatwienia manipulacji obrazami.





Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

Zuckerberg: Meta zajmie lata, zanim zacznie zarabiać na generatywnej sztucznej inteligencji

Trwa gorączka złota generatywnej sztucznej inteligencji – nie należy się jednak spodziewać, że w najbliższym czasie przyniesie ona zyski.Firma jest już całkiem rentowna,...

Opcja testowania wątków umożliwiająca użytkownikom automatyczne archiwizowanie starych postów

Meta eksperymentowała z wieloma nowymi funkcjami Threads, swojej platformy mikroblogowania. Teraz szef Instagrama Adam Mosseri ujawnił w środę, że platforma rozpoczęła testowanie...

Kiedy wychodzi Manor Lords?

Panowie dworscy to średniowieczna gra polegająca na budowaniu miast i zarządzaniu, opracowywana w całości przez jednoosobowy zespół (nazywa się Greg...
Advertisment