Nowe badania AI umożliwiają klikanie i przeciąganie obrazów w celu manipulowania nimi w ciągu kilku sekund

Nie, to jeszcze nie koniec: możliwości narzędzi AI do manipulowania obrazami wciąż rosną. Najnowszy przykład to na razie tylko praca naukowa, ale bardzo imponująca, pozwalająca użytkownikom po prostu przeciągnąć elementy obrazu, aby zmienić ich wygląd.

Na pierwszy rzut oka nie brzmi to zbyt ekscytująco, ale spójrz na poniższe przykłady, aby zorientować się, co potrafi ten system.

Nie tylko możesz zmienić wymiary samochodu lub zamienić uśmiech w zmarszczenie brwi jednym kliknięciem i przeciągnięciem, ale możesz także obrócić obiekt zdjęcia tak, jakby był modelem 3D — na przykład zmieniając kierunek, w którym ktoś jest zwrócony. Jedna demonstracja pokazuje nawet, jak użytkownik dopasowuje odbicia na jeziorze i wysokości pasma górskiego za pomocą kilku kliknięć.

Oto przegląd różnych tematów:

Oto bliższe spojrzenie na manipulację krajobrazem:

I tak dla zabawy, bawiąc się z lwami:

Reklama

Te filmy pochodzą z strona zespołu badawczegochociaż zdarzało się, że ulegało to awariom ze względu na duży ruch wysyłany do witryny przez Twittera (głównie przez użytkownika @_akhaliq, który wykonuje fantastyczną robotę, podkreślając interesujące dokumenty AI i jest wart obserwowania, jeśli Cię to interesuje). Możesz także przeczytać artykuł badawczy na temat arXiv tutaj.

Jak zauważa odpowiedzialny zespół, tym, co jest naprawdę interesujące w tej pracy, niekoniecznie jest manipulacja obrazem jako taki, ale interfejs użytkownika. Od jakiegoś czasu możemy używać narzędzi sztucznej inteligencji, takich jak GAN, do generowania realistycznych obrazów, ale większości metod brakuje elastyczności i precyzji. Możesz powiedzieć generatorowi obrazów AI, aby „zrobił zdjęcie lwa prześladującego sawannę”, a otrzymasz jeden, ale może to nie być dokładny pozować, którą chcesz lub potrzebujesz.

Ten model, nazwany DragGAN, oferuje jasne rozwiązanie tego problemu. Interfejs jest dokładnie taki sam, jak tradycyjne wypaczanie obrazu, ale zamiast po prostu rozmazywać i miażdżyć istniejące piksele, model generuje obiekt na nowo. Jak piszą badacze: „[O]Twoje podejście może wywołać halucynacje zasłoniętej treści, jak zęby w paszczy lwa, i może odkształcić się pod wpływem sztywności obiektu, jak zgięcie nogi konia”.

Oczywiście na razie jest to tylko demo i nie można całkowicie ocenić technologii. (Na przykład, jak realistyczne są obrazy końcowe? Trudno powiedzieć na podstawie dostępnych filmów o niskiej rozdzielczości). Ale to kolejny przykład ułatwienia manipulacji obrazami.

Source link

Poprzedni artykuł

HEAD akustyka ogłasza zmiany w zarządzie po ogłoszeniu przejścia na emeryturę Hansa Gierlicha

Następny artykuł

ASUS przedstawia klawiaturę Marshmallow KW100

ZOSTAW ODPOWIEDŹ Anuluj odpowiedź

Proszę wpisać swój komentarz!

Proszę podać swoje imię tutaj

Wpisałeś nieprawidłowy adres e-mail!

Wpisz tutaj swój adres e-mail

Nowe badania AI umożliwiają klikanie i przeciąganie obrazów w celu manipulowania nimi w ciągu kilku sekund

Więcej

ZOSTAW ODPOWIEDŹ Anuluj odpowiedź

Podobne

Najnowsze

Zuckerberg: Meta zajmie lata, zanim zacznie zarabiać na generatywnej sztucznej inteligencji

Opcja testowania wątków umożliwiająca użytkownikom automatyczne archiwizowanie starych postów

Kiedy wychodzi Manor Lords?