Generatywna sztuczna inteligencja w przełomowym momencie z falą wyzwań prawnych

Gdziekolwiek teraz spojrzysz, nie da się uniknąć istnienia generatywnej sztucznej inteligencji (AI). Od ChatGPT po twórców obrazów, takich jak Stable Diffusion, branża rozrosła się niemal od zera do globalnego superprzemysłu. Ale nie wszyscy są szczęśliwi. W styczniu 2023 roku firma Getty Images zajmująca się licencjonowaniem obrazów wszczęła postępowanie sądowe przeciwko właścicielom aplikacji do tworzenia obrazów AI Stable Diffusion w związku z rzekomym naruszeniem praw autorskich.

To tylko jedna z rosnącej liczby spraw – w tym skarg prawnych przeciwko obrazowej sztucznej inteligencji Midjounrey I Flagowy Open AI wspierany przez Microsoft – które mogą zadecydować o przyszłości technologii.

Ale te batalie prawne niosą ze sobą coś więcej niż tylko przyszłość generatywnej sztucznej inteligencji i mogą wpłynąć na całą przyszłość sztuki sztucznej inteligencji, tworzenie treści i możliwość kontrolowania sposobu wykorzystywania naszych danych osobowych.

Powody sprawy sądowej są z pozoru dość proste. Getty Images, jako platforma licencjonowania obrazów, pobiera opłatę od użytkowników za dostęp do obrazów lub korzystanie z nich. System ten stanowi poważny problem dla generatywnych systemów sztucznej inteligencji, takich jak ChatGPT lub Stable Diffusion, które polegają na masowym zbieraniu danych w celu nauczenia swoich systemów, jak odpowiadać na monity.

„Trenowanie tych generatywnych modeli sztucznej inteligencji wymaga ogromnych ilości danych” — mówi Laura Houston, ekspertka w dziedzinie prawa autorskiego i partnerka w firmie prawniczej Slaughter and May. „Na przykład w modelach zamiany tekstu na obraz istnieje potrzeba zasilenia go setkami milionów punktów danych, aby nauczyć model znajdowania statystycznych relacji między słowami a obrazami”.

Mówiąc najprościej – jeśli twórca obrazu AI chce dowiedzieć się, jak stworzyć zdjęcie, powiedzmy, kurczaka w cylindrze – musi przestudiować jak najwięcej obrazów kurczaków i cylindrów. Sama skala danych potrzebnych do nauczenia się tej umiejętności uniemożliwia sensowne oddzielenie obrazów chronionych prawem autorskim od obrazów nieobjętych prawem autorskim.

Reklama

„Masz własność intelektualną [IP] ryzyko naruszenia, które wynika z wykorzystania tych danych do uczenia modelu AI” – mówi. „Ale wtedy pojawia się również pytanie, co model AI generuje w wyniku i czy na podstawie danych, na których jest szkolony, dane wyjściowe modelu mogą naruszyć IP tych danych wejściowych”.

To wszystko nie jest tylko ćwiczeniem intelektualnym. Prawo autorskie jest tym, co leży u podstaw zdolności wszystkich artystów i twórców treści do ochrony i kontrolowania, a tym samym faktycznego zarabiania na swojej pracy. Jeśli generatywna sztuczna inteligencja będzie w stanie przejść przez to prosto i wykorzystać swoją pracę do szkolenia swoich systemów, może zyskać, dziesiątkując branże kultury na całym świecie.

Ale kwestie prawne i moralne nie kończą się na prawach autorskich. Generatywna sztuczna inteligencja i duże modele językowe coraz częściej padają ofiarą organów regulacyjnych zajmujących się ochroną danych.

Już zrobił to włoski regulator danych zabronił chatbotowi Replika opartemu na Open AI gromadzenia danych w kraju.

„Publicznie dostępne dane to nadal dane osobowe w rozumieniu RODO [General Data Protection Regulation] oraz inne przepisy dotyczące ochrony danych i prywatności, więc nadal potrzebujesz podstawy prawnej do ich przetwarzania” – mówi Robert Bateman, ekspert ds. ochrony danych. „Problem polega na tym, że nie wiem, ile te firmy o tym myślały… Myślę, że to trochę prawna bomba zegarowa”.

Naruszenia danych osobowych są często również dość dziwne. W zeszłym miesiącu, Dziennikarz FT, Dave Lee, dowiedział się, że ChatGPT podaje jego numer Signal (opublikowany na jego koncie na Twitterze) jako własny numer chatbota, a następnie został zalany losowymi wiadomościami. Według Batemana nawet tego rodzaju publicznie publikowane dane podlegają przepisom o ochronie danych.

„Istnieje coś takiego jak prywatność kontekstowa” — mówi. „Możesz umieścić swój numer na Twitterze i nie oczekiwać, że pojawi się w bazie danych w Chinach. To samo tyczy się ciebie [necessarily] oczekując, że stanie się wyjściem chatbotów. Dokładność danych jest jedną z zasad RODO. Jesteś zobowiązany do upewnienia się, że dane osobowe w Twoich procesach są dokładne i aktualne.

„Ale duże modele językowe najwyraźniej mają halucynacje w około 20% przypadków. Na tej podstawie będzie wiele niedokładnych informacji o dystrybuowanych ludziach”.

Generatywna sztuczna inteligencja w przełomowym momencie z falą wyzwań prawnych

Więcej

Senat ponownie zatwierdza program szpiegowski FISA, ale nie przed jego wygaśnięciem o północy

Przewodnik po Dniu Społeczności Pokémon Go Bellsprout

Co oznacza restrukturyzacja Google dla Pixela i Androida?

ZOSTAW ODPOWIEDŹ Anuluj odpowiedź

Podobne

Najnowsze

Senat ponownie zatwierdza program szpiegowski FISA, ale nie przed jego wygaśnięciem o północy

Przewodnik po Dniu Społeczności Pokémon Go Bellsprout

Co oznacza restrukturyzacja Google dla Pixela i Androida?

Generatywna sztuczna inteligencja w przełomowym momencie z falą wyzwań prawnych

Ustalanie naruszeń

Atrybucja

Więcej

Senat ponownie zatwierdza program szpiegowski FISA, ale nie przed jego wygaśnięciem o północy

Przewodnik po Dniu Społeczności Pokémon Go Bellsprout

Co oznacza restrukturyzacja Google dla Pixela i Androida?

ZOSTAW ODPOWIEDŹ Anuluj odpowiedź

Podobne

Think Tank dotyczący zrównoważonego rozwoju IT: Zrównoważone innowacje kluczem do przejrzystości emisji gazów cieplarnianych

Najnowsze

Senat ponownie zatwierdza program szpiegowski FISA, ale nie przed jego wygaśnięciem o północy

Przewodnik po Dniu Społeczności Pokémon Go Bellsprout

Co oznacza restrukturyzacja Google dla Pixela i Androida?