Były gubernator Arkansas Mike Huckabee należy do grupy autorów pozywających Meta, Microsoft i inne firmy w związku z wykorzystaniem ich pracy do tworzenia narzędzi sztucznej inteligencji.
W pozwie złożonym we wtorek Huckabee i inni autorzy, w tym chrześcijańska pisarka Lysa TerKeurst, utrzymują, że ich książki były pirackie i wykorzystywane w zbiorach danych do trenowania modeli sztucznej inteligencji. W pozwie wymieniono także EleutherAI, grupę badawczą zajmującą się sztuczną inteligencją, podobnie jak Bloomberg.
Proponowany pozew zbiorowy to najnowszy przykład autorów twierdzących, że firmy technologiczne wykorzystywały ich prace bez pozwolenia do szkolenia generatywnych modeli sztucznej inteligencji. W ciągu ostatnich kilku miesięcy szereg popularnych autorów, w tym George’a R.R. MartinaJodi Picoult i Michaela Chabona pozwali OpenAI za naruszenie praw autorskich.
Sprawa Huckabee koncentruje się na kontrowersyjnym zbiorze danych o nazwie „Books3”. zawiera ponad 180 000 dzieł które są częścią zbioru danych używanego do uczenia dużych modeli językowych. W sierpniu, Atlantycki opublikowany przeszukiwalna baza danych wszystkich tytułów w Books3 z informacjami o autorach. Books3 jest częścią większej góry danych zwanej Pile, stworzonej przez EleutherAI, która według pozwu była wykorzystywana przez firmy do szkolenia swoich produktów.
„[Meta and Microsoft] byli w stanie włączyć zaawansowane zbiory danych, które obejmowały pirackie materiały chronione prawem autorskim w Books3, w ramach procesu szkoleniowego LLM, bez konieczności płacenia autorom wynagrodzenia” – czytamy w pozwie.
Microsoft odmówił komentarza w tej sprawie. Meta, Bloomberg i EleutherAI nie odpowiedziały na prośby o komentarz.
Firmy zajmujące się sztuczną inteligencją korzystają z ogromnych ilości danych publicznych do szkolenia modeli sztucznej inteligencji – nie tylko książek, ale także fotografii, dzieł sztuki, muzyki i nie tylko. Ponieważ narzędzia takie jak ChatGPT lub Stable Diffusion stały się łatwo dostępne, wybuchła gorąca debata (i wiele działań prawnych) na temat tego, jak powinny być wynagradzane osoby dostarczające takie dane. W styczniu, Getty Images pozwało firmę stojącą za narzędziem graficznym AI Stable Diffusiontwierdząc, że bezprawnie skopiował miliony obrazów chronionych prawem autorskim w celu wytrenowania swojego modelu.