Po zawarciu umów z Google i OpenAIDyrektor generalny Reddita, Steve Huffman, apeluje do Microsoftu i innych firm o zapłatę, jeśli chcą nadal gromadzić dane z serwisu.
„Bez tych umów nie mamy nic do powiedzenia ani wiedzy na temat tego, jak nasze dane są wyświetlane i do czego są wykorzystywane, co postawiło nas teraz w sytuacji blokowania osób, które nie były skłonne do pogodzenia się z tym, jak chcielibyśmy, aby nasze dane były wykorzystywane lub nie” – powiedział Huffman w wywiadzie w tym tygodniu. Wymienił konkretnie Microsoft, Anthropic i Perplexity za odmowę negocjacji, mówiąc, że blokowanie tych firm było „naprawdę uciążliwe”.
Reddit zaostrzył swoją walkę z crawlerami w ostatnich miesiącach. Na początku lipca plik robots.txt został zaktualizowany aby zablokować roboty sieciowe, z którymi nie ma umów. Wtedy ludzie zaczęli zauważać że wyniki wyszukiwania w serwisie Reddit były widoczne tylko w wynikach wyszukiwania Google — gdzie Reddit otrzymuje wynagrodzenie za wyświetlanie swoich danych — a nie w innych wyszukiwarkach, takich jak Bing.
Huffman powiedział, że Microsoft używa danych Reddita do trenowania swojej sztucznej inteligencji i podsumowywania jej treści w wynikach wyszukiwania Bing „bez informowania nas o tym” oraz że dane Reddita zostały również sprzedane za pośrednictwem interfejsu API Bing innym wyszukiwarkom. W wywiadzie odniósł się do niedawnego komentarza CEO Microsoft AI Mustafy Suleymana na konferencji, że publiczne dane w internecie jest „freeware”.
„Microsoft, Anthropic i Perplexity zachowywali się tak, jakby cała zawartość internetu była dla nich bezpłatna” – powiedział Huffman. „To jest ich prawdziwe stanowisko”.
W odpowiedzi na niedawne zniknięcie wyników wyszukiwania Reddit z wyszukiwarki Bing, szef działu wyszukiwania w firmie Microsoft, Jordi Ribas, powiedział na X że „Reddit zablokował Bingowi możliwość indeksowania ich witryny w celu wyszukiwania, faworyzując inną wyszukiwarkę i wpływając na konkurencję ze strony Binga i wyszukiwarek opartych na Bingu”. Rzeczniczka Microsoftu Caitlin Roulston opowiedziano oddzielnie Skraj zeszły tydzień że „przestrzegamy wytycznych stron internetowych, które nie chcą, aby treści na ich stronach były wykorzystywane w naszych generatywnych modelach sztucznej inteligencji”.
„Tradycyjna wymiana wartości w wyszukiwarkach uległa zmianie”
Huffman wskazał na OpenAI ostatnie ogłoszenie SearchGPTktóry będzie mógł pokazać wyniki Reddita dzięki umowie, którą obie firmy zawarły wcześniej w tym roku, jako model, który chce powielić. Żadna z umów licencyjnych na treści, jakie Reddit zawarł do tej pory, nie obejmuje wyłącznych przypadków użycia jego danych, według rzecznika Tima Rathschmidta.
Wzywając do zawierania umów licencyjnych, Reddit dołączając do większej liczby wydawców mediów tradycyjnych (w tym The Verge jest spółka macierzysta, Vox Media) w celu uzyskania zapłaty za umożliwienie przesyłania ich treści do generatywnej sztucznej inteligencji. „Myślę, że tradycyjna wymiana wartości między wyszukiwarkami uległa zmianie” — powiedział Huffman. „Wyszukiwanie, podsumowywanie i szkolenie łączą się, a wymiana wartości indeksowania w zamian za ruch powrotny staje się niejasna”.
Rzecznicy Microsoftu, Anthropic i Perplexity nie skomentowali tego artykułu do czasu publikacji.