Интернет-архив часто служил ценным ресурсом для журналистов: от поиска записей удаленных твитов до предоставления академических текстов для фоновых исследований. Однако появление ИИ породило новое напряжение между сторонами. Несколько крупных изданий начали блокировать доступ некоммерческой цифровой библиотеки к своему контенту, опасаясь, что боты ИИ-компаний используют коллекции Интернет-архива для косвенного сбора их статей.
«Многие из этих ИИ-бизнесов ищут готовые, структурированные базы данных контента, — заявил Роберт Хан, глава по деловым вопросам и лицензированию The Guardian, — Nieman Lab. — API Интернет-архива был бы очевидным местом, куда можно было бы подключить свои машины и вытянуть IP».
The New York Times предприняла аналогичный шаг. «Мы блокируем бота Интернет-архива от доступа к Times, потому что Wayback Machine предоставляет беспрепятственный доступ к контенту Times — в том числе для ИИ-компаний — без разрешения», — подтвердил представитель газеты Nieman Lab. Издание Financial Times, ориентированное на подписку, и социальный форум Reddit также предприняли шаги по избирательной блокировке каталогизации их материалов Интернет-архивом.
Многие издатели пытались подать в суд на ИИ-бизнесы за то, как они получают доступ к контенту, используемому для обучения больших языковых моделей. Например, только из сферы журналистики:
-
The New York Times подала в суд на OpenAI и Microsoft
-
Центр журналистских расследований подал в суд на OpenAI и Microsoft
-
The Wall Street Journal и New York Post подали в суд на Perplexity
-
Группа издателей, включая The Atlantic, The Guardian и Politico, подала в суд на Cohere
-
Penske Media подала в суд на Google
-
The New York Times и Chicago Tribune подали в суд на Perplexity
Другие СМИ искали финансовые соглашения, прежде чем предлагать свои библиотеки в качестве обучающего материала, хотя такие договоренности, похоже, обеспечивают компенсацию издательским компаниям, а не авторам. И это даже не касаясь вопросов авторского права и пиратства, с которыми также борются другие творческие сферы против ИИ-инструментов: от писателей-фантастов до художников до музыкантов. Вся статья Nieman Lab стоит того, чтобы ее прочитал каждый, кто следил за реакцией каких-либо творческих индустрий на искусственный интеллект.
