Теневая сделка: Nvidia планировала обучать ИИ на миллионах пиратских книг
Корпорация Nvidia, мировой лидер в производстве графических процессоров и разработке технологий искусственного интеллекта, оказалась в эпицентре юридического скандала. Согласно коллективной жалобе, поданной группой авторов, компания в погоне за конкурентными преимуществами сознательно пошла на сделку с теневой интернет-библиотекой Anna’s Archive с целью получения доступа к миллионам пиратских книг для обучения своих больших языковых моделей (LLM).
В жалобе подробно описывается, что представители Nvidia, «испытывая конкурентное давление» на стремительно растущем рынке ИИ, вышли на операторов Anna’s Archive. Предметом переговоров стала возможность предоставления Nvidia высокоскоростного доступа к гигантской коллекции нелегально оцифрованных произведений.
Согласно иску, операторы Anna’s Archive прямо предупредили Nvidia о незаконном характере происхождения и поддержания своей библиотеки. Они запросили у компании официальное подтверждение того, что сделка получила внутреннее одобрение. Истцы утверждают, что такое одобрение от руководства Nvidia было получено в течение недели, что, по их мнению, свидетельствует о сознательном и умышленном нарушении авторских прав ради коммерческой выгоды.
После получения «зелёного света» Anna’s Archive предоставила Nvidia доступ к данным общим объёмом около 500 ТБ. Этот массив информации включал миллионы книг, значительная часть которых обычно доступна легально только через систему цифровой выдачи Internet Archive. Авторы настаивают, что их произведения были использованы для тренировки ИИ-моделей без какого-либо разрешения, лицензионных отчислений или компенсации, а Nvidia извлекла из этого прямую коммерческую выгоду.
Данный иск ставит под вопрос этические и юридические границы сбора данных для обучения искусственного интеллекта. Успех или провал этого коллективного иска может создать важный прецедент, который определит, насколько компании-разработчики ИИ могут использовать общедоступные, но нелегальные источники информации в своей гонке технологий.