Юридическая битва между правообладателями и технологическими гигантами набирает обороты. Компания NVIDIA официально ответила на обвинения в использовании пиратского контента из библиотеки Anna’s Archive для обучения своих языковых моделей. Позиция NVIDIA категорична: наличие контактов или упоминаний ресурса не является доказательством кражи интеллектуальной собственности.

Группа авторов и издателей подала коллективный иск, утверждая, что NVIDIA использовала набор данных под названием Books3. Этот датасет содержит почти 200 000 книг, многие из которых были получены нелегальным путем через «Архив Анны». Истцы заявляют, что без этой огромной базы знаний нейросети компании не смогли бы достичь такого высокого уровня грамотности и понимания контекста.

В своем официальном заявлении в суде представители NVIDIA утверждают, что истцы не предоставили прямых доказательств того, что конкретные защищенные авторским правом произведения были «проглочены» ИИ в процессе обучения. Тот факт, что сотрудники NVIDIA могли связываться с представителями архива или обсуждать датасет Books3, не означает, что эти данные в итоге вошли в финальную версию обучающей выборки для таких моделей, как NeMo.

Юристы компании продолжают настаивать на том, что обучение ИИ на существующих данных является “трансформационным использованием”, которое не нарушает закон об авторском праве, так как создает новый продукт, а не копирует оригинал. Nvidia активно отвергает утверждения о том, что их модели обучались на пиратских книгах. Юристы компании в федеральном суде Калифорнии заявили, что предполагаемые контакты Nvidia с библиотекой пиратского сайта Anna’s Archive не могут являться доказательством нарушения авторских прав.

В своем ходатайстве об отклонении иска, компания заявляет, что аргументы авторов дела «Nazemian против Nvidia» не могут доказать, что их работы использовались в обучении ИИ-моделей Nvidia, несмотря на расширенные жалобы со стороны истцов за счет включения новых предложений и наборов данных. Nvidia утверждает, что в измененном исковом заявлении отсутствуют даже самые основные элементы, необходимые для предъявления иска о нарушении авторских прав.

«Истцы не приводят фактов, свидетельствующих о том, что Nvidia скопировала какие-либо из их защищенных авторским правом произведений, когда такое копирование имело место или какие модели Nvidia предположительно содержат эти произведения», — заявили представители компании.

На этом компания не остановилась, а начала критиковать истцов за то, что они полагаются на утверждения, сделанные на основании разговоров и убеждений. Nvidia заявляет, что таким образом истцы неправомерно пытаются использовать процесс раскрытия информации в качестве основы искового заявления. Компания, в своем ходатайстве, напоминает суду, что истцы по делам о нарушении авторских прав обязаны заявлять о нарушении до начала процесса раскрытия информации, а не полагаться на него для определения того, было ли нарушение вообще или нет.

Кроме того, Nvidia стремится сузить рамки дела, оспаривая информацию о включении дополнительных наборов данных и моделей, таких как Megantron 345M. Компания утверждает, что истцы неправомерно объединяют несколько вещей в одном деле, не объясняя при этом, как та или иная модель обучалась на их работах. В нескольких случаях Nvidia ссылается на собственную документацию, которая находится в общем доступе, для показания противоречий в словах истцов. Слушанье по этому ходатайству назначено на 2 апреля 2026 года.

От Дмитрий Соколов

Гик-писака🤓