Игорь Градов

29 июня 2026 г. в 21:45 МСК5 мин

text

Google назвала обучение нейросетей добросовестным использованием: авторское право хотят обойти через opt-out

Google второго июля опубликовала программный документ «Прагматичный подход к управлению ИИ в Америке», в котором назвала обучение нейросетей на открытых веб-данных добросовестным использованием (fair use), а издателям предложила механизмы отказа вместо компенсаций.

Почему это важно

Google впервые собрала свою позицию по авторскому праву в один политический документ и подала его в момент, когда регуляторы в Британии уже обязали поисковик давать ссылки на источники, а американские издатели требуют разрешения до сбора данных, а не после.

Документ называется A Pragmatic Approach to AI Governance in America и вышел 25 июня. По сути, это не новые правила, а сборка прежних тезисов Google в одном месте. Но контекст изменился: британский регулятор CMA (Competition and Markets Authority, орган по защите конкуренции) в июне ввёл требование, дающее сайтам право отказаться от участия в ИИ-выдаче и обязывающее Google указывать источник контента. В США организация Digital Content Next (объединение крупных цифровых издателей) направила Common Crawl Foundation (некоммерческий фонд, собирающий открытые веб-данные для обучения моделей) письмо с требованием прекратить сбор, заявив, что «закон об авторском праве не работает по принципу отказа». Именно на этом фоне Google зафиксировала свою линию.

Что говорит Google: обучение нейросетей и авторское право

Компания сравнивает обучение моделей на публичных данных с тем, как «студент-художник черпает вдохновение, прогуливаясь по галерее». В документе это названо «трансформативным, не экспрессивным использованием», которое должно оставаться под защитой доктрины добросовестного использования в США.

Google предлагает распространить аналогичную защиту на международный уровень через исключения для интеллектуального анализа текстов и данных (text-and-data-mining exceptions).

Для владельцев сайтов, которые не хотят участвовать в обучении, компания рекомендует использовать машиночитаемые команды, в частности директиву Google-Extended в файле robots.txt (файл на сайте, который указывает поисковым роботам, какие страницы можно сканировать, а какие нет).

Если ИИ воспроизведёт существующий контент, Google предлагает не фильтрацию на «степень сходства», а стандартную процедуру «уведомление и удаление» (notice-and-takedown), давно работающую в интернете.

Как защитить свой контент прямо сейчас?

Если вы издатель или автор и хотите ограничить использование ваших материалов для обучения нейросетей, вот что можно сделать уже сегодня.

Что понадобится

Доступ к файлу robots.txt вашего сайта (обычно через хостинг-панель или FTP)
Текстовый редактор (подойдёт даже «Блокнот»)
10 минут времени
Понимание того, что эта мера не гарантирует полную защиту: она работает только с теми ботами, которые уважают robots.txt

Пошаговая инструкция

Откройте файл robots.txt вашего сайта. Он лежит в корневой папке по адресу вашсайт.ru/robots.txt. Если файла нет, создайте его.
Добавьте директиву для Google-Extended. Вставьте в файл следующий блок:

User-agent: Google-Extended
Disallow: /

Это запретит боту Google-Extended (он отвечает за сбор данных для обучения моделей) индексировать любые страницы вашего сайта.

Если хотите закрыть доступ и для других ИИ-ботов, добавьте аналогичные блоки для каждого из них. Например, для бота OpenAI:

User-agent: GPTBot
Disallow: /

Сохраните файл и проверьте, что он доступен по прямой ссылке в браузере.
Следите за обновлениями от CMA и американских регуляторов. Google уже тестирует переключатель отказа от ИИ-выдачи в Британии, но отчёты для издателей пока не содержат данных о кликах.

Как это выглядит на практике

Допустим, вы ведёте авторский блог на собственном домене и не хотите, чтобы ваши тексты использовались для обучения. Вы открываете robots.txt и добавляете блок User-agent: Google-Extended / Disallow: /. После сохранения бот Google-Extended перестаёт собирать страницы вашего сайта. Но старые данные, уже собранные до этого момента, остаются в обучающих выборках. Документ Google не уточняет, удаляются ли они.

Частые ошибки

Путать поисковую индексацию и обучение ИИ. Блокировка Google-Extended не влияет на обычный Googlebot: ваш сайт останется в поиске. Но если заблокируете Googlebot целиком, исчезнете из выдачи.
Считать robots.txt юридической защитой. Это техническая рекомендация, а не закон. Боты, которые не уважают директивы, продолжат сбор. Позиция Digital Content Next как раз в том, что обучение нейросетей и авторское право должны регулироваться разрешением, а не отказом.
Ждать компенсации автоматически. Google упоминает партнёрства с сайтами, которые помогают поддерживать ИИ-ответы актуальными, и платные сделки на доступ к закрытому контенту, но не называет ни программ, ни условий, ни сроков.

Что делать с этим прямо сейчас, по ролям

Автору Дзена и блогеру: если ваш контент живёт на платформе Дзена, вы не управляете robots.txt напрямую. Следите за тем, какие настройки предоставит сама платформа. На собственном сайте, действуйте по инструкции выше.

Маркетологу и редактору медиа: документ Google не содержит обязательств по компенсации или атрибуции в США. Но решение CMA в Британии уже идёт дальше: требует указания источника. Если вы работаете с англоязычной аудиторией, учитывайте разницу юрисдикций.

Издателю и предпринимателю в РФ: российское законодательство об авторском праве не содержит аналога доктрины fair use в американском понимании. Позиция Google формально касается только США, но фактически определяет, как обучающие данные (training data, массивы текстов и медиа, на которых учится модель) собираются по всему миру. В России «Яндекс» и другие компании пока не публиковали аналогичных программных документов, но вопрос стоит так же остро.

Совет редакции dzen.guru

Google собрала свои прежние аргументы в один текст и подала его как политическую позицию, не как продуктовое обязательство. Партнёрства, платные сделки, новые способы создания ценности для издателей: всё это упомянуто без единой цифры, срока или названия программы. Я бы не рассматривал этот документ как обещание, а воспринимал как переговорную рамку: компания фиксирует максимально удобную для себя позицию перед тем, как регуляторы примут решения. Для автора и издателя практический вывод один: не ждите, что кто-то защитит ваш контент за вас. Ставьте технические ограничения сейчас, следите за регуляторными новостями и документируйте свои публикации с датами, это пригодится при любом развитии событий.

Проверьте, как ИИ видит ваш контент

Инструменты dzen.guru помогают авторам анализировать, как их тексты работают в новой среде поиска.

Попробовать бесплатно

Две вещи стоит отслеживать в ближайшие месяцы: появятся ли у Google конкретные программы и условия тех самых «платных партнёрств», о которых документ говорит без деталей, и как американские суды отреагируют на позицию издателей, которые настаивают на разрешении до сбора данных, а не на отказе после.

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Reddit и ИИ: бренды засевают треды ради цитирования, но фильтр неизбежен

Reddit стал одним из главных источников, которые цитируют ИИ-модели в своих ответах, и вокруг этого уже выросла целая индустрия: компании покупают старые…

29 июня в 22:15 МСК5 мин

text

Внутренние ссылки и СЕО: как найти утечку веса и вернуть трафик за 4 часа

Внутренние ссылки на сайте со временем теряют силу незаметно: новые страницы оттягивают вес, редизайн меняет навигацию, а старые ссылки ведут через цепочки…

29 июня в 19:15 МСК6 мин

text

ИИ как замена людей: 0 из 160 компаний подтвердили увольнения, но страх убивает продажи

Почему это важно Два независимых исследования в США показали: ни одна компания из 160 не указала ИИ причиной увольнений, а экономического эффекта вытеснения…

29 июня в 18:00 МСК5 мин

Google назвала обучение нейросетей добросовестным использованием: авторское право хотят обойти через opt-out

Что говорит Google: обучение нейросетей и авторское право

Как защитить свой контент прямо сейчас?

Что понадобится

Пошаговая инструкция

Что делать с этим прямо сейчас, по ролям

Проверьте, как ИИ видит ваш контент

Комментарии

Читайте также

Reddit и ИИ: бренды засевают треды ради цитирования, но фильтр неизбежен

Внутренние ссылки и СЕО: как найти утечку веса и вернуть трафик за 4 часа

ИИ как замена людей: 0 из 160 компаний подтвердили увольнения, но страх убивает продажи