Игорь Градов
Игорь Градов
5 мин
ai

Claude Code и урок Fable 5: четыре дня от релиза до отзыва обнажили риски закрытых ИИ

Claude Code от Anthropic показал на примере Fable 5, как четырёхдневный жизненный цикл передовой модели обнажает системную уязвимость любого продакшен-стека, построенного поверх закрытого ИИ-сервиса.

Claude Code и урок Fable 5: четыре дня от релиза до отзыва обнажили риски закрытых ИИ
Почему это важно

Anthropic выкатила и отозвала свою сильнейшую публичную модель за четыре дня, а между релизом и отключением обнаружилась невидимая деградация ответов, утечка системного промпта (набора внутренних инструкций модели) и принудительное хранение данных на 30 дней. Для каждого, кто строит продукт поверх стороннего ИИ через API (программный интерфейс), это не драма, а инженерный кейс.

Автор разбора на Хабре восстановил хронологию инцидента с Claude Fable 5 и показал, что проблема не в конкретной модели, а в архитектуре зависимости. Когда ваш продакшен-стек опирается на закрытую модель, которую провайдер может заменить, урезать или отключить без предупреждения, классические приёмы управления зависимостями перестают работать. Fable 5 просто сжал этот сценарий до четырёх дней вместо пары лет.

Показатель Значение Источник
Дата релиза Fable 5 9 июня Anthropic, релиз
Дата отзыва доступа 12 июня Anthropic
Цена Fable 5 (вход) $10 за 1 млн токенов Anthropic, релиз
Цена Fable 5 (выход) $50 за 1 млн токенов Anthropic, релиз
Размер утёкшего системного промпта 1585 строк, около 117 КБ Архив на GitHub, файл CLAUDE-FABLE-5.md
Хранение данных для моделей класса Mythos 30 дней Claude Help Center
Уязвимости, найденные Mythos Preview 27-летняя в OpenBSD, 16-летняя в FFmpeg, цепочка в ядре Linux Anthropic, Project Glasswing

Что именно произошло с Fable 5?

Anthropic 9 июня выпустила Claude Fable 5, публичную версию с защитными механизмами. Одновременно существовала Mythos 5, та же базовая модель, но с частично снятыми ограничениями для доверенных организаций через программу Project Glasswing.

В релизе Anthropic описала механизм переключения на запасную модель: если классификаторы (автоматические фильтры безопасности) ловят запросы по кибербезопасности, биологии, химии или дистилляции моделей (извлечению знаний из одной модели в другую), ответ передаётся Claude Opus 4.8, и пользователь должен видеть факт переключения.

На бумаге всё выглядело разумно. Проблема вскрылась в другом месте.

Невидимая деградация опаснее явного отказа

Издание WIRED 10 июня сообщило, что Anthropic изначально выбрала другой режим: невидимо ухудшать ответ, если система решит, что пользователь применяет Fable для разработки конкурирующей модели. После критики Anthropic заявила WIRED, что «выбрала неправильный компромисс», и пообещала сделать ограничения видимыми.

Автор разбора формулирует инженерную суть: если модель отказывается, отказ можно обработать в коде. Если модель переключается на другую и сообщает об этом, факт можно записать в лог. А если модель молча становится хуже, разработчик дебажит не свой код и не свой промпт, а чужое скрытое правило, к которому нет ни логов, ни доступа.

Для тех, кто использует Claude Code или любой другой инструмент Anthropic в рабочих проектах, это ключевой урок: невидимая деградация неотличима от собственной ошибки.

Что на самом деле утекло?

Вокруг Fable 5 разгорелась отдельная история: пользователь Pliny опубликовал в X пост о том, что «хакеры взломали Fable и вытащили системный промпт». Файл действительно появился на GitHub.

Автор разбора прочитал все 1585 строк и пришёл к выводу: это не веса модели и не обучающие данные, а продуктовый промпт, слой инструкций для конкретной поверхности Claude.ai. Там инструкции не про «как думать», а про «как работать в приложении».

Аналогия автора точная: слить настройки расширения для редактора кода не то же самое, что получить исходники компилятора. Путать системный промпт с весами модели и обучающими данными, всё равно что путать обёртку шоколадки с какао-бобами.

Девять аргументов, половина вне вашего контроля

Главный технический вывод из утечки: современная модель в продукте давно не чистая функция «промпт даёт ответ». Автор показывает, что реальный вызов включает контекст аккаунта, точку входа (Claude.ai, API, Claude Code, облачный провайдер), состояние памяти, включённые инструменты, классификаторы безопасности, регион, тарифный план и текущую политику провайдера.

Когда вы говорите «Claude ответил плохо», вопросов уже не один, а как минимум девять. И половину параметров вы не контролируете.

Что делать с этим прямо сейчас?

Авторам Дзена и копирайтерам. Если вы пишете тексты через Claude Code или веб-интерфейс Anthropic, закладывайте в процесс проверку качества на выходе, а не доверие к стабильности модели. Вчерашний промпт может давать другой результат сегодня не из-за вашей ошибки, а из-за невидимого переключения на стороне сервиса.

Разработчикам и техническим предпринимателям. Проектируйте стек так, чтобы замена модели не ломала продукт. Абстрагируйте слой вызова модели, храните логи ответов с метаданными (какая модель, какая точка входа, был ли факт переключения), пишите тесты на качество выхода, а не на конкретную модель.

Тем, кто работает в РФ и СНГ. Доступ к моделям Anthropic в России и так ограничен, но урок универсален. Аналогичный риск существует с любым закрытым API, включая доступные в регионе YandexGPT и GigaChat: провайдер может изменить поведение модели без уведомления. Прослойка абстракции и собственные тесты качества нужны независимо от поставщика.

Мнение редакции dzen.guru

Этот инцидент, пожалуй, лучшая иллюстрация того, о чём мы в dzen.guru говорим давно: не привязывайтесь к конкретной модели. Fable 5 прожил четыре дня. Но даже если модель живёт год, невидимая деградация ответов, о которой писал WIRED, может случиться в любой момент с любым закрытым сервисом. Единственная надёжная страховка: абстракция на уровне архитектуры, набор тестов на качество выхода и готовность переключиться на альтернативу за часы, а не за недели. Для авторов это проще, чем кажется: сохраняйте удачные промпты в отдельном файле и периодически прогоняйте их через разные модели, чтобы понимать, где вы зависите от конкретного поставщика, а где промпт работает универсально.

Ограничения разбора

Анализ построен на одном авторском разборе и открытых источниках (релиз Anthropic, публикация WIRED, архив на GitHub). Полная внутренняя хронология решений Anthropic не раскрыта. Утёкший файл системного промпта не верифицирован Anthropic как подлинный. Выводы об архитектуре стека, авторские рекомендации, а не документированные стандарты индустрии.

Четыре дня жизни Fable 5 показали не слабость конкретной модели, а хрупкость архитектуры, где критический компонент вам не принадлежит и может исчезнуть между утренним кофе и обедом. Кто проектирует стек с учётом этого сценария уже сейчас, тот не будет дебажить чужие невидимые решения в три ночи.

По материалам Habr ML

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

IPO SpaceX: когда начнутся торги и почему $75 млрд побили рекорд втрое
ai

IPO SpaceX: когда начнутся торги и почему $75 млрд побили рекорд втрое

SpaceX второго июня оценила свои акции в 135 долларов за штуку и привлекла 75 миллиардов долларов от андеррайтеров, оформив крупнейшее первичное размещение в…

5 мин
Неделя на один комикс: какие LLM проблемы вскрыл эксперимент с ChatGPT
ai

Неделя на один комикс: какие LLM проблемы вскрыл эксперимент с ChatGPT

Автор из сообщества Habr неделю бился с генерацией комикса через бесплатный ChatGPT и подробно задокументировал каждый промпт и каждый провал, показав на…

5 мин
IPO SpaceX уже в пятницу: когда нижние слои SPV получат акции и получат ли вообще
ai

IPO SpaceX уже в пятницу: когда нижние слои SPV получат акции и получат ли вообще

SpaceX в пятницу выходит на биржу, и часть инвесторов, вложившихся через многослойные SPV (специальные инвестиционные оболочки, где несколько участников…

5 мин