Игорь Градов
Игорь Градов
5 мин
aggregator

Sequent собирает $150 млн на независимую безопасность ИИ: лаборатории не справляются сами

Microsoft представила новую модель, которая рассуждает сама, а Sequent предлагает альтернативный путь к безопасности ИИ.

Группа исследователей из Британского института безопасности ИИ и стартапа Timaeus в июне 2025 года объединилась в некоммерческую организацию Sequent, заявив, что выравнивание сверхразумных систем с человеческими ценностями «не идёт по графику» и требует принципиально иного подхода, чем тот, что практикуют крупные лаборатории.

Почему это важно

Sequent открыто назвала реактивный подход ведущих ИИ-лабораторий недостаточным для будущего, где модели начнут улучшать сами себя, и предложила модель независимого финансирования исследований безопасности ИИ на сумму от 100 до 150 миллионов долларов только на старте.

Тема безопасности ИИ обычно остаётся внутри корпораций: OpenAI, Google DeepMind и Anthropic сами решают, как проверять свои модели. Sequent строится как независимая структура, способная, по словам основателей, «кричать», если лаборатории делают что-то опасное. По данным Import AI, организация намерена вырасти до 40-80 штатных сотрудников за пару лет и вести параллельно десятки исследовательских направлений.

Показатель Значение Источник
Начальный объём привлечения средств 100-150 млн долларов Sequent
Плановый штат через 2 года 40-80 штатных сотрудников Sequent
Следующий раунд (при успехе) «Минимум на порядок больше» (от 1 млрд долларов) Sequent
Откуда пришли основатели UK AI Security Institute (команда Alignment) и стартап Timaeus Import AI

Что именно исследует Sequent?

Выравнивание (alignment) в контексте ИИ означает задачу: как сделать так, чтобы система действовала в интересах людей, а не преследовала собственные цели. Сейчас лаборатории проверяют модели после обучения: запускают тесты, находят сбои, латают. Sequent называет это «реактивным» подходом и считает, что он не даст уверенности до того, как появится сверхразумная система.

Организация хочет найти «принципиальные основания» для уверенности в том, что выравнивание, которое работает в контролируемых условиях (при обучении, на тестах), сохранится и в реальном мире, при выполнении масштабных долгосрочных задач.

Конкретные направления исследований, которые перечислены в манифесте Sequent:

  • Масштабируемый надзор (scalable oversight) означает способы контролировать систему, которая умнее контролёра
  • Теория обучения (learning theory) изучает, при каких условиях модель вообще может «выучить» правильное поведение
  • Эвристические аргументы (heuristic arguments) дают не строгое доказательство, а обоснованную уверенность, что система безопасна
  • Теория игр (game theory) моделирует стратегическое взаимодействие ИИ и человека
  • Персоны (personas) изучают, какие «роли» принимает модель и как это влияет на её поведение

Sequent делает ставку на то, что пересечение этих направлений даст синергию. Например, теория игр покажет, к каким равновесиям приведут методы масштабируемого надзора, а сочетание теории обучения и изучения персон подскажет, какие переменные можно менять при обучении модели.

Что обнаружили основатели и почему бьют тревогу?

  • Сверхразумный ИИ (ASI) может появиться в ближайшие годы, а методы выравнивания к этому моменту, вероятно, не будут готовы, по оценке самих основателей Sequent
  • Лаборатории не дают априорной уверенности в безопасности до обучения сверхразумной модели: их методы «функциональны, но не дают принципиального понимания, когда и при каких условиях они откажут»
  • Рекурсивное самоулучшение (когда ИИ сам проектирует и обучает следующие версии себя) потребует качественно иного уровня безопасности ИИ, которого пока нет
  • Независимость критична: организация позиционирует себя как структуру, которая сможет публично предупредить о рисках, если лаборатории пойдут по опасному пути. Дословно: «Возможно, нам придётся кричать»
Как это читать

Оценки Sequent о сроках появления сверхразумного ИИ («в ближайшие годы») являются прогнозом основателей, а не общепринятым консенсусом. Организация только заявила о намерении привлечь 100-150 млн долларов, факт привлечения пока не подтверждён. Штат 40-80 человек и «порядок величины больше» в следующем раунде тоже планы, а не свершившийся факт. Исследовательские результаты ещё не опубликованы: Sequent находится на стадии формирования.

Что это значит для вас?

Авторам Дзена и контент-мейкерам. Тема безопасности ИИ перестаёт быть абстрактной страшилкой и превращается в конкретные организации с бюджетами и штатами. Если вы пишете про нейросети, стоит следить за Sequent: их публикации будут задавать повестку в спорах о том, можно ли доверять ИИ-агентам (программам, которые действуют самостоятельно от имени пользователя).

Маркетологам и предпринимателям. Каждый релиз о проблемах выравнивания влияет на регуляторную среду. Чем громче звучат предупреждения, тем быстрее приходят новые правила. Для бизнеса в РФ и СНГ это значит: внедряя ИИ-инструменты, закладывайте в процесс проверку на адекватность ответов, особенно если модель принимает решения без человека в цепочке.

Для российского контекста. В России практически нет независимых исследовательских организаций, занимающихся безопасностью ИИ. Модель Sequent показывает, как можно выстроить такую структуру: некоммерческий формат, начальное финансирование 100-150 млн долларов, портфель параллельных исследовательских направлений вместо одной ставки, публичная позиция и готовность спорить с крупными игроками. Для тех, кто думает о подобных инициативах в РФ, это рабочий образец.

Мнение редакции dzen.guru

Меня привлекает честность формулировки: «В идеальном мире мы бы сначала доказали безопасность, а потом строили. В этом мире придётся обойтись чем-то заметно меньшим». Это редкий случай, когда исследователи безопасности ИИ не обещают серебряную пулю, а прямо говорят: мы пытаемся снизить риск, а не устранить его. На мой взгляд, независимость от лабораторий здесь ключевая: если Sequent действительно сможет публично критиковать OpenAI или Google, не рискуя финансированием, это будет ценнее любого конкретного исследования. Пока же это манифест и план, а не результат. Буду следить за первыми публикациями.

Безопасность ИИ из темы для конференций превращается в область с реальными бюджетами и кадрами. Sequent пока только план, но план с конкретными цифрами, направлениями и командой, которая готова «кричать», если придётся.

По материалам Import AI

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

Loopcraft: программный код для автоматизации операций пользователя пишут каскады ИИ-агентов
aggregator

Loopcraft: программный код для автоматизации операций пользователя пишут каскады ИИ-агентов

Loopcraft предлагает убрать человека из цикла промптирования и передать управление автономным петлям ИИ-агентов, которые сами генерируют, проверяют и улучшают…

5 мин
ai

Белый дом заставил Anthropic отключить модели для сотен миллионов пользователей за выходные

Anthropic 12 июня получила предписание Белого дома заблокировать иностранный доступ к своим новейшим моделям Fable 5 и Mythos 5, а спустя часы отключила обе…

5 мин
ai

Anthropic отключила модели по приказу Белого дома: какие альтернативы Claude доступны сейчас

Microsoft, Google, открытые модели и российские сервисы покрывают почти все задачи, которые раньше решал Claude, и после инцидента с Anthropic самое время…

5 мин