Симуляция жизни нейросети: 100 агентов прожили 10 лет и дали данные лучше Claude
Команда исследователей запустила виртуальный город на 100 ИИ-агентов, управляемых нейросетью, и позволила им прожить 10 лет без единого сценария, а затем использовала накопленный синтетический опыт для дообучения базовой модели, которая после этого стала лучше понимать человеческое поведение.

Качественных текстов для обучения нейросетей в интернете почти не осталось. Симуляция жизни нейросети в виртуальном мире даёт принципиально новый источник обучающих данных (training data), синтетический опыт из «прожитых» цифровых судеб, и модель, дообученная на нём, по ряду задач обходит Claude.
Статья об эксперименте Agentopia появилась на arxiv.org несколько дней назад. Независимый ИИ-исследователь Михаил Сальников, автор бенчмарка AI Independence Bench, разобрал архитектуру проекта на Хабре. Суть: вместо того чтобы искать новые массивы «живых» текстов, авторы построили виртуальное общество, где ИИ-агенты (agent, автономная программа, действующая от имени персонажа) сами принимают решения, заводят друзей, ссорятся из-за денег, выгорают и меняют профессию. Никаких скриптов. Только наблюдение и сбор данных.
Что понадобится
- Доступ к статье Agentopia на arxiv.org (бесплатно)
- Понимание базовой архитектуры: что такое ИИ-агент и как работает дообучение (fine-tuning, обучение модели на специфических примерах под узкую задачу)
- Для воспроизведения: мощная языковая модель уровня Qwen3.5-397B-A17B (открытые веса, open weights, то есть разработчик публикует параметры модели, но условия использования могут отличаться от полностью свободных)
- Время на чтение и осмысление: 20-30 минут
Как устроена симуляция жизни нейросети: пошаговая инструкция
-
Создайте агентов с памятью. Каждый ИИ-агент получает профиль и личные файлы памяти. Агент сам решает, что записать, обновить или забыть через функции
read_fileиupdate_file. Он ведёт собственный дневник, а не получает записи от движка. -
Задайте ритм жизни. Неделя агента состоит из четырёх фаз: планирование, контакты, активность, рефлексия (Plan, Contact, Activity, Review). Этот цикл повторяется на протяжении 10 виртуальных лет.
-
Назначьте модель среды вместо жёстких правил. Вместо тысяч скриптов реальностью управляет одна нейросеть. Она работает как ведущий в настольной ролевой игре: создаёт события, оценивает правдоподобность поступков, определяет очерёдность реплик и фильтрует галлюцинации (hallucination, когда ИИ уверенно выдумывает то, чего не было), блокируя нехарактерные для персонажа действия.
-
Настройте систему оценки жизненного успеха. Авторы Agentopia используют три компонента: социальный статус, экономическое благополучие и субъективную удовлетворённость. Последняя построена на пирамиде Маслоу и отслеживается через четыре метрики: настроение, материальная обеспеченность, социализация и признание. Агент неявно стремится эту оценку максимизировать.
-
Запустите мир и не вмешивайтесь. В Agentopia доступны три мира: The Campus (китайская школа), The Apartment (нью-йоркская коммуналка) и Arcane Academy (магическая академия). В каждом живут 100 агентов. Базовая нейросеть для агентов и ведущего среды одна и та же: Qwen3.5-397B-A17B.
-
Соберите синтетический опыт и дообучите модель. Накопленные за 10 виртуальных лет «прожитые» сценарии используются как обучающие данные. По результатам авторов, базовая нейросеть после дообучения на этих данных стала лучше понимать человеческое поведение, чем Claude, по ряду задач.
Что происходит, когда агенты начинают жить?
Самое показательное в Agentopia: незапланированные социальные явления. Агенты без единого скрипта начали дарить друг другу подарки, передавая их из поколения в поколение. Одна компания друзей соблюдала ритуалы выходного дня более 55 недель подряд.
Один агент-консультант с доходом 500 долларов в неделю бросил карьеру и стал гидом по скалолазанию, потеряв 56% дохода. Его «запас жизненных сил» упал до нуля, но к концу десятилетия настроение выросло на 112%, а сбережения увеличились. Никто не подсказывал: ИИ-агент сам воспроизвёл дилемму «деньги или смысл».
Другой агент вёл гиперактивную социальную жизнь: 402 совместных дела, почти 80% всех школьных событий. Итог: эмоциональное выгорание, запас жизненных сил с 70 до 0. Сценарий выгорания никто не программировал.
Именно способность симуляции жизни нейросети порождать подобные незапланированные паттерны и делает синтетические данные ценными для дообучения: модель учится не на шаблонах, а на «прожитом» опыте с непредсказуемыми последствиями.
В эксперименте агент Доктор Грант стала «душой компании»: знакомила людей, собрала тесный круг из пяти друзей. Её главное достижение: она познакомила Люсьена и Одетт. Эти двое провели вместе 76 совместных занятий и стали самой близкой парой, связь которой оказалась крепче, чем у самой Грант с любым из них. Агент Джулиан, которого Грант привела в компанию первым, к концу десятилетия перестал упоминать её в списке тех, кто ему нравится. Система лишь однажды свела незнакомцев на старте. Дальше агенты действовали сами, опираясь на собственные воспоминания. Результат: создатель сообщества создаёт ценность для сети, но когда сеть начинает поддерживать себя сама, создателя забывают первым.
- Путать симуляцию с игрой. Это не развлечение в духе The Sims. Без системы оценки жизненного успеха и модели среды данные бесполезны для дообучения.
- Игнорировать фильтрацию галлюцинаций. Модель среды специально блокирует нехарактерные для персонажа действия. Без этого механизма агенты быстро «сойдут с ума» и данные потеряют связь с реальным поведением.
- Считать, что любая языковая модель подойдёт. В эксперименте использовалась Qwen3.5-397B-A17B. Менее мощная модель может не справиться с ролью ведущего среды и не удержит согласованность мира на протяжении 10 виртуальных лет.
- Ожидать мгновенного результата. Ценность появляется на длинной дистанции: именно накопление «прожитого» опыта за годы симуляции порождает те самые незапланированные паттерны, которые полезны для дообучения.
Что делать с этим прямо сейчас?
Авторам Дзена. Подход Agentopia показывает: контент, основанный на «синтетическом опыте», уже конкурирует с ответами моделей, обученных на реальных текстах. Ваш живой опыт, личные истории и нестандартные наблюдения, это именно тот тип данных, которые нейросети пока не могут сгенерировать сами. Пока не могут.
Разработчикам в РФ и СНГ. Симуляция жизни нейросети открывает способ генерировать локализованные обучающие данные без зависимости от англоязычного интернета. Вместо поиска русскоязычных корпусов можно построить виртуальный мир с русскоязычными агентами и получить синтетический опыт, адаптированный под местную культуру и поведение. Из доступных в РФ моделей для экспериментов подойдут YandexGPT и открытые модели семейства Qwen.
Маркетологам. Если модели учатся на «прожитых» социальных сценариях, а не на текстах с сайтов, меняется природа ИИ-ассистентов для бизнеса. Нейросеть, обученная на данных из виртуального общества, лучше предсказывает эмоциональные реакции и социальную динамику, а это напрямую касается персонализации и работы с аудиторией.
На мой взгляд, Agentopia, это не столько технический фокус, сколько честный ответ на вопрос «где брать данные, когда интернет кончился». Модель, которая «прожила» тысячи виртуальных судеб, действительно понимает контекст иначе, чем модель, натасканная на статьях из Википедии. Мы в dzen.guru видим в этом прямой сигнал: ценность уникального авторского опыта будет только расти, потому что именно его сложнее всего синтезировать. Честная оговорка: эксперимент проведён на одной конкретной модели Qwen3.5-397B-A17B, и авторы не раскрывают, как результаты масштабируются на другие архитектуры. Воспроизвести это в домашних условиях пока нереально, но сам принцип «учить модель на прожитом, а не на прочитанном» стоит держать в голове.
Научитесь работать с нейросетями на практике
В dzen.guru мы разбираем реальные инструменты и приёмы работы с ИИ, которые можно применить уже сегодня, от промптов до агентных сценариев.
Попробовать dzen.guruВиртуальные миры, в которых нейросети проживают собственные судьбы, перестали быть экспериментом ради эксперимента. Когда модель, дообученная на «синтетических жизнях», обходит коммерческие решения по пониманию человеческого поведения, это практический аргумент: данные можно не только собирать, но и выращивать.
По материалам Habr ML

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».
Читайте также

SymFSM ставит LLM в конечный автомат: как меняются архитектуры нейросетей
Современные языковые модели, какими бы продвинутыми они ни были, остаются вероятностными генераторами текста, и проект SymFSM предлагает надстройку, которая…

Сундар Пичаи в Стэнфорде: глава Google дал три совета без единого слова про ИИ
Microsoft второго июня запустила Project Solara — нет, стоп. Работаю строго по источнику. Сундар Пичаи, генеральный директор Google, 15 июня 2026 года выступил…

Amazon нашла уязвимость в Anthropic Fable 5: иностранных сотрудников отрезали от собственной модели
Amazon нашла уязвимость в модели Anthropic Fable 5, и после разговора главы компании с Белым домом иностранным сотрудникам Anthropic запретили доступ к…
Комментарии