Игорь Градов

22 июня 2026 г. в 03:30 МСК7 мин

Что такое ИИ-агент с памятью: 7 типов, без которых модель забывает всё

Языковые модели по умолчанию ничего не помнят: каждый запрос для них первый, и это ломает любую попытку построить полноценного ИИ-агента (программу, которая сама планирует, вызывает инструменты и работает в несколько шагов), потому что агенту нужна память, и у неё, как выяснилось, семь разных типов.

Почему это важно

Понимание типов памяти определяет, будет ваш ИИ-агент полезным помощником или забывчивым болтуном, который каждый раз начинает с нуля и теряет контекст на втором шаге задачи.

Тему разобрал англоязычный ресурс по архитектуре ИИ-агентов. Материал не привязан к конкретному релизу продукта: это системный разбор семи механизмов, которые превращают «одноразовую» языковую модель в систему, способную учиться на опыте и действовать во времени. Для тех, кто строит чат-ботов, исследовательских помощников или автоматизирует рутину на базе больших языковых моделей, включая отечественные, разбор этих механизмов напрямую влияет на качество продукта.

Что	Когда	Кто описал	Цена
Классификация семи типов памяти для ИИ-агентов	Июнь 2025	Англоязычный ресурс по архитектуре агентов	Открытый материал, бесплатно

Какие семь типов памяти выделяют и зачем каждый нужен?

Рабочая память (Working Memory): всё, что модель «видит» прямо сейчас в контекстном окне (токенах, доступных за один вызов). Системный промпт (базовая инструкция модели), последние сообщения, результаты вызова инструментов. Аналогия: оперативная память компьютера. Быстрая, но временная, и все остальные типы памяти конкурируют за место именно здесь.
Семантическая память (Semantic Memory): долгосрочное хранилище фактов, предпочтений и знаний о пользователе. Запись вроде «пользователь предпочитает Python, а не JavaScript» живёт между сессиями. Это «энциклопедия» агента о вас или о теме.
Эпизодическая память (Episodic Memory): журнал конкретных прошлых событий, целых диалогов и результатов задач. Записывает, что сработало, а что провалилось. Агент учится на опыте: системы вроде Reflexion и ExpeL (исследовательские фреймворки для обучения агентов через самоанализ) фиксируют выводы после каждого запуска.
Процедурная память (Procedural Memory): знание «как делать». Навыки, шаблоны использования инструментов, последовательности действий. Агент поддержки, обработавший сотый сброс пароля, не рассуждает заново, а выполняет выученную процедуру.
Внешняя / извлекаемая память (Retrieval Memory): знания, хранящиеся вне модели, в векторной базе данных (специальном хранилище, где тексты представлены числовыми «отпечатками» для быстрого поиска похожих фрагментов). Подтягиваются в контекст в момент инференса (генерации ответа) через поиск по схожести. По сути это RAG (Retrieval-Augmented Generation, генерация с подключением внешних источников), применённая к истории агента или документам. Качество поиска быстро становится узким местом.
Параметрическая память (Parametric Memory): знания, «вшитые» в веса модели во время обучения. Язык, паттерны рассуждений, общие знания о мире. Модель ничего не ищет, а генерирует из выученных связей. Ограничение: эта память заморожена на момент обучения.
Проспективная память (Prospective Memory): способность агента помнить о будущих намерениях и запланированных целях. Отслеживает то, что агент запланировал, но ещё не выполнил. Без неё агент забывает собственные обязательства, и длинные многошаговые задачи рассыпаются.

Как все семь работают вместе?

В источнике приводится наглядный пример: автономный агент для анализа рынка задействует все типы одновременно. Параметрическая память даёт базовое рассуждение. Извлекаемая память подтягивает свежие рыночные данные из векторного хранилища. Семантическая память хранит предпочтения пользователя по формату отчёта. Эпизодическая вспоминает, какие источники оказались надёжными раньше.

Процедурная память задаёт порядок разделов: сначала размер рынка, затем конкурентный ландшафт, затем риски. Проспективная память планирует черновик на следующую неделю. Рабочая память собирает всё это в единый контекст для текущего вызова.

Уберите любой слой, и агент становится слабее. Каждый тип закрывает задачу, которую другие закрыть не могут.

Как попробовать настроить память для своего агента?

Определите задачу и выберите нужные типы. Чат-бот поддержки для ответов на вопросы по документации требует в первую очередь извлекаемую память (RAG по базе знаний) и процедурную (выученные сценарии). Персональный помощник, который должен помнить ваши предпочтения между сессиями, нуждается в семантической и эпизодической памяти.
Реализуйте хранилища раздельно. Даже минимальный стек, как показывает пример из источника на Python, разделяет семантическую память (словарь фактов), эпизодическую (журнал событий с результатами) и процедурную (набор функций-навыков). Рабочая память собирается заново перед каждым вызовом модели из данных остальных хранилищ.
Подключите векторную базу для внешней памяти. Для продакшена долгосрочные хранилища переносятся в векторную базу данных. Подойдут открытые решения: Chroma, Qdrant (оба доступны для самостоятельного развёртывания).
Тестируйте на длинных сценариях. Проспективная память, способность помнить о будущих задачах, проверяется только в многошаговых сценариях длиной в несколько сессий. Без такого теста вы не узнаете, «забывает» ли агент свои обязательства.

Что доступно в России: YandexGPT и GigaChat

Для тех, кто строит ИИ-агентов на отечественных моделях, картина следующая.

Возможность	YandexGPT (через API)	GigaChat (через API)
Рабочая память (контекстное окно)	Доступна, размер окна зависит от версии модели	Доступна, аналогично
Семантическая и эпизодическая память	Реализуется разработчиком: внешнее хранилище плюс промпт	Реализуется разработчиком аналогично
Извлекаемая память (RAG)	Поддерживается через сторонние векторные базы	Поддерживается аналогично
Процедурная память	Задаётся через системный промпт и код приложения	Задаётся аналогично
Проспективная память	Нет встроенной поддержки, реализуется на стороне приложения	Нет встроенной поддержки

Ключевой вывод: ни одна модель, ни зарубежная, ни отечественная, не даёт все семь типов памяти «из коробки». Это всегда архитектурная задача разработчика. Разница в размере контекстного окна и качестве генерации, но принципы организации памяти одинаковы.

Что с этого вам, по ролям?

Автору Дзена. Если вы используете ИИ-агента для подготовки материалов, проверьте, сохраняет ли он ваши предпочтения по стилю между сессиями. Если нет, вы каждый раз тратите токены и время на повторные инструкции. Добавление семантической памяти (простого файла с вашими правилами, подгружаемого в промпт) решает эту проблему.

Маркетологу. Чат-боты поддержки и продаж без эпизодической памяти не учатся на ошибках. Бот, который вчера дал клиенту неверный ответ, сегодня повторит его. Если ваш подрядчик не объясняет, какие типы памяти реализованы, задайте этот вопрос.

Предпринимателю в РФ. Все семь типов памяти реализуемы на базе YandexGPT или GigaChat, но это работа разработчика, а не «галочка в настройках». Закладывайте бюджет на архитектуру памяти отдельно от бюджета на саму модель.

Мнение редакции dzen.guru

Я проверял работу агентов с памятью и без на практике: разница колоссальная. Агент без семантической памяти забывает ваши предпочтения после каждого закрытия чата. Агент без эпизодической не учится на собственных провалах. Агент без проспективной теряет задачи, которые сам же запланировал.

По моим наблюдениям, большинство тех, кто «разочаровался в ИИ-агентах», просто работали с системой, у которой была только рабочая память, один тип из семи. Это как оценивать компьютер, у которого нет жёсткого диска: оперативка есть, а сохранить ничего нельзя.

Что сделать сегодня: возьмите своего текущего агента или чат-бота и задайте ему вопрос о чём-то, что вы обсуждали три сессии назад. Если он не помнит, вы нашли первый тип памяти, который стоит добавить.

Оговорка: реализация всех семи типов сложна и дорога. Для большинства задач достаточно трёх-четырёх. Начните с рабочей, семантической и извлекаемой, это закроет процентов восемьдесят потребностей типичного бота.

Частые вопросы

Что такое ИИ-агент и чем он отличается от обычного чат-бота?

ИИ-агент (AI agent) это программа на базе языковой модели, которая не просто отвечает на вопрос, а сама планирует последовательность действий, вызывает внешние инструменты (поиск, калькулятор, базу данных) и выполняет задачу в несколько шагов. Обычный чат-бот работает в режиме «вопрос, ответ, забыл». Агент работает в режиме «получил задачу, разбил на шаги, выполнил, запомнил результат».

Нужны ли все семь типов памяти для простого бота?

Нет. Для бота, который отвечает на вопросы по документации, достаточно рабочей памяти (контекст текущего диалога) и извлекаемой памяти (RAG по базе знаний). Семь типов нужны сложному автономному агенту, который работает днями, учится на опыте и планирует будущие действия. Выбирайте типы под задачу, а не внедряйте все ради полноты.

Можно ли реализовать эти типы памяти на российских моделях?

Да. Типы памяти не зависят от конкретной модели: это архитектурные решения на уровне приложения. YandexGPT и GigaChat предоставляют контекстное окно (рабочую память) и API для интеграции с внешними хранилищами. Семантическую, эпизодическую и другие типы памяти разработчик строит вокруг модели, используя базы данных и код. Принципы из этого разбора применимы к любой языковой модели с API.

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Allbirds продала обувь за $43 млн и стала платформой стартапов по искусственному интеллекту

Компания Allbirds, ещё в марте торговавшая кроссовками, в апреле 2025 года продала обувной бизнес за 43 миллиона долларов, привлекла 100 миллионов долларов на…

22 июня в 05:45 МСК5 мин

Как включить ИИ на Айфоне iOS 18: функции работают сами, настраивать почти нечего

Apple встраивает ИИ-функции прямо в привычные приложения iPhone, и чтобы включить их на iOS 18, не нужно осваивать нового ассистента: достаточно обновить…

22 июня в 05:15 МСК5 мин

Anthropic новости: Белый дом впервые принудительно отключил ИИ-модели компании

Anthropic второго июня лишилась двух флагманских моделей Fable 5 и Mythos 5 после того, как администрация Трампа применила к компании экспортный контроль,…

22 июня в 04:45 МСК5 мин