Когнитивная архитектура LLM на 24 фазы: как PAD+ AI выносит логику за пределы модели
Когнитивная архитектура LLM (большой языковой модели, системы вроде ChatGPT или YandexGPT) определяет, что происходит между вашим вопросом и ответом нейросети, и проект PAD+ AI v4.0 предлагает конкретную схему из 24 фаз, которую можно взять за основу собственной разработки.

Большинство приложений на основе LLM работают по простейшей цепочке «промпт, модель, ответ», и вся логика заперта внутри одной нейросети. PAD+ AI показывает, как вынести принятие решений наружу, разбив обработку на модули: от проверки безопасности до самоанализа, и сделать каждый из них управляемым и заменяемым.
Зачем это нужно и откуда взялось?
Открытый исследовательский проект PAD+ AI не создаёт собственную языковую модель. Он рассматривает LLM как исполнительный механизм генерации текста, один из компонентов более сложной системы. Вместо прямой передачи запроса в нейросеть система проводит его через последовательность независимых когнитивных фаз: безопасность, намерение пользователя, память, эмоциональное состояние, проверка утверждений и обновление внутреннего состояния.
На фоне того, что большинство проектов вокруг LLM развиваются как интерфейсы чатов, ИИ-агенты (программы, которые сами выполняют цепочку действий), RAG-системы (поиск по вашей базе знаний перед генерацией ответа) или автоматизация рабочих процессов, PAD+ AI исследует другое направление. Главный объект, когнитивная архитектура LLM, внутри которой модель становится лишь генератором текста, а не единственным «мозгом».
Что понадобится
- Базовое понимание того, как работают промпты (текстовые инструкции для нейросети) и что такое LLM
- Доступ к любой языковой модели через API (Application Programming Interface, программный интерфейс): ChatGPT, Claude, GigaChat или YandexGPT
- PostgreSQL с расширением pgvector (для векторного поиска по документам), если планируете реализовать модуль памяти
- Примерно 2 часа на разбор архитектуры, ещё 4 на прототип первого модуля
Как устроен когнитивный конвейер: 24 фазы по порядку
В PAD+ AI каждый запрос проходит через конвейер (pipeline), разбитый на укрупнённые этапы. Вот цепочка целиком:
Safety, Intent, Retrieve, Generate, Truth, Remember, Evolve, Emit
Внутри этих этапов живут 24 фазы. Каждая фаза, это самостоятельный программный модуль со своей зоной ответственности и интерфейсом.
- Safety (безопасность). Проверка запроса до любой обработки: нет ли в нём вредоносного содержания.
- Intent (намерение). Анализ того, чего на самом деле хочет пользователь.
- RAG. Извлечение релевантной информации из векторной базы знаний.
- Knowledge Graph (граф знаний). Обработка концептов и связей между ними.
- Episodic (эпизодическая память). История прошлых взаимодействий с пользователем.
- Semantic (семантическая память). Факты, концепты, обобщённые знания.
- Emotion (эмоция). Анализ текущего эмоционального состояния системы.
- Persona (личность). Актуализация характера и стиля общения.
- Roots (корни). Сверка с неизменяемыми фундаментальными принципами.
- Identity (идентичность). Формирование «голоса» конкретного ответа.
- Generate (генерация). Здесь наконец работает LLM и создаёт текст.
- Truth Loop (петля истины). Проверка утверждений в ответе.
- Save Episode. Сохранение текущего разговора в память.
- Emotion Update. Обновление эмоционального состояния после ответа.
- Consolidation (консолидация). Перенос краткосрочной памяти в долговременную.
- Procedure Success. Фиксация успешного выполнения процедуры.
- Persona Evolution. Эволюция личности на основе взаимодействия.
- Events Broadcast. Рассылка событий подписанным компонентам.
- Health (здоровье). Мониторинг состояния всей системы.
- Reflection (рефлексия). Самоанализ завершённого цикла.
- Dreams (сны). Фоновая обработка и ассоциативное связывание знаний.
- Metrics (метрики). Сбор данных о производительности.
- Response Guard (защита ответа). Финальная проверка перед отправкой пользователю.
- Anti-Loop Guard (защита от зацикливания). Блокирует запрос, если он повторяется более 3 раз подряд.
Обратите внимание: LLM включается только на 11-м шаге. Первые десять фаз готовят контекст, последние тринадцать проверяют и запоминают результат. Именно в этом суть когнитивной архитектуры LLM по версии PAD+ AI: модель генерирует, а всё остальное делает внешняя инженерная обвязка.
Как устроена многоуровневая память?
Память в PAD+ AI не единое хранилище, а набор специализированных компонентов:
- RAG-память на PostgreSQL с pgvector: векторный поиск по документам
- Эпизодическая память: история разговоров с конкретным пользователем
- Семантическая память: факты и обобщённые знания
- Память личности (Persona): устойчивые черты и стиль общения системы
- Память пользователя (User Persona): модель предпочтений конкретного человека
- Корневая память (Roots): неизменяемые принципы, которые система не может переписать
- Гигиена памяти (Memory Hygiene): очистка и удаление дублей устаревших записей
Эпизоды общения постепенно превращаются в устойчивые знания, а те могут становиться частью фундаментальных принципов. Это разделение краткосрочного опыта, долговременных знаний и неизменяемых оснований поведения.
Эмоциональный движок: зачем машине «эмоции»?
Эмоциональная модель построена на шести параметрах: удовольствие (Pleasure), возбуждение (Arousal), доминирование (Dominance), любопытство (Curiosity), уверенность (Confidence), социальная связь (Social Connection).
Это не попытка имитировать человеческие чувства. Параметры работают как инженерный механизм: текущее «эмоциональное состояние» системы влияет на стиль ответа, уровень детализации, уверенность формулировок и стратегию взаимодействия. Предусмотрен механизм затухания (decay): если ничего не меняется, параметры постепенно возвращаются к нейтральным значениям.
Пошаговая инструкция: как применить эту схему в своём проекте
-
Нарисуйте свой конвейер на бумаге. Возьмите цепочку «Safety, Intent, Retrieve, Generate, Truth, Remember, Evolve, Emit» и вычеркните то, что вашей задаче не нужно. Для простого чат-бота поддержки можно оставить Safety, Intent, RAG, Generate, Truth Loop, Response Guard.
-
Реализуйте каждую фазу как отдельный модуль. Один файл или один класс на фазу. Входной и выходной формат одинаковый для всех: словарь (или JSON-объект) с полями запроса и накопленного контекста.
-
Начните с Safety и Intent. Пример промпта для фазы Intent:
Проанализируй запрос пользователя и верни JSON с полями:
- "intent": основное намерение (вопрос, просьба, жалоба, уточнение)
- "topic": тема запроса
- "urgency": от 1 до 5
Запрос: "{user_message}"
-
Добавьте RAG-фазу. Подключите pgvector или любой векторный поиск. Перед генерацией ответа система ищет релевантные фрагменты в вашей базе и добавляет их в контекст для LLM.
-
Реализуйте Truth Loop. После генерации ответа отправьте его обратно в модель с промптом:
Выдели из текста все конкретные утверждения (факты, числа, даты).
Для каждого укажи: подтверждается ли оно контекстом, который был передан на этапе RAG?
Верни JSON-массив с полями "claim", "supported" (true/false), "source".
-
Подключите Response Guard. Финальная проверка: нет ли в ответе запрещённых тем, не превышена ли длина, соответствует ли тон заданной Persona.
-
Добавляйте остальные фазы по мере необходимости. Эпизодическая память, эмоциональный движок, рефлексия, фаза Dreams пригодятся для сложных продуктов с длительным взаимодействием.
Допустим, вы строите бота-консультанта для интернет-магазина. Без когнитивной архитектуры LLM запрос «у меня сломался блендер, что делать» уходит напрямую в модель, и та выдаёт общий совет из обучающих данных. С конвейером из PAD+ AI тот же запрос сначала проходит Safety (проверка на токсичность), затем Intent (определяется: «жалоба, нужна замена или ремонт»), затем RAG (система находит гарантийную политику вашего магазина), затем Episodic (видит, что этот клиент покупал блендер 3 месяца назад), и только после этого Generate формирует ответ с конкретным номером заявки и ссылкой на форму возврата. Truth Loop проверяет, что срок гарантии в ответе совпадает с данными из базы.
Пытаться реализовать все 24 фазы сразу. Конвейер модульный, в этом его сила. Начните с 4 фаз, наращивайте по одной.
Путать когнитивную архитектуру с промпт-инжинирингом. Длинный системный промпт (system prompt, постоянная инструкция для модели) не заменяет внешние модули. Промпт-инжиниринг работает внутри одного вызова модели, архитектура организует цепочку вызовов и внешнюю логику.
Игнорировать Anti-Loop Guard. Без защиты от зацикливания система может бесконечно перегенерировать ответ, если Truth Loop раз за разом отклоняет результат. PAD+ AI блокирует запрос после 3 повторов подряд.
Хранить всё в одной «памяти». Если не разделить эпизодическую, семантическую и корневую память, система со временем начнёт путать личные предпочтения пользователя с фундаментальными правилами.
Что делать с этим прямо сейчас, по ролям
Разработчику или техлиду. Возьмите схему 24 фаз как чек-лист для аудита собственного ИИ-продукта. Пройдитесь по списку и отметьте, какие этапы у вас отсутствуют. Скорее всего, не хватает Truth Loop и Memory Hygiene.
Автору Дзена или копирайтеру. Если вы используете нейросеть для генерации текстов, поймите главное: качество ответа зависит не только от модели, а от того, что происходит до и после генерации. Добавьте хотя бы ручной аналог Truth Loop: перепроверяйте факты в сгенерированном тексте по источникам, прежде чем публиковать.
Предпринимателю в РФ. Архитектура PAD+ AI работает поверх любой LLM, включая доступные в России GigaChat и YandexGPT. Вы не привязаны к конкретному провайдеру, а значит, можете начать строить когнитивный конвейер уже на тех моделях, которые доступны сейчас.
По моим наблюдениям, абсолютное большинство ИИ-продуктов на российском рынке до сих пор работают по схеме «промпт, модель, ответ». Когнитивная архитектура LLM, как её описывает PAD+ AI, это не академическая игрушка. Это инженерный подход, который объясняет, почему одни чат-боты выдают галлюцинации (уверенно выдуманные факты) на каждом втором ответе, а другие проверяют себя сами.
Честная оговорка: PAD+ AI остаётся исследовательским проектом. Готового коробочного решения, которое можно поставить за вечер, здесь нет. Это архитектурная карта, а не готовый продукт. Но сама идея вынести «мышление» за пределы модели и сделать его наблюдаемым, на мой взгляд, именно то, чего не хватает большинству ИИ-решений сегодня.
Хотите разобраться, как нейросети меняют работу автора?
В dzen.guru мы тестируем ИИ-инструменты на практике и показываем, что реально работает для контента на Дзене.
Попробовать dzen.guruСхема из 24 фаз не обязательна целиком, но даже три модуля из неё (Safety, Truth Loop, Response Guard) превращают «болтливую нейросеть» в систему, которой можно доверять чуть больше, а это уже конкретное инженерное преимущество, которое стоит попробовать на ближайшем проекте.

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».
Читайте также

Локальная нейросеть на ПК с 4 ГБ видеопамяти: пошаговая настройка без облака и подписок
Локальная нейросеть на домашнем ПК с Windows 11 решает конкретную задачу: вы получаете языковую модель, которая работает без облака, без подписки и без…

37% новых треков на Яндекс Музыке сгенерированы: нейросеть для создания музыки научились детектить без GPU
Нейросеть для создания музыки бесплатно генерирует треки, которые уже составляют больше трети новых релизов на Яндекс Музыке, и теперь есть способ отличить их…
Компьютерное зрение на палубе судна: как трёхуровневая валидация убирает ложные тревоги
Компьютерное зрение (computer vision, технология, позволяющая нейросети «видеть» и анализировать изображения с камер) на открытой палубе судна сталкивается с…
Комментарии