Игорь Градов

4 июля 2026 г. в 03:15 МСК8 мин

Когнитивная архитектура LLM на 24 фазы: как PAD+ AI выносит логику за пределы модели

Когнитивная архитектура LLM (большой языковой модели, системы вроде ChatGPT или YandexGPT) определяет, что происходит между вашим вопросом и ответом нейросети, и проект PAD+ AI v4.0 предлагает конкретную схему из 24 фаз, которую можно взять за основу собственной разработки.

Почему это важно

Большинство приложений на основе LLM работают по простейшей цепочке «промпт, модель, ответ», и вся логика заперта внутри одной нейросети. PAD+ AI показывает, как вынести принятие решений наружу, разбив обработку на модули: от проверки безопасности до самоанализа, и сделать каждый из них управляемым и заменяемым.

Зачем это нужно и откуда взялось?

Открытый исследовательский проект PAD+ AI не создаёт собственную языковую модель. Он рассматривает LLM как исполнительный механизм генерации текста, один из компонентов более сложной системы. Вместо прямой передачи запроса в нейросеть система проводит его через последовательность независимых когнитивных фаз: безопасность, намерение пользователя, память, эмоциональное состояние, проверка утверждений и обновление внутреннего состояния.

На фоне того, что большинство проектов вокруг LLM развиваются как интерфейсы чатов, ИИ-агенты (программы, которые сами выполняют цепочку действий), RAG-системы (поиск по вашей базе знаний перед генерацией ответа) или автоматизация рабочих процессов, PAD+ AI исследует другое направление. Главный объект, когнитивная архитектура LLM, внутри которой модель становится лишь генератором текста, а не единственным «мозгом».

Что понадобится

Базовое понимание того, как работают промпты (текстовые инструкции для нейросети) и что такое LLM
Доступ к любой языковой модели через API (Application Programming Interface, программный интерфейс): ChatGPT, Claude, GigaChat или YandexGPT
PostgreSQL с расширением pgvector (для векторного поиска по документам), если планируете реализовать модуль памяти
Примерно 2 часа на разбор архитектуры, ещё 4 на прототип первого модуля

Как устроен когнитивный конвейер: 24 фазы по порядку

В PAD+ AI каждый запрос проходит через конвейер (pipeline), разбитый на укрупнённые этапы. Вот цепочка целиком:

Safety, Intent, Retrieve, Generate, Truth, Remember, Evolve, Emit

Внутри этих этапов живут 24 фазы. Каждая фаза, это самостоятельный программный модуль со своей зоной ответственности и интерфейсом.

Safety (безопасность). Проверка запроса до любой обработки: нет ли в нём вредоносного содержания.
Intent (намерение). Анализ того, чего на самом деле хочет пользователь.
RAG. Извлечение релевантной информации из векторной базы знаний.
Knowledge Graph (граф знаний). Обработка концептов и связей между ними.
Episodic (эпизодическая память). История прошлых взаимодействий с пользователем.
Semantic (семантическая память). Факты, концепты, обобщённые знания.
Emotion (эмоция). Анализ текущего эмоционального состояния системы.
Persona (личность). Актуализация характера и стиля общения.
Roots (корни). Сверка с неизменяемыми фундаментальными принципами.
Identity (идентичность). Формирование «голоса» конкретного ответа.
Generate (генерация). Здесь наконец работает LLM и создаёт текст.
Truth Loop (петля истины). Проверка утверждений в ответе.
Save Episode. Сохранение текущего разговора в память.
Emotion Update. Обновление эмоционального состояния после ответа.
Consolidation (консолидация). Перенос краткосрочной памяти в долговременную.
Procedure Success. Фиксация успешного выполнения процедуры.
Persona Evolution. Эволюция личности на основе взаимодействия.
Events Broadcast. Рассылка событий подписанным компонентам.
Health (здоровье). Мониторинг состояния всей системы.
Reflection (рефлексия). Самоанализ завершённого цикла.
Dreams (сны). Фоновая обработка и ассоциативное связывание знаний.
Metrics (метрики). Сбор данных о производительности.
Response Guard (защита ответа). Финальная проверка перед отправкой пользователю.
Anti-Loop Guard (защита от зацикливания). Блокирует запрос, если он повторяется более 3 раз подряд.

Обратите внимание: LLM включается только на 11-м шаге. Первые десять фаз готовят контекст, последние тринадцать проверяют и запоминают результат. Именно в этом суть когнитивной архитектуры LLM по версии PAD+ AI: модель генерирует, а всё остальное делает внешняя инженерная обвязка.

Как устроена многоуровневая память?

Память в PAD+ AI не единое хранилище, а набор специализированных компонентов:

RAG-память на PostgreSQL с pgvector: векторный поиск по документам
Эпизодическая память: история разговоров с конкретным пользователем
Семантическая память: факты и обобщённые знания
Память личности (Persona): устойчивые черты и стиль общения системы
Память пользователя (User Persona): модель предпочтений конкретного человека
Корневая память (Roots): неизменяемые принципы, которые система не может переписать
Гигиена памяти (Memory Hygiene): очистка и удаление дублей устаревших записей

Эпизоды общения постепенно превращаются в устойчивые знания, а те могут становиться частью фундаментальных принципов. Это разделение краткосрочного опыта, долговременных знаний и неизменяемых оснований поведения.

Эмоциональный движок: зачем машине «эмоции»?

Эмоциональная модель построена на шести параметрах: удовольствие (Pleasure), возбуждение (Arousal), доминирование (Dominance), любопытство (Curiosity), уверенность (Confidence), социальная связь (Social Connection).

Это не попытка имитировать человеческие чувства. Параметры работают как инженерный механизм: текущее «эмоциональное состояние» системы влияет на стиль ответа, уровень детализации, уверенность формулировок и стратегию взаимодействия. Предусмотрен механизм затухания (decay): если ничего не меняется, параметры постепенно возвращаются к нейтральным значениям.

Пошаговая инструкция: как применить эту схему в своём проекте

Нарисуйте свой конвейер на бумаге. Возьмите цепочку «Safety, Intent, Retrieve, Generate, Truth, Remember, Evolve, Emit» и вычеркните то, что вашей задаче не нужно. Для простого чат-бота поддержки можно оставить Safety, Intent, RAG, Generate, Truth Loop, Response Guard.
Реализуйте каждую фазу как отдельный модуль. Один файл или один класс на фазу. Входной и выходной формат одинаковый для всех: словарь (или JSON-объект) с полями запроса и накопленного контекста.
Начните с Safety и Intent. Пример промпта для фазы Intent:

Проанализируй запрос пользователя и верни JSON с полями:

- "intent": основное намерение (вопрос, просьба, жалоба, уточнение)
- "topic": тема запроса
- "urgency": от 1 до 5
Запрос: "{user_message}"

Добавьте RAG-фазу. Подключите pgvector или любой векторный поиск. Перед генерацией ответа система ищет релевантные фрагменты в вашей базе и добавляет их в контекст для LLM.
Реализуйте Truth Loop. После генерации ответа отправьте его обратно в модель с промптом:

Выдели из текста все конкретные утверждения (факты, числа, даты).
Для каждого укажи: подтверждается ли оно контекстом, который был передан на этапе RAG?
Верни JSON-массив с полями "claim", "supported" (true/false), "source".

Подключите Response Guard. Финальная проверка: нет ли в ответе запрещённых тем, не превышена ли длина, соответствует ли тон заданной Persona.
Добавляйте остальные фазы по мере необходимости. Эпизодическая память, эмоциональный движок, рефлексия, фаза Dreams пригодятся для сложных продуктов с длительным взаимодействием.

Как это применить

Допустим, вы строите бота-консультанта для интернет-магазина. Без когнитивной архитектуры LLM запрос «у меня сломался блендер, что делать» уходит напрямую в модель, и та выдаёт общий совет из обучающих данных. С конвейером из PAD+ AI тот же запрос сначала проходит Safety (проверка на токсичность), затем Intent (определяется: «жалоба, нужна замена или ремонт»), затем RAG (система находит гарантийную политику вашего магазина), затем Episodic (видит, что этот клиент покупал блендер 3 месяца назад), и только после этого Generate формирует ответ с конкретным номером заявки и ссылкой на форму возврата. Truth Loop проверяет, что срок гарантии в ответе совпадает с данными из базы.

Частые ошибки

Пытаться реализовать все 24 фазы сразу. Конвейер модульный, в этом его сила. Начните с 4 фаз, наращивайте по одной.

Путать когнитивную архитектуру с промпт-инжинирингом. Длинный системный промпт (system prompt, постоянная инструкция для модели) не заменяет внешние модули. Промпт-инжиниринг работает внутри одного вызова модели, архитектура организует цепочку вызовов и внешнюю логику.

Игнорировать Anti-Loop Guard. Без защиты от зацикливания система может бесконечно перегенерировать ответ, если Truth Loop раз за разом отклоняет результат. PAD+ AI блокирует запрос после 3 повторов подряд.

Хранить всё в одной «памяти». Если не разделить эпизодическую, семантическую и корневую память, система со временем начнёт путать личные предпочтения пользователя с фундаментальными правилами.

Что делать с этим прямо сейчас, по ролям

Разработчику или техлиду. Возьмите схему 24 фаз как чек-лист для аудита собственного ИИ-продукта. Пройдитесь по списку и отметьте, какие этапы у вас отсутствуют. Скорее всего, не хватает Truth Loop и Memory Hygiene.

Автору Дзена или копирайтеру. Если вы используете нейросеть для генерации текстов, поймите главное: качество ответа зависит не только от модели, а от того, что происходит до и после генерации. Добавьте хотя бы ручной аналог Truth Loop: перепроверяйте факты в сгенерированном тексте по источникам, прежде чем публиковать.

Предпринимателю в РФ. Архитектура PAD+ AI работает поверх любой LLM, включая доступные в России GigaChat и YandexGPT. Вы не привязаны к конкретному провайдеру, а значит, можете начать строить когнитивный конвейер уже на тех моделях, которые доступны сейчас.

Мнение редакции dzen.guru

По моим наблюдениям, абсолютное большинство ИИ-продуктов на российском рынке до сих пор работают по схеме «промпт, модель, ответ». Когнитивная архитектура LLM, как её описывает PAD+ AI, это не академическая игрушка. Это инженерный подход, который объясняет, почему одни чат-боты выдают галлюцинации (уверенно выдуманные факты) на каждом втором ответе, а другие проверяют себя сами.

Честная оговорка: PAD+ AI остаётся исследовательским проектом. Готового коробочного решения, которое можно поставить за вечер, здесь нет. Это архитектурная карта, а не готовый продукт. Но сама идея вынести «мышление» за пределы модели и сделать его наблюдаемым, на мой взгляд, именно то, чего не хватает большинству ИИ-решений сегодня.

Хотите разобраться, как нейросети меняют работу автора?

В dzen.guru мы тестируем ИИ-инструменты на практике и показываем, что реально работает для контента на Дзене.

Попробовать dzen.guru

Схема из 24 фаз не обязательна целиком, но даже три модуля из неё (Safety, Truth Loop, Response Guard) превращают «болтливую нейросеть» в систему, которой можно доверять чуть больше, а это уже конкретное инженерное преимущество, которое стоит попробовать на ближайшем проекте.

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Локальная нейросеть на ПК с 4 ГБ видеопамяти: пошаговая настройка без облака и подписок

Локальная нейросеть на домашнем ПК с Windows 11 решает конкретную задачу: вы получаете языковую модель, которая работает без облака, без подписки и без…

4 июля в 07:15 МСК7 мин

37% новых треков на Яндекс Музыке сгенерированы: нейросеть для создания музыки научились детектить без GPU

Нейросеть для создания музыки бесплатно генерирует треки, которые уже составляют больше трети новых релизов на Яндекс Музыке, и теперь есть способ отличить их…

4 июля в 06:45 МСК5 мин

Компьютерное зрение на палубе судна: как трёхуровневая валидация убирает ложные тревоги

Компьютерное зрение (computer vision, технология, позволяющая нейросети «видеть» и анализировать изображения с камер) на открытой палубе судна сталкивается с…

4 июля в 06:30 МСК7 мин