Игорь Градов
Игорь Градов
5 мин
ai

СберТех подключил GigaChat к мониторингу PostgreSQL на 700+ экземплярах: инциденты теперь находит ИИ

Команда «R4C.Support.Всадники апокалипсиса» из СберТеха показала, как связать мониторинг PostgreSQL с искусственным интеллектом на парке из более чем 700 экземпляров СУБД, чтобы система сама находила проблемы и создавала заявки на их устранение.

СберТех подключил GigaChat к мониторингу PostgreSQL на 700+ экземплярах: инциденты теперь находит ИИ
Почему это важно

Вместо ручного сбора метрик с десятков дашбордов администратор получает готовый отчёт от нейросети и автоматически созданную задачу в трекере: время реакции на инцидент сокращается с часов до минут.

Станислав Епишин и Константин Резник из СберТеха описали два инструмента, которые превращают разрозненный мониторинг PostgreSQL в замкнутый цикл «обнаружил, проанализировал, завёл задачу». Решение построено целиком на внутренних продуктах Сбера: Pipeliner (CI/CD-оркестратор, аналог Jenkins), TaskTracker (система управления задачами, аналог Jira), GigaChat (языковая модель Сбера) и Platform V Pangolin (доработанная PostgreSQL с усиленной безопасностью). Публикация вышла как техническая статья с открытым репозиторием экспортёра.

Что Когда Кто выпустил Цена
Monitoring_Checker_TT и Analyze_Pangolin_AI дату релиза авторы не назвали команда «R4C.Support.Всадники апокалипсиса», СберТех не раскрыта, внутренний проект

Два инструмента вместо ручного разбора

  • Monitoring_Checker_TT связывает Prometheus, Pipeliner и TaskTracker. Задания по расписанию собирают метрики напрямую через Prometheus API с помощью PromQL-запросов (язык запросов к системе мониторинга), без промежуточного слоя Grafana, и при превышении порогов автоматически создают заявки в TaskTracker.

  • Analyze_Pangolin_AI отправляет собранные данные в GigaChat через AI Hub API (программный интерфейс для доступа к нейросети). Модель формирует диагностический отчёт: что сломалось, почему и что делать. Администратор получает не сырые графики, а текстовый разбор инцидента.

  • stdguard_pgexporter (кастомный экспортёр, то есть программа, которая собирает показатели и отдаёт их системе мониторинга) лежит в основе обоих инструментов. Каждые 15 минут он выполняет bash-команды и SQL-запросы, описанные в двух конфигурационных файлах, и преобразует текстовые журналы СУБД в структурированные метрики Prometheus.

Какие метрики собирает экспортёр?

Файл stdguard_queries.yaml содержит SQL-запросы для проверки соответствия внутренним стандартам:

  • имена объектов (запрещён верхний регистр)
  • наличие комментариев к таблицам и полям
  • разделение таблиц и индексов по табличным пространствам
  • выявление внешних ключей без индексов

Файл stdguard_system.yaml описывает bash-команды для сбора системных данных: количество процессов СУБД, размеры журналов, частота блокировок (deadlock, ситуация, когда два процесса ждут друг друга и оба встают) и критических ошибок.

Гибкость конфигурации позволяет адаптировать сбор под любую топологию кластера, от одиночного экземпляра до крупных мультимастерных конфигураций.

Prometheus API вместо Grafana: зачем?

Традиционный подход предполагает визуализацию в Grafana: администратор смотрит на графики глазами. Здесь система работает напрямую с Prometheus API, что даёт три преимущества:

  • данные приходят в структурированном формате JSON, пригодном для программной обработки
  • сложные агрегации выполняются на стороне Prometheus средствами PromQL
  • нет накладных расходов на рендеринг графиков, которые всё равно никто не смотрит в момент инцидента

Именно JSON-ответы Prometheus становятся входными данными для GigaChat: нейросеть получает не картинку, а числа с контекстом.

Как попробовать?

  1. Установите stdguard_pgexporter из открытого репозитория (ссылка указана в статье авторов) и настройте два конфигурационных файла под свои экземпляры PostgreSQL или Pangolin.
  2. Подключите экспортёр к вашему Prometheus и убедитесь, что метрики появляются на эндпоинте /metrics.
  3. Настройте задания в вашем CI/CD-оркестраторе (Pipeliner, Jenkins или аналог) для опроса Prometheus API и создания задач в трекере при превышении порогов.
  4. Для ИИ-диагностики подключите GigaChat через AI Hub API, передавая собранные метрики как контекст промпта (текстового запроса к нейросети).

Что делать, если вы не в экосистеме Сбера?

Архитектура решения не привязана жёстко к конкретным продуктам. Авторы прямо указывают аналоги: Pipeliner заменяется Jenkins, TaskTracker заменяется Jira. Вместо GigaChat можно подключить другую языковую модель с API, например YandexGPT.

Компонент СберТеха Открытый или российский аналог
Pipeliner Jenkins, GitLab CI
TaskTracker Jira, Яндекс Трекер
GigaChat через AI Hub API YandexGPT через Yandex Cloud API
Platform V Pangolin PostgreSQL (без доработок Сбера по безопасности)

Ключевой элемент, stdguard_pgexporter, выложен в открытый репозиторий и работает с любым PostgreSQL.

Что с этого вам прямо сейчас?

Администраторам баз данных. Если вы обслуживаете хотя бы десяток экземпляров PostgreSQL, схема «экспортёр плюс Prometheus плюс нейросеть» экономит время на разборе инцидентов. Начните с установки экспортёра, это самый простой шаг, и посмотрите, какие метрики он выдаёт на вашей конфигурации.

Авторам Дзена, пишущим про технологии. Кейс СберТеха показывает, что мониторинг PostgreSQL с помощью ИИ уже не теория, а внутренний продукт крупной компании. Это рабочий материал для статьи или разбора: конкретная архитектура, открытый код, названия инструментов.

Предпринимателям и руководителям ИТ. Решение целиком построено на российском стеке. Если ваша инфраструктура завязана на PostgreSQL и вы ищете способ сократить время реакции на сбои без закупки западного ПО, здесь готовый шаблон.

Мнение редакции dzen.guru

Я вижу главную ценность не в самих инструментах (они заточены под внутреннюю инфраструктуру Сбера), а в архитектурном паттерне. Связка «экспортёр собирает метрики, оркестратор опрашивает API, нейросеть пишет диагностику, трекер получает задачу» воспроизводима на любом стеке. По моим наблюдениям, большинство команд до сих пор останавливаются на этапе «Grafana показала красное, человек пошёл разбираться». Здесь человек подключается, когда задача уже сформулирована. Оговорка: авторы не приводят числа по точности диагностики GigaChat, а галлюцинации (когда нейросеть уверенно выдумывает то, чего не было) в техническом контексте могут стоить дорого. Прежде чем доверять ИИ-отчётам, проверяйте их на реальных инцидентах с известным исходом.

Частые вопросы

Нужен ли именно Pangolin или подойдёт обычный PostgreSQL?

Экспортёр stdguard_pgexporter работает с PostgreSQL. Pangolin, это доработанная версия от СберТеха с усиленной безопасностью, но базовый мониторинг PostgreSQL через экспортёр доступен и без неё.

Можно ли заменить GigaChat на другую нейросеть?

Да. Архитектура предполагает передачу метрик в формате JSON через API. Любая языковая модель с программным интерфейсом (YandexGPT, Claude, GPT) может принять эти данные как контекст промпта и сформировать отчёт.

Где взять код экспортёра?

Авторы указывают, что репозиторий stdguard_pgexporter открыт. Ссылка приведена в оригинальной статье на Хабре.

Полная связка «Prometheus плюс экспортёр плюс GigaChat плюс трекер» пока живёт внутри СберТеха, но каждый элемент заменяем, а экспортёр уже лежит в открытом доступе: забирайте и адаптируйте под свой парк PostgreSQL.

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

Эмбеддинги нейросети для русского языка: какую модель выбрать и не потерять дни на эксперименты
ai

Эмбеддинги нейросети для русского языка: какую модель выбрать и не потерять дни на эксперименты

Выбор модели для векторных представлений текста определяет, насколько точно нейросеть поймёт смысл ваших данных, и неудачный выбор обнаруживается только после…

6 мин
СберЗдоровье описало 5 методов верификации нейросетей: ИИ не может проверять ИИ
ai

СберЗдоровье описало 5 методов верификации нейросетей: ИИ не может проверять ИИ

Компания СберЗдоровье и её архитектор Руслан Черкас 2 июня опубликовали развёрнутую классификацию методов верификации нейросетей, адресованную тем, кто…

5 мин
ChatGPT для генерации кода без лимитов: бесплатное расширение заменяет Codex
ai

ChatGPT для генерации кода без лимитов: бесплатное расширение заменяет Codex

ChatGPT умеет генерировать код не хуже специализированных инструментов, но встроенный Codex быстро упирается в лимиты, а подписка на API дорогая, и разработчик…

6 мин