Игорь Градов

4 июля 2026 г. в 05:30 МСК6 мин

Sber AI Lab перенесла компьютерное зрение в прогноз событий: ошибки многошагового предсказания сняты

Российские учёные из Sber AI Lab представили на конференции AAAI 2026 метод, который переносит приёмы компьютерного зрения (распознавание объектов на изображениях) в задачу долгосрочного прогнозирования событий, где интервалы между точками данных непредсказуемы, и показали, что такой перенос снимает главную проблему накопления ошибок при многошаговом прогнозе.

Почему это важно

Стандартные модели прогнозирования событий предсказывают только следующий шаг и при многократном повторе быстро накапливают ошибку. Метод из компьютерного зрения позволяет прогнозировать всю будущую последовательность за один проход, что критично для банков, медицины и рекомендательных систем.

Исследование опубликовали Андрей Савченко, директор по науке Sber AI Lab, и Иван Карпухин, старший исследователь того же центра. Работа представлена на AAAI 2026, одной из ведущих мировых конференций по искусственному интеллекту. Авторы показали, что задача «найти объект на картинке и определить, где он» структурно совпадает с задачей «предсказать событие и определить, когда оно случится», и этот неочевидный мост между областями открывает путь к переносу целого класса методов детектирования объектов в моделирование последовательностей.

Показатель	Значение	Источник
Конференция публикации	AAAI 2026	Статья Sber AI Lab на Хабре
Авторы	Андрей Савченко, Иван Карпухин	Статья Sber AI Lab на Хабре
Организация	Sber AI Lab	Статья Sber AI Lab на Хабре
Области применения	Банковские транзакции, медицинские данные, социальные сети, рекомендательные системы	Статья Sber AI Lab на Хабре
Базовый подход	Перенос методов object detection на временные точечные процессы (TPP)	Статья Sber AI Lab на Хабре

Какую задачу решали и почему старые методы не справлялись?

Речь идёт о прогнозировании последовательностей событий. Это не классические временные ряды, где данные поступают через равные промежутки (температура каждый час, курс валюты каждую минуту). Здесь интервалы хаотичны: клиент банка может совершить две операции за секунду, а потом не пользоваться картой неделями; пациент месяцами ходит к врачу по расписанию, а потом экстренно попадает в стационар.

Каждое событие несёт не только временну́ю метку, но и набор атрибутов:

тип и категория (покупка, визит к врачу, комментарий в соцсети)
числовые характеристики (сумма транзакции, результаты анализов)
текстовые и географические признаки

До сих пор такие последовательности моделировали через так называемые временные точечные процессы (Temporal Point Processes, TPP). Ранние модели, от процесса Пуассона до процессов Хоукса (когда одно событие повышает вероятность следующего), а затем нейросетевые подходы на основе рекуррентных сетей и трансформеров, все они обучались одинаково: предсказать одно следующее событие.

Когда нужен прогноз на неделю или месяц вперёд, модель запускают многократно. Она предсказывает первое событие, подставляет собственный прогноз как входные данные и предсказывает второе, и так далее. Это называется авторегрессионное прогнозирование (когда модель шаг за шагом кормит саму себя своими же ответами).

Проблема очевидна: малая ошибка на первом шаге становится частью входа для второго, на третьем она уже больше, а через десятки шагов прогноз полностью расходится с реальностью. Модель начинает «галлюцинировать», здесь в буквальном смысле: галлюцинация (когда ИИ уверенно выдумывает то, чего не было) проявляется как повторение одних и тех же событий вместо разнообразных сценариев.

Как компьютерное зрение подсказало решение?

Авторы заметили структурное сходство двух задач. В компьютерном зрении (computer vision, область ИИ, которая учит машину «видеть» и распознавать содержимое изображений) модель отвечает на два вопроса: что на картинке и где это расположено. В прогнозировании событий вопросы зеркальные: какое событие произойдёт и когда.

Разница только в размерности: двумерное пространство изображения сжимается в одномерную временную ось.

Эта аналогия позволила перенести целый класс методов из детектирования объектов (object detection) в моделирование последовательностей. Вместо того чтобы угадывать события по одному, модель может за один проход «увидеть» всю будущую последовательность целиком, как детектор на фотографии одновременно находит все объекты, а не ищет их по очереди.

Принципиальное отличие от авторегрессионного подхода: ошибка одного прогноза не заражает следующий, потому что следующего шага подстановки просто нет.

Что обнаружили?

Структурная аналогия работает. Методы, ставшие стандартом в детектировании объектов на изображениях, применимы к прогнозированию событий, несмотря на внешнюю несхожесть задач.
Главная проблема снимается архитектурно. Накопление ошибок при многошаговом авторегрессионном прогнозе устраняется за счёт параллельного предсказания всей последовательности, аналогично тому, как детектор находит все объекты на фотографии за один проход.
Области применения конкретны. Авторы указывают банковские транзакции, медицинские данные и активность в социальных сетях как прямые сценарии использования.

Как это читать

Исследование представлено на AAAI 2026, это рецензируемая конференция высшего уровня, но в доступной публикации на Хабре авторы не приводят численных метрик качества (точность, полнота, сравнение с базовыми моделями на конкретных бенчмарках). Без этих цифр невозможно оценить, насколько новый подход превосходит существующие решения на практике. Также не указано, на каких именно датасетах проводились эксперименты и воспроизводимы ли результаты на открытых данных. Это не отменяет ценности самой идеи переноса методов, но ставить на неё в продакшене до публикации полных результатов преждевременно.

Что делать с этим прямо сейчас?

Авторам Дзена и контент-маркетологам. Если вы работаете с аналитикой поведения подписчиков, обратите внимание на саму логику: поведение читателя (просмотр, лайк, подписка, уход) это именно такая нерегулярная последовательность событий. Пока инструментов на базе этого метода в открытом доступе нет, но понимание подхода поможет грамотнее разговаривать с аналитиками и оценивать будущие продукты рекомендательных систем Дзена и других платформ.

Предпринимателям и маркетологам в РФ. Исследование вышло из Sber AI Lab, значит, вероятность появления практических инструментов на базе этого подхода в экосистеме Сбера выше, чем где-либо ещё в России. Если ваш бизнес работает с транзакционными данными, медицинскими записями или CRM-историями клиентов, стоит следить за публикациями команды.

Техническим специалистам. Идея переноса архитектур между доменами (от компьютерного зрения к прогнозированию событий) сама по себе методологически ценна. Полный текст статьи стоит искать в материалах AAAI 2026.

Мнение редакции dzen.guru

Мне нравится в этой работе не столько конкретный результат (его цифры пока не раскрыты публично), сколько сам ход мысли. Российская команда берёт зрелый, хорошо изученный инструментарий из одной области ИИ и аккуратно адаптирует его для совершенно другой. Это ровно тот подход, который исторически давал самые сильные прорывы: трансформеры тоже начинались как решение для перевода текстов, а сегодня на них работает всё, от генерации изображений до управления роботами. Для тех, кто не пишет код, практический вывод один: когда платформа вроде Дзена или Сбера начнёт точнее предсказывать, что вы сделаете завтра, за этим будут стоять именно такие работы.

Интересно, что самые заметные сдвиги в ИИ последних лет происходили именно на стыке дисциплин. Если команда Sber AI Lab подтвердит метрики на открытых бенчмарках, у российских компаний появится собственный, не зависящий от западных API инструмент для долгосрочного прогнозирования клиентского поведения, а это конкретное конкурентное преимущество, не абстрактная «наука ради науки».

По данным Sber AI Lab (Хабр)

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Prompt injection это угроза каждому 4-му скиллу: как сканер NVIDIA ловит закладки

Промпт-инъекция (prompt injection) это атака, при которой злоумышленник подсовывает ИИ-агенту текст, замаскированный под инструкцию, и агент выполняет чужую…

4 июля в 05:45 МСК6 мин

ИИ агенты и их документация

Документ, который управляет нейросетями вместо вас: как фрилансер из России настроил файл инструкций и перестал бороться с ИИ-агентами. Почему это важно…

4 июля в 05:15 МСК5 мин

Россия строит 38 атомных блоков к 2042 году: атомные станции определят географию ЦОД для ИИ

Правительство России утвердило генеральную схему размещения энергообъектов до 2042 года, и среди 38 новых атомных блоков значительная часть предназначена для…

4 июля в 04:45 МСК5 мин