Игорь Градов
Игорь Градов
5 мин
ai

SmartDocs ускоряет распознавание текста в 30 раз: ИИ не только читает документ, но и понимает его

Компания SmartDocs представила систему распознавания документов на базе мультимодальной модели (модели, которая одновременно «видит» изображение и «понимает» текст), заточенную под реальные задачи российского бизнеса, от мятых фотографий договоров до пожелтевших архивов советской эпохи.

SmartDocs ускоряет распознавание текста в 30 раз: ИИ не только читает документ, но и понимает его
Почему это важно

Классическое распознавание текста (OCR, optical character recognition) умеет превращать картинку в буквы, но не понимает, что эти буквы значат. SmartDocs заявляет, что решает обе задачи: и читает, и извлекает нужные данные, номер договора, сумму, контрагента, и раскладывает их по полям учётной системы.

До сих пор большинство компаний в России обрабатывают входящие документы вручную: сотрудник открывает скан или фотографию, находит нужные реквизиты, переносит их в ERP (систему управления ресурсами предприятия) или таблицу и проверяет за собой. По данным разработчиков SmartDocs, в крупных организациях на это уходят десятки тысяч часов в год. Продукт обещает сократить обработку одного документа с 30 секунд до 1 секунды, то есть примерно в 30 раз.

Что Когда Кто выпустил Цена
SmartDocs, система распознавания и атрибутирования документов на мультимодальной модели Доступна сейчас (точную дату запуска разработчик не называет) SmartDocs (Россия) Не раскрыта, предлагают тест на ваших документах

Что умеет SmartDocs и чем это отличается от обычного OCR?

Разработчики разделяют два процесса, которые часто путают.

  • Распознавание (OCR): система видит скан и определяет буквы. С чистыми и ровными документами справляется и классический OCR.
  • Атрибутирование: система понимает смысл текста и извлекает конкретные поля, номер, дату, сумму, контрагента, артикулы, и складывает их в нужную структуру. Для этого уже нужна мультимодальная модель, именно она лежит в основе SmartDocs.

Вот какие типы документов разработчики показывают в качестве рабочих кейсов:

  • Фотографии договоров с телефона, кривые, с тенями, частично смазанные. Система вытаскивает номер договора, дату, стороны и сумму.
  • Счета-фактуры в любом виде (скан, PDF, фото). Извлекаются номер, дата, контрагент, позиции, суммы, НДС. Результат готов к загрузке в учётную систему.
  • Пэкинг-листы (упаковочные листы) с десятками позиций, артикулами, весами, кодами. Кейс пришёл от логистической компании, работающей с международными поставками.
  • Распознавание рукописного текста: резолюции на письмах, пометки на полях, старые рукописные письма целиком. Система не просто распознаёт символы, а извлекает смысл, утверждают разработчики.
  • Этикетки с круговым текстом, мелким шрифтом и сложным фоном, то, с чем классический OCR почти не справляется.
  • Старые документы советской эпохи: технологические инструкции, чертежи, регламенты 30-40-летней давности. Система переводит их в цифровой формат (HTML или Word). Один из клиентов, компания, проектирующая двигатели, хранит тысячи страниц таких архивов.

Стоит отметить, что все перечисленные кейсы описаны самими разработчиками. Независимых тестов или сравнительных замеров в источнике нет.

Как попробовать?

  1. Перейдите на сайт SmartDocs (ссылку разработчик предоставляет по запросу, публичный URL в источнике не указан).
  2. Загрузите свой документ: скан, PDF или фотографию.
  3. Посмотрите, какие атрибуты система извлечёт и в какую структуру их разложит.
  4. Оцените, подходит ли результат для загрузки в вашу учётную систему или таблицу.

SmartDocs и другие инструменты: что есть в России?

Для понимания контекста: на российском рынке давно работают сервисы распознавания текста. Вот как они соотносятся по заявленным возможностям.

Возможность SmartDocs ABBYY FineReader Яндекс Vision OCR
Распознавание печатного текста Да Да Да
Распознавание рукописного текста Да (с пониманием контекста, по заявлению разработчиков) Частично Частично
Атрибутирование (извлечение полей: номер, дата, сумма) Да, на мультимодальной модели Через шаблоны Нет из коробки
Советские архивы, пожелтевшие документы Да (кейс описан) Ограниченно Не заявлено
Круговой текст на этикетках Да (кейс описан) Нет Нет
Доступность в РФ Да, российский продукт Да (с ограничениями после 2022) Да

Оговорка: данные по SmartDocs взяты из описания разработчика. По ABBYY и Яндексу приведены общеизвестные характеристики продуктов. Прямого сравнения на одних и тех же документах в источнике нет.

Что делать с этим прямо сейчас, по ролям?

Автору на Дзене. Если вы работаете с архивами, расшифровываете старые документы для исторических или краеведческих статей, подобные инструменты экономят часы. Загрузите пробный документ и проверьте, насколько точно система читает рукописный текст, прежде чем переносить вручную.

Бухгалтеру и предпринимателю. Счета-фактуры и первичка, главный кандидат на автоматизацию. Если в вашей компании кто-то каждый день вбивает реквизиты из сканов в 1С, попросите демо на ваших документах. Разница между 30 секундами и 1 секундой на документ при потоке в сотни штук в день, это реальное высвобождение людей.

Маркетологу. Распознавание этикеток и упаковки может пригодиться для мониторинга конкурентов или каталогизации продукции. Пока это нишевая функция, но она заявлена как рабочая.

Мнение редакции dzen.guru

Заявленные возможности выглядят сильно, особенно распознавание рукописного текста и советских архивов. По моему опыту, именно на таких документах «ломаются» большинство OCR-сервисов. Но я хочу быть честным: все кейсы в источнике описаны самим разработчиком, без независимой проверки и без конкретных цифр точности распознавания (процент ошибок, сравнение с конкурентами на одних данных). Я бы рекомендовал загрузить 5-10 своих самых «сложных» документов и посмотреть на результат, прежде чем принимать решение о внедрении. Бесплатный тест на своих файлах, это минимум, который стоит сделать уже сегодня.

Частые вопросы

Чем SmartDocs отличается от Google NotebookLM?

NotebookLM работает с уже оцифрованными текстами: вы загружаете PDF с текстовым слоем, и система помогает анализировать содержимое. SmartDocs решает другую задачу: берёт изображение (фото, скан) и сначала распознаёт текст, а затем извлекает из него структурированные данные. Это инструмент не для анализа, а для оцифровки и атрибутирования.

Работает ли система с рукописным текстом на русском языке?

По заявлению разработчиков, да. В описанных кейсах упоминаются рукописные резолюции, пометки на полях и полностью рукописные старые письма. Система не просто распознаёт символы, а извлекает смысл из контекста, утверждают создатели. Независимых тестов точности распознавания рукописного текста в источнике не приводится.

Сколько стоит SmartDocs?

Цену разработчик публично не раскрывает. Предлагается протестировать систему на своих документах, после чего, судя по описанию, обсуждаются условия. Для оценки экономики посчитайте, сколько часов в месяц ваши сотрудники тратят на ручной ввод данных из документов, и сравните с предложением.

Если в вашей компании до сих пор кто-то каждое утро вручную перебивает реквизиты из сканов, это тот случай, когда стоит потратить полчаса на тест, а не ещё один год на ручной труд.

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

Локальная нейросеть на ПК с 4 ГБ видеопамяти: пошаговая настройка без облака и подписок
ai

Локальная нейросеть на ПК с 4 ГБ видеопамяти: пошаговая настройка без облака и подписок

Локальная нейросеть на домашнем ПК с Windows 11 решает конкретную задачу: вы получаете языковую модель, которая работает без облака, без подписки и без…

7 мин
37% новых треков на Яндекс Музыке сгенерированы: нейросеть для создания музыки научились детектить без GPU
ai

37% новых треков на Яндекс Музыке сгенерированы: нейросеть для создания музыки научились детектить без GPU

Нейросеть для создания музыки бесплатно генерирует треки, которые уже составляют больше трети новых релизов на Яндекс Музыке, и теперь есть способ отличить их…

5 мин
ai

Компьютерное зрение на палубе судна: как трёхуровневая валидация убирает ложные тревоги

Компьютерное зрение (computer vision, технология, позволяющая нейросети «видеть» и анализировать изображения с камер) на открытой палубе судна сталкивается с…

7 мин