Игорь Градов
Игорь Градов
6 мин
ai

36 000 файлов за день: создание ИИ-агентов для разбора архива на 222 ГБ

Обработка 36 000 файлов за день вместо «никогда» показывает, как создание ИИ-агентов превращает невыполнимую задачу в управляемый процесс, где человек принимает решения, а машина делает рутину.

36 000 файлов за день: создание ИИ-агентов для разбора архива на 222 ГБ
Почему это важно

Практик взял реальный архив (36 659 файлов, 222 ГБ, 20 лет накоплений в OneDrive, Apple Photos и Gmail) и вместо ручного разбора поручил ИИ-агенту оркестрацию, а локальным моделям тяжёлый перебор, потратив на токены фронтирной модели минимум, а на локальный инференс (вычисления на своём компьютере) почти ноль.

Автор материала на Habr описал кейс, который знаком каждому: файлы копятся годами, лежат в трёх-четырёх сервисах, имена вроде «IMG_4348.JPG», EXIF-данные (метаданные снимка с датой и камерой) частично потеряны. Разобрать руками означает «когда-нибудь», то есть никогда. Триггером стало банальное уведомление «в почте кончается место». Вместо покупки квоты автор запустил агента и за один подход разобрал почту, вытащил фото из писем и причесал архив в OneDrive.

Что понадобится?

  • ИИ-агент-оркестратор. В кейсе использовался Claude Code с моделью Opus 4.8 (закрытая модель Anthropic). Подойдёт любой агентный инструмент, умеющий писать и запускать скрипты: Cursor, Windsurf, аналогичные среды
  • Локальные модели для тяжёлой работы. CLIP (open_clip, ViT-B-32) для грубых тегов содержимого. Запускаются на вашем железе, токены не тратятся
  • Доступ к API сервисов. Gmail API для анализа и чистки почты, OneDrive для загрузки архива, Apple Photos для финального импорта
  • Инструмент дедупликации. czkawka (бесплатный, опенсорсный) для поиска визуальных дублей через перцептивный хэш (сравнение не байт в байт, а по тому, насколько картинки похожи глазу)
  • Время. Настройка и первый прогон заняли один рабочий день. Ручной просмотр 36 000 файлов занял бы недели

Пошаговая инструкция

  1. Начните с почты, а не с архива. Дайте агенту доступ к Gmail API и попросите проанализировать ящик. Агент вернёт раскладку: сколько писем по отправителям, размерам, годам. Это занимает минуты и сразу показывает масштаб проблемы
Проанализируй мой ящик Gmail через API.
Покажи топ-20 отправителей по объёму,
разбивку по годам и типам вложений.
Отдельно выдели письма тяжелее 5 МБ.
  1. Вычистите спам, но только в корзину. Агент определит явный мусор (рекламу, уведомления). В описанном кейсе это было около 9 500 писем. Критически важно: удаляйте только в корзину, не насовсем. Автор кейса чуть не потерял рабочую переписку интернет-магазина, которая формально выглядела как спам. Восстановили одной командой, отправителя занесли в исключения

  2. Вытащите фото из тяжёлых писем и сгруппируйте по событиям. Здесь агент делает больше, чем простое извлечение вложений. Он анализирует темы и содержание писем, выборочно смотрит сами фотографии и предлагает структуру. Файлы из четырёх разных писем с пометками «часть 1», «часть 2» он объединяет в одно событие. Результат: не «папка на письмо», а «папка на реальное событие»

  3. Уберите дубли до любой сортировки. Первое правило большого архива: сначала дедупликация, потом всё остальное. Точные дубли по хэшу не ловят пересохранения и ресайзы. Перцептивный хэш через czkawka сравнивает сами изображения. Агент дополнительно собрал браузерную страничку для ревью: группы похожих кадров с миниатюрами в ряд, лучший по разрешению предвыбран. Остальные уходят в карантин, не удаляются

  4. Протегируйте содержимое локальной моделью. Свалки без имён и дат нельзя разложить по событиям, пока не понимаешь, что на снимках. Модель CLIP (ViT-B-32) запускается локально и присваивает каждому файлу грубые теги содержимого. Фронтирная модель при этом не тратит токены на перебор 36 000 файлов, она только оркестрирует процесс и проверяет качество

  5. Перенесите результат в целевое хранилище. В описанном кейсе всё переезжало в Apple Photos. С массовым импортом скриптом возникли проблемы (Apple Photos плохо дружит с автоматическим импортом), но агент помог их решить. После переноса автор смог отказаться от подписки OneDrive

Главный архитектурный принцип: разделение труда

Агент сам предложил не гнать 36 000 файлов через фронтирную модель. Дословно: «Это и в контекст не влезет, и по токенам разорит». Вместо этого сложилась трёхуровневая схема:

  • Локальные модели перемалывают десятки тысяч файлов почти бесплатно
  • Фронтирный агент пишет одноразовый скрипт под каждый шаг, склеивает инструменты, сам проверяет результат
  • Человек принимает финальные решения и ловит то, что машина знать не может

Именно это делает создание ИИ-агентов для обработки файлов экономически разумным: дорогая модель тратится на логику, дешёвая берёт объём.

Что ввели и что получили

Автор попросил агента проанализировать почту через Gmail API. Агент вернул раскладку по отправителям и размерам, выделил 9 500 мусорных писем и обнаружил, что значительная часть фотоархива осела в тяжёлых вложениях. Дальше агент сам извлёк фото, сгруппировал файлы из разных писем по реальным событиям, а не по дате отправки, и подготовил их к импорту в Apple Photos. На этапе дедупликации из почти одинаковых кадров (пересохранения, ресайзы, серии) оставался лучший по разрешению, остальные уходили в карантин. Итог: 36 659 файлов, 222 ГБ разобраны за один подход вместо «никогда».

Частые ошибки

Удаление без страховки. Автор кейса едва не потерял рабочую историю проекта: рассылка интернет-магазина формально выглядела как спам. Всегда удаляйте только в корзину и проверяйте исключения до финальной чистки.

Попытка пропустить всё через фронтирную модель. 36 000 файлов через Claude или GPT-4 обойдутся в сотни долларов и займут дни. Тяжёлый перебор отдавайте локальным моделям.

Дедупликация после сортировки. Если сначала разложить файлы по папкам, а потом искать дубли, вы получите одинаковые фото в разных папках и запутаетесь ещё сильнее. Сначала дубли, потом структура.

Ожидание, что агент решит всё сам. Агент не знает, какие письма для вас ценны, а какие нет. Финальное решение всегда за человеком. Схема работает именно потому, что человек принимает решения, а машина делает перебор.

Что делать с этим прямо сейчас?

Авторам Дзена. Если у вас накопились тысячи скриншотов, референсов и черновых изображений для статей, попробуйте тот же подход: агент плюс локальная модель для тегирования. Результат применим сразу: найти нужное фото к публикации за секунды вместо минут.

Маркетологам. Архивы рекламных креативов, баннеров, фото для соцсетей копятся точно так же. Создание ИИ-агентов для файловой рутины освобождает часы, которые уходят на поиск «того самого макета из прошлого года».

Предпринимателям в РФ и СНГ. Claude Code пока требует VPN для доступа. Из доступных в России агентных сред можно попробовать Cursor или аналогичные IDE с ИИ-помощником. Для локальных моделей ограничений нет: CLIP и czkawka работают на любом железе без привязки к региону.

Мнение редакции dzen.guru

Этот кейс ценен не технологией, а подходом. Автор не программировал: он разговаривал с агентом, тот сам писал одноразовые скрипты и дёргал нужные инструменты. По сути, это менеджмент, только подчинённый не человек, а модель. По моим наблюдениям, именно такие «мегатаски» (разобрать архив, вычистить базу, структурировать 10 лет документов) станут первым массовым применением агентов для нетехнических пользователей. Но честная оговорка: описанный кейс требует как минимум понимания, что такое API и как запустить скрипт. Для человека, который никогда не открывал терминал, порог входа пока высок. Мы в dzen.guru ждём, когда агентные интерфейсы дорастут до уровня «нажал кнопку и забыл», но пока это скорее инструмент для уверенного пользователя.

Хотите разобраться в ИИ-инструментах для авторов?

В dzen.guru мы тестируем нейросети и агентов на практике и делимся работающими приёмами для тех, кто создаёт контент.

Перейти на dzen.guru

По материалам Habr ML

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

AI-агенты за 15 минут: как развернуть QwenPaw в Google Colab с кастомными скиллами
ai

AI-агенты за 15 минут: как развернуть QwenPaw в Google Colab с кастомными скиллами

QwenPaw позволяет развернуть полноценного ИИ-агента (программу, которая сама выполняет цепочку действий по вашему запросу) прямо в Google Colab за один сеанс,…

5 мин
ai

Obsidian + LLM без копипаста: открытый MCP-сервер связал заметки с нейросетью за 15 минут

Русский разработчик собрал открытый MCP-сервер, который позволяет любому LLM-клиенту напрямую читать, искать и редактировать заметки в хранилище Obsidian, и…

6 мин
Мультимодальная нейросеть Zamba2-VL отвечает в 10 раз быстрее трансформеров: веса открыты
ai

Мультимодальная нейросеть Zamba2-VL отвечает в 10 раз быстрее трансформеров: веса открыты

Microsoft второго июня запустила Project Solara — операционную систему, где ИИ-агенты заменяют привычные приложения, и впервые отдала управление машине, а не…

6 мин