Игорь Градов

30 марта 2026 г.· Обновлено 13 апреля 2026 г.5 мин

Я сделал 127 LoRA для Stable Diffusion: показываю пошаговый алгоритм

Я обучаю нейросеть новым трюкам. LoRA это маленький файл, который доучивает Stable Diffusion. Показываю ваш персонаж, стиль, предмет. Модель запоминает и генерирует их в любых сценах. Я прошёл путь от первой корявой модели до отточенного конвейера. Расскажу, как сделать свою lora для stable diffusion без магии, только практика.

Как работает LoRA на практике?

Вы показываете нейросети 20-50 картинок. Пишете, что на них. Запускаете обучение на несколько часов. Получаете файл на 50-150 МБ. Подключаете его к Stable Diffusion. Используете ключевое слово в промпте. Система рисует ваш концепт.

Ключевое правило

Качество модели определяет датасет. Я трачу 80% времени на сбор и разметку картинок. Остальное, технические настройки.

Что вы получаете со своей LoRA?

Базовая нейросень рисует абстрактных людей и предметы. Ваша LoRA учит её конкретике.

Без своей модели вы не сможете стабильно генерировать:

Уникальных персонажей. Вашего героя комикса или лицо реального человека.
Дизайнерские предметы. Конкретную модель кроссовок или форму стула.
Узнаваемые стили. Манеру рисования друга-художника или корпоративную графику.

Полное обучение модели требует тысяч снимков и серверов. LoRA точечно корректирует готовую нейросеть. Это в десятки раз быстрее и дешевле.

Три параметра, которые нужно понять

Я объясню просто. Ранг, эпохи, скорость обучения это настройки “восприимчивости” модели.

Ранг (Rank). Сложность урока. Ранг 4-16 для простых стилей. Ранг 32-128 для детальных лиц.
Эпохи (Epochs). Количество повторений урока. Слишком много: модель перестаёт думать, начинает тупо копировать.
Скорость обучения (Learning Rate). Скорость усвоения. Высокая скорость: модель проскакивает суть. Низкая. учится вечность.

На чём учить LoRA в 2026 году?

Процесс стал проще. Выбирайте локальный компьютер или облачный сервис.

Локальные программы (нужна видеокарта)

Stable Diffusion WebUI. Плагин Kohya SS встроен в интерфейс. Мой стандартный выбор для дома.
ComfyUI + ComfyLLM. Гибкий конструктор для сложных задач. Требует технического склада ума.

Облака (аренда мощности)

Я арендую видеокарты на несколько часов. Не нужно настраивать систему.

Сервис	Плюсы	Минусы	Примерная стоимость за обучение
RunPod	Мощные GPU, оплата за секунды	Работа через Jupyter Notebook	От $0.8
Vast.ai	Часто дешевле конкурентов	Сложный интерфейс для новичка	От $0.6
Banana.dev	Полная автоматизация, API	Мало настроек под специфичные задачи	От $1.5

Рекомендация

Начните с Kohya SS GUI в Stable Diffusion WebUI. Видеокарта NVIDIA с 8+ ГБ памяти (например, RTX 3060). Вы поймёте логику всего процесса.

Подготовка датасета: мой алгоритм

Я собрал 127 моделей. Качество каждой начиналось здесь.

Соберите 20-50 изображений. Лицо человека: 30-40 фото с разных ракурсов. Стиль: 20-30 картинок.
Обработайте снимки. Приведите к квадрату (512x512, 768x768). Используйте встроенный препроцессинг в Kohya.
Напишите текстовые описания. К каждому файлу. Это инструкция для нейросети, что запомнить.

Пример промпта для изображения персонажа

face_01.jpg создайте face_01.txt с текстом: photo of a woman, [Varya:0.9], looking at viewer, smiling, portrait, detailed eyes, studio lighting Здесь [Varya:0.9], уникальное слово-триггер для вашей модели.Для файла

Как оценить качество LoRA?

Не доверяйте одной красивой картинке. Нужна система проверки.

Цифры (Loss, Checkpoint)

Loss (потери). График в логах обучения. Кривая должна плавно падать и выходить на плато. Скачки: сигнал проблемы.
Контрольные точки (Checkpoints). Сохранённые версии модели через каждые N эпох. Позволяют выбрать лучший результат.

Практика (тест-промпты)

Я создал набор из 15 тестовых запросов. Генерирую изображения на каждой контрольной точке.

Тест-промпт	Что проверяем	Критерий успеха
`[Varya]`	Узнаваемость	Лицо соответствует оригиналу
`[Varya] in a cyberpunk city`	Гибкость	Концепт вписался в новую сцену
`portrait of [Varya] and a man`	Совместимость	Оба лица качественные, нет артефактов
`[Varya], [style:watercolor]`	Работу с другими LoRA	Стиль и персонаж сочетаются

Внимание

Не оценивайте модель только по промпту [Varya]. Нейросеть могла выучить картинки датасета, а не концепт. Проверяйте в новых условиях.

Чек-лист: как сделать свою lora для stable diffusion

Я прошёл этот путь 127 раз. Довёл до алгоритма.

Определите цель. Чётко: лицо, персонаж целиком, стиль или предмет.
Соберите датасет. 20-50 изображений в высоком разрешении, в одном стиле.
Обработайте изображения. Приведите к одному размеру. Сейчас рекомендую 768x768.
Создайте текстовые описания. Для каждого .jpg файла свой .txt с деталями и триггерным словом.
Настройте Kohya SS GUI. Выберите базовую модель (например, SDXL 1.0), укажите путь к датасету.
Задайте параметры обучения. Ранг: 16-32 для лиц, 8-16 для стилей. Эпохи: 10-20. Скорость обучения: 0.0001.
Запустите обучение. Следите за графиком loss.
Протестируйте контрольные точки. Генерируйте картинки по тестовым промптам для каждой сохранённой версии.
Выберите лучшую версию. Та, где концепт узнаваем, но нет переобучения.
Интегрируйте LoRA в работу. Используйте триггерное слово в промптах Stable Diffusion.

Мои ошибки и как их избежать

Я наступил на все грабли. Вот самые частые провалы.

Ошибка 1: Плохой датасет

Проявление. LoRA рисует размыто или нестабильно.
Причина. Картинки разного стиля (аниме + фото), низкого разрешения, с логотипами.
Решение. Потратьте основное время на отбор. Датасет должен быть чистым и однородным.

Ошибка 2: Переобучение

Проявление. Модель копирует картинки из датасета, но не создаёт новое.
Причина. Слишком много эпох (100 вместо 15) или высокий ранг для простой задачи.
Решение. Обучайте с сохранением каждой эпохи. После 10-й начинайте тестировать. Качество перестало расти: остановка.

Пример параметров для обучения стиля живописи

Базовая модель: sd_xl_base_1.0.safetensors
Ранг (Rank): 12
Эпохи (Epochs): 15
Скорость обучения (Learning Rate): 0.0003
Размер пакета (Batch Size): 2
Разрешение: 1024x1024

Реальный кейс: LoRA для персонажа комикса

Задача. Создать устойчивого персонажа «Астра» для веб-комикса. Действия. Собрал 42 изображения с набросков автора. Апускейлил, привёл к 1024x1024. Написал детальные описания, упор на костюм и лицо. Обучил на RunPod (RTX 4090) за 2 часа 17 минут и $1.8. Результат. LoRA весом 86 МБ. Триггер [astra] стабильно генерирует героя в любой сцене. Автор сократил время отрисовки страниц на 40%. Нейросеть готовит скетчи.

Мой честный провал: я переобучил модель на коте друга. Получилась нейросеть-обезьянка, которая вставляла эту морду везде, даже в портреты людей. Пришлось начинать заново.

Частые вопросы (FAQ)

Как сделать свою лору для stable diffusion без мощной видеокарты?

Используйте облака: RunPod или Vast.ai. Арендуйте RTX 4090 на несколько часов. Загрузите датасет в готовый образ с Kohya SS. Обучите модель. Стоимость, от $0.6 за сессию. Дешевле, чем покупать железо.

Как создать лору для stable diffusion без переобучения?

Секрет в ранней остановке. Сохраняйте контрольные точки каждую эпоху. После 5-й эпохи тестируйте модель на новых промптах. Качество на новых запросах перестало расти, обучение закончено. Это оптимальная точка.

Итог: как системно улучшить процесс

Чтобы делать качественные LoRA, превратите процесс в конвейер.

Стандартизируйте сбор датасета. Чек-лист требований к изображениям.
Автоматизируйте препроцессинг. Скрипт для ресайза и обрезки.
Ведите журнал экспериментов. Записывайте параметры и результат каждой модели. Через 10-15 запусков увидите закономерности.
Создайте свой набор тест-промптов. Это ваш эталон для проверки.

Каждая следующая LoRA получается лучше. Накопительный эффект через 20-30 моделей сократит время создания с 8 часов до 2-3. : Игорь Градов, dzen.guru

Главный вывод: как сделать свою lora для stable diffusion это технологичный процесс. Качество на 90% определяет дисциплина на этапах подготовки и тестирования. Начните с простого концепта, пройдите чек-лист, проанализируйте ошибки. Вы получите инструмент, который расширит творческие возможности.

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Жанры музыки для suno ai

Жанры музыки для Suno AI определяют звучание, настроение и стилистику генерируемого трека. Правильный выбор жанра и его комбинация с дополнительными тегами стиля позволяют получить результат,...

8 апреля 2026 г.16 мин· 1 комм.

ИИ инструментыРабота с изображениями

Живое фото онлайн бесплатно без регистрации на русском

Живое фото онлайн бесплатно без регистрации на русском можно создать за пару минут с помощью нейросетей, которые анимируют статичные снимки прямо в браузере. Достаточно загрузить изображение, выбрать...

8 апреля 2026 г.7 мин

Работа с изображениями

Живое фото сделать онлайн

Живое фото сделать онлайн можно с помощью нейросетей, которые анализируют статичное изображение и добавляют к нему реалистичное движение: поворот головы, моргание, колыхание волос или фона. Для этого...

8 апреля 2026 г.8 мин