Сделать картинку на основе фото нейросеть
Сделать картинку на основе фото нейросеть позволяет за считанные минуты: достаточно загрузить исходное изображение, описать желаемый результат текстовым запросом и выбрать подходящий сервис. Среди популярных инструментов для работы с фото выделяются Кандинский (Kandinsky), Миджорни (Midjourney) и МиниМакс (Minimax), каждый со своими сильными сторонами.

За последний год я протестировал более двух десятков нейросетей для генерации изображений по фотографии. Проверял на реальных задачах: стилизация портретов, создание иллюстраций для блогов, подготовка визуалов для соцсетей. В этом гайде покажу конкретные шаги, разберу плюсы и минусы ключевых сервисов и дам работающие формулы промптов. Вы получите пошаговую инструкцию, которую сможете применить сразу после прочтения.
Как сделать картинку на основе фото нейросеть: с чего начать?
Начать стоит с выбора задачи и подходящего инструмента. Нейросети для обработки фото делятся на две большие группы: те, что меняют стиль существующего изображения, и те, что генерируют новое изображение с использованием фото как референса. Понимание этой разницы сэкономит время и избавит от разочарований.
Стилизация берёт ваше фото и «перерисовывает» его, сохраняя композицию и основные формы. Генерация по референсу использует фото как отправную точку, создавая совершенно новое изображение. Например, из обычного портрета можно получить мультяшный аватар (стилизация) или полноценную иллюстрацию в стиле фэнтези, где узнаваемы лишь черты лица (генерация по референсу).
Чтобы создать ИИ картинку по фото онлайн, не нужно устанавливать программы или разбираться в коде. Большинство сервисов работают прямо в браузере. Вот что потребуется для старта:
- Исходное фото: чем выше качество и чётче объект, тем лучше результат
- Текстовый запрос (промпт): описание желаемого результата на русском или английском языке
- Выбранный сервис: бесплатный или платный, в зависимости от задач
- Несколько минут терпения: генерация одного изображения занимает от 10 до 90 секунд
Главный принцип: качество результата на 70% зависит от промпта и на 30% от исходного фото. Даже лучшая нейросеть выдаст посредственный результат при размытом запросе. Поэтому разберём инструменты и правила составления промптов подробно.
Кандинский 3.1 (Kandinsky), бесплатная нейросеть от «Сбера»
Что умеет Кандинский и кому подойдёт?
Кандинский 3.1 (Kandinsky) от «Сбера», полностью бесплатный генератор изображений, который хорошо понимает запросы на русском языке. Для многих пользователей это самый простой способ сделать картинку на основе фото нейросеть без финансовых вложений. Сервис доступен через сайт FusionBrain и мобильное приложение.
Модель поддерживает несколько режимов работы с фотографиями. Можно загрузить исходное изображение и задать степень влияния: чем выше параметр, тем сильнее результат будет отличаться от оригинала. По нашему опыту, оптимальное значение для стилизации составляет от 0.4 до 0.6, а для серьёзной трансформации подойдут значения от 0.7 до 0.9.
Сильные стороны Кандинского:
- Полностью бесплатный без скрытых лимитов на количество генераций
- Русскоязычные промпты обрабатываются корректно, не нужно переводить на английский
- Несколько стилей на выбор: живопись, аниме, детальное фото, цифровое искусство
- Быстрая генерация: результат готов за 15 до 30 секунд
- Не требует регистрации для базового использования через сайт
Ограничения тоже стоит знать. Кандинский уступает платным конкурентам в детализации мелких элементов: руки, пальцы, текст на изображении. Сложные многофигурные композиции иногда получаются с артефактами. Для профессиональных задач, возможно, потребуется дополнительная доработка.
Начните именно с Кандинского, если пробуете генерацию впервые. Бесплатный доступ и русский интерфейс позволят разобраться в принципах без вложений, а потом при необходимости перейти к более мощным инструментам.
Подробнее о возможностях бесплатных генераторов можно узнать в нашем обзоре нейросетей для генерации изображений.
Как создать изображение: правильный запрос к нейросети?
Правильный промпт состоит из четырёх компонентов: объект, стиль, детали и технические параметры. Именно структурированный запрос отличает качественный результат от случайного. Запомните формулу: «Кто/что + в каком стиле + какие детали + какое настроение».
Формула промпта для генерации по фото
Базовая формула выглядит так: [описание объекта на фото] + [желаемый стиль] + [детали окружения] + [освещение и настроение]. Например, вместо «сделай красиво» напишите «портрет женщины в стиле масляной живописи эпохи Возрождения, мягкое боковое освещение, тёплые тона, детализированный фон с колоннами». Чем конкретнее запрос, тем точнее результат.
Вот примеры промптов разного уровня детализации:
- Слабый промпт: «Сделай из фото картину» (результат непредсказуем)
- Средний промпт: «Портрет в стиле аниме, яркие цвета» (результат приемлем, но без характера)
- Сильный промпт: «Портрет в стиле студии Гибли (Studio Ghibli), мягкие пастельные тона, фон с цветущей сакурой, тёплый солнечный свет, акварельная текстура» (результат детализирован и стилистически точен)
Отдельно о негативных промптах. Многие сервисы позволяют указать, чего не должно быть на изображении. Этот параметр сильно влияет на качество. Типичные элементы для исключения:
- Деформации: «лишние пальцы, размытые лица, двойные конечности»
- Качество: «низкое разрешение, пикселизация, шум»
- Стиль: «мультяшный» (если нужен реализм) или «фотореалистичный» (если нужен арт)
По данным базы dzen.guru, использование негативного промпта улучшает результат с первой попытки примерно в двух случаях из трёх. Без него часто приходится перегенерировать изображение от 3 до 5 раз.
Промпт на английском языке почти всегда даёт более точный результат, чем на русском, даже в Кандинском. Если сервис поддерживает оба языка, попробуйте английскую версию запроса и сравните.
Как создать картинку с текстом при помощи нейросети?
Добавление текста на сгенерированное изображение остаётся одной из самых сложных задач для нейросетей. Большинство моделей плохо справляются с надписями: буквы искажаются, слова становятся нечитаемыми. Но есть рабочие подходы, которые дают приемлемый результат.
Первый подход: генерировать изображение отдельно, а текст добавлять в графическом редакторе. Это самый надёжный способ. Нейросеть создаёт визуальную часть, а надпись вы наносите в Канве (Canva), Фотошопе (Photoshop) или даже встроенном редакторе телефона. Результат всегда чистый и читаемый.
Второй подход: использовать модели, которые лучше других работают с текстом. По результатам тестирования, наиболее стабильно текст на изображениях генерируют:
- Миджорни версии 6 и выше (Midjourney v6+): корректно отображает короткие надписи на английском
- DALL-E 3 через ЧатГПТ (ChatGPT): хорошо работает с текстом, особенно при чётком указании содержания
- Идеограм (Ideogram): специально оптимизирован для текста на изображениях
Третий подход: указывать текст в промпте с максимальной точностью. Используйте формулировку: «text "Ваш текст" written on [место]». Ограничивайте надпись двумя, максимум тремя словами. Длинные фразы нейросети почти гарантированно исказят.
Для тех, кто готовит визуалы для Дзена или социальных сетей, рекомендую комбинированный метод. Генерируем фон и основное изображение нейросетью, а текст, логотип и элементы оформления добавляем вручную. Более детально работу с визуальным контентом для блогов разбираем в статье о нейросетях для создания контента.
Как создать изображение с Миджорни (Midjourney) и МиниМакс (Minimax)?
Миджорни (Midjourney): для максимального качества
Миджорни (Midjourney) считается эталоном качества среди генераторов изображений. Сервис работает через собственный сайт и ДискордБот (Discord-бот). Для работы с фото используется функция /describe (распознаёт содержимое фото и предлагает промпт) и загрузка изображения как референса через прямую ссылку.
Чтобы создать ИИ картинку по фото онлайн в Миджорни, загрузите фото, скопируйте его ссылку и добавьте в промпт. Параметр --iw (image weight, «вес» изображения) регулирует, насколько сильно результат будет опираться на оригинал. Значения от 0.5 до 1.0 дают баланс между узнаваемостью фото и творческой переработкой.
Преимущества Миджорни:
- Высочайшая детализация и фотореалистичность
- Гибкие параметры управления стилем, пропорциями, «весом» референса
- Активное сообщество, готовые коллекции промптов и стилей
Минусы: платная подписка (от 10 долларов в месяц), интерфейс на английском, промпты лучше писать тоже на английском.
МиниМакс (Minimax): новый игрок с сильным видео
МиниМакс (Minimax) привлекает внимание прежде всего возможностью генерации видео, но и с изображениями работает достойно. Сервис позволяет загрузить фото и трансформировать его с помощью текстового описания. Интерфейс проще, чем у Миджорни, порог входа ниже.
МиниМакс хорошо подходит для задач, где нужна не просто картинка, а анимация или короткий видеоролик на основе фотографии. Загружаете фото, описываете движение или сцену, и получаете несколько секунд видео. Для статичных изображений качество приемлемое, но уступает Миджорни в детализации текстур и сложных композиций.
| Критерий | Кандинский 3.1 (Kandinsky) | Миджорни (Midjourney) | МиниМакс (Minimax) |
|---|---|---|---|
| Стоимость | Бесплатно | От 10 $/мес | Есть бесплатный тариф |
| Язык промптов | Русский, английский | Английский | Английский, русский (частично) |
| Работа с фото-референсом | Да, загрузка + ползунок влияния | Да, через ссылку + параметр --iw | Да, загрузка в интерфейсе |
| Качество стилизации | Хорошее | Отличное | Хорошее |
| Генерация видео | Нет | Нет | Да |
| Скорость генерации | От 15 до 30 сек | От 30 до 60 сек | От 20 до 90 сек |
| Интерфейс на русском | Да | Нет | Частично |
Выбор инструмента зависит от задачи. Для быстрых экспериментов и русскоязычных промптов подойдёт Кандинский. Для профессионального качества и контроля над результатом выбирайте Миджорни. Для задач с видео и анимацией попробуйте МиниМакс.
Пошаговая инструкция: как сделать картинку на основе фото нейросеть
Ниже приведён универсальный алгоритм, который работает для большинства сервисов. Конкретные кнопки и названия меню могут отличаться, но логика остаётся одинаковой. Инструкция проверена на Кандинском, Миджорни и МиниМакс.
- Подготовьте фотографию. Выберите снимок с хорошим освещением и чётким основным объектом. Разрешение от 1024 на 1024 пикселей и выше. Уберите лишние элементы: водяные знаки, рамки, надписи. Чем «чище» исходник, тем точнее нейросеть распознает содержимое.
- Откройте выбранный сервис. Для Кандинского зайдите на FusionBrain.ai. Для Миджорни откройте midjourney.com или Дискорд-сервер. Для МиниМакс используйте minimax.io. Зарегистрируйтесь, если требуется.
- Загрузите фото. Найдите функцию загрузки изображения. В Кандинском это кнопка «Загрузить изображение» под полем промпта. В Миджорни перетащите фото в чат и скопируйте ссылку. В МиниМакс нажмите иконку прикрепления файла.
- Настройте степень влияния фото. Если сервис позволяет регулировать «вес» референса, начните со среднего значения (от 0.4 до 0.6). Низкие значения дают больше свободы нейросети, высокие сохраняют сходство с оригиналом.
- Напишите промпт. Используйте формулу: объект + стиль + детали + настроение. Пример: «Женщина в стиле поп-арт, яркие контрастные цвета, крупный план, фон с геометрическими фигурами». Добавьте негативный промпт, если сервис поддерживает.
- Запустите генерацию. Нажмите кнопку генерации и подождите. Первый результат может не попасть в цель. Это нормально.
- Оцените и скорректируйте. Если результат далёк от ожиданий, измените промпт: добавьте или уберите детали, скорректируйте степень влияния фото. Обычно от 2 до 4 итераций достаточно для хорошего результата.
- Скачайте и доработайте. Сохраните финальное изображение. При необходимости добавьте текст, обрежьте или отредактируйте в графическом редакторе.
Загрузил обычное фото рабочего стола в Кандинский, написал промпт «уютное рабочее место дизайнера в стиле изометрической иллюстрации, пастельные тона, мягкие тени». Степень влияния фото: 0.5. Третья итерация дала отличный результат для обложки блога. Весь процесс занял около 4 минут.
Эта инструкция работает как отправная точка. Каждый сервис добавляет свои уникальные функции: вариации, увеличение разрешения (upscale), редактирование отдельных частей изображения (inpainting). Осваивайте их постепенно, начиная с базового процесса.
Если вы хотите автоматизировать подготовку промптов и не тратить время на подбор формулировок, попробуйте генератор промптов dzen.guru. Он помогает составить структурированный запрос для разных нейросетей за несколько секунд.
Преимущества и недостатки генерации картинок по фото
Прежде чем встроить нейросети в рабочий процесс, полезно трезво оценить, что они дают и где пока пасуют. По нашему опыту тестирования инструментов для авторов и блогеров, картина такая.
Что реально работает хорошо:
- Скорость. Стилизация или трансформация фото занимает минуты вместо часов работы дизайнера
- Доступность. Не нужны навыки рисования, знание графических программ или большой бюджет
- Вариативность. Из одного фото можно получить десятки разных стилей и интерпретаций за один сеанс
- Идея и визуализация. Нейросеть превращает абстрактные концепции в конкретные изображения, что полезно для мозговых штурмов и прототипов
- Уникальность. Каждое сгенерированное изображение уникально, проблем с авторскими правами на сам результат обычно не возникает
Где нейросети пока слабы:
- Анатомическая точность. Руки, пальцы, зубы, мелкие детали тела часто генерируются с ошибками
- Текст на изображениях. Надписи искажаются, буквы путаются, слова становятся нечитаемыми
- Повторяемость. Сложно получить серию изображений в абсолютно одинаковом стиле для единообразного оформления
- Контроль деталей. Нейросеть может «додумать» элементы, которых вы не хотели видеть на картинке
- Этические вопросы. Генерация реалистичных изображений людей поднимает вопросы дипфейков и манипуляций
Оптимальный подход: использовать нейросеть как первый этап, а финальную доработку выполнять вручную. Это сочетает скорость ИИ с контролем человека над результатом. Для большинства задач блогера или контент-мейкера такая связка закрывает потребности полностью.
Если вы генерируете изображения реальных людей (по фотографии), убедитесь, что у вас есть их согласие. Использование чужих фото без разрешения для создания стилизованных портретов может нарушать права на изображение, особенно при коммерческом применении.
Больше практических приёмов работы с нейросетями для визуального контента собрано в нашем руководстве по ИИ-инструментам для блогеров.
Часто задаваемые вопросы (FAQ)
Можно ли сделать картинку на основе фото нейросеть бесплатно?
Да, бесплатно доступны Кандинский 3.1 (Kandinsky) от «Сбера» и ряд других сервисов с ограниченными бесплатными тарифами. Кандинский не устанавливает лимит на количество генераций, что делает его лучшим выбором для экспериментов. Платные сервисы вроде Миджорни предлагают более высокое качество, но для большинства бытовых задач бесплатных инструментов достаточно.
Какой формат и размер фото лучше загружать?
Оптимальный формат: JPEG или PNG с разрешением от 1024 на 1024 пикселей. Слишком маленькие фото (менее 512 пикселей по стороне) дают размытые результаты, так как нейросети не хватает информации для анализа. Снимок должен быть хорошо освещён, а главный объект чётко виден без обрезки важных деталей.
Почему нейросеть искажает лицо на фото при генерации?
Искажения лиц возникают, когда степень влияния фото установлена слишком низко или промпт содержит противоречивые описания. Попробуйте увеличить «вес» исходного изображения (параметр image weight) до 0.7 и выше. Также помогает добавление в промпт фразы «сохранить черты лица» и исключение в негативном промпте «деформированные лица, асимметрия».
Можно ли использовать сгенерированные картинки для коммерческих целей?
Зависит от условий сервиса. Миджорни разрешает коммерческое использование на платных тарифах. Кандинский предоставляет права на использование результатов, но стоит проверять актуальную лицензию на сайте. Главное ограничение: нельзя использовать чужие фотографии без разрешения правообладателя, даже если результат сильно отличается от оригинала.
Сколько времени уходит на получение качественного результата?
Одна генерация занимает от 15 до 90 секунд в зависимости от сервиса. Но для качественного результата обычно требуется от 2 до 5 итераций с корректировкой промпта. По нашему опыту, весь процесс от загрузки фото до финального сохранения занимает от 5 до 15 минут. С практикой скорость растёт: опытные пользователи часто попадают в цель со второй попытки.

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».
Читайте также

Живое фото онлайн бесплатно без регистрации на русском
Живое фото онлайн бесплатно без регистрации на русском можно создать за пару минут с помощью нейросетей, которые анимируют статичные снимки прямо в браузере. Достаточно загрузить изображение, выбрать...

Живое фото сделать онлайн
Живое фото сделать онлайн можно с помощью нейросетей, которые анализируют статичное изображение и добавляют к нему реалистичное движение: поворот головы, моргание, колыхание волос или фона. Для этого...

Запуск deepseek r1 локально
Запуск DeepSeek R1 локально позволяет использовать мощную языковую модель с открытым исходным кодом прямо на своём компьютере, без облачных сервисов и подписок. Для этого достаточно бесплатной...