UA RU
Инструкции

Почему AI-модели генерируют только вертикальные фото: разбираю разрешение

Рассказываю, почему CivitAI показывает вертикальные AI-фото, какое разрешение работает лучше для Flux и Midjourney, и как правильно выбрать формат.

Почему AI-модели генерируют только вертикальные фото: разбираю разрешение
Почему AI-модели генерируют только вертикальные фото: разбираю разрешение

TL;DR: CivitAI показывает вертикальные фото, потому что модели натренированы на портретах 768×1024. Я объясняю, какие разрешения работают для Flux, Midjourney и Stable Diffusion, и почему горизонталь часто выходит хуже.

Почему все фото на CivitAI вертикальные

Когда открываешь CivitAI, видишь стену вертикальных портретов. Это не совпадение — большинство AI-моделей (особенно для реалистичных персонажей) тренировались на датасетах с портретной ориентацией 768×1024, 832×1216 или 896×1152 пикселей.

Почему так? Потому что в интернете (Instagram, Pinterest, стоковые фото моделей) преобладают вертикальные кадры. AI учится на том, что видит. Если 70% тренировочных изображений — вертикальные портреты девушек в полный рост, модель «запоминает» этот формат как оптимальный.

Я заметила это на своих первых кейсах с Flux: когда пыталась сгенерировать горизонтальный кадр 1216×832 для обложки блога, лица выходили размытыми, а композиция — пустой. Перешла на 832×1216 — сразу четкие детали, правильные пропорции.

Рекомендуемые разрешения для популярных моделей

Flux (Schnell и Dev)

Flux работает лучше всего на разрешениях, кратных 64 пикселям. Мои любимые:

  • Вертикаль: 832×1216, 896×1152 (портреты в полный рост)
  • Горизонталь: 1216×832, 1344×768 (пейзажи, рум-туры)
  • Квадрат: 1024×1024 (Instagram-посты)

Как выбрать? Если тебе нужно лицо крупным планом — бери 768×1024. Для модного лука в полный рост — 832×1216. Горизонталь оставляю для локаций без людей.

Midjourney

Midjourney v6 любит квадрат и легкие отклонения:

  • Стандарт: 1024×1024 (universal)
  • Портрет: 896×1344 (меньше замыливания на лице)
  • Широкий кадр: 1792×1024 (для групповых фото)

Важно: Midjourney не имеет fixed resolution, но соотношение сторон влияет на композицию. Если пишешь --ar 2:3, получишь вертикаль около 896×1344.

Stable Diffusion 1.5 / SDXL

SD 1.5 тренировался на 512×512, но я никогда не генерирую на базовом разрешении — слишком мало деталей. Использую:

  • SD 1.5 + upscale: 768×1024 → потом Ultimate SD Upscale до 1536×2048
  • SDXL: 1024×1024 (native), можно 896×1152 для портретов

Совет: если модель требует 512×512, сразу добавляй Hires.fix или ControlNet Tile для апскейла — иначе увидишь пикселизацию.

Влияет ли разрешение на детали

Да, но не линейно. Вот что я заметила:

  • 512×512 → 768×1024: разница огромная — появляются текстуры кожи, волосы не выглядят как пластик.
  • 768×1024 → 1024×1536: детали добавляются, но менее драматично. Часто возникают артефакты (лишние пальцы, удвоение глаз).
  • 1536×2048+: модель начинает «придумывать» детали, которых не было в промпте. Например, могут появиться случайные тату или измениться цвет глаз.

Мой воркфлоу: генерирую на 832×1216, потом апскейлю через Magnific AI или Topaz Gigapixel до нужного размера для печати (3000×4000 пикселей).

Как выбрать разрешение в зависимости от сюжета

Я создала для себя шпаргалку:

Портрет крупным планом (лицо + плечи):
768×1024 (Flux), 896×1152 (SDXL)

Полный рост (модный лук, студийное фото):
832×1216 (Flux), 896×1344 (Midjourney)

Групповое фото (2-3 человека):
1344×768 горизонталь или 1024×1024 квадрат

Пейзаж / интерьер:
1216×832 или 1536×864 (широкий кадр)

Instagram-карусель:
1080×1080 (квадрат, потом crop в Photoshop)

Пример: для персональной AI-фотосессии я всегда начинаю с вертикальных 832×1216 — клиентки хотят фото для профиля в Instagram, где вертикаль выглядит лучше.

Почему горизонтальные AI-фото часто выходят хуже

Горизонталь — это слабое место многих моделей. Причины:

  1. Дисбаланс датасета: модели видели мало горизонтальных портретов во время тренировки.
  2. Пустое пространство: AI не знает, чем заполнить бока кадра — добавляет размытый фон или дублирует элементы.
  3. Деформация лица: на широком кадре лицо может «растянуться» или потерять симметрию.

Как исправить? Используй ControlNet Canny или Depth для контроля композиции. Или генерируй вертикаль, а потом расширяй через Outpainting (Photoshop Generative Fill или ComfyUI).

Вот промпт для горизонтального кадра, который сработал у меня:

A young woman sitting on a beige linen sofa, wide shot, cinematic composition, natural window light from left, minimalist Scandinavian interior, warm tones, shallow depth of field, 35mm lens, --ar 16:9

Универсальное разрешение: существует ли

Нет универсального решения, но если нужно выбрать одно — бери 1024×1024. Почему:

  • Работает для всех моделей (Flux, Midjourney, SDXL)
  • Легко кропить под Instagram (1:1) или расширять под портрет (4:5)
  • Быстрее генерируется, чем высокие разрешения
  • Меньше артефактов, чем на 1536×2048

Но я редко использую квадрат — для блога нужны вертикальные обложки 832×1216, поэтому сразу генерирую в целевом формате.

Мой чеклист перед генерацией

Перед каждым AI-фото я задаю себе 3 вопроса:

  1. Где будет использовано фото? (Instagram → вертикаль, блог → горизонталь)
  2. Что в кадре? (лицо → 768×1024, полный рост → 832×1216)
  3. Какая модель? (Flux любит 832, Midjourney — 896)

Если сомневаюсь — генерирую 3 варианта: вертикаль, горизонталь, квадрат. Потом выбираю лучший.

Для сложных кейсов (например, AI-фото для печати на холсте 60×90 см) сначала генерирую на 832×1216, потом апскейлю через Magnific AI с настройкой "Portraits" до 4000×6000 пикселей. Это стоит $0.20 за фото, но результат как с профессиональной камеры.


FAQ

Почему CivitAI показывает только вертикальные AI-фото?
Потому что популярные модели (RealisticVision, DreamShaper) тренировались на портретных датасетах 768×1024. Вертикаль дает меньше артефактов и лучшую детализацию лица.

Какое разрешение лучше для Flux?
832×1216 для портретов в полный рост, 1024×1024 для квадратных фото. Избегай разрешений, не кратных 64 пикселям — могут появиться шумы.

Большее разрешение = больше деталей?
До определенного предела — да. После 1536×2048 модели начинают "придумывать" детали, которых не было в промпте. Лучше генерировать 832×1216 и апскейлить.

Почему горизонтальные AI-фото выходят хуже?
Модели редко видели горизонтальные портреты во время тренировки. AI не знает, чем заполнить бока кадра — добавляет размытие или дублирует элементы.

Какое универсальное разрешение для всех моделей?
1024×1024 — работает для Flux, Midjourney, SDXL. Но если нужна вертикаль для Instagram — сразу бери 832×1216, чтобы не кропить.


Если хочешь получить AI-фото в идеальном разрешении без экспериментов — закажи персональную AI-фотосессию. Я подбираю формат под твои цели: Instagram, LinkedIn, печать на холсте или аватарка для Telegram. Разрешение, композиция, ретушь — все включено.

Понравилась статья?

Подпишись на телеграм — там промпты, гайды и персональные рекомендации.

Все статьи

Залиш заявку

Напиши — і я зв'яжуся з тобою у Telegram або по телефону протягом дня з деталями оплати та доступом до матеріалів.