Почему AI-модели генерируют только вертикальные фото: разбираю разрешение
Рассказываю, почему CivitAI показывает вертикальные AI-фото, какое разрешение работает лучше для Flux и Midjourney, и как правильно выбрать формат.
TL;DR: CivitAI показывает вертикальные фото, потому что модели натренированы на портретах 768×1024. Я объясняю, какие разрешения работают для Flux, Midjourney и Stable Diffusion, и почему горизонталь часто выходит хуже.
Почему все фото на CivitAI вертикальные
Когда открываешь CivitAI, видишь стену вертикальных портретов. Это не совпадение — большинство AI-моделей (особенно для реалистичных персонажей) тренировались на датасетах с портретной ориентацией 768×1024, 832×1216 или 896×1152 пикселей.
Почему так? Потому что в интернете (Instagram, Pinterest, стоковые фото моделей) преобладают вертикальные кадры. AI учится на том, что видит. Если 70% тренировочных изображений — вертикальные портреты девушек в полный рост, модель «запоминает» этот формат как оптимальный.
Я заметила это на своих первых кейсах с Flux: когда пыталась сгенерировать горизонтальный кадр 1216×832 для обложки блога, лица выходили размытыми, а композиция — пустой. Перешла на 832×1216 — сразу четкие детали, правильные пропорции.
Рекомендуемые разрешения для популярных моделей
Flux (Schnell и Dev)
Flux работает лучше всего на разрешениях, кратных 64 пикселям. Мои любимые:
- Вертикаль: 832×1216, 896×1152 (портреты в полный рост)
- Горизонталь: 1216×832, 1344×768 (пейзажи, рум-туры)
- Квадрат: 1024×1024 (Instagram-посты)
Как выбрать? Если тебе нужно лицо крупным планом — бери 768×1024. Для модного лука в полный рост — 832×1216. Горизонталь оставляю для локаций без людей.
Midjourney
Midjourney v6 любит квадрат и легкие отклонения:
- Стандарт: 1024×1024 (universal)
- Портрет: 896×1344 (меньше замыливания на лице)
- Широкий кадр: 1792×1024 (для групповых фото)
Важно: Midjourney не имеет fixed resolution, но соотношение сторон влияет на композицию. Если пишешь --ar 2:3, получишь вертикаль около 896×1344.
Stable Diffusion 1.5 / SDXL
SD 1.5 тренировался на 512×512, но я никогда не генерирую на базовом разрешении — слишком мало деталей. Использую:
- SD 1.5 + upscale: 768×1024 → потом Ultimate SD Upscale до 1536×2048
- SDXL: 1024×1024 (native), можно 896×1152 для портретов
Совет: если модель требует 512×512, сразу добавляй Hires.fix или ControlNet Tile для апскейла — иначе увидишь пикселизацию.
Влияет ли разрешение на детали
Да, но не линейно. Вот что я заметила:
- 512×512 → 768×1024: разница огромная — появляются текстуры кожи, волосы не выглядят как пластик.
- 768×1024 → 1024×1536: детали добавляются, но менее драматично. Часто возникают артефакты (лишние пальцы, удвоение глаз).
- 1536×2048+: модель начинает «придумывать» детали, которых не было в промпте. Например, могут появиться случайные тату или измениться цвет глаз.
Мой воркфлоу: генерирую на 832×1216, потом апскейлю через Magnific AI или Topaz Gigapixel до нужного размера для печати (3000×4000 пикселей).
Как выбрать разрешение в зависимости от сюжета
Я создала для себя шпаргалку:
Портрет крупным планом (лицо + плечи):
768×1024 (Flux), 896×1152 (SDXL)
Полный рост (модный лук, студийное фото):
832×1216 (Flux), 896×1344 (Midjourney)
Групповое фото (2-3 человека):
1344×768 горизонталь или 1024×1024 квадрат
Пейзаж / интерьер:
1216×832 или 1536×864 (широкий кадр)
Instagram-карусель:
1080×1080 (квадрат, потом crop в Photoshop)
Пример: для персональной AI-фотосессии я всегда начинаю с вертикальных 832×1216 — клиентки хотят фото для профиля в Instagram, где вертикаль выглядит лучше.
Почему горизонтальные AI-фото часто выходят хуже
Горизонталь — это слабое место многих моделей. Причины:
- Дисбаланс датасета: модели видели мало горизонтальных портретов во время тренировки.
- Пустое пространство: AI не знает, чем заполнить бока кадра — добавляет размытый фон или дублирует элементы.
- Деформация лица: на широком кадре лицо может «растянуться» или потерять симметрию.
Как исправить? Используй ControlNet Canny или Depth для контроля композиции. Или генерируй вертикаль, а потом расширяй через Outpainting (Photoshop Generative Fill или ComfyUI).
Вот промпт для горизонтального кадра, который сработал у меня:
A young woman sitting on a beige linen sofa, wide shot, cinematic composition, natural window light from left, minimalist Scandinavian interior, warm tones, shallow depth of field, 35mm lens, --ar 16:9
Универсальное разрешение: существует ли
Нет универсального решения, но если нужно выбрать одно — бери 1024×1024. Почему:
- Работает для всех моделей (Flux, Midjourney, SDXL)
- Легко кропить под Instagram (1:1) или расширять под портрет (4:5)
- Быстрее генерируется, чем высокие разрешения
- Меньше артефактов, чем на 1536×2048
Но я редко использую квадрат — для блога нужны вертикальные обложки 832×1216, поэтому сразу генерирую в целевом формате.
Мой чеклист перед генерацией
Перед каждым AI-фото я задаю себе 3 вопроса:
- Где будет использовано фото? (Instagram → вертикаль, блог → горизонталь)
- Что в кадре? (лицо → 768×1024, полный рост → 832×1216)
- Какая модель? (Flux любит 832, Midjourney — 896)
Если сомневаюсь — генерирую 3 варианта: вертикаль, горизонталь, квадрат. Потом выбираю лучший.
Для сложных кейсов (например, AI-фото для печати на холсте 60×90 см) сначала генерирую на 832×1216, потом апскейлю через Magnific AI с настройкой "Portraits" до 4000×6000 пикселей. Это стоит $0.20 за фото, но результат как с профессиональной камеры.
FAQ
Почему CivitAI показывает только вертикальные AI-фото?
Потому что популярные модели (RealisticVision, DreamShaper) тренировались на портретных датасетах 768×1024. Вертикаль дает меньше артефактов и лучшую детализацию лица.
Какое разрешение лучше для Flux?
832×1216 для портретов в полный рост, 1024×1024 для квадратных фото. Избегай разрешений, не кратных 64 пикселям — могут появиться шумы.
Большее разрешение = больше деталей?
До определенного предела — да. После 1536×2048 модели начинают "придумывать" детали, которых не было в промпте. Лучше генерировать 832×1216 и апскейлить.
Почему горизонтальные AI-фото выходят хуже?
Модели редко видели горизонтальные портреты во время тренировки. AI не знает, чем заполнить бока кадра — добавляет размытие или дублирует элементы.
Какое универсальное разрешение для всех моделей?
1024×1024 — работает для Flux, Midjourney, SDXL. Но если нужна вертикаль для Instagram — сразу бери 832×1216, чтобы не кропить.
Если хочешь получить AI-фото в идеальном разрешении без экспериментов — закажи персональную AI-фотосессию. Я подбираю формат под твои цели: Instagram, LinkedIn, печать на холсте или аватарка для Telegram. Разрешение, композиция, ретушь — все включено.
Понравилась статья?
Подпишись на телеграм — там промпты, гайды и персональные рекомендации.