UA RU
Інструкції

Чому AI-моделі генерують тільки вертикальні фото: розбираю роздільну здатність

Розповідаю, чому CivitAI показує вертикальні AI-фото, яка роздільна здатність працює краще для Flux і Midjourney, і як правильно вибрати формат.

Чому AI-моделі генерують тільки вертикальні фото: розбираю роздільну здатність
Чому AI-моделі генерують тільки вертикальні фото: розбираю роздільну здатність

TL;DR: CivitAI показує вертикальні фото, бо моделі натреновані на портретах 768×1024. Я пояснюю, які роздільності працюють для Flux, Midjourney і Stable Diffusion, і чому горизонталь часто виходить гірше.

Чому всі фото на CivitAI вертикальні

Коли відкриваєш CivitAI, бачиш стіну вертикальних портретів. Це не збіг — більшість AI-моделей (особливо для реалістичних персонажів) тренувалися на датасетах із портретною орієнтацією 768×1024, 832×1216 або 896×1152 пікселів.

Чому так? Бо в інтернеті (Instagram, Pinterest, стокові фото моделей) переважають вертикальні кадри. AI вчиться на тому, що бачить. Якщо 70% тренувальних зображень — вертикальні портрети дівчат у повний зріст, модель «запам'ятовує» цей формат як оптимальний.

Я помітила це на своїх перших кейсах із Flux: коли намагалася згенерувати горизонтальний кадр 1216×832 для обкладинки блогу, обличчя виходили розмитими, а композиція — порожньою. Перейшла на 832×1216 — одразу чіткі деталі, правильні пропорції.

Рекомендовані роздільності для популярних моделей

Flux (Schnell і Dev)

Flux працює краще за все на роздільностях, кратних 64 пікселям. Мої улюблені:

  • Вертикаль: 832×1216, 896×1152 (портрети в повний зріст)
  • Горизонталь: 1216×832, 1344×768 (пейзажі, рум-тури)
  • Квадрат: 1024×1024 (Instagram-пости)

Як вибрати? Якщо тобі потрібна особа великим планом — бери 768×1024. Для модного луку в повний зріст — 832×1216. Горизонталь залишаю для локацій без людей.

Midjourney

Midjourney v6 любить квадрат і легкі відхилення:

  • Стандарт: 1024×1024 (universal)
  • Портрет: 896×1344 (менше кроплення на обличчі)
  • Широкий кадр: 1792×1024 (для групових фото)

Важливо: Midjourney не має fixed resolution, але співвідношення сторін впливає на композицію. Якщо пишеш --ar 2:3, отримаєш вертикаль близько 896×1344.

Stable Diffusion 1.5 / SDXL

SD 1.5 тренувався на 512×512, але я ніколи не генерую на базовій роздільності — занадто мало деталей. Використовую:

  • SD 1.5 + upscale: 768×1024 → потім Ultimate SD Upscale до 1536×2048
  • SDXL: 1024×1024 (native), можна 896×1152 для портретів

Порада: якщо модель вимагає 512×512, одразу додавай Hires.fix або ControlNet Tile для апскейлу — інакше побачиш пікселізацію.

Чи впливає роздільна здатність на деталі

Так, але не лінійно. Ось що я помітила:

  • 512×512 → 768×1024: різниця величезна — з'являються текстури шкіри, волосся не виглядає як пластик.
  • 768×1024 → 1024×1536: деталі додаються, але менш драматично. Часто виникають артефакти (зайві пальці, подвоєння очей).
  • 1536×2048+: модель починає «вигадувати» деталі, яких не було в промпті. Наприклад, можуть з'явитися випадкові тату або змінитися колір очей.

Мій воркфлоу: генерую на 832×1216, потім апскейлю через Magnific AI або Topaz Gigapixel до потрібного розміру для друку (3000×4000 пікселів).

Як вибрати роздільність залежно від сюжету

Я створила для себе шпаргалку:

Портрет великим планом (обличчя + плечі):
768×1024 (Flux), 896×1152 (SDXL)

Повний зріст (модний лук, студійне фото):
832×1216 (Flux), 896×1344 (Midjourney)

Групове фото (2-3 особи):
1344×768 горизонталь або 1024×1024 квадрат

Пейзаж / інтер'єр:
1216×832 або 1536×864 (широкий кадр)

Instagram-карусель:
1080×1080 (квадрат, потім crop у Photoshop)

Приклад: для персональної AI-фотосесії я завжди починаю з вертикальних 832×1216 — клієнтки хочуть фото для профілю в Instagram, де вертикаль виглядає краще.

Чому горизонтальні AI-фото часто виходять гірше

Горизонталь — це слабке місце багатьох моделей. Причини:

  1. Дисбаланс датасету: моделі бачили мало горизонтальних портретів під час тренування.
  2. Порожній простір: AI не знає, чим заповнити боки кадру — додає розмитий фон або дублює елементи.
  3. Деформація обличчя: на широкому кадрі обличчя може «розтягнутися» або втратити симетрію.

Як виправити? Використовуй ControlNet Canny або Depth для контролю композиції. Або генеруй вертикаль, а потім розширюй через Outpainting (Photoshop Generative Fill або ComfyUI).

Ось промпт для горизонтального кадру, що спрацював у мене:

A young woman sitting on a beige linen sofa, wide shot, cinematic composition, natural window light from left, minimalist Scandinavian interior, warm tones, shallow depth of field, 35mm lens, --ar 16:9

Універсальна роздільна здатність: чи існує

Немає універсального рішення, але якщо треба вибрати одну — бери 1024×1024. Чому:

  • Працює для всіх моделей (Flux, Midjourney, SDXL)
  • Легко кропити під Instagram (1:1) або розширювати під портрет (4:5)
  • Швидше генерується, ніж високі роздільності
  • Менше артефактів, ніж на 1536×2048

Але я рідко використовую квадрат — для блогу потрібні вертикальні обкладинки 832×1216, тому одразу генерую в цільовому форматі.

Мій чеклист перед генерацією

Перед кожним AI-фото я задаю собі 3 питання:

  1. Де буде використане фото? (Instagram → вертикаль, блог → горизонталь)
  2. Що в кадрі? (обличчя → 768×1024, повний зріст → 832×1216)
  3. Яка модель? (Flux любить 832, Midjourney — 896)

Якщо сумніваюся — генерую 3 варіанти: вертикаль, горизонталь, квадрат. Потім вибираю найкращий.

Для складних кейсів (наприклад, AI-фото для друку на холсті 60×90 см) спочатку генерую на 832×1216, потім апскейлю через Magnific AI з налаштуванням "Portraits" до 4000×6000 пікселів. Це коштує $0.20 за фото, але результат як з професійної камери.


FAQ

Чому CivitAI показує тільки вертикальні AI-фото?
Бо популярні моделі (RealisticVision, DreamShaper) тренувалися на портретних датасетах 768×1024. Вертикаль дає менше артефактів і краще деталізацію обличчя.

Яка роздільна здатність краща для Flux?
832×1216 для портретів у повний зріст, 1024×1024 для квадратних фото. Уникай роздільностей, не кратних 64 пікселям — можуть з'явитися шуми.

Чи більша роздільність = більше деталей?
До певної межі — так. Після 1536×2048 моделі починають "вигадувати" деталі, яких не було в промпті. Краще генерувати 832×1216 і апскейлити.

Чому горизонтальні AI-фото виходять гірше?
Моделі рідко бачили горизонтальні портрети під час тренування. AI не знає, чим заповнити боки кадру — додає розмиття або дублює елементи.

Яка універсальна роздільність для всіх моделей?
1024×1024 — працює для Flux, Midjourney, SDXL. Але якщо потрібна вертикаль для Instagram — одразу бери 832×1216, щоб не кропити.


Якщо хочеш отримати AI-фото в ідеальній роздільності без експериментів — замов персональну AI-фотосесію. Я підбираю формат під твої цілі: Instagram, LinkedIn, друк на холсті або аватарка для Telegram. Роздільність, композиція, ретуш — все включено.

Сподобалась стаття?

Підпишись на телеграм, щоб отримати ще промпти, гайди й персональні рекомендації.

Усі статті

Залиш заявку

Напиши — і я зв'яжуся з тобою у Telegram або по телефону протягом дня з деталями оплати та доступом до матеріалів.