UA RU
Tools

ComfyUI HY-World2: панорамні AI-фото без 24 ГБ VRAM — тестую оновлення

Новий нод ComfyUI HY-World2 генерує 360° панорами на звичайній відеокарті. Показую, як встановити, які моделі працюють і чому це змінює гру.

ComfyUI HY-World2: панорамні AI-фото без 24 ГБ VRAM — тестую оновлення
ComfyUI HY-World2: панорамні AI-фото без 24 ГБ VRAM — тестую оновлення

TL;DR: Нод HY-World2 для ComfyUI тепер генерує якісні 360° панорами навіть на 8 ГБ VRAM завдяки автоматичній компіляції та новим моделям World Stereo Light. Ставлю, тестую і показую, де це реально працює.

Чому я взагалі звернула увагу на панорами

Міняю локації у фотосесіях кожні 2 тижні — інтер'єри, вулиці, природа. Класичні AI-моделі дають мені квадрат чи портрет, але ніколи — повноцінний простір навколо. Хотіла зробити 360° фон для VR-проєкту клієнтки (весільний блог), але Midjourney й Flux не вміють у панорами без швів.

Побачила апдейт ComfyUI HY-World2 на Reddit — автор обіцяв, що тепер:

  • не треба 24 ГБ VRAM (у мене RTX 3070 Ti з 8 ГБ),
  • автоматична компіляція модулів (раніше ламалася на кожному кроці),
  • нові моделі World Stereo Light для стерео-панорам.

Вирішила протестувати — чи це маркетинг, чи реально працює.

Що таке HY-World і навіщо він у ComfyUI

HY-World — це розширення для Stable Diffusion, яке перетворює звичайну генерацію в equirectangular-панораму (формат 2:1, як у Google Street View). Раніше треба було:

  1. Генерувати фрагменти окремо.
  2. Зшивати їх у Photoshop.
  3. Виправляти шви вручну.

Нод HY-World2 робить це за один прохід — модель одразу «розуміє», що ліва і права межі мають з'єднатися без артефактів.

Для чого я це використовую:

  • Фони для композитних зйомок (підставляю модель у панораму — виглядає, ніби вона всередині локації).
  • Референси для 3D-художників (клієнтка робить віртуальні тури квартир).
  • Експерименти з іммерсивним контентом для Instagram (360° Stories поки рідкість).

Як встановити HY-World2 у ComfyUI (без танців з бубном)

Раніше я витратила 3 години на компіляцію diff-gaussian-rasterization і simple-knn — щоразу падали помилки з CUDA. Тепер:

Крок 1: Встанови нод через ComfyUI Manager

  1. Відкрий ComfyUI → ManagerInstall Custom Nodes.
  2. Шукай ComfyUI_HYWorld2.
  3. Натискай Install — Manager сам завантажить репозиторій.

Крок 2: Дочекайся автокомпіляції

Після перезапуску ComfyUI:

  • Консоль покаже Compiling diff-gaussian-rasterization...
  • Це займе 5-15 хвилин (залежить від CPU).
  • НЕ закривай вікно — процес іде у фоні.

У мене на Ryzen 7 5800X зайняло 8 хвилин. Раніше я ламала це 4 рази, поки не знайшла правильну версію Visual Studio Build Tools.

Крок 3: Завантаж моделі

Автор рекомендує:

  • Juggernaut XL (base-модель для реалістичних панорам).
  • World Stereo Light (нова модель для стерео-ефектів — поки в експерименті).

Завантажуй через Civitai, клади в ComfyUI/models/checkpoints/.

Мій перший тест: генерація панорами кафе

Взяла промпт для інтер'єру, який зазвичай використовую у Flux:

Cozy Parisian cafe interior, wooden tables, vintage chairs, morning sunlight through large windows, croissants on counter, equirectangular 360 panorama, architectural photography, 8K

Налаштування:

  • Модель: Juggernaut XL
  • Роздільність: 2048×1024 (стандарт для equirect)
  • Sampler: DPM++ 2M Karras, 30 кроків
  • CFG: 7

Результат:

  • VRAM: пік 7.2 ГБ (раніше HY-World жер 18+).
  • Час: 2 хв 40 сек.
  • Якість: шви майже непомітні — ліва і права межі злилися без артефактів.

Де зламалося:

  • Двері на задньому плані «роздвоїлися» (модель не зрозуміла геометрію).
  • Вікна мали різну яскравість з обох боків.

Виправила через inpainting — перегенерувала проблемну зону з маскою.

World Stereo Light: що нового у стерео-моделях

Автор додав World Stereo Light — полегшену версію для генерації стереоскопічних панорам (окремі зображення для лівого і правого ока). Це потрібно для VR-контенту.

Тестую промпт для природи:

Icelandic black sand beach, volcanic rocks, dramatic storm clouds, crashing waves, moss-covered cliffs, stereo equirectangular, cinematic atmosphere, volumetric lighting

Що вийшло:

  • Модель згенерувала 2 панорами (L/R).
  • Глибина реалістична — скелі «виступають» ближче, хвилі — далі.
  • Але: хмари іноді не збігалися між оком — треба було зменшити CFG до 5.

Це ще сира фіча, але для VR-прототипів уже можна використовувати.

Порівняння: HY-World2 vs Skybox AI vs Blockade Labs

Я тестувала 3 інструменти для панорам:

Критерій HY-World2 Skybox AI Blockade Labs
Ціна Безкоштовно (локально) $10/міс $20/міс
Контроль Повний (промпт + нод) Обмежений Обмежений
VRAM 8 ГБ+ Хмара Хмара
Швидкість 2-3 хв 30 сек 1 хв
Якість швів 8/10 9/10 9/10

Мій вердикт:

  • Для клієнтів — Skybox AI (швидко, без налаштувань).
  • Для експериментів — HY-World2 (безкоштовно, можна крутити параметри).
  • Для VR — HY-World2 (тільки він дає стерео локально).

Де я використала панорами у реальних проєктах

Кейс 1: Весільний блог у VR

Клієнтка хотіла віртуальний тур по банкетному залу для своїх передплатниць. Я:

  1. Згенерувала 5 панорам різних інтер'єрів (класика, лофт, прованс).
  2. Імпортувала у Unity як skybox.
  3. Додала 3D-моделі столів і декору.

Результат: вона отримала інтерактивний тур за 3 дні, замість 2 тижнів на фотозйомку реальних локацій.

Кейс 2: Фон для композитної фотосесії

Знімала модель на зеленому фоні, потім:

  1. Згенерувала панораму токійської вулиці вночі (неонові вивіски, дощ).
  2. У Photoshop розгорнула панораму в перспективу через фільтр Polar Coordinates.
  3. Підставила модель — вийшов ефект, ніби вона стоїть посеред Сібуя.

Клієнтка думала, що я літала в Японію. Насправді — 20 хвилин у ComfyUI.

Де HY-World2 ще не дотягує

Проблеми, які я зустріла:

  1. Людські фігури ламаються на швах — якщо персонаж стоїть біля межі панорами, його обличчя може «розірватися». Рішення: генерую панораму без людей, додаю їх окремо через inpainting.

  2. Текст і логотипи розмиті — модель не вміє у чіткі написи на вивісках. Треба дорисовувати вручну.

  3. Стерео-моделі жруть 12+ ГБ — World Stereo Light заявлена як «легка», але на 8 ГБ не влізла. Довелося зменшити роздільність до 1536×768.

Чи варто переходити на HY-World2 прямо зараз

Так, якщо:

  • Тобі потрібні панорами для VR/AR.
  • Ти вже працюєш у ComfyUI і хочеш розширити можливості.
  • Маєш 8+ ГБ VRAM і готова чекати 2-3 хвилини на генерацію.

Ні, якщо:

  • Тобі потрібно швидко — Skybox AI генерує за 30 секунд.
  • Ти не хочеш розбиратися з нодами (HY-World2 — не для новачків).
  • Працюєш тільки з flat-зображеннями (панорами — специфічний формат).

Хочеш навчитися генерувати AI-фото для своїх проєктів? Я веду персональні консультації — розбираємо твої кейси, підбираємо інструменти і промпти під твої задачі. Пиши!


FAQ: HY-World2 і панорамна генерація

1. Чи можна використовувати HY-World2 на MacBook?

Теоретично так, але компіляція модулів на macOS часто падає. Рекомендую спробувати через Docker або віддалений сервер з Linux.

2. Скільки VRAM потрібно для стерео-панорам?

World Stereo Light вимагає мінімум 10 ГБ для роздільності 2048×1024. На 8 ГБ зменшуй до 1536×768.

3. Як експортувати панораму для Instagram 360°?

Збережи як JPEG 2:1, завантаж через мобільний додаток Instagram → вибери «360 Photo». Але: Instagram часто обрізає панорами — тестуй спочатку у Stories.

4. Чи можна використовувати LoRA з HY-World2?

Так, але деякі LoRA ламають геометрію швів. Тестуй з CFG 5-6 і уникай LoRA для персонажів (вони конфліктують з equirectangular-проєкцією).

5. Що робити, якщо компіляція зависла?

Закрий ComfyUI, видали папку ComfyUI/custom_nodes/ComfyUI_HYWorld2/build/, перезапусти. Переконайся, що встановлена CUDA Toolkit 11.8+ і Visual Studio Build Tools (Windows) або GCC 9+ (Linux).

Сподобалась стаття?

Підпишись на телеграм, щоб отримати ще промпти, гайди й персональні рекомендації.

Усі статті

Залиш заявку

Напиши — і я зв'яжуся з тобою у Telegram або по телефону протягом дня з деталями оплати та доступом до матеріалів.