UA RU
Инструменты

ComfyUI HY-World2: панорамные AI-фото без 24 ГБ VRAM — тестирую обновление

Новый нод ComfyUI HY-World2 генерирует 360° панорамы на обычной видеокарте. Показываю, как установить, какие модели работают и почему это меняет игру.

ComfyUI HY-World2: панорамные AI-фото без 24 ГБ VRAM — тестирую обновление
ComfyUI HY-World2: панорамные AI-фото без 24 ГБ VRAM — тестирую обновление

TL;DR: Нод HY-World2 для ComfyUI теперь генерирует качественные 360° панорамы даже на 8 ГБ VRAM благодаря автоматической компиляции и новым моделям World Stereo Light. Устанавливаю, тестирую и показываю, где это реально работает.

Почему я вообще обратила внимание на панорамы

Меняю локации на фотосессиях каждые 2 недели — интерьеры, улицы, природа. Классические AI-модели дают мне квадрат или портрет, но никогда — полноценное пространство вокруг. Хотела сделать 360° фон для VR-проекта клиентки (свадебный блог), но Midjourney и Flux не умеют в панорамы без швов.

Увидела апдейт ComfyUI HY-World2 на Reddit — автор обещал, что теперь:

  • не нужно 24 ГБ VRAM (у меня RTX 3070 Ti с 8 ГБ),
  • автоматическая компиляция модулей (раньше ломалась на каждом шаге),
  • новые модели World Stereo Light для стерео-панорам.

Решила протестировать — это маркетинг или реально работает.

Что такое HY-World и зачем он в ComfyUI

HY-World — это расширение для Stable Diffusion, которое превращает обычную генерацию в equirectangular-панораму (формат 2:1, как в Google Street View). Раньше нужно было:

  1. Генерировать фрагменты отдельно.
  2. Сшивать их в Photoshop.
  3. Исправлять швы вручную.

Нод HY-World2 делает это за один проход — модель сразу «понимает», что левая и правая границы должны соединиться без артефактов.

Для чего я это использую:

  • Фоны для композитных съемок (подставляю модель в панораму — выглядит, будто она внутри локации).
  • Референсы для 3D-художников (клиентка делает виртуальные туры квартир).
  • Эксперименты с иммерсивным контентом для Instagram (360° Stories пока редкость).

Как установить HY-World2 в ComfyUI (без танцев с бубном)

Раньше я потратила 3 часа на компиляцию diff-gaussian-rasterization и simple-knn — каждый раз падали ошибки с CUDA. Теперь:

Шаг 1: Установи нод через ComfyUI Manager

  1. Открой ComfyUI → ManagerInstall Custom Nodes.
  2. Ищи ComfyUI_HYWorld2.
  3. Нажимай Install — Manager сам скачает репозиторий.

Шаг 2: Дождись автокомпиляции

После перезапуска ComfyUI:

  • Консоль покажет Compiling diff-gaussian-rasterization...
  • Это займет 5-15 минут (зависит от CPU).
  • НЕ закрывай окно — процесс идет в фоне.

У меня на Ryzen 7 5800X заняло 8 минут. Раньше я ломала это 4 раза, пока не нашла правильную версию Visual Studio Build Tools.

Шаг 3: Скачай модели

Автор рекомендует:

  • Juggernaut XL (base-модель для реалистичных панорам).
  • World Stereo Light (новая модель для стерео-эффектов — пока в эксперименте).

Скачивай через Civitai, клади в ComfyUI/models/checkpoints/.

Мой первый тест: генерация панорамы кафе

Взяла промпт для интерьера, который обычно использую в Flux:

Cozy Parisian cafe interior, wooden tables, vintage chairs, morning sunlight through large windows, croissants on counter, equirectangular 360 panorama, architectural photography, 8K

Настройки:

  • Модель: Juggernaut XL
  • Разрешение: 2048×1024 (стандарт для equirect)
  • Sampler: DPM++ 2M Karras, 30 шагов
  • CFG: 7

Результат:

  • VRAM: пик 7.2 ГБ (раньше HY-World жрал 18+).
  • Время: 2 мин 40 сек.
  • Качество: швы почти незаметны — левая и правая границы слились без артефактов.

Где сломалось:

  • Дверь на заднем плане «раздвоилась» (модель не поняла геометрию).
  • Окна имели разную яркость с обеих сторон.

Исправила через inpainting — перегенерировала проблемную зону с маской.

World Stereo Light: что нового в стерео-моделях

Автор добавил World Stereo Light — облегченную версию для генерации стереоскопических панорам (отдельные изображения для левого и правого глаза). Это нужно для VR-контента.

Тестирую промпт для природы:

Icelandic black sand beach, volcanic rocks, dramatic storm clouds, crashing waves, moss-covered cliffs, stereo equirectangular, cinematic atmosphere, volumetric lighting

Что вышло:

  • Модель сгенерировала 2 панорамы (L/R).
  • Глубина реалистичная — скалы «выступают» ближе, волны — дальше.
  • Но: облака иногда не совпадали между глазами — пришлось уменьшить CFG до 5.

Это еще сырая фича, но для VR-прототипов уже можно использовать.

Сравнение: HY-World2 vs Skybox AI vs Blockade Labs

Я тестировала 3 инструмента для панорам:

Критерий HY-World2 Skybox AI Blockade Labs
Цена Бесплатно (локально) $10/мес $20/мес
Контроль Полный (промпт + нод) Ограниченный Ограниченный
VRAM 8 ГБ+ Облако Облако
Скорость 2-3 мин 30 сек 1 мин
Качество швов 8/10 9/10 9/10

Мой вердикт:

  • Для клиентов — Skybox AI (быстро, без настроек).
  • Для экспериментов — HY-World2 (бесплатно, можно крутить параметры).
  • Для VR — HY-World2 (только он дает стерео локально).

Где я использовала панорамы в реальных проектах

Кейс 1: Свадебный блог в VR

Клиентка хотела виртуальный тур по банкетному залу для своих подписчиц. Я:

  1. Сгенерировала 5 панорам разных интерьеров (классика, лофт, прованс).
  2. Импортировала в Unity как skybox.
  3. Добавила 3D-модели столов и декора.

Результат: она получила интерактивный тур за 3 дня, вместо 2 недель на фотосъемку реальных локаций.

Кейс 2: Фон для композитной фотосессии

Снимала модель на зеленом фоне, потом:

  1. Сгенерировала панораму токийской улицы ночью (неоновые вывески, дождь).
  2. В Photoshop развернула панораму в перспективу через фильтр Polar Coordinates.
  3. Подставила модель — вышел эффект, будто она стоит посреди Сибуя.

Клиентка думала, что я летала в Японию. На самом деле — 20 минут в ComfyUI.

Где HY-World2 еще не дотягивает

Проблемы, которые я встретила:

  1. Человеческие фигуры ломаются на швах — если персонаж стоит у границы панорамы, его лицо может «разорваться». Решение: генерирую панораму без людей, добавляю их отдельно через inpainting.

  2. Текст и логотипы размыты — модель не умеет в четкие надписи на вывесках. Надо дорисовывать вручную.

  3. Стерео-модели жрут 12+ ГБ — World Stereo Light заявлена как «легкая», но на 8 ГБ не влезла. Пришлось уменьшить разрешение до 1536×768.

Стоит ли переходить на HY-World2 прямо сейчас

Да, если:

  • Тебе нужны панорамы для VR/AR.
  • Ты уже работаешь в ComfyUI и хочешь расширить возможности.
  • Имеешь 8+ ГБ VRAM и готова ждать 2-3 минуты на генерацию.

Нет, если:

  • Тебе нужно быстро — Skybox AI генерирует за 30 секунд.
  • Ты не хочешь разбираться с нодами (HY-World2 — не для новичков).
  • Работаешь только с flat-изображениями (панорамы — специфический формат).

Хочешь научиться генерировать AI-фото для своих проектов? Я веду персональные консультации — разбираем твои кейсы, подбираем инструменты и промпты под твои задачи. Пиши!


FAQ: HY-World2 и панорамная генерация

1. Можно ли использовать HY-World2 на MacBook?

Теоретически да, но компиляция модулей на macOS часто падает. Рекомендую попробовать через Docker или удаленный сервер с Linux.

2. Сколько VRAM нужно для стерео-панорам?

World Stereo Light требует минимум 10 ГБ для разрешения 2048×1024. На 8 ГБ уменьшай до 1536×768.

3. Как экспортировать панораму для Instagram 360°?

Сохрани как JPEG 2:1, загрузи через мобильное приложение Instagram → выбери «360 Photo». Но: Instagram часто обрезает панорамы — тестируй сначала в Stories.

4. Можно ли использовать LoRA с HY-World2?

Да, но некоторые LoRA ломают геометрию швов. Тестируй с CFG 5-6 и избегай LoRA для персонажей (они конфликтуют с equirectangular-проекцией).

5. Что делать, если компиляция зависла?

Закрой ComfyUI, удали папку ComfyUI/custom_nodes/ComfyUI_HYWorld2/build/, перезапусти. Убедись, что установлена CUDA Toolkit 11.8+ и Visual Studio Build Tools (Windows) или GCC 9+ (Linux).

Понравилась статья?

Подпишись на телеграм — там промпты, гайды и персональные рекомендации.

Все статьи

Залиш заявку

Напиши — і я зв'яжуся з тобою у Telegram або по телефону протягом дня з деталями оплати та доступом до матеріалів.