UA RU
Кейсы

AI не может проверить факты: почему я не доверяю ей в работе с клиентками

Пять топовых AI-моделей разошлись в 67% фактов. Рассказываю, как это повлияло на мою работу с AI-фотографией и почему я изменила подход к клиентским брифам.

AI не может проверить факты: почему я не доверяю ей в работе с клиентками
AI не может проверить факты: почему я не доверяю ей в работе с клиентками

TL;DR: Новое исследование показало: пять топовых AI-моделей разошлись в выводах по 67% фактов. Рассказываю, как это повлияло на мою работу с AI-фотографией — от испорченных клиентских брифов до потерянных часов на исправление.

Когда ChatGPT «помог» мне облажаться с клиенткой

В прошлом месяце клиентка заказала AI-фотосессию в стиле «vintage Vogue 1950s». Я, как всегда, попросила ChatGPT быстро проверить референсы эпохи — цвет обложек, типичные позы, макияж. Модель выдала мне подробный список: «красные губы, тонкие брови, pastel backgrounds».

Я сгенерировала 20 фото. Клиентка написала: «Это же не 50-е, это 40-е! Брови слишком тонкие, а фоны — вообще не того оттенка». Я переспросила Claude — он сказал противоположное. Gemini дал третий вариант. Потратила 4 часа на ручной fact-checking через Google Scholar.

Вот тогда я поняла: AI не может быть единственным источником правды в работе, где каждая деталь стоит денег.

Исследование, которое все объяснило

На этой неделе вышло исследование: пять frontier AI-моделей (GPT-4, Claude, Gemini, Llama, еще одна) проверяли 1000 реальных утверждений. Они разошлись в 67% случаев. Две трети!

Это не баг — это фича. AI-модели тренируются на разных датасетах, по-разному интерпретируют контекст и не имеют «единой правды». Они генерируют ответы на основе вероятностей, а не фактов.

Для меня это означало одно: каждый бриф с клиенткой нужно проверять вручную, если там есть исторические, культурные или технические детали.

Три кейса, когда AI меня подвела (и как я это исправила)

1. «Барочный жемчуг» — какой именно?

Клиентка хотела AI-портрет с «baroque pearls». ChatGPT сказал: «irregular, asymmetrical». Claude: «oversized, layered». Midjourney сгенерировал что-то среднее — и клиентка сказала «не то».

Решение: теперь я прошу клиенток присылать визуальные референсы (Pinterest, Instagram), а не текстовые описания. AI-модели лучше работают с img2img, чем с «барочными» терминами.

2. Цвет Pantone года — точный ли он?

В 2024 году Pantone объявил цвет Peach Fuzz. Я спросила три AI-модели: «Какой hex-код Pantone 13-1023?» Получила три разных ответа. Проверила на официальном сайте Pantone — ни один не совпал.

Решение: для брендовых цветов всегда использую первичные источники (сайт бренда, официальный пресс-релиз). AI — только для «похожего настроения», не точных значений.

3. «90s minimalism» — Gap или Jil Sander?

Бриф: «90-е, минимализм, нейтральные тона». ChatGPT выдал Gap-эстетику (casual, denim). Claude — Jil Sander (tailored, luxe). Клиентка имела в виду Jil Sander, но я уже сгенерировала 15 фото в стиле Gap.

Решение: теперь в брифе прошу назвать конкретные бренды/фотографов/эры. «90-е минимализм» — слишком широко. «Jil Sander FW 1995» — конкретно.

Почему это критично для AI-фотографии (а не только для fact-checking)

Мы, AI-фотографы, работаем на грани креатива и технических деталей. Клиентки платят за точность настроения, а не абстрактную «красоту». Если я сгенерирую «vintage Chanel», а клиентка имела в виду «vintage Dior» — это не просто ошибка, это потерянные деньги и репутация.

AI-модели не понимают нюансов, которые критичны для нашей работы:

  • Разница между «blush pink» и «dusty rose»
  • Почему «90s grunge» в Сиэтле — не то же самое, что в Лондоне
  • Какие именно «thin eyebrows» были в 1920-х vs 1990-х

Они выдают «усредненный» ответ, который часто технически правильный, но контекстуально ложный.

Мой новый рабочий процесс: как я использую AI после этого

Теперь я делю работу на два этапа:

Этап 1: Сбор идей (AI)

  • Прошу ChatGPT/Claude набросать общие направления
  • Генерирую списки возможных стилей, эпох, референсов
  • Использую как brainstorming-инструмент, не источник правды

Этап 2: Верификация (я сама)

  • Проверяю каждый факт через Google Scholar, официальные сайты, archive.org
  • Ищу визуальные первичные источники (музейные коллекции, оригинальные журналы)
  • Если сомневаюсь — спрашиваю у клиентки, что именно она имеет в виду

Так я трачу на 30% больше времени на подготовку, но экономлю 90% времени на исправление ошибок после генерации.

Промпт, который помогает уменьшить расхождения

Я не могу заставить AI сходиться в фактах, но могу попросить ее показать источники неуверенности:

You are a fact-checking assistant for a professional AI photographer.
I will give you a client brief with historical/cultural/technical details.
For each detail:
1. Provide your interpretation
2. List 2-3 alternative interpretations (if any)
3. Mark uncertainty level: LOW / MEDIUM / HIGH
4. Suggest primary sources to verify (museum archives, official brand sites, etc.)

Client brief: [тут вставляешь бриф]

Этот промпт не дает мне правду, но показывает, где AI сомневается — и я знаю, что именно нужно проверить вручную.

Что это означает для будущего AI-фотографии

Исследование с 67% расхождений — это не «AI плохо работает». Это напоминание, что AI — инструмент, а не эксперт.

В нашей сфере это особенно важно, потому что мы продаем не только картинку, но и контекст, настроение, историю. Если я говорю клиентке «это authentic 1920s flapper style», она ожидает, что я знаю, о чем говорю — а не просто повторяю то, что сказал ChatGPT.

Мой вывод после этого кейса: AI — для скорости, человек — для точности. Я больше не доверяю моделям в работе с клиентскими брифами без двойной проверки. И мои клиентки теперь получают то, что заказывали — а не то, что «AI считает похожим».


Хочешь научиться работать с AI-фотографией профессионально — без ошибок и потерянных клиенток? Я рассказываю о своих кейсах, инструментах и рабочих процессах в персональных консультациях. Помогу настроить твой workflow так, чтобы AI работала на тебя, а не против.

FAQ

Можно ли вообще доверять AI в работе с клиентками? Да, но только на этапе brainstorming и генерации идей. Факты, исторические детали, технические спецификации — всегда проверяй вручную через первичные источники.

Какие AI-модели самые точные для fact-checking? Исследование показало, что все пять топовых моделей (GPT-4, Claude, Gemini, Llama, другие) разошлись в 67% случаев. Нет «самой точной» — они работают на вероятностях, а не фактах.

Как проверить, правильно ли AI интерпретировала бриф клиентки? Проси клиентку прислать визуальные референсы (фото, Pinterest-доски). Если она использует термины («baroque», «minimalism») — уточни конкретные бренды, эпохи, имена дизайнеров.

Что делать, если уже сгенерировала фото по неправильному брифу? Признай ошибку, объясни, что произошло, предложи бесплатную ревизию. Я всегда делала так — и клиентки ценили честность больше, чем идеальный результат с первого раза.

Стоит ли отказываться от AI из-за такой низкой точности? Нет. AI — мощный инструмент для креатива, но не для фактов. Используй ее для генерации идей, быстрого драфта, экспериментов — а проверку оставь себе. Это и есть профессионализм.

Понравилась статья?

Подпишись на телеграм — там промпты, гайды и персональные рекомендации.

Все статьи

Залиш заявку

Напиши — і я зв'яжуся з тобою у Telegram або по телефону протягом дня з деталями оплати та доступом до матеріалів.