AI не может проверить факты: почему я не доверяю ей в работе с клиентками
Пять топовых AI-моделей разошлись в 67% фактов. Рассказываю, как это повлияло на мою работу с AI-фотографией и почему я изменила подход к клиентским брифам.
TL;DR: Новое исследование показало: пять топовых AI-моделей разошлись в выводах по 67% фактов. Рассказываю, как это повлияло на мою работу с AI-фотографией — от испорченных клиентских брифов до потерянных часов на исправление.
Когда ChatGPT «помог» мне облажаться с клиенткой
В прошлом месяце клиентка заказала AI-фотосессию в стиле «vintage Vogue 1950s». Я, как всегда, попросила ChatGPT быстро проверить референсы эпохи — цвет обложек, типичные позы, макияж. Модель выдала мне подробный список: «красные губы, тонкие брови, pastel backgrounds».
Я сгенерировала 20 фото. Клиентка написала: «Это же не 50-е, это 40-е! Брови слишком тонкие, а фоны — вообще не того оттенка». Я переспросила Claude — он сказал противоположное. Gemini дал третий вариант. Потратила 4 часа на ручной fact-checking через Google Scholar.
Вот тогда я поняла: AI не может быть единственным источником правды в работе, где каждая деталь стоит денег.
Исследование, которое все объяснило
На этой неделе вышло исследование: пять frontier AI-моделей (GPT-4, Claude, Gemini, Llama, еще одна) проверяли 1000 реальных утверждений. Они разошлись в 67% случаев. Две трети!
Это не баг — это фича. AI-модели тренируются на разных датасетах, по-разному интерпретируют контекст и не имеют «единой правды». Они генерируют ответы на основе вероятностей, а не фактов.
Для меня это означало одно: каждый бриф с клиенткой нужно проверять вручную, если там есть исторические, культурные или технические детали.
Три кейса, когда AI меня подвела (и как я это исправила)
1. «Барочный жемчуг» — какой именно?
Клиентка хотела AI-портрет с «baroque pearls». ChatGPT сказал: «irregular, asymmetrical». Claude: «oversized, layered». Midjourney сгенерировал что-то среднее — и клиентка сказала «не то».
Решение: теперь я прошу клиенток присылать визуальные референсы (Pinterest, Instagram), а не текстовые описания. AI-модели лучше работают с img2img, чем с «барочными» терминами.
2. Цвет Pantone года — точный ли он?
В 2024 году Pantone объявил цвет Peach Fuzz. Я спросила три AI-модели: «Какой hex-код Pantone 13-1023?» Получила три разных ответа. Проверила на официальном сайте Pantone — ни один не совпал.
Решение: для брендовых цветов всегда использую первичные источники (сайт бренда, официальный пресс-релиз). AI — только для «похожего настроения», не точных значений.
3. «90s minimalism» — Gap или Jil Sander?
Бриф: «90-е, минимализм, нейтральные тона». ChatGPT выдал Gap-эстетику (casual, denim). Claude — Jil Sander (tailored, luxe). Клиентка имела в виду Jil Sander, но я уже сгенерировала 15 фото в стиле Gap.
Решение: теперь в брифе прошу назвать конкретные бренды/фотографов/эры. «90-е минимализм» — слишком широко. «Jil Sander FW 1995» — конкретно.
Почему это критично для AI-фотографии (а не только для fact-checking)
Мы, AI-фотографы, работаем на грани креатива и технических деталей. Клиентки платят за точность настроения, а не абстрактную «красоту». Если я сгенерирую «vintage Chanel», а клиентка имела в виду «vintage Dior» — это не просто ошибка, это потерянные деньги и репутация.
AI-модели не понимают нюансов, которые критичны для нашей работы:
- Разница между «blush pink» и «dusty rose»
- Почему «90s grunge» в Сиэтле — не то же самое, что в Лондоне
- Какие именно «thin eyebrows» были в 1920-х vs 1990-х
Они выдают «усредненный» ответ, который часто технически правильный, но контекстуально ложный.
Мой новый рабочий процесс: как я использую AI после этого
Теперь я делю работу на два этапа:
Этап 1: Сбор идей (AI)
- Прошу ChatGPT/Claude набросать общие направления
- Генерирую списки возможных стилей, эпох, референсов
- Использую как brainstorming-инструмент, не источник правды
Этап 2: Верификация (я сама)
- Проверяю каждый факт через Google Scholar, официальные сайты, archive.org
- Ищу визуальные первичные источники (музейные коллекции, оригинальные журналы)
- Если сомневаюсь — спрашиваю у клиентки, что именно она имеет в виду
Так я трачу на 30% больше времени на подготовку, но экономлю 90% времени на исправление ошибок после генерации.
Промпт, который помогает уменьшить расхождения
Я не могу заставить AI сходиться в фактах, но могу попросить ее показать источники неуверенности:
You are a fact-checking assistant for a professional AI photographer.
I will give you a client brief with historical/cultural/technical details.
For each detail:
1. Provide your interpretation
2. List 2-3 alternative interpretations (if any)
3. Mark uncertainty level: LOW / MEDIUM / HIGH
4. Suggest primary sources to verify (museum archives, official brand sites, etc.)
Client brief: [тут вставляешь бриф]
Этот промпт не дает мне правду, но показывает, где AI сомневается — и я знаю, что именно нужно проверить вручную.
Что это означает для будущего AI-фотографии
Исследование с 67% расхождений — это не «AI плохо работает». Это напоминание, что AI — инструмент, а не эксперт.
В нашей сфере это особенно важно, потому что мы продаем не только картинку, но и контекст, настроение, историю. Если я говорю клиентке «это authentic 1920s flapper style», она ожидает, что я знаю, о чем говорю — а не просто повторяю то, что сказал ChatGPT.
Мой вывод после этого кейса: AI — для скорости, человек — для точности. Я больше не доверяю моделям в работе с клиентскими брифами без двойной проверки. И мои клиентки теперь получают то, что заказывали — а не то, что «AI считает похожим».
Хочешь научиться работать с AI-фотографией профессионально — без ошибок и потерянных клиенток? Я рассказываю о своих кейсах, инструментах и рабочих процессах в персональных консультациях. Помогу настроить твой workflow так, чтобы AI работала на тебя, а не против.
FAQ
Можно ли вообще доверять AI в работе с клиентками? Да, но только на этапе brainstorming и генерации идей. Факты, исторические детали, технические спецификации — всегда проверяй вручную через первичные источники.
Какие AI-модели самые точные для fact-checking? Исследование показало, что все пять топовых моделей (GPT-4, Claude, Gemini, Llama, другие) разошлись в 67% случаев. Нет «самой точной» — они работают на вероятностях, а не фактах.
Как проверить, правильно ли AI интерпретировала бриф клиентки? Проси клиентку прислать визуальные референсы (фото, Pinterest-доски). Если она использует термины («baroque», «minimalism») — уточни конкретные бренды, эпохи, имена дизайнеров.
Что делать, если уже сгенерировала фото по неправильному брифу? Признай ошибку, объясни, что произошло, предложи бесплатную ревизию. Я всегда делала так — и клиентки ценили честность больше, чем идеальный результат с первого раза.
Стоит ли отказываться от AI из-за такой низкой точности? Нет. AI — мощный инструмент для креатива, но не для фактов. Используй ее для генерации идей, быстрого драфта, экспериментов — а проверку оставь себе. Это и есть профессионализм.
Понравилась статья?
Подпишись на телеграм — там промпты, гайды и персональные рекомендации.