AI не може перевірити факти: чому я не довіряю їй у роботі з клієнтами

TL;DR: Нове дослідження показало: п'ять топових AI-моделей розійшлися у висновках щодо 67% фактів. Розповідаю, як це вплинуло на мою роботу з AI-фотографією — від зіпсованих клієнтських брифів до втрачених годин на виправлення.

Коли ChatGPT «допоміг» мені облажатися з клієнткою

Минулого місяця клієнтка замовила AI-фотосесію у стилі «vintage Vogue 1950s». Я, як завжди, попросила ChatGPT швидко перевірити референси епохи — колір обкладинок, типові пози, макіяж. Модель видала мені докладний список: «червоні губи, тонкі брови, pastel backgrounds».

Я згенерувала 20 фото. Клієнтка написала: «Це ж не 50-ті, це 40-ві! Брови занадто тонкі, а фони — взагалі не той відтінок». Я перепитала Claude — він сказав протилежне. Gemini дав третій варіант. Витратила 4 години на ручний fact-checking через Google Scholar.

Ось тоді я зрозуміла: AI не може бути єдиним джерелом правди у роботі, де кожна деталь коштує грошей.

Дослідження, яке все пояснило

Цього тижня вийшло дослідження: п'ять frontier AI-моделей (GPT-4, Claude, Gemini, Llama, ще одна) перевіряли 1000 реальних тверджень. Вони не збіглися у 67% випадків. Дві третини!

Це не баг — це фіча. AI-моделі тренуються на різних датасетах, по-різному інтерпретують контекст і не мають «єдиної правди». Вони генерують відповіді на основі ймовірностей, а не фактів.

Для мене це означало одне: кожен бриф із клієнткою треба перевіряти вручну, якщо там є історичні, культурні чи технічні деталі.

Три кейси, коли AI мене підвела (і як я це виправила)

1. «Барокові перли» — які саме?

Клієнтка хотіла AI-портрет із «baroque pearls». ChatGPT сказав: «irregular, asymmetrical». Claude: «oversized, layered». Midjourney згенерував щось середнє — і клієнтка сказала «не те».

Рішення: тепер я прошу клієнток надсилати візуальні референси (Pinterest, Instagram), а не текстові описи. AI-моделі краще працюють із img2img, ніж із «барокових» термінів.

2. Колір Pantone року — чи точний він?

У 2024 році Pantone оголосив колір Peach Fuzz. Я запитала три AI-моделі: «Який hex-код Pantone 13-1023?» Отримала три різні відповіді. Перевірила на офіційному сайті Pantone — жоден не збігся.

Рішення: для брендових кольорів завжди використовую первинні джерела (сайт бренду, офіційний прес-реліз). AI — тільки для «схожого настрою», не точних значень.

3. «90s minimalism» — Gap чи Jil Sander?

Бриф: «90-ті, мінімалізм, нейтральні тони». ChatGPT видав Gap-естетику (casual, denim). Claude — Jil Sander (tailored, luxe). Клієнтка мала на увазі Jil Sander, але я вже згенерувала 15 фото у стилі Gap.

Рішення: тепер у брифі прошу назвати конкретні бренди/фотографів/ери. «90-ті мінімалізм» — занадто широко. «Jil Sander FW 1995» — конкретно.

Чому це критично для AI-фотографії (а не тільки для fact-checking)

Ми, AI-фотографи, працюємо на межі креативу та технічності. Клієнтки платять за точність настрою, а не абстрактну «красу». Якщо я згенерую «vintage Chanel», а клієнтка мала на увазі «vintage Dior» — це не просто помилка, це втрачені гроші та репутація.

AI-моделі не розуміють нюансів, які критичні для нашої роботи:

Різниця між «blush pink» та «dusty rose»
Чому «90s grunge» у Seattle — не те саме, що у Лондоні
Які саме «thin eyebrows» були у 1920-х vs 1990-х

Вони видають «усереднену» відповідь, яка часто технічно правильна, але контекстуально хибна.

Мій новий робочий процес: як я використовую AI після цього

Тепер я ділю роботу на два етапи:

Етап 1: Збір ідей (AI)

Прошу ChatGPT/Claude накидати загальні напрямки
Генерую списки можливих стилів, епох, референсів
Використовую як brainstorming-інструмент, не джерело правди

Етап 2: Верифікація (я сама)

Перевіряю кожен факт через Google Scholar, офіційні сайти, archive.org
Шукаю візуальні первинні джерела (музейні колекції, оригінальні журнали)
Якщо сумніваюся — питаю у клієнтки, що саме вона має на увазі

Так я витрачаю на 30% більше часу на підготовку, але економлю 90% часу на виправлення помилок після генерації.

Промпт, який допомагає зменшити розбіжності

Я не можу змусити AI збігатися у фактах, але можу попросити її показати джерела невпевненості:

You are a fact-checking assistant for a professional AI photographer.
I will give you a client brief with historical/cultural/technical details.
For each detail:
1. Provide your interpretation
2. List 2-3 alternative interpretations (if any)
3. Mark uncertainty level: LOW / MEDIUM / HIGH
4. Suggest primary sources to verify (museum archives, official brand sites, etc.)

Client brief: [тут вставляєш бриф]

Цей промпт не дає мені правду, але показує, де AI сумнівається — і я знаю, що саме треба перевірити вручну.

Що це означає для майбутнього AI-фотографії

Дослідження з 67% розбіжностей — це не «AI погано працює». Це нагадування, що AI — інструмент, а не експерт.

У нашій сфері це особливо важливо, бо ми продаємо не тільки картинку, а й контекст, настрій, історію. Якщо я кажу клієнтці «це authentic 1920s flapper style», вона очікує, що я знаю, про що говорю — а не просто повторюю те, що сказав ChatGPT.

Мій висновок після цього кейсу: AI — для швидкості, людина — для точності. Я більше не довіряю моделям у роботі з клієнтськими брифами без подвійної перевірки. І мої клієнтки тепер отримують те, що замовляли — а не те, що «AI вважає схожим».

Хочеш навчитися працювати з AI-фотографією професійно — без помилок і втрачених клієнтів? Я розповідаю про свої кейси, інструменти та робочі процеси у персональних консультаціях. Допоможу налаштувати твій workflow так, щоб AI працювала на тебе, а не проти.

FAQ

Чи можна взагалі довіряти AI у роботі з клієнтами? Так, але тільки на етапі brainstorming та генерації ідей. Факти, історичні деталі, технічні специфікації — завжди перевіряй вручну через первинні джерела.

Які AI-моделі найточніші для fact-checking? Дослідження показало, що всі п'ять топових моделей (GPT-4, Claude, Gemini, Llama, інші) розійшлися у 67% випадків. Немає «найточнішої» — вони працюють на ймовірностях, а не фактах.

Як перевірити, чи правильно AI інтерпретував бриф клієнтки? Проси клієнтку надіслати візуальні референси (фото, Pinterest-дошки). Якщо вона використовує терміни («baroque», «minimalism») — уточни конкретні бренди, епохи, імена дизайнерів.

Що робити, якщо вже згенерувала фото за неправильним брифом? Визнай помилку, поясни, що сталося, запропонуй безкоштовну ревізію. Я завжди робила так — і клієнтки цінували чесність більше, ніж ідеальний результат із першого разу.

Чи варто відмовлятися від AI через таку низьку точність? Ні. AI — потужний інструмент для креативу, але не для фактів. Використовуй її для генерації ідей, швидкого драфту, експериментів — а перевірку залиш собі. Це і є професіоналізм.

AI не може перевірити факти: чому я не довіряю їй у роботі з клієнтами

Коли ChatGPT «допоміг» мені облажатися з клієнткою

Дослідження, яке все пояснило