AI не може перевірити факти: чому я не довіряю їй у роботі з клієнтами
П'ять топових AI-моделей не збіглися у 67% фактів. Розповідаю, як це вплинуло на мою роботу з AI-фотографією та чому я змінила підхід до клієнтських брифів.
TL;DR: Нове дослідження показало: п'ять топових AI-моделей розійшлися у висновках щодо 67% фактів. Розповідаю, як це вплинуло на мою роботу з AI-фотографією — від зіпсованих клієнтських брифів до втрачених годин на виправлення.
Коли ChatGPT «допоміг» мені облажатися з клієнткою
Минулого місяця клієнтка замовила AI-фотосесію у стилі «vintage Vogue 1950s». Я, як завжди, попросила ChatGPT швидко перевірити референси епохи — колір обкладинок, типові пози, макіяж. Модель видала мені докладний список: «червоні губи, тонкі брови, pastel backgrounds».
Я згенерувала 20 фото. Клієнтка написала: «Це ж не 50-ті, це 40-ві! Брови занадто тонкі, а фони — взагалі не той відтінок». Я перепитала Claude — він сказав протилежне. Gemini дав третій варіант. Витратила 4 години на ручний fact-checking через Google Scholar.
Ось тоді я зрозуміла: AI не може бути єдиним джерелом правди у роботі, де кожна деталь коштує грошей.
Дослідження, яке все пояснило
Цього тижня вийшло дослідження: п'ять frontier AI-моделей (GPT-4, Claude, Gemini, Llama, ще одна) перевіряли 1000 реальних тверджень. Вони не збіглися у 67% випадків. Дві третини!
Це не баг — це фіча. AI-моделі тренуються на різних датасетах, по-різному інтерпретують контекст і не мають «єдиної правди». Вони генерують відповіді на основі ймовірностей, а не фактів.
Для мене це означало одне: кожен бриф із клієнткою треба перевіряти вручну, якщо там є історичні, культурні чи технічні деталі.
Три кейси, коли AI мене підвела (і як я це виправила)
1. «Барокові перли» — які саме?
Клієнтка хотіла AI-портрет із «baroque pearls». ChatGPT сказав: «irregular, asymmetrical». Claude: «oversized, layered». Midjourney згенерував щось середнє — і клієнтка сказала «не те».
Рішення: тепер я прошу клієнток надсилати візуальні референси (Pinterest, Instagram), а не текстові описи. AI-моделі краще працюють із img2img, ніж із «барокових» термінів.
2. Колір Pantone року — чи точний він?
У 2024 році Pantone оголосив колір Peach Fuzz. Я запитала три AI-моделі: «Який hex-код Pantone 13-1023?» Отримала три різні відповіді. Перевірила на офіційному сайті Pantone — жоден не збігся.
Рішення: для брендових кольорів завжди використовую первинні джерела (сайт бренду, офіційний прес-реліз). AI — тільки для «схожого настрою», не точних значень.
3. «90s minimalism» — Gap чи Jil Sander?
Бриф: «90-ті, мінімалізм, нейтральні тони». ChatGPT видав Gap-естетику (casual, denim). Claude — Jil Sander (tailored, luxe). Клієнтка мала на увазі Jil Sander, але я вже згенерувала 15 фото у стилі Gap.
Рішення: тепер у брифі прошу назвати конкретні бренди/фотографів/ери. «90-ті мінімалізм» — занадто широко. «Jil Sander FW 1995» — конкретно.
Чому це критично для AI-фотографії (а не тільки для fact-checking)
Ми, AI-фотографи, працюємо на межі креативу та технічності. Клієнтки платять за точність настрою, а не абстрактну «красу». Якщо я згенерую «vintage Chanel», а клієнтка мала на увазі «vintage Dior» — це не просто помилка, це втрачені гроші та репутація.
AI-моделі не розуміють нюансів, які критичні для нашої роботи:
- Різниця між «blush pink» та «dusty rose»
- Чому «90s grunge» у Seattle — не те саме, що у Лондоні
- Які саме «thin eyebrows» були у 1920-х vs 1990-х
Вони видають «усереднену» відповідь, яка часто технічно правильна, але контекстуально хибна.
Мій новий робочий процес: як я використовую AI після цього
Тепер я ділю роботу на два етапи:
Етап 1: Збір ідей (AI)
- Прошу ChatGPT/Claude накидати загальні напрямки
- Генерую списки можливих стилів, епох, референсів
- Використовую як brainstorming-інструмент, не джерело правди
Етап 2: Верифікація (я сама)
- Перевіряю кожен факт через Google Scholar, офіційні сайти, archive.org
- Шукаю візуальні первинні джерела (музейні колекції, оригінальні журнали)
- Якщо сумніваюся — питаю у клієнтки, що саме вона має на увазі
Так я витрачаю на 30% більше часу на підготовку, але економлю 90% часу на виправлення помилок після генерації.
Промпт, який допомагає зменшити розбіжності
Я не можу змусити AI збігатися у фактах, але можу попросити її показати джерела невпевненості:
You are a fact-checking assistant for a professional AI photographer.
I will give you a client brief with historical/cultural/technical details.
For each detail:
1. Provide your interpretation
2. List 2-3 alternative interpretations (if any)
3. Mark uncertainty level: LOW / MEDIUM / HIGH
4. Suggest primary sources to verify (museum archives, official brand sites, etc.)
Client brief: [тут вставляєш бриф]
Цей промпт не дає мені правду, але показує, де AI сумнівається — і я знаю, що саме треба перевірити вручну.
Що це означає для майбутнього AI-фотографії
Дослідження з 67% розбіжностей — це не «AI погано працює». Це нагадування, що AI — інструмент, а не експерт.
У нашій сфері це особливо важливо, бо ми продаємо не тільки картинку, а й контекст, настрій, історію. Якщо я кажу клієнтці «це authentic 1920s flapper style», вона очікує, що я знаю, про що говорю — а не просто повторюю те, що сказав ChatGPT.
Мій висновок після цього кейсу: AI — для швидкості, людина — для точності. Я більше не довіряю моделям у роботі з клієнтськими брифами без подвійної перевірки. І мої клієнтки тепер отримують те, що замовляли — а не те, що «AI вважає схожим».
Хочеш навчитися працювати з AI-фотографією професійно — без помилок і втрачених клієнтів? Я розповідаю про свої кейси, інструменти та робочі процеси у персональних консультаціях. Допоможу налаштувати твій workflow так, щоб AI працювала на тебе, а не проти.
FAQ
Чи можна взагалі довіряти AI у роботі з клієнтами? Так, але тільки на етапі brainstorming та генерації ідей. Факти, історичні деталі, технічні специфікації — завжди перевіряй вручну через первинні джерела.
Які AI-моделі найточніші для fact-checking? Дослідження показало, що всі п'ять топових моделей (GPT-4, Claude, Gemini, Llama, інші) розійшлися у 67% випадків. Немає «найточнішої» — вони працюють на ймовірностях, а не фактах.
Як перевірити, чи правильно AI інтерпретував бриф клієнтки? Проси клієнтку надіслати візуальні референси (фото, Pinterest-дошки). Якщо вона використовує терміни («baroque», «minimalism») — уточни конкретні бренди, епохи, імена дизайнерів.
Що робити, якщо вже згенерувала фото за неправильним брифом? Визнай помилку, поясни, що сталося, запропонуй безкоштовну ревізію. Я завжди робила так — і клієнтки цінували чесність більше, ніж ідеальний результат із першого разу.
Чи варто відмовлятися від AI через таку низьку точність? Ні. AI — потужний інструмент для креативу, але не для фактів. Використовуй її для генерації ідей, швидкого драфту, експериментів — а перевірку залиш собі. Це і є професіоналізм.
Сподобалась стаття?
Підпишись на телеграм, щоб отримати ще промпти, гайди й персональні рекомендації.