Чи Галюцинує Ваш ШІ? Небезпека Використання Загальних LLM для Дієтичних Порад

ChatGPT та Gemini можуть писати поезію, але чи можуть вони рахувати ваші калорії? Ми протестували загальні LLM на основі перевірених даних про харчування, і результати мають насторожити всіх, хто використовує їх для відстеження дієти.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

"Привіт, ChatGPT, скільки калорій у моєму курячому стір-фраї?"

Відповідь приходить миттєво і впевнено: "Типовий курячий стір-фрай містить приблизно 350-450 калорій на порцію." Звучить розумно. Навіть розбиває макроси. Але є проблема: це число вигадане. Не оцінене, не приблизне, а згенероване на основі статистичних патернів текстових даних без зв'язку з реальною базою даних харчування.

Це те, що дослідники ШІ називають галюцинацією, і коли це відбувається в контексті харчування, наслідки виходять за межі поганого есе або невірної відповіді на запитання. Люди приймають реальні дієтичні рішення на основі цих чисел, і ці рішення впливають на їхнє здоров'я.

Що означає "Галюцинація" в контексті харчування

У термінах великих мовних моделей галюцинація відбувається, коли модель генерує інформацію, яка звучить правдоподібно, але фактично є неправильною. LLM не шукають факти в базі даних. Вони прогнозують наступне найімовірніше слово в послідовності на основі патернів, вивчених під час навчання.

Коли ви запитуєте ChatGPT про калорійність їжі, він не запитує базу даних USDA FoodData Central або не перехресно перевіряє NCCDB. Він генерує відповідь, яка статистично нагадує той тип відповіді, що з'являється в його навчальних даних. Іноді ця відповідь близька до правильної. Іноді вона сильно відрізняється.

Небезпека полягає в тому, що рівень впевненості однаковий у обох випадках. Галюцинований рахунок калорій виглядає точно так само, як і точний.

Де Загальні LLM Помиляються в Харчуванні

Ми провели серію тестів, запитуючи ChatGPT (GPT-4o), Gemini та Claude оцінити харчову цінність звичайних страв. Потім ми порівняли ці оцінки з перевіреними значеннями USDA та базою даних Nutrola, перевіреною дієтологами. Патерни невдач були послідовними та показовими.

Вигадана Точність

Запитайте LLM "скільки калорій у столовій ложці оливкової олії?" і ви часто отримаєте правильну відповідь: близько 119 калорій. Це тому, що цей конкретний факт часто з'являється в навчальних даних.

Але запитайте "скільки калорій у домашньому курячому тіці масала з нааном?" і модель повинна імпровізувати. У наших тестах GPT-4o повернув оцінки від 450 до 750 калорій для однієї й тієї ж страви в різних розмовах. Реальна вартість, розрахована за стандартним рецептом з перевіреними даними про інгредієнти, становила 685 калорій. Одна відповідь була близькою. Інші відрізнялися більш ніж на 200 калорій.

Модель не має способу сигналізувати, які відповіді є надійними, а які є імпровізованими здогадками.

Сліпота до Методу Приготування

У LLM є фундаментальна сліпота щодо того, як їжа готується. "Грильована куряча грудинка" та "смажена куряча грудинка на маслі" можуть отримати схожі оцінки калорій, оскільки модель зосереджується на основному інгредієнті, а не на методі приготування.

У наших тестах, коли ми запитували про "лосося", не уточнюючи спосіб приготування, відповіді постійно за замовчуванням давали оцінку близько 230-280 калорій для філе вагою 6 унцій. Філе лосося вагою 6 унцій, смажене на двох столових ложках масла з теріякі, насправді містить близько 450-500 калорій. Різниця є суттєвою, щоб підривати дефіцит калорій з часом.

Галюцинація Розміру Порції

Можливо, найнебезпечніший спосіб помилки — це припущення про розмір порції. Коли ви запитуєте загальний LLM про калорії їжі, він повинен припустити розмір порції. Ці припущення є непослідовними і часто не вказані.

"Чаша пасти" може бути оцінена в 300-400 калорій. Але чия чаша? Стандартна порція 2 унції сухої спагетті з маринара містить близько 280 калорій. Порція ресторану з 4-6 унцій сухої пасти з соусом легко досягає 600-900 калорій. LLM вибирає число посередині і подає його як факт.

Накопичення Помилок у Планах Харчування

Ризик зростає, коли користувачі просять LLM створити повні плани харчування. Кожна окрема оцінка має помилку, і ці помилки накопичуються через страви та дні. План харчування, який стверджує, що забезпечує 1,800 калорій на день, насправді може забезпечити 2,200 або 1,400 в залежності від напрямку помилок.

Для когось, хто використовує план харчування для управління медичним станом, таким як діабет, або для досягнення певних спортивних цілей, цей рівень неточності не просто непомічений. Це може бути потенційно шкідливим.

Чому Спеціалізований Харчовий ШІ Відрізняється

Різниця між загальним LLM і спеціалізованою харчовою системою є архітектурною, а не косметичною.

Відповіді, ґрунтовані на Базі Даних

ШІ Nutrola не генерує оцінки калорій на основі мовних патернів. Коли він ідентифікує продукт, він відображає цю ідентифікацію на перевірений запис у харчовій базі даних. База даних містить записи, отримані з USDA FoodData Central, національних харчових баз даних з кількох країн та перевірених дієтологами записів.

Це означає, що система не може галюцинувати рахунок калорій. Число походить з конкретного, аудиторного запису бази даних, а не з статистичної мовної моделі.

Візуальна Перевірка

Коли користувач фотографує страву, комп'ютерна модель зору Nutrola ідентифікує окремі продукти та оцінює розміри порцій на основі візуального аналізу. Це візуальне підґрунтя забезпечує перевірку, яку текстові LLM не можуть виконати. Система буквально дивиться на те, що ви їсте, а не здогадує з текстового опису.

Прозора Невизначеність

Добре спроектована харчова система визнає, коли вона не впевнена. Якщо страва є неоднозначною або розмір порції важко оцінити з фотографії, система може позначити цю невизначеність і запитати у користувача уточнення. Загальні LLM майже ніколи не вказують, коли їхні харчові оцінки є низько впевненими, оскільки у них немає механізму для вимірювання власної впевненості в фактичних твердженнях.

Реальні Ризики для Здоров'я

Неточні дані про калорії від ШІ — це не абстрактна проблема. Вона проявляється у конкретних способах.

Проблеми з управлінням вагою. Постійне перевищення або недооблік на 200 калорій на день змінює результати будь-якої дієти. Протягом 30 днів це становить 6,000 калорій, що приблизно еквівалентно 1.7 фунта жирової маси в будь-якому напрямку.

Сліпота до мікронутрієнтів. LLM рідко надають дані про мікронутрієнти, а коли вони це роблять, цифри є ще менш надійними, ніж їхні оцінки калорій. Людина, яка відстежує споживання заліза під час вагітності або контролює натрій при гіпертонії, не може покладатися на згенеровані оцінки.

Ложна впевненість. Найбільш підступний ризик полягає в тому, що користувач вважає, що має точні дані, коли насправді це не так. Ця хибна впевненість заважає їм шукати кращі інструменти або вносити корективи на основі реальних результатів.

Коли Можна Запитувати LLM про Їжу

Загальні LLM не є марними для харчування. Вони ефективні для певних типів запитів:

  • Загальна освіта: "Які продукти багаті калієм?" або "У чому різниця між розчинними та нерозчинними волокнами?" Це питання знань, де приблизні відповіді є прийнятними.
  • Ідеї для рецептів: "Дайте мені ідею для обіду з високим вмістом білка до 500 калорій" може дати корисне натхнення, навіть якщо точну калорійність слід перевірити.
  • Розуміння концепцій: "Поясніть, що таке дефіцит калорій" або "Як білок допомагає відновленню м'язів?" — це сфери, в яких LLM добре справляються.

Межа чітка: використовуйте LLM для навчання про харчування. Використовуйте перевірені, базовані на даних інструменти для його відстеження.

Як Перевірити Будь-яке Твердження ШІ про Харчування

Чи використовуєте ви чат-бота, чи будь-який інший інструмент, є практичні кроки для перевірки даних, які ви отримуєте:

  1. Перевірте з USDA FoodData Central. База даних USDA є безкоштовною, публічною та перевіреною в лабораторії. Якщо оцінка ШІ значно відрізняється від запису USDA для тієї ж їжі, ймовірно, ШІ помиляється.
  2. Перевірте припущення про розмір порції. Завжди запитуйте або перевіряйте, на якому розмірі порції базується оцінка. Число калорій без розміру порції не має сенсу.
  3. Врахуйте метод приготування. Один і той же інгредієнт може варіюватися в щільності калорій на 2-3 рази в залежності від того, чи він сирий, запечений, смажений або обсмажений в олії.
  4. Будьте скептичними щодо круглих чисел. Якщо ШІ говорить вам, що страва має "точно 500 калорій", це згенерована оцінка, а не виміряне значення. Реальні харчові дані мають конкретні числа, такі як 487 або 523.

Часто Задавані Питання

Чи точний ChatGPT для рахунку калорій?

ChatGPT та подібні великі мовні моделі не є надійними для рахунку калорій. Вони генерують оцінки на основі текстових патернів, а не шукають значення в перевірених харчових базах даних. У тестах оцінки калорій LLM для складних страв варіювалися на 200-300 калорій у різних запитах для однієї й тієї ж їжі. Для простих, добре відомих продуктів, таких як "одне велике яйце", оцінки, як правило, близькі, оскільки дані часто з'являються в навчальному тексті. Для приготованих страв, ресторанних страв і змішаних продуктів харчування рівень помилок значно зростає.

Чи можу я використовувати ChatGPT для відстеження своїх макросів?

Використання ChatGPT для відстеження макросів не рекомендується для тих, хто прагне досягти конкретних цілей у сфері здоров'я чи фітнесу. Модель не може враховувати ваші фактичні розміри порцій, методи приготування або конкретні інгредієнти. Вона також не є послідовною; запитуючи одне й те ж питання двічі, можна отримати різні розподіли макросів. Для загального усвідомлення того, чи є їжа багатою на білок чи вуглеводи, LLM може надати корисну орієнтацію. Для точного відстеження спеціалізований додаток для харчування з перевіреною базою даних забезпечить значно точніші та послідовні результати.

Що таке галюцинація ШІ в харчуванні?

Галюцинація ШІ в харчуванні відноситься до випадків, коли мовна модель генерує дані про харчування, такі як рахунки калорій, розподіли макросів або значення мікронутрієнтів, які звучать авторитетно, але є фактично неправильними. Модель не намагається обманути; вона прогнозує правдоподібний текст на основі патернів. В результаті виходить рахунок калорій, який виглядає як факт, але ніколи не був перевірений проти жодної харчової бази даних. Це особливо небезпечно, оскільки користувачі не мають можливості відрізнити галюциновану оцінку від точної без ручної перевірки.

Як дізнатися, чи мій харчовий ШІ надає точні дані?

Перевірте три речі. По-перше, запитайте, чи інструмент використовує перевірену харчову базу даних, таку як USDA FoodData Central або NCCDB, а не генерує оцінки з мовної моделі. По-друге, перевірте, чи враховує він методи приготування, оскільки метод приготування може змінити вміст калорій у їжі на 50-200 відсотків. По-третє, перевірте, чи вказує інструмент точний розмір порції, на якому базується його оцінка. Надійний харчовий ШІ повинен бути прозорим щодо своїх джерел даних і повинен позначати невизначені оцінки, а не подавати кожне число з однаковою впевненістю.

Чи безпечно слідувати плану харчування, створеному ШІ?

Плани харчування, створені ШІ, можуть бути корисними як початкові рамки, але їх не слід слідувати бездумно для конкретних медичних або спортивних цілей. Кожна оцінка калорій у плані має потенційну помилку, і ці помилки накопичуються протягом усього дня харчування. Якщо план стверджує, що забезпечує 1,800 калорій, але кожна оцінка страви відрізняється на 10-15 відсотків, фактичне добове споживання може коливатися від 1,500 до 2,100 калорій. Для загального натхнення здорового харчування плани харчування ШІ є розумним початковим пунктом. Для клінічного управління харчуванням, програм схуднення або дієт для спортивних досягнень цілі калорій та макросів слід перевіряти за допомогою інструмента, заснованого на базі даних.

Готові трансформувати своє відстеження харчування?

Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!