Чи може Gemini AI відстежувати ваші калорії? Ми протестували його в порівнянні з спеціалізованим додатком

Ми попросили Gemini та ChatGPT оцінити калорії для 30 страв, а потім порівняли результати з Nutrola та зваженими даними про їжу. Різниця в точності виявилася більшою, ніж очікувалося.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

З появою AI-чат-ботів у повсякденному житті виникає природне запитання: чи можна просто запитати Gemini або ChatGPT про підрахунок калорій замість використання спеціалізованого додатка для харчування? Ми протестували це безпосередньо. Протягом двох тижнів ми запитували Google Gemini та OpenAI ChatGPT оцінити калорійність і макронутрієнти 30 різних страв, від простих продуктів до складних ресторанних страв. Ми порівняли їх оцінки з двома еталонами: перевіреними записами бази даних Nutrola та зваженими даними про їжу, розрахованими за значеннями USDA FoodData Central.

Результати виявили основні обмеження використання загальних AI-чат-ботів для відстеження харчування, які є структурними, а не тимчасовими, що означає, що їх навряд чи буде повністю вирішено в майбутніх оновленнях моделей.

Чи можу я використовувати Gemini для підрахунку калорій?

Ви можете запитати Gemini про калорії в страві, і він надасть відповідь. Питання в тому, чи є ця відповідь достатньо точною та послідовною для реального управління дієтою. На основі наших тестів відповідь негативна для будь-якого випадку, що вимагає надійності.

Методологія тестування: Ми приготували або придбали 30 страв різної складності. Кожну страву зважили на каліброваних кухонних вагах, а значення калорій були розраховані за даними USDA FoodData Central. Потім ми описали кожну страву Gemini (AI-асистенту Google) природною мовою, так само, як це зробив би реальний користувач, і зафіксували його оцінку калорій. Ми провели той же тест з ChatGPT (GPT-4o) і зареєстрували кожну страву в Nutrola, використовуючи розпізнавання зображень та пошук у базі даних.

Визначення точності: Ми вважали оцінку "точною", якщо вона потрапляла в межах 10 відсотків від зваженого еталонного значення, що є стандартним порогом, який використовується в дослідженнях оцінки харчування (Subar et al., The Journal of Nutrition, 2015).

Наскільки точні AI-чат-боти для підрахунку калорій?

Результати були послідовними в категоріях страв: загальні AI-чат-боти надають приблизні оцінки, які недостатньо надійні для дієт з контролем калорій.

Параметр Gemini ChatGPT (GPT-4o) Nutrola Зважений еталон
Страви в межах 10% від еталону 11/30 (37%) 13/30 (43%) 25/30 (83%) 30/30 (100%)
Середня абсолютна помилка 127 ккал 108 ккал 38 ккал 0 ккал
Середня відсоткова помилка 22.4% 18.6% 6.1% 0%
Найбільше одноразове завищення +340 ккал (паста) +285 ккал (смажені овочі) +95 ккал (ресторанна страва) Н/Д
Найбільше одноразове заниження -290 ккал (салат з соусом) -315 ккал (гранола) -72 ккал (домашній суп) Н/Д
Послідовність в повторних запитах Ні (варіювалося на 50-200 ккал) Ні (варіювалося на 30-150 ккал) Так (заблоковано в базі даних) Н/Д

Ключове відкриття: Середня абсолютна помилка в 108-127 калорій на страву означає, що це призводить до кумулятивної помилки в 324-381 калорії за три страви на день. Для тих, хто намагається досягти дефіциту в 500 калорій для схуднення, такий рівень неточності може знищити 65-76 відсотків їх запланованого дефіциту, фактично зупиняючи прогрес.

Чому AI-чат-боти помиляються в підрахунку калорій?

Помилки, які ми спостерігали, не були випадковими. Вони слідували передбачуваним шаблонам, які виявляють структурні обмеження використання великих мовних моделей для оцінки харчування.

Проблема 1: Відсутність перевіреної бази даних. Gemini та ChatGPT не шукають продукти в структурованій базі даних харчування, коли ви запитуєте їх про оцінку калорій. Вони генерують відповіді на основі шаблонів у своїх навчальних даних, які містять суміш точних даних USDA, контенту, створеного користувачами, оцінок з харчових блогів та маркетингових матеріалів. Один і той же продукт може мати кардинально різні значення калорій у цих джерелах, і модель не має механізму для визначення, яке джерело є правильним.

Nutrola та інші спеціалізовані додатки для харчування використовують перевірені бази даних продуктів. База даних Nutrola містить понад 1.8 мільйона записів, які перехресно перевіряються з USDA FoodData Central, етикетками харчування виробників та незалежними лабораторними аналізами. Коли ви реєструєте "грудка курки, гриль, 150г", повернуте значення є перевіреною точкою даних, а не статистичним середнім з усього, що коли-небудь говорилося в інтернеті про курку.

Проблема 2: Відсутність прив'язки до розміру порції. Коли ви кажете AI-чат-боту, що ви з'їли "миску пасти", він повинен здогадатися, що означає "миска". Це 200 грамів вареної пасти чи 400 грамів? Різниця може становити 250 калорій або більше. AI-чат-боти зазвичай базуються на культурно середніх припущеннях про порції, які можуть не відповідати вашій фактичній порції.

У нашому тестуванні неправильне визначення розміру порції стало найбільшим джерелом помилок. Gemini занижив порцію граноли на 210 калорій, оскільки припустив, що порція менша, ніж насправді була спожита. ChatGPT завищив порцію смажених овочів на 285 калорій, оскільки припустив, що це ресторанна порція, хоча страва була домашньою.

Nutrola вирішує цю проблему за допомогою кількох механізмів: сканування штрих-кодів безпосередньо пов'язує з розмірами порцій, вказаними виробником, AI-розпізнавання зображень оцінює об'єм порції за зображенням, а користувачі можуть регулювати порції в грамах, використовуючи кухонні ваги для максимальної точності.

Проблема 3: Відсутність пам'яті між сесіями. Це, мабуть, найбільш фундаментальне обмеження для тривалого відстеження калорій. AI-чат-боти не ведуть постійний журнал того, що ви їли. Кожна розмова починається з нуля. Немає щоденного підсумку, жодної тижневої тенденції, жодного поточного розподілу макронутрієнтів.

Ефективне відстеження калорій вимагає кумулятивних даних. Вам потрібно знати не лише калорії на обід, але й загальну кількість за день, середню за тиждень, розподіл макронутрієнтів та тенденцію ваги з часом. Чат-бот надає ізольовані оцінки без безперервності.

Проблема 4: Непослідовні оцінки для ідентичних запитів. Ми запитували як Gemini, так і ChatGPT оцінити калорії для одного й того ж опису страви тричі в різні дні. Результати варіювалися на 50-200 калорій між запитами. "Середній салат Цезар з грильованою куркою" дав оцінки 380, 450 та 520 калорій від Gemini у трьох окремих розмовах. Ця непослідовність є вродженою для того, як мовні моделі генерують відповіді. Вони є ймовірнісними текстовими генераторами, а не системами пошуку в базі даних.

Проблема 5: Гіпотетичні дані про харчування. У 4 з 30 оцінок страв ChatGPT надав специфічні, але вигадані дані про харчування. Наприклад, він стверджував, що певний бренд протеїнового батончика містить 22 г білка та 210 калорій, тоді як фактична етикетка вказує 20 г білка та 190 калорій. Цифри були достатньо близькими, щоб виглядати правдоподібно, але помилковими, що має значення з часом. Це явище, відоме як "галюцинація" в дослідженнях AI, є особливо небезпечним у харчуванні, оскільки помилки виглядають авторитетно.

Чи точний ChatGPT для підрахунку калорій?

ChatGPT показав трохи кращі результати, ніж Gemini в нашому тестуванні, з 43 відсотками оцінок, які потрапили в межі 10 відсотків від еталону, порівняно з 37 відсотками для Gemini. Однак ця різниця не має практичного значення. Обидва чат-боти значно нижчі за поріг точності, необхідний для надійного управління дієтою.

Академічний стандарт для інструментів оцінки харчування, визначений такими дослідниками, як Subar et al. та Thompson et al. з Національного інституту раку, вимагає, щоб інструмент демонстрував менше 10 відсотків середньої помилки, щоб вважатися дійсним для моніторингу харчування на індивідуальному рівні. Обидва чат-боти значно перевищують цей поріг.

Перевага ChatGPT над Gemini, ймовірно, виникла з трохи кращих припущень щодо розміру порцій для звичайних американських продуктів, що, ймовірно, відображає склад його навчальних даних. Для міжнародних продуктів, регіональних страв і домашніх страв точність значно знижувалася для обох моделей.

AI-чат-бот проти додатка для харчування для відстеження дієти: Повне порівняння

Окрім чистої точності, функціональні відмінності між чат-ботом і спеціалізованим додатком для харчування охоплюють кілька вимірів, які впливають на реальну зручність використання.

Функція Gemini / ChatGPT Nutrola
Точність калорій (проти зваженого еталону) 18-22% середня помилка 6% середня помилка
Перевірена база даних продуктів Ні Так, 1.8M+ записів
Сканування штрих-кодів Ні Так
Розпізнавання їжі на основі фото Обмежене (потрібно завантаження) Вбудоване AI-розпізнавання
Голосове ведення Непряме (перетворення голосу в текст) Нативне голосове ведення їжі
Постійний щоденний журнал Ні Так, автоматично
Поточні щоденні/тижневі підсумки Ні (потрібно вручну підсумовувати) Так, в реальному часі
Розподіл макронутрієнтів Оцінюється за запитом Відстежується за їжею, щоденно, щотижня
Відстеження мікронутрієнтів Непослідовне 100+ нутрієнтів
Відстеження тенденцій ваги Ні Так, з графіками
Інтеграція з Apple Watch Ні Так
Адаптивні цілі калорій Ні Так, коригуються відповідно до ваших тенденцій
Послідовні оцінки Ні (варіюються за запитом) Так (заблоковано в базі даних)
Офлайн-доступ Ні Так
Вартість Безкоштовно (з підпискою для розширених функцій) Від €2.50/місяць
Реклама Варіюється за платформою Жодної реклами

У чому AI-чат-боти хороші в харчуванні?

Незважаючи на свої обмеження для підрахунку калорій, загальні AI-чат-боти мають справжні випадки використання в харчуванні, які слід визнати.

Загальна освіта з харчування. Запитуючи Gemini або ChatGPT пояснити різницю між насиченими та ненасиченими жирами або описати, як відбувається синтез білка, зазвичай отримуєте точні та добре організовані відповіді. Для концептуальних запитань з встановленим науковим консенсусом AI-чат-боти працюють добре.

Генерація ідей для страв. Чат-боти відмінно генерують ідеї рецептів на основі обмежень, таких як "високобілкові страви до 500 калорій з куркою та броколі". Конкретна кількість калорій може бути неточною, але концепції страв є корисними відправними точками.

Порівняння дієтичних патернів. Запитуючи чат-бота порівняти середземноморську, кетогенну та рослинну дієти, ви отримуєте розумні підсумки доказів для кожного підходу.

Де чат-боти зазнають невдачі, так це в кількісному, постійному та точному завданні щоденного підрахунку калорій і нутрієнтів. Це проблема бази даних і ведення записів, а не проблема генерації мови.

Чому спеціалізовані додатки для харчування перевершують загальні AI-чат-боти

Основна причина полягає в архітектурі. Додаток для відстеження харчування побудований навколо структурованої бази даних, постійного профілю користувача та логіки накопичення. AI-чат-бот побудований навколо прогнозування наступного токена з мовної моделі. Це принципово різні інструменти, оптимізовані для принципово різних завдань.

Постійність. Nutrola зберігає повний запис кожної їжі, яку ви реєструєте, ваші щоденні та тижневі підсумки, тенденції макронутрієнтів і історію ваги. Ці довгострокові дані роблять відстеження калорій ефективним. Оцінка калорій в один момент, незалежно від того, наскільки точна, є безглуздою без контексту вашого щоденного підсумку та тижневої тенденції.

Перевірені дані. Запис бази даних для "Chobani Greek Yogurt, Plain, 150g" у Nutrola отримано з етикетки харчування виробника та перевірено відповідно до стандартів USDA. Коли чат-бот оцінює той же продукт, він середньо оцінює інформацію з тисяч веб-джерел різної надійності, що призводить до правдоподібного, але неперевіреного числа.

Інтеграція з носимими пристроями. Дані з Apple Watch безпосередньо надходять до Nutrola, надаючи точні оцінки калорій активності, які комбінуються з веденням їжі для розрахунку чистого енергетичного балансу. Жоден чат-бот не може отримати доступ до ваших даних з носимого пристрою, щоб коригувати рекомендації щодо калорій на основі вашого фактичного щоденного руху.

Швидкість і зручність. Зробити фото своєї тарілки, відсканувати штрих-код або озвучити свою страву займає менше 30 секунд. Введення детального опису страви в чат-бот, очікування відповіді, а потім ручне записування оцінки займає значно більше часу і дає менш точний результат.

Чи можуть AI-чат-боти покращитися настільки, щоб замінити додатки для харчування?

Це питання про фундаментальну архітектуру, а не лише про можливості моделі. Навіть з ідеальною точністю оцінки калорій (якої нинішні моделі далекі від досягнення) AI-чат-боти все ще будуть позбавлені постійного ведення записів, кумулятивного відстеження, інтеграції з носимими пристроями та перевіреної бази даних.

Майбутні AI-системи теоретично можуть включити ці функції. Але в такому випадку вони фактично стануть додатками для харчування з розмовним інтерфейсом, а не загальними чат-ботами. Функції, які роблять відстеження калорій ефективним, перевірена база даних, постійні журнали користувачів, інтеграції пристроїв, адаптивні алгоритми — це інженерні системи, а не мовні можливості.

Найбільш ймовірне майбутнє — це не "чат-боти замінюють додатки для харчування", а "додатки для харчування інтегрують розмовний AI". Це вже відбувається. AI-управлінне розпізнавання зображень та голосове ведення Nutrola забезпечують зручність розмовної взаємодії зі структурованою надійністю перевіреної бази даних харчування. Ви отримуєте природну взаємодію з AI з точністю та постійністю системи, створеної для відстеження.

Що відбувається, коли ви запитуєте AI про підрахунок калорій?

Щоб проілюструвати практичну різницю, ось як виглядає типовий день підрахунку калорій з кожним підходом.

Використовуючи Gemini або ChatGPT: Ви запитуєте чат-бота оцінити ваш сніданок. Він дає вам число. Ви записуєте його десь або намагаєтеся запам'ятати. На обід ви починаєте нову розмову (чат-бот не пам'ятає сніданок) і отримуєте ще одну оцінку. Ви ментально додаєте два числа. До вечері у вас є приблизний підсумок, який може бути помилковим на 200-400 калорій, і у вас немає розподілу макронутрієнтів, постійного запису та тижневої тенденції.

Використовуючи Nutrola: Ви фотографуєте свій сніданок. AI розпізнає продукти, співвідносить їх з перевіреними записами бази даних і автоматично реєструє їх. Ваш щоденний підсумок оновлюється в реальному часі. На обід ви скануєте штрих-код на упаковці свого сендвіча, і точні дані харчування виробника додаються до вашого журналу. До вечері у вас є точний підсумок, розподіл макронутрієнтів і історія страв, яка впливає на ваші тижневі та місячні тенденції. Ваша ціль калорій коригується на основі ваших фактичних даних про тенденції ваги, синхронізованих з вашими Apple Watch.

Різниця не є незначною. Це різниця між здогадкою та системою.

Ключові висновки

Загальні AI-чат-боти, такі як Gemini та ChatGPT, є вражаючими інструментами для багатьох завдань, але підрахунок калорій — не одне з них. Наш тест на 30 страв виявив середні помилки в 108-127 калорій на страву, непослідовні результати в повторних запитах, відсутність постійної можливості ведення записів та інтеграції з базами даних харчування або носимими пристроями. Ці обмеження є структурними, а не випадковими. Вони виникають з фундаментальної різниці між мовною моделлю та системою відстеження харчування.

Для тих, хто серйозно ставиться до управління своїм харчуванням, спеціалізований додаток з перевіреною базою даних, постійним веденням записів та адаптивними цілями залишається необхідним. Nutrola поєднує зручність, що забезпечується AI (розпізнавання зображень, голосове ведення, сканування штрих-кодів), з точністю та постійністю структурованої платформи для харчування, всього за 2.50 євро на місяць без реклами. Коли мова йде про підрахунок калорій, питання не в тому, чи залучений AI. Питання в тому, чи підтримується AI правильною архітектурою для цієї роботи.

Готові трансформувати своє відстеження харчування?

Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!