Může Gemini AI sledovat vaše kalorie? Otestovali jsme to ve srovnání s dedikovanou aplikací
Požádali jsme Gemini a ChatGPT, aby odhadli kalorie u 30 jídel, a poté jsme výsledky porovnali s Nutrolou a váženými referencemi. Rozdíl v přesnosti byl větší, než jsme očekávali.
Jak se AI chatovací roboti stávají součástí každodenního života, přirozeně se objevuje otázka: Můžete se jednoduše zeptat Gemini nebo ChatGPT na sledování kalorií místo používání dedikované nutriční aplikace? Otestovali jsme to přímo. Během dvou týdnů jsme požádali Google Gemini a OpenAI ChatGPT, aby odhadli obsah kalorií a makroživin u 30 různých jídel, od jednoduchých potravin po složitá jídla z restaurací. Jejich odhady jsme porovnali se dvěma referenčními hodnotami: ověřenými záznamy potravin v databázi Nutrola a váženými referencemi vypočítanými pomocí hodnot z USDA FoodData Central.
Výsledky odhalují základní omezení používání AI chatovacích robotů pro sledování výživy, která jsou strukturální a nikoli dočasná, což znamená, že je pravděpodobné, že nebudou plně vyřešena budoucími aktualizacemi modelu.
Mohu použít Gemini k počítání kalorií?
Můžete požádat Gemini, aby odhadl kalorie v jídle, a on vám poskytne odpověď. Otázkou však je, zda je tato odpověď dostatečně přesná a konzistentní pro skutečné řízení stravy. Na základě našich testů je odpověď ne, pokud jde o jakékoli použití, které vyžaduje spolehlivost.
Metodologie testu: Připravili jsme nebo zakoupili 30 jídel s různou složitostí. Každé jídlo bylo zváženo na kalibrované kuchyňské váze a referenční hodnoty kalorií byly vypočítány pomocí nutričních dat z USDA FoodData Central. Poté jsme každé jídlo popsali Gemini (AI asistentovi Google) v přirozeném jazyce, tak jak by to udělal skutečný uživatel, a zaznamenali jsme jeho odhad kalorií. Stejný test jsme provedli s ChatGPT (GPT-4o) a každé jídlo jsme zaznamenali v Nutrole pomocí rozpoznávání fotografií a vyhledávání v databázi.
Definice přesnosti: Odhad jsme považovali za "přesný", pokud spadal do 10 procent od vážené referenční hodnoty, což je standardní prahová hodnota používaná ve výzkumu hodnocení stravy (Subar et al., The Journal of Nutrition, 2015).
Jak přesné jsou AI chatovací roboti pro počítání kalorií?
Výsledky byly konzistentní napříč kategoriemi jídel: AI chatovací roboti poskytují hrubé odhady, které nejsou dostatečně spolehlivé pro diety s kontrolovaným příjmem kalorií.
| Metrika | Gemini | ChatGPT (GPT-4o) | Nutrola | Vážená reference |
|---|---|---|---|---|
| Jídla v rámci 10 % od reference | 11/30 (37 %) | 13/30 (43 %) | 25/30 (83 %) | 30/30 (100 %) |
| Průměrná absolutní chyba | 127 kcal | 108 kcal | 38 kcal | 0 kcal |
| Průměrná procentuální chyba | 22,4 % | 18,6 % | 6,1 % | 0 % |
| Největší jednotlivé nadhodnocení | +340 kcal (těstoviny) | +285 kcal (restaurace) | +95 kcal (restaurace) | N/A |
| Největší jednotlivé podhodnocení | -290 kcal (salát s dresinkem) | -315 kcal (granola) | -72 kcal (domácí polévka) | N/A |
| Konzistentní napříč opakovanými dotazy | Ne (variabilita 50-200 kcal) | Ne (variabilita 30-150 kcal) | Ano (uzamčeno v databázi) | N/A |
Klíčový závěr: Průměrná absolutní chyba 108 až 127 kalorií na jídlo se promítá do kumulativní chyby 324 až 381 kalorií napříč třemi jídly denně. Pro někoho, kdo cílí na deficit 500 kalorií pro hubnutí, tato úroveň nepřesnosti může eliminovat 65 až 76 procent jejich zamýšleného deficitu, což efektivně zastaví pokrok.
Proč AI chatovací roboti chybují v počtech kalorií?
Chyby, které jsme pozorovali, nebyly náhodné. Následovaly předvídatelné vzory, které odhalují strukturální omezení používání velkých jazykových modelů pro nutriční odhady.
Problém 1: Žádná ověřená databáze. Gemini a ChatGPT neprovádějí vyhledávání potravin v strukturované nutriční databázi, když se jich ptáte na odhady kalorií. Generují odpovědi na základě vzorů ve svých tréninkových datech, která zahrnují směs přesných dat z USDA, obsahu generovaného uživateli, odhadů z food blogů a marketingových materiálů. Jediná potravina může mít v těchto zdrojích velmi odlišné hodnoty kalorií a model nemá mechanismus, jak zjistit, který zdroj je správný.
Nutrola a další dedikované nutriční aplikace používají ověřené potravinové databáze. Databáze Nutrola obsahuje více než 1,8 milionu záznamů, které jsou křížově ověřeny s USDA FoodData Central, nutričními štítky výrobců a nezávislými laboratorními analýzami. Když zaznamenáte "kuřecí prsa, grilovaná, 150g," vrácená hodnota je ověřený datový bod, nikoli statistický průměr všeho, co kdy internet řekl o kuřeti.
Problém 2: Žádné určení velikosti porce. Když řeknete AI chatovacímu robotu, že jste měli "misku těstovin," musí hádat, co "miska" znamená. Je to 200 gramů vařených těstovin nebo 400 gramů? Rozdíl je 250 kalorií nebo více. AI chatovací roboti defaultně předpokládají kulturně průměrné velikosti porcí, které nemusí odpovídat vaší skutečné porci.
V našich testech byla chybnost určení velikosti porce největším zdrojem chyb. Gemini podhodnotil misku granoly o 210 kalorií, protože předpokládal menší porci, než byla skutečně konzumována. ChatGPT nadhodnotil stir fry o 285 kalorií, protože předpokládal porce z restaurace, když bylo jídlo domácí.
Nutrola to řeší několika mechanismy: skenování čárového kódu přímo odkazuje na velikosti porcí uvedené výrobcem, AI rozpoznávání fotografií odhaduje objem porce z obrázku a uživatelé mohou upravit porce v gramech pomocí kuchyňské váhy pro maximální přesnost.
Problém 3: Žádná paměť mezi relacemi. To je snad nejzákladnější omezení pro průběžné sledování kalorií. AI chatovací roboti neudržují trvalý záznam o tom, co jste jedli. Každý rozhovor začíná od nuly. Neexistuje žádný denní součet, žádný týdenní trend, žádné běžné rozdělení makroživin.
Efektivní sledování kalorií vyžaduje kumulativní data. Musíte vědět nejen kalorie ve vašem obědě, ale také váš běžný denní součet, váš týdenní průměr, vaše rozdělení makroživin a váš trend hmotnosti v průběhu času. Chatovací robot poskytuje izolované odhady bez kontinuity.
Problém 4: Nekonzistentní odhady pro identické dotazy. Požádali jsme jak Gemini, tak ChatGPT, aby odhadli kalorie pro stejný popis jídla třikrát v různých dnech. Výsledky se lišily o 50 až 200 kalorií napříč dotazy. "Střední Caesar salát s grilovaným kuřetem" vrátil odhady 380, 450 a 520 kalorií od Gemini napříč třemi samostatnými rozhovory. Tato nekonzistence je inherentní tomu, jak jazykové modely generují odpovědi. Jsou to pravděpodobnostní generátory textu, nikoli systémy pro vyhledávání databází.
Problém 5: Halucinační nutriční data. Ve 4 z 30 odhadů jídel poskytl ChatGPT konkrétní, ale vymyšlené nutriční rozdělení. Například uvedl, že konkrétní značka proteinové tyčinky obsahuje 22 g bílkovin a 210 kalorií, když skutečný štítek uvádí 20 g bílkovin a 190 kalorií. Čísla byla dost blízko, aby se zdála pravděpodobná, ale dost špatná, aby to v průběhu času mělo význam. Tento jev, známý jako halucinace v AI výzkumu, je v oblasti výživy obzvlášť nebezpečný, protože chyby vypadají autoritativně.
Je ChatGPT přesný pro počítání kalorií?
ChatGPT se v našem testování mírně umístil lépe než Gemini, přičemž 43 procent odhadů spadlo do 10 procent od referenční hodnoty oproti 37 procentům pro Gemini. Tento rozdíl však není prakticky významný. Oba chatovací roboti jsou daleko pod prahovou hodnotou přesnosti potřebnou pro spolehlivé řízení stravy.
Akademický standard pro nástroje hodnocení stravy, jak jej definují výzkumníci jako Subar et al. a Thompson et al. z Národního onkologického institutu, vyžaduje, aby nástroj prokázal méně než 10 procent průměrné chyby, aby byl považován za platný pro sledování stravy na individuální úrovni. Oba chatovací roboti tuto prahovou hodnotu překračují širokým rozsahem.
Výhoda ChatGPT oproti Geminimu se zdála vyplývat z mírně lepších předpokladů velikosti porcí pro běžné americké potraviny, což pravděpodobně odráží složení jeho tréninkových dat. U mezinárodních potravin, regionálních pokrmů a domácích jídel přesnost výrazně klesla pro oba modely.
AI Chatbot vs Nutriční aplikace pro sledování diety: Kompletní srovnání
Kromě surové přesnosti se funkční rozdíly mezi chatovacím robotem a dedikovanou nutriční aplikací rozprostírají napříč několika dimenzemi, které ovlivňují reálnou použitelnost.
| Funkce | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Přesnost kalorií (vs vážená reference) | 18-22% průměrná chyba | 6% průměrná chyba |
| Ověřená potravinová databáze | Ne | Ano, 1,8M+ záznamů |
| Skenování čárového kódu | Ne | Ano |
| Rozpoznávání potravin na základě fotografií | Omezené (vyžaduje nahrání) | Vestavěné AI rozpoznávání |
| Hlasové zaznamenávání | Nepřímé (hlas na text) | Nativní hlasové zaznamenávání potravin |
| Trvalý denní záznam | Ne | Ano, automatický |
| Běžné denní/týdenní součty | Ne (musí se ručně sčítat) | Ano, v reálném čase |
| Rozdělení makroživin | Odhadované na základě dotazu | Sledované na základě potravin, denně, týdně |
| Sledování mikroživin | Nekonzistentní | 100+ živin |
| Sledování trendu hmotnosti | Ne | Ano, s grafy |
| Integrace s Apple Watch | Ne | Ano |
| Adaptivní cíle kalorií | Ne | Ano, přizpůsobuje se vašim trendům |
| Konzistentní odhady | Ne (liší se podle dotazu) | Ano (uzamčeno v databázi) |
| Offline přístup | Ne | Ano |
| Cena | Zdarma (s předplatným pro pokročilé) | Od €2.50/měsíc |
| Reklamy | Liší se podle platformy | Žádné reklamy |
Na co jsou AI chatovací roboti dobří v oblasti výživy?
Navzdory svým omezením pro sledování kalorií mají AI chatovací roboti legitimní využití v oblasti výživy, které by mělo být uznáno.
Obecné vzdělávání o výživě. Požádání Gemini nebo ChatGPT, aby vysvětlili rozdíl mezi nasycenými a nenasycenými tuky, nebo aby popsali, jak funguje syntéza bílkovin, obvykle produkuje přesné a dobře uspořádané odpovědi. U konceptuálních otázek s ustáleným vědeckým konsensem AI chatovací roboti fungují dobře.
Generování nápadů na jídlo. Chatovací roboti excelují v generování nápadů na recepty na základě omezení, jako je "vysoce bílkovinná jídla pod 500 kalorií s kuřetem a brokolicí." Specifický počet kalorií nemusí být přesný, ale koncepty jídel jsou užitečné výchozí body.
Porovnání dietních vzorců. Požádání chatovacího robota, aby porovnal středomořskou, ketogenní a rostlinnou stravu, produkuje rozumné shrnutí důkazů pro každý přístup.
Kde chatovací roboti selhávají, je v kvantitativním, trvalém a přesnostně závislém úkolu každodenního sledování kalorií a živin. To je problém databáze a zaznamenávání, nikoli generování jazyka.
Proč dedikované nutriční aplikace překonávají obecné AI chatovací roboty
Hlavním důvodem je architektura. Aplikace pro sledování výživy je postavena kolem strukturované databáze, trvalého uživatelského profilu a akumulační logiky. AI chatovací robot je postaven kolem předpovědi dalšího tokenu z jazykového modelu. To jsou zásadně různé nástroje optimalizované pro zásadně různé úkoly.
Trvalost. Nutrola udržuje úplný záznam o každé potravině, kterou zaznamenáte, vašich denních a týdenních součtech, trendech makroživin a historii tělesné hmotnosti. Tato longitudinální data činí sledování kalorií efektivním. Odhad kalorií v jednom bodě, bez ohledu na to, jak přesný, je k ničemu bez kontextu vašeho denního součtu a týdenního vzorce.
Ověřená data. Záznam databáze pro "Chobani řecký jogurt, přírodní, 150g" v Nutrole je získán z nutričního štítku výrobce a ověřen podle standardů USDA. Když chatovací robot odhaduje stejnou položku, průměruje informace z tisíců webových zdrojů s různou spolehlivostí, což produkuje pravděpodobné, ale neověřené číslo.
Integrace s nositelnými zařízeními. Data z Apple Watch se přímo přenášejí do Nutrola, což poskytuje přesné odhady kalorií z aktivit, které se kombinují se sledováním potravin pro výpočet čisté energetické bilance. Žádný chatovací robot nemůže přistupovat k vašim datům z nositelných zařízení, aby upravil doporučení kalorií na základě vašeho skutečného denního pohybu.
Rychlost a pohodlí. Pořízení fotografie vašeho talíře, skenování čárového kódu nebo mluvení o vašem jídle trvá méně než 30 sekund. Psát podrobný popis jídla chatovacímu robotu, čekat na odpověď a poté ručně zaznamenat odhad někde trvá výrazně déle a produkuje méně přesný výsledek.
Mohou se AI chatovací roboti zlepšit natolik, aby nahradili nutriční aplikace?
To je otázka o základní architektuře, nikoli jen o schopnostech modelu. I při dokonalé přesnosti odhadu kalorií (kterou současné modely daleko nevyhovují) by AI chatovací roboti stále postrádali trvalé zaznamenávání, kumulativní sledování, integraci s nositelnými zařízeními a ověřování ve strukturované databázi, které sledování výživy vyžaduje.
Budoucí AI systémy by teoreticky mohly tyto funkce zahrnout. Ale v tom případě by to v podstatě byly nutriční aplikace s konverzačním rozhraním, nikoli obecné chatovací roboty. Funkce, které činí sledování kalorií efektivním, ověřená databáze, trvalé uživatelské záznamy, integrace zařízení, adaptivní algoritmy, jsou inženýrské systémy, nikoli jazykové schopnosti.
Nejpravděpodobnější budoucnost není "chatovací roboti nahradí nutriční aplikace", ale spíše "nutriční aplikace začleňují konverzační AI." To se již děje. AI poháněné rozpoznávání fotografií a hlasové zaznamenávání Nutrola přináší pohodlí konverzační interakce do strukturované spolehlivosti ověřené nutriční databáze. Získáte přirozenou interakci s AI s přesností a trvalostí systému určeného k sledování.
Co se stane, když požádáte AI, aby sledovala vaše kalorie?
Abychom ilustrovali praktický rozdíl, zde je to, jak typický den sledování kalorií vypadá s každým přístupem.
Použití Gemini nebo ChatGPT: Požádáte chatovacího robota, aby odhadl vaše snídaně. Dává vám číslo. Někde si to zapíšete nebo se to snažíte zapamatovat. Na oběd začínáte nový rozhovor (chatovací robot si nepamatuje snídani) a dostanete další odhad. Mentálně sčítáte obě dvě čísla. Před večeří máte hrubý běžný součet, který může být od 200 do 400 kalorií mimo, a nemáte žádné rozdělení makroživin, žádný trvalý záznam a žádný týdenní trend.
Použití Nutrola: Vyfotíte svou snídani. AI rozpozná potraviny, přiřadí je k ověřeným záznamům v databázi a automaticky je zaznamená. Váš denní součet se aktualizuje v reálném čase. Na oběd naskenujete čárový kód na obalu vašeho sendviče a přesná nutriční data výrobce se přidají do vašeho záznamu. Před večeří máte přesný běžný součet, rozdělení makroživin a historii jídel, která přispívá k vašim týdenním a měsíčním trendům. Váš cíl kalorií se přizpůsobuje na základě vašich skutečných trendů hmotnosti synchronizovaných z Apple Watch.
Rozdíl není subtilní. Je to rozdíl mezi odhadem a systémem.
Klíčové závěry
Obecné AI chatovací roboti jako Gemini a ChatGPT jsou impozantní nástroje pro mnoho úkolů, ale sledování kalorií není jedním z nich. Náš test 30 jídel zjistil průměrné chyby 108 až 127 kalorií na jídlo, nekonzistentní výsledky napříč opakovanými dotazy, žádnou trvalou schopnost zaznamenávání a žádnou integraci s databázemi potravin nebo nositelnými zařízeními. Tato omezení jsou strukturální, nikoli nahodilá. Vyplývají z fundamentálního rozdílu mezi jazykovým modelem a systémem pro sledování výživy.
Pro každého, kdo to myslí vážně s řízením své výživy, zůstává dedikovaná aplikace s ověřenou databází, trvalým zaznamenáváním a adaptivními cíli nezbytná. Nutrola kombinuje pohodlí poháněné AI (rozpoznávání fotografií, hlasové zaznamenávání, skenování čárového kódu) s přesností a trvalostí strukturované nutriční platformy, to vše za 2,50 eura měsíčně bez reklam. Pokud jde o sledování kalorií, otázka není, zda je AI zapojena. Je to otázka, zda je AI podpořena správnou architekturou pro tuto práci.
Připraveni proměnit sledování výživy?
Přidejte se k tisícům, kteří svou cestu ke zdraví proměnili s Nutrola!