Képes a Gemini AI nyomon követni a kalóriáidat? Teszteltük egy dedikált alkalmazással
Megkértük a Geminit és a ChatGPT-t, hogy becsüljék meg 30 étkezés kalóriatartalmát, majd összehasonlítottuk az eredményeket a Nutrola-val és a súlyozott ételek referenciaértékeivel. Az eltérés nagyobb volt, mint vártuk.
Ahogy az AI chatbotok egyre inkább a mindennapi élet részévé válnak, felmerül a kérdés: vajon elég, ha csak megkérdezed a Geminit vagy a ChatGPT-t, hogy kövessék a kalóriáidat, ahelyett, hogy egy dedikált táplálkozási alkalmazást használnál? Ezt közvetlenül teszteltük. Két hét alatt megkértük a Google Geminit és az OpenAI ChatGPT-t, hogy becsüljék meg 30 különböző étkezés kalória- és makrotápanyag-tartalmát, az egyszerű egy összetevőből készült ételektől kezdve a bonyolult éttermek fogásaiig. Az ő becsléseiket két referenciaértékkel hasonlítottuk össze: a Nutrola hitelesített élelmiszer-adatbázisának bejegyzéseivel és a USDA FoodData Central értékeivel számolt súlyozott ételekkel.
Az eredmények alapvető korlátokat mutatnak a általános célú AI chatbotok táplálkozási nyomon követésére, amelyek strukturális jellegűek, nem pedig átmenetiek, így valószínű, hogy a jövőbeli modellek frissítései sem oldják meg őket teljesen.
Használhatom a Geminit kalóriaszámlálásra?
Megkérdezheted a Geminit, hogy becsülje meg egy étkezés kalóriatartalmát, és választ fog adni. A kérdés az, hogy ez a válasz elég pontos és következetes-e ahhoz, hogy támogassa a tényleges diétás menedzsmentet. A tesztelésünk alapján a válasz nem, ha megbízhatóságra van szükség.
Tesztelési módszertan: 30 étkezést készítettünk vagy vásároltunk, amelyek különböző bonyolultságúak voltak. Minden étkezést egy kalibrált konyhai mérlegen megmértünk, és a referencia kalóriaértékeket az USDA FoodData Central táplálkozási adatai alapján számoltuk ki. Ezután minden étkezést természetes nyelven írtunk le a Gemininél (a Google AI asszisztense), ahogyan egy valódi felhasználó tenné, és rögzítettük a kalória becslését. Ugyanezt a tesztet elvégeztük a ChatGPT-vel (GPT-4o), és minden étkezést bejegyeztünk a Nutrolába fénykép-azonosítással és adatbázis-kereséssel.
Pontosság meghatározása: A becslést "pontosnak" definiáltuk, ha az 10 százalékon belül volt a súlyozott referenciaértéktől, ami egy standard küszöb a táplálkozási értékelési kutatásokban (Subar et al., The Journal of Nutrition, 2015).
Mennyire pontosak az AI chatbotok a kalóriaszámlálásban?
Az eredmények következetesek voltak az étkezési kategóriák között: az általános célú AI chatbotok durva becsléseket adnak, amelyek nem elég megbízhatóak a kalóriakontrollált diétákhoz.
| Metrika | Gemini | ChatGPT (GPT-4o) | Nutrola | Súlyozott referencia |
|---|---|---|---|---|
| Ételek, amelyek 10%-on belül vannak a referenciától | 11/30 (37%) | 13/30 (43%) | 25/30 (83%) | 30/30 (100%) |
| Átlagos abszolút hiba | 127 kcal | 108 kcal | 38 kcal | 0 kcal |
| Átlagos százalékos hiba | 22.4% | 18.6% | 6.1% | 0% |
| Legnagyobb egyedi túlbecsülés | +340 kcal (tésztás étel) | +285 kcal (zöldséges étel) | +95 kcal (éttermi étkezés) | N/A |
| Legnagyobb egyedi alábecsülés | -290 kcal (saláta öntettel) | -315 kcal (granola tál) | -72 kcal (házi leves) | N/A |
| Ismételt lekérdezések közötti következetesség | Nem (50-200 kcal eltérés) | Nem (30-150 kcal eltérés) | Igen (adatbázis-zár) | N/A |
Kulcsfontosságú megállapítás: Az átlagos abszolút hiba 108-127 kalória étkezésenként 324-381 kalória kumulatív hibát jelent három étkezés naponta. Ha valaki 500 kalóriás deficitre törekszik a fogyás érdekében, ez a szintű pontatlanság 65-76%-kal csökkentheti a tervezett deficitet, gyakorlatilag megakadályozva a fejlődést.
Miért tévednek az AI chatbotok a kalóriák számításában?
A megfigyelt hibák nem véletlenszerűek. Megjósolható mintákat követnek, amelyek a nagy nyelvi modellek táplálkozási becslésre való használatának strukturális korlátait tárják fel.
Probléma 1: Nincs hitelesített adatbázis. A Gemini és a ChatGPT nem keresnek ételeket egy strukturált táplálkozási adatbázisban, amikor kalória becsléseket kérsz tőlük. A válaszokat a tanulási adataikban lévő minták alapján generálják, amelyek között pontos USDA adatok, felhasználók által generált tartalom, étkezési blogok becslései és marketinganyagok keveréke található. Egyetlen élelmiszernek széles spektrumú kalóriaértékei lehetnek ezekből a forrásokból, és a modellnek nincs mechanizmusa annak az azonosítására, hogy melyik forrás a helyes.
A Nutrola és más dedikált táplálkozási alkalmazások hitelesített élelmiszeradatbázisokat használnak. A Nutrola adatbázisa több mint 1,8 millió bejegyzést tartalmaz, amelyeket az USDA FoodData Central, a gyártók táplálkozási címkéi és független laboratóriumi elemzések alapján keresztellenőriztek. Amikor bejegyzed, hogy "grillezett csirkemell, 150g", a visszakapott érték egy hitelesített adatpont, nem pedig mindaz, amit az internet valaha mondott a csirkéről.
Probléma 2: Nincs adagméret-azonosítás. Amikor azt mondod egy AI chatbotnak, hogy "egy tál tészta", akkor meg kell tippelnie, mit jelent az "egy tál". 200 gramm főtt tésztát jelent, vagy 400 grammot? A különbség 250 kalória vagy annál több. Az AI chatbotok a kulturálisan átlagolt adagfeltételezésekre támaszkodnak, amelyek nem biztos, hogy megfelelnek a tényleges adagodnak.
A tesztelésünk során az adagméret téveszméje volt a legnagyobb hiba forrása. A Gemini 210 kalóriával alábecsülte a granola tálat, mert kisebb adagot feltételezett, mint amit valójában elfogyasztottak. A ChatGPT 285 kalóriával túlbecsülte a zöldséges ételt, mert étterem méretű adagokat feltételezett, amikor az étel otthon készült.
A Nutrola ezt több mechanizmuson keresztül kezeli: a vonalkód-olvasás közvetlenül a gyártó által megadott adagméretekhez kapcsolódik, az AI fénykép-azonosítás a kép alapján becsüli meg az adag térfogatát, és a felhasználók grammokban állíthatják be az adagokat a maximális pontosság érdekében.
Probléma 3: Nincs memória a munkamenetek között. Ez talán a legfontosabb korlát a folyamatos kalóriaszámlálás szempontjából. Az AI chatbotok nem tartanak fenn tartós naplót arról, mit ettél. Minden beszélgetés nulláról indul. Nincs napi összesítés, nincs heti trend, nincs folyamatos makrotápanyag-elemzés.
A hatékony kalóriaszámlálás kumulatív adatokat igényel. Tudnod kell, nemcsak a kalóriákat az ebédedben, hanem a napi összesítést, a heti átlagot, a makrotápanyagok megoszlását és a testsúlyod trendjét az idő múlásával. Egy chatbot elszigetelt pontbecsléseket ad, amelyeknek nincs folytonosságuk.
Probléma 4: Inkonzisztens becslések az azonos lekérdezésekre. Mind a Geminit, mind a ChatGPT-t megkértük, hogy becsüljék meg a kalóriákat ugyanannak az étkezésnek a leírása alapján három különböző napon. Az eredmények 50-200 kalória eltérést mutattak a lekérdezések között. Egy "közepes Caesar saláta grillezett csirkével" becslései 380, 450 és 520 kalória voltak a Geminitől három különböző beszélgetés során. Ez az inkonzisztencia a nyelvi modellek válaszgenerálási módjának inherent jellemzője. Ezek valószínűségi szöveg-generátorok, nem adatbázis-kereső rendszerek.
Probléma 5: Képzelt táplálkozási adatok. A 30 étkezésből 4 esetben a ChatGPT konkrétan hangzó, de kitalált táplálkozási bontásokat adott meg. Például azt állította, hogy egy adott márkájú fehérjeszelet 22g fehérjét és 210 kalóriát tartalmaz, miközben a tényleges címke 20g fehérjét és 190 kalóriát mutatott. A számok elég közel voltak ahhoz, hogy hihetőnek tűnjenek, de elég távol ahhoz, hogy számítson az idő múlásával. Ezt a jelenséget, amely az AI kutatásban hallucinációnak nevezik, különösen veszélyesnek tartják a táplálkozás terén, mert a hibák tekintélyesnek tűnnek.
Mennyire pontos a ChatGPT a kalóriaszámlálásban?
A ChatGPT a tesztünk során kissé jobban teljesített, mint a Gemini, mivel az becslések 43%-a esett 10%-on belül a referenciaértéktől, míg a Gemini esetében ez 37% volt. Azonban ez a különbség nem gyakorlati értelemben jelentős. Mindkét chatbot messze elmarad a megbízható diétás menedzsmenthez szükséges pontossági küszöbtől.
A táplálkozási értékelő eszközök tudományos standardja, amelyet olyan kutatók határoztak meg, mint Subar et al. és Thompson et al. a Nemzeti Rákkutató Intézetben, megköveteli, hogy egy eszköznek kevesebb mint 10% átlagos hibát kell mutatnia ahhoz, hogy érvényesnek tekintsék egyéni szintű táplálkozási nyomon követéshez. Mindkét chatbot messze túllépi ezt a küszöböt.
A ChatGPT előnye a Geminivel szemben valószínűleg a közönséges amerikai ételek adagméretének valamivel jobb feltételezéseiből adódik, ami valószínűleg a tanulási adatok összetételének tükröződése. A nemzetközi ételek, regionális ételek és házi készítésű ételek esetében a pontosság jelentősen csökkent mindkét modellnél.
AI Chatbot vs Táplálkozási Alkalmazás diétás nyomon követéshez: Teljes Összehasonlítás
A nyers pontosságon túl a chatbotok és a dedikált táplálkozási alkalmazások közötti funkcionális különbségek több dimenzióban is kiterjednek, amelyek befolyásolják a valós használhatóságot.
| Jellemző | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Kalória pontosság (súlyozott referencia alapján) | 18-22% átlagos hiba | 6% átlagos hiba |
| Hitelesített élelmiszer adatbázis | Nincs | Igen, 1,8M+ bejegyzés |
| Vonalkód-olvasás | Nincs | Igen |
| Fénykép alapú élelmiszer-azonosítás | Korlátozott (feltöltést igényel) | Beépített AI-azonosítás |
| Hangalapú naplózás | Közvetett (hangról szövegre) | Natív hangalapú étkezésnaplózás |
| Tartós napi napló | Nincs | Igen, automatikus |
| Folyamatos napi/heti összesítések | Nincs (kézzel kell összegezni) | Igen, valós időben |
| Makrotápanyag bontás | Lekérdezésenként becsült | Étel, napi, heti bontásban nyomon követett |
| Mikrotápanyag nyomon követés | Inkonzisztens | 100+ tápanyag |
| Testsúly trend nyomon követés | Nincs | Igen, grafikonokkal |
| Apple Watch integráció | Nincs | Igen |
| Adaptív kalóriacélok | Nincs | Igen, a trendjeidhez igazítva |
| Következetes becslések | Nincs (lekérdezésenként változik) | Igen (adatbázis-zár) |
| Offline hozzáférés | Nincs | Igen |
| Költség | Ingyenes (előfizetéssel a fejlettekhez) | 2,50 eurótól/hó |
| Hirdetések | Változó a platformtól függően | Nulla hirdetés |
Miben jók az AI chatbotok a táplálkozásban?
A kalóriaszámlálás korlátai ellenére az általános célú AI chatbotoknak vannak legitim táplálkozási felhasználási eseteik, amelyeket el kell ismerni.
Általános táplálkozási oktatás. Ha megkérdezed a Geminit vagy a ChatGPT-t, hogy magyarázza el a telített és telítetlen zsírok közötti különbséget, vagy hogy írja le, hogyan működik a fehérjeszintézis, általában pontos és jól szervezett válaszokat adnak. A tudományos konszenzussal rendelkező fogalmi kérdések esetén az AI chatbotok jól teljesítenek.
Ételötletek generálása. A chatbotok kiválóan generálnak receptötleteket olyan korlátok alapján, mint például "magas fehérjetartalmú ételek 500 kalória alatt csirkével és brokkolival". A konkrét kalóriaszám lehet, hogy nem pontos, de az étkezési koncepciók hasznos kiindulópontok.
Diétás minták összehasonlítása. Ha megkérdezel egy chatbotot, hogy hasonlítsa össze a mediterrán, ketogén és növényi alapú diétákat, ésszerű összefoglalókat ad az egyes megközelítések bizonyítékairól.
A chatbotok gyengéi a napi kalória- és tápanyagkövetés mennyiségi, tartós és pontosságra érzékeny feladata. Ez egy adatbázis- és naplózási probléma, nem pedig nyelvtermelési probléma.
Miért teljesítenek jobban a dedikált táplálkozási alkalmazások, mint az általános AI chatbotok?
A fő ok az architektúrában rejlik. Egy táplálkozási nyomon követő alkalmazás egy strukturált adatbázis, egy tartós felhasználói profil és felhalmozási logika köré épül. Egy AI chatbot a nyelvi modellből származó következő token előrejelzésére épül. Ezek alapvetően eltérő eszközök, amelyek alapvetően eltérő feladatokra optimalizáltak.
Tartósság. A Nutrola teljes nyilvántartást vezet minden élelemről, amit bejegyzel, a napi és heti összesítéseidről, a makrotápanyag-trendjeidről és a testsúlytörténetedről. Ez a longitudinális adat az, ami hatékonyá teszi a kalóriaszámlálást. Egyetlen pontbeli kalória becslés, bármennyire pontos is, haszontalan a napi összesítés és a heti minta kontextusa nélkül.
Hitelesített adatok. A Nutrolában a "Chobani Görög Joghurt, Natúr, 150g" adatbázis-bejegyzés a gyártó táplálkozási címkéjéből származik, és az USDA szabványokkal ellenőrizve van. Amikor egy chatbot ugyanazt az elemet becsüli, akkor ezer webforrás információját átlagolja, amelyek eltérő megbízhatósággal bírnak, így egy hihető, de nem hitelesített számot ad.
Viselhető eszközök integrációja. Az Apple Watch adatai közvetlenül a Nutrolába kerülnek, pontos aktivitási kalória becsléseket biztosítva, amelyeket az étkezési naplózással kombinálva számítanak ki a nettó energiaegyensúlyt. Egy chatbot nem tudja elérni a viselhető eszközödet, hogy a tényleges napi mozgásod alapján igazítsa a kalóriaajánlásokat.
Sebesség és kényelem. Az étkezésed fényképének készítése, vonalkód beolvasása vagy az étkezésed elmondása kevesebb mint 30 másodpercet vesz igénybe. Részletes étkezésleírás begépelése egy chatbotnak, a válaszra várakozás, majd a becslés manuális rögzítése valahol sokkal hosszabb ideig tart, és kevésbé pontos eredményt ad.
Lehetséges, hogy az AI chatbotok annyira fejlődjenek, hogy helyettesítsék a táplálkozási alkalmazásokat?
Ez egy alapvető architektúrával kapcsolatos kérdés, nem csupán a modell képességeivel. Még ha a kalória becslések pontossága tökéletes lenne (ami jelenlegi modellek esetében messze van), az AI chatbotok akkor is hiányoznának a tartós naplózás, a kumulatív nyomon követés, a viselhető eszközök integrációja és a strukturált adatbázis-ellenőrzés, amelyek a táplálkozási nyomon követéshez szükségesek.
A jövőbeli AI rendszerek elméletileg beépíthetnék ezeket a funkciókat. De ekkor lényegében táplálkozási alkalmazások lennének egy beszélgetési felülettel, nem általános célú chatbotok. Azok a funkciók, amelyek működőképessé teszik a kalóriaszámlálást, mint például a hitelesített adatbázis, a tartós felhasználói naplók, az eszközintegrációk és az adaptív algoritmusok mérnöki rendszerek, nem nyelvi képességek.
A legvalószínűbb jövő nem az, hogy "a chatbotok helyettesítik a táplálkozási alkalmazásokat", hanem inkább az, hogy "a táplálkozási alkalmazások beépítik a beszélgetési AI-t". Ez már most is történik. A Nutrola AI-alapú fénykép-azonosítása és hangalapú naplózása a beszélgetési interakció kényelmét hozza a hitelesített táplálkozási adatbázis megbízhatóságához. Így megkapod a természetes interakciót egy AI-val, a pontos és tartós nyomon követési rendszer előnyeivel.
Mi történik, amikor megkérdezel egy AI-t, hogy kövesse a kalóriáidat?
A gyakorlati különbség illusztrálására itt van, hogyan néz ki egy tipikus kalóriaszámlálási nap mindkét megközelítéssel.
Gemini vagy ChatGPT használatával: Megkéred a chatbotot, hogy becsülje meg a reggelidet. Ad egy számot. Valahol felírod, vagy próbálod megjegyezni. Ebédnél új beszélgetést kezdesz (a chatbot nem emlékszik a reggelire), és kapsz egy újabb becslést. Mentálisan összeadod a két számot. Vacsorára már van egy durva összesítésed, ami 200-400 kalóriával eltérhet, és nincs makrotápanyag-bontásod, tartós nyilvántartásod, és heti trended.
Nutrola használatával: Fényképet készítesz a reggelidről. Az AI azonosítja az ételeket, összepárosítja őket a hitelesített adatbázis-bejegyzésekkel, és automatikusan rögzíti őket. A napi összesítésed valós időben frissül. Ebédnél beolvasod a szendvics csomagolásán található vonalkódot, és a pontos gyártói táplálkozási adatok bekerülnek a naplódba. Vacsorára pontos futó összesítéssel, makrotápanyag-bontással és étkezési előzményekkel rendelkezel, amelyek táplálják a heti és havi trendjeidet. A kalóriacélod az Apple Watch-ról szinkronizált tényleges testsúly-trend adatok alapján állítódik be.
A különbség nem elhanyagolható. Ez a különbség egy tipp és egy rendszer között.
Kulcsfontosságú megállapítások
Az általános célú AI chatbotok, mint a Gemini és a ChatGPT, lenyűgöző eszközök sok feladatra, de a kalóriaszámlálás nem tartozik ezek közé. A 30 étkezéses tesztünk 108-127 kalória átlagos hibát mutatott étkezésenként, inkonzisztens eredményeket a megismételt lekérdezések között, tartós naplózási képesség hiányát, valamint az élelmiszeradatbázisokkal és viselhető eszközökkel való integráció hiányát. Ezek a korlátok strukturálisak, nem véletlenszerűek. A nyelvi modell és a táplálkozási nyomon követő rendszer közötti alapvető különbségekből erednek.
Bárki, aki komolyan szeretné kezelni a táplálkozását, számára elengedhetetlen egy dedikált alkalmazás, amely hitelesített adatbázissal, tartós naplózással és adaptív célokkal rendelkezik. A Nutrola az AI-alapú kényelmet (fénykép-azonosítás, hangalapú naplózás, vonalkód-olvasás) ötvözi a strukturált táplálkozási platform pontosságával és tartósságával, mindezt 2,50 euró/hó áron, hirdetések nélkül. Amikor a kalóriaszámlálásról van szó, a kérdés nem az, hogy az AI részt vesz-e. Hanem az, hogy az AI mögött a megfelelő architektúra áll-e a feladathoz.
Készen állsz a táplálkozásod nyomon követésének átalakítására?
Csatlakozz ezrekhez, akik a Nutrolával átalakították az egészségügyi útjukat!