Poate Gemini AI să-ți urmărească caloriile? Am testat-o față în față cu o aplicație dedicată
Am cerut lui Gemini și ChatGPT să estimeze caloriile pentru 30 de mese, apoi am comparat rezultatele cu Nutrola și referințele alimentare cântărite. Diferența de acuratețe a fost mai mare decât ne așteptam.
Pe măsură ce chatboții AI devin parte din viața de zi cu zi, o întrebare firească apare: poți să-i ceri lui Gemini sau ChatGPT să-ți urmărească caloriile în loc să folosești o aplicație de nutriție dedicată? Am testat acest lucru direct. Pe parcursul a două săptămâni, am cerut lui Google Gemini și OpenAI ChatGPT să estimeze conținutul caloric și macronutrient al 30 de mese diferite, de la alimente simple cu un singur ingredient până la preparate complexe din restaurante. Am comparat estimările lor cu două repere: intrările verificate din baza de date Nutrola și referințele alimentare cântărite calculate folosind valorile din USDA FoodData Central.
Rezultatele dezvăluie limitări fundamentale în utilizarea chatboților AI de uz general pentru urmărirea nutriției, limitări care sunt structurale, nu temporare, ceea ce înseamnă că este puțin probabil să fie complet rezolvate prin actualizări viitoare ale modelului.
Pot folosi Gemini pentru a număra caloriile?
Poți cere lui Gemini să estimeze caloriile dintr-o masă, iar acesta îți va oferi un răspuns. Întrebarea este dacă acel răspuns este suficient de precis și constant pentru a susține o gestionare reală a dietei. Pe baza testării noastre, răspunsul este nu pentru orice caz de utilizare care necesită fiabilitate.
Metodologia testului: Am pregătit sau achiziționat 30 de mese acoperind o gamă de complexitate. Fiecare masă a fost cântărită pe o balanță de bucătărie calibrată, iar valorile calorice de referință au fost calculate folosind datele nutriționale din USDA FoodData Central. Apoi, am descris fiecare masă lui Gemini (asistentul AI de la Google) în limbaj natural, exact așa cum ar face un utilizator real, și am înregistrat estimarea calorică. Am efectuat același test cu ChatGPT (GPT-4o) și am înregistrat fiecare masă în Nutrola folosind recunoașterea foto și căutarea în baza de date.
Definiția acurateței: Am definit o estimare ca fiind "precisă" dacă se încadra în 10 procente față de valoarea de referință cântărită, un prag standard utilizat în cercetările de evaluare dietetică (Subar et al., The Journal of Nutrition, 2015).
Cât de precise sunt chatboții AI pentru numărarea caloriilor?
Rezultatele au fost consistente în toate categoriile de mese: chatboții AI de uz general oferă estimări aproximative care nu sunt suficient de fiabile pentru dietele controlate caloric.
| Metric | Gemini | ChatGPT (GPT-4o) | Nutrola | Referință cântărită |
|---|---|---|---|---|
| Mese în cadrul a 10% din referință | 11/30 (37%) | 13/30 (43%) | 25/30 (83%) | 30/30 (100%) |
| Eroare absolută medie | 127 kcal | 108 kcal | 38 kcal | 0 kcal |
| Eroare procentuală medie | 22.4% | 18.6% | 6.1% | 0% |
| Cea mai mare supraestimare unică | +340 kcal (felie de paste) | +285 kcal (stir fry) | +95 kcal (masă de restaurant) | N/A |
| Cea mai mare subestimare unică | -290 kcal (salată cu dressing) | -315 kcal (bol de granola) | -72 kcal (supă de casă) | N/A |
| Consistentă în cereri repetate | Nu (variază între 50-200 kcal) | Nu (variază între 30-150 kcal) | Da (blocat în baza de date) | N/A |
Constatare cheie: Eroarea absolută medie de 108 până la 127 de calorii pe masă se traduce în 324 până la 381 de calorii de eroare cumulată pe parcursul a trei mese pe zi. Pentru cineva care vizează un deficit de 500 de calorii pentru pierderea în greutate, acest nivel de inexactitate poate elimina 65 până la 76 la sută din deficitul dorit, stagnând efectiv progresul.
De ce greșesc chatboții AI în numărarea caloriilor?
Erorile pe care le-am observat nu au fost aleatorii. Ele au urmat modele previzibile care dezvăluie limitările structurale ale utilizării modelelor lingvistice mari pentru estimarea nutrițională.
Problema 1: Fără bază de date verificată. Gemini și ChatGPT nu caută alimente într-o bază de date nutrițională structurată atunci când le ceri estimări calorice. Ele generează răspunsuri bazate pe modele din datele lor de antrenament, care includ un amestec de date precise din USDA, conținut generat de utilizatori, estimări din bloguri culinare și materiale de marketing. Un singur aliment poate avea valori calorice extrem de diferite în funcție de aceste surse, iar modelul nu are un mecanism prin care să identifice care sursă este corectă.
Nutrola și alte aplicații de nutriție dedicate utilizează baze de date verificate. Baza de date Nutrola conține peste 1.8 milioane de intrări corelate cu USDA FoodData Central, etichetele nutriționale ale producătorilor și analizele de laborator independente. Atunci când înregistrezi "piept de pui, la grătar, 150g", valoarea returnată este un punct de date verificat, nu o medie statistică a tot ce a spus internetul vreodată despre pui.
Problema 2: Fără referință la dimensiunea porției. Când îi spui unui chatbot AI că ai avut "o farfurie de paste", acesta trebuie să ghicească ce înseamnă "o farfurie". Este vorba de 200 de grame de paste fierte sau de 400 de grame? Diferența este de 250 de calorii sau mai mult. Chatboții AI se bazează pe presupuneri culturale medii despre porții care s-ar putea să nu se potrivească cu porția ta reală.
În testarea noastră, calcularea greșită a dimensiunii porției a fost cea mai mare sursă de eroare. Gemini a subestimat un bol de granola cu 210 calorii pentru că a presupus o porție mai mică decât cea consumată efectiv. ChatGPT a supraestimat un stir fry cu 285 de calorii pentru că a presupus porții de restaurant când masa a fost gătită acasă.
Nutrola abordează acest lucru prin multiple mecanisme: scanarea codurilor de bare se leagă direct de dimensiunile porțiilor listate de producători, recunoașterea foto AI estimează volumul porției din imagine, iar utilizatorii pot ajusta porțiile în grame folosind o balanță de bucătărie pentru o acuratețe maximă.
Problema 3: Fără memorie între sesiuni. Aceasta este poate cea mai fundamentală limitare pentru urmărirea continuă a caloriilor. Chatboții AI nu păstrează un jurnal persistent al ceea ce ai mâncat. Fiecare conversație începe de la zero. Nu există un total zilnic, nu există o tendință săptămânală, nu există o defalcare a macronutrienților în timp real.
Urmărirea eficientă a caloriilor necesită date cumulative. Trebuie să știi nu doar caloriile din prânzul tău, ci și totalul zilnic, media săptămânală, defalcarea macronutrienților și tendința greutății în timp. Un chatbot oferă estimări punctuale izolate fără continuitate.
Problema 4: Estimări inconsistente pentru cereri identice. Am cerut atât lui Gemini, cât și lui ChatGPT să estimeze caloriile pentru aceeași descriere a mesei de trei ori în zile diferite. Rezultatele au variat cu 50 până la 200 de calorii între cereri. O "salată Caesar medie cu pui la grătar" a returnat estimări de 380, 450 și 520 de calorii de la Gemini în trei conversații separate. Această inconsistență este inerentă modului în care modelele lingvistice generează răspunsuri. Ele sunt generatoare de text probabilist, nu sisteme de căutare în baze de date.
Problema 5: Date nutriționale halucinate. În 4 din 30 de estimări de mese, ChatGPT a furnizat defalcări nutriționale specifice, dar fabricate. De exemplu, a afirmat că o anumită marcă de baton proteic conține 22g de proteină și 210 calorii, când eticheta reală indică 20g de proteină și 190 de calorii. Numerele erau suficient de apropiate pentru a părea plauzibile, dar greșite suficient pentru a conta în timp. Acest fenomen, cunoscut sub numele de halucinație în cercetarea AI, este deosebit de periculos în nutriție deoarece erorile par autoritare.
Este ChatGPT precis pentru numărarea caloriilor?
ChatGPT a performat ușor mai bine decât Gemini în testarea noastră, cu 43% din estimări încadrați în 10% din referință față de 37% pentru Gemini. Totuși, această diferență nu este semnificativă din punct de vedere practic. Ambele chatboți sunt departe de pragul de acuratețe necesar pentru o gestionare fiabilă a dietei.
Standardul academic pentru instrumentele de evaluare dietetică, așa cum este definit de cercetători precum Subar et al. și Thompson et al. de la Institutul Național al Cancerului, necesită ca un instrument să demonstreze o eroare medie de sub 10% pentru a fi considerat valid pentru monitorizarea dietetică la nivel individual. Ambele chatboți depășesc acest prag cu o marjă largă.
Avantajul ChatGPT față de Gemini pare să provină din presupuneri ușor mai bune privind dimensiunea porției pentru alimentele comune americane, reflectând probabil compoziția datelor sale de antrenament. Pentru alimente internaționale, preparate regionale și mese gătite acasă, acuratețea a scăzut semnificativ pentru ambele modele.
Chatbot AI vs Aplicație de nutriție pentru urmărirea dietei: Comparare completă
Dincolo de acuratețea brută, diferențele funcționale între un chatbot și o aplicație de nutriție dedicată se extind pe multiple dimensiuni care afectează utilizabilitatea în lumea reală.
| Caracteristică | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Acuratețea caloriilor (vs referință cântărită) | 18-22% eroare medie | 6% eroare medie |
| Bază de date verificată | Nu | Da, 1.8M+ intrări |
| Scanare coduri de bare | Nu | Da |
| Recunoaștere alimentară bazată pe fotografie | Limitată (necesită încărcare) | Recunoaștere AI integrată |
| Înregistrare vocală | Indirect (vocal la text) | Înregistrare vocală nativă a alimentelor |
| Jurnal zilnic persistent | Nu | Da |
| Totaluri zilnice/săptămânale în timp real | Nu (trebuie să aduni manual) | Da |
| Defalcarea macronutrienților | Estimată pe cerere | Urmărită pe aliment, zilnic, săptămânal |
| Urmărirea micronutrienților | Inconsistentă | 100+ nutrienți |
| Urmărirea tendinței greutății | Nu | Da, cu grafice |
| Integrarea cu Apple Watch | Nu | Da |
| Obiective calorice adaptive | Nu | Da, se ajustează în funcție de tendințele tale |
| Estimări consistente | Nu (variază pe cerere) | Da (blocat în baza de date) |
| Acces offline | Nu | Da |
| Cost | Gratuit (cu abonament pentru avansate) | De la €2.50/lună |
| Reclame | Variează în funcție de platformă | Zero reclame |
În ce sunt buni chatboții AI în nutriție?
În ciuda limitărilor lor pentru numărarea caloriilor, chatboții AI de uz general au totuși cazuri de utilizare nutrițională legitime care ar trebui recunoscute.
Educație nutrițională generală. Întrebându-l pe Gemini sau ChatGPT să explice diferența dintre grăsimile saturate și cele nesaturate sau să descrie cum funcționează sinteza proteinelor, de obicei, produce răspunsuri precise și bine organizate. Pentru întrebările conceptuale cu un consens științific stabilit, chatboții AI performează bine.
Generarea de idei pentru mese. Chatboții excelează în generarea de idei de rețete bazate pe constrângeri precum "mese bogate în proteine sub 500 de calorii cu pui și broccoli." Numărul specific de calorii poate să nu fie precis, dar conceptele de mese sunt puncte de plecare utile.
Compararea pattern-urilor dietetice. Întrebând un chatbot să compare dietele mediteraneană, ketogenică și pe bază de plante produce rezumate rezonabile ale dovezilor pentru fiecare abordare.
Acolo unde chatboții eșuează este în sarcina cantitativă, persistentă și dependentă de acuratețe a numărării zilnice a caloriilor și nutrienților. Aceasta este o problemă de bază de date și înregistrare, nu o problemă de generare a limbajului.
De ce aplicațiile de nutriție dedicate depășesc chatboții AI generali
Motivul principal este arhitectural. O aplicație de urmărire a nutriției este construită în jurul unei baze de date structurate, a unui profil de utilizator persistent și a unei logici de acumulare. Un chatbot AI este construit în jurul predicției următorului token dintr-un model de limbaj. Acestea sunt instrumente fundamental diferite optimizate pentru sarcini fundamental diferite.
Persistență. Nutrola menține un record complet al fiecărui aliment pe care îl înregistrezi, totalurile tale zilnice și săptămânale, tendințele macronutrienților și istoricul greutății tale. Aceste date longitudinale sunt ceea ce face urmărirea caloriilor eficientă. O estimare a caloriilor într-un singur punct, oricât de precisă, este inutilă fără contextul totalului tău zilnic și al pattern-ului săptămânal.
Date verificate. O intrare în baza de date pentru "Chobani Greek Yogurt, Plain, 150g" în Nutrola este obținută din eticheta nutrițională a producătorului și verificată conform standardelor USDA. Când un chatbot estimează același articol, acesta face o medie a informațiilor din mii de surse web cu fiabilitate variabilă, producând un număr plauzibil, dar neverificat.
Integrarea cu dispozitivele purtabile. Datele de pe Apple Watch se alimentează direct în Nutrola, oferind estimări precise ale caloriilor de activitate care sunt combinate cu înregistrarea alimentelor pentru a calcula balanța netă de energie. Niciun chatbot nu poate accesa datele tale de purtare pentru a ajusta recomandările calorice în funcție de mișcarea ta zilnică reală.
Viteză și comoditate. Fotografierea farfuriei tale, scanarea unui cod de bare sau vorbirea despre masă durează sub 30 de secunde. Tastarea unei descrieri detaliate a mesei către un chatbot, așteptând răspunsul, apoi înregistrând manual estimarea undeva durează considerabil mai mult și produce un rezultat mai puțin precis.
Ar putea chatboții AI să se îmbunătățească suficient pentru a înlocui aplicațiile de nutriție?
Aceasta este o întrebare despre arhitectura fundamentală, nu doar despre capacitatea modelului. Chiar și cu o acuratețe perfectă a estimării caloriilor (ceea ce modelele actuale sunt departe de a realiza), chatboții AI ar lipsi în continuare de înregistrarea persistentă, urmărirea cumulativă, integrarea dispozitivelor purtabile și verificarea bazelor de date structurate necesare pentru urmărirea nutriției.
Sistemele AI viitoare ar putea teoretic să încorporeze aceste caracteristici. Dar în acel moment, ele ar fi practic aplicații de nutriție cu o interfață conversațională, nu chatboți de uz general. Caracteristicile care fac ca urmărirea caloriilor să funcționeze, o bază de date verificată, jurnale de utilizator persistente, integrarea dispozitivelor, algoritmi adaptivi, sunt sisteme de inginerie, nu capacități lingvistice.
Cel mai probabil viitor nu este "chatboții înlocuiesc aplicațiile de nutriție", ci mai degrabă "aplicațiile de nutriție încorporează AI conversațional." Acest lucru se întâmplă deja. Recunoașterea foto și înregistrarea vocală alimentată de AI a Nutrola aduc comoditatea interacțiunii conversaționale la fiabilitatea structurată a unei baze de date nutriționale verificate. Obții interacțiunea naturală de a vorbi cu un AI cu acuratețea și persistența unui sistem de urmărire dedicat.
Ce se întâmplă când ceri unui AI să-ți urmărească caloriile?
Pentru a ilustra diferența practică, iată cum arată o zi tipică de urmărire a caloriilor cu fiecare abordare.
Folosind Gemini sau ChatGPT: Îi ceri chatbot-ului să estimeze micul dejun. Îți oferă un număr. Îl notezi undeva sau încerci să-l ții minte. La prânz, începi o nouă conversație (chatbot-ul nu își amintește de micul dejun) și obții o altă estimare. Aduni mental cele două numere. Până la cină, ai un total aproximativ care poate fi greșit cu 200 până la 400 de calorii, și nu ai nicio defalcare a macronutrienților, nicio înregistrare persistentă și nicio tendință săptămânală.
Folosind Nutrola: Îți fotografiezi micul dejun. AI-ul recunoaște alimentele, le potrivește cu intrările verificate din baza de date și le înregistrează automat. Totalul tău zilnic se actualizează în timp real. La prânz, scanezi un cod de bare de pe ambalajul sandvișului tău, iar datele nutriționale exacte ale producătorului sunt adăugate la jurnalul tău. Până la cină, ai un total precis, o defalcare a macronutrienților și un istoric al meselor care contribuie la tendințele tale săptămânale și lunare. Obiectivul tău caloric se ajustează în funcție de datele tale reale despre tendința greutății sincronizate de la Apple Watch.
Diferența nu este subtilă. Este diferența dintre o presupunere și un sistem.
Concluzii cheie
Chatboții AI de uz general, precum Gemini și ChatGPT, sunt instrumente impresionante pentru multe sarcini, dar urmărirea caloriilor nu este una dintre ele. Testul nostru pe 30 de mese a găsit erori medii de 108 până la 127 de calorii pe masă, rezultate inconsistente în cereri repetate, lipsa capacității de înregistrare persistentă și lipsa integrării cu baze de date alimentare sau dispozitive purtabile. Aceste limitări sunt structurale, nu întâmplătoare. Ele derivă din diferența fundamentală dintre un model lingvistic și un sistem de urmărire a nutriției.
Pentru oricine este serios în gestionarea nutriției, o aplicație dedicată cu o bază de date verificată, înregistrare persistentă și obiective adaptive rămâne esențială. Nutrola combină comoditatea alimentată de AI (recunoaștere foto, înregistrare vocală, scanare coduri de bare) cu acuratețea și persistența unei platforme structurate de nutriție, totul pentru 2.50 euro pe lună, fără reclame. Când vine vorba de urmărirea caloriilor, întrebarea nu este dacă AI-ul este implicat. Este dacă AI-ul este susținut de arhitectura potrivită pentru această sarcină.
Ești gata să îți transformi urmărirea nutriției?
Alătură-te celor mii care și-au transformat călătoria de sănătate cu Nutrola!