Kan Gemini AI Spore Dine Kalorier? Vi Testede Det Mod En Dedikeret App

Vi bad Gemini og ChatGPT om at estimere kalorier for 30 måltider og sammenlignede resultaterne med Nutrola og vejede madreferencer. Nøjagtighedsforskellen var større end forventet.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Når AI chatbots bliver en del af hverdagen, opstår et naturligt spørgsmål: kan du bare spørge Gemini eller ChatGPT om at spore dine kalorier i stedet for at bruge en dedikeret ernæringsapp? Vi testede dette direkte. Over to uger bad vi Google Gemini og OpenAI ChatGPT om at estimere kalorie- og makronæringsindholdet i 30 forskellige måltider, der spænder fra enkle enkeltstående fødevarer til komplekse restaurantretter. Vi sammenlignede deres estimater med to benchmarks: Nutrolas verificerede fødevaredatabase og vejede madreferencer beregnet ved hjælp af USDA FoodData Central værdier.

Resultaterne afslører fundamentale begrænsninger ved at bruge generelle AI chatbots til ernæringssporing, begrænsninger der er strukturelle snarere end midlertidige, hvilket betyder, at de sandsynligvis ikke vil blive fuldt ud løst med fremtidige modelopdateringer.

Kan jeg bruge Gemini til at tælle kalorier?

Du kan spørge Gemini om at estimere kalorierne i et måltid, og den vil give et svar. Spørgsmålet er, om det svar er præcist og konsekvent nok til at understøtte faktisk diætstyring. Baseret på vores test er svaret nej for enhver anvendelse, der kræver pålidelighed.

Testmetodologi: Vi forberedte eller købte 30 måltider, der dækkede et udvalg af kompleksitet. Hvert måltid blev vejet på en kalibreret køkkenvægt, og referencekalorieværdier blev beregnet ved hjælp af USDA FoodData Central ernæringsdata. Vi beskrev derefter hvert måltid for Gemini (Googles AI-assistent) i naturligt sprog, på samme måde som en rigtig bruger ville gøre, og registrerede dens kalorieestimat. Vi kørte den samme test med ChatGPT (GPT-4o) og loggede hvert måltid i Nutrola ved hjælp af fotogenkendelse og databaseopslag.

Nøjagtighedsdefinition: Vi definerede et estimat som "præcist", hvis det lå inden for 10 procent af den vejede referenceværdi, en standardgrænse der anvendes i forskningen om diætvurdering (Subar et al., The Journal of Nutrition, 2015).

Hvor præcise er AI chatbots til kalorieoptælling?

Resultaterne var konsekvente på tværs af måltidskategorier: generelle AI chatbots giver grove estimater, der ikke er pålidelige nok til kalorie-kontrollerede diæter.

Metrik Gemini ChatGPT (GPT-4o) Nutrola Vejede Referencer
Måltider inden for 10% af reference 11/30 (37%) 13/30 (43%) 25/30 (83%) 30/30 (100%)
Gennemsnitlig absolut fejl 127 kcal 108 kcal 38 kcal 0 kcal
Gennemsnitlig procentuel fejl 22,4% 18,6% 6,1% 0%
Største enkelt overestimat +340 kcal (pastaret) +285 kcal (wokret) +95 kcal (restaurantmåltid) N/A
Største enkelt underestimat -290 kcal (salat med dressing) -315 kcal (granola skål) -72 kcal (hjemmelavet suppe) N/A
Konsistent på tværs af gentagne forespørgsler Nej (varierede med 50-200 kcal) Nej (varierede med 30-150 kcal) Ja (database-låst) N/A

Nøglefund: Den gennemsnitlige absolutte fejl på 108 til 127 kalorier pr. måltid oversættes til 324 til 381 kalorier af kumulativ fejl på tværs af tre måltider om dagen. For en person, der sigter mod et 500-kalorie underskud for vægttab, kan dette niveau af unøjagtighed eliminere 65 til 76 procent af deres tilsigtede underskud, hvilket effektivt stopper fremdriften.

Hvorfor får AI chatbots kalorieoptællingen forkert?

De fejl, vi observerede, var ikke tilfældige. De fulgte forudsigelige mønstre, der afslører strukturelle begrænsninger ved at bruge store sprogmodeller til ernæringsestimering.

Problem 1: Ingen verificeret database. Gemini og ChatGPT slår ikke op i fødevarer i en struktureret ernæringsdatabase, når du beder dem om kalorieestimater. De genererer svar baseret på mønstre i deres træningsdata, som inkluderer en blanding af nøjagtige USDA-data, brugergenereret indhold, estimater fra madblogs og markedsføringsmaterialer. Et enkelt fødevareelement kan have vidt forskellige kalorieværdier på tværs af disse kilder, og modellen har ingen mekanisme til at identificere, hvilken kilde der er korrekt.

Nutrola og andre dedikerede ernæringsapps bruger verificerede fødedatabaser. Nutrolas database indeholder over 1,8 millioner poster, der er krydsrefereret med USDA FoodData Central, producenternes ernæringsetiketter og uafhængige laboratorieanalyser. Når du logger "grillet kyllingebryst, 150g", er den værdi, der returneres, et verificeret datapunkt, ikke et statistisk gennemsnit af alt, hvad internettet nogensinde har sagt om kylling.

Problem 2: Ingen portionstørrelsesforankring. Når du fortæller en AI chatbot, at du har haft "en skål pasta", skal den gætte, hvad "en skål" betyder. Er det 200 gram kogt pasta eller 400 gram? Forskellen er 250 kalorier eller mere. AI chatbots falder tilbage på kulturelt gennemsnitlige portionsantagelser, der måske ikke matcher din faktiske servering.

I vores test var fejltagelse i portionsstørrelse den største kilde til fejl. Gemini undervurderede en granola skål med 210 kalorier, fordi den antog en mindre servering end hvad der faktisk blev indtaget. ChatGPT overvurderede en wokret med 285 kalorier, fordi den antog restaurantstørrelser, da måltidet var hjemmelavet.

Nutrola adresserer dette gennem flere mekanismer: stregkodescanning linker direkte til producentens angivne portionsstørrelser, AI fotogenkendelse estimerer portionsvolumen fra billedet, og brugerne kan justere portioner i gram ved hjælp af en køkkenvægt for maksimal nøjagtighed.

Problem 3: Ingen hukommelse mellem sessioner. Dette er måske den mest grundlæggende begrænsning for løbende kalorie tracking. AI chatbots opretholder ikke en vedholdende log over, hvad du har spist. Hver samtale starter fra nul. Der er ingen daglig total, ingen ugentlig tendens, ingen løbende makronæringsopdeling.

Effektiv kalorie tracking kræver kumulative data. Du skal vide ikke kun kalorierne i din frokost, men også din løbende daglige total, dit ugentlige gennemsnit, din makronæringsfordeling og din vægttrend over tid. En chatbot giver isolerede punktestimater uden kontinuitet.

Problem 4: Inkonsistente estimater for identiske forespørgsler. Vi bad både Gemini og ChatGPT om at estimere kalorierne for den samme måltidsbeskrivelse tre gange på forskellige dage. Resultaterne varierede med 50 til 200 kalorier på tværs af forespørgsler. En "medium Caesar salat med grillet kylling" returnerede estimater på 380, 450 og 520 kalorier fra Gemini på tværs af tre separate samtaler. Denne inkonsistens er iboende i, hvordan sprogmodeller genererer svar. De er probabilistiske tekstgeneratorer, ikke databaseopslagsystemer.

Problem 5: Hallucinerede ernæringsdata. I 4 ud af 30 måltidsestimater gav ChatGPT specifikt klingende, men fabrikerede ernæringsopdelinger. For eksempel sagde det, at en bestemt mærkeproteinbar indeholdt 22g protein og 210 kalorier, mens den faktiske etiket angiver 20g protein og 190 kalorier. Tallene var tæt nok til at virke plausible, men forkerte nok til at betyde noget over tid. Dette fænomen, kendt som hallucination i AI-forskning, er særligt farligt inden for ernæring, fordi fejlene ser autoritative ud.

Er ChatGPT præcis til kalorieoptælling?

ChatGPT klarede sig lidt bedre end Gemini i vores test, med 43 procent af estimaterne inden for 10 procent af referencen mod 37 procent for Gemini. Dog er denne forskel ikke praktisk betydningsfuld. Begge chatbots ligger langt under den nøjagtighedsgrænse, der er nødvendig for pålidelig diætstyring.

Den akademiske standard for værktøjer til diætvurdering, som defineret af forskere som Subar et al. og Thompson et al. ved National Cancer Institute, kræver, at et værktøj demonstrerer mindre end 10 procent gennemsnitlig fejl for at blive betragtet som gyldigt til individuel diætmonitorering. Begge chatbots overstiger denne grænse med en stor margen.

ChatGPT's fordel over Gemini syntes at komme fra lidt bedre antagelser om portionsstørrelse for almindelige amerikanske fødevarer, sandsynligvis som et resultat af sammensætningen af dens træningsdata. For internationale fødevarer, regionale retter og hjemmelavede måltider faldt nøjagtigheden betydeligt for begge modeller.

AI Chatbot vs Ernæringsapp til Diæt Tracking: Fuld Sammenligning

Udover den rå nøjagtighed spænder de funktionelle forskelle mellem en chatbot og en dedikeret ernæringsapp over flere dimensioner, der påvirker den virkelige anvendelighed.

Funktion Gemini / ChatGPT Nutrola
Kalorie nøjagtighed (vs vejede reference) 18-22% gennemsnitlig fejl 6% gennemsnitlig fejl
Verificeret fødedatabase Nej Ja, 1,8M+ poster
Stregkodescanning Nej Ja
Foto-baseret madgenkendelse Begrænset (kræver upload) Indbygget AI genkendelse
Stemmelogging Indirekte (stemme-til-tekst) Native stemmelogging af mad
Vedholdende daglig log Nej Ja, automatisk
Løbende daglige/ugentlige totaler Nej (skal manuelt summere) Ja, i realtid
Makronæringsopdeling Estimeret pr. forespørgsel Sporet pr. mad, dagligt, ugentligt
Mikronæringssporing Inkonsistent 100+ næringsstoffer
Vægttrendsporing Nej Ja, med grafisk fremstilling
Apple Watch integration Nej Ja
Adaptive kaloriemål Nej Ja, justeres til dine tendenser
Konsistente estimater Nej (varierer pr. forespørgsel) Ja (database-låst)
Offline adgang Nej Ja
Omkostninger Gratis (med abonnement for avancerede funktioner) Fra €2,50/måned
Annoncer Varierer efter platform Ingen annoncer

Hvad er AI chatbots gode til inden for ernæring?

På trods af deres begrænsninger til kalorieoptælling har generelle AI chatbots legitime ernæringsmæssige anvendelsestilfælde, der bør anerkendes.

Generel ernæringsuddannelse. At spørge Gemini eller ChatGPT om at forklare forskellen mellem mættet og umættet fedt, eller at beskrive hvordan proteinsyntese fungerer, giver typisk nøjagtige og velorganiserede svar. For konceptuelle spørgsmål med etableret videnskabelig konsensus præsterer AI chatbots godt.

Måltidsidé generation. Chatbots excellerer i at generere opskriftsidéer baseret på begrænsninger som "højt proteinmåltid under 500 kalorier med kylling og broccoli." Den specifikke kalorieoptælling er måske ikke præcis, men måltidskonceptene er nyttige udgangspunkter.

Sammenligning af kostmønstre. At spørge en chatbot om at sammenligne middelhavs-, ketogen- og plantebaserede diæter giver rimelige opsummeringer af beviserne for hver tilgang.

Hvor chatbots fejler, er i den kvantitative, vedholdende og nøjagtighedsafhængige opgave med daglig kalorie- og næringssporing. Dette er et database- og loggingsproblem, ikke et sproggenereringsproblem.

Hvorfor dedikerede ernæringsapps overgår generelle AI chatbots

Den centrale årsag er arkitektonisk. En ernæringssporing app er bygget omkring en struktureret database, en vedholdende brugerprofil og akkumuleringslogik. En AI chatbot er bygget omkring næste-token forudsigelse fra en sprogmodel. Disse er fundamentalt forskellige værktøjer optimeret til fundamentalt forskellige opgaver.

Vedholdenhed. Nutrola opretholder en komplet optegnelse over hver fødevare, du logger, dine daglige og ugentlige totaler, dine makronærings tendenser og din vægt historie. Disse longitudinale data er det, der gør kalorie tracking effektivt. Et enkelt kalorieestimat, uanset hvor præcist, er ubrugeligt uden konteksten af din daglige total og ugentlige mønster.

Verificerede data. En databasepost for "Chobani Græsk Yoghurt, Natur, 150g" i Nutrola er hentet fra producentens ernæringsetiket og verificeret mod USDA-standarder. Når en chatbot estimerer den samme vare, gennemsnitser den information fra tusindvis af webkilder med varierende pålidelighed, hvilket producerer et plausibelt, men uverificeret tal.

Wearable integration. Apple Watch-data feeds direkte ind i Nutrola, hvilket giver nøjagtige aktivitetskalorieestimater, der kombineres med madlogging for at beregne netto energibalance. Ingen chatbot kan få adgang til dine wearable data for at justere kalorierekommandationer baseret på din faktiske daglige bevægelse.

Hastighed og bekvemmelighed. At tage et billede af din tallerken, scanne en stregkode eller tale dit måltid tager under 30 sekunder. At skrive en detaljeret måltidsbeskrivelse til en chatbot, vente på svaret og derefter manuelt registrere estimatet et sted tager betydeligt længere tid og giver et mindre præcist resultat.

Kan AI chatbots forbedre sig nok til at erstatte ernæringsapps?

Dette er et spørgsmål om grundlæggende arkitektur, ikke kun modelkapacitet. Selv med perfekt kalorieestimeringsnøjagtighed (som nuværende modeller er langt fra at opnå) ville AI chatbots stadig mangle den vedholdende logføring, kumulative tracking, wearable integration og struktureret databaseverificering, som ernæringssporing kræver.

Fremtidige AI-systemer kunne teoretisk inkorporere disse funktioner. Men på det tidspunkt ville de i bund og grund være ernæringsapps med en samtalegrænseflade, ikke generelle chatbots. De funktioner, der gør kalorie tracking effektiv, en verificeret database, vedholdende brugerlogs, enhedsintegrationer, adaptive algoritmer, er ingeniørsystemer, ikke sprogkapaciteter.

Den mest sandsynlige fremtid er ikke "chatbots erstatter ernæringsapps", men snarere "ernæringsapps inkorporerer samtale-AI." Dette sker allerede. Nutrolas AI-drevne fotogenkendelse og stemmelogging bringer bekvemmeligheden ved samtaleinteraktion til den strukturerede pålidelighed af en verificeret ernæringsdatabase. Du får den naturlige interaktion ved at tale med en AI med nøjagtigheden og vedholdenheden af et formålsbygget sporingssystem.

Hvad sker der, når du beder en AI om at spore dine kalorier?

For at illustrere den praktiske forskel, her er, hvordan en typisk dag med kalorieoptælling ser ud med hver tilgang.

Ved brug af Gemini eller ChatGPT: Du beder chatbotten om at estimere din morgenmad. Den giver dig et tal. Du skriver det ned et sted eller prøver at huske det. Til frokost starter du en ny samtale (chatbotten husker ikke morgenmad) og får endnu et estimat. Du lægger de to tal sammen mentalt. Ved middagstid har du en grov løbende total, der kan være forkert med 200 til 400 kalorier, og du har ingen makronæringsopdeling, ingen vedholdende optegnelse og ingen ugentlig tendens.

Ved brug af Nutrola: Du fotograferer din morgenmad. AI'en genkender fødevarerne, matcher dem med verificerede databaseposter og logger dem automatisk. Din daglige total opdateres i realtid. Til frokost scanner du en stregkode på din sandwichemballage, og de nøjagtige producenternæringsdata tilføjes til din log. Ved middagstid har du en præcis løbende total, en makronæringsopdeling og en måltidshistorik, der fodrer ind i dine ugentlige og månedlige tendenser. Dit kaloriemål justeres baseret på dine faktiske vægttrenddata synkroniseret fra din Apple Watch.

Forskellen er ikke subtil. Det er forskellen mellem et gæt og et system.

Nøglepunkter

Generelle AI chatbots som Gemini og ChatGPT er imponerende værktøjer til mange opgaver, men kalorieoptælling er ikke en af dem. Vores test med 30 måltider fandt gennemsnitlige fejl på 108 til 127 kalorier pr. måltid, inkonsistente resultater på tværs af gentagne forespørgsler, ingen vedholdende logningskapacitet og ingen integration med fødedatabaser eller wearable enheder. Disse begrænsninger er strukturelle, ikke tilfældige. De stammer fra den grundlæggende forskel mellem en sprogmodel og et ernæringssporingssystem.

For alle, der seriøst ønsker at styre deres ernæring, forbliver en dedikeret app med en verificeret database, vedholdende logning og adaptive mål essentiel. Nutrola kombinerer AI-drevet bekvemmelighed (fotogenkendelse, stemmelogging, stregkodescanning) med nøjagtigheden og vedholdenheden af en struktureret ernæringsplatform, alt sammen for 2,50 euro om måneden uden annoncer. Når det kommer til kalorieoptælling, er spørgsmålet ikke, om AI er involveret. Det er, om AI'en understøttes af den rigtige arkitektur til opgaven.

Klar til at forvandle din ernæringsregistrering?

Bliv en del af de tusindvis, der har forvandlet deres sundhedsrejse med Nutrola!