Kan Gemini AI Spore Kaloriene Dine? Vi Testet Den Mot En Dedikert App
Vi ba Gemini og ChatGPT om å estimere kaloriene i 30 måltider, og sammenlignet resultatene med Nutrola og veide matreferanser. Nøyaktighetsgapet var større enn forventet.
Etter hvert som AI-chatboter blir en del av hverdagen, oppstår det et naturlig spørsmål: kan du bare spørre Gemini eller ChatGPT om å spore kaloriene dine i stedet for å bruke en dedikert ernæringsapp? Vi testet dette direkte. I løpet av to uker ba vi Google Gemini og OpenAI ChatGPT om å estimere kalori- og makronæringsinnholdet i 30 forskjellige måltider, fra enkle enkeltstående ingredienser til komplekse restaurantretter. Vi sammenlignet estimatene deres med to referanser: Nutrolas verifiserte matdatabase og veide matreferanser beregnet ved hjelp av USDA FoodData Central-verdier.
Resultatene avdekket grunnleggende begrensninger ved å bruke generelle AI-chatboter for ernæringssporing, begrensninger som er strukturelle snarere enn midlertidige, noe som betyr at de sannsynligvis ikke vil bli fullt ut løst med fremtidige modelloppdateringer.
Kan jeg bruke Gemini til å telle kalorier?
Du kan be Gemini om å estimere kaloriene i et måltid, og den vil gi deg et svar. Spørsmålet er om svaret er nøyaktig og konsistent nok til å støtte faktisk kostholdshåndtering. Basert på vår testing, er svaret nei for alle bruksområder som krever pålitelighet.
Testmetodikk: Vi forberedte eller kjøpte 30 måltider med varierende kompleksitet. Hvert måltid ble veid på en kalibrert kjøkkenvekt, og referanseverdiene for kalorier ble beregnet ved hjelp av USDA FoodData Central-næringsdata. Deretter beskrev vi hvert måltid for Gemini (Googles AI-assistent) på naturlig språk, på samme måte som en ekte bruker ville gjort, og registrerte kaloriestimatet. Vi gjennomførte den samme testen med ChatGPT (GPT-4o) og logget hvert måltid i Nutrola ved hjelp av bilde gjenkjenning og databaseoppslag.
Nøyaktighetsdefinisjon: Vi definerte et estimat som "nøyaktig" hvis det falt innenfor 10 prosent av den veide referanseverdien, en standard terskel som brukes i forskning på kostholdsvurdering (Subar et al., The Journal of Nutrition, 2015).
Hvor nøyaktige er AI-chatboter for kalori telling?
Resultatene var konsistente på tvers av måltidskategorier: generelle AI-chatboter gir grove estimater som ikke er pålitelige nok for kalori-kontrollerte dietter.
| Metrikk | Gemini | ChatGPT (GPT-4o) | Nutrola | Veid Referanse |
|---|---|---|---|---|
| Måltider innen 10% av referansen | 11/30 (37%) | 13/30 (43%) | 25/30 (83%) | 30/30 (100%) |
| Gjennomsnittlig absolutt feil | 127 kcal | 108 kcal | 38 kcal | 0 kcal |
| Gjennomsnittlig prosentvis feil | 22.4% | 18.6% | 6.1% | 0% |
| Største enkelt overestimering | +340 kcal (pastarett) | +285 kcal (wok) | +95 kcal (restaurantmåltid) | N/A |
| Største enkelt underestimering | -290 kcal (salat med dressing) | -315 kcal (granola-bolle) | -72 kcal (hjemmelaget suppe) | N/A |
| Konsistent på tvers av gjentatte forespørsel | Nei (varierte med 50-200 kcal) | Nei (varierte med 30-150 kcal) | Ja (database-låst) | N/A |
Hovedfunn: Den gjennomsnittlige absolutte feilen på 108 til 127 kalorier per måltid oversettes til 324 til 381 kalorier av kumulert feil over tre måltider per dag. For noen som sikter mot et 500-kaloriunderskudd for vekttap, kan dette nivået av unøyaktighet eliminere 65 til 76 prosent av det tiltenkte underskuddet, noe som effektivt stopper fremdriften.
Hvorfor får AI-chatboter kalori tellingen feil?
Feilene vi observerte var ikke tilfeldige. De fulgte forutsigbare mønstre som avdekker strukturelle begrensninger ved å bruke store språkmodeller for ernæringsestimering.
Problem 1: Ingen verifisert database. Gemini og ChatGPT ser ikke opp matvarer i en strukturert næringsdatabase når du ber dem om kaloriestimater. De genererer svar basert på mønstre i treningsdataene sine, som inkluderer en blanding av nøyaktige USDA-data, brukergenerert innhold, estimater fra matblogger og markedsføringsmateriale. En enkelt matvare kan ha vidt forskjellige kaloriinnhold på tvers av disse kildene, og modellen har ingen mekanisme for å identifisere hvilken kilde som er korrekt.
Nutrola og andre dedikerte ernæringsapper bruker verifiserte matdatabaser. Nutrolas database inneholder over 1,8 millioner oppføringer som er kryssreferert mot USDA FoodData Central, produsentens næringsetiketter og uavhengige laboratorieanalyser. Når du logger "grillet kyllingbryst, 150g," er verdien som returneres et verifisert datapunkt, ikke et statistisk gjennomsnitt av alt internett har sagt om kylling.
Problem 2: Ingen grunnlag for porsjonsstørrelse. Når du forteller en AI-chatbot at du hadde "en bolle med pasta," må den gjette hva "en bolle" betyr. Er det 200 gram kokt pasta eller 400 gram? Forskjellen er 250 kalorier eller mer. AI-chatboter antar kulturelt gjennomsnittlige porsjonsstørrelser som kanskje ikke samsvarer med din faktiske servering.
I vår testing var feilberegning av porsjonsstørrelse den største kilden til feil. Gemini undervurderte en granola-bolle med 210 kalorier fordi den antok en mindre servering enn det som faktisk ble konsumert. ChatGPT overestimerte en wok med 285 kalorier fordi den antok restaurantstørrelser når måltidet var hjemmelaget.
Nutrola adresserer dette gjennom flere mekanismer: strekkode skanning kobles direkte til produsentens oppgitte serveringsstørrelser, AI-bildegjenkjenning estimerer porsjonsvolum fra bildet, og brukere kan justere porsjoner i gram ved hjelp av en kjøkkenvekt for maksimal nøyaktighet.
Problem 3: Ingen hukommelse mellom økter. Dette er kanskje den mest grunnleggende begrensningen for kontinuerlig kalori sporing. AI-chatboter opprettholder ikke en vedvarende logg over hva du har spist. Hver samtale starter fra null. Det er ingen daglig total, ingen ukentlig trend, ingen løpende makronæringsoppsummering.
Effektiv kalori sporing krever kumulativ data. Du må vite ikke bare kaloriene i lunsjen din, men også din løpende daglige total, ditt ukentlige gjennomsnitt, din makronæringsfordeling og din vekttrend over tid. En chatbot gir isolerte punktestimater uten kontinuitet.
Problem 4: Inkonsistente estimater for identiske forespørsel. Vi ba både Gemini og ChatGPT om å estimere kaloriene for den samme måltidsbeskrivelsen tre ganger på forskjellige dager. Resultatene varierte med 50 til 200 kalorier på tvers av forespørslene. En "medium Caesar-salat med grillet kylling" ga estimater på 380, 450 og 520 kalorier fra Gemini over tre separate samtaler. Denne inkonsistensen er iboende i hvordan språkmodeller genererer svar. De er probabilistiske tekstgeneratorer, ikke databasesøkessystemer.
Problem 5: Hallusinerte næringsdata. I 4 av 30 måltidsestimater ga ChatGPT spesifikasjoner som hørtes troverdige ut, men som var oppdiktede. For eksempel sa den at en bestemt merkevare proteinbar inneholdt 22g protein og 210 kalorier, mens den faktiske etiketten viser 20g protein og 190 kalorier. Tallene var nære nok til å virke plausible, men feil nok til å bety noe over tid. Dette fenomenet, kjent som hallusinasjon i AI-forskning, er spesielt farlig innen ernæring fordi feilene ser autoritative ut.
Er ChatGPT nøyaktig for kalori telling?
ChatGPT presterte litt bedre enn Gemini i vår testing, med 43 prosent av estimatene innenfor 10 prosent av referansen mot 37 prosent for Gemini. Imidlertid er denne forskjellen ikke praktisk betydningsfull. Begge chatbotene ligger langt under nøyaktighetsterskelen som kreves for pålitelig kostholdshåndtering.
Den akademiske standarden for verktøy for kostholdsvurdering, som definert av forskere som Subar et al. og Thompson et al. ved National Cancer Institute, krever at et verktøy viser mindre enn 10 prosent gjennomsnittlig feil for å bli ansett som gyldig for individuell kostholdsovervåking. Begge chatbotene overskrider denne terskelen med god margin.
ChatGPTs fordel over Gemini så ut til å komme fra litt bedre porsjonsstørrelsesantakelser for vanlige amerikanske matvarer, noe som sannsynligvis reflekterer sammensetningen av treningsdataene. For internasjonale matvarer, regionale retter og hjemmelagde måltider falt nøyaktigheten betydelig for begge modellene.
AI Chatbot vs Ernæringsapp for Diettsporing: Full Sammenligning
Utover rå nøyaktighet, spenner de funksjonelle forskjellene mellom en chatbot og en dedikert ernæringsapp over flere dimensjoner som påvirker brukervennligheten i den virkelige verden.
| Funksjon | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Kalori nøyaktighet (vs veid referanse) | 18-22% gjennomsnittlig feil | 6% gjennomsnittlig feil |
| Verifisert matdatabase | Nei | Ja, 1.8M+ oppføringer |
| Strekkode skanning | Nei | Ja |
| Foto-basert matgjenkjenning | Begrenset (krever opplasting) | Innebygd AI-gjenkjenning |
| Tale logging | Indirekte (tale-til-tekst) | Innebygd tale matlogging |
| Vedvarende daglig logg | Nei | Ja, automatisk |
| Løpende daglige/ukentlige totaler | Nei (må manuelt summere) | Ja, i sanntid |
| Makronæringsoppsummering | Estimert per forespørsel | Sporet per mat, daglig, ukentlig |
| Mikronæringssporing | Inkonsistent | 100+ næringsstoffer |
| Vekttrend sporing | Nei | Ja, med grafisk fremstilling |
| Apple Watch-integrasjon | Nei | Ja |
| Adaptive kalori mål | Nei | Ja, justerer seg etter dine trender |
| Konsistente estimater | Nei (varierer per forespørsel) | Ja (database-låst) |
| Offline tilgang | Nei | Ja |
| Kostnad | Gratis (med abonnement for avansert) | Fra €2.50/måned |
| Annonser | Varierer etter plattform | Ingen annonser |
Hva er AI-chatboter gode til innen ernæring?
Til tross for begrensningene for kalori telling, har generelle AI-chatboter legitime ernæringsmessige bruksområder som bør anerkjennes.
Generell ernæringsutdanning. Å spørre Gemini eller ChatGPT om å forklare forskjellen mellom mettet og umettet fett, eller å beskrive hvordan proteinsyntese fungerer, gir vanligvis nøyaktige og godt organiserte svar. For konseptuelle spørsmål med etablert vitenskapelig konsensus, presterer AI-chatboter godt.
Måltidsidegenerering. Chatboter utmerker seg i å generere oppskriftideer basert på begrensninger som "høyt proteinmåltid under 500 kalorier med kylling og brokkoli." Den spesifikke kalori tellingen er kanskje ikke presis, men måltidskonseptene er nyttige utgangspunkt.
Sammenligning av kostholdsmønstre. Å be en chatbot om å sammenligne middelhavsdietten, ketogen diett og plantebaserte dietter gir rimelige oppsummeringer av bevisene for hver tilnærming.
Der chatboter feiler, er i den kvantitative, vedvarende og nøyaktighetsavhengige oppgaven med daglig kalori- og næringssporing. Dette er et database- og loggproblem, ikke et språkgenereringsproblem.
Hvorfor dedikerte ernæringsapper overgår generelle AI-chatboter
Hovedårsaken er arkitektonisk. En ernæringssporingapp er bygget rundt en strukturert database, en vedvarende brukerprofil og akkumuleringlogikk. En AI-chatbot er bygget rundt neste-token prediksjon fra en språkmodell. Dette er fundamentalt forskjellige verktøy optimalisert for fundamentalt forskjellige oppgaver.
Vedholdenhet. Nutrola opprettholder en komplett oversikt over hver matvare du logger, dine daglige og ukentlige totaler, dine makronærings trender og din vekt historie. Disse longitudinelle dataene er det som gjør kalori sporing effektiv. Et enkelt kaloriestimat, uansett hvor nøyaktig, er ubrukelig uten konteksten av din daglige total og ukentlige mønster.
Verifiserte data. En databaseoppføring for "Chobani gresk yoghurt, naturell, 150g" i Nutrola er hentet fra produsentens næringsetikett og verifisert mot USDA-standarder. Når en chatbot estimerer den samme varen, gjennomsnittlig informasjon fra tusenvis av nett kilder med varierende pålitelighet, noe som gir et plausibelt men uverifisert tall.
Bærbar integrasjon. Apple Watch-data mates direkte inn i Nutrola, og gir nøyaktige aktivitetskaloriestimater som kombineres med matlogging for å beregne netto energibalanse. Ingen chatbot kan få tilgang til bærbare data for å justere kalori anbefalinger basert på din faktiske daglige bevegelse.
Hastighet og bekvemmelighet. Å ta et bilde av tallerkenen din, skanne en strekkode eller si måltidet ditt tar under 30 sekunder. Å skrive en detaljert måltidsbeskrivelse til en chatbot, vente på svaret, og deretter manuelt registrere estimatet et sted tar betydelig lengre tid og gir et mindre nøyaktig resultat.
Kan AI-chatboter forbedre seg nok til å erstatte ernæringsapper?
Dette er et spørsmål om grunnleggende arkitektur, ikke bare modellkapasitet. Selv med perfekt kaloriestimeringsnøyaktighet (som nåværende modeller er langt fra å oppnå), ville AI-chatboter fortsatt mangle vedvarende logging, kumulativ sporing, bærbar integrasjon og strukturert databaseverifisering som kreves for ernæringssporing.
Fremtidige AI-systemer kan teoretisk inkorporere disse funksjonene. Men på det tidspunktet ville de i hovedsak være ernæringsapper med et samtalegrensesnitt, ikke generelle chatboter. Funksjonene som gjør kalori sporing mulig, en verifisert database, vedvarende brukerlogger, enhetsintegrasjoner, adaptive algoritmer, er ingeniørsystemer, ikke språkferdigheter.
Den mest sannsynlige fremtiden er ikke "chatboter erstatter ernæringsapper" men snarere "ernæringsapper inkorporerer samtale-AI." Dette skjer allerede. Nutrolas AI-drevne bilde gjenkjenning og tale logging bringer bekvemmeligheten av samtaleinteraksjon til den strukturerte påliteligheten av en verifisert ernæringsdatabase. Du får den naturlige interaksjonen av å snakke med en AI med nøyaktigheten og vedholdenheten til et formålsbygget sporingssystem.
Hva skjer når du ber en AI om å spore kaloriene dine?
For å illustrere den praktiske forskjellen, her er hvordan en typisk dag med kalori sporing ser ut med hver tilnærming.
Bruke Gemini eller ChatGPT: Du ber chatboten om å estimere frokosten din. Den gir deg et tall. Du skriver det ned et sted eller prøver å huske det. Ved lunsj starter du en ny samtale (chatboten husker ikke frokost) og får et annet estimat. Du legger de to tallene sammen mentalt. Ved middagstid har du en grov løpende total som kan være feil med 200 til 400 kalorier, og du har ingen makronæringsoppsummering, ingen vedvarende opptegnelse, og ingen ukentlig trend.
Bruke Nutrola: Du fotograferer frokosten din. AI-en gjenkjenner matvarene, matcher dem med verifiserte databaseoppføringer, og logger dem automatisk. Din daglige total oppdateres i sanntid. Ved lunsj skanner du en strekkode på smørbrødpakken din, og de eksakte næringsdataene fra produsenten legges til loggen din. Ved middagstid har du en nøyaktig løpende total, en makronæringsoppsummering, og en måltidshistorikk som fôrer inn i dine ukentlige og månedlige trender. Kalori målet ditt justeres basert på din faktiske vekttrenddata synkronisert fra Apple Watch.
Forskjellen er ikke subtil. Det er forskjellen mellom et gjetning og et system.
Viktige punkter
Generelle AI-chatboter som Gemini og ChatGPT er imponerende verktøy for mange oppgaver, men kalori sporing er ikke en av dem. Vår test av 30 måltider fant gjennomsnittlige feil på 108 til 127 kalorier per måltid, inkonsistente resultater på tvers av gjentatte forespørsel, ingen vedvarende loggføringsevne, og ingen integrasjon med matdatabaser eller bærbare enheter. Disse begrensningene er strukturelle, ikke tilfeldige. De stammer fra den fundamentale forskjellen mellom en språkmodell og et ernæringssporingssystem.
For alle som er seriøse med å håndtere ernæringen sin, er en dedikert app med en verifisert database, vedvarende logging og adaptive mål fortsatt essensiell. Nutrola kombinerer AI-drevet bekvemmelighet (bildegjenkjenning, tale logging, strekkode skanning) med nøyaktigheten og vedholdenheten til en strukturert ernæringsplattform, alt for 2,50 euro per måned uten annonser. Når det gjelder kalori sporing, er spørsmålet ikke om AI er involvert. Det er om AI-en støttes av den rette arkitekturen for oppgaven.
Klar til å forvandle ernæringssporingen din?
Bli en del av tusenvis som har forvandlet helsereisen sin med Nutrola!