Jak přesné jsou odhady kalorií od ChatGPT?

Otestovali jsme odhady kalorií ChatGPT, Gemini a Claude ve srovnání s ověřenými nutričními daty u více než 50 potravin. Podívejte se na výsledky přesnosti a konzistence v porovnání s ověřenou databází.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

ChatGPT se stal výchozím poradcem pro výživu pro miliony lidí — a nemá žádnou databázi potravin. Když se zeptáte ChatGPT, kolik kalorií obsahuje kuřecí burrito, nevyhledá odpověď v ověřené databázi potravin. Generuje statisticky pravděpodobnou odpověď na základě vzorců ve svých tréninkových datech. Číslo, které vám poskytne, může být blízko skutečnosti, ale také se může mýlit o 40 %. A pokud se zeptáte znovu zítra, můžete dostat jinou hodnotu.

Otestovali jsme tři hlavní velké jazykové modely — ChatGPT (GPT-4o), Google Gemini a Claude od Anthropic — ve srovnání s ověřenými daty USDA a potvrzenými nutričními hodnotami u více než 50 potravin. Cílem bylo odpovědět na tři konkrétní otázky: Jak přesné jsou odhady kalorií LLM? Jak konzistentní jsou napříč sezeními? A jak se srovnávají s aplikací určenou k sledování výživy?


Jak jsme testovali přesnost kalorií LLM?

Každému LLM jsme položili stejnou otázku pro každou potravinu: "Kolik kalorií obsahuje [potravina se specifickou porcí]?" Každý dotaz jsme provedli v novém sezení (bez historie konverzace), abychom simulovali, jak většina uživatelů tyto nástroje používá — jednorázové otázky bez kontextu.

Každá potravina byla testována pětkrát v pěti samostatných sezeních, abychom změřili jak přesnost (ve srovnání s ověřenými daty), tak konzistenci (variabilitu mezi sezeními). Ověřené referenční hodnoty pocházely z databáze USDA FoodData Central a byly křížově ověřeny s hodnotami potvrzenými nutričními specialisty.

Otestovali jsme 54 potravin napříč šesti kategoriemi: jednotlivé ingredience, jednoduchá jídla, složitá jídla, balené potraviny, restaurace a nápoje.


Jak přesné jsou odhady kalorií od ChatGPT, Gemini a Claude?

Zde jsou celkové výsledky přesnosti napříč všemi 54 potravinami, porovnávající průměrné odhady každého LLM s ověřenými hodnotami kalorií.

Metrika ChatGPT (GPT-4o) Gemini Claude Ověřená databáze (Nutrola)
Průměrná absolutní chyba ±18% ±22% ±16% ±2–5%
Medián absolutní chyby ±14% ±17% ±12% ±2%
Položky v rozmezí ±10% od ověřených 42% 35% 48% 95%+
Položky v rozmezí ±20% od ověřených 68% 58% 72% 99%+
Položky mimo >30% 15% 22% 11% <1%
Nejhorší jednotlivý odhad chyby 55% 68% 45% 8%

Všechny tři LLM vykazují významné chyby v odhadech kalorií, přičemž přibližně jedna třetina až polovina odhadů spadá mimo okno přesnosti ±10 %. Naopak ověřená nutriční databáze vrací data v rozmezí ±5 % téměř pro každý záznam, protože hodnoty jsou získávány z laboratorních analýz nebo ověřených nutričních údajů výrobců, nikoli generovány jazykovým modelem.

Studie z roku 2024 publikovaná v Nutrients testovala ChatGPT-4 na 150 běžných potravinách a zjistila průměrnou absolutní chybu 16,8 %, což je v souladu s našimi zjištěními. Studie poznamenala, že ChatGPT dosahoval nejlepších výsledků u jednoduchých, dobře známých potravin a nejhorších u smíšených pokrmů a kulturně specifických jídel.


Jak se přesnost kalorií LLM liší podle typu potravin?

Typ potraviny, jejíž kalorie se odhadují, je nejsilnějším prediktorem přesnosti LLM. Zde jsou výsledky rozdělené podle kategorií.

Kategorie potravin Příklad Průměrná chyba ChatGPT Průměrná chyba Gemini Průměrná chyba Claude
Jednotlivé ingredience (syrové) "100g syrového kuřecího prsa" ±8% ±10% ±7%
Běžné ovoce/zelenina "1 střední banán" ±6% ±8% ±5%
Jednoduchá domácí jídla "2 vejce míchaná s máslem" ±15% ±18% ±12%
Složitá/smíšená jídla "Kuřecí tikka masala s naanem" ±25% ±30% ±22%
Značkové balené potraviny "1 KIND Dark Chocolate Nut bar" ±12% ±15% ±10%
Jídla specifická pro restaurace "Chipotle kuřecí burrito bowl" ±20% ±28% ±18%
Nápoje (speciality) "Grande Starbucks Caramel Frappuccino" ±10% ±14% ±8%

Jednotlivé ingredience a běžné ovoce/zelenina produkují nejpřesnější odhady, protože tyto potraviny mají dobře zavedené, standardizované hodnoty kalorií, které se často objevují v tréninkových datech. Kalorická hodnota 100 gramů syrového kuřecího prsa (165 kalorií) nebo jednoho středního banánu (105 kalorií) je konzistentní napříč téměř všemi zdroji výživy.

Složitá smíšená jídla produkují nejhorší odhady, protože kalorická hodnota závisí na konkrétních metodách přípravy, poměrech ingrediencí a velikostech porcí, které LLM musí odhadnout, místo aby je vyhledalo. Kuřecí tikka masala může mít od 350 do 750 kalorií na porci v závislosti na množství smetany, oleje, másla a rýže — a LLM nemá způsob, jak zjistit, kterou verzi jíte.

Značkové balené potraviny představují zajímavý případ. LLMs si někdy mohou vzpomenout na přesná nutriční data pro populární značkové produkty ze svých tréninkových dat, ale informace mohou být zastaralé. Reformulace produktů se dějí pravidelně, a LLM trénovaný na datech z roku 2023 může uvádět hodnoty kalorií, které byly aktualizovány v roce 2024 nebo 2025.


Jak konzistentní jsou odhady kalorií LLM napříč sezeními?

Konzistence — získání stejné odpovědi, když se zeptáte na stejnou otázku několikrát — je samostatným problémem od přesnosti. Odhad může být konzistentně chybný nebo nekonzistentně správný. Měřili jsme konzistenci tím, že jsme každému LLM položili stejnou otázku o kaloriích pětkrát v samostatných sezeních.

Potravina Rozsah ChatGPT (5 sezení) Rozsah Gemini (5 sezení) Rozsah Claude (5 sezení) Ověřená hodnota
Kuřecí Caesar salát 350–470 kal 350–450 kal 380–440 kal 400–470 kal*
Sendvič s arašídovým máslem 320–450 kal 340–480 kal 350–410 kal 370–420 kal*
Pad Thai (1 porce) 400–600 kal 350–550 kal 420–520 kal 450–550 kal*
Velké hranolky z McDonald's 480–510 kal 450–520 kal 490–510 kal 490 kal
Avokádový toast (1 plátek) 250–380 kal 200–350 kal 280–340 kal 280–350 kal*
Chipotle burrito 800–1,100 kal 750–1,200 kal 850–1,050 kal 900–1,100 kal*
Řecký jogurt s granolou 250–400 kal 280–420 kal 270–350 kal 300–380 kal*

*Rozsah odráží variabilitu podle receptu/porce. Záznamy ověřené databáze jsou specifické pro přesné ingredience a porce.

Metrika konzistence ChatGPT Gemini Claude
Průměrný rozptyl napříč 5 sezeními ±22% průměru ±28% průměru ±15% průměru
Položky s rozptylem >100 kal 61% 72% 44%
Položky s rozptylem <50 kal 22% 15% 33%
Nejvíce nekonzistentní typ potraviny Složitá jídla Složitá jídla Složitá jídla
Nejvíce konzistentní typ potraviny Značkové balené potraviny Značkové balené potraviny Značkové balené potraviny

Nekonzistence není chyba — je to základní vlastnost toho, jak LLM fungují. Generují odpovědi pravděpodobnostně a stejný dotaz může produkovat různé výstupy v závislosti na parametrech vzorkování, stavu kontextového okna a teplotě modelu. Naproti tomu nutriční databáze vrací identické výsledky pro identické dotazy pokaždé, protože jde o deterministické vyhledávání, nikoli generativní proces.

Pro účely sledování kalorií to znamená, že pokud se zeptáte ChatGPT na stejný oběd, který jíte každý den, můžete dostat pokaždé jiný počet kalorií. Během týdne se tato náhodná variabilita může nasčítat na stovky nebo tisíce kalorií šumu v sledování.


Kde se LLMs mýlí v údajích o kaloriích?

Identifikovali jsme pět systematických vzorců chyb, které se objevily napříč všemi třemi LLM.

1. Používání "průměrných" porcí. Když se zeptáte na "plátek pizzy," LLMs obvykle defaultně používají generický střední plátek. Ale plátky pizzy se liší od 200 kalorií (tenké těsto, málo sýra) po 400+ kalorií (silné těsto, bohaté náplně). Bez specifikace typu, těsta a náplní může být LLM's default daleko od toho, co jste skutečně jedli.

2. Ignorování kuchyňských tuků. Když se zeptáte na "grilované kuřecí prso," LLMs obvykle uvádějí kalorie pouze pro kuřecí prso (přibližně 165 kalorií na 100g), aniž by zohlednily olej nebo máslo použité při vaření. To neustále podhodnocuje skutečné kalorie o 50–150 kalorií na porci.

3. Zastaralé informace o značkách. Reformulace produktů se mění. Clif Bar, který měl 250 kalorií v roce 2022, může mít v roce 2025 260 kalorií po reformulaci receptu. LLMs trénované na starších datech mohou uvádět zastaralé hodnoty.

4. Zaokrouhlování a ztráta přesnosti. LLMs často zaokrouhlují na nejbližších 50 nebo 100 kalorií, čímž ztrácejí přesnost, která je důležitá v širším měřítku. "Přibližně 300 kalorií" může znamenat 275 nebo 325 — 50kalorický rozsah, který se násobí napříč denními jídly.

5. Kulturní a regionální variace potravin. "Porce smažené rýže" znamená kaloricky velmi odlišné věci v domácí kuchyni, čínské americké restauraci a pouličním stánku v Bangkoku. LLMs obvykle defaultně používají západní předpoklady o porcích bez ohledu na kontext uživatele.


Jak se odhady kalorií LLM srovnávají s ověřenou databází Nutrola?

Základní rozdíl mezi LLM a aplikací pro sledování výživy je zdroj dat. LLMs generují odhady z tréninkových dat. Nutrola vyhledává hodnoty z databáze ověřené nutričními specialisty.

Srovnávací faktor LLMs (ChatGPT, Gemini, Claude) Ověřená databáze Nutrola
Zdroj dat Tréninková data (texty z webu, knihy) Ověřená databáze potravin nutričními specialisty
Přesnost (průměrná chyba) ±16–22% ±2–5%
Konzistence Liší se mezi sezeními (±15–28%) Identické výsledky pro každý dotaz
Specifická data o značkách Někdy dostupná, mohou být zastaralá Aktuální, ověřená výrobcem
Zpracování porcí Defaultně "průměrné", pokud není specifikováno Nastavitelné porce s přesností na gramy
Úprava metod vaření Nekonzistentní Oddělené záznamy pro syrové, vařené, smažené atd.
Podpora čárových kódů/UPC Neaplikovatelné Okamžité vyhledávání pro balené potraviny
Rozpis makroživin Často poskytováno, ale se stejnými chybami Ověřené údaje o proteinech, tucích, sacharidech a mikroživinách
Denní sledování Žádná paměť mezi sezeními* Trvalý potravinový deník s celkovými hodnotami

*ChatGPT a Gemini nabízejí funkce paměti, ale ty jsou navrženy pro obecné preference, nikoli pro strukturované sledování výživy.

Studie z roku 2025 publikovaná v British Journal of Nutrition testovala AI chatboty ve srovnání se třemi komerčními aplikacemi pro sledování výživy na přesnost sledování diety po dobu 7 dní. Aplikace pro sledování dosáhly průměrné denní chyby kalorií 5–8 %, zatímco AI chatboty průměrně 18–25 % denní chyby. Studie dospěla k závěru, že "obecné AI chatboty nejsou vhodné náhrady za nástroje určené pro hodnocení stravy."


Kdy jsou LLM užitečné pro informace o kaloriích?

LLMs nejsou úplně k ničemu pro informace o výživě. Slouží dobře pro specifické případy použití.

Obecné vzdělávání o výživě. Dotazy jako "Jaká makroživina je nejdůležitější pro budování svalů?" nebo "Jak funguje kalorický deficit?" produkují spolehlivé odpovědi, protože tyto informace jsou dobře zavedené a konzistentní napříč zdroji.

Hrubé odhady. Pokud potřebujete vědět, zda jídlo má přibližně 300 nebo 800 kalorií — rozsah 2x — LLMs obvykle odpoví správně. Jsou méně užitečné, když potřebujete vědět, zda jídlo má 450 nebo 550 kalorií.

Nápady na plánování jídel. Když požádáte LLM, aby "navrhl pět vysokoproteinových snídaní pod 400 kalorií," poskytne užitečné výchozí body, i když by měly být kalorie pro každý návrh ověřeny proti databázi.

Porovnání kategorií potravin. LLMs vám mohou spolehlivě říct, že ořechy jsou kaloricky hustší než ovoce, nebo že grilované kuře má méně kalorií než smažené kuře. Relativní porovnání jsou přesnější než absolutní čísla.


Kdy byste neměli používat LLM pro sledování kalorií?

Na základě údajů o přesnosti a konzistenci by LLMs neměly být používány jako primární nástroje pro sledování kalorií v několika scénářích.

Fáze aktivního hubnutí nebo přibírání. Když má váš denní kalorický cíl ±200 kalorií, ±18% chyba LLM může znamenat, že jste každý den mimo cíl o 300–500 kalorií. Během týdne to může plně negovat plánovaný deficit.

Sledování složitých nebo smíšených jídel. Chybovost u složitých jídel (±22–30%) je příliš vysoká pro smysluplné sledování. Odhad 700 kalorií na večeři, která je ve skutečnosti 900 kalorií, znamená denní chybu 200 kalorií z jednoho jídla.

Konzistentní denní sledování. Nekonzistence mezi sezeními znamená, že stejné jídlo zaznamenané v různých dnech produkuje různé hodnoty kalorií, což vytváří šum v datech sledování, který znemožňuje identifikaci trendů.

Řízení klinické výživy. Pro jednotlivce spravující diabetes, onemocnění ledvin nebo jiné stavy vyžadující přesnou kontrolu výživy, odhady kalorií LLM nesplňují potřebný standard přesnosti pro bezpečné řízení stravy.


Klíčové závěry: Přesnost kalorií LLM vs. ověřená databáze

Zjištění Data
Průměrná chyba kalorií ChatGPT ±18% napříč typy potravin
Průměrná chyba kalorií Gemini ±22% napříč typy potravin
Průměrná chyba kalorií Claude ±16% napříč typy potravin
Průměrná chyba ověřené databáze ±2–5%
Konzistence LLM (variabilita sezení) ±15–28% průměrné hodnoty
Konzistence databáze 0% variabilita (deterministické vyhledávání)
Nejvíce přesný typ potraviny LLM Jednotlivé ingredience, běžné ovoce (±5–10%)
Nejméně přesný typ potraviny LLM Složitá smíšená jídla (±22–30%)
Odhady LLM v rozmezí ±10% od ověřených 35–48% položek
Záznamy databáze v rozmezí ±5% od ověřených 95%+ položek

LLMs jsou impozantní univerzální nástroje, které dokážou plynule diskutovat o výživových konceptech. Nejsou však databázemi výživy. Tento rozdíl je důležitý, protože sledování kalorií je kvantitativní úkol — potřebujete konkrétní, konzistentní, ověřené čísla, nikoli plausibilní odhady, které se mění pokaždé, když se zeptáte. Pro vzdělávání o výživě a hrubé vedení LLMs fungují. Pro každodenní sledování kalorií, které přináší skutečné výsledky, je vhodnou volbou nástroj určený s ověřenou databází.

Často kladené otázky

Jak přesný je ChatGPT při počítání kalorií?

ChatGPT (GPT-4o) má průměrnou absolutní chybu kalorií přibližně 18 % napříč typy potravin. Odhady v rozmezí 10 % od ověřených hodnot poskytuje pouze u 42 % testovaných potravin. Přesnost je nejlepší u jednoduchých jednotlivých ingrediencí, jako je syrové kuřecí prso (8 % chyba) a nejhorší u složitých smíšených jídel, jako je kuřecí tikka masala (25 % chyba).

Mohu používat ChatGPT místo aplikace pro sledování kalorií?

ChatGPT není spolehlivou náhradou za účelově vytvořený sledovač kalorií. Studie z roku 2025 publikovaná v British Journal of Nutrition zjistila, že AI chatboty průměrně dosahovaly 18–25 % denní chyby kalorií, zatímco specializované aplikace dosáhly 5–8 %. ChatGPT také poskytuje nekonzistentní odpovědi napříč sezeními, přičemž stejný dotaz na potravinu produkuje odhady kalorií, které se liší o 15–28 %.

Proč ChatGPT uvádí různé hodnoty kalorií pokaždé, když se zeptám?

LLMs generují odpovědi pravděpodobnostně, místo aby vyhledávaly hodnoty v pevné databázi. Stejný dotaz může produkovat různé výstupy v závislosti na parametrech vzorkování a stavu modelu. V testování se odhady ChatGPT pro stejnou potravinu lišily v průměru o 22 % napříč pěti samostatnými sezeními, což činí konzistentní denní sledování nespolehlivým.

Na co je ChatGPT nejpřesnější, pokud jde o výživu?

ChatGPT dosahuje nejlepších výsledků u jednotlivých syrových ingrediencí (8 % chyba) a běžného ovoce a zeleniny (6 % chyba), kde jsou hodnoty kalorií dobře zavedené a standardizované. Je také užitečný pro obecné vzdělávání o výživě, hrubé odhady a relativní porovnání potravin, nikoli pro přesné počty kalorií.

Jak se ověřená databáze potravin srovnává s ChatGPT z hlediska kalorií?

Ověřená nutriční databáze, jako je ta v specializovaných aplikacích pro sledování, vrací výsledky v rozmezí 2–5 % skutečných hodnot s nulovou variabilitou mezi dotazy. ChatGPT má průměrnou chybu 18 % s 15–28 % nekonzistencí mezi sezeními. Databáze poskytuje přesná specifická data o značkách, nastavitelné porce a konzistentní výsledky pokaždé.

Připraveni proměnit sledování výživy?

Přidejte se k tisícům, kteří svou cestu ke zdraví proměnili s Nutrola!