Může AI zjistit, kolik kalorií je v mém jídle z fotografie?

Ano, AI dokáže s překvapivou přesností odhadnout kalorie z fotografie jídla. Zde je přesně popsáno, jak technologie funguje — od počítačového vidění po odhad porcí — a kde stále naráží na problémy.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Myšlenka zní téměř příliš pohodlně, aby byla pravdivá. Vyfotíte svůj talíř s večeří a během několika sekund vám AI sdělí, že vaše jídlo obsahuje 647 kalorií, 42 gramů bílkovin, 58 gramů sacharidů a 24 gramů tuku. Žádné odměrky. Žádné váhy na jídlo. Žádné psaní do vyhledávacího pole.

Ale může to AI skutečně udělat? A pokud ano, jak dobře?

Krátká odpověď zní ano — AI dokáže s prakticky užitečnou přesností odhadnout kalorie z fotografie jídla. V roce 2026 dosahují nejlepší systémy sledování jídla pomocí AI přesnosti odhadu kalorií v rozmezí 8 až 12 procent od hodnot změřených v laboratoři u většiny jídel. To je přesnější než průměrný manuální odhad kalorií, který podle výzkumů bývá nepřesný o 20 až 40 procent (Lichtman et al., 1992).

Dlouhá odpověď zahrnuje pochopení toho, co se přesně děje mezi okamžikem, kdy stisknete spoušť, a okamžikem, kdy se na vaší obrazovce objeví číslo kalorií. Je to vícestupňový proces, kde každý krok přináší jak schopnosti, tak omezení.

Čtyřstupňový proces: Od fotografie k kaloriím

Když vyfotíte jídlo a AI vrátí údaje o kaloriích, probíhá čtyři odlišné výpočetní procesy v sekvenci, obvykle během několika sekund.

Krok 1: Zpracování obrazu a detekce jídla

Prvním úkolem je ten nejzákladnější: AI musí určit, kde se v obrázku nachází jídlo, a rozdělit fotografii na jednotlivé oblasti potravin.

K tomu se používají modely hlubokého učení nazývané sítě pro detekci objektů — konkrétně architektury jako YOLO (You Only Look Once) a její nástupci, nebo modely detekce založené na transformátorech jako DETR. Tyto modely byly trénovány na milionech anotovaných obrázků jídla, kde lidé nakreslili ohraničující rámečky kolem každého jídla.

Výstupem tohoto kroku je sada oblastí v obrázku, z nichž každá obsahuje podezřelé jídlo. Fotografie talíře s večeří může například vytvořit čtyři oblasti: jednu pro bílkoviny, jednu pro škroby, jednu pro zeleninu a jednu pro omáčku.

Co dělá tento krok obtížným:

  • Jídla, která se překrývají nebo jsou částečně skrytá (kus salátu pod kuřecím prsem)
  • Smíšená jídla, kde nejsou ingredience vizuálně oddělitelné (dušené jídlo, zapečené pokrmy)
  • Podobně vypadající jídla vedle sebe (dva druhy rýže vedle sebe)
  • Nejedlé objekty v záběru (příbory, ubrousky, lahve s omáčkami)

Krok 2: Klasifikace jídla

Jakmile AI identifikuje oblasti obsahující jídlo, musí každou oblast klasifikovat — jaké konkrétní jídlo to je?

K tomu se používají modely klasifikace obrazu, obvykle konvoluční neuronové sítě (CNN) nebo vizuální transformátory (ViT) trénované na označených datech o jídle. Model vezme každou oblast jídla a vrátí pravděpodobnostní rozdělení napříč stovkami nebo tisíci kategorií potravin.

Moderní systémy rozpoznávání jídla operují s vocabularií 2 000 až 10 000+ kategorií potravin. Například AI Nutrola je trénována na rozpoznávání jídel z více než 50 zemí, což vyžaduje výjimečně široký slovník, který zahrnuje nejen "rýži", ale i rozlišení jako basmati rýže, jasmínová rýže, sushi rýže a lepkavá rýže — protože hustota kalorií se významně liší.

Co dělá tento krok obtížným:

  • Vizuálně podobná jídla s různými profily kalorií (bílá rýže vs. květáková rýže: 130 vs. 25 kalorií na šálek)
  • Regionální variace jídel („knedlík“ vypadá jinak v Číně, Polsku a Nepálu)
  • Přípravená jídla, kde není vizuálně zřejmé, jakým způsobem byla připravena (je kuře grilované nebo smažené? Rozdíl v kaloriích je značný)
  • Omáčky a dresinky, které jsou často zakryté nebo smíchané

Krok 3: Odhad velikosti porce

Toto je obecně považováno za nejtěžší krok v celém procesu. Správná identifikace jídla je nezbytná, ale nestačí — musíte také vědět, kolik toho je.

AI musí odhadnout fyzický objem nebo hmotnost každého jídla z 2D fotografie. To je inherentně špatně definovaný problém: 2D obraz neobsahuje úplné 3D informace. Ta samá fotografie může zobrazovat velký talíř jídla daleko od kamery nebo malý talíř blízko kamery.

Systémy AI používají několik strategií, jak se s tímto vypořádat:

Měřítko referenčního objektu: Talíř sám slouží jako referenční bod. Standardní večeřové talíře mají obvykle průměr 10 až 12 palců, a AI používá tuto předpokládanou velikost k odhadu měřítka potravin. Proto zahrnutí celého okraje talíře do vaší fotografie zlepšuje přesnost.

Naučené předpoklady porcí: AI se z tréninkových dat naučila, jak „typické“ porce vypadají. Miska cereálií s mlékem obvykle obsahuje 200-350 kalorií. Kuřecí prso na talíři má obvykle 4-8 uncí. Tyto statistické předpoklady poskytují rozumné výchozí odhady, i když není možné provést přesné měření.

Odhad hloubky: Některé systémy používají modely odhadu hloubky z jediné fotografie — AI, která odvozuje 3D hloubku z jednoho 2D obrazu — k odhadu výšky a objemu potravin. Novější iPhony s LiDAR senzory mohou poskytnout skutečná hloubková data, i když ne všechny aplikace toho využívají.

Modely hustoty potravin: Jakmile je objem odhadnut, AI aplikuje specifické modely hustoty potravin, aby převedla objem na hmotnost. To je nezbytné, protože různé potraviny mají velmi odlišné hustoty — šálek špenátu váží asi 30 gramů, zatímco šálek arašídového másla váží asi 258 gramů.

Co dělá tento krok obtížným:

  • Skryté jídlo pod jiným jídlem (miska polévky může mít pod povrchem značné ingredience)
  • Kaloricky husté ingredience v malých objemech (lžíce olivového oleje přidává 120 kalorií, ale je téměř neviditelná)
  • Proměnlivé hustoty potravin (volně balená vs. pevně balená rýže)
  • Neobvyklé nádoby na servírování, které narušují předpoklad velikosti talíře

Krok 4: Vyhledání v nutriční databázi

Poslední krok mapuje identifikované jídlo (z Krok 2) a odhadnutou porci (z Krok 3) do nutriční databáze, aby získal hodnoty kalorií a makroživin.

Tento krok je často opomíjen v diskusích o přesnosti sledování jídla pomocí AI, ale je kriticky důležitý. Výstup AI je pouze tak spolehlivý, jaká je databáze, na kterou se odkazuje.

Typy nutričních databází:

Typ databáze Zdroj Kvalita Omezení
Vládní databáze (USDA, EFSA) Laboratorně analyzovaná data Vysoká Omezená rozmanitost potravin, převážně syrové ingredience
Databáze založené na crowdsourcingu Uživatelské příspěvky Proměnlivá Nekonzistentní, duplicity, chyby
Databáze ověřené odborníky na výživu Profesionální revize Velmi vysoká Vyžaduje značné pokračující investice
Databáze specifické pro restaurace Údaje značek/řetězců Střední Pokrývá pouze konkrétní zařízení

Nutrola používá 100% databázi ověřenou odborníky na výživu, což znamená, že každý záznam o potravině byl přezkoumán kvalifikovanými odborníky na výživu. To poskytuje důležitou záruku přesnosti: i když má vizuální identifikace AI drobné chyby, nutriční data, na která se mapuje, jsou klinicky spolehlivá. Mnoho konkurenčních aplikací spoléhá na databáze založené na crowdsourcingu, kde jediný záznam pro „kuřecí kari“ mohl být zaslán uživatelem, který hádal hodnoty — a tento nepřesný záznam se pak dostane ke každému dalšímu uživateli.

Krajina přesnosti v roce 2026

Jak přesný je tento čtyřstupňový proces v praxi? Odpověď se výrazně liší v závislosti na konkrétní aplikaci, typu jídla a podmínkách fotografie.

Agregovaný výkon

Nejlepší systémy sledování jídla pomocí AI v roce 2026 dosahují následujících úrovní přesnosti:

Metrika Přední aplikace Průměrné aplikace Aplikace v rané fázi
Kalorická MAPE (průměrná absolutní procentuální chyba) 8-12% 13-18% 19-30%
Přesnost identifikace jídla 88-94% 75-85% 60-75%
Přesnost odhadu porcí 80-88% 65-78% 50-65%
Míra do 10% kalorií 65-75% 40-55% 20-35%

Pro kontext, 10 procentní MAPE u jídla s 600 kaloriemi znamená, že odhad AI je obvykle v rozmezí 60 kalorií od skutečné hodnoty. To je rozdíl mezi 600 a 660 kaloriemi — marže, která je nutričně nevýznamná pro praktické účely.

Kde AI exceluje

Určité typy jídel jsou téměř dokonale přizpůsobeny odhadu kalorií pomocí AI:

  • Jednoduché, jasně viditelné položky: Banán, jablko, vařené vejce. AI je dokáže identifikovat s téměř dokonalou přesností a porce (jeden střední banán, jedno velké vejce) jsou jednoznačné.
  • Standardní talířová jídla: Bílkovina, škrob a zelenina na standardním talíři. Jasné oddělení usnadňuje identifikaci a porci.
  • Běžná jídla v restauracích: Oblíbená jídla s konzistentními metodami přípravy. Margherita pizza, Caesar salát nebo talíř špaget carbonara vypadají v restauracích dostatečně podobně, aby byly průměry AI spolehlivé.
  • Balené potraviny vyfocené s viditelnými etiketami: Když AI dokáže přečíst text na obalu, může provést křížovou kontrolu s databázemi produktů pro přesné shody.

Kde AI stále bojuje

Některé scénáře zůstávají skutečně náročné:

  • Skryté kalorie: Kuchyňské oleje, máslo, dresinky a omáčky, které jsou absorbovány do jídla nebo nejsou vizuálně odlišné. Lžíce olivového oleje (120 kalorií) pokapané na salát je v fotografii téměř neviditelná.
  • Smíšená jídla v miskách: Dušená jídla, kari, polévky a zapečené pokrmy, kde kapalina zakrývá pevné ingredience. Miska chili vyfocená zhora může obsahovat kdekoli od 300 do 700 kalorií v závislosti na obsahu masa, hustotě fazolí a obsahu tuku.
  • Klamející velikosti porcí: Mělký široký talíř vs. hluboká miska mohou prezentovat vizuálně podobné fotografie s velmi odlišnými objemy jídla.
  • Neznámá nebo regionální jídla: Jídla mimo tréninkovou distribuci AI. Řídce tradiční pokrm z konkrétní oblasti nemusí odpovídat žádné kategorii ve slovníku modelu.

Jak přístup Nutrola řeší tyto výzvy

Systém AI Nutrola byl navržen tak, aby zmírnil známé slabiny analýzy fotografií jídla prostřednictvím několika specifických strategií.

Různorodá tréninková data

AI Nutrola je trénována na fotografiích jídla z kuchyní více než 50 zemí, shromážděných od více než 2 milionů uživatelů aplikace (s povolením a anonymizací). Tato šíře tréninkových dat znamená, že AI se setkává s okrajovými případy z každé potravinové kultury, místo aby byla úzce optimalizována pro dietu jedné oblasti.

Ověřená bezpečnostní síť odborníky na výživu

I když je vizuální analýza AI nedokonalá, 100% databáze ověřená odborníky na výživu Nutrola funguje jako korekční vrstva. Pokud AI identifikuje jídlo jako „kuřecí tikka masala“, kalorií, které vrátí, byla určena odborníkem na výživu, který zohlednil typické metody vaření, použití oleje a hustoty porcí — nikoli náhodným uživatelem, který hádal.

Více možností vstupu

Pro situace, kdy je fotografie sama o sobě nedostatečná, Nutrola poskytuje alternativní metody zaznamenávání:

  • Hlasové zaznamenávání: Popište své jídlo přirozeným jazykem. Užitečné pro potraviny, které jste jedli dříve a které nemůžete vyfotit, nebo pro přidání kontextu, který AI nemůže vidět („uvařeno ve dvou lžících kokosového oleje“).
  • AI Dietní asistent: Zeptejte se AI na otázky ohledně vašeho jídla. „Měl jsem misku ramen v restauraci — byla pravděpodobně vývar z vepřového nebo kuřecího?“ AI Dietní asistent může pomoci upřesnit odhady na základě konverzačního kontextu.
  • Manuální úprava: Po poskytnutí počátečního odhadu AI můžete upravit porce, vyměnit položky a přidat chybějící komponenty s minimálním počtem kliknutí.

Nepřetržité učení

Každá oprava, kterou uživatel provede — úprava porce, výměna potravin, přidání chybějící ingredience — se vrací do tréninkového procesu Nutrola. S více než 2 miliony aktivních uživatelů to vytváří obrovskou zpětnou vazbu, která neustále zlepšuje přesnost AI na reálných jídlech.

Věda za AI pro rozpoznávání potravin

Pro čtenáře, kteří mají zájem o technické základy, zde je stručný přehled klíčového výzkumu, který umožnil odhad kalorií z fotografií jídla.

Klíčové milníky

2014 — Dataset Food-101: Výzkumníci na ETH Curych publikovali dataset Food-101, obsahující 101 000 obrázků 101 kategorií potravin. To se stalo prvním standardizovaným benchmarkem pro AI rozpoznávání potravin a katalyzovalo výzkum v této oblasti (Bossard et al., 2014).

2016 — Průlom v hlubokém učení: Aplikace hlubokých konvolučních neuronových sítí na rozpoznávání potravin posunula přesnost identifikace nad 80 procent poprvé, což prokázali výzkumníci z MIT a Google (Liu et al., 2016).

2019 — Pokrok v odhadu porcí: Dataset Nutrition5k od Google Research poskytl párovaná data obrázků potravin s laboratorně změřeným nutričním obsahem, což umožnilo první přesné modely odhadu porcí (Thames et al., 2021).

2022 — Revoluce vizuálního transformátoru: Přijetí vizuálních transformátorů (ViT) pro rozpoznávání potravin zlepšilo přesnost o 5-8 procentních bodů oproti tradičním přístupům CNN, zejména pro jemné klasifikace potravin (Dosovitskiy et al., 2022).

2024-2026 — Komerční zralost: Velké komerční aplikace jako Nutrola kombinovaly pokroky v rozpoznávání potravin, odhadu porcí a kvalitě databází, aby dosáhly praktických úrovní přesnosti, které podporují každodenní sledování kalorií.

Ongoing Research Frontiers

Výzkumná komunita aktivně pracuje na několika frontách, které dále zlepší přesnost:

  • 3D rekonstrukce potravin z jednotlivých obrázků, využívající generativní AI k přesnějšímu odhadu objemu potravin
  • Rozpoznávání ingrediencí na úrovni jednotlivých složek, které identifikuje jednotlivé ingredience v smíšených pokrmech
  • Detekce způsobu vaření, která rozlišuje mezi grilováním, smažením, pečením a vařením v páře
  • Analýza více fotografií, která kombinuje pohledy z různých úhlů pro lepší odhad porcí

Praktické důsledky: Měli byste důvěřovat odhadům kalorií AI?

S ohledem na vše výše uvedené, zde je vyvážené hodnocení, kdy a jak moc důvěřovat odhadům kalorií AI z fotografií jídla.

Můžete s jistotou důvěřovat odhadům AI, když:

  • Jídlo se skládá z jasně viditelných, oddělených potravin
  • Používáte aplikaci s ověřenou nutriční databází (ne crowdsourced)
  • Kuchařství je dobře zastoupeno v tréninkových datech aplikace
  • Přezkoumáte a upravíte výstup AI, když vypadá nesprávně
  • Váš cíl je směrová přesnost (udržení v kalorickém rozmezí) spíše než přesná preciznost

Měli byste uplatnit zvýšenou pozornost, když:

  • Jídlo je složité smíšené jídlo (dušené, zapečené, husté kari)
  • Bylo použito významné množství tuku na vaření, které není vizuálně zřejmé
  • Jídlo pochází z kuchyně nebo oblasti, o které se domníváte, že je v tréninkových datech AI nedostatečně zastoupeno
  • Přesné počty kalorií jsou lékařsky nezbytné (klinické nutriční scénáře)

Ve srovnání s alternativami:

Metoda Typická přesnost Čas potřebný Konzistence
Odhadování kalorií z fotografie AI (nejlepší aplikace) 88-92% 3-5 sekund Vysoká
Ruční sebehodnocení 60-80% 4-7 minut Nízká (závislá na únavě)
Vážení + vyhledání v databázi 95-98% 10-15 minut Vysoká (ale zřídka udržována)
Žádné sledování 0% 0 sekund N/A

Metoda vážení je nejpřesnější, ale prakticky nikdo mimo klinický výzkum ji dlouhodobě neudržuje. Odhadování kalorií pomocí AI dosahuje praktického zlatého středu: dostatečně přesné, aby bylo skutečně užitečné, a dostatečně rychlé, aby bylo udržitelné.

Závěr

Ano, AI dokáže zjistit, kolik kalorií je ve vašem jídle z fotografie — a v roce 2026 to dělá s přesností, která významně překonává lidské odhady. Technologie spojuje detekci potravin, klasifikaci, odhad porcí a vyhledávání v nutriční databázi do procesu, který probíhá během několika sekund.

Kvalita výsledků silně závisí na konkrétní aplikaci, kterou používáte. Klíčové rozdíly zahrnují šíři tréninkových dat, kvalitu nutriční databáze a přesnost odhadu porcí. Kombinace globálně různorodého trénování AI (50+ zemí), 100% databáze ověřené odborníky na výživu a doby odezvy pod tři sekundy představuje současný vrchol pro analýzu fotografií jídla pro spotřebitele.

Technologie není dokonalá — skryté tuky, složitá smíšená jídla a neobvyklé potraviny zůstávají výzvou. Ale je dost dobrá na to, že se otázka posunula z „může to AI udělat?“ na „jak získám co nejpřesnější výsledky?“ A tento posun sám o sobě znamená zlomový bod v tom, jak miliony lidí přistupují k sledování výživy.


Reference:

  • Lichtman, S. W., et al. (1992). "Discrepancy between self-reported and actual caloric intake and exercise in obese subjects." New England Journal of Medicine, 327(27), 1893-1898.
  • Bossard, L., Guillaumin, M., & Van Gool, L. (2014). "Food-101 — Mining discriminative components with random forests." European Conference on Computer Vision, 446-461.
  • Liu, C., et al. (2016). "DeepFood: Deep learning-based food image recognition for computer-aided dietary assessment." International Conference on Smart Homes and Health Telematics, 37-48.
  • Thames, Q., et al. (2021). "Nutrition5k: Towards automatic nutritional understanding of generic food." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 8903-8911.
  • Dosovitskiy, A., et al. (2022). "An image is worth 16x16 words: Transformers for image recognition at scale." International Conference on Learning Representations.

Připraveni proměnit sledování výživy?

Přidejte se k tisícům, kteří svou cestu ke zdraví proměnili s Nutrola!