Analyzovali jsme 10 milionů fotografií potravin: 20 nejčastěji chybně identifikovaných potravin AI

Data z AI systému rozpoznávání potravin Nutrola odhalují, které potraviny jsou pro počítačové vidění nejtěžší na správnou identifikaci, proč algoritmy selhávají a jak jsme zlepšili přesnost.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Data za AI rozpoznáváním potravin

AI řízené rozpoznávání potravin změnilo způsob sledování výživy. Místo procházení databázemi a odhadování velikosti porcí stačí pořídit fotografii a nechat počítačové vidění udělat zbytek. Funkce Snap & Track od Nutrola zpracovává miliony fotografií potravin každý měsíc a uživatelé ve více než 50 zemích se na ni spoléhají jako na hlavní metodu zaznamenávání.

Ale rozpoznávání potravin pomocí AI není dokonalé. Některé potraviny pravidelně zmátou i ty nejpokročilejší modely počítačového vidění. Abychom pochopili, kde technologie vyniká a kde selhává, analyzovali jsme 10 milionů fotografií potravin zpracovaných systémem Snap & Track od Nutrola mezi lednem 2025 a lednem 2026. Porovnali jsme identifikace AI s opravami uživatelů, manuálními ověřeními a recenzemi výživových poradců, abychom vypočítali míru přesnosti pro jednotlivé potraviny a identifikovali systematické vzorce chybné identifikace.

Toto jsou naše zjištění.

Metodologie

Naše analýza zahrnovala 10 247 831 fotografií potravin zaslaných uživateli Nutrola ve 53 zemích. Pro každou fotografii jsme sledovali:

  • Původní identifikace AI: Potravina(y), které AI identifikovala s nejvyšší mírou důvěry
  • Míra oprav uživateli: Jak často uživatel změnil identifikaci AI na jinou potravinu
  • Ověření výživovým poradcem: Náhodný vzorek 50 000 obrázků byl zkontrolován kvalifikovanými výživovými poradci, aby se stanovila přesnost nezávislá na opravách uživatelů
  • Top-1 přesnost: Zda byla identifikace s nejvyšší mírou důvěry správná
  • Top-3 přesnost: Zda se správná potravina objevila mezi třemi nejvyššími predikcemi AI

Celkově dosáhl systém Snap & Track od Nutrola top-1 přesnosti 87,3 % a top-3 přesnosti 94,1 % napříč všemi kategoriemi potravin. Tato čísla odpovídají publikovaným standardům pro nejmodernější modely rozpoznávání potravin, které obvykle hlásí 80-90 % top-1 přesnosti na standardních datech jako Food-101 a ISIA Food-500.

Přesto se přesnost dramaticky liší podle typu potravin. Některé kategorie překračují 95 % top-1 přesnosti, zatímco jiné klesají pod 60 %.

20 nejčastěji chybně identifikovaných potravin

Kompletní žebříček

Pořadí Potravina Top-1 přesnost Top-3 přesnost Nejčastější chybné určení Chyba v kaloriích při chybné identifikaci
1 Couscous 52,1 % 71,4 % Quinoa, bulgur, rýže +/- 15-40 kcal na porci
2 Řecký jogurt (přírodní) 55,8 % 78,2 % Zakysaná smetana, labneh, běžný jogurt +/- 30-80 kcal na porci
3 Květáková rýže 57,3 % 74,6 % Bílá rýže, couscous +110-150 kcal na porci
4 Miso polévka 58,9 % 76,1 % Jiné polévky na bázi vývaru, dashi +/- 20-60 kcal na porci
5 Různé flatbready 59,4 % 73,8 % Naan vs roti vs pita vs tortilla +/- 50-150 kcal na kus
6 Açai miska 61,2 % 79,5 % Smoothie miska, míchané bobule +/- 100-200 kcal na misku
7 Krůtí slanina 62,0 % 80,1 % Vepřová slanina +40-70 kcal na porci
8 Tempeh 63,4 % 77,9 % Tofu (pevné), seitan +/- 30-80 kcal na porci
9 Cuketové nudle 64,1 % 81,3 % Běžné těstoviny, skleněné nudle +150-200 kcal na porci
10 Baba ghanoush 64,8 % 79,7 % Hummus +30-60 kcal na porci
11 Filet z bílé ryby 65,2 % 82,4 % Kuřecí prsa, jiné druhy bílé ryby +/- 20-50 kcal na porci
12 Proteinové palačinky 66,1 % 83,0 % Běžné palačinky +80-150 kcal na porci
13 Ovesné mléko 67,3 % 84,2 % Běžné mléko, mandlové mléko, sójové mléko +/- 30-80 kcal na šálek
14 Tmavě zelené listové zeleniny (vařené) 67,9 % 85,1 % Špenát vs kapusta vs mangold +/- 5-15 kcal na porci
15 Dezerty bez cukru 68,4 % 80,6 % Běžné verze stejného dezertu +100-250 kcal na porci
16 Zrninové mísy 69,1 % 83,7 % Chybná identifikace typu základního zrna +/- 40-100 kcal na porci
17 Rostlinné maso 69,8 % 84,9 % Skutečné maso +/- 30-80 kcal na porci
18 Knedlíky 70,2 % 85,6 % Wonton vs gyoza vs pierogi vs momo +/- 20-60 kcal na kus
19 Smíšená kari jídla 70,5 % 82,3 % Záměna mezi typy kari a základy +/- 50-150 kcal na porci
20 Ovesné vločky přes noc 71,0 % 86,2 % Běžné ovesné vločky, chia pudink +/- 50-120 kcal na porci

Proč tyto potraviny matou AI: Pět vzorců

Vzor 1: Vizualní dvojčata s různými kalorickými profily

Nejčastějším zdrojem chybné identifikace jsou potraviny, které vypadají téměř identicky, ale mají výrazně odlišné nutriční profily. Couscous a quinoa, naše nejčastěji chybně identifikovaná potravina, jsou na fotografii vizuálně téměř nerozeznatelné, zejména když jsou smíchané se zeleninou nebo omáčkou. Přitom quinoa obsahuje přibližně o 20 % více kalorií a podstatně více bílkovin na porci než couscous.

Podobně květáková rýže a bílá rýže sdílejí téměř identické vizuální charakteristiky na fotografiích, ale rozdíl v kaloriích je obrovský: přibližně 25 kcal na šálek pro květákovou rýži oproti více než 200 kcal pro bílou rýži. Když AI chybně identifikuje květákovou rýži jako bílou rýži, může se kalorická bilance zvýšit o 150 nebo více kalorií za jedinou přílohu.

Řecký jogurt, zakysaná smetana a labneh představují další skupinu vizuálních dvojčat. Všechny tři jsou bílé, krémové a obvykle podávané v miskách. Plnotučný řecký jogurt obsahuje přibližně 130 kcal na šálek, zatímco zakysaná smetana má kolem 445 kcal na šálek. Chybná identifikace v tomto případě může dramaticky zkreslit výpočet denního příjmu uživatele.

Vzor 2: Regionální variace podobných potravin

Flatbready se umístily na pátém místě našeho seznamu, protože tato kategorie zahrnuje desítky vizuálně podobných, ale nutričně odlišných potravin napříč kulturami. Standardní tortilla z pšeničné mouky (přibližně 120 kcal) vypadá na fotografiích podobně jako naan (přibližně 260 kcal), zejména když je částečně složená nebo srolovaná. Roti (přibližně 100 kcal) a paratha (přibližně 260 kcal, kvůli vrstvení oleje/ másla) mohou vypadat nerozeznatelně, přičemž jedna má více než dvojnásobek kalorií.

Knedlíky (18. místo) představují stejnou výzvu. Japonské gyoza, čínské jiaozi, polské pierogi, nepálské momo a gruzínské khinkali sdílejí podobný tvar (těsto s náplní), ale liší se podstatně velikostí, tloušťkou těsta, složením náplně a metodou přípravy (vařené vs smažené vs dušené).

Výhodou Nutrola je její pokrytí ve více než 50 zemích. AI model je trénován na fotografiích potravin ze všech hlavních kuchyní, což mu dává širší vizuální slovník než modely trénované převážně na západní fotografii potravin. Přesto zůstávají vnitrokategoriové rozdíly výzvou.

Vzor 3: Náhradní potraviny, které napodobují originály

Vzestup dietních náhrad vytvořil novou třídu výzev pro rozpoznávání. Krůtí slanina napodobuje vepřovou slaninu. Rostlinné burgery napodobují hovězí burgery. Cuketové nudle napodobují těstoviny. Proteinové palačinky napodobují běžné palačinky. Dezerty bez cukru napodobují své plnohodnotné protějšky.

Tyto náhrady jsou záměrně navrženy tak, aby vypadaly jako potraviny, které nahrazují. To je celý smysl z pohledu spokojenosti spotřebitele, ale vytváří to zásadní problém pro vizuální rozpoznávací systémy. Kalorické důsledky mohou být značné: běžné palačinky mají průměrně 175 kcal každá, zatímco proteinové palačinky obvykle obsahují 90-110 kcal každá. Cuketové nudle mají přibližně 20 kcal na šálek oproti 220 kcal pro vařené špagety.

V našem datasetu měly náhradní potraviny průměrnou top-1 přesnost 66,7 %, zatímco jejich nenáhradní protějšky dosahovaly 89,2 %. Toto je oblast, kde mohou kontextové signály (uživatelské dietní preference, předchozí vzory zaznamenávání) pomoci, a AI od Nutrola tyto signály zahrnuje pro zlepšení predikcí.

Vzor 4: Tekuté a polotekuté potraviny

Polévky, smoothie mísy a nápoje jsou pro AI konzistentně těžší k identifikaci než pevné potraviny. Miso polévka (4. místo) je jasná tekutina s viditelnými kousky tofu a mořské řasy, které mohou být zaměněny s jinými asijskými vývary. Açai mísy (6. místo) sdílejí vizuální charakteristiky s jinými bobulovými smoothie mísami, ale dramaticky se liší v obsahu kalorií v závislosti na základní směsi a polevě.

Výzvou u tekutých potravin je, že kritické nutriční informace jsou doslova neviditelné. Dva šálky tekutiny, které vypadají na fotografii identicky, mohou obsahovat kdekoliv od 10 kcal (černá káva) po 400 kcal (vysokokalorické smoothie). Nutrola to řeší tím, že uživatelům pokládá následné otázky, když jsou detekovány tekuté potraviny: "Je to běžná nebo dietní verze?" "Jaká je to značka?"

Vzor 5: Smíšená jídla s skrytými ingrediencemi

Kari jídla (19. místo) a zrninové mísy (16. místo) představují širší problém: vícero komponentní jídla, kde jsou nutričně významné ingredience skryty z pohledu. Thajské zelené kari může být připraveno s kokosovým mlékem (přidávajícími 200+ kcal na porci) nebo lehčím vývarem. Kalorický obsah zrninové mísy závisí silně na tom, zda je základ quinoa, bílá rýže, hnědá rýže nebo farro, což může být zakryto polevami.

Smíšená jídla tvoří přibližně 35 % všech jídel zaznamenaných uživateli Nutrola, ale představují 52 % významných chyb v odhadu kalorií (definovaných jako chyby přesahující 15 % skutečného kalorického obsahu jídla).

Jak Nutrola zlepšila přesnost

Iterativní trénink modelu

Každá oprava uživatele v Nutrola se vrací do tréninkového procesu AI modelu. Když uživatel změní "quinoa" na "couscous", tato oprava spolu s původním obrázkem je přidána do tréninkového datasetu. Během 12 měsíců naší analýzy tento kontinuální proces učení zlepšil celkovou top-1 přesnost z 82,6 % na 87,3 %, což představuje zisk 4,7 procentního bodu.

Čtvrtletí Top-1 přesnost Top-3 přesnost Průměrná chyba v kaloriích
Q1 2025 82,6 % 90,3 % 47 kcal
Q2 2025 84,1 % 91,8 % 41 kcal
Q3 2025 85,9 % 93,2 % 36 kcal
Q4 2025 86,8 % 93,9 % 33 kcal
Q1 2026 (částečné) 87,3 % 94,1 % 31 kcal

Kontextové signály

AI od Nutrola neidentifikuje potraviny ve vakuu. Zahrnuje kontextové signály pro zlepšení přesnosti:

  • Uživatelský dietní profil: Pokud uživatel uvedl, že dodržuje rostlinnou stravu, model zvyšuje míru důvěry pro rostlinné alternativy (tofu místo kuřete, ovesné mléko místo mléka, rostlinný burger místo hovězího).
  • Časování jídla: Obrázky snídaně mají větší pravděpodobnost, že obsahují snídaňové potraviny. To se může zdát samozřejmé, ale významně to zlepšuje přesnost pro nejasné položky jako ovesné vločky přes noc versus chia pudink.
  • Geografická poloha: Fotografie pořízená v Tokiu je pravděpodobněji miso polévka než minestrone. Nutrola slouží uživatelům ve více než 50 zemích a využívá obecná lokalizační data (s povolením uživatele) k úpravě priorit identifikace potravin.
  • Minulé vzory zaznamenávání: Pokud uživatel pravidelně zaznamenává květákovou rýži, model se učí, že tento uživatel je pravděpodobněji konzumuje květákovou rýži než bílou rýži, když je vizuální vstup nejasný.

Víceúhlové rozpoznávání

V roce 2025 Nutrola zavedla možnost pořídit více fotografií stejného jídla z různých úhlů. Pro složitá jídla a nejasné potraviny může druhý úhel vyřešit nejistotu identifikace. V testování zlepšilo víceúhlové rozpoznávání top-1 přesnost pro 20 nejčastěji chybně identifikovaných potravin o 8,2 procentního bodu.

Prahové hodnoty důvěry a uživatelské výzvy

Když míra důvěry AI klesne pod 75 %, Nutrola uživateli nabídne tři nejlepší kandidáty místo automatického zaznamenání nejlepšího výsledku. Uživatelé mohou klepnout na správnou identifikaci nebo napsat název potraviny. Tento transparentní přístup znamená, že identifikace s nízkou důvěrou jsou zachyceny a opraveny dříve, než ovlivní přesnost sledování kalorií.

Kalorický dopad chybné identifikace

Ne všechny chybné identifikace jsou si rovny. Záměna kapusty se špenátem (14. místo) má kalorický dopad 5-15 kcal na porci, což je nutričně nevýznamné. Záměna květákové rýže s bílou rýží (3. místo) nebo cuketových nudlí s těstovinami (9. místo) může způsobit chyby o 150-200 kcal, což může významně ovlivnit denní kalorický rozpočet.

Vypočítali jsme vážený kalorický dopad chybné identifikace napříč naším datasetem:

Rozsah chyby v kaloriích % všech chybných identifikací Praktický dopad
Méně než 25 kcal 38,2 % Nezávažné
25-75 kcal 29,6 % Menší
75-150 kcal 19,7 % Mírné, znatelné v průběhu času
150-250 kcal 9,1 % Významné, může ovlivnit denní cíle
Více než 250 kcal 3,4 % Hlavní, ekvivalent malé porce

Medián kalorové chyby napříč všemi chybnými identifikacemi byl 42 kcal, což je v rámci chyby pro většinu účelů sledování výživy. Nicméně, konec distribuce (12,5 % chybných identifikací, které zavádějí chyby přes 150 kcal) je oblast, kde má rozpoznávání potravin AI nejvíce prostoru pro zlepšení.

Co mohou uživatelé udělat pro zlepšení přesnosti AI

  1. Pořiďte jasné, dobře osvětlené fotografie. AI funguje nejlépe za dobrého osvětlení a s jasným pohledem shora na talíř. Fotografie pořízené ve slabém osvětlení a z extrémních úhlů snižují přesnost v průměru o 6 procentních bodů.

  2. Oddělte komponenty, pokud je to možné. Pokud má vaše jídlo odlišné komponenty (bílkoviny, zrno, zelenina), uspořádání s viditelným oddělením pomáhá AI identifikovat každou položku jednotlivě, místo aby považovala talíř za jedno smíšené jídlo.

  3. Použijte funkci opravy. Každá oprava, kterou provedete, zlepšuje AI pro vás i pro celou komunitu Nutrola. Uživatelé, kteří opravují chybné identifikace během prvních dvou týdnů používání, mají o 11 % vyšší dlouhodobé míry přesnosti, protože model se učí jejich specifickým dietním vzorcům.

  4. Specifikujte náhrady. Pokud pravidelně konzumujete náhradní potraviny (květákovou rýži, rostlinné maso, dezerty bez cukru), uveďte to ve svých dietních preferencích Nutrola. AI bude tyto alternativy více zohledňovat ve svých predikcích.

  5. Zkuste víceúhlové fotografie. Pro složitá jídla může druhá fotografie z jiného úhlu vyřešit nejasnosti. To je obzvlášť užitečné pro mísy, polévky a smíšená jídla, kde mohou být klíčové ingredience skryty pod polevami.

Výhled do budoucna

Přesnost AI rozpoznávání potravin se v posledních třech letech dramaticky zlepšila a trend nejeví známky zpomalení. Model Snap & Track od Nutrola zpracovává měsíčně více fotografií potravin, než kolik většina publikovaných akademických datasetů obsahuje celkově, a každá interakce dělá systém chytřejším.

Naším cílem na konci roku 2026 je dosáhnout top-1 přesnosti 90 % napříč všemi kategoriemi potravin a 75 % pro aktuálních 20 nejčastěji chybně identifikovaných potravin. S pokračujícími zlepšeními modelu, rozšířenými tréninkovými daty z naší rostoucí uživatelské základny ve více než 50 zemích a funkcemi jako víceúhlové rozpoznávání a kontextové signály věříme, že těchto cílů lze dosáhnout.

Cílem není zcela nahradit lidské posouzení. Chceme, aby bylo zaznamenávání potravin tak rychlé a přesné, že tření spojené se sledováním výživy efektivně zmizí. Ještě jsme tam nedošli, ale po 10 milionech fotografií jsme měřitelně blíž než před rokem.

Připraveni proměnit sledování výživy?

Přidejte se k tisícům, kteří svou cestu ke zdraví proměnili s Nutrola!