Przeanalizowaliśmy 10 milionów zdjęć jedzenia: 20 najczęściej błędnie rozpoznawanych produktów przez AI

Dane z systemu rozpoznawania jedzenia AI Nutrola ujawniają, które produkty są najtrudniejsze do poprawnej identyfikacji przez algorytmy, dlaczego wprowadzają je w błąd oraz jak poprawiliśmy dokładność.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Dane dotyczące rozpoznawania jedzenia przez AI

Rozpoznawanie jedzenia oparte na AI zrewolucjonizowało śledzenie diety. Zamiast przeszukiwać bazy danych i zgadywać porcje, wystarczy zrobić zdjęcie, a komputerowe widzenie zajmie się resztą. Funkcja Snap & Track Nutrola przetwarza co miesiąc miliony zdjęć jedzenia, a użytkownicy w ponad 50 krajach polegają na niej jako głównym sposobie rejestrowania posiłków.

Jednak rozpoznawanie jedzenia przez AI nie jest doskonałe. Niektóre produkty regularnie mylą nawet najbardziej zaawansowane modele komputerowego widzenia. Aby zrozumieć, gdzie technologia radzi sobie dobrze, a gdzie napotyka trudności, przeanalizowaliśmy 10 milionów zdjęć jedzenia przetworzonych przez system Snap & Track Nutrola w okresie od stycznia 2025 do stycznia 2026. Porównaliśmy identyfikacje AI z poprawkami użytkowników, weryfikacjami manualnymi oraz recenzjami dietetyków, aby obliczyć wskaźniki dokładności dla poszczególnych produktów i zidentyfikować systematyczne wzorce błędnej identyfikacji.

Oto, co odkryliśmy.

Metodologia

Nasza analiza obejmowała 10,247,831 zdjęć jedzenia przesłanych przez użytkowników Nutrola w 53 krajach. Dla każdego zdjęcia śledziliśmy:

  • Początkowa identyfikacja AI: Produkt(y), które AI zidentyfikowało z najwyższym poziomem pewności
  • Wskaźnik poprawek użytkowników: Jak często użytkownik zmieniał identyfikację AI na inny produkt
  • Weryfikacja przez dietetyków: Losowa próbka 50,000 zdjęć została oceniona przez wykwalifikowanych dietetyków, aby ustalić dokładność niezależną od poprawek użytkowników
  • Dokładność top-1: Czy najwyżej oceniona identyfikacja AI była poprawna
  • Dokładność top-3: Czy poprawny produkt znalazł się w trzech najwyżej ocenianych przez AI przewidywaniach

Ogólnie rzecz biorąc, Snap & Track Nutrola osiągnęło dokładność top-1 na poziomie 87.3% oraz dokładność top-3 na poziomie 94.1% we wszystkich kategoriach jedzenia. Te liczby są zgodne z opublikowanymi wskaźnikami dla najnowocześniejszych modeli rozpoznawania jedzenia, które zazwyczaj raportują 80-90% dokładności top-1 na standardowych zestawach danych, takich jak Food-101 i ISIA Food-500.

Jednak dokładność znacznie różni się w zależności od rodzaju jedzenia. Niektóre kategorie przekraczają 95% dokładności top-1, podczas gdy inne spadają poniżej 60%.

20 najczęściej błędnie rozpoznawanych produktów

Pełne rankingi

Miejsce Produkt Dokładność top-1 Dokładność top-3 Najczęstsza błędna identyfikacja Błąd kaloryczny przy błędnej identyfikacji
1 Couscous 52.1% 71.4% Quinoa, bulgur, ryż +/- 15-40 kcal na porcję
2 Jogurt grecki (naturalny) 55.8% 78.2% Śmietana, labneh, jogurt naturalny +/- 30-80 kcal na porcję
3 Ryż kalafiorowy 57.3% 74.6% Ryż biały, couscous +110-150 kcal na porcję
4 Zupa miso 58.9% 76.1% Inne zupy na bazie bulionu, dashi +/- 20-60 kcal na porcję
5 Różne rodzaje płaskiego chleba 59.4% 73.8% Naan vs roti vs pita vs tortilla +/- 50-150 kcal na sztukę
6 Miska açai 61.2% 79.5% Miska smoothie, mieszana miska owocowa +/- 100-200 kcal na miskę
7 Bekon z indyka 62.0% 80.1% Bekon wieprzowy +40-70 kcal na porcję
8 Tempeh 63.4% 77.9% Tofu (twarde), seitan +/- 30-80 kcal na porcję
9 Makaron z cukinii 64.1% 81.3% Zwykły makaron, makaron szklany +150-200 kcal na porcję
10 Baba ghanoush 64.8% 79.7% Hummus +30-60 kcal na porcję
11 Filet z białej ryby 65.2% 82.4% Pierś z kurczaka, inne gatunki białej ryby +/- 20-50 kcal na porcję
12 Naleśniki białkowe 66.1% 83.0% Zwykłe naleśniki +80-150 kcal na porcję
13 Mleko owsiane 67.3% 84.2% Zwykłe mleko, mleko migdałowe, mleko sojowe +/- 30-80 kcal na szklankę
14 Ciemnozielone warzywa liściaste (gotowane) 67.9% 85.1% Szpinak vs jarmuż vs kapusta vs boćwina +/- 5-15 kcal na porcję
15 Desery bezcukrowe 68.4% 80.6% Zwykłe wersje tych samych deserów +100-250 kcal na porcję
16 Miska zbożowa 69.1% 83.7% Błędna identyfikacja rodzaju bazy zbożowej +/- 40-100 kcal na porcję
17 Mięso roślinne 69.8% 84.9% Odpowiednik mięsa +/- 30-80 kcal na porcję
18 Pierogi 70.2% 85.6% Wonton vs gyoza vs pierogi vs momo +/- 20-60 kcal na sztukę
19 Mieszane dania curry 70.5% 82.3% Mylenie typów curry i baz +/- 50-150 kcal na porcję
20 Owsianka na noc 71.0% 86.2% Zwykła owsianka, pudding chia +/- 50-120 kcal na porcję

Dlaczego te produkty mylą AI: pięć wzorców

Wzorzec 1: Wizualne bliźniaki z różnymi profilami kalorycznymi

Najczęstszym źródłem błędnej identyfikacji są produkty, które wyglądają niemal identycznie, ale mają znacznie różne profile odżywcze. Couscous i quinoa, nasz najczęściej błędnie rozpoznawany produkt, są wizualnie niemal nieodróżnialne na zdjęciu, szczególnie gdy są wymieszane z warzywami lub sosem. Jednak quinoa ma około 20% więcej kalorii i znacznie więcej białka na porcję niż couscous.

Podobnie, ryż kalafiorowy i ryż biały mają niemal identyczne cechy wizualne na zdjęciach, ale różnica kaloryczna jest ogromna: około 25 kcal na filiżankę dla ryżu kalafiorowego w porównaniu do 200+ kcal dla ryżu białego. Gdy AI błędnie identyfikuje ryż kalafiorowy jako ryż biały, log kaloryczny może być zawyżony o 150 lub więcej kalorii dla jednego dodatku.

Jogurt grecki, śmietana i labneh to kolejny zbiór wizualnych bliźniaków. Wszystkie trzy są białe, kremowe i zazwyczaj podawane w miseczkach. Jogurt grecki pełnotłusty zawiera około 130 kcal na filiżankę, podczas gdy śmietana ma około 445 kcal na filiżankę. Błędna identyfikacja w tym przypadku może drastycznie zniekształcić obliczenia dziennego spożycia użytkownika.

Wzorzec 2: Regionalne wariacje podobnych produktów

Płaskie chleby zajmują piątą pozycję na naszej liście, ponieważ kategoria ta obejmuje dziesiątki wizualnie podobnych, ale odżywczo różnych produktów w różnych kulturach. Standardowa tortilla z mąki pszennej (około 120 kcal) wygląda podobnie do naan (około 260 kcal) na zdjęciach, szczególnie gdy jest częściowo złożona lub zwinięta. Roti (około 100 kcal) i paratha (około 260 kcal, z powodu warstw oleju/masła) mogą wyglądać nieodróżnialnie, mimo że jedna z nich ma ponad dwa razy więcej kalorii.

Pierogi (na 18. miejscu) stawiają ten sam problem. Japońskie gyoza, chińskie jiaozi, polskie pierogi, nepalskie momo i gruzińskie khinkali mają podobny kształt (ciasto z nadzieniem), ale różnią się znacznie pod względem rozmiaru, grubości ciasta, składu nadzienia i metody przygotowania (gotowane, smażone, duszone).

Zaletą Nutrola jest jej zasięg w ponad 50 krajach. Model AI jest szkolony na zdjęciach jedzenia z każdej głównej tradycji kulinarnej, co daje mu szerszy zasób wizualny niż modele szkolone głównie na zachodniej fotografii jedzenia. Mimo to, różnice wewnątrzkategorii pozostają wyzwaniem.

Wzorzec 3: Produkty zastępcze, które naśladują oryginały

Wzrost popularności zamienników dietetycznych stworzył nową klasę wyzwań w rozpoznawaniu. Bekon z indyka naśladuje bekon wieprzowy. Roślinne burgery naśladują wołowe. Makaron z cukinii naśladuje makaron. Naleśniki białkowe naśladują zwykłe naleśniki. Desery bezcukrowe naśladują swoje pełnosłodzone odpowiedniki.

Te zamienniki są celowo zaprojektowane, aby wyglądać jak produkty, które zastępują. To cały sens z perspektywy zadowolenia konsumentów, ale stwarza fundamentalny problem dla systemów rozpoznawania wizualnego. Skutki kaloryczne mogą być znaczne: zwykłe naleśniki mają średnio 175 kcal każdy, podczas gdy naleśniki białkowe zazwyczaj zawierają 90-110 kcal każdy. Makaron z cukinii zawiera około 20 kcal na filiżankę w porównaniu do 220 kcal dla ugotowanego spaghetti.

W naszym zbiorze danych zamienniki miały średnią dokładność top-1 na poziomie 66.7%, w porównaniu do 89.2% dla ich odpowiedników niezamiennych. To obszar, w którym sygnały kontekstowe (preferencje dietetyczne użytkowników, wzorce logowania) mogą pomóc, a AI Nutrola uwzględnia te sygnały, aby poprawić przewidywania.

Wzorzec 4: Płynne i półpłynne produkty

Zupy, miski smoothie i napoje są konsekwentnie trudniejsze do zidentyfikowania przez AI niż produkty stałe. Zupa miso (na 4. miejscu) jest klarownym płynem z widocznymi kawałkami tofu i wodorostów, które mogą być mylone z innymi azjatyckimi bulionami. Miski açai (na 6. miejscu) mają cechy wizualne wspólne z innymi miskami smoothie, ale znacznie różnią się zawartością kaloryczną w zależności od bazy i dodatków.

Wyzwanie związane z płynnymi produktami polega na tym, że kluczowe informacje odżywcze są dosłownie niewidoczne. Dwie filiżanki płynu, które wyglądają identycznie na zdjęciu, mogą zawierać od 10 kcal (czarna kawa) do 400 kcal (wysokokaloryczne smoothie). Nutrola radzi sobie z tym, zadając użytkownikom pytania uzupełniające, gdy wykryje płynne produkty: "Czy to wersja zwykła czy dietetyczna?" "Jaka to marka?"

Wzorzec 5: Dania mieszane z ukrytymi składnikami

Dania curry (na 19. miejscu) i miski zbożowe (na 16. miejscu) reprezentują szersze wyzwanie: dania wieloskładnikowe, w których istotne składniki odżywcze są ukryte przed wzrokiem. Tajskie zielone curry może być przygotowane na bazie mleka kokosowego (dodając 200+ kcal na porcję) lub lżejszego bulionu. Kaloryczność miski zbożowej zależy w dużej mierze od tego, czy baza to quinoa, ryż biały, ryż brązowy czy farro, które mogą być przykryte dodatkami.

Dania mieszane stanowią około 35% wszystkich posiłków rejestrowanych przez użytkowników Nutrola, ale odpowiadają za 52% istotnych błędów w szacowaniu kalorii (definiowanych jako błędy przekraczające 15% prawdziwej zawartości kalorycznej dania).

Jak Nutrola poprawiła dokładność

Iteracyjne szkolenie modelu

Każda poprawka użytkownika w Nutrola trafia z powrotem do procesu szkolenia modelu AI. Gdy użytkownik zmienia "quinoa" na "couscous", ta poprawka, wraz z oryginalnym zdjęciem, jest dodawana do zbioru danych szkoleniowych. W ciągu 12 miesięcy naszej analizy ten proces ciągłego uczenia poprawił ogólną dokładność top-1 z 82.6% do 87.3%, co stanowi wzrost o 4.7 punktu procentowego.

Kwartał Dokładność top-1 Dokładność top-3 Średni błąd kaloryczny
Q1 2025 82.6% 90.3% 47 kcal
Q2 2025 84.1% 91.8% 41 kcal
Q3 2025 85.9% 93.2% 36 kcal
Q4 2025 86.8% 93.9% 33 kcal
Q1 2026 (częściowy) 87.3% 94.1% 31 kcal

Sygnały kontekstowe

AI Nutrola nie identyfikuje produktów w próżni. Uwzględnia sygnały kontekstowe, aby poprawić dokładność:

  • Profil dietetyczny użytkownika: Jeśli użytkownik wskazał, że stosuje dietę roślinną, model zwiększa wskaźniki pewności dla roślinnych alternatyw (tofu zamiast kurczaka, mleko owsiane zamiast mleka krowiego, roślinny burger zamiast wołowego).
  • Czas posiłku: Zdjęcia z poranków są bardziej prawdopodobne, że zawierają produkty śniadaniowe. To wydaje się oczywiste, ale znacząco poprawia dokładność w przypadku niejednoznacznych pozycji, takich jak owsianka na noc w porównaniu do puddingu chia.
  • Lokalizacja geograficzna: Zdjęcie zrobione w Tokio jest bardziej prawdopodobne, że przedstawia zupę miso niż minestrone. Nutrola obsługuje użytkowników w ponad 50 krajach i wykorzystuje ogólne dane lokalizacyjne (za zgodą użytkownika), aby dostosować priorytety identyfikacji żywności.
  • Wzorce logowania: Jeśli użytkownik regularnie rejestruje ryż kalafiorowy, model uczy się, że ten użytkownik jest bardziej skłonny do jedzenia ryżu kalafiorowego niż ryżu białego w przypadku niejednoznacznych wizualizacji.

Rozpoznawanie z wielu zdjęć

W 2025 roku Nutrola wprowadziła możliwość robienia wielu zdjęć tego samego posiłku z różnych kątów. W przypadku złożonych dań i niejednoznacznych produktów, drugi kąt może rozwiązać niepewność identyfikacji. W testach rozpoznawanie z wielu kątów poprawiło dokładność top-1 dla 20 najczęściej błędnie rozpoznawanych produktów o 8.2 punktu procentowego.

Progi pewności i pytania do użytkowników

Gdy wskaźnik pewności AI spada poniżej 75%, Nutrola prezentuje użytkownikowi trzy najlepsze kandydatury zamiast automatycznie rejestrować najlepszy wynik. Użytkownicy mogą dotknąć poprawnej identyfikacji lub wpisać nazwę produktu. To przejrzyste podejście oznacza, że identyfikacje o niskiej pewności są wychwytywane i korygowane, zanim wpłyną na dokładność śledzenia kalorii.

Wpływ błędnej identyfikacji na kalorie

Nie wszystkie błędne identyfikacje są sobie równe. Mylenie jarmużu ze szpinakiem (na 14. miejscu) ma wpływ kaloryczny wynoszący 5-15 kcal na porcję, co jest odżywczo nieistotne. Mylenie ryżu kalafiorowego z ryżem białym (na 3. miejscu) lub makaronu z cukinii z makaronem (na 9. miejscu) może wprowadzić błędy rzędu 150-200 kcal, co może znacząco wpłynąć na dzienny budżet kaloryczny.

Obliczyliśmy ważony wpływ kaloryczny błędnych identyfikacji w naszym zbiorze danych:

Zakres błędu kalorycznego % wszystkich błędnych identyfikacji Praktyczny wpływ
Mniej niż 25 kcal 38.2% Znikomy
25-75 kcal 29.6% Niewielki
75-150 kcal 19.7% Umiarkowany, zauważalny w czasie
150-250 kcal 9.1% Znaczący, może wpłynąć na dzienne cele
Ponad 250 kcal 3.4% Poważny, równoważny małemu posiłkowi

Mediana błędu kalorycznego we wszystkich błędnych identyfikacjach wyniosła 42 kcal, co mieści się w marginesie błędu dla większości celów śledzenia żywności. Jednak ogon rozkładu (12.5% błędnych identyfikacji, które wprowadzają błędy przekraczające 150 kcal) to obszar, w którym rozpoznawanie jedzenia przez AI ma najwięcej miejsca na poprawę.

Co użytkownicy mogą zrobić, aby poprawić dokładność AI

  1. Robić wyraźne, dobrze oświetlone zdjęcia. AI działa najlepiej przy dobrym oświetleniu i wyraźnym widoku z góry talerza. Zdjęcia w słabo oświetlonych restauracjach i z ekstremalnych kątów obniżają dokładność średnio o 6 punktów procentowych.

  2. Oddzielać składniki, gdy to możliwe. Jeśli Twój posiłek ma wyraźne składniki (białko, zboża, warzywa), ułożenie ich z widocznym oddzieleniem pomaga AI zidentyfikować każdy element indywidualnie, zamiast traktować talerz jako jedno mieszane danie.

  3. Korzystać z funkcji korekty. Każda poprawka, którą wprowadzisz, poprawia AI zarówno dla Ciebie, jak i dla całej społeczności Nutrola. Użytkownicy, którzy poprawiają błędne identyfikacje w ciągu pierwszych dwóch tygodni korzystania, mają o 11% wyższe długoterminowe wskaźniki dokładności, ponieważ model uczy się ich specyficznych wzorców dietetycznych.

  4. Określać zamienniki. Jeśli regularnie spożywasz produkty zastępcze (ryż kalafiorowy, roślinne mięso, opcje bezcukrowe), zaznacz to w swoich preferencjach dietetycznych Nutrola. AI będzie bardziej uwzględniać te alternatywy w swoich przewidywaniach.

  5. Spróbować zdjęć z różnych kątów. W przypadku złożonych dań drugie zdjęcie z innego kąta może rozwiązać niejednoznaczność. Jest to szczególnie przydatne w przypadku misek, zup i dań mieszanych, gdzie kluczowe składniki mogą być ukryte pod dodatkami.

Patrząc w przyszłość

Dokładność rozpoznawania jedzenia przez AI znacznie poprawiła się w ciągu ostatnich trzech lat, a trajektoria nie wykazuje oznak spowolnienia. Model Snap & Track Nutrola przetwarza miesięcznie więcej zdjęć jedzenia niż większość opublikowanych zestawów danych akademickich zawiera w całości, a każda interakcja sprawia, że system staje się mądrzejszy.

Naszym celem na koniec 2026 roku jest osiągnięcie dokładności top-1 na poziomie 90% we wszystkich kategoriach jedzenia oraz 75% dla obecnych 20 najczęściej błędnie rozpoznawanych produktów. Dzięki dalszym ulepszeniom modelu, rozszerzonym danym szkoleniowym z naszej rosnącej bazy użytkowników w ponad 50 krajach oraz funkcjom takim jak rozpoznawanie z wielu kątów i sygnały kontekstowe, wierzymy, że te cele są osiągalne.

Celem nie jest całkowite zastąpienie ludzkiego osądu. Chcemy, aby rejestrowanie jedzenia było tak szybkie i dokładne, że tarcie związane z śledzeniem diety praktycznie zniknie. Jeszcze nie osiągnęliśmy tego celu, ale po 10 milionach zdjęć jesteśmy wyraźnie bliżej niż rok temu.

Gotowy, aby przeksztalcic sledzenie zywienia?

Dolacz do tysiecy osob, ktore przeksztalcily swoja podroz zdrowotna z Nutrola!