Creierul Global: De ce majoritatea AI-urilor nu recunosc Biryani, Arepas și Dal
Cele mai multe AI-uri de recunoaștere a alimentelor au fost antrenate pe burgeri și salate. Iată de ce acest lucru creează o diferență uriașă de acuratețe pentru bucătăriile din Asia de Sud, America Latină și Orientul Mijlociu și cum modelele antrenate global reduc acest decalaj.
Întreabă majoritatea aplicațiilor de recunoaștere a alimentelor să identifice o porție de chicken biryani și probabil vei obține răspunsul „orez cu carne” sau, și mai rău, „orez prăjit”. Estimarea caloriilor care urmează va fi greșită cu 200 până la 400 de calorii, deoarece modelul nu are nicio noțiune despre basmatiul îmbibat în ghee, marinarea stratificată sau ceapa prăjită încorporată în preparat.
Aceasta nu este o problemă de nișă. Conform Națiunilor Unite, peste 5,5 miliarde de oameni trăiesc în afara Americii de Nord și Europei. Mesele lor zilnice, de la jollof rice nigerian la ceviche peruan și okonomiyaki japonez, sunt sistematic subreprezentate în seturile de date care alimentează AI-urile de recunoaștere a alimentelor. Rezultatul este o tehnologie care funcționează bine pentru un cheeseburger, dar eșuează în fața majorității populației mondiale.
Problema datelor de antrenament centrate pe Occident
Modelele de viziune computerizată învață din imaginile pe care sunt antrenate. Cele mai utilizate seturi de date publice pentru alimente spun o poveste clară despre unde se află prejudecățile.
Food-101, unul dintre benchmark-urile fundamentale în cercetarea recunoașterii alimentelor, conține 101 categorii de alimente. Aproape 70% dintre acestea sunt preparate din Europa de Vest sau America de Nord: hamburgeri, spaghetti bolognese, salată Caesar, plăcintă de mere. Bucătăria din Asia de Sud este reprezentată de o singură categorie. Bucătăria africană nu are nicio reprezentare.
UECFOOD-256, dezvoltat la Universitatea de Electro-Comunicatii din Tokyo, se concentrează puternic pe preparatele japoneze. Este excelent pentru recunoașterea ramen-ului și tempura, dar oferă aproape nimic pentru mâncărurile din America de Sud sau din Africa de Vest.
Când un model antrenat în principal pe aceste seturi de date întâlnește o porție de chole bhature, are două opțiuni: să clasifice greșit preparatul complet sau să-l asocieze cu cel mai apropiat echivalent occidental. Niciuna dintre aceste opțiuni nu produce o estimare corectă a caloriilor.
De ce clasificarea greșită costă mai mult decât crezi
Diferența de calorii între o clasificare corectă și una greșită poate fi uriașă. Ia în considerare aceste exemple din viața reală:
- Chicken biryani clasificat ca „orez prăjit cu pui”: biryani-ul făcut cu ghee și ceapă prăjită poate conține între 450 și 600 de calorii pe porție. O intrare tipică pentru orez prăjit cu pui într-o bază de date generică listează între 300 și 380 de calorii. Aceasta este o subestimare potențială de 200 de calorii pe masă.
- Arepas clasificate ca „pâine de porumb”: o arepa umplută cu brânză și fasole poate ajunge la 500 de calorii. O felie de pâine de porumb este înregistrată la 170 până la 200 de calorii.
- Dal makhani clasificat ca „supă de linte”: untul și smântâna din dal makhani tradițional îl duc la 350 până la 450 de calorii pe cană. O supă de linte simplă are între 160 și 200 de calorii.
Pe parcursul unei săptămâni, aceste erori se acumulează în sute sau chiar mii de calorii greșit contabilizate, suficiente pentru a submina complet un plan de slăbire sau de creștere în greutate.
Complexitatea preparatelor globale
Preparatele occidentale tind să aibă componente relativ vizibile și separabile: o proteină, un amidon, o legumă. Multe bucătării non-occidentale prezintă o provocare fundamental diferită pentru viziunea computerizată.
Preparări stratificate și mixte
Biryani este un preparat stratificat. Orezul, carnea, condimentele, ceapa prăjită și grăsimea sunt integrate, nu servite separat. O fotografie a suprafeței dezvăluie doar stratul de sus. Mole negro din Oaxaca conține peste 30 de ingrediente măcinate într-un singur sos. Curry-ul massaman thailandez combină laptele de cocos, arahidele prăjite, cartofii și carnea într-un amestec indistinct.
Pentru ca un model AI să estimeze caloriile cu precizie, trebuie să înțeleagă nu doar cum arată preparatul, ci și ce conține.
Variația regională în cadrul aceluiași preparat
„Hummus”-ul făcut în Liban, Siria, Israel și Turcia va varia semnificativ în ceea ce privește conținutul de ulei de măsline, raportul de tahini și dimensiunea porției. Un biryani de casă din Hyderabad diferă de un biryani restaurant Lucknowi atât în tehnică, cât și în densitatea caloriilor. Tamalele variază de la o regiune la alta în Mexic și America Centrală, cu umpluturi variind de la pui slab la porc în untură.
Un model are nevoie de context regional, nu doar de recunoașterea la nivel de preparat, pentru a produce estimări fiabile.
Contribuitori invizibili de calorii
Multe tradiții culinare globale se bazează pe utilizarea generoasă a grăsimilor de gătit, care devin invizibile în preparatul final. Gătitul indian folosește ghee. Preparatele din Africa de Vest folosesc adesea ulei de palmier. Bucătăria din America Latină include untura și manteca. Gătitul din Orientul Mijlociu folosește cantități generoase de ulei de măsline și unt.
Aceste grăsimi sunt absorbite în preparat în timpul gătitului. O fotografie nu le poate dezvălui, dar ele pot reprezenta între 30 și 50 la sută din totalul caloriilor.
Cum abordează Nutrola recunoașterea alimentelor globale
Construirea unui AI alimentar care funcționează pentru diverse bucătării necesită un efort deliberat în fiecare etapă: colectarea datelor, arhitectura modelului și cartografierea nutrițională post-recunoaștere.
Date de antrenament diverse la scară
Setul de date de antrenament al Nutrola include imagini cu alimente provenite din peste 130 de țări. În loc să se bazeze exclusiv pe seturi de date publice centrate pe Occident, sistemul încorporează imagini colectate regional, cu etichete verificate de nutriționiști. Aceasta înseamnă că modelul a văzut mii de exemple de injera cu tibs, nu doar fotografii de stoc, ci mese reale fotografiate în case și restaurante din Etiopia și Eritreea.
Profiluri nutriționale la nivel de preparat
În loc să descompună fiecare preparat în componente generice, Nutrola menține profiluri nutriționale pentru preparate așa cum sunt ele de fapt gătite. Dal makhani nu este „linte + grăsime necunoscută”. Este un preparat specific cu o metodă de preparare cunoscută, iar estimarea caloriilor reflectă untul, smântâna și tehnica de gătire lentă care îl definesc.
Această abordare se extinde și la variantele regionale. Sistemul distinge între un biryani în stil Kolkata cu cartofi și un biryani dum din Hyderabad, deoarece profilurile calorice sunt cu adevărat diferite.
Intrare multimodală pentru ingrediente ascunse
Când o fotografie singură nu este suficientă, Nutrola folosește comenzi vocale și text pentru a completa informațiile lipsă. Un utilizator poate spune „a fost gătit în ulei de cocos” sau „există brânză în interiorul arepei” și sistemul ajustează estimarea în consecință. Această abordare multimodală abordează problema caloriilor invizibile pe care sistemele bazate doar pe fotografie nu le pot rezolva.
Ce înseamnă o recunoaștere globală mai bună pentru utilizatori
Pentru milioanele de oameni care consumă zilnic diete non-occidentale, un AI alimentar precis nu este o caracteristică de lux. Este diferența dintre un tracker nutrițional care funcționează și unul care, în tăcere, sabotează obiectivele lor.
Un studiu din 2023 publicat în Journal of the Academy of Nutrition and Dietetics a constatat că respectarea urmăririi nutriționale scade cu 40% atunci când utilizatorii percep aplicația ca fiind inexactă. Dacă trackerul tău clasifică constant greșit mesele, încetezi să mai ai încredere în el și, apoi, încetezi să-l folosești.
Recunoașterea precisă a alimentelor globale este importantă și pentru comunitățile de diasporă. Un indian-american de a doua generație care mănâncă o combinație de dal, roti și salate pe parcursul săptămânii are nevoie de o aplicație care să gestioneze ambele bucătării cu aceeași precizie. Un student nigerian din Londra care gătește supă egusi nu ar trebui să fie nevoit să introducă manual fiecare ingredient pentru că AI-ul nu a văzut niciodată preparatul.
Calea de urmat pentru AI-ul alimentar
Domeniul recunoașterii alimentelor se îndreaptă spre o diversitate mai mare, dar progresul este inegal. Noi seturi de date precum ISIA Food-500 și Nutrition5k extind acoperirea, iar tehnicile de învățare prin transfer permit modelelor să se adapteze la bucătăriile subreprezentate cu cantități mai mici de date etichetate.
Factorul cheie care va face diferența în viitor va fi datele nutriționale verificate. Recunoașterea că un preparat este biryani este doar jumătate din problemă. Corelarea acestei recunoașteri cu o estimare precisă a caloriilor și a macronutrienților necesită cunoștințe nutriționale specifice regiunii, care depășesc ceea ce poate oferi o bază de date alimentară generică.
Pentru oricine urmărește nutriția în afara unei diete standard occidentale, întrebarea de pus despre orice AI alimentar este simplă: a fost acest sistem antrenat pe mâncarea mea?
Întrebări frecvente
Care este cea mai bună aplicație de urmărire a caloriilor pentru mâncarea indiană?
Cea mai bună aplicație de urmărire a caloriilor pentru mâncarea indiană are nevoie de două lucruri: un model de recunoaștere antrenat pe preparate diverse din Asia de Sud și o bază de date nutrițională care să țină cont de metodele tradiționale de preparare. Aplicațiile antrenate în principal pe seturi de date occidentale tind să clasifice greșit preparate precum biryani, paneer tikka și dal makhani ca intrări generice, generând erori semnificative de calorii. Modelul Nutrola este antrenat pe imagini cu alimente din peste 130 de țări și menține profiluri nutriționale specifice preparatelor care reflectă metodele reale de gătire, inclusiv ghee, smântână și variațiile regionale.
De ce îmi oferă trackerul de calorii rezultate greșite pentru mâncarea etnică?
Cele mai multe trackere alimentare mainstream folosesc modele de recunoaștere antrenate pe seturi de date dominate de bucătării occidentale, cum ar fi Food-101. Când aceste modele întâlnesc preparate necunoscute, ele le clasifică greșit ca un preparat occidental similar din punct de vedere vizual sau recurg la intrări generice din baza de date. Profilurile nutriționale pentru aceste potriviri greșite sunt adesea cu sute de calorii diferite, în special pentru preparate gătite cu grăsimi de gătit precum ghee, ulei de palmier sau lapte de cocos, care sunt invizibile în fotografii.
Poate AI-ul să urmărească cu precizie caloriile pentru mâncarea din Orientul Mijlociu?
AI-ul poate urmări cu precizie mâncarea din Orientul Mijlociu dacă modelul a fost antrenat specific pe preparate precum shawarma, fattoush, kibbeh și mansaf și dacă baza de date nutrițională ține cont de conținutul de ulei de măsline, tahini și unt. Multe alimente din bucătăria din Orientul Mijlociu își extrag o parte semnificativă a caloriilor din grăsimile incorporate în timpul gătitului. Un sistem care combină recunoașterea prin fotografie cu detalii despre preparare furnizate de utilizator, cum ar fi cantitatea de ulei de măsline utilizată, va produce estimări mai fiabile.
Cum gestionează AI-ul alimentar preparatele cu multe ingrediente mixte?
Preparatele complexe cu ingrediente mixte sau stratificate, cum ar fi mole, biryani și tocănițe, reprezintă unele dintre cele mai dificile provocări în recunoașterea alimentelor. Sistemele bazate exclusiv pe imagini pot analiza doar suprafața vizibilă, pierzând straturile interioare și grăsimile absorbite. AI-ul alimentar avansat abordează acest lucru prin recunoașterea la nivel de preparat, identificând preparatul complet în loc de componente individuale, și prin input multimodal, unde utilizatorii pot adăuga detalii despre ingrediente ascunse prin text sau voce. Această abordare combinată îmbunătățește semnificativ acuratețea pentru preparate complexe cu multe ingrediente.
Este datele alimentare crowdsourced precise pentru bucătăriile internaționale?
Bazele de date nutriționale crowdsourced tind să fie cele mai puțin precise pentru bucătăriile internaționale. Intrările pentru preparate precum jollof rice, ceviche sau pad Thai sunt adesea trimise de utilizatori care s-ar putea să nu țină cont de variațiile regionale, grăsimile de gătit sau metodele autentice de preparare. O singură intrare „biryani” nu poate reprezenta gama calorică de la un biryani ușor cu legume la un biryani bogat de miel. Bazele de date verificate cu profiluri nutriționale specifice regiunii și detalii la nivel de variantă oferă date mult mai fiabile pentru bucătăriile non-occidentale.
Ești gata să îți transformi urmărirea nutriției?
Alătură-te celor mii care și-au transformat călătoria de sănătate cu Nutrola!