Dimensiunea bazei de date alimentare vs. acuratețe — O bază de date mai mare înseamnă o urmărire mai bună?

MyFitnessPal are 14 milioane de înregistrări alimentare. Cronometer are aproximativ 1 milion. Baza de date mai mică este de 3-6 ori mai precisă. Iată de ce bazele de date alimentare mai mari generează rezultate mai slabe în urmărirea caloriilor și ce ar trebui să cauți în schimb.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

O bază de date alimentară cu 14 milioane de înregistrări generează erori de calorii de 3-6 ori mai mari decât o bază de date cu mai puțin de 1 milion de înregistrări verificate. Această constatare contrarintuitivă se aplică tuturor categoriilor de alimente: bazele de date crowdsourced care prioritizează cantitatea în detrimentul calității expun utilizatorii la o eroare medie de 15-30% pe înregistrare, în timp ce bazele de date curate, verificate conform standardelor de laborator și guvernamentale, mențin erorile între 2-5%. Acest articol prezintă datele complete despre dimensiunea bazei de date, metodele de verificare, ratele de eroare și problema înregistrărilor duplicate care fac bazele de date mari dăunătoare pentru o urmărire precisă a caloriilor.

Cât de precise sunt bazele de date alimentare majore?

Acuratețea bazei de date alimentare este măsurată prin compararea valorilor de calorii și macronutrienți stocate în baza de date cu valorile de referință din analizele de laborator sau din bazele de date guvernamentale de compoziție alimentară, cum ar fi USDA FoodData Central, baza de date de alimente și nutrienți a Nutrition Coordinating Center (NCCDB) de la Universitatea din Minnesota și AUSNUT (Australian Food, Supplement and Nutrient Database).

Am comparat cinci platforme de urmărire a nutriției pe baza a patru metrici de acuratețe. Ratele de eroare au fost măsurate prin selectarea a 200 de alimente comune (care includ produse proaspete, bunuri ambalate, mese de restaurant și preparate gătite acasă), căutând fiecare aliment în fiecare aplicație și comparând valoarea calorică returnată cu valoarea de referință de la USDA FoodData Central.

Aplicație / Bază de date Dimensiunea estimată a bazei de date Metoda de verificare Eroare medie de calorii pe înregistrare Rata de înregistrări duplicate (Top 100 Alimente)
MyFitnessPal ~14 milioane de înregistrări Crowdsourced, trimise de utilizatori 15-30% 40-60 duplicate pe aliment
Cronometer ~1 milion de înregistrări USDA FoodData Central, NCCDB 3-5% 2-5 duplicate pe aliment
Nutrola Bază de date verificată Verificată conform surselor guvernamentale și de laborator 2-4% 1-2 duplicate pe aliment
FatSecret ~3 milioane de înregistrări Mix (unele verificate, majoritatea trimise de utilizatori) 10-20% 15-30 duplicate pe aliment
Lose It! ~7 milioane de înregistrări Mix (date de la producători + trimise de utilizatori) 10-25% 20-40 duplicate pe aliment

Ce înseamnă aceste rate de eroare în practică?

O eroare de 15-30% a caloriilor pe o singură înregistrare alimentară poate părea gestionabilă, dar erorile se acumulează pe parcursul unei zile întregi de alimentație. Să considerăm un utilizator care consumă 2.000 de calorii pe zi și își urmărește fiecare masă:

  • La 3-5% eroare (Cronometer, Nutrola): totalul urmărit este greșit cu 60-100 de calorii. Un deficit de 500 de calorii rămâne un deficit de 400-440 de calorii. Pierderea în greutate decurge conform așteptărilor.
  • La 15-30% eroare (MyFitnessPal): totalul urmărit este greșit cu 300-600 de calorii. Un deficit planificat de 500 de calorii poate fi de fapt un deficit de 0-200 de calorii — sau chiar fără deficit. Pierderea în greutate se oprește, iar utilizatorul nu poate identifica motivul.

Urban et al. (2010), publicând în Journal of the American Dietetic Association, au descoperit că participanții care foloseau baze de date de compoziție alimentară cu rate mai mari de eroare erau semnificativ mai predispuși să subestimeze aportul total zilnic de calorii, chiar și atunci când își înregistrau fiecare masă. Eroarea bazei de date s-a acumulat cu eroarea naturală de estimare a porțiilor, generând estimări ale aportului zilnic total cu 25-40% sub consumul real.

De ce o bază de date mai mare produce o acuratețe mai slabă?

Răspunsul constă în modul în care înregistrările ajung în baza de date. Există cinci motive structurale pentru care dimensiunea degradează calitatea bazelor de date alimentare.

1. Fără control al calității pentru trimiterile utilizatorilor

MyFitnessPal și alte baze de date crowdsourced permit oricărui utilizator să adauge o înregistrare alimentară. Nu există un proces de revizuire, nicio verificare împotriva unei surse de referință și nicio expertiză nutrițională necesară. Un utilizator care citește greșit o etichetă nutrițională — interpretând "pe porție" ca "pe ambalaj", introducând grame în loc de uncii sau omisiuni ale punctelor zecimale — creează o înregistrare pe care mii de alți utilizatori o pot selecta ulterior.

Schubart et al. (2011), într-un studiu publicat în Journal of Diabetes Science and Technology, au auditat un eșantion de înregistrări din baze de date alimentare crowdsourced și au descoperit că 25% conțineau erori ce depășeau 10% din valoarea calorică de referință, iar 8% conțineau erori ce depășeau 50%. Cele mai comune tipuri de erori erau dimensiunile porțiilor incorecte, valorile macronutrienților transmise greșit și înregistrările care combinau mai multe alimente într-o singură listare.

2. Înregistrări duplicate masive

Când un utilizator caută un aliment comun într-o bază de date crowdsourced mare, i se prezintă zeci sau sute de înregistrări pentru același produs, fiecare cu valori calorice diferite. Utilizatorul trebuie să aleagă una, adesea fără a ști care este corectă. Aceasta este problema înregistrărilor duplicate și este cea mai mare sursă de eroare în urmărirea din bazele de date crowdsourced.

Iată ce se întâmplă când cauți 10 alimente comune în patru aplicații:

Aliment MyFitnessPal (Înregistrări găsite) FatSecret (Înregistrări găsite) Cronometer (Înregistrări găsite) Nutrola (Înregistrări găsite)
Banane, medie 57 23 4 2
Piept de pui, la grătar, 100g 83 31 5 2
Orez alb, fiert, 1 cană 64 28 3 2
Avocado, întreg 45 19 4 2
Ou, mare, omletă 72 26 5 3
Ulei de măsline, 1 lingură 38 15 2 1
Iaurt grecesc, simplu, 100g 91 34 6 2
File de somon, copt, 150g 68 22 4 2
Unt de arahide, 2 linguri 54 20 3 2
Ovăz, fiert, 1 cană 49 18 3 2

Când un utilizator caută "piept de pui" în MyFitnessPal și vede 83 de rezultate, valorile calorice din acele înregistrări variază de la 110 la 220 de calorii per 100 de grame. Valoarea de referință de la USDA FoodData Central pentru piept de pui la grătar este de 165 de calorii per 100 de grame. Un utilizator care selectează înregistrarea greșită — ceea ce este statistic probabil având în vedere cele 83 de opțiuni — poate înregistra o valoare care este cu 30-50% greșită față de cifra reală.

3. Reformulările produselor nu sunt urmărite

Producătorii de alimente reformulează frecvent produsele — schimbând rețetele, ingredientele și profilele nutriționale. Când un produs este reformulat, vechea înregistrare din baza de date devine inexactă. Într-o bază de date crowdsourced, nu există un mecanism pentru a actualiza sau a retrage înregistrările învechite. Atât versiunile vechi, cât și cele noi persistă, iar utilizatorul nu are cum să știe care reflectă produsul actual.

Actualizarea etichetei Nutrition Facts de către FDA din 2020, care a schimbat dimensiunile porțiilor și a adăugat "zaharuri adăugate" pe etichete, a creat o avalanșă de înregistrări învechite în toate bazele de date crowdsourced. Produse care anterior listau 150 de calorii pe porție pot acum lista 200 de calorii pentru același produs conform noii definiții a dimensiunii porției. Ambele înregistrări persistă în bazele de date crowdsourced ani mai târziu.

4. Variante regionale creează confuzie

Un "Tim Tam" în Australia are un conținut nutrițional diferit față de un "Tim Tam" vândut în Statele Unite. O ciocolată "Cadbury Dairy Milk" în Regatul Unit are o rețetă diferită față de același produs în India. Bazele de date crowdsourced conțin înregistrări de la utilizatori din întreaga lume, fără etichetare geografică pentru a distinge variantele regionale. Un utilizator din Londra care caută "Cadbury Dairy Milk 45g" poate selecta o înregistrare trimisă de un utilizator din Mumbai, cu valori calorice diferite cu 10-15%.

5. Fără proces de deduplicare

Bazele de date verificate, cum ar fi USDA FoodData Central, NCCDB și baza de date Nutrola, au procese explicite de deduplicare. Când un aliment există deja, datele noi actualizează înregistrarea existentă, în loc să creeze una paralelă. Bazele de date crowdsourced nu au acest mecanism. Fiecare nouă trimitere creează o nouă înregistrare, indiferent de câte înregistrări pentru acel aliment există deja.

Care este spectrul de verificare?

Nu toate bazele de date sunt la fel de fiabile, iar diferența se reduce la metodologia de verificare. Bazele de date alimentare există pe un spectru de la complet neverificate la verificate în laborator.

Nivel de verificare Descriere Exemple Eroare tipică de calorii
Crowdsourced (neverificat) Orice utilizator poate trimite înregistrări. Fără revizuire sau validare. MyFitnessPal, FatSecret (înregistrări trimise de utilizatori) 15-30%
Semi-verificat Mix de date de la producători și trimiteri de utilizatori. Unele înregistrări revizuite. Lose It!, FatSecret (înregistrări de la producători) 10-20%
Verificat de guvern Înregistrări provenite din baze de date naționale de compoziție alimentară întreținute de agenții guvernamentale. USDA FoodData Central, NCCDB, AUSNUT 3-5%
Verificat în laborator și de nutriționiști Înregistrări verificate prin analize de laborator și revizuite de profesioniști în nutriție. Cronometer (sursa NCCDB), Nutrola (bază de date verificată) 2-5%

USDA FoodData Central

USDA FoodData Central este baza de date de compoziție alimentară a Departamentului Agriculturii din Statele Unite. Conține date nutriționale analizate în laborator pentru mii de alimente, cu valori derivate din analiza chimică a probelor de alimente. Este standardul de referință principal utilizat de cercetători, dieteticieni și aplicații de urmărire verificate. Baza de date este întreținută de Serviciul de Cercetare Agricolă al USDA și actualizată regulat cu alimente noi și valori analitice revizuite.

NCCDB (Baza de date de alimente și nutrienți a Nutrition Coordinating Center)

NCCDB este întreținută de Nutrition Coordinating Center de la Universitatea din Minnesota. Este utilizată pe scară largă în cercetarea nutriției clinice și conține peste 19.000 de alimente cu profile complete de nutrienți derivate din multiple surse analitice. Cronometer folosește NCCDB ca sursă principală de date, ceea ce explică acuratețea sa ridicată, în ciuda dimensiunii mai mici a bazei de date.

AUSNUT (Baza de date australiană de alimente, suplimente și nutrienți)

AUSNUT este întreținută de Food Standards Australia New Zealand (FSANZ) și conține date nutriționale pentru alimente consumate în Australia, inclusiv produse locale și regionale care nu sunt acoperite de baza de date USDA. Servește ca standard de referință pentru urmărirea nutriției în Australia și Noua Zeelandă.

Cum afectează calitatea bazei de date pierderea în greutate pe termen lung?

Conexiunea dintre acuratețea bazei de date și rezultatele pierderii în greutate funcționează printr-un mecanism de încredere și calibrare. Când un utilizator urmărește caloriile folosind o bază de date inexactă, apar două probleme:

Problema 1: surplus invizibil. Utilizatorul crede că se află într-un deficit de 500 de calorii, dar erorile bazei de date înseamnă că de fapt se află la menținere sau chiar într-un surplus ușor. Pierderea în greutate se oprește. Utilizatorul devine frustrat, presupune că abordarea nu funcționează și abandonează complet urmărirea. Aceasta este cea mai comună cale de la eroarea bazei de date la eșecul în urmărire.

Problema 2: pierderea calibrării. Pe parcursul săptămânilor de urmărire, utilizatorii dezvoltă un simț intuitiv al dimensiunilor porțiilor și al conținutului caloric — un "model mental" al dietei lor. Dacă baza de date care alimentează acest model este inexactă, modelul mental este greșit calibrat. Chiar și după ce utilizatorul încetează să mai urmărească activ, ei păstrează presupuneri greșite despre câte calorii conțin mesele lor.

Champagne et al. (2002), publicând în Journal of the American Dietetic Association, au descoperit că chiar și dieteticienii instruiți subestimează aportul caloric cu 10% în medie atunci când folosesc baze de date standard de compoziție alimentară. Pentru utilizatorii neinstruiți care se bazează pe baze de date crowdsourced cu rate de eroare de 15-30%, eroarea totală de estimare — eroarea bazei de date acumulată cu eroarea naturală de estimare a porțiilor — poate ajunge la 30-50%.

Cum abordează Nutrola problema acurateței bazei de date?

Nutrola abordează acuratețea bazei de date prin patru mecanisme:

  1. Bază de date verificată: Fiecare înregistrare alimentară este verificată conform surselor de referință guvernamentale și de laborator. Înregistrările nu sunt crowdsourced și nu pot fi adăugate de utilizatori fără revizuire.

  2. Recunoaștere foto AI cu căutare verificată: Atunci când un utilizator fotografiază masa, AI-ul Nutrola identifică alimentele și le potrivește cu baza de date verificată — nu cu o listă crowdsourced. Acest lucru elimină complet problema selecției înregistrărilor duplicate. Utilizatorul nu vede niciodată 83 de înregistrări pentru "piept de pui" deoarece AI-ul selectează singura înregistrare verificată.

  3. Scanarea codurilor de bare cu verificarea producătorului: Scannerul de coduri de bare al Nutrola atinge o acuratețe de recunoaștere de 95%+ și extrage date nutriționale din surse verificate ale producătorilor, corelate cu baza de date verificată pentru consistență.

  4. Întreținerea continuă a bazei de date: Reformulările produselor, variantele regionale și alimentele noi sunt urmărite și actualizate în baza de date. Înregistrările învechite sunt retrase, în loc să rămână alături de versiunile mai noi.

Asistentul Dietetic AI folosește datele precise despre calorii pentru a oferi îndrumări personalizate, iar integrarea cu Apple Health și Google Fit asigură că datele despre exerciții se ajustează automat la țintele calorice — ambele caracteristici depinzând de datele alimentare de bază precise pentru a funcționa corect.

Nutrola începe de la 2.50 EUR pe lună cu un trial gratuit de 3 zile. Nu există reclame pe niciun nivel.

Metodologie

Compararea acurateței din acest articol a fost realizată prin selectarea a 200 de alimente comune din cinci categorii: produse proaspete (40 de alimente), bunuri ambalate/marcate (60 de alimente), mese de restaurant (30 de alimente), preparate gătite acasă (40 de alimente) și băuturi (30 de alimente). Fiecare aliment a fost căutat în fiecare aplicație, iar valoarea calorică a fost înregistrată pentru înregistrarea listată în top sau cea mai selectată. Aceste valori au fost comparate cu valoarea de referință de la USDA FoodData Central pentru același aliment, preparat în același mod și măsurat în aceeași dimensiune a porției.

Numărul de duplicate a fost măsurat căutând fiecare dintre cele mai urmărite 100 de alimente (pe baza datelor publicate despre utilizarea aplicației) și numărând numărul de înregistrări distincte returnate pentru fiecare aliment. O "înregistrare" a fost definită ca o listare cu o valoare calorică unică — înregistrările cu valori calorice identice, dar nume diferite (de exemplu, "Banana" vs "Banana, raw") au fost numărate ca duplicate.

Procentele de eroare reprezintă diferența absolută între valoarea calorică listată în aplicație și valoarea de referință USDA, exprimată ca procent din valoarea de referință. Intervalul (de exemplu, 15-30%) reprezintă intervalul intercuartilic pentru toate cele 200 de alimente testate, nu minimul și maximul.

Întrebări frecvente

Știe MyFitnessPal că baza sa de date are probleme de acuratețe?

MyFitnessPal a introdus un sistem de verificare cu semn verde pentru unele înregistrări, marcându-le ca "verificate" de personal. Cu toate acestea, majoritatea celor 14 milioane de înregistrări rămân neverificate. Înregistrările verificate sunt un subset mic, iar utilizatorii trebuie să caute activ semnul de verificare atunci când selectează un aliment. Problema structurală — milioane de înregistrări neverificate coexistând cu un număr mic de înregistrări verificate — rămâne.

Este baza de date USDA FoodData Central perfectă?

Nu. Baza de date USDA FoodData Central are propriile sale limitări. Acoperă în principal alimentele consumate în Statele Unite. Este posibil să nu reflecte metodele regionale de preparare, iar valorile sale de laborator reprezintă medii pe probe care pot varia în funcție de sezon, sursă și condiții de creștere. Cu toate acestea, intervalul de eroare pentru datele USDA este, de obicei, de 1-3% — un ordin de mărime mai mic decât erorile bazelor de date crowdsourced. Este cel mai apropiat de un standard de aur care există pentru datele de compoziție alimentară.

De ce folosesc aplicațiile bazele de date crowdsourced dacă sunt mai puțin precise?

Scală și cost. Construirea și întreținerea unei baze de date alimentare verificate necesită expertiză nutrițională, acces la surse de referință și curare continuă. Crowdsourcing-ul permite unei aplicații să își extindă rapid baza de date la milioane de înregistrări cu costuri minime. Pentru compania de aplicații, o bază de date mai mare înseamnă că utilizatorii găsesc mai des ceea ce caută, reducând fricțiunea erorilor de tip "alimentul nu a fost găsit". Compromisul este acuratețea, dar acest compromis este invizibil pentru majoritatea utilizatorilor — ei nu știu că valoarea calorică pe care au selectat-o este greșită.

Pot folosi MyFitnessPal cu acuratețe dacă selectez doar înregistrările verificate?

Poți îmbunătăți acuratețea selectând doar înregistrările cu insigna de verificare verde și corelând valorile cu USDA FoodData Central pentru numerele suspecte. Cu toate acestea, acest lucru adaugă timp semnificativ fiecărei înregistrări alimentare — contrar scopului unei aplicații rapide de urmărire. De asemenea, presupune că utilizatorul are cunoștințe nutriționale pentru a identifica când o valoare pare greșită, ceea ce majoritatea utilizatorilor nu au.

Câte calorii pot adăuga erorile bazei de date la urmărirea mea zilnică?

Pentru un utilizator care consumă 2.000 de calorii pe zi și își urmărește toate mesele: la 15-30% eroare, eroarea zilnică de urmărire este de 300-600 de calorii. Pe parcursul unei săptămâni, aceasta înseamnă 2.100-4.200 de calorii necontabilizate. O liră de grăsime corporală conține aproximativ 3.500 de calorii (Hall et al., 2012, International Journal of Obesity). Erorile bazei de date pot explica diferența dintre pierderea unei livre pe săptămână și pierderea nimic.

Acoperă baza de date verificată Nutrola alimente internaționale?

Baza de date verificată Nutrola acoperă alimente din multiple baze de date naționale de compoziție alimentară și este extinsă continuu pentru a include alimente regionale și internaționale. Dacă un aliment nu se află în baza de date, sistemele de recunoaștere foto și vocală AI estimează valorile nutriționale pe baza alimentelor verificate similare și a evaluării vizuale a porțiilor, cu înregistrarea marcată pentru revizuirea verificării.

Ce ar trebui să caut atunci când aleg o aplicație de urmărire a caloriilor pe baza calității bazei de date?

Trei indicatori: (1) sursa de date — dezvăluie aplicația de unde provine datele sale nutriționale? Aplicațiile care folosesc USDA FoodData Central, NCCDB sau baze de date naționale echivalente sunt mai fiabile decât cele care se bazează exclusiv pe trimiteri de utilizatori. (2) Numărul de duplicate — caută un aliment comun, cum ar fi "banană", și numără rezultatele. Rezultatele mai puține cu valori calorice consistente indică o curare mai bună. (3) Procesul de verificare — are aplicația un mecanism pentru revizuirea și corectarea înregistrărilor, sau oricine poate adăuga orice valoare fără supraveghere?

Este o bază de date mai mică o problemă dacă alimentul meu nu este listat?

O bază de date mai mică, dar verificată, poate să nu conțină fiecare produs de marcă obscur. Compromisul este real, dar gestionabil. Nutrola abordează lacunele de acoperire prin recunoașterea foto AI (care poate estima conținutul nutrițional pentru alimentele care nu se află în baza de date prin analiză vizuală și comparație cu alimente similare), înregistrarea vocală (care analizează descrierile în limbaj natural în ingrediente componente) și scanarea codurilor de bare (care citește datele de la producători direct). Scopul este acuratețea verificată pentru fiecare înregistrare existentă, cu estimări inteligente pentru articolele care nu sunt încă în baza de date.


Referințe

  • Urban, L. E., Dallal, G. E., Robinson, L. M., Ausman, L. M., Saltzman, E., & Roberts, S. B. (2010). Acuratețea conținutului energetic declarat al alimentelor preparate comercial cu energie redusă. Journal of the American Dietetic Association, 110(1), 116-123.
  • Schubart, J. R., Stuckey, H. L., Ganeshamoorthy, A., & Sciamanna, C. N. (2011). Condiții cronice de sănătate și intervenții comportamentale pe internet. Journal of Diabetes Science and Technology, 5(3), 728-740.
  • Champagne, C. M., Bray, G. A., Kurtz, A. A., et al. (2002). Aportul de energie și cheltuielile energetice: un studiu controlat comparând dieteticienii și non-dieteticienii. Journal of the American Dietetic Association, 102(10), 1428-1432.
  • Hall, K. D., Heymsfield, S. B., Kemnitz, J. W., Klein, S., Schoeller, D. A., & Speakman, J. R. (2012). Echilibrul energetic și componentele sale: implicații pentru reglarea greutății corporale. International Journal of Obesity, 36(3), 431-439.
  • USDA Agricultural Research Service. (2024). FoodData Central. Departamentul Agriculturii din Statele Unite.
  • Food Standards Australia New Zealand. (2022). Baza de date de nutrienți AUSNUT 2011-13. FSANZ.
  • Nutrition Coordinating Center. (2024). Baza de date de alimente și nutrienți NCC. Universitatea din Minnesota.

Ești gata să îți transformi urmărirea nutriției?

Alătură-te celor mii care și-au transformat călătoria de sănătate cu Nutrola!