Краудсорсингові vs. Верифіковані бази даних продуктів: Наскільки точний ваш трекер калорій?

Наскільки точні краудсорсингові бази даних продуктів, такі як MyFitnessPal? Ми порівнюємо рівні помилок між краудсорсинговими та верифікованими базами даних на основі реальних даних та досліджень.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Ваш трекер калорій настільки ж точний, наскільки точна його база даних продуктів. Це може звучати очевидно, але більшість людей ніколи про це не задумуються. Вони завантажують додаток, шукають "грильована куряча грудинка", натискають на перший результат і вважають, що цифра правильна.

Якщо ця база даних є краудсорсинговою — тобто звичайні користувачі надсилали ці записи без професійної перевірки — дані, на які ви покладаєтеся, щоб схуднути, наростити м'язи або контролювати стан здоров'я, можуть бути помилковими на 15-30 відсотків. Це не припущення. Це підтверджують дослідження.

Дослідження, проведене Evenepoel та ін. (2020), опубліковане в журналі Nutrients, оцінило точність популярних додатків для трекінгу харчування і виявило значні розбіжності в значеннях калорій та макронутрієнтів на краудсорсингових платформах. Дослідники порівняли значення, які повідомляли додатки, з важеними записами продуктів, проаналізованими лабораторними методами, і виявили, що краудсорсингові бази даних постійно вводять суттєві помилки — помилки, які можуть зруйнувати ретельно сплановану дієту.

Ця стаття розгляне, як насправді працюють краудсорсингові та верифіковані бази даних продуктів, що говорить дослідження про їх точність і чому ця різниця важлива більше, ніж більшість людей усвідомлює.

Як працюють краудсорсингові бази даних продуктів

Найбільш популярні додатки для трекінгу калорій — включаючи MyFitnessPal — створили свої бази даних за допомогою моделі краудсорсингу. Концепція проста: будь-хто з обліковим записом може надіслати запис про продукт. Інші користувачі потім шукають і реєструють ці записи. База даних швидко зростає, оскільки мільйони користувачів вносять свій внесок.

Проблема в тому, що немає жодного значимого рівня перевірки. Коли користувач надсилає запис для "Kirkland Signature Protein Bar", ніхто не перевіряє, чи правильна кількість калорій, чи відповідає розмір порції етикетці, чи була змінена формула продукту з моменту створення запису. Запис стає доступним, і інші користувачі починають його реєструвати.

Це створює кілька системних проблем:

  • Дублікати записів з суперечливими даними. Пошукайте будь-який звичайний продукт, і ви знайдете кілька записів з різними значеннями калорій та макронутрієнтів. Користувачі не мають надійного способу дізнатися, який з них правильний.
  • Відсутність атрибуції джерела. Більшість краудсорсингових записів не вказують, звідки взято дані про харчування. Це можуть бути дані з етикетки продукту, припущення або неправильно згадане число.
  • Застарілі формули. Виробники продуктів регулярно змінюють формули. Краудсорсингові записи з 2019 року можуть відображати рецепт, якого більше не існує.
  • Непослідовні розміри порцій. Один запис може вказувати банан як 100 грамів, інший — як "1 середній", а третій — як 118 грамів. Відповідно, значення калорій відрізняються, і користувачі не можуть визначити, який стандарт був використаний.

Evenepoel та ін. (2020) спеціально зазначили, що додатки, які покладаються на контент, створений користувачами, показували вищу варіабельність у повідомлених значеннях енергії в порівнянні з додатками, які використовують кураторські, інституційні джерела даних. Дослідження дійшло висновку, що вибір бази даних безпосередньо впливає на надійність самостійного моніторингу харчування.

Окремий аналіз Griffiths та ін. (2018), опублікований у JMIR mHealth and uHealth, вивчав точність популярних додатків для ведення щоденників харчування на смартфонах. Вони виявили, що оцінки калорій з краудсорсингових баз даних відхилялися від референтних значень в середньому на 15-25 відсотків для звичайних продуктів. Для складних страв і ресторанних позицій відхилення перевищували 30 відсотків у деяких випадках.

Масштаб проблеми

Щоб зрозуміти, як це проявляється на практиці, розгляньте кілька реальних прикладів.

Проблема з бананами. Пошукайте "банан" у MyFitnessPal, і ви знайдете понад десяток записів. Один вказує на середній банан з 89 калоріями. Інший — з 105 калоріями. Третій — з 121 калорією. Референтне значення USDA FoodData Central для середнього банана (118 грамів) становить 105 калорій. Користувач, який вибере неправильний запис, може помилитися на 15-20 відсотків лише для одного продукту — і ця помилка накопичується протягом усього дня реєстрації.

Відхилення брендових продуктів. Популярний граноловий батончик був реформульований у 2024 році, зменшивши його калорійність з 190 до 170 на батончик. Старий запис залишається в краудсорсингових базах даних поряд з новим. Користувачі, які сканують штрих-код, можуть отримати будь-яку версію, залежно від того, який запис система відобразить першою.

Приблизні дані про ресторанні страви. Краудсорсингові записи про ресторанні страви особливо ненадійні. Дослідження Urban та ін. (2016), опубліковане в JAMA Internal Medicine, виявило, що фактичний вміст калорій у ресторанних стравах відрізнявся від заявлених значень в середньому на 18 відсотків, причому деякі страви містили на 100 відсотків більше калорій, ніж було вказано. Коли користувачі потім вносять ці вже неточні значення в краудсорсингову базу даних — іноді округлюючи або оцінюючи далі — накопичення помилок стає серйозним.

Міжнародні прогалини в даних. Краудсорсингові бази даних сильно орієнтовані на ринки США та Великої Британії. Користувачі в Німеччині, Японії, Бразилії або Індії часто виявляють, що їхні місцеві продукти або зовсім відсутні, або представлені записами, надісланими одним користувачем без перевірки.

Дослідження, опубліковане Teixeira та ін. (2021) в European Journal of Clinical Nutrition, підтвердило ці висновки, показавши, що користувачі додатків харчування в країнах, де не говорять англійською, стикалися з набагато вищими показниками неточності реєстрації через обмежене та ненадійне покриття бази даних.

Як працюють верифіковані бази даних

Верифіковані бази даних продуктів використовують принципово інший підхід. Замість того, щоб покладатися на надходження даних від користувачів, вони отримують інформацію про харчування з авторитетних, лабораторно перевірених джерел і застосовують професійну кураторську перевірку перед тим, як будь-який запис стане доступним для користувачів.

Золотими стандартами є:

  • USDA FoodData Central — всебічна база даних Міністерства сільського господарства США, що містить лабораторно проаналізовані дані про харчування тисяч продуктів.
  • NCCDB (База даних харчування Координаційного центру) — підтримується Університетом Міннесоти, використовується в клінічних дослідженнях за її високу точність і повноту.
  • Національні бази даних складу продуктів — підтримуються державними агентствами в таких країнах, як Німеччина (BLS), Японія (MEXT), Великобританія (McCance і Widdowson's) та Австралія (AUSNUT).

Верифіковані бази даних перехресно перевіряють записи з кількох джерел. Якщо USDA стверджує, що велике яйце містить 72 калорії, а етикетка виробника вказує 70, верифікована база даних досліджує цю розбіжність, а не приймає будь-яке значення на віру. Записи включають повні профілі нутрієнтів — не лише калорії та макроси, а й вітаміни, мінерали, амінокислоти та жирні кислоти.

Оновлення відбуваються за визначеним графіком. Коли продукт реформулюється, верифіковані бази даних помічають старий запис і замінюють його актуальними даними. Це вимагає залучення спеціалізованого персоналу та систематичного моніторингу, тому більшість безкоштовних додатків цього не роблять.

Порівняння точності бази даних

Наступна таблиця порівнює три підходи до управління базами даних продуктів за метриками, які мають найбільше значення для точності трекінгу.

Метрика MyFitnessPal (Краудсорсинг) Cronometer (USDA / NCCDB) Nutrola (Верифікована + Глобальна)
Основне джерело даних Надходження від користувачів USDA FoodData Central, NCCDB Державні бази даних, дані виробників, лабораторний аналіз з 50+ країн
Метод перевірки Відсутній (спільне позначення) Професійна кураторська перевірка інституційних джерел Перехресна перевірка з кількох джерел з автоматизованим та ручним оглядом
Оцінюваний рівень помилок 15-30% для звичайних продуктів (Griffiths et al., 2018) 5-10% (обмежено прогалинами покриття USDA/NCCDB) Менше 5% для всіх типів записів
Кількість записів продуктів 14+ мільйонів (включаючи дублікати) 1+ мільйонів кураторських записів 2+ мільйонів верифікованих записів
Нутрієнти на запис Зазвичай 5-15 (залежно від користувача) 80+ для записів, отриманих з NCCDB 100+ на запис
Частота оновлень Нерегулярна, залежить від користувачів Відповідає циклам випуску USDA Безперервний моніторинг та оновлення
Глобальне покриття продуктів Середнє (орієнтоване на США/Велику Британію) Обмежене (переважно Північна Америка) Широке (50+ країн, включаючи місцеві бренди)
Дублікати записів Широко поширені Мінімальні Відсутні (один верифікований запис на продукт)

Головний висновок з цього порівняння: кількість сирих записів не є корисним показником якості бази даних. 14 мільйонів записів MyFitnessPal включають величезну кількість дублікатів і невірних даних. Менша, повністю верифікована база даних забезпечує кращу реальну точність, ніж більша невірна.

Чому 15% помилка важлива для схуднення

15-відсоткова помилка в базі даних може здаватися незначною. Але це не так. Ось математика.

Припустимо, ви помірно активна людина з загальним добовим енергетичним витратом (TDEE) 2200 калорій. Щоб втратити приблизно півкілограма на тиждень, вам потрібно щоденне дефіцит близько 500 калорій, тобто ви повинні споживати близько 1700 калорій на день.

Тепер уявіть, що ви ретельно трекуєте, реєструючи кожен прийом їжі, і ваш трекер говорить вам, що ви спожили 1700 калорій. Але ваша база даних має 15-відсотковий рівень помилок, занижуючи значення — це означає, що фактичний вміст калорій продуктів, які ви зареєстрували, на 15 відсотків вищий, ніж те, що повідомив додаток.

Ваше фактичне споживання: 1700 x 1.15 = 1955 калорій.

Ваш фактичний дефіцит: 2200 - 1955 = 245 калорій — приблизно половина того, що ви планували.

При такому темпі ваше очікуване схуднення на півкілограма на тиждень перетворюється на менше ніж чверть кілограма на тиждень. Протягом місяця ви втрачаєте близько 1 кілограма замість запланованих 2 кілограмів. Після двох місяців дисциплінованого трекінгу без видимих результатів більшість людей приходять до висновку, що підрахунок калорій не працює, і здаються.

Проблема ніколи не полягала в їхній дисципліні. Це була їхня база даних.

Дослідження 2019 року, проведене Simpson та ін., опубліковане в Journal of the Academy of Nutrition and Dietetics, виявило, що учасники, які використовували додатки для трекінгу харчування, споживали в середньому на 200-400 калорій більше на день, ніж повідомляли їхні додатки. Дослідники визначили неточності бази даних як основний фактор, поряд з помилками в оцінці порцій.

При 25-30 відсотковому рівні помилок — які задокументували Griffiths та ін. для складних страв — ситуація погіршується. Людина, яка намагається досягти 1700 калорій, може насправді споживати понад 2100 калорій, повністю стираючи свій дефіцит і потенційно викликаючи набір ваги, незважаючи на те, що вважає, що вона в дефіциті калорій.

Підхід Nutrola: 100% верифіковано, всесвітнє покриття

У Nutrola ми з самого початку прийняли свідоме рішення: жодні невірогідні дані не потрапляють до нашої бази даних. Кожен запис про продукт можна відстежити до авторитетного джерела, перехресно перевірити на точність і регулярно перевіряти на актуальність.

Ось що це означає на практиці:

Перевірка з кількох джерел. Кожен запис у базі даних Nutrola перевіряється принаймні з двома незалежними джерелами. Для загальних продуктів, таких як фрукти, овочі, злаки та білки, ми посилаємося на державні бази даних складу продуктів з відповідної країни. Для брендових продуктів ми перевіряємо дані про харчування, надані виробниками, та етикетки продуктів. Коли джерела суперечать, наша команда з харчування досліджує та вирішує розбіжність перед публікацією запису.

Глобальне покриття з самого початку. На відміну від баз даних, які в основному створюються на основі даних США, а потім розширюються, Nutrola інтегрує дані складу продуктів з понад 50 країн. Якщо ви трекуєте японські рисові крекери, німецький житній хліб, бразильські боули з асаї або індійський дал, Nutrola має верифіковані записи, отримані з відповідного національного харчового органу — а не здогадок користувачів.

100+ нутрієнтів на запис. Більшість краудсорсингових записів містять лише калорії, білки, вуглеводи та жири. Записи Nutrola включають повний профіль нутрієнтів: всі вітаміни, ключові мінерали, підтипи дієтичного волокна, профілі амінокислот, розподіл жирних кислот тощо. Цей рівень деталізації є важливим для користувачів, які потребують моніторингу споживання мікронутрієнтів, управління медичними станами або оптимізації спортивних результатів.

Безперервний моніторинг актуальності. Системи Nutrola постійно моніторять зміни формул продуктів, зміни етикеток та оновлення бази даних з інституційних джерел. Коли виробник продукту змінює рецепт, Nutrola позначає старий запис, перевіряє нові дані та оновлює базу даних — часто протягом кількох днів, а не місяців або років.

Відсутність дублікатів. У Nutrola кожен продукт має один верифікований запис. Немає жодної неоднозначності щодо того, який "банан" вибрати. Правильний запис — це єдиний запис.

Цей підхід вимагає значно більших інвестицій, ніж краудсорсинг. Але результатом є база даних, якій користувачі можуть довіряти — де цифри, які вони бачать, насправді відображають їжу, яку вони споживали.

Часто задавані питання

Наскільки точні краудсорсингові бази даних продуктів, такі як MyFitnessPal?

Дослідження Griffiths та ін. (2018) і Evenepoel та ін. (2020) показали, що краудсорсингові бази даних продуктів мають рівень помилок від 15 до 30 відсотків для звичайних продуктів, з вищими рівнями помилок для ресторанних страв і складних страв. Nutrola повністю уникає цих проблем, використовуючи базу даних, що складається на 100% з верифікованих записів, де кожен запис перехресно перевіряється з авторитетними джерелами перед тим, як стати доступним для користувачів.

У чому різниця між краудсорсинговою та верифікованою базою даних продуктів?

Краудсорсингова база даних дозволяє будь-якому користувачеві надсилати записи про харчування без професійної перевірки, що призводить до дублікатів, застарілих даних і помилок. Верифікована база даних отримує дані про харчування з лабораторно проаналізованих джерел, таких як USDA FoodData Central і національні таблиці складу продуктів, а потім застосовує професійну кураторську перевірку перед публікацією. Nutrola використовує модель верифікованої бази даних з перехресною перевіркою з кількох джерел у понад 50 країнах, що забезпечує точність і повноту кожного запису.

Чому мій трекер калорій показує різні калорії для одного й того ж продукту?

Це відбувається тому, що краудсорсингові бази даних містять кілька невірогідних записів для одного й того ж продукту, кожен з яких надісланий різними користувачами з потенційно різними джерелами або припущеннями. В результаті виникають суперечливі значення калорій, і немає способу визначити, яке з них правильне. Nutrola усуває цю проблему, підтримуючи один верифікований запис на продукт, тому немає жодної неоднозначності щодо того, яке значення довіряти.

Чи можуть помилки в базі даних дійсно уповільнити моє схуднення?

Так. 15-відсоткова помилка в базі даних при щоденній цілі в 1700 калорій означає, що ваше фактичне споживання ближче до 1955 калорій — зменшуючи ваш запланований дефіцит калорій майже вдвічі. Дослідження Simpson та ін. (2019) виявило, що користувачі додатків для трекінгу споживали на 200-400 калорій більше на день, ніж повідомляли їхні додатки, причому неточності бази даних були визначені як основна причина. Верифікована база даних Nutrola підтримує рівень помилок нижче 5 відсотків, що дає користувачам впевненість у тому, що їхнє зареєстроване споживання відображає реальність.

Який трекер калорій має найточнішу базу даних продуктів?

Точність бази даних залежить від методу перевірки, а не від кількості записів. Краудсорсингові бази даних, такі як MyFitnessPal, мають мільйони записів, але високі рівні помилок. Клінічно кураторські бази даних, такі як Cronometer, точні, але обмежені в глобальному покритті. Nutrola поєднує строгість верифікованих, лабораторно отриманих даних з покриттям, що охоплює понад 50 країн і 2+ мільйони записів — кожен з яких містить понад 100 нутрієнтів — що робить її найточнішим варіантом для користувачів у всьому світі.

Чи використовує Nutrola краудсорсингову базу даних?

Ні. Nutrola не приймає невірогідні надходження від користувачів до своєї бази даних продуктів. Кожен запис у Nutrola отримується з державних баз даних складу продуктів, перевірених даних виробників або лабораторного аналізу. Кожен запис проходить через перехресну перевірку з кількох джерел і професійний огляд перед публікацією. Цей верифікований підхід є причиною того, що Nutrola підтримує рівень помилок нижче 5 відсотків для всіх категорій продуктів, у порівнянні з 15-30 відсотковими рівнями помилок, задокументованими в краудсорсингових альтернативних варіантах.

Готові трансформувати своє відстеження харчування?

Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!