Краудсорсинговые и верифицированные базы данных продуктов: насколько точен ваш трекер калорий?

Насколько точны краудсорсинговые базы данных продуктов, такие как MyFitnessPal? Мы сравниваем уровень ошибок между краудсорсинговыми и верифицированными базами данных на основе реальных данных и исследований.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Ваш трекер калорий столь же точен, как и его база данных продуктов. Это утверждение может показаться очевидным, но большинство людей никогда не задумываются об этом. Они скачивают приложение, ищут "куриную грудку на гриле", нажимают на первый результат и предполагают, что цифры верны.

Если база данных краудсорсинговая — то есть обычные пользователи добавили эти записи без профессиональной проверки — данные, на которые вы полагаетесь для похудения, наращивания мышечной массы или управления состоянием здоровья, могут быть неверными на 15-30 процентов. Это не предположение. Это подтверждено исследованиями.

Исследование, проведенное Эвенепулом и др. (2020), опубликованное в журнале Nutrients, оценивало точность популярных приложений для трекинга питания и выявило значительные расхождения в значениях калорий и макронутриентов на краудсорсинговых платформах. Исследователи сравнили значения, указанные в приложениях, с взвешенными записями продуктов, проанализированными лабораторными методами, и обнаружили, что краудсорсинговые базы данных последовательно вводят значительные ошибки — ошибки, которые могут подорвать тщательно спланированную диету.

В этой статье мы подробно рассмотрим, как работают краудсорсинговые и верифицированные базы данных продуктов, что говорят исследования о их точности и почему это различие имеет большее значение, чем большинство людей осознает.

Как работают краудсорсинговые базы данных продуктов

Наиболее популярные приложения для трекинга калорий — включая MyFitnessPal — строят свои базы данных по модели краудсорсинга. Концепция проста: любой пользователь с аккаунтом может добавить запись о продукте. Другие пользователи затем ищут и фиксируют эти записи. База данных быстро растет, потому что миллионы пользователей вносят в нее свои данные.

Проблема в том, что нет никакого значимого уровня проверки. Когда пользователь добавляет запись о "Kirkland Signature Protein Bar", никто не проверяет, правильна ли калорийность, соответствует ли размер порции этикетке или была ли изменена формула продукта с момента создания записи. Запись становится доступной, и другие пользователи начинают ее фиксировать.

Это создает несколько системных проблем:

  • Дублирующиеся записи с противоречивыми данными. Поиск любого распространенного продукта приведет к множеству записей с разными значениями калорий и макронутриентов. Пользователи не имеют надежного способа узнать, какая из них верна.
  • Отсутствие указания источника. Большинство краудсорсинговых записей не ссылаются на источник данных о питательных веществах. Это может быть информация с этикетки продукта, предположение или неправильно запомненное число.
  • Устаревшие формулы. Производители продуктов регулярно изменяют рецептуры. Краудсорсинговые записи 2019 года могут отражать рецепт, который больше не существует.
  • Несогласованные размеры порций. Одна запись может указывать, что банан весит 100 граммов, другая — "1 средний", а третья — 118 граммов. Соответственно, значения калорий различаются, и пользователи не могут понять, какой стандарт использовался.

Эвенепул и др. (2020) специально отметили, что приложения, полагающиеся на контент, созданный пользователями, показывали более высокую изменчивость в сообщаемых значениях энергии по сравнению с приложениями, использующими кураторские, институциональные источники данных. Исследование пришло к выводу, что выбор базы данных напрямую влияет на надежность самоконтроля в питании.

Отдельный анализ, проведенный Гриффитсом и др. (2018), опубликованный в JMIR mHealth and uHealth, изучал точность популярных приложений для ведения пищевых дневников на смартфонах. Они обнаружили, что оценки калорий из краудсорсинговых баз данных отклонялись от эталонных значений в среднем на 15-25 процентов для распространенных продуктов. Для составных блюд и ресторанных позиций отклонения превышали 30 процентов в некоторых случаях.

Масштаб проблемы

Чтобы понять, как это проявляется на практике, рассмотрим несколько реальных примеров.

Проблема с бананом. Поиск "банан" в MyFitnessPal выдаст более дюжины записей. Одна указывает, что средний банан содержит 89 калорий. Другая — 105 калорий. Третья — 121 калорию. Эталонное значение USDA FoodData Central для среднего банана (118 граммов) составляет 105 калорий. Пользователь, выбравший неправильную запись, может ошибиться на 15-20 процентов по одному продукту — и эта ошибка накапливается за весь день.

Изменение брендов. Популярный граноловый батончик был реформулирован в 2024 году, снизив его калорийность с 190 до 170 калорий за батончик. Старая запись остается в краудсорсинговых базах данных наряду с новой. Пользователи, сканирующие штрих-код, могут получить либо ту, либо другую версию, в зависимости от того, какая запись будет показана первой.

Предположения о ресторанных блюдах. Записи о ресторанных блюдах, созданные пользователями, особенно ненадежны. Исследование, проведенное Урбаном и др. (2016), опубликованное в JAMA Internal Medicine, показало, что фактическое содержание калорий в ресторанных блюдах отличается от заявленных значений в среднем на 18 процентов, причем некоторые блюда содержали более 100 процентов калорий больше, чем указано. Когда пользователи затем добавляют эти уже неточные значения в краудсорсинговую базу данных — иногда округляя или оценивая дальше — накопление ошибок становится серьезным.

Международные пробелы в данных. Краудсорсинговые базы данных сильно смещены в сторону рынков США и Великобритании. Пользователи в Германии, Японии, Бразилии или Индии часто обнаруживают, что их местные продукты либо полностью отсутствуют, либо представлены записями, добавленными одним пользователем без проверки.

Исследование, опубликованное Тейшейрой и др. (2021) в European Journal of Clinical Nutrition, подтвердило эти выводы, показав, что пользователи приложений для питания в странах, где не говорят на английском, сталкиваются с значительно более высокими уровнями неточности в ведении записей из-за ограниченного и ненадежного охвата баз данных.

Как работают верифицированные базы данных

Верифицированные базы данных продуктов используют совершенно другой подход. Вместо того чтобы полагаться на пользовательские записи, они получают данные о питательных веществах из авторитетных, лабораторно проверенных источников и применяют профессиональную кураторскую работу, прежде чем любая запись станет доступной пользователям.

Золотыми стандартами являются:

  • USDA FoodData Central — обширная база данных Министерства сельского хозяйства США, содержащая лабораторно проанализированные данные о питательных веществах для тысяч продуктов.
  • NCCDB (Nutrition Coordinating Center Food and Nutrient Database) — поддерживаемая Университетом Миннесоты, используемая в клинических исследованиях за свою высокую точность и полноту.
  • Национальные базы данных о составе продуктов — поддерживаемые государственными учреждениями в таких странах, как Германия (BLS), Япония (MEXT), Великобритания (McCance и Widdowson) и Австралия (AUSNUT).

Верифицированные базы данных сопоставляют записи с несколькими источниками. Если USDA утверждает, что большое яйцо содержит 72 калории, а этикетка производителя указывает 70, верифицированная база данных исследует расхождение, а не принимает одно из значений на веру. Записи включают полные профили питательных веществ — не только калории и макронутриенты, но и витамины, минералы, аминокислоты и жирные кислоты.

Обновления происходят по установленному графику. Когда продукт реформулируется, верифицированные базы данных помечают старую запись и заменяют ее актуальными данными. Это требует выделенных сотрудников и систематического мониторинга, поэтому большинство бесплатных приложений этого не делают.

Сравнение точности баз данных

В следующей таблице сравниваются три подхода к управлению базами данных продуктов по наиболее важным метрикам для отслеживания точности.

Метрика MyFitnessPal (краудсорсинг) Cronometer (USDA / NCCDB) Nutrola (верифицированная + глобальная)
Основной источник данных Записи пользователей USDA FoodData Central, NCCDB Государственные базы данных, данные производителей, лабораторный анализ из более чем 50 стран
Метод проверки Нет (сообщество отмечает) Профессиональная кураторская работа институциональных источников Многоисточниковое сопоставление с автоматизированным и ручным обзором
Оценочный уровень ошибок 15-30% для распространенных продуктов (Гриффитс и др., 2018) 5-10% (ограничено пробелами в покрытии USDA/NCCDB) Менее 5% для всех типов записей
Количество записей о продуктах 14+ миллионов (включая дубликаты) 1+ миллион кураторских записей 2+ миллиона верифицированных записей
Питательные вещества на запись Обычно 5-15 (в зависимости от пользователя) 80+ для записей, полученных из NCCDB 100+ на запись
Частота обновлений Нерегулярно, зависит от пользователей Соответствует циклам выпуска USDA Непрерывный мониторинг и обновления
Глобальное покрытие продуктов Умеренное (сильный акцент на США/Великобритании) Ограниченное (преимущественно Северная Америка) Обширное (более 50 стран, включая местные бренды)
Дублирующиеся записи Широко распространены Минимальные Нет (одна верифицированная запись на продукт)

Ключевой вывод из этого сравнения: количество сырых записей не является полезной мерой качества базы данных. 14 миллионов записей MyFitnessPal включают значительное количество дублирующих и непроверенных данных. Меньшая, полностью верифицированная база данных обеспечивает лучшую реальную точность, чем большая непроверенная.

Почему ошибка в 15% важна для похудения

Ошибка базы данных в 15 процентов может показаться незначительной. Но это не так. Вот математика.

Предположим, вы умеренно активный человек с общим суточным расходом энергии (TDEE) 2200 калорий. Чтобы потерять примерно полкилограмма в неделю, вам нужен суточный дефицит около 500 калорий, что означает, что вы должны потреблять около 1700 калорий в день.

Теперь предположим, что вы тщательно отслеживаете, фиксируя каждую еду, и ваш трекер сообщает, что вы потребили 1700 калорий. Но ваша база данных имеет уровень ошибок 15 процентов, занижающий значения — это означает, что фактическое содержание калорий в продуктах, которые вы зафиксировали, на 15 процентов выше, чем то, что указал приложение.

Ваш фактический прием: 1700 x 1.15 = 1955 калорий.

Ваш фактический дефицит: 2200 - 1955 = 245 калорий — примерно половина от того, что вы планировали.

При таком раскладе ваша ожидаемая потеря в полкилограмма в неделю становится менее четверти килограмма в неделю. За месяц вы теряете около 1 килограмма вместо 2 килограммов, которые планировали. После двух месяцев дисциплинированного отслеживания без видимых результатов большинство людей приходят к выводу, что подсчет калорий не работает, и сдаются.

Проблема никогда не заключалась в их дисциплине. Это была их база данных.

Исследование 2019 года, проведенное Симпсоном и др., опубликованное в Journal of the Academy of Nutrition and Dietetics, показало, что участники, использующие приложения для трекинга питания, потребляли в среднем на 200-400 калорий больше в день, чем сообщали их приложения. Исследователи выявили неточности в базе данных как основную причину, наряду с ошибками в оценке порций.

При уровне ошибок 25-30 процентов — который Гриффитс и др. задокументировали для составных блюд — цифры становятся еще хуже. Человек, нацеленный на 1700 калорий, может фактически потреблять более 2100 калорий, полностью стирая свой дефицит и потенциально вызывая увеличение веса, несмотря на то, что он считает себя в дефиците калорий.

Подход Nutrola: 100% верифицированные данные, глобальное покрытие

В Nutrola мы с самого начала приняли осознанное решение: в нашу базу данных не попадет ни одна непроверенная информация. Каждая запись о продукте прослеживается до авторитетного источника, сопоставляется на точность и регулярно проверяется на актуальность.

Вот что это значит на практике:

Многоисточниковая верификация. Каждая запись в базе данных Nutrola проверяется по крайней мере по двум независимым источникам. Для общих продуктов, таких как фрукты, овощи, злаки и белки, мы ссылаемся на государственные базы данных о составе продуктов из соответствующей страны. Для брендированных продуктов мы проверяем данные о питательных веществах, предоставленные производителями, и этикетки продуктов. Когда источники конфликтуют, наша команда по данным о питательных веществах исследует и разрешает расхождение, прежде чем запись станет доступной.

Глобальное покрытие с первого дня. В отличие от баз данных, которые в основном строятся на данных из США и затем расширяются, Nutrola интегрирует данные о составе продуктов из более чем 50 стран. Если вы отслеживаете японские рисовые крекеры, немецкий ржаной хлеб, бразильские боулы акай или индийский дал, Nutrola имеет верифицированные записи, полученные от соответствующего национального продовольственного органа — а не предположения пользователей.

100+ питательных веществ на запись. Большинство краудсорсинговых записей включают только калории, белки, углеводы и жиры. Записи Nutrola содержат полный профиль питательных веществ: все витамины, ключевые минералы, подтипы пищевых волокон, профили аминокислот, разбивку жирных кислот и многое другое. Этот уровень детализации необходим для пользователей, которым нужно контролировать потребление микронутриентов, управлять медицинскими состояниями или оптимизировать спортивные результаты.

Непрерывный мониторинг актуальности. Системы Nutrola постоянно отслеживают изменения в рецептурах продуктов, изменения на этикетках и обновления баз данных от институциональных источников. Когда производитель изменяет рецепт продукта, Nutrola помечает старую запись, проверяет новые данные и обновляет базу данных — часто в течение нескольких дней, а не месяцев или лет.

Никаких дубликатов. Каждый продукт в Nutrola имеет одну верифицированную запись. Нет неопределенности относительно того, какой "банан" выбрать. Правильная запись — единственная запись.

Этот подход требует значительно больших инвестиций, чем краудсорсинг. Но результат — это база данных, которой пользователи могут доверять — такая, где цифры, которые они видят, действительно отражают еду, которую они съели.

Часто задаваемые вопросы

Насколько точны краудсорсинговые базы данных продуктов, такие как MyFitnessPal?

Исследования Гриффитса и др. (2018) и Эвенепула и др. (2020) показали, что краудсорсинговые базы данных продуктов имеют уровень ошибок от 15 до 30 процентов для распространенных продуктов, с более высокими уровнями ошибок для ресторанных блюд и составных блюд. Nutrola полностью избегает этих проблем, используя 100% верифицированную базу данных, где каждая запись проверяется по авторитетным источникам перед тем, как стать доступной для пользователей.

В чем разница между краудсорсинговой и верифицированной базой данных продуктов?

Краудсорсинговая база данных позволяет любому пользователю добавлять записи о питательных веществах без профессиональной проверки, что приводит к дублированию, устаревшим данным и ошибкам. Верифицированная база данных получает данные о питательных веществах из лабораторно проанализированных источников, таких как USDA FoodData Central и национальные таблицы о составе продуктов, а затем применяет профессиональную кураторскую работу перед публикацией. Nutrola использует модель верифицированной базы данных с многоисточниковым сопоставлением в более чем 50 странах, обеспечивая точность и полноту каждой записи.

Почему мой трекер калорий показывает разные калории для одного и того же продукта?

Это происходит потому, что краудсорсинговые базы данных содержат несколько непроверенных записей для одного и того же продукта, каждая из которых была добавлена разными пользователями с потенциально разными источниками или предположениями. В результате возникают противоречивые значения калорий, и нет способа определить, какое из них верно. Nutrola устраняет эту проблему, поддерживая единую верифицированную запись на продукт, так что никогда нет неопределенности относительно того, какому значению доверять.

Могут ли ошибки в базе данных продуктов действительно затормозить мою потерю веса?

Да. Ошибка базы данных в 15 процентов при целевом показателе в 1700 калорий означает, что ваш фактический прием ближе к 1955 калориям — что почти вдвое сокращает ваш запланированный дефицит в 500 калорий. Исследование Симпсона и др. (2019) показало, что пользователи приложений для трекинга потребляли на 200-400 калорий больше в день, чем сообщали их приложения, при этом неточности в базе данных были определены как основная причина. Верифицированная база данных Nutrola поддерживает уровень ошибок ниже 5 процентов, что дает пользователям уверенность в том, что их зафиксированный прием отражает реальность.

Какой трекер калорий имеет самую точную базу данных продуктов?

Точность базы данных зависит от метода верификации, а не от количества записей. Краудсорсинговые базы данных, такие как MyFitnessPal, имеют миллионы записей, но высокий уровень ошибок. Клинически кураторские базы данных, такие как Cronometer, точны, но ограничены в глобальном охвате. Nutrola сочетает строгость верифицированных, лабораторно полученных данных с охватом более 50 стран и более 2 миллионов записей — каждая из которых содержит более 100 питательных веществ — что делает ее самым точным вариантом для пользователей по всему миру.

Использует ли Nutrola краудсорсинговую базу данных?

Нет. Nutrola не принимает непроверенные пользовательские записи в свою базу данных продуктов. Каждая запись в Nutrola получает данные из государственных баз данных о составе продуктов, проверенных данных производителей или лабораторного анализа. Каждая запись проходит многоисточниковое сопоставление и профессиональный обзор перед публикацией. Этот верифицированный подход — причина, по которой Nutrola поддерживает уровень ошибок ниже 5 процентов по всем категориям продуктов, в отличие от 15-30 процентов, задокументированных в краудсорсинговых альтернативных базах данных.

Готовы трансформировать отслеживание питания?

Присоединяйтесь к тысячам тех, кто изменил свой путь к здоровью с Nutrola!