Порівняння відкритих наборів даних про харчування: USDA, Open Food Facts, Nutrola та FatSecret
Детальне порівняння основних наборів даних про харчування, включаючи USDA FoodData Central, Open Food Facts, Nutrola та FatSecret. Охоплює якість даних, охоплення, частоту оновлення, доступ до API, ліцензування та те, який набір даних найкращий для вашого випадку використання.
Кожен додаток для харчування, дослідження в галузі дієтології та продукт харчових технологій базується на базі даних складу продуктів. Якість, охоплення та доступність цієї бази визначають, наскільки точним буде кінцевий продукт. Проте більшість користувачів, а також багато розробників ніколи не перевіряють, що стоїть за підрахунками калорій на їхніх екранах. Різні бази даних мають свої сильні та слабкі сторони, різні цикли оновлення та умови ліцензування, які впливають на те, як і де їх можна використовувати.
У цій статті ми детально порівнюємо чотири найбільш використовувані набори даних про харчування: USDA FoodData Central, Open Food Facts, Nutrola та FatSecret. Ми оцінюємо кожен з них за такими критеріями, як охоплення, якість даних, частота оновлення, доступність, ліцензування та придатність для різних випадків використання. Незалежно від того, чи ви розробник, який обирає джерело даних, дослідник, що вибирає стандарт для посилань, чи просто допитливий користувач, який хоче знати, звідки беруться підрахунки калорій у вашому додатку, цей посібник допоможе вам зробити обґрунтований вибір.
Порівняння в одному погляді
| Особливість | USDA FoodData Central | Open Food Facts | Nutrola | FatSecret |
|---|---|---|---|---|
| Загальна кількість продуктів | 370,000+ | 3,000,000+ | 900,000+ | 500,000+ |
| Основний тип даних | Посилання + брендові | Упаковані продукти | Звичайні + брендові + ресторанні | Звичайні + брендові |
| Географічний фокус | Сполучені Штати | Глобальний (з акцентом на ЄС) | Глобальний (50+ країн) | Глобальний (з акцентом на США) |
| Нутрієнти на запис | До 150 | Змінні (5-40) | 30+ стандартних | 15-25 |
| Частота оновлення | Щоквартально (основні), безперервно (брендові) | Безперервно (краудсорсинг) | Щомісяця (основні), щоденно (окремі) | Безперервно |
| Метод збору даних | Лабораторний аналіз + виробник | Краудсорсинг (сканування користувачами) | Перевірка з кількох джерел | Багатоджерельний + спільнота |
| Доступ до API | Так (безкоштовно) | Так (безкоштовно) | Так (безкоштовний рівень + платний) | Так (безкоштовно з атрибуцією) |
| Масове завантаження | Так | Так | Платний рівень | Ні |
| Ліцензія | Публічна власність | Ліцензія відкритих баз даних (ODbL) | Приватна (доступ до API) | Приватна (доступ до API) |
| Дані про штрих-коди/UPC | Так (брендований підмножина) | Так (основна увага) | Так | Так |
| Ресторанні страви | Обмежені | Ні | Так (широкі) | Так (помірні) |
| Рецепти/композитні страви | Так (Опитування/FNDDS) | Обмежені | Так | Так |
USDA FoodData Central
Огляд
USDA FoodData Central (FDC) — це всебічна база даних складу продуктів Міністерства сільського господарства США. Вона є авторитетним джерелом харчових даних у Сполучених Штатах і слугує стандартом для перевірки інших баз даних. FDC була запущена в 2019 році як єдина платформа, яка об'єднала кілька раніше окремих баз даних USDA.
Компоненти бази даних
FDC насправді містить п'ять різних наборів даних, кожен з яких має свої цілі та методології:
Foundation Foods: Приблизно 2,300 мінімально оброблених продуктів, проаналізованих за сучасними аналітичними методами в рамках Національної програми аналізу харчових продуктів і поживних речовин (NFNAP). Ці записи мають найвищу якість даних, значення отримані з безпосереднього лабораторного аналізу кількох зразків. Кожен запис включає середні значення, стандартні відхилення та розміри зразків для значень нутрієнтів.
SR Legacy (Спадщина стандартних посилань): Останнє видання історичної бази даних стандартних посилань USDA, що містить приблизно 7,800 записів про продукти. SR Legacy надає значення нутрієнтів, які цитуються в дослідженнях протягом десятиліть. Хоча більше не оновлюється, вона залишається критично важливим посиланням.
Survey Foods (FNDDS): База даних продуктів і поживних речовин для дієтичних досліджень містить приблизно 7,000 продуктів, які відображають те, що американці насправді споживають у Національному обстеженні здоров'я та харчування (NHANES). Ці записи включають композитні та змішані страви з профілями нутрієнтів, отриманими з рецептів. FNDDS є безцінним для аналізу дієти на рівні населення.
Experimental Foods: Менша колекція продуктів, проаналізованих для конкретних дослідницьких цілей, таких як нові культури або експериментальні харчові формули.
Branded Foods: Понад 350,000 записів, отриманих з бази даних глобальних брендових продуктів USDA (GFBD), яка збирає дані з етикеток харчових продуктів, наданих виробниками. Це найбільший компонент за кількістю записів, але має найбільш змінну якість даних, оскільки залежить від точності та повноти виробників.
Якість даних
Компонент Foundation Foods представляє золотий стандарт у даних про склад продуктів. Значення нутрієнтів визначаються за допомогою аналізу вологого хімічного складу (К'єльдаля для білка, кислотного гідролізу для жиру, бомбового калориметрії для енергії) на кількох зразках, отриманих з різних місць і сезонів. Аналітичні методи відповідають протоколам AOAC International, а дані проходять багаторівневу перевірку якості.
Якість даних SR Legacy також висока, але відображає старі аналітичні методи та протоколи відбору зразків у деяких записах. Деякі записи датуються десятиліттями, і хоча значення нутрієнтів були точними на момент аналізу, склад продуктів може змінюватися з часом через зміни в сільськогосподарських практиках, тваринництві та обробці продуктів.
Якість даних Branded Foods є більш змінною. Значення нутрієнтів отримуються з етикеток харчових продуктів, наданих виробниками, які, згідно з нормами FDA, можуть мати певні відхилення. Наприклад, FDA дозволяє, щоб вказані калорії були на 20 відсотків вищими за фактичні значення, а вітаміни та мінерали можуть бути присутніми на 80 відсотків або більше від вказаних значень. Це означає, що записи про брендові продукти можуть відрізнятися від значень, отриманих у лабораторії.
Глибина нутрієнтів
USDA FDC надає найглибше охоплення нутрієнтів серед усіх публічних баз даних. Записи Foundation Foods можуть включати до 150 окремих нутрієнтів і компонентів їжі, включаючи всі макронутрієнти, окремі амінокислоти, окремі жирні кислоти (насичені, мононенасичені, поліненасичені, транс), вітаміни, мінерали, каротиноїди, флавоноїди та інші біоактивні сполуки. Жодна інша база даних не наближається до такого рівня деталізації для аналітичних продуктів.
Доступ та ліцензування
Дані FDC є публічною власністю (без обмежень авторських прав). Вони доступні через:
- Веб-інтерфейс: fdc.nal.usda.gov для ручних пошуків
- API: api.nal.usda.gov з безкоштовною реєстрацією API ключа (1,000 запитів на годину)
- Масове завантаження: Завантаження CSV та JSON файлів повної бази даних, оновлюється щоквартально
Статус публічної власності означає, що будь-хто може використовувати дані USDA для будь-яких цілей, комерційних або некомерційних, без вимог до атрибуції (хоча атрибуція є хорошою практикою).
Обмеження
- Сфокусованість на США: База даних в основному охоплює продукти, доступні на ринку США. Міжнародні страви, регіональні продукти та їжа з неамериканських систем харчування представлені недостатньо.
- Відсутність даних про ресторани: FDC не включає специфічні меню ресторанів. Бургер Chipotle не є тим самим, що й загальний бургер, але FDC має лише загальну версію.
- Затримка оновлення: Foundation Foods оновлюються рідко (деякі записи не були повторно проаналізовані більше десяти років). Оновлення даних про брендові продукти залежать від подачі виробників.
- Відсутність зображень: FDC не включає фотографії продуктів, що робить її непридатною як самостійний ресурс для навчання візуального розпізнавання їжі.
- Складна структура: П'ятибазова архітектура з різними системами ID, рівнями охоплення нутрієнтів та форматами даних ускладнює інтеграцію без значних зусиль з розробки.
Open Food Facts
Огляд
Open Food Facts (OFF) — це безкоштовна, відкрита, спільна база даних продуктів харчування з усього світу. Вона була заснована в 2012 році і функціонує як неприбутковий проект з місією, аналогічною Wikipedia, але для продуктів харчування. Станом на 2026 рік вона містить понад 3 мільйони записів продуктів з більш ніж 200 країн, що робить її найбільшою відкритою базою даних продуктів за кількістю продуктів.
Метод збору даних
Open Food Facts повністю покладається на краудсорсингові внески. Користувачі (як окремі особи, так і організаційні партнери) подають дані про продукти, скануючи штрих-коди та фотографуючи етикетки з харчовою інформацією за допомогою мобільного додатку або веб-сайту Open Food Facts. Оптичне розпізнавання символів (OCR) допомагає витягувати текст з фотографій етикеток, але людський перегляд і корекція є центральними для процесу забезпечення якості.
Охоплення
Охоплення OFF є винятковим для упакованих і оброблених продуктів, особливо в Європі. Франція, Німеччина, Великобританія та Сполучені Штати мають найбільшу кількість записів продуктів. База даних відзначається в зборі:
- Упакованих супермаркетних продуктів зі штрих-кодами
- Міжнародних продуктів, які відсутні в базах даних, орієнтованих на США
- Списків інгредієнтів та інформації про алергени
- Даних про харчову інформацію у форматі країни походження продукту (формат ЄС, формат США тощо)
- Добавок та індикаторів обробки (класифікація NOVA)
- Nutri-Score (рейтингова система харчування на упаковці, що використовується в кількох країнах ЄС)
Питання якості даних
Оскільки дані OFF є краудсорсинговими, якість значно варіюється між записами:
- Повнота: Багато записів мають неповні дані про харчування. Продукт може мати калорії та макронутрієнти, але бути без вітамінів, мінералів або навіть клітковини. Аналіз 2021 року показав, що лише 67 відсотків записів OFF мали повні дані про макронутрієнти (енергія, білок, вуглеводи, жир), а менш ніж 20 відсотків мали дані про мікронутрієнти, окрім натрію.
- Точність: Помилки OCR, помилки транскрипції користувачів та плутанина між значеннями на порцію та на 100 г вводять помилки. Процес перевірки спільноти виявляє багато з цих помилок, але рівень помилок вищий, ніж у кураторських базах даних.
- Дублювання: Один і той же продукт може з'являтися кілька разів під різними штрих-кодами (регіональні варіанти, перероблені продукти) або з суперечливими даними від різних учасників.
- Своєчасність: Продукти можуть бути реформульовані виробниками, але запис OFF може не бути оновленим, якщо користувач не просканує нову версію.
OFF вирішує проблеми якості через систему репутації учасників, перевірки валідації даних (наприклад, позначення записів, де калорії не приблизно дорівнюють 4 x білок + 4 x вуглеводи + 9 x жир) та модерацію спільноти.
Унікальні особливості
Аналіз інгредієнтів: OFF розбиває списки інгредієнтів на структуровані дані, ідентифікуючи добавки за їхніми кодами E та позначаючи алергени. Цей рівень даних на рівні інгредієнтів є рідкісним у інших базах даних.
Екологічний рейтинг: OFF розраховує Eco-Score, рейтинг впливу на навколишнє середовище, що базується на категорії продукту, інгредієнтах, упаковці та походженні. Це робить його унікальним ресурсом для застосувань, орієнтованих на сталий розвиток.
Класифікація NOVA: Кожен продукт класифікується за шкалою ультраобробки NOVA (1 = необроблений, 4 = ультраоброблений), що дозволяє проводити дослідження та застосування, зосереджені на рівнях обробки їжі.
Доступ та ліцензування
Дані OFF доступні під ліцензією відкритих баз даних (ODbL), яка вимагає атрибуції та спільного використання (похідні бази даних також повинні бути відкритими). Методи доступу включають:
- Веб-інтерфейс: world.openfoodfacts.org
- API: Безкоштовно, без аутентифікації для розумного використання
- Масове завантаження: Повна база даних доступна у вигляді CSV та MongoDB дампів (файли розміром у кілька гігабайт)
- Мобільний SDK: Для інтеграції сканування штрих-кодів
Ліцензія ODbL означає, що комерційні застосунки можуть використовувати дані OFF, але повинні вказувати Open Food Facts та ділитися будь-якими поліпшеннями бази даних назад зі спільнотою. Ця вимога про спільне використання може бути обмеженням для деяких комерційних випадків використання.
Обмеження
- Упаковка продуктів: OFF в основному є базою даних упакованих продуктів. Неупаковані цілісні продукти (свіжі овочі, крупи, свіже м'ясо), страви з ресторанів та домашні страви погано представлені.
- Змінна повнота: Багато записів не мають ключових нутрієнтів. Застосунки, які потребують повних профілів макронутрієнтів + мікронутрієнтів, не можуть покладатися лише на OFF.
- Непостійність якості: Краудсорсингові дані за своєю природою мають більше помилок, ніж професійно кураторські дані. Продукційні застосунки повинні впроваджувати шари валідації.
- Відсутність контексту приготування: OFF фіксує продукти в тому вигляді, в якому вони продаються, а не в тому, як їх споживають. Коробка пасти має сухі значення харчування; варені значення (які насправді споживають користувачі) потрібно розраховувати окремо.
Nutrola
Огляд
Nutrola підтримує приватну базу даних складу продуктів, розроблену спеціально для відстеження харчування з використанням штучного інтелекту. База даних об'єднує кілька авторитетних джерел з перевіреними даними від спільноти, щоб охопити весь спектр продуктів, які насправді споживають користувачі: звичайні цілісні продукти, брендові продукти, страви з ресторанів, регіональні страви та композитні страви.
Джерела даних та методологія
База даних Nutrola створюється шляхом агрегації та перевірки з кількох джерел:
USDA FoodData Central: Дані Foundation Foods та SR Legacy слугують базовим шаром для звичайних цілісних продуктів та загальних приготувань. Дані USDA синхронізуються протягом 30 днів після кожного випуску USDA.
Дані виробників: Харчова інформація для брендових продуктів отримується з даних, наданих виробниками, перевіряється за допомогою сканування етикеток та перехресно перевіряється з записами USDA Branded Foods, коли це можливо.
Партнерство з ресторанами: Nutrola співпрацює з мережами ресторанів та використовує опубліковані дані про харчування меню (які великі мережі США зобов'язані надавати відповідно до норм FDA про маркування калорій) для заповнення записів про їжу з ресторанів.
Перевірені дані від спільноти: Для продуктів, не охоплених вище, особливо регіональних та міжнародних страв, Nutrola створює початкові записи на основі стандартних рецептів та даних інгредієнтів USDA, а потім перевіряє та уточнює їх за допомогою зворотного зв'язку від користувачів. Коли кілька користувачів постійно коригують запис про їжу в одному напрямку, корекція перевіряється та потенційно включається.
Введення даних за допомогою ШІ: Nutrola використовує моделі ШІ для витягування харчових даних з етикеток продуктів різними мовами та форматами, зменшуючи ручні зусилля, необхідні для розширення міжнародного охоплення.
Профіль охоплення
| Категорія | Приблизна кількість записів | Примітки |
|---|---|---|
| Звичайні цілісні продукти | 12,000 | Перевірені з даними USDA Foundation + SR Legacy |
| Брендові продукти (США) | 380,000 | Регулярна синхронізація з даними виробників |
| Брендові продукти (міжнародні) | 210,000 | Зосередження на ринках ЄС, Великобританії, Австралії, Азійсько-Тихоокеанського регіону |
| Страви з меню ресторанів | 85,000 | Мережі США + вибрані міжнародні мережі |
| Регіональні та культурні страви | 45,000 | 50+ кухонь, перевірені спільнотою |
| Композитні страви та рецепти | 168,000 | Отримані з рецептів з даними на рівні інгредієнтів |
| Загалом | 900,000+ |
Заходи контролю якості
Nutrola використовує кілька механізмів контролю якості:
- Перехресна перевірка з USDA: Усі записи про звичайні продукти перехресно перевіряються з даними USDA. Записи, які відрізняються більше ніж на 15 відсотків від значень USDA для будь-якого макронутрієнта, позначаються для перевірки.
- Перевірки харчової правдоподібності: Автоматизовані перевірки підтверджують, що значення калорій узгоджуються з загальними макронутрієнтами (калорії повинні приблизно дорівнювати 4 x білок + 4 x вуглеводи + 9 x жир + 7 x алкоголь, в межах допустимого). Записи, які не проходять цю перевірку, карантинуються до перевірки.
- Аналіз виправлень користувачів: Статистичний аналіз виправлень користувачів виявляє записи, які систематично виправляються в одному напрямку, що викликає перевірку даних командою.
- Періодичний аудит: Випадкова вибірка записів перевіряється щоквартально на відповідність первинним джерелам (USDA, етикетки виробників, опубліковані дані ресторанів).
Охоплення нутрієнтів
Стандартні записи включають 30+ нутрієнтів: енергія (ккал), білок, загальні вуглеводи, загальний жир, насичений жир, транс-жир, мононенасичений жир, поліненасичений жир, холестерин, натрій, харчова клітковина, загальні цукри, додані цукри, вітамін A, вітамін C, вітамін D, кальцій, залізо, калій, вітамін B6, вітамін B12, магній, цинк та кілька інших. Записи, отримані з USDA Foundation Foods, можуть включати додаткові нутрієнти, успадковані з даних USDA.
Доступ
- API: Безкоштовний рівень (500 запитів на день) та платні рівні. Дивіться посібник для розробників Nutrola API для повної документації.
- У додатку: Мобільні та веб-додатки Nutrola є основною точкою доступу для споживачів.
- Масовий доступ: Доступний на рівні Enterprise для дослідницьких та комерційних партнерів.
- Ліцензія: Приватна. Використання API регулюється умовами обслуговування розробників Nutrola. Дані не можуть бути повторно розподілені без комерційної ліцензії.
Обмеження
- Приватна: На відміну від USDA та OFF, дані Nutrola не є безкоштовними для завантаження або повторного розподілу. Це обмежує їх використання для академічних досліджень, які вимагають відкритих даних.
- Глибина нутрієнтів: Хоча 30+ нутрієнтів є достатніми для більшості споживчих та клінічних застосувань, це не відповідає глибині USDA Foundation Foods у 150+ нутрієнтів для спеціалізованих досліджень.
- Молодша база даних: База даних Nutrola є новішою, ніж USDA та OFF, що означає, що історичне охоплення знятих продуктів та спадкових харчових товарів є менш повним.
FatSecret
Огляд
FatSecret є однією з найстаріших платформ для відстеження харчування, що працює з 2007 року. Її база даних продуктів еволюціонувала протягом майже двох десятиліть через поєднання професійної кураторської роботи, внесків спільноти та партнерств. API платформи FatSecret робить ці дані доступними для розробників.
Джерела даних
База даних FatSecret черпає дані з кількох джерел:
- Приватна команда з харчових даних: FatSecret має команду даних, яка кураторить записи про звичайні продукти з харчовими даними, отриманими з таблиць складу продуктів, урядових баз даних та даних виробників.
- Внески спільноти: Користувачі можуть додавати та редагувати записи про продукти, подібно до Open Food Facts, але в рамках модерації.
- Партнерства з виробниками: Дані про брендові продукти надходять від подачі виробників.
- Міжнародні харчові органи: FatSecret посилається на бази даних складу продуктів з кількох країн (FSANZ Австралії, COFID/McCance та Widdowson Великобританії тощо) для підтримки міжнародного охоплення.
Охоплення
База даних FatSecret містить приблизно 500,000 записів про продукти з розумним глобальним охопленням. База даних доступна 16 мовами, що відображає присутність FatSecret на кількох міжнародних ринках. Охоплення є найсильнішим для продуктів США, Австралії та Європи. Охоплення ресторанних продуктів є помірним, включаючи основні мережі США.
Якість даних
FatSecret використовує систему модерації для записів, внесених спільнотою, а її професійна команда даних кураторить основну базу даних продуктів. Якість даних зазвичай є хорошою для звичайних продуктів та основних брендових товарів. Проте, як і в будь-якій базі даних, яка приймає внески спільноти, крайні випадки та менш поширені предмети можуть мати змінну точність.
Охоплення нутрієнтів є більш обмеженим, ніж у USDA або Nutrola, зазвичай надаючи 15-25 нутрієнтів на запис. Основні макронутрієнти, натрій, клітковина, цукор та насичений жир постійно доступні. Охоплення мікронутрієнтів є менш комплексним.
Доступ та ліцензування
- API: API платформи FatSecret безкоштовний у використанні, з щедрим лімітом 5,000 запитів на день. Проте застосунки, які використовують безкоштовний API, повинні відображати брендинг та атрибуцію FatSecret.
- Аутентифікація: OAuth 1.0, що є більш складним для реалізації, ніж методи API ключа або OAuth 2.0, які використовуються іншими постачальниками.
- Масове завантаження: Немає. Дані доступні лише через API.
- Ліцензія: Приватна з обов'язковою атрибуцією для безкоштовного рівня. Варіанти білого етикету доступні через комерційні партнерства.
Унікальні особливості
Підтримка кількох мов: З 16 підтримуваними мовами FatSecret має ширше мовне охоплення, ніж більшість конкурентів, за винятком Open Food Facts.
Довгий термін роботи: Майже два десятиліття роботи означають, що база даних FatSecret була протестована та вдосконалена. Крайні випадки, які новіші бази даних ще виявляють, часто вже були вирішені.
Інтеграція дієти та рецептів: Платформа FatSecret включає функції рецептів та планування страв, які тісно інтегровані з базою даних продуктів, що надає готові випадки використання для розробників, які створюють інструменти для планування страв.
Обмеження
- Відсутність масового завантаження: Розробники не можуть завантажити повний набір даних для офлайн-аналізу або локального хостингу. Весь доступ повинен проходити через API.
- Аутентифікація OAuth 1.0: Старий протокол аутентифікації додає складність реалізації в порівнянні з простим API ключем.
- Вимога атрибуції: Обов'язковий брендинг FatSecret для користувачів безкоштовного API може конфліктувати з деякими дизайнами або вимогами до брендингу застосунків.
- Обмежені дані про мікронутрієнти: Застосунки, які потребують комплексних даних про вітаміни та мінерали, можуть виявити недостатність охоплення FatSecret.
- Відсутність розпізнавання ШІ: Платформа не пропонує можливостей розпізнавання їжі на основі ШІ.
Порівняння в деталях: Порівняння функцій
Повнота даних про макронутрієнти
Ми визначаємо "повні дані про макронутрієнти" як наявність енергії (ккал), білка (г), загальних вуглеводів (г) та загального жиру (г) для запису.
| База даних | % записів з повними макро | Примітки |
|---|---|---|
| USDA FDC (Foundation) | 100% | Лабораторно проаналізовані |
| USDA FDC (SR Legacy) | 99.8% | Обчислені для кількох записів |
| USDA FDC (Branded) | 94% | Деякі подачі виробників неповні |
| Open Food Facts | ~67% | Варіюється за країною та учасником |
| Nutrola | 99.2% | Якісний контроль запобігає неповним записам |
| FatSecret | ~92% | Вищий для кураторських, нижчий для записів, доданих спільнотою |
Міжнародне охоплення продуктів
| Регіон | USDA | Open Food Facts | Nutrola | FatSecret |
|---|---|---|---|---|
| Північна Америка | Відмінно | Добре | Відмінно | Відмінно |
| Західна Європа | Обмежено | Відмінно | Добре | Добре |
| Східна Азія | Погано | Помірно | Добре | Помірно |
| Південна Азія | Погано | Помірно | Добре | Помірно |
| Південно-Східна Азія | Погано | Помірно | Добре | Погано |
| Латинська Америка | Погано | Помірно | Добре | Помірно |
| Близький Схід | Погано | Погано | Помірно | Погано |
| Африка | Дуже погано | Погано | Обмежено | Погано |
| Океанія | Обмежено | Добре | Добре | Відмінно |
Охоплення ресторанних та готових продуктів
| База даних | Основні мережі США | Регіональні ресторани США | Міжнародні мережі | Готові/делікатесні продукти |
|---|---|---|---|---|
| USDA | Немає | Немає | Немає | Лише загальні |
| Open Food Facts | Дуже обмежено | Немає | Дуже обмежено | Немає |
| Nutrola | 85,000+ предметів | Зростаюче | Вибрані ринки | Так |
| FatSecret | Помірно | Обмежено | Обмежено | Декілька |
Досвід розробника
| Фактор | USDA | Open Food Facts | Nutrola | FatSecret |
|---|---|---|---|---|
| Якість документації API | Адекватна | Добра | Відмінна | Добра |
| Час до першого успішного виклику | 15-30 хв | 5 хв (без аутентифікації) | 10 хв | 20-30 хв (OAuth 1.0) |
| Наявність SDK | Немає офіційного | Python, JS, Dart | Python, JS (офіційно) | Спільні SDK |
| Пісочниця/тестове середовище | Ні | Виробництво = тест | Так | Ні |
| Підтримка вебхуків | Ні | Ні | Заплановано (2026) | Ні |
| Пакетні операції | Так (завантаження) | Так (завантаження) | Так (API) | Ні |
Вибір правильного набору даних
Для академічних досліджень
Основна рекомендація: USDA FoodData Central
Академічні дослідження зазвичай вимагають найбільш авторитетних, добре задокументованих та безкоштовних даних. USDA FDC, особливо компонент Foundation Foods, надає лабораторно проаналізовані значення нутрієнтів з статистичною документацією (середні значення, стандартні відхилення, розміри зразків), які можуть бути процитовані в рецензованих публікаціях. Ліцензія публічної власності усуває будь-які юридичні складнощі. Для досліджень, зосереджених на конкретних нутрієнтах на рівні окремих жирних кислот або амінокислот, USDA є єдиним варіантом з достатньою глибиною.
Доповнити: Open Food Facts для досліджень, що стосуються упакованих продуктів, досліджень харчового середовища або оцінок ультраобробки (класифікація NOVA).
Для споживчих додатків харчування
Основна рекомендація: Nutrola або Nutritionix (через API)
Споживчі додатки потребують широкого охоплення продуктів, які люди насправді споживають, включаючи страви з ресторанів, брендові продукти та міжнародні страви. Вони потребують послідовної якості даних та інформації про розміри порцій, яка відповідає тому, як люди думають про їжу (наприклад, "середня куряча грудинка", а не "100 грамів сирого м'яса курки"). API Nutrola надає цю комбінацію з парсингом природної мови та опційним розпізнаванням на основі ШІ.
Доповнити: USDA як базовий шар для звичайних цілісних продуктів та для заповнення прогалин у даних про мікронутрієнти.
Для додатків, що працюють з упакованими продуктами / скануванням штрих-кодів
Основна рекомендація: Open Food Facts
Якщо ваш додаток зосереджений на скануванні штрих-кодів упакованих продуктів, OFF надає найбільшу базу даних з індексацією штрих-кодів з глобальним охопленням, абсолютно безкоштовно та відкрито. Її парсинг інгредієнтів, позначення алергенів та функції Nutri-Score і Eco-Score додають цінності, які не забезпечує лише харчова інформація.
Доповнити: Nutrola або FatSecret для продуктів, які відсутні в OFF, та для охоплення неупакованих продуктів.
Для міжнародних або багатомовних застосувань
Основна рекомендація: Open Food Facts + Nutrola
OFF надає найширше міжнародне охоплення упакованих продуктів з 40+ мовами. Nutrola додає міжнародне охоплення звичайних продуктів та ресторанів на 8 мовах з вищою повнотою даних. Підтримка FatSecret з 16 мовами також є актуальною для споживчих застосувань.
Для проектів з обмеженим бюджетом
Основна рекомендація: API платформи FatSecret або USDA + Open Food Facts
Безкоштовний рівень FatSecret з 5,000 щоденними запитами є найщедрішим серед комерційних API, якщо ви можете врахувати вимогу атрибуції. Альтернативно, поєднання USDA (для даних посилань) з Open Food Facts (для брендових продуктів) надає вам повністю безкоштовний стек відкритих даних, хоча вам потрібно буде інвестувати час у розробку для нормалізації даних та фільтрації якості.
Взаємозв'язки між базами даних
Розуміння того, як ці бази даних пов'язані одна з одною, допомагає при інтеграції кількох джерел:
USDA є авторитетом посилань: Nutrola, FatSecret та багато записів у OFF в кінцевому підсумку отримують загальні харчові значення з даних USDA. Коли ви бачите "куряча грудинка: 165 ккал на 100 г" у кількох базах даних, це число походить з аналізу USDA.
OFF та Nutrola обидва посилаються на USDA для базових даних: Обидві бази даних використовують USDA як основу для загальних харчових записів і накладають додаткові дані (брендовані продукти, міжнародні продукти) поверх.
Перекриття штрих-кодів: OFF, Nutrola та FatSecret всі індексують продукти за штрих-кодом, але їх охоплення відрізняється. Вказаний UPC може існувати в усіх трьох, у двох або лише в одному. Перевірка кількох баз даних покращує ймовірність успішного пошуку штрих-коду.
Дані про ресторани є ключовим відмінником: USDA та OFF практично не мають даних про ресторани. Nutrola має найширше охоплення ресторанів. FatSecret має помірне охоплення. Для застосунків, які обслуговують користувачів, які часто їдять у ресторанах, це часто є вирішальним фактором.
Порівняння методології якості даних
| Показник якості | USDA Foundation | USDA Branded | Open Food Facts | Nutrola | FatSecret |
|---|---|---|---|---|---|
| Основне джерело даних | Лабораторний аналіз (методи AOAC) | Етикетки виробників | Етикетки, скановані користувачами | Перевірка з кількох джерел | Кураторство з кількох джерел |
| Різноманітність зразків | Кілька регіонів/сезонів | Одна етикетка | Один внесок | Перехресна перевірка | Змінна |
| Перевірка калорій/макро узгодженості | Лабораторно перевірено | Немає систематично | Автоматизована формульна перевірка | Автоматизована + ручний аудит | Перевірка модерації |
| Статистична документація | Так (SD, n) | Ні | Ні | Ні | Ні |
| Тригер оновлення | Цикли дослідницьких програм | Подача виробників | Внесок користувачів | Виробник + користувач + аудит | Звіти користувачів + модерація |
Часто задавані питання
Яка база даних про харчування є найточнішою?
Для звичайних цілісних продуктів USDA FoodData Central Foundation Foods є найточнішою, оскільки вона спирається на безпосередній лабораторний аналіз за стандартними методами. Для упакованих та брендових продуктів точність залежить від того, наскільки актуальними є дані стосовно останньої формули продукту. Жодна база даних не є універсально "найточнішою" для всіх типів їжі. Найкращий підхід для виробничих застосувань — використовувати USDA як базовий шар і доповнити базою даних, яка має сильніше охоплення брендових, ресторанних та міжнародних продуктів.
Чи можу я комбінувати дані з кількох баз даних про харчування?
Так, і це є звичайною практикою. Основні виклики полягають у нормалізації назв нутрієнтів та одиниць виміру між базами даних (наприклад, "Вітамін A" може бути вказано в IU, RAE або мкг залежно від джерела), обробці дубльованих записів для однієї їжі з різними харчовими значеннями та управлінні різними вимогами до ліцензування. Дані USDA (публічна власність) можна вільно комбінувати з будь-яким іншим джерелом. Дані Open Food Facts вимагають дотримання ODbL, якщо ви повторно розподіляєте комбінований набір даних.
Як часто я повинен оновлювати свою локальну копію харчових даних?
Для даних USDA квартальні синхронізації, узгоджені з циклами випуску USDA, є достатніми для Foundation та Legacy даних. Дані про брендові продукти змінюються частіше; рекомендуються щомісячні синхронізації. Для Open Food Facts щомісячні або щотижневі синхронізації є доречними, враховуючи модель безперервного внесення. Для доступу на основі API до Nutrola або FatSecret дані завжди актуальні на момент виклику API, тому локальна синхронізація не потрібна, якщо ви не кешуєте.
Чому підрахунки калорій відрізняються між базами даних для однієї й тієї ж їжі?
Декілька факторів викликають розбіжності: різні аналітичні методи, різні джерела зразків, різні визначення "однієї й тієї ж" їжі (чи є "коричневий рис" вареним чи сирим? довгозернистим чи короткозернистим? з сіллю чи без?), практики округлення та вік даних. Різниці в 5-10 відсотків між базами даних для однієї й тієї ж їжі є звичайними і зазвичай відображають законну варіацію, а не помилки.
Чи є дані Open Food Facts достатньо надійними для виробничого застосування?
Дані Open Food Facts є достатньо надійними для виробничого використання, якщо ви впроваджуєте шари валідації. Найкращі практики включають фільтрацію записів, які не проходять перевірки узгодженості макронутрієнтів та калорій, вимагання мінімальних порогів повноти, перехресну перевірку з другим джерелом для записів з високим трафіком та відображення індикаторів впевненості даних користувачам. Багато успішних застосувань, включаючи деякі компоненти Yuka та інші додатки для сканування їжі, покладаються на дані OFF з цими запобіжниками.
Чи включає база даних Nutrola дані з USDA та Open Food Facts?
Nutrola використовує USDA FoodData Central як базовий шар для звичайних цілісних продуктів, регулярно синхронізуючи з випусками USDA. Nutrola не безпосередньо включає дані Open Food Facts, хоча є природне перекриття в охопленні упакованих продуктів, де обидві бази даних отримують дані з етикеток виробників. Приватний шар Nutrola включає дані про ресторани, перевірені міжнародні страви та записи, підтверджені ШІ, які недоступні в USDA або OFF.
Що стосується Nutritionix, CalorieKing та інших комерційних баз даних?
Nutritionix підтримує одну з найбільших комерційних баз даних продуктів (понад 1 мільйон записів) з особливо сильним охопленням ресторанних продуктів. CalorieKing є добре відомою базою даних, популярною в Австралії та США. Обидві є приватними з доступом через API за комерційними цінами. Ми зосередили це порівняння на базах даних з безкоштовними або відкритими рівнями доступу, щоб надати найбільш практичні рекомендації для розробників та дослідників. Nutritionix займала б місце поруч з Nutrola в повному комерційному порівнянні, з вищими цінами, але глибшим охопленням ресторанів у США.
Висновок
Жоден набір даних про харчування не є ідеальним для кожного випадку використання. USDA FoodData Central залишається золотим стандартом для аналітичної точності та глибини нутрієнтів, Open Food Facts веде в охопленні упакованих продуктів та відкритості, Nutrola поєднує широту охоплення з якістю даних і надає найсильніше охоплення ресторанів та міжнародних продуктів серед наборів даних з безкоштовним доступом до API, а FatSecret пропонує зрілу, добре протестовану базу даних з щедрим безкоштовним доступом до API.
Найбільш надійний підхід для серйозних застосувань — використовувати кілька баз даних у багаторівневій архітектурі: USDA як базовий фундамент, комплексну базу даних, таку як Nutrola, для охоплення реальних продуктів та доступу на основі API, а також додаткові джерела, такі як Open Food Facts, для широти упакованих продуктів. Розуміння сильних, слабких сторін та методології кожного набору даних забезпечує, що харчові дані, які живлять ваш додаток, є настільки точними та повними, наскільки це дозволяє сучасний стан науки про склад продуктів.
Готові трансформувати своє відстеження харчування?
Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!