Le jeu de données ouvert de nutrition alimentaire de Nutrola : plus de 500 000 aliments disponibles en téléchargement
Téléchargez le jeu de données ouvert de nutrition alimentaire de Nutrola avec plus de 500 000 entrées vérifiées comprenant calories, macros, micronutriments et tailles de portions. Disponible en CSV et JSON pour la recherche, le développement et l'éducation.
Les bonnes données nutritionnelles sont difficiles à trouver. Les chercheurs perdent des semaines à nettoyer des bases de données gouvernementales. Les développeurs écrivent des scrapers fragiles qui cassent chaque mois. Les étudiants rédigeant des mémoires se contentent d'échantillons petits et obsolètes parce qu'assembler un jeu de données complet à partir de zéro n'est pas réaliste dans un calendrier académique.
Nous avons construit la base de données alimentaire de Nutrola pour alimenter notre application de suivi des calories, et au cours des trois dernières années, nous avons investi massivement pour rendre ces données précises, complètes et bien structurées. Aujourd'hui, nous publions un sous-ensemble curé de cette base de données en tant que jeu de données ouvert : plus de 500 000 entrées alimentaires vérifiées disponibles en téléchargement gratuit aux formats CSV et JSON.
Cet article couvre tout ce que vous devez savoir sur le jeu de données — ce qu'il contient, comment le télécharger, le schéma, la licence, la méthodologie de qualité et comment il se compare aux autres sources de données nutritionnelles disponibles publiquement.
Ce que contient le jeu de données
Le Nutrola Open Food Nutrition Dataset contient plus de 500 000 entrées alimentaires couvrant les ingrédients bruts, les aliments génériques, les produits de consommation de marque et les plats courants de restaurant. Chaque entrée a été vérifiée par notre pipeline de contrôle qualité multicouche, le même système décrit en détail dans notre article sur comment nous avons construit notre base de données alimentaire.
Chaque entrée alimentaire comprend les points de données suivants :
- Nom de l'aliment — le nom commun de l'aliment en anglais, avec les noms de marque le cas échéant
- Calories — contenu énergétique en kilocalories (kcal) pour 100 grammes et par portion
- Macronutriments — protéines, matières grasses totales, graisses saturées, graisses trans, glucides totaux, fibres alimentaires, sucres totaux et sucres ajoutés, le tout en grammes
- Micronutriments — plus de 30 vitamines et minéraux dont la vitamine A, la vitamine C, la vitamine D, la vitamine E, la vitamine K, la thiamine, la riboflavine, la niacine, la vitamine B6, le folate, la vitamine B12, le calcium, le fer, le magnésium, le phosphore, le potassium, le sodium, le zinc, le cuivre, le manganèse, le sélénium et plus encore
- Tailles de portions — description de la taille de portion standard (par ex., « 1 pomme moyenne », « 1 tasse cuite »), poids de la portion en grammes et jusqu'à trois tailles de portions alternatives par aliment
- Catégorie alimentaire — classification hiérarchique utilisant notre taxonomie interne (par ex., Produits laitiers > Fromage > Fromage à pâte dure)
- Pays d'origine — le pays ou la région principal(e) où le produit alimentaire est vendu ou l'ingrédient est couramment consommé
- Code-barres (lorsque disponible) — codes UPC ou EAN pour les produits de marque
- Tags de source de données — indicateurs de provenance montrant si l'entrée provient de bases de données gouvernementales, de données fabricant, d'analyses de laboratoire ou de notre équipe de vérification interne
Données d'exemple
Voici une sélection d'entrées du jeu de données pour vous donner une idée de la structure et du niveau de détail :
| food_id | food_name | category | country | calories_per_100g | protein_g | fat_g | carbs_g | fiber_g | serving_desc | serving_g |
|---|---|---|---|---|---|---|---|---|---|---|
| NF-001247 | Chicken Breast, Raw, Skinless | Poultry > Chicken | US | 120 | 22.5 | 2.6 | 0.0 | 0.0 | 1 breast (174g) | 174 |
| NF-008391 | Fage Total 0% Greek Yogurt | Dairy > Yogurt > Greek | GR | 54 | 10.3 | 0.0 | 3.0 | 0.0 | 1 container (150g) | 150 |
| NF-014205 | Basmati Rice, White, Cooked | Grains > Rice | IN | 130 | 2.7 | 0.3 | 28.2 | 0.4 | 1 cup (158g) | 158 |
| NF-022876 | Avocado, Hass, Raw | Fruits > Tropical | MX | 160 | 2.0 | 14.7 | 8.5 | 6.7 | 1/2 avocado (68g) | 68 |
| NF-031560 | Barilla Penne Rigate, Dry | Pasta > Dried | IT | 359 | 12.5 | 2.0 | 71.2 | 3.0 | 2 oz (56g) | 56 |
| NF-045892 | Kimchi, Traditional Napa Cabbage | Vegetables > Fermented | KR | 15 | 1.1 | 0.5 | 2.4 | 1.6 | 1/2 cup (75g) | 75 |
| NF-053714 | Salmon, Atlantic, Raw, Farmed | Fish > Salmon | NO | 208 | 20.4 | 13.4 | 0.0 | 0.0 | 1 fillet (113g) | 113 |
| NF-067283 | Chickpeas, Canned, Drained | Legumes > Beans | US | 119 | 6.3 | 2.0 | 18.2 | 5.4 | 1/2 cup (120g) | 120 |
Le jeu de données complet inclut de nombreuses colonnes supplémentaires pour les micronutriments, les tailles de portions alternatives, les données de code-barres et les tags de source. Le tableau ci-dessus montre les champs nutritionnels principaux.
Formats de données
Le jeu de données est disponible en deux formats :
CSV
Le fichier CSV utilise l'encodage UTF-8 avec des délimiteurs virgule. La première ligne contient les en-têtes de colonnes. Les champs contenant des virgules sont encadrés par des guillemets doubles. Les valeurs nulles sont représentées par des champs vides.
Le format CSV est idéal pour les outils de tableur comme Excel et Google Sheets, les logiciels statistiques comme R et SPSS, et l'exploration rapide des données avec des outils en ligne de commande comme csvkit ou xsv.
Fichier : nutrola-open-food-dataset-v3.csv (environ 210 Mo non compressé, 48 Mo gzippé)
JSON
Le fichier JSON contient un tableau d'objets, un par entrée alimentaire. Des objets imbriqués sont utilisés pour les champs structurés comme les tailles de portions (qui contiennent une description, un poids en grammes et un équivalent en millilitres le cas échéant) et les profils de micronutriments.
Le format JSON est mieux adapté au développement d'applications, aux importations de bases de données et à tout workflow où vous devez préserver la structure hiérarchique des tailles de portions et des groupes de nutriments.
Fichier : nutrola-open-food-dataset-v3.json (environ 340 Mo non compressé, 62 Mo gzippé)
Les deux fichiers sont également disponibles sous forme d'archives compressées gzip pour réduire les temps de téléchargement.
Schéma de données
Voici le schéma complet avec les descriptions de chaque champ du jeu de données :
| Nom du champ | Type | Description |
|---|---|---|
food_id |
string | Identifiant unique Nutrola pour l'entrée alimentaire (format : NF-XXXXXX) |
food_name |
string | Nom commun de l'aliment, incluant la marque le cas échéant |
category_l1 |
string | Catégorie alimentaire de niveau supérieur (par ex., Produits laitiers, Céréales, Fruits) |
category_l2 |
string | Catégorie de deuxième niveau (par ex., Fromage, Riz, Tropical) |
category_l3 |
string | Catégorie de troisième niveau le cas échéant (par ex., Fromage à pâte dure, Riz complet) |
country |
string | Code pays ISO 3166-1 alpha-2 indiquant le marché principal |
brand |
string | Nom de marque pour les produits de marque ; null pour les aliments génériques |
barcode |
string | Code-barres UPC/EAN ; null si non applicable |
calories_per_100g |
float | Énergie en kcal pour 100 grammes |
protein_g |
float | Protéines en grammes pour 100g |
fat_total_g |
float | Matières grasses totales en grammes pour 100g |
fat_saturated_g |
float | Graisses saturées en grammes pour 100g |
fat_trans_g |
float | Graisses trans en grammes pour 100g |
carbs_total_g |
float | Glucides totaux en grammes pour 100g |
fiber_g |
float | Fibres alimentaires en grammes pour 100g |
sugars_total_g |
float | Sucres totaux en grammes pour 100g |
sugars_added_g |
float | Sucres ajoutés en grammes pour 100g |
sodium_mg |
float | Sodium en milligrammes pour 100g |
cholesterol_mg |
float | Cholestérol en milligrammes pour 100g |
vitamin_a_mcg |
float | Vitamine A en microgrammes RAE pour 100g |
vitamin_c_mg |
float | Vitamine C en milligrammes pour 100g |
vitamin_d_mcg |
float | Vitamine D en microgrammes pour 100g |
calcium_mg |
float | Calcium en milligrammes pour 100g |
iron_mg |
float | Fer en milligrammes pour 100g |
potassium_mg |
float | Potassium en milligrammes pour 100g |
magnesium_mg |
float | Magnésium en milligrammes pour 100g |
zinc_mg |
float | Zinc en milligrammes pour 100g |
phosphorus_mg |
float | Phosphore en milligrammes pour 100g |
selenium_mcg |
float | Sélénium en microgrammes pour 100g |
vitamin_b6_mg |
float | Vitamine B6 en milligrammes pour 100g |
vitamin_b12_mcg |
float | Vitamine B12 en microgrammes pour 100g |
folate_mcg |
float | Folate en microgrammes DFE pour 100g |
vitamin_e_mg |
float | Vitamine E en milligrammes pour 100g |
vitamin_k_mcg |
float | Vitamine K en microgrammes pour 100g |
thiamin_mg |
float | Thiamine (B1) en milligrammes pour 100g |
riboflavin_mg |
float | Riboflavine (B2) en milligrammes pour 100g |
niacin_mg |
float | Niacine (B3) en milligrammes pour 100g |
copper_mg |
float | Cuivre en milligrammes pour 100g |
manganese_mg |
float | Manganèse en milligrammes pour 100g |
serving_1_desc |
string | Description de la taille de portion principale (par ex., « 1 tasse cuite ») |
serving_1_g |
float | Poids de la taille de portion principale en grammes |
serving_2_desc |
string | Description de la taille de portion alternative ; null si non disponible |
serving_2_g |
float | Poids de la taille de portion alternative en grammes |
serving_3_desc |
string | Deuxième description de taille de portion alternative ; null si non disponible |
serving_3_g |
float | Poids de la deuxième taille de portion alternative en grammes |
data_source |
string | Tag de provenance : « government », « manufacturer », « laboratory » ou « verified_community » |
last_verified |
string | Date ISO 8601 de la dernière vérification de l'entrée (AAAA-MM-JJ) |
dataset_version |
string | Identifiant de version du jeu de données (par ex., « v3.0 ») |
Toutes les valeurs nutritionnelles sont exprimées pour 100 grammes afin de permettre des comparaisons cohérentes. Pour calculer les nutriments par portion, multipliez la valeur pour 100g par le poids de la portion en grammes et divisez par 100.
Comment télécharger
Le jeu de données est hébergé sur notre dépôt public GitHub :
github.com/nutrola/open-food-nutrition-dataset
Vous pouvez télécharger les fichiers directement depuis la page Releases de GitHub, ou cloner le dépôt :
git clone https://github.com/nutrola/open-food-nutrition-dataset.git
Pour les versions compressées :
# Download CSV (gzipped)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.csv.gz
# Download JSON (gzipped)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.json.gz
Le dépôt contient également :
- Un
README.mddétaillé avec des instructions de démarrage rapide - Un
CHANGELOG.mddocumentant les changements entre les versions du jeu de données - Un répertoire
scripts/avec des scripts d'exemple en Python et R pour charger, filtrer et analyser les données - Un répertoire
schema/avec des définitions JSON Schema et de dialecte CSV
Si vous avez besoin de la base de données complète de plus de 3 millions d'entrées avec des mises à jour en temps réel plutôt que des instantanés périodiques, consultez notre Nutrition Data API pour l'accès développeur.
Cas d'utilisation
Recherche académique
Les chercheurs en nutrition peuvent utiliser le jeu de données pour l'analyse des habitudes alimentaires, la modélisation épidémiologique et les études de densité nutritionnelle sans passer des semaines à nettoyer et fusionner des fichiers de données gouvernementaux. Le système de catégories hiérarchique facilite le filtrage par groupes d'aliments, et le champ pays permet des comparaisons interculturelles.
La recherche publiée utilisant le jeu de données devrait le citer ainsi : Nutrola Open Food Nutrition Dataset, v3.0 (2026). Disponible sur github.com/nutrola/open-food-nutrition-dataset. Sous licence CC BY-SA 4.0.
Développement d'applications
Les développeurs créant des applications liées à la santé, au fitness ou à l'alimentation peuvent utiliser le jeu de données comme base de données alimentaire locale. Le schéma cohérent et les données de taille de portion signifient que vous pouvez construire une fonctionnalité de journal alimentaire fonctionnelle sans dépendre d'une connexion API en direct. C'est particulièrement utile pour les applications mobiles offline-first, le prototypage et les projets de hackathon.
Le format CSV se charge directement dans SQLite, PostgreSQL ou toute base de données relationnelle. Le format JSON se mappe proprement dans les magasins de documents comme MongoDB ou Firestore.
Science des données et apprentissage automatique
Le jeu de données est bien adapté à l'entraînement et à l'évaluation de modèles d'apprentissage automatique liés à l'alimentation et à la nutrition. Les applications courantes incluent :
- Modèles de classification alimentaire — utilisez la hiérarchie des catégories comme étiquettes d'entraînement pour construire des classificateurs qui prédisent les catégories alimentaires à partir de noms ou de profils nutritionnels
- Estimation nutritionnelle — entraînez des modèles de régression qui prédisent le contenu calorique ou en macros à partir d'informations partielles (par ex., estimer les calories à partir des ratios protéines, lipides et glucides)
- Systèmes de recommandation — construisez des moteurs de recommandation alimentaire qui suggèrent des alternatives nutritionnellement similaires
- Détection d'anomalies — identifiez les profils nutritionnels inhabituels qui pourraient indiquer des problèmes de qualité de données dans d'autres jeux de données
Éducation
Les étudiants et enseignants en sciences de la nutrition peuvent utiliser le jeu de données pour les travaux de cours, les travaux pratiques et les devoirs. L'étendue des données — couvrant des aliments de dizaines de pays et englobant tous les grands groupes alimentaires — le rend utile pour enseigner des concepts comme les ratios de macronutriments, la densité en micronutriments et comment les profils nutritionnels varient selon les cuisines et les niveaux de transformation alimentaire.
Santé publique et politique
Les organisations de santé publique peuvent utiliser les données pour analyser le paysage nutritionnel de catégories alimentaires ou de marchés spécifiques. Le champ pays permet le filtrage par région, et le champ marque permet l'analyse de la qualité nutritionnelle des aliments de marque par rapport aux aliments génériques.
Méthodologie de qualité des données
Publier un jeu de données ouvert ne signifie rien si les données ne sont pas fiables. Voici comment nous assurons la qualité des plus de 500 000 entrées de cette publication.
Vérification multisource
Chaque entrée du jeu de données a été vérifiée par rapport à au moins deux sources indépendantes. Nos sources de données primaires incluent :
- Bases de données nutritionnelles gouvernementales — USDA FoodData Central (États-Unis), CoFID (Royaume-Uni), NUTTAB (Australie), CNF (Canada) et des bases de données équivalentes de plus de 20 pays
- Données fournies par les fabricants — panneaux de données nutritionnelles soumis directement par les fabricants d'aliments via notre programme de partenariat de marques
- Analyses de laboratoire — tests de laboratoire indépendants réalisés par notre équipe pour les aliments à fort volume lorsque les données sources sont contradictoires ou obsolètes
- Soumissions communautaires vérifiées — entrées soumises par les utilisateurs ayant passé notre processus de vérification en trois étapes (recoupement automatisé, examen par des experts et détection statistique des valeurs aberrantes)
Contrôles de qualité automatisés
Chaque entrée passe par une batterie de contrôles automatisés avant d'être intégrée au jeu de données :
- Validation du bilan énergétique — le nombre de calories est recoupé avec le calcul d'Atwater (4 kcal/g protéines + 9 kcal/g lipides + 4 kcal/g glucides). Les entrées où les calories déclarées s'écartent de la valeur calculée de plus de 10 % sont signalées pour examen manuel.
- Vérifications de plage — chaque valeur nutritionnelle est validée par rapport à des plages physiologiquement plausibles pour la catégorie alimentaire. Une entrée de fromage affirmant 0 gramme de matières grasses ou une entrée de fruit affirmant 50 grammes de protéines est immédiatement signalée.
- Cohérence inter-entrées — les aliments similaires sont comparés statistiquement. Si une nouvelle entrée de blanc de poulet a des valeurs significativement différentes du cluster existant d'entrées de blanc de poulet, elle est retenue pour examen.
- Validation de la taille de portion — les poids des portions sont vérifiés par rapport aux portions standard connues. Une « 1 pomme moyenne » prétendant peser 500 grammes ne passe pas.
Examen humain
Les entrées signalées par les contrôles automatisés passent par un examen manuel par notre équipe de données, qui comprend des nutritionnistes et des scientifiques alimentaires accrédités. Environ 12 % des entrées nécessitent une forme de correction manuelle avant d'être approuvées.
Maintenance continue
Le jeu de données n'est pas un export ponctuel. Nous revérifions les entrées de manière continue, en priorisant les aliments à fort volume (ceux les plus fréquemment enregistrés par les utilisateurs de Nutrola) et les entrées dont les données sources ont été mises à jour. Lorsqu'un fabricant d'aliments reformule un produit, nous détectons le changement via notre système de surveillance des codes-barres et mettons à jour l'entrée en conséquence.
Fréquence de mise à jour
Nous publions de nouvelles versions du jeu de données ouvert chaque trimestre. Chaque publication comprend :
- De nouvelles entrées alimentaires ajoutées depuis la version précédente
- Des corrections d'entrées existantes identifiées par notre surveillance qualité
- Des données nutritionnelles mises à jour pour les produits reformulés
- Une couverture élargie des micronutriments lorsque de nouvelles données sources deviennent disponibles
La version actuelle est la v3.0, publiée en mars 2026. L'historique des versions et les journaux de modifications sont disponibles dans le dépôt GitHub.
Si vous avez besoin de données mises à jour plus fréquemment que chaque trimestre, notre Nutrition Data API reflète les changements sous 48 heures.
Licence
Le Nutrola Open Food Nutrition Dataset est publié sous la licence Creative Commons Attribution-Partage dans les Mêmes Conditions 4.0 International (CC BY-SA 4.0).
Cela signifie que vous êtes libre de :
- Partager — copier et redistribuer le jeu de données sur tout support ou dans tout format
- Adapter — remixer, transformer et créer à partir du jeu de données pour tout usage, y compris commercial
Sous les conditions suivantes :
- Attribution — vous devez créditer Nutrola de manière appropriée, fournir un lien vers la licence et indiquer si des modifications ont été apportées
- Partage dans les Mêmes Conditions — si vous remixez, transformez ou créez à partir du jeu de données, vous devez distribuer vos contributions sous la même licence CC BY-SA 4.0
Nous avons choisi CC BY-SA 4.0 car elle trouve le bon équilibre entre ouverture et garantie que les améliorations reviennent à la communauté. Si vous construisez une meilleure version de ces données, la licence garantit que vos améliorations restent disponibles pour tous.
Comparaison avec d'autres jeux de données
Il existe plusieurs jeux de données nutritionnelles disponibles publiquement. Voici comment le Nutrola Open Food Nutrition Dataset se compare aux deux alternatives les plus utilisées.
vs. USDA FoodData Central
USDA FoodData Central est la référence en matière de données nutritionnelles aux États-Unis. Il est approfondi, bien documenté et soutenu par des analyses de laboratoire. Cependant, il a des limites que le jeu de données Nutrola adresse :
| Dimension | USDA FoodData Central | Nutrola Open Dataset |
|---|---|---|
| Entrées totales | ~400 000 (Foundation, SR Legacy, Branded combinés) | 500 000+ |
| Couverture géographique | Principalement les États-Unis | 47 pays |
| Produits de marque | Marques américaines uniquement, souvent obsolètes | Marques internationales, vérifiées trimestriellement |
| Format de données | Formats de fichiers multiples et incompatibles, structure relationnelle complexe | Un seul fichier CSV ou JSON, structure plate |
| Tailles de portions | Incohérentes entre les sous-bases de données | Format standardisé avec jusqu'à 3 portions par aliment |
| Facilité d'utilisation | Nécessite une ingénierie de données importante pour fusionner les sous-bases de données | Téléchargez un fichier et commencez à travailler |
| Fréquence de mise à jour | Varie selon la sous-base de données (annuellement pour certaines) | Trimestrielle |
Si votre travail se concentre exclusivement sur les aliments américains et que vous avez besoin du profil nutritionnel le plus approfondi possible (USDA couvre plus de 150 nutriments pour les aliments Foundation), FoodData Central est le meilleur choix. Si vous avez besoin d'une couverture internationale, d'un formatage cohérent et d'un jeu de données qui fonctionne immédiatement, le jeu de données Nutrola est l'option la plus forte.
Les deux jeux de données sont complémentaires. De nombreux chercheurs utilisent les données USDA Foundation pour une analyse détaillée des nutriments américains et les complètent avec les données Nutrola pour la couverture internationale et les produits de marque.
vs. Open Food Facts
Open Food Facts est une base de données collaborative avec plus de 3 millions d'entrées. Elle a une échelle impressionnante et couvre des produits de nombreux pays. Cependant, sa nature collaborative introduit des défis de qualité de données :
| Dimension | Open Food Facts | Nutrola Open Dataset |
|---|---|---|
| Entrées totales | 3M+ | 500 000+ |
| Qualité des données | Variable — collaborative avec des contrôles automatisés | Vérifiée — multisource, révisée par des humains |
| Complétude | De nombreuses entrées manquent de données macros/micros | Toutes les entrées ont des données macros complètes ; 90%+ ont des profils micros complets |
| Tailles de portions | Incohérentes, souvent manquantes | Standardisées, toujours présentes |
| Taxonomie des catégories | Tags collaboratifs, incohérents | Taxonomie hiérarchique et curée |
| Couverture nutritionnelle | Varie largement par entrée | 40+ nutriments cohérents sur toutes les entrées |
| Format de données | Export MongoDB, JSON imbriqué complexe | CSV et JSON propres |
| Licence | Open Database License (ODbL) | CC BY-SA 4.0 |
Open Food Facts excelle en largeur — si vous devez chercher un produit obscur spécifique par code-barres, ils l'ont probablement. Le jeu de données Nutrola excelle en profondeur et cohérence — chaque entrée respecte le même standard de qualité, ce qui le rend plus fiable pour les analyses quantitatives où les lacunes de données ou les erreurs peuvent fausser les résultats.
Si vous construisez une application de scanner de codes-barres et avez besoin d'une couverture maximale de produits, Open Food Facts est un bon point de départ. Si vous entraînez un modèle d'apprentissage automatique, menez une recherche statistique ou construisez une application où la précision nutritionnelle compte, les données vérifiées du jeu de données Nutrola vous donneront une base plus solide.
Pour commencer
Une fois que vous avez téléchargé le jeu de données, voici un exemple rapide de chargement et d'exploration en Python :
import pandas as pd
# Load the dataset
df = pd.read_csv("nutrola-open-food-dataset-v3.csv")
# Basic overview
print(f"Total entries: {len(df):,}")
print(f"Countries covered: {df['country'].nunique()}")
print(f"Food categories (L1): {df['category_l1'].nunique()}")
# Find high-protein, low-calorie foods
high_protein = df[
(df["protein_g"] > 20) &
(df["calories_per_100g"] < 150)
].sort_values("protein_g", ascending=False)
print(high_protein[["food_name", "calories_per_100g", "protein_g"]].head(10))
# Analyze average macros by food category
category_macros = df.groupby("category_l1").agg({
"calories_per_100g": "mean",
"protein_g": "mean",
"fat_total_g": "mean",
"carbs_total_g": "mean"
}).round(1)
print(category_macros.sort_values("calories_per_100g", ascending=False))
D'autres exemples — y compris des scripts R, des guides d'importation SQL et des Jupyter notebooks — sont disponibles dans le répertoire scripts/ du dépôt GitHub.
Questions fréquemment posées
Le jeu de données est-il vraiment gratuit ?
Oui. Le Nutrola Open Food Nutrition Dataset est publié sous la licence CC BY-SA 4.0, qui autorise l'utilisation commerciale et non commerciale. Les seules exigences sont que vous créditiez Nutrola comme source et que tout jeu de données dérivé que vous distribuez utilise la même licence. Il n'y a pas de clés API, pas de limites d'utilisation et aucune inscription requise pour télécharger les fichiers.
À quelle fréquence le jeu de données est-il mis à jour ?
Nous publions de nouvelles versions chaque trimestre. Chaque publication ajoute de nouvelles entrées alimentaires, corrige les erreurs identifiées depuis la version précédente et met à jour les entrées pour les produits qui ont été reformulés. La page Releases du dépôt GitHub contient l'historique complet des versions, et vous pouvez suivre le dépôt pour être notifié lors de la publication de nouvelles versions.
Puis-je utiliser ce jeu de données pour construire une application commerciale ?
Oui. La licence CC BY-SA 4.0 autorise explicitement l'utilisation commerciale. Vous pouvez utiliser les données dans une application payante, un produit SaaS ou tout autre contexte commercial. Vous devez inclure l'attribution à Nutrola dans votre application ou documentation, et si vous distribuez une version modifiée du jeu de données lui-même, la version modifiée doit également être sous licence CC BY-SA 4.0. L'utilisation des données au sein de votre application (sans redistribuer le jeu de données brut) ne déclenche pas l'exigence de Partage dans les Mêmes Conditions.
Pourquoi seulement 500 000 entrées alors que la base de données complète de Nutrola en compte plus de 3 millions ?
Le jeu de données ouvert contient les entrées que nous pouvons publier sous une licence ouverte sans restrictions. Notre base de données complète inclut des données provenant de sources propriétaires — partenariats directs avec des fabricants, données de laboratoire sous licence et autres sources avec des limitations contractuelles sur la redistribution. Les 500 000 entrées du jeu de données ouvert proviennent de bases de données gouvernementales, de nos propres analyses de laboratoire et de soumissions communautaires où les contributeurs ont accepté la licence ouverte. Si vous avez besoin d'accéder à la base de données complète, notre Nutrition Data API la fournit sous des conditions commerciales distinctes.
Que dois-je faire si je trouve une erreur dans le jeu de données ?
Ouvrez un issue sur le dépôt GitHub avec le food_id de l'entrée concernée et une description de l'erreur. Incluez un lien source si vous en avez un (par ex., un site web de fabricant montrant des données nutritionnelles différentes). Notre équipe de données examine les problèmes signalés chaque semaine, et les corrections confirmées sont incluses dans la prochaine publication trimestrielle. Pour les corrections urgentes, nous pouvons publier une version de correctif entre les mises à jour trimestrielles.
Quel est le rapport entre ceci et la Nutrola Nutrition Data API ?
Le jeu de données ouvert est un instantané trimestriel statique d'un sous-ensemble curé de notre base de données. L'API fournit un accès en temps réel à la base de données complète de plus de 3 millions d'entrées avec recherche, filtrage, recherche par code-barres et d'autres fonctionnalités. Considérez le jeu de données ouvert comme la base pour les cas d'utilisation hors ligne ou par lots, et l'API comme la solution pour les applications en production qui ont besoin de données en direct. De nombreux développeurs commencent avec le jeu de données ouvert pour le prototypage et migrent vers l'API lors du passage en production.
Prêt à transformer votre suivi nutritionnel ?
Rejoignez des milliers de personnes qui ont transformé leur parcours santé avec Nutrola !