Nutrola's Open Food Nutrition Dataset: 500K+ Voedingsmiddelen Beschikbaar voor Download
Download Nutrola's open food nutrition dataset met 500K+ geverifieerde entries, inclusief calorieën, macronutriënten, micronutriënten en portiegroottes. Beschikbaar in CSV en JSON voor onderzoek, ontwikkeling en onderwijs.
Goede voedingsdata is moeilijk te vinden. Onderzoekers verspillen weken aan het opschonen van overheidsdatabases. Ontwikkelaars schrijven kwetsbare scrapers die elke maand kapot gaan. Studenten die scripties schrijven, moeten zich vaak tevredenstellen met kleine, verouderde monsters omdat het samenstellen van een uitgebreide dataset van nul niet realistisch is binnen een academische tijdlijn.
We hebben Nutrola's voedseldatabase ontwikkeld om onze calorie-tracking app te ondersteunen, en in de afgelopen drie jaar hebben we veel geïnvesteerd in het verbeteren van de nauwkeurigheid, volledigheid en structuur van die data. Vandaag brengen we een zorgvuldig geselecteerde subset van die database uit als een open dataset: meer dan 500.000 geverifieerde voedselentries die gratis te downloaden zijn in CSV- en JSON-formaten.
In dit artikel vind je alles wat je moet weten over de dataset — wat erin zit, hoe je het kunt downloaden, het schema, de licentie, de kwaliteitsmethodologie en hoe het zich verhoudt tot andere openbaar beschikbare voedingsdatasources.
Wat Zit Er in de Dataset
De Nutrola Open Food Nutrition Dataset bevat meer dan 500.000 voedselentries, variërend van rauwe ingrediënten en generieke voedingsmiddelen tot merkproducten en gangbare restaurantitems. Elke entry is geverifieerd via onze meerlaagse kwaliteitscontrole, hetzelfde systeem dat in detail is beschreven in ons artikel over hoe we onze voedseldatabase hebben gebouwd.
Elke voedselentry bevat de volgende gegevenspunten:
- Voedselnaam — de gangbare naam van het voedingsmiddel in het Engels, met merknamen waar van toepassing
- Calorieën — energie-inhoud in kilocalorieën (kcal) per 100 gram en per portie
- Macronutriënten — eiwit, totaal vet, verzadigd vet, transvet, totale koolhydraten, voedingsvezels, totale suikers en toegevoegde suikers, allemaal in grammen
- Micronutriënten — 30+ vitamines en mineralen, waaronder vitamine A, vitamine C, vitamine D, vitamine E, vitamine K, thiamine, riboflavine, niacine, vitamine B6, foliumzuur, vitamine B12, calcium, ijzer, magnesium, fosfor, kalium, natrium, zink, koper, mangaan, selenium en meer
- Portiegroottes — beschrijving van de standaardportiegrootte (bijv. "1 middelgrote appel," "1 kop gekookt"), portiewaarde in grammen en tot drie alternatieve portiegroottes per voedsel
- Voedselcategorie — hiërarchische classificatie volgens onze interne taxonomie (bijv. Zuivel > Kaas > Hard Kaas)
- Land van herkomst — het primaire land of regio waar het voedselproduct wordt verkocht of het ingrediënt doorgaans wordt geconsumeerd
- Barcode (waar beschikbaar) — UPC- of EAN-codes voor merkproducten
- Data bron tags — herkomstindicatoren die aangeven of de entry afkomstig is uit overheidsdatabases, fabrikantgegevens, laboratoriumanalyses of ons interne verificatieteam
Voorbeelddata
Hier is een selectie van entries uit de dataset om je een idee te geven van de structuur en details:
| food_id | food_name | category | country | calories_per_100g | protein_g | fat_g | carbs_g | fiber_g | serving_desc | serving_g |
|---|---|---|---|---|---|---|---|---|---|---|
| NF-001247 | Kipfilet, Rauw, Zonder Huid | Vlees > Kip | VS | 120 | 22.5 | 2.6 | 0.0 | 0.0 | 1 filet (174g) | 174 |
| NF-008391 | Fage Total 0% Griekse Yoghurt | Zuivel > Yoghurt > Griekse | GR | 54 | 10.3 | 0.0 | 3.0 | 0.0 | 1 verpakking (150g) | 150 |
| NF-014205 | Basmati Rijst, Wit, Gekookt | Granen > Rijst | IN | 130 | 2.7 | 0.3 | 28.2 | 0.4 | 1 kop (158g) | 158 |
| NF-022876 | Avocado, Hass, Rauw | Fruit > Tropisch | MX | 160 | 2.0 | 14.7 | 8.5 | 6.7 | 1/2 avocado (68g) | 68 |
| NF-031560 | Barilla Penne Rigate, Droog | Pasta > Gedroogd | IT | 359 | 12.5 | 2.0 | 71.2 | 3.0 | 2 oz (56g) | 56 |
| NF-045892 | Kimchi, Traditionele Napa Kool | Groenten > Gefermenteerd | KR | 15 | 1.1 | 0.5 | 2.4 | 1.6 | 1/2 kop (75g) | 75 |
| NF-053714 | Zalm, Atlantisch, Rauw, Gefokt | Vis > Zalm | NO | 208 | 20.4 | 13.4 | 0.0 | 0.0 | 1 filet (113g) | 113 |
| NF-067283 | Kikkererwten, Blik, Uitgelekt | Peulvruchten > Bonen | VS | 119 | 6.3 | 2.0 | 18.2 | 5.4 | 1/2 kop (120g) | 120 |
De volledige dataset bevat veel meer kolommen voor micronutriënten, alternatieve portiegroottes, barcodegegevens en bronlabels. De bovenstaande tabel toont de kern voedingsvelden.
Dataformaten
De dataset is beschikbaar in twee formaten:
CSV
Het CSV-bestand maakt gebruik van UTF-8-codering met komma-gescheiden waarden. De eerste rij bevat kolomkoppen. Velden die komma's bevatten, zijn omgeven door dubbele aanhalingstekens. Lege waarden worden weergegeven als lege velden.
Het CSV-formaat is ideaal voor spreadsheettools zoals Excel en Google Sheets, statistische software zoals R en SPSS, en snelle data-exploratie met commandoregeltools zoals csvkit of xsv.
Bestand: nutrola-open-food-dataset-v3.csv (ongeveer 210 MB ongecomprimeerd, 48 MB gecomprimeerd)
JSON
Het JSON-bestand bevat een array van objecten, één per voedselentry. Geneste objecten worden gebruikt voor gestructureerde velden zoals portiegroottes (die een beschrijving, gramgewicht en milliliter-equivalent bevatten waar van toepassing) en micronutriëntenprofielen.
Het JSON-formaat is beter geschikt voor applicatieontwikkeling, database-imports en elke workflow waarbij je de hiërarchische structuur van portiegroottes en nutriëntgroepen wilt behouden.
Bestand: nutrola-open-food-dataset-v3.json (ongeveer 340 MB ongecomprimeerd, 62 MB gecomprimeerd)
Beide bestanden zijn ook beschikbaar als gzip-gecomprimeerde archieven om de downloadtijden te verkorten.
Dataschema
Hier is het volledige schema met beschrijvingen voor elk veld in de dataset:
| Veldnaam | Type | Beschrijving |
|---|---|---|
food_id |
string | Unieke Nutrola-identificatie voor de voedselentry (formaat: NF-XXXXXX) |
food_name |
string | Gangbare naam van het voedsel, inclusief merk waar van toepassing |
category_l1 |
string | Hoofdvoedselcategorie (bijv. Zuivel, Granen, Fruit) |
category_l2 |
string | Tweede niveau categorie (bijv. Kaas, Rijst, Tropisch) |
category_l3 |
string | Derde niveau categorie waar van toepassing (bijv. Hard Kaas, Bruine Rijst) |
country |
string | ISO 3166-1 alpha-2 landcode die de primaire markt aangeeft |
brand |
string | Merknamen voor merkproducten; null voor generieke voedingsmiddelen |
barcode |
string | UPC/EAN barcode; null als niet van toepassing |
calories_per_100g |
float | Energie in kcal per 100 gram |
protein_g |
float | Eiwit in grammen per 100g |
fat_total_g |
float | Totaal vet in grammen per 100g |
fat_saturated_g |
float | Verzadigd vet in grammen per 100g |
fat_trans_g |
float | Transvet in grammen per 100g |
carbs_total_g |
float | Totale koolhydraten in grammen per 100g |
fiber_g |
float | Voedingsvezels in grammen per 100g |
sugars_total_g |
float | Totale suikers in grammen per 100g |
sugars_added_g |
float | Toegevoegde suikers in grammen per 100g |
sodium_mg |
float | Natrium in milligram per 100g |
cholesterol_mg |
float | Cholesterol in milligram per 100g |
vitamin_a_mcg |
float | Vitamine A in microgram RAE per 100g |
vitamin_c_mg |
float | Vitamine C in milligram per 100g |
vitamin_d_mcg |
float | Vitamine D in microgram per 100g |
calcium_mg |
float | Calcium in milligram per 100g |
iron_mg |
float | Ijzer in milligram per 100g |
potassium_mg |
float | Kalium in milligram per 100g |
magnesium_mg |
float | Magnesium in milligram per 100g |
zinc_mg |
float | Zink in milligram per 100g |
phosphorus_mg |
float | Fosfor in milligram per 100g |
selenium_mcg |
float | Selenium in microgram per 100g |
vitamin_b6_mg |
float | Vitamine B6 in milligram per 100g |
vitamin_b12_mcg |
float | Vitamine B12 in microgram per 100g |
folate_mcg |
float | Foliumzuur in microgram DFE per 100g |
vitamin_e_mg |
float | Vitamine E in milligram per 100g |
vitamin_k_mcg |
float | Vitamine K in microgram per 100g |
thiamin_mg |
float | Thiamine (B1) in milligram per 100g |
riboflavin_mg |
float | Riboflavine (B2) in milligram per 100g |
niacin_mg |
float | Niacine (B3) in milligram per 100g |
copper_mg |
float | Koper in milligram per 100g |
manganese_mg |
float | Mangaan in milligram per 100g |
serving_1_desc |
string | Beschrijving van de primaire portiegrootte (bijv. "1 kop gekookt") |
serving_1_g |
float | Gewicht van de primaire portiegrootte in grammen |
serving_2_desc |
string | Beschrijving van de alternatieve portiegrootte; null als niet beschikbaar |
serving_2_g |
float | Gewicht van de alternatieve portiegrootte in grammen |
serving_3_desc |
string | Beschrijving van de tweede alternatieve portiegrootte; null als niet beschikbaar |
serving_3_g |
float | Gewicht van de tweede alternatieve portiegrootte in grammen |
data_source |
string | Herkomstlabel: "government", "manufacturer", "laboratory" of "verified_community" |
last_verified |
string | ISO 8601 datum waarop de entry voor het laatst is geverifieerd (YYYY-MM-DD) |
dataset_version |
string | Datasetversie-identificatie (bijv. "v3.0") |
Alle nutriëntwaarden zijn uitgedrukt per 100 gram om consistente vergelijkingen mogelijk te maken. Om nutriënten per portie te berekenen, vermenigvuldig je de waarde per 100g met het gewicht van de portie in grammen en deel je door 100.
Hoe te Downloaden
De dataset is gehost op onze openbare GitHub-repository:
github.com/nutrola/open-food-nutrition-dataset
Je kunt de bestanden rechtstreeks downloaden van de GitHub Releases-pagina, of de repository klonen:
git clone https://github.com/nutrola/open-food-nutrition-dataset.git
Voor de gecomprimeerde versies:
# Download CSV (gecomprimeerd)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.csv.gz
# Download JSON (gecomprimeerd)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.json.gz
De repository bevat ook:
- Een gedetailleerde
README.mdmet snelle startinstructies - Een
CHANGELOG.mdwaarin wijzigingen tussen datasetversies worden gedocumenteerd - Een
scripts/-directory met voorbeeldscripts in Python en R voor het laden, filteren en analyseren van de data - Een
schema/-directory met JSON-schema en CSV-dialectdefinities
Als je toegang nodig hebt tot de volledige database van meer dan 3 miljoen entries met realtime-updates in plaats van periodieke snapshots, zie dan onze Nutrition Data API voor toegang voor ontwikkelaars.
Toepassingen
Academisch Onderzoek
Voedingsonderzoekers kunnen de dataset gebruiken voor analyses van dieetpatronen, epidemiologische modellering en studies naar voedingsdichtheid zonder weken te besteden aan het opschonen en samenvoegen van overheidsdata. Het hiërarchische categorisatiesysteem maakt het eenvoudig om te filteren op voedselgroepen, en het landveld maakt cross-culturele vergelijkingen mogelijk.
Gepubliceerde onderzoeken die de dataset gebruiken, moeten deze citeren als: Nutrola Open Food Nutrition Dataset, v3.0 (2026). Beschikbaar op github.com/nutrola/open-food-nutrition-dataset. Gelicentieerd onder CC BY-SA 4.0.
Applicatieontwikkeling
Ontwikkelaars die gezondheids-, fitness- of voedselgerelateerde applicaties bouwen, kunnen de dataset gebruiken als een lokale voedseldatabase. Het consistente schema en de gegevens over portiegroottes betekenen dat je een functionele functie voor voedselregistratie kunt bouwen zonder afhankelijk te zijn van een live API-verbinding. Dit is bijzonder nuttig voor offline mobiele apps, prototyping en hackathonprojecten.
Het CSV-formaat kan direct worden geladen in SQLite, PostgreSQL of elke relationele database. Het JSON-formaat past goed in documentopslag zoals MongoDB of Firestore.
Datawetenschap en Machine Learning
De dataset is goed geschikt voor het trainen en evalueren van machine learning-modellen gerelateerd aan voedsel en voeding. Veelvoorkomende toepassingen zijn:
- Voedselclassificatiemodellen — gebruik de categoriehiërarchie als trainingslabels om classifiers te bouwen die voedselcategorieën voorspellen op basis van namen of voedingsprofielen
- Voedingsschatting — train regressiemodellen die calorie- of macro-inhoud voorspellen op basis van gedeeltelijke informatie (bijv. het schatten van calorieën op basis van eiwit-, vet- en koolhydraatverhoudingen)
- Aanbevelingssystemen — bouw voedselaanbevelingssystemen die voedingsmatig vergelijkbare alternatieven voorstellen
- Anomaliedetectie — identificeer ongebruikelijke voedingsprofielen die kunnen wijzen op kwaliteitsproblemen in andere datasets
Onderwijs
Studenten voedingswetenschappen en docenten kunnen de dataset gebruiken voor cursussen, laboratoria en opdrachten. De breedte van de data — die voedingsmiddelen uit tientallen landen dekt en elke belangrijke voedselgroep omvat — maakt het nuttig voor het onderwijzen van concepten zoals macronutriëntverhoudingen, micronutriëntdichtheid en hoe voedingsprofielen variëren tussen keukens en voedselverwerkingsniveaus.
Publieke Gezondheid en Beleid
Organisaties voor publieke gezondheid kunnen de data gebruiken om het voedingslandschap van specifieke voedselcategorieën of markten te analyseren. Het landveld maakt filtering op basis van regio mogelijk, en het merkveld maakt analyse van de voedingskwaliteit van merk- versus generieke voedingsmiddelen mogelijk.
Kwaliteitsmethodologie van de Data
Het vrijgeven van een open dataset betekent niets als de data niet betrouwbaar is. Hier is hoe we de kwaliteit waarborgen over de meer dan 500.000 entries in deze release.
Multi-Source Verificatie
Elke entry in de dataset is geverifieerd aan de hand van ten minste twee onafhankelijke bronnen. Onze primaire gegevensbronnen zijn onder andere:
- Overheidsvoedingsdatabases — USDA FoodData Central (Verenigde Staten), CoFID (Verenigd Koninkrijk), NUTTAB (Australië), CNF (Canada) en gelijkwaardige databases uit meer dan 20 landen
- Door fabrikanten geleverde gegevens — voedingsinformatiepanelen die rechtstreeks door voedselproducenten zijn ingediend via ons merkpartnerschapsprogramma
- Laboratoriumanalyses — onafhankelijke laboratoriumtests uitgevoerd door ons team voor veelvoorkomende voedingsmiddelen waar brondata tegenstrijdig of verouderd zijn
- Geverifieerde community-inzendingen — door gebruikers ingediende entries die onze drie-stappen verificatieproces hebben doorstaan (geautomatiseerde kruisverwijzing, deskundige beoordeling en statistische uitschieterdetectie)
Geautomatiseerde Kwaliteitscontroles
Elke entry doorloopt een reeks geautomatiseerde controles voordat deze in de dataset wordt opgenomen:
- Energiebalansvalidatie — het calorieaantal wordt gecontroleerd aan de hand van de Atwater-berekening (4 kcal/g eiwit + 9 kcal/g vet + 4 kcal/g koolhydraten). Entries waarvan de opgegeven calorieën meer dan 10% afwijken van de berekende waarde worden gemarkeerd voor handmatige controle.
- Bereikcontroles — elke nutriëntwaarde wordt gevalideerd aan de hand van fysiologisch plausibele bereiken voor de voedselcategorie. Een kaasentry die 0 gram vet claimt of een fruitentry die 50 gram eiwit claimt, wordt onmiddellijk gemarkeerd.
- Consistentie tussen entries — vergelijkbare voedingsmiddelen worden statistisch vergeleken. Als een nieuwe kipfiletentry significant andere waarden heeft dan de bestaande groep kipfiletentries, wordt deze vastgehouden voor beoordeling.
- Portiegroottevalidatie — portiewaarden worden gecontroleerd aan de hand van bekende standaardporties. Een "1 middelgrote appel" die claimt 500 gram te wegen, komt niet door de controle.
Menselijke Beoordeling
Entries die door geautomatiseerde controles zijn gemarkeerd, worden handmatig beoordeeld door ons datateam, dat bestaat uit gekwalificeerde voedingsdeskundigen en voedingswetenschappers. Ongeveer 12% van de entries vereist enige vorm van handmatige correctie voordat ze worden goedgekeurd.
Voortdurende Onderhoud
De dataset is geen eenmalige dump. We verifiëren entries continu, met prioriteit voor veelvoorkomende voedingsmiddelen (die het vaakst door Nutrola-gebruikers worden geregistreerd) en entries waarvan de brondata is bijgewerkt. Wanneer een voedselproducent een product herformuleert, vangen we de wijziging op via ons barcodebewakingssysteem en werken we de entry dienovereenkomstig bij.
Updatefrequentie
We publiceren elk kwartaal nieuwe versies van de open dataset. Elke release omvat:
- Nieuwe voedselentries die sinds de vorige versie zijn toegevoegd
- Correcties van bestaande entries die zijn geïdentificeerd via onze kwaliteitsmonitoring
- Bijgewerkte voedingsdata voor herformuleerde producten
- Uitgebreide micronutriëntdekking waar nieuwe brondata beschikbaar komt
De huidige versie is v3.0, uitgebracht in maart 2026. Versiegeschiedenis en changelogs zijn beschikbaar in de GitHub-repository.
Als je data nodig hebt die vaker wordt bijgewerkt dan elk kwartaal, weerspiegelt onze Nutrition Data API wijzigingen binnen 48 uur.
Licentie
De Nutrola Open Food Nutrition Dataset is vrijgegeven onder de Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) licentie.
Dit betekent dat je vrij bent om:
- Te delen — de dataset te kopiëren en opnieuw te verspreiden in elk medium of formaat
- Aan te passen — de dataset te remixen, transformeren en er op voort te bouwen voor elk doel, inclusief commercieel gebruik
Onder de volgende voorwaarden:
- Attributie — je moet de juiste erkenning geven aan Nutrola, een link naar de licentie verstrekken en aangeven of er wijzigingen zijn aangebracht
- Gelijk delen — als je de dataset remixt, transformeert of er op voortbouwt, moet je je bijdragen onder dezelfde CC BY-SA 4.0-licentie verspreiden
We hebben gekozen voor CC BY-SA 4.0 omdat het de juiste balans biedt tussen openheid en ervoor zorgt dat verbeteringen terugvloeien naar de gemeenschap. Als je een betere versie van deze data bouwt, zorgt de licentie ervoor dat jouw verbeteringen ook beschikbaar blijven voor anderen.
Hoe Het Zich Verhoudt Tot Andere Datasets
Er zijn verschillende openbaar beschikbare voedingsdatasets. Hier is hoe de Nutrola Open Food Nutrition Dataset zich verhoudt tot de twee meest gebruikte alternatieven.
vs. USDA FoodData Central
USDA FoodData Central is de gouden standaard voor voedingsdata in de Verenigde Staten. Het is grondig, goed gedocumenteerd en ondersteund door laboratoriumanalyses. Het heeft echter beperkingen die de Nutrola dataset aanpakt:
| Dimensie | USDA FoodData Central | Nutrola Open Dataset |
|---|---|---|
| Totaal aantal entries | ~400.000 (Foundation, SR Legacy, Branded gecombineerd) | 500.000+ |
| Geografische dekking | Primair Verenigde Staten | 47 landen |
| Merkenproducten | Alleen Amerikaanse merken, vaak verouderd | Internationale merken, elk kwartaal geverifieerd |
| Dataformaat | Meerdere incompatibele bestandsformaten, complexe relationele structuur | Enkel CSV of JSON-bestand, platte structuur |
| Portiegroottes | Inconsistent tussen subdatabases | Gestandaardiseerd formaat met tot 3 porties per voedsel |
| Gebruiksgemak | Vereist aanzienlijke data-engineering om subdatabases samen te voegen | Download één bestand en begin met werken |
| Updatefrequentie | Varieert per subdatabase (jaarlijks voor sommige) | Elk kwartaal |
Als je werk zich uitsluitend richt op Amerikaanse voedingsmiddelen en je de diepste mogelijke voedingsprofielen nodig hebt (USDA dekt 150+ nutriënten voor Foundation voedingsmiddelen), is FoodData Central de betere keuze. Als je internationale dekking, consistente opmaak en een dataset nodig hebt die direct werkt, is de Nutrola dataset de sterkere optie.
De twee datasets zijn complementair. Veel onderzoekers gebruiken USDA Foundation-data voor gedetailleerde voedingsanalyse in de VS en vullen deze aan met Nutrola-data voor internationale dekking en merkproducten.
vs. Open Food Facts
Open Food Facts is een crowdsourced database met meer dan 3 miljoen entries. Het heeft een indrukwekkende schaal en dekt producten uit veel landen. Echter, de crowdsourced aard brengt kwaliteitsproblemen met zich mee:
| Dimensie | Open Food Facts | Nutrola Open Dataset |
|---|---|---|
| Totaal aantal entries | 3M+ | 500.000+ |
| Data kwaliteit | Variabel — crowdsourced met geautomatiseerde controles | Geverifieerd — multi-source, handmatig beoordeeld |
| Compleetheid | Veel entries missen macro/micro data | Alle entries hebben complete macrodata; 90%+ heeft volledige microprofielen |
| Portiegroottes | Inconsistent, vaak ontbrekend | Gestandaardiseerd, altijd aanwezig |
| Categorie taxonomie | Crowdsourced tags, inconsistent | Hiërarchische, gecureerde taxonomie |
| Nutriëntdekking | Varieert sterk per entry | Consistente 40+ nutriënten over alle entries |
| Dataformaat | MongoDB dump, complexe geneste JSON | Schone CSV en JSON |
| Licentie | Open Database License (ODbL) | CC BY-SA 4.0 |
Open Food Facts excelleert in breedte — als je een specifiek obscuur product op barcode wilt opzoeken, hebben ze het waarschijnlijk. De Nutrola dataset excelleert in diepte en consistentie — elke entry voldoet aan dezelfde kwaliteitsnorm, waardoor het betrouwbaarder is voor kwantitatieve analyses waarbij datagaten of fouten de resultaten kunnen vertekenen.
Als je een barcode-scanner-app bouwt en maximale productdekking nodig hebt, is Open Food Facts een goed startpunt. Als je een machine learning-model traint, statistisch onderzoek doet of een app bouwt waarbij voedingsnauwkeurigheid belangrijk is, biedt de geverifieerde data van de Nutrola dataset een sterkere basis.
Aan de Slag
Zodra je de dataset hebt gedownload, hier is een snel voorbeeld van het laden en verkennen ervan in Python:
import pandas as pd
# Laad de dataset
df = pd.read_csv("nutrola-open-food-dataset-v3.csv")
# Basisoverzicht
print(f"Totaal aantal entries: {len(df):,}")
print(f"Gedeckte landen: {df['country'].nunique()}")
print(f"Voedselcategorieën (L1): {df['category_l1'].nunique()}")
# Vind eiwitrijke, caloriearme voedingsmiddelen
high_protein = df[
(df["protein_g"] > 20) &
(df["calories_per_100g"] < 150)
].sort_values("protein_g", ascending=False)
print(high_protein[["food_name", "calories_per_100g", "protein_g"]].head(10))
# Analyseer gemiddelde macro's per voedselcategorie
category_macros = df.groupby("category_l1").agg({
"calories_per_100g": "mean",
"protein_g": "mean",
"fat_total_g": "mean",
"carbs_total_g": "mean"
}).round(1)
print(category_macros.sort_values("calories_per_100g", ascending=False))
Meer voorbeelden — inclusief R-scripts, SQL-importgidsen en Jupyter-notebooks — zijn beschikbaar in de scripts/-directory van de GitHub-repository.
Veelgestelde Vragen
Is de dataset echt gratis te gebruiken?
Ja. De Nutrola Open Food Nutrition Dataset is vrijgegeven onder de CC BY-SA 4.0-licentie, die commercieel en niet-commercieel gebruik toestaat. De enige vereisten zijn dat je Nutrola als bron crediteert en dat eventuele afgeleide datasets die je verspreidt dezelfde licentie gebruiken. Er zijn geen API-sleutels, geen gebruikslimieten en geen registratie vereist om de bestanden te downloaden.
Hoe vaak wordt de dataset bijgewerkt?
We publiceren elk kwartaal nieuwe versies. Elke release voegt nieuwe voedselentries toe, corrigeert eventuele fouten die sinds de vorige versie zijn geïdentificeerd en werkt entries bij voor producten die zijn herformuleerd. De Releases-pagina van de GitHub-repository heeft de volledige versiegeschiedenis, en je kunt de repository volgen om op de hoogte te worden gehouden van nieuwe versies.
Mag ik deze dataset gebruiken om een commerciële app te bouwen?
Ja. De CC BY-SA 4.0-licentie staat commercieel gebruik expliciet toe. Je kunt de data gebruiken in een betaalde app, een SaaS-product of in elke andere commerciële context. Je moet attributie aan Nutrola opnemen in je app of documentatie, en als je een gewijzigde versie van de dataset zelf verspreidt, moet de gewijzigde versie ook onder CC BY-SA 4.0 worden gelicentieerd. Het gebruik van de data binnen je app (zonder de ruwe dataset opnieuw te distribueren) activeert de ShareAlike-vereiste niet.
Waarom slechts 500K entries terwijl Nutrola's volledige database meer dan 3 miljoen bevat?
De open dataset bevat entries die we kunnen vrijgeven onder een open licentie zonder beperkingen. Onze volledige database bevat data van eigendomsbronnen — directe samenwerkingen met fabrikanten, gelicentieerde laboratoriumdata en andere bronnen met contractuele beperkingen voor herdistributie. De 500K entries in de open dataset komen uit overheidsdatabases, onze eigen laboratoriumanalyses en community-inzendingen waarbij bijdragers akkoord gingen met open licenties. Als je toegang nodig hebt tot de volledige database, biedt onze Nutrition Data API deze onder aparte commerciële voorwaarden.
Wat moet ik doen als ik een fout in de dataset vind?
Open een issue op de GitHub-repository met de food_id van de betreffende entry en een beschrijving van de fout. Voeg een bronlink toe als je die hebt (bijv. een website van een fabrikant die andere voedingsfeiten toont). Ons datateam beoordeelt gerapporteerde problemen wekelijks, en bevestigde correcties worden opgenomen in de volgende kwartaalrelease. Voor dringende correcties kunnen we een patch-release tussen kwartaalupdates doorvoeren.
Hoe verhoudt dit zich tot de Nutrola Nutrition Data API?
De open dataset is een statische kwartaalsnapshot van een zorgvuldig geselecteerde subset van onze database. De API biedt realtime toegang tot de volledige database van meer dan 3 miljoen entries met zoek-, filter-, barcode-lookup en andere functies. Beschouw de open dataset als de basis voor offline of batchgebruik, en de API als de oplossing voor productie-applicaties die live data nodig hebben. Veel ontwikkelaars beginnen met de open dataset voor prototyping en migreren naar de API wanneer ze in productie gaan.
Klaar om je voedingstracking te transformeren?
Sluit je aan bij duizenden die hun gezondheidsreis hebben getransformeerd met Nutrola!