Nutrola's Open Food Nutrition Dataset: 500K+ Voedingsmiddelen Beschikbaar voor Download

12 maart 2026

Download Nutrola's open food nutrition dataset met 500K+ geverifieerde entries, inclusief calorieën, macronutriënten, micronutriënten en portiegroottes. Beschikbaar in CSV en JSON voor onderzoek, ontwikkeling en onderwijs.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Goede voedingsdata is moeilijk te vinden. Onderzoekers verspillen weken aan het opschonen van overheidsdatabases. Ontwikkelaars schrijven kwetsbare scrapers die elke maand kapot gaan. Studenten die scripties schrijven, moeten zich vaak tevredenstellen met kleine, verouderde monsters omdat het samenstellen van een uitgebreide dataset van nul niet realistisch is binnen een academische tijdlijn.

We hebben Nutrola's voedseldatabase ontwikkeld om onze calorie-tracking app te ondersteunen, en in de afgelopen drie jaar hebben we veel geïnvesteerd in het verbeteren van de nauwkeurigheid, volledigheid en structuur van die data. Vandaag brengen we een zorgvuldig geselecteerde subset van die database uit als een open dataset: meer dan 500.000 geverifieerde voedselentries die gratis te downloaden zijn in CSV- en JSON-formaten.

In dit artikel vind je alles wat je moet weten over de dataset — wat erin zit, hoe je het kunt downloaden, het schema, de licentie, de kwaliteitsmethodologie en hoe het zich verhoudt tot andere openbaar beschikbare voedingsdatasources.

Wat Zit Er in de Dataset

De Nutrola Open Food Nutrition Dataset bevat meer dan 500.000 voedselentries, variërend van rauwe ingrediënten en generieke voedingsmiddelen tot merkproducten en gangbare restaurantitems. Elke entry is geverifieerd via onze meerlaagse kwaliteitscontrole, hetzelfde systeem dat in detail is beschreven in ons artikel over hoe we onze voedseldatabase hebben gebouwd.

Elke voedselentry bevat de volgende gegevenspunten:

Voedselnaam — de gangbare naam van het voedingsmiddel in het Engels, met merknamen waar van toepassing
Calorieën — energie-inhoud in kilocalorieën (kcal) per 100 gram en per portie
Macronutriënten — eiwit, totaal vet, verzadigd vet, transvet, totale koolhydraten, voedingsvezels, totale suikers en toegevoegde suikers, allemaal in grammen
Micronutriënten — 30+ vitamines en mineralen, waaronder vitamine A, vitamine C, vitamine D, vitamine E, vitamine K, thiamine, riboflavine, niacine, vitamine B6, foliumzuur, vitamine B12, calcium, ijzer, magnesium, fosfor, kalium, natrium, zink, koper, mangaan, selenium en meer
Portiegroottes — beschrijving van de standaardportiegrootte (bijv. "1 middelgrote appel," "1 kop gekookt"), portiewaarde in grammen en tot drie alternatieve portiegroottes per voedsel
Voedselcategorie — hiërarchische classificatie volgens onze interne taxonomie (bijv. Zuivel > Kaas > Hard Kaas)
Land van herkomst — het primaire land of regio waar het voedselproduct wordt verkocht of het ingrediënt doorgaans wordt geconsumeerd
Barcode (waar beschikbaar) — UPC- of EAN-codes voor merkproducten
Data bron tags — herkomstindicatoren die aangeven of de entry afkomstig is uit overheidsdatabases, fabrikantgegevens, laboratoriumanalyses of ons interne verificatieteam

Voorbeelddata

Hier is een selectie van entries uit de dataset om je een idee te geven van de structuur en details:

food_id	food_name	category	country	calories_per_100g	protein_g	fat_g	carbs_g	fiber_g	serving_desc	serving_g
NF-001247	Kipfilet, Rauw, Zonder Huid	Vlees > Kip	VS	120	22.5	2.6	0.0	0.0	1 filet (174g)	174
NF-008391	Fage Total 0% Griekse Yoghurt	Zuivel > Yoghurt > Griekse	GR	54	10.3	0.0	3.0	0.0	1 verpakking (150g)	150
NF-014205	Basmati Rijst, Wit, Gekookt	Granen > Rijst	IN	130	2.7	0.3	28.2	0.4	1 kop (158g)	158
NF-022876	Avocado, Hass, Rauw	Fruit > Tropisch	MX	160	2.0	14.7	8.5	6.7	1/2 avocado (68g)	68
NF-031560	Barilla Penne Rigate, Droog	Pasta > Gedroogd	IT	359	12.5	2.0	71.2	3.0	2 oz (56g)	56
NF-045892	Kimchi, Traditionele Napa Kool	Groenten > Gefermenteerd	KR	15	1.1	0.5	2.4	1.6	1/2 kop (75g)	75
NF-053714	Zalm, Atlantisch, Rauw, Gefokt	Vis > Zalm	NO	208	20.4	13.4	0.0	0.0	1 filet (113g)	113
NF-067283	Kikkererwten, Blik, Uitgelekt	Peulvruchten > Bonen	VS	119	6.3	2.0	18.2	5.4	1/2 kop (120g)	120

De volledige dataset bevat veel meer kolommen voor micronutriënten, alternatieve portiegroottes, barcodegegevens en bronlabels. De bovenstaande tabel toont de kern voedingsvelden.

Dataformaten

De dataset is beschikbaar in twee formaten:

CSV

Het CSV-bestand maakt gebruik van UTF-8-codering met komma-gescheiden waarden. De eerste rij bevat kolomkoppen. Velden die komma's bevatten, zijn omgeven door dubbele aanhalingstekens. Lege waarden worden weergegeven als lege velden.

Het CSV-formaat is ideaal voor spreadsheettools zoals Excel en Google Sheets, statistische software zoals R en SPSS, en snelle data-exploratie met commandoregeltools zoals csvkit of xsv.

Bestand: nutrola-open-food-dataset-v3.csv (ongeveer 210 MB ongecomprimeerd, 48 MB gecomprimeerd)

JSON

Het JSON-bestand bevat een array van objecten, één per voedselentry. Geneste objecten worden gebruikt voor gestructureerde velden zoals portiegroottes (die een beschrijving, gramgewicht en milliliter-equivalent bevatten waar van toepassing) en micronutriëntenprofielen.

Het JSON-formaat is beter geschikt voor applicatieontwikkeling, database-imports en elke workflow waarbij je de hiërarchische structuur van portiegroottes en nutriëntgroepen wilt behouden.

Bestand: nutrola-open-food-dataset-v3.json (ongeveer 340 MB ongecomprimeerd, 62 MB gecomprimeerd)

Beide bestanden zijn ook beschikbaar als gzip-gecomprimeerde archieven om de downloadtijden te verkorten.

Dataschema

Hier is het volledige schema met beschrijvingen voor elk veld in de dataset:

Veldnaam	Type	Beschrijving
`food_id`	string	Unieke Nutrola-identificatie voor de voedselentry (formaat: NF-XXXXXX)
`food_name`	string	Gangbare naam van het voedsel, inclusief merk waar van toepassing
`category_l1`	string	Hoofdvoedselcategorie (bijv. Zuivel, Granen, Fruit)
`category_l2`	string	Tweede niveau categorie (bijv. Kaas, Rijst, Tropisch)
`category_l3`	string	Derde niveau categorie waar van toepassing (bijv. Hard Kaas, Bruine Rijst)
`country`	string	ISO 3166-1 alpha-2 landcode die de primaire markt aangeeft
`brand`	string	Merknamen voor merkproducten; null voor generieke voedingsmiddelen
`barcode`	string	UPC/EAN barcode; null als niet van toepassing
`calories_per_100g`	float	Energie in kcal per 100 gram
`protein_g`	float	Eiwit in grammen per 100g
`fat_total_g`	float	Totaal vet in grammen per 100g
`fat_saturated_g`	float	Verzadigd vet in grammen per 100g
`fat_trans_g`	float	Transvet in grammen per 100g
`carbs_total_g`	float	Totale koolhydraten in grammen per 100g
`fiber_g`	float	Voedingsvezels in grammen per 100g
`sugars_total_g`	float	Totale suikers in grammen per 100g
`sugars_added_g`	float	Toegevoegde suikers in grammen per 100g
`sodium_mg`	float	Natrium in milligram per 100g
`cholesterol_mg`	float	Cholesterol in milligram per 100g
`vitamin_a_mcg`	float	Vitamine A in microgram RAE per 100g
`vitamin_c_mg`	float	Vitamine C in milligram per 100g
`vitamin_d_mcg`	float	Vitamine D in microgram per 100g
`calcium_mg`	float	Calcium in milligram per 100g
`iron_mg`	float	Ijzer in milligram per 100g
`potassium_mg`	float	Kalium in milligram per 100g
`magnesium_mg`	float	Magnesium in milligram per 100g
`zinc_mg`	float	Zink in milligram per 100g
`phosphorus_mg`	float	Fosfor in milligram per 100g
`selenium_mcg`	float	Selenium in microgram per 100g
`vitamin_b6_mg`	float	Vitamine B6 in milligram per 100g
`vitamin_b12_mcg`	float	Vitamine B12 in microgram per 100g
`folate_mcg`	float	Foliumzuur in microgram DFE per 100g
`vitamin_e_mg`	float	Vitamine E in milligram per 100g
`vitamin_k_mcg`	float	Vitamine K in microgram per 100g
`thiamin_mg`	float	Thiamine (B1) in milligram per 100g
`riboflavin_mg`	float	Riboflavine (B2) in milligram per 100g
`niacin_mg`	float	Niacine (B3) in milligram per 100g
`copper_mg`	float	Koper in milligram per 100g
`manganese_mg`	float	Mangaan in milligram per 100g
`serving_1_desc`	string	Beschrijving van de primaire portiegrootte (bijv. "1 kop gekookt")
`serving_1_g`	float	Gewicht van de primaire portiegrootte in grammen
`serving_2_desc`	string	Beschrijving van de alternatieve portiegrootte; null als niet beschikbaar
`serving_2_g`	float	Gewicht van de alternatieve portiegrootte in grammen
`serving_3_desc`	string	Beschrijving van de tweede alternatieve portiegrootte; null als niet beschikbaar
`serving_3_g`	float	Gewicht van de tweede alternatieve portiegrootte in grammen
`data_source`	string	Herkomstlabel: "government", "manufacturer", "laboratory" of "verified_community"
`last_verified`	string	ISO 8601 datum waarop de entry voor het laatst is geverifieerd (YYYY-MM-DD)
`dataset_version`	string	Datasetversie-identificatie (bijv. "v3.0")

Alle nutriëntwaarden zijn uitgedrukt per 100 gram om consistente vergelijkingen mogelijk te maken. Om nutriënten per portie te berekenen, vermenigvuldig je de waarde per 100g met het gewicht van de portie in grammen en deel je door 100.

Hoe te Downloaden

De dataset is gehost op onze openbare GitHub-repository:

github.com/nutrola/open-food-nutrition-dataset

Je kunt de bestanden rechtstreeks downloaden van de GitHub Releases-pagina, of de repository klonen:

git clone https://github.com/nutrola/open-food-nutrition-dataset.git

Voor de gecomprimeerde versies:

# Download CSV (gecomprimeerd)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.csv.gz

# Download JSON (gecomprimeerd)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.json.gz

De repository bevat ook:

Een gedetailleerde README.md met snelle startinstructies
Een CHANGELOG.md waarin wijzigingen tussen datasetversies worden gedocumenteerd
Een scripts/-directory met voorbeeldscripts in Python en R voor het laden, filteren en analyseren van de data
Een schema/-directory met JSON-schema en CSV-dialectdefinities

Als je toegang nodig hebt tot de volledige database van meer dan 3 miljoen entries met realtime-updates in plaats van periodieke snapshots, zie dan onze Nutrition Data API voor toegang voor ontwikkelaars.

Toepassingen

Academisch Onderzoek

Voedingsonderzoekers kunnen de dataset gebruiken voor analyses van dieetpatronen, epidemiologische modellering en studies naar voedingsdichtheid zonder weken te besteden aan het opschonen en samenvoegen van overheidsdata. Het hiërarchische categorisatiesysteem maakt het eenvoudig om te filteren op voedselgroepen, en het landveld maakt cross-culturele vergelijkingen mogelijk.

Gepubliceerde onderzoeken die de dataset gebruiken, moeten deze citeren als: Nutrola Open Food Nutrition Dataset, v3.0 (2026). Beschikbaar op github.com/nutrola/open-food-nutrition-dataset. Gelicentieerd onder CC BY-SA 4.0.

Applicatieontwikkeling

Ontwikkelaars die gezondheids-, fitness- of voedselgerelateerde applicaties bouwen, kunnen de dataset gebruiken als een lokale voedseldatabase. Het consistente schema en de gegevens over portiegroottes betekenen dat je een functionele functie voor voedselregistratie kunt bouwen zonder afhankelijk te zijn van een live API-verbinding. Dit is bijzonder nuttig voor offline mobiele apps, prototyping en hackathonprojecten.

Het CSV-formaat kan direct worden geladen in SQLite, PostgreSQL of elke relationele database. Het JSON-formaat past goed in documentopslag zoals MongoDB of Firestore.

Datawetenschap en Machine Learning

De dataset is goed geschikt voor het trainen en evalueren van machine learning-modellen gerelateerd aan voedsel en voeding. Veelvoorkomende toepassingen zijn:

Voedselclassificatiemodellen — gebruik de categoriehiërarchie als trainingslabels om classifiers te bouwen die voedselcategorieën voorspellen op basis van namen of voedingsprofielen
Voedingsschatting — train regressiemodellen die calorie- of macro-inhoud voorspellen op basis van gedeeltelijke informatie (bijv. het schatten van calorieën op basis van eiwit-, vet- en koolhydraatverhoudingen)
Aanbevelingssystemen — bouw voedselaanbevelingssystemen die voedingsmatig vergelijkbare alternatieven voorstellen
Anomaliedetectie — identificeer ongebruikelijke voedingsprofielen die kunnen wijzen op kwaliteitsproblemen in andere datasets

Onderwijs

Studenten voedingswetenschappen en docenten kunnen de dataset gebruiken voor cursussen, laboratoria en opdrachten. De breedte van de data — die voedingsmiddelen uit tientallen landen dekt en elke belangrijke voedselgroep omvat — maakt het nuttig voor het onderwijzen van concepten zoals macronutriëntverhoudingen, micronutriëntdichtheid en hoe voedingsprofielen variëren tussen keukens en voedselverwerkingsniveaus.

Publieke Gezondheid en Beleid

Organisaties voor publieke gezondheid kunnen de data gebruiken om het voedingslandschap van specifieke voedselcategorieën of markten te analyseren. Het landveld maakt filtering op basis van regio mogelijk, en het merkveld maakt analyse van de voedingskwaliteit van merk- versus generieke voedingsmiddelen mogelijk.

Kwaliteitsmethodologie van de Data

Het vrijgeven van een open dataset betekent niets als de data niet betrouwbaar is. Hier is hoe we de kwaliteit waarborgen over de meer dan 500.000 entries in deze release.

Multi-Source Verificatie

Elke entry in de dataset is geverifieerd aan de hand van ten minste twee onafhankelijke bronnen. Onze primaire gegevensbronnen zijn onder andere:

Overheidsvoedingsdatabases — USDA FoodData Central (Verenigde Staten), CoFID (Verenigd Koninkrijk), NUTTAB (Australië), CNF (Canada) en gelijkwaardige databases uit meer dan 20 landen
Door fabrikanten geleverde gegevens — voedingsinformatiepanelen die rechtstreeks door voedselproducenten zijn ingediend via ons merkpartnerschapsprogramma
Laboratoriumanalyses — onafhankelijke laboratoriumtests uitgevoerd door ons team voor veelvoorkomende voedingsmiddelen waar brondata tegenstrijdig of verouderd zijn
Geverifieerde community-inzendingen — door gebruikers ingediende entries die onze drie-stappen verificatieproces hebben doorstaan (geautomatiseerde kruisverwijzing, deskundige beoordeling en statistische uitschieterdetectie)

Geautomatiseerde Kwaliteitscontroles

Elke entry doorloopt een reeks geautomatiseerde controles voordat deze in de dataset wordt opgenomen:

Energiebalansvalidatie — het calorieaantal wordt gecontroleerd aan de hand van de Atwater-berekening (4 kcal/g eiwit + 9 kcal/g vet + 4 kcal/g koolhydraten). Entries waarvan de opgegeven calorieën meer dan 10% afwijken van de berekende waarde worden gemarkeerd voor handmatige controle.
Bereikcontroles — elke nutriëntwaarde wordt gevalideerd aan de hand van fysiologisch plausibele bereiken voor de voedselcategorie. Een kaasentry die 0 gram vet claimt of een fruitentry die 50 gram eiwit claimt, wordt onmiddellijk gemarkeerd.
Consistentie tussen entries — vergelijkbare voedingsmiddelen worden statistisch vergeleken. Als een nieuwe kipfiletentry significant andere waarden heeft dan de bestaande groep kipfiletentries, wordt deze vastgehouden voor beoordeling.
Portiegroottevalidatie — portiewaarden worden gecontroleerd aan de hand van bekende standaardporties. Een "1 middelgrote appel" die claimt 500 gram te wegen, komt niet door de controle.

Menselijke Beoordeling

Entries die door geautomatiseerde controles zijn gemarkeerd, worden handmatig beoordeeld door ons datateam, dat bestaat uit gekwalificeerde voedingsdeskundigen en voedingswetenschappers. Ongeveer 12% van de entries vereist enige vorm van handmatige correctie voordat ze worden goedgekeurd.

Voortdurende Onderhoud

De dataset is geen eenmalige dump. We verifiëren entries continu, met prioriteit voor veelvoorkomende voedingsmiddelen (die het vaakst door Nutrola-gebruikers worden geregistreerd) en entries waarvan de brondata is bijgewerkt. Wanneer een voedselproducent een product herformuleert, vangen we de wijziging op via ons barcodebewakingssysteem en werken we de entry dienovereenkomstig bij.

Updatefrequentie

We publiceren elk kwartaal nieuwe versies van de open dataset. Elke release omvat:

Nieuwe voedselentries die sinds de vorige versie zijn toegevoegd
Correcties van bestaande entries die zijn geïdentificeerd via onze kwaliteitsmonitoring
Bijgewerkte voedingsdata voor herformuleerde producten
Uitgebreide micronutriëntdekking waar nieuwe brondata beschikbaar komt

De huidige versie is v3.0, uitgebracht in maart 2026. Versiegeschiedenis en changelogs zijn beschikbaar in de GitHub-repository.

Als je data nodig hebt die vaker wordt bijgewerkt dan elk kwartaal, weerspiegelt onze Nutrition Data API wijzigingen binnen 48 uur.

Licentie

De Nutrola Open Food Nutrition Dataset is vrijgegeven onder de Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) licentie.

Dit betekent dat je vrij bent om:

Te delen — de dataset te kopiëren en opnieuw te verspreiden in elk medium of formaat
Aan te passen — de dataset te remixen, transformeren en er op voort te bouwen voor elk doel, inclusief commercieel gebruik

Onder de volgende voorwaarden:

Attributie — je moet de juiste erkenning geven aan Nutrola, een link naar de licentie verstrekken en aangeven of er wijzigingen zijn aangebracht
Gelijk delen — als je de dataset remixt, transformeert of er op voortbouwt, moet je je bijdragen onder dezelfde CC BY-SA 4.0-licentie verspreiden

We hebben gekozen voor CC BY-SA 4.0 omdat het de juiste balans biedt tussen openheid en ervoor zorgt dat verbeteringen terugvloeien naar de gemeenschap. Als je een betere versie van deze data bouwt, zorgt de licentie ervoor dat jouw verbeteringen ook beschikbaar blijven voor anderen.

Hoe Het Zich Verhoudt Tot Andere Datasets

Er zijn verschillende openbaar beschikbare voedingsdatasets. Hier is hoe de Nutrola Open Food Nutrition Dataset zich verhoudt tot de twee meest gebruikte alternatieven.

vs. USDA FoodData Central

USDA FoodData Central is de gouden standaard voor voedingsdata in de Verenigde Staten. Het is grondig, goed gedocumenteerd en ondersteund door laboratoriumanalyses. Het heeft echter beperkingen die de Nutrola dataset aanpakt:

Dimensie	USDA FoodData Central	Nutrola Open Dataset
Totaal aantal entries	~400.000 (Foundation, SR Legacy, Branded gecombineerd)	500.000+
Geografische dekking	Primair Verenigde Staten	47 landen
Merkenproducten	Alleen Amerikaanse merken, vaak verouderd	Internationale merken, elk kwartaal geverifieerd
Dataformaat	Meerdere incompatibele bestandsformaten, complexe relationele structuur	Enkel CSV of JSON-bestand, platte structuur
Portiegroottes	Inconsistent tussen subdatabases	Gestandaardiseerd formaat met tot 3 porties per voedsel
Gebruiksgemak	Vereist aanzienlijke data-engineering om subdatabases samen te voegen	Download één bestand en begin met werken
Updatefrequentie	Varieert per subdatabase (jaarlijks voor sommige)	Elk kwartaal

Als je werk zich uitsluitend richt op Amerikaanse voedingsmiddelen en je de diepste mogelijke voedingsprofielen nodig hebt (USDA dekt 150+ nutriënten voor Foundation voedingsmiddelen), is FoodData Central de betere keuze. Als je internationale dekking, consistente opmaak en een dataset nodig hebt die direct werkt, is de Nutrola dataset de sterkere optie.

De twee datasets zijn complementair. Veel onderzoekers gebruiken USDA Foundation-data voor gedetailleerde voedingsanalyse in de VS en vullen deze aan met Nutrola-data voor internationale dekking en merkproducten.

vs. Open Food Facts

Open Food Facts is een crowdsourced database met meer dan 3 miljoen entries. Het heeft een indrukwekkende schaal en dekt producten uit veel landen. Echter, de crowdsourced aard brengt kwaliteitsproblemen met zich mee:

Dimensie	Open Food Facts	Nutrola Open Dataset
Totaal aantal entries	3M+	500.000+
Data kwaliteit	Variabel — crowdsourced met geautomatiseerde controles	Geverifieerd — multi-source, handmatig beoordeeld
Compleetheid	Veel entries missen macro/micro data	Alle entries hebben complete macrodata; 90%+ heeft volledige microprofielen
Portiegroottes	Inconsistent, vaak ontbrekend	Gestandaardiseerd, altijd aanwezig
Categorie taxonomie	Crowdsourced tags, inconsistent	Hiërarchische, gecureerde taxonomie
Nutriëntdekking	Varieert sterk per entry	Consistente 40+ nutriënten over alle entries
Dataformaat	MongoDB dump, complexe geneste JSON	Schone CSV en JSON
Licentie	Open Database License (ODbL)	CC BY-SA 4.0

Open Food Facts excelleert in breedte — als je een specifiek obscuur product op barcode wilt opzoeken, hebben ze het waarschijnlijk. De Nutrola dataset excelleert in diepte en consistentie — elke entry voldoet aan dezelfde kwaliteitsnorm, waardoor het betrouwbaarder is voor kwantitatieve analyses waarbij datagaten of fouten de resultaten kunnen vertekenen.

Als je een barcode-scanner-app bouwt en maximale productdekking nodig hebt, is Open Food Facts een goed startpunt. Als je een machine learning-model traint, statistisch onderzoek doet of een app bouwt waarbij voedingsnauwkeurigheid belangrijk is, biedt de geverifieerde data van de Nutrola dataset een sterkere basis.

Aan de Slag

Zodra je de dataset hebt gedownload, hier is een snel voorbeeld van het laden en verkennen ervan in Python:

import pandas as pd

# Laad de dataset
df = pd.read_csv("nutrola-open-food-dataset-v3.csv")

# Basisoverzicht
print(f"Totaal aantal entries: {len(df):,}")
print(f"Gedeckte landen: {df['country'].nunique()}")
print(f"Voedselcategorieën (L1): {df['category_l1'].nunique()}")

# Vind eiwitrijke, caloriearme voedingsmiddelen
high_protein = df[
    (df["protein_g"] > 20) &
    (df["calories_per_100g"] < 150)
].sort_values("protein_g", ascending=False)

print(high_protein[["food_name", "calories_per_100g", "protein_g"]].head(10))

# Analyseer gemiddelde macro's per voedselcategorie
category_macros = df.groupby("category_l1").agg({
    "calories_per_100g": "mean",
    "protein_g": "mean",
    "fat_total_g": "mean",
    "carbs_total_g": "mean"
}).round(1)

print(category_macros.sort_values("calories_per_100g", ascending=False))

Meer voorbeelden — inclusief R-scripts, SQL-importgidsen en Jupyter-notebooks — zijn beschikbaar in de scripts/-directory van de GitHub-repository.

Veelgestelde Vragen

Is de dataset echt gratis te gebruiken?

Ja. De Nutrola Open Food Nutrition Dataset is vrijgegeven onder de CC BY-SA 4.0-licentie, die commercieel en niet-commercieel gebruik toestaat. De enige vereisten zijn dat je Nutrola als bron crediteert en dat eventuele afgeleide datasets die je verspreidt dezelfde licentie gebruiken. Er zijn geen API-sleutels, geen gebruikslimieten en geen registratie vereist om de bestanden te downloaden.

Hoe vaak wordt de dataset bijgewerkt?

We publiceren elk kwartaal nieuwe versies. Elke release voegt nieuwe voedselentries toe, corrigeert eventuele fouten die sinds de vorige versie zijn geïdentificeerd en werkt entries bij voor producten die zijn herformuleerd. De Releases-pagina van de GitHub-repository heeft de volledige versiegeschiedenis, en je kunt de repository volgen om op de hoogte te worden gehouden van nieuwe versies.

Mag ik deze dataset gebruiken om een commerciële app te bouwen?

Ja. De CC BY-SA 4.0-licentie staat commercieel gebruik expliciet toe. Je kunt de data gebruiken in een betaalde app, een SaaS-product of in elke andere commerciële context. Je moet attributie aan Nutrola opnemen in je app of documentatie, en als je een gewijzigde versie van de dataset zelf verspreidt, moet de gewijzigde versie ook onder CC BY-SA 4.0 worden gelicentieerd. Het gebruik van de data binnen je app (zonder de ruwe dataset opnieuw te distribueren) activeert de ShareAlike-vereiste niet.

Waarom slechts 500K entries terwijl Nutrola's volledige database meer dan 3 miljoen bevat?

De open dataset bevat entries die we kunnen vrijgeven onder een open licentie zonder beperkingen. Onze volledige database bevat data van eigendomsbronnen — directe samenwerkingen met fabrikanten, gelicentieerde laboratoriumdata en andere bronnen met contractuele beperkingen voor herdistributie. De 500K entries in de open dataset komen uit overheidsdatabases, onze eigen laboratoriumanalyses en community-inzendingen waarbij bijdragers akkoord gingen met open licenties. Als je toegang nodig hebt tot de volledige database, biedt onze Nutrition Data API deze onder aparte commerciële voorwaarden.

Wat moet ik doen als ik een fout in de dataset vind?

Open een issue op de GitHub-repository met de food_id van de betreffende entry en een beschrijving van de fout. Voeg een bronlink toe als je die hebt (bijv. een website van een fabrikant die andere voedingsfeiten toont). Ons datateam beoordeelt gerapporteerde problemen wekelijks, en bevestigde correcties worden opgenomen in de volgende kwartaalrelease. Voor dringende correcties kunnen we een patch-release tussen kwartaalupdates doorvoeren.

Hoe verhoudt dit zich tot de Nutrola Nutrition Data API?

De open dataset is een statische kwartaalsnapshot van een zorgvuldig geselecteerde subset van onze database. De API biedt realtime toegang tot de volledige database van meer dan 3 miljoen entries met zoek-, filter-, barcode-lookup en andere functies. Beschouw de open dataset als de basis voor offline of batchgebruik, en de API als de oplossing voor productie-applicaties die live data nodig hebben. Veel ontwikkelaars beginnen met de open dataset voor prototyping en migreren naar de API wanneer ze in productie gaan.

Klaar om je voedingstracking te transformeren?

Sluit je aan bij duizenden die hun gezondheidsreis hebben getransformeerd met Nutrola!