Nutrola Nyílt Élelmiszer Táplálkozási Adatbázisa: 500K+ Élelmiszer Letöltése

Töltsd le a Nutrola nyílt élelmiszer táplálkozási adatbázisát, amely 500K+ ellenőrzött bejegyzést tartalmaz kalóriákról, makrókról, mikrotápanyagokról és adagméretekről. Elérhető CSV és JSON formátumban kutatás, fejlesztés és oktatás céljából.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Jó minőségű táplálkozási adatok beszerzése nem könnyű feladat. A kutatók hetekig takarítják a kormányzati adatbázisokat. A fejlesztők törékeny adatgyűjtő programokat írnak, amelyek havonta elromlanak. A szakdolgozatot író diákok gyakran elavult, kis mintákra kényszerülnek, mert egy átfogó adatbázis összeállítása nem reális az akadémiai időkeretben.

A Nutrola élelmiszer adatbázisát a kalóriaszámláló alkalmazásunk támogatására építettük, és az elmúlt három évben jelentős erőforrást fektettünk abba, hogy az adatok pontosak, átfogóak és jól strukturáltak legyenek. Ma egy válogatott részhalmazt adunk ki ebből az adatbázisból nyílt adatként: több mint 500,000 ellenőrzött élelmiszerbejegyzés érhető el ingyenes letöltésre CSV és JSON formátumban.

Ez a bejegyzés mindent tartalmaz, amit tudnod kell az adatbázisról — mi található benne, hogyan töltheted le, a séma, licencelés, minőségi módszertan, és hogyan viszonyul más nyilvánosan elérhető táplálkozási adatforrásokhoz.

Mi található az adatbázisban

A Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis több mint 500,000 élelmiszerbejegyzést tartalmaz, amelyek nyers alapanyagokat, általános élelmiszereket, márkás fogyasztói termékeket és gyakori éttermi ételeket ölelnek fel. Minden bejegyzést ellenőriztünk a több rétegű minőségellenőrzési folyamatunkon keresztül, amelyet részletesen bemutatunk a hogyan építettük fel az élelmiszer adatbázisunkat című bejegyzésünkben.

Minden élelmiszerbejegyzés a következő adatpontokat tartalmazza:

  • Élelmiszer neve — az élelmiszer közönséges neve angolul, márkanevekkel, ahol alkalmazható
  • Kalóriák — energiatartalom kilokalóriában (kcal) 100 grammonként és adagonként
  • Makrotápanyagok — fehérje, összes zsír, telített zsír, transz zsír, összes szénhidrát, élelmi rost, összes cukor és hozzáadott cukor, mind grammban
  • Mikrotápanyagok — 30+ vitamin és ásványi anyag, beleértve az A-vitamint, C-vitamint, D-vitamint, E-vitamint, K-vitamint, tiamin, riboflavin, niacin, B6-vitamint, folát, B12-vitamint, kalciumot, vasat, magnéziumot, foszfort, káliumot, nátriumot, cinket, rezet, mangánt, szelént és még sok mást
  • Adagméretek — standard adagméret leírás (pl. "1 közepes alma", "1 csésze főtt"), adag súlya grammban, és legfeljebb három alternatív adagméret élelmiszerenként
  • Élelmiszer kategória — hierarchikus besorolás a belső taxonómiánk szerint (pl. Tejtermékek > Sajtok > Kemény sajtok)
  • Származási ország — az elsődleges ország vagy régió, ahol az élelmiszerterméket értékesítik, vagy az összetevőt általában fogyasztják
  • Vonalkód (ha elérhető) — UPC vagy EAN kódok a márkás termékekhez
  • Adatforrás címkék — származási mutatók, amelyek megmutatják, hogy a bejegyzés kormányzati adatbázisból, gyártói adatokból, laboratóriumi elemzésből vagy a belső ellenőrző csapatunkból származik

Mintapélda

Itt van néhány bejegyzés az adatbázisból, hogy érzékeld a struktúrát és a részletességet:

food_id food_name category country calories_per_100g protein_g fat_g carbs_g fiber_g serving_desc serving_g
NF-001247 Csirkemell, Nyers, Bőr nélküli Szárnyas > Csirke US 120 22.5 2.6 0.0 0.0 1 mell (174g) 174
NF-008391 Fage Total 0% Görög Joghurt Tejtermékek > Joghurt > Görög GR 54 10.3 0.0 3.0 0.0 1 doboz (150g) 150
NF-014205 Basmati Rizs, Fehér, Főtt Gabonafélék > Rizs IN 130 2.7 0.3 28.2 0.4 1 csésze (158g) 158
NF-022876 Avokádó, Hass, Nyers Gyümölcsök > Trópusi MX 160 2.0 14.7 8.5 6.7 1/2 avokádó (68g) 68
NF-031560 Barilla Penne Rigate, Száraz Tészta > Száraz IT 359 12.5 2.0 71.2 3.0 2 oz (56g) 56
NF-045892 Kimchi, Hagyományos Napa Káposzta Zöldségek > Erjesztett KR 15 1.1 0.5 2.4 1.6 1/2 csésze (75g) 75
NF-053714 Lazac, Atlanti, Nyers, Tenyésztett Halak > Lazac NO 208 20.4 13.4 0.0 0.0 1 filé (113g) 113
NF-067283 Csicseriborsó, Konzerv, Leöntve Hüvelyesek > Bab US 119 6.3 2.0 18.2 5.4 1/2 csésze (120g) 120

A teljes adatbázis sokkal több oszlopot tartalmaz a mikrotápanyagokról, alternatív adagméretekről, vonalkód adatokról és forrást címkékről. A fenti táblázat a legfontosabb tápanyagtartalmi mezőket mutatja.

Adatformátumok

Az adatbázis két formátumban érhető el:

CSV

A CSV fájl UTF-8 kódolást használ, vesszővel elválasztva. Az első sor oszlopfejléceket tartalmaz. Azok a mezők, amelyek vesszőt tartalmaznak, dupla idézőjelek közé vannak zárva. A null értékek üres mezőkként jelennek meg.

A CSV formátum ideális táblázatkezelő eszközök, mint az Excel és a Google Sheets, statisztikai szoftverek, mint az R és SPSS, valamint gyors adatfeltárásra parancssori eszközökkel, mint a csvkit vagy xsv.

Fájl: nutrola-open-food-dataset-v3.csv (kb. 210 MB kicsomagolva, 48 MB tömörítve)

JSON

A JSON fájl egy objektumokból álló tömböt tartalmaz, egyet minden élelmiszerbejegyzéshez. Beágyazott objektumok használatosak a strukturált mezők, például az adagméretek (amelyek tartalmazzák a leírást, grammban mért súlyt és milliliter megfelelőjét, ahol alkalmazható) és a mikrotápanyag profilok számára.

A JSON formátum jobban megfelel alkalmazásfejlesztéshez, adatbázis-importáláshoz és bármilyen munkafolyamathoz, ahol meg kell őrizni az adagméretek és tápanyagcsoportok hierarchikus struktúráját.

Fájl: nutrola-open-food-dataset-v3.json (kb. 340 MB kicsomagolva, 62 MB tömörítve)

Mindkét fájl elérhető gzip tömörített archívumként is, hogy csökkentse a letöltési időt.

Adatséma

Itt található a teljes séma, amely minden mező leírását tartalmazza az adatbázisban:

Field Name Type Description
food_id string A Nutrola egyedi azonosítója az élelmiszerbejegyzéshez (formátum: NF-XXXXXX)
food_name string Az élelmiszer közönséges neve, beleértve a márkát, ahol alkalmazható
category_l1 string Legfelső szintű élelmiszer kategória (pl. Tejtermékek, Gabonafélék, Gyümölcsök)
category_l2 string Második szintű kategória (pl. Sajtok, Rizs, Trópusi)
category_l3 string Harmadik szintű kategória, ahol alkalmazható (pl. Kemény sajt, Barna rizs)
country string ISO 3166-1 alpha-2 országkód, amely az elsődleges piacot jelzi
brand string Márkaneve a márkás termékekhez; null az általános élelmiszerekhez
barcode string UPC/EAN vonalkód; null, ha nem alkalmazható
calories_per_100g float Energia kcal/100 grammban
protein_g float Fehérje grammban/100g
fat_total_g float Összes zsír grammban/100g
fat_saturated_g float Telített zsír grammban/100g
fat_trans_g float Transz zsír grammban/100g
carbs_total_g float Összes szénhidrát grammban/100g
fiber_g float Élelmi rost grammban/100g
sugars_total_g float Összes cukor grammban/100g
sugars_added_g float Hozzáadott cukor grammban/100g
sodium_mg float Nátrium milligrammban/100g
cholesterol_mg float Koleszterin milligrammban/100g
vitamin_a_mcg float A-vitamin mikrogrammban RAE/100g
vitamin_c_mg float C-vitamin milligrammban/100g
vitamin_d_mcg float D-vitamin mikrogrammban/100g
calcium_mg float Kalcium milligrammban/100g
iron_mg float Vas milligrammban/100g
potassium_mg float Kálium milligrammban/100g
magnesium_mg float Magnézium milligrammban/100g
zinc_mg float Cink milligrammban/100g
phosphorus_mg float Foszfor milligrammban/100g
selenium_mcg float Szelén mikrogrammban/100g
vitamin_b6_mg float B6-vitamin milligrammban/100g
vitamin_b12_mcg float B12-vitamin mikrogrammban/100g
folate_mcg float Folsav mikrogrammban DFE/100g
vitamin_e_mg float E-vitamin milligrammban/100g
vitamin_k_mcg float K-vitamin mikrogrammban/100g
thiamin_mg float Tiamin (B1) milligrammban/100g
riboflavin_mg float Riboflavin (B2) milligrammban/100g
niacin_mg float Niacin (B3) milligrammban/100g
copper_mg float Réz milligrammban/100g
manganese_mg float Mangán milligrammban/100g
serving_1_desc string Elsődleges adagméret leírás (pl. "1 csésze főtt")
serving_1_g float Elsődleges adagméret súlya grammban
serving_2_desc string Alternatív adagméret leírás; null, ha nem elérhető
serving_2_g float Alternatív adagméret súlya grammban
serving_3_desc string Második alternatív adagméret leírás; null, ha nem elérhető
serving_3_g float Második alternatív adagméret súlya grammban
data_source string Származási címke: "kormányzati", "gyártó", "laboratórium" vagy "ellenőrzött közösség"
last_verified string ISO 8601 dátum, amikor a bejegyzést utoljára ellenőrizték (YYYY-MM-DD)
dataset_version string Az adatbázis verzió azonosítója (pl. "v3.0")

Minden tápanyagtartalom 100 grammonként van kifejezve, hogy lehetővé tegye a következetes összehasonlítást. Az adagok tápanyagtartalmának kiszámításához szorozd meg a 100 grammonkénti értéket az adag súlyával grammban, majd oszd el 100-zal.

Hogyan töltsd le

Az adatbázis a nyilvános GitHub tárolónkon található:

github.com/nutrola/open-food-nutrition-dataset

A fájlokat közvetlenül a GitHub Kiadások oldaláról töltheted le, vagy klónozhatod a tárolót:

git clone https://github.com/nutrola/open-food-nutrition-dataset.git

A tömörített verziókhoz:

# CSV letöltése (tömörítve)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.csv.gz

# JSON letöltése (tömörítve)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.json.gz

A tárolóban található még:

  • Egy részletes README.md, amely gyors kezdési útmutatót tartalmaz
  • Egy CHANGELOG.md, amely dokumentálja a változásokat az adatbázis verziói között
  • Egy scripts/ könyvtár Python és R példascriptekkel az adatok betöltésére, szűrésére és elemzésére
  • Egy schema/ könyvtár JSON séma és CSV dialektus definíciókkal

Ha a teljes 3 millió+ bejegyzésből álló adatbázisra van szükséged valós idejű frissítésekkel, lásd a Nutrition Data API oldalunkat a fejlesztői hozzáféréshez.

Felhasználási esetek

Akadémiai Kutatás

A táplálkozási kutatók felhasználhatják az adatbázist étrendi mintázatok elemzésére, epidemiológiai modellezésre és tápanyag sűrűségi tanulmányokra anélkül, hogy heteket kellene tölteniük kormányzati adatfájlok tisztításával és összevonásával. A hierarchikus kategória rendszer lehetővé teszi az élelmiszercsoportok szerinti egyszerű szűrést, a származási mező pedig lehetővé teszi a kultúrák közötti összehasonlítást.

A publikált kutatásoknak hivatkozniuk kell: Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis, v3.0 (2026). Elérhető a github.com/nutrola/open-food-nutrition-dataset oldalon. Licenc: CC BY-SA 4.0.

Alkalmazásfejlesztés

A fejlesztők, akik egészséggel, fitneszszel vagy élelmiszerekkel kapcsolatos alkalmazásokat építenek, helyi élelmiszer adatbázisként használhatják az adatbázist. A következetes séma és adagméret adatok lehetővé teszik, hogy funkcionális élelmiszer naplózási funkciót építsenek anélkül, hogy élő API kapcsolatra lenne szükségük. Ez különösen hasznos offline első mobilalkalmazások, prototípusok és hackathon projektek esetén.

A CSV formátum közvetlenül betölthető SQLite, PostgreSQL vagy bármilyen relációs adatbázisba. A JSON formátum tisztán illeszkedik a dokumentumtárolókhoz, mint a MongoDB vagy Firestore.

Adattudomány és Gépi Tanulás

Az adatbázis jól alkalmazható gépi tanulási modellek betanítására és értékelésére, amelyek az élelmiszerrel és táplálkozással kapcsolatosak. A gyakori alkalmazások közé tartozik:

  • Élelmiszer klasszifikáló modellek — a kategória hierarchia használata tanító címkékként, hogy olyan klasszifikátorokat építsenek, amelyek az élelmiszer kategóriákat a nevekből vagy tápanyagprofilokból jósolják
  • Táplálkozási becslés — regressziós modellek betanítása, amelyek a kalória vagy makrotápanyag tartalmat becsülik meg részleges információk alapján (pl. kalóriák becslése fehérje, zsír és szénhidrát arányok alapján)
  • Ajánlórendszerek — élelmiszerajánló motorok építése, amelyek táplálkozásilag hasonló alternatívákat javasolnak
  • Anomália észlelés — szokatlan táplálkozási profilok azonosítása, amelyek adatminőségi problémákra utalhatnak más adatbázisokban

Oktatás

A táplálkozástudományi hallgatók és oktatók felhasználhatják az adatbázist kurzusokhoz, laborokhoz és feladatokhoz. Az adatok széles spektruma — amely élelmiszereket ölel fel tucatnyi országból és minden fő élelmiszercsoportot — hasznos a makrotápanyag arányok, mikrotápanyag sűrűség és a táplálkozási profilok különböző konyhák és élelmiszerfeldolgozási szintek közötti változásaival kapcsolatos fogalmak tanításához.

Közegészségügy és Politika

A közegészségügyi szervezetek felhasználhatják az adatokat az adott élelmiszercsoportok vagy piacok táplálkozási tájának elemzésére. A származási mező lehetővé teszi a régió szerinti szűrést, a márkamező pedig a márkás és általános élelmiszerek táplálkozási minőségének elemzését.

Adatminőségi Módszertan

Nyílt adatbázis kiadása semmit sem ér, ha az adatok nem megbízhatóak. Íme, hogyan biztosítjuk a minőséget a több mint 500,000 bejegyzés esetében, amelyeket most kiadunk.

Többforrásos Ellenőrzés

Minden bejegyzést legalább két független forrás alapján ellenőriztünk. Fő adatforrásaink közé tartoznak:

  • Kormányzati táplálkozási adatbázisok — USDA FoodData Central (Egyesült Államok), CoFID (Egyesült Királyság), NUTTAB (Ausztrália), CNF (Kanada) és 20+ ország megfelelő adatbázisai
  • Gyártói adatok — táplálkozási tények panelek, amelyeket közvetlenül az élelmiszer gyártók nyújtottak be a márka partnerségi programunkon keresztül
  • Laboratóriumi elemzés — független laboratóriumi tesztelés, amelyet csapatunk végez a nagy mennyiségű élelmiszerek esetében, ahol a forrásadatok ellentmondásosak vagy elavultak
  • Ellenőrzött közösségi benyújtások — felhasználók által benyújtott bejegyzések, amelyek átestek a háromlépcsős ellenőrzési folyamatunkon (automatikus keresztellenőrzés, szakértői felülvizsgálat és statisztikai kiugró észlelés)

Automatikus Minőségellenőrzések

Minden bejegyzés átesik egy sor automatikus ellenőrzésen, mielőtt bekerülne az adatbázisba:

  • Energiaegyensúly-ellenőrzés — a kalóriák számát összehasonlítjuk az Atwater számítással (4 kcal/g fehérje + 9 kcal/g zsír + 4 kcal/g szénhidrát). Azokat a bejegyzéseket, ahol a megadott kalóriák eltérnek a számított értéktől 10%-nál többel, manuális felülvizsgálatra jelöljük.
  • Tartományellenőrzések — minden tápanyagértéket élettanilag elfogadható tartományokkal validálunk az élelmiszer kategória szerint. Egy sajtbejegyzés, amely 0 gramm zsírt állít, vagy egy gyümölcsbejegyzés, amely 50 gramm fehérjét állít, azonnal jelölve van.
  • Keresztbejegyzés-konzisztencia — hasonló élelmiszerek statisztikai összehasonlítása. Ha egy új csirkemell bejegyzés jelentősen eltérő értékeket mutat a meglévő csirkemell bejegyzések klaszterétől, azt felülvizsgálatra tartjuk.
  • Adagméret-ellenőrzés — az adag súlyokat a jól ismert standard adagokkal ellenőrizzük. Egy "1 közepes alma", amely 500 grammot állít, nem teljesíti az ellenőrzést.

Emberi Felülvizsgálat

Az automatikus ellenőrzések által jelölt bejegyzések manuális felülvizsgálaton mennek keresztül az adatcsapatunk által, amely tartalmazza a hitelesített táplálkozási szakembereket és élelmiszertudósokat. A bejegyzések körülbelül 12%-ának valamilyen formában manuális korrekcióra van szüksége, mielőtt jóváhagyják őket.

Folyamatos Karbantartás

Az adatbázis nem egyszeri kiadás. Folyamatosan újraellenőrizzük a bejegyzéseket, prioritást adva a nagy mennyiségű élelmiszereknek (azoknak, amelyeket a Nutrola felhasználói a leggyakrabban naplóznak) és azoknak a bejegyzéseknek, amelyek forrásadatai frissültek. Amikor egy élelmiszergyártó átalakít egy terméket, a vonalkód figyelő rendszerünk segítségével észleljük a változást, és ennek megfelelően frissítjük a bejegyzést.

Frissítési Gyakoriság

Új verziókat negyedévente adunk ki a nyílt adatbázisból. Minden kiadás tartalmazza:

  • Az előző verzió óta hozzáadott új élelmiszerbejegyzéseket
  • A korábbi verzió óta azonosított hibák javításait
  • A reformált termékek frissített táplálkozási adatait
  • Kiterjesztett mikrotápanyag lefedettséget, ahol új forrásadatok állnak rendelkezésre

A jelenlegi verzió a v3.0, amely 2026 márciusában jelent meg. A verziótörténet és a változásnaplók elérhetők a GitHub tárolóban.

Ha olyan adatokra van szükséged, amelyek gyakrabban frissülnek, mint negyedévente, a Nutrition Data API 48 órán belül tükrözi a változásokat.

Licenc

A Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis a Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) licenc alatt került kiadásra.

Ez azt jelenti, hogy szabadon:

  • Megoszthatod — másolhatod és újraeloszthatod az adatbázist bármilyen médiában vagy formátumban
  • Alkalmazhatod — átdolgozhatod, átalakíthatod és építheted az adatbázist bármilyen célra, beleértve a kereskedelmi felhasználást is

Az alábbi feltételek mellett:

  • Hivatkozás — megfelelően meg kell említened a Nutrolát, linket kell adnod a licencre, és jelezned kell, ha változtatásokat hajtottál végre
  • Megosztás — ha átdolgozod, átalakítod vagy építesz az adatbázison, a hozzájárulásaidat ugyanazzal a CC BY-SA 4.0 licenccel kell terjesztened

A CC BY-SA 4.0-et választottuk, mert megfelelő egyensúlyt teremt a nyitottság és a közösség számára visszafolyó fejlesztések biztosítása között. Ha jobb verziót készítesz az adatokból, a licenc biztosítja, hogy a fejlesztéseid mások számára is elérhetők maradjanak.

Hogyan viszonyul más adatbázisokhoz

Számos nyilvánosan elérhető táplálkozási adatbázis létezik. Íme, hogyan hasonlítható össze a Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis a két legszélesebb körben használt alternatívával.

USDA FoodData Central vs.

Az USDA FoodData Central az Egyesült Államok táplálkozási adatainak arany standardja. Alapos, jól dokumentált és laboratóriumi elemzés támasztja alá. Azonban vannak korlátai, amelyeket a Nutrola adatbázis kezel:

Dimenzió USDA FoodData Central Nutrola Nyílt Adatbázis
Összes bejegyzés ~400,000 (Foundation, SR Legacy, Branded kombinálva) 500,000+
Földrajzi lefedettség Főként Egyesült Államok 47 ország
Márkás termékek Csak amerikai márkák, gyakran elavult Nemzetközi márkák, negyedévente ellenőrzött
Adatformátum Több inkompatibilis fájlformátum, bonyolult relációs struktúra Egyetlen CSV vagy JSON fájl, lapos struktúra
Adagméretek Inkonzisztens az al-adatbázisok között Standardizált formátum legfeljebb 3 adag élelmiszerenként
Használhatóság Jelentős adatfeldolgozást igényel az al-adatbázisok összevonásához Tölts le egy fájlt és kezdj el dolgozni
Frissítési gyakoriság Az al-adatbázisok szerint változó (évente egyeseknél) Negyedévente

Ha a munkád kizárólag az amerikai élelmiszerekre összpontosít, és a lehető legmélyebb tápanyagprofilt igényled (az USDA 150+ tápanyagot fed le a Foundation élelmiszerek esetében), akkor a FoodData Central a jobb választás. Ha nemzetközi lefedettségre, következetes formázásra és egy azonnal használható adatbázisra van szükséged, akkor a Nutrola adatbázis a erősebb opció.

A két adatbázis kiegészíti egymást. Sok kutató az USDA Foundation adatokat használja részletes amerikai tápanyag-elemzéshez, és kiegészíti a Nutrola adataival nemzetközi lefedettség és márkás termékek érdekében.

Open Food Facts vs.

Az Open Food Facts egy közösségi adatbázis, amely több mint 3 millió bejegyzést tartalmaz. Imponáló mérete van, és sok országból származó termékeket fed le. Azonban a közösségi alapú természete adatminőségi kihívásokat jelent:

Dimenzió Open Food Facts Nutrola Nyílt Adatbázis
Összes bejegyzés 3M+ 500,000+
Adatminőség Változó — közösségi alapú, automatikus ellenőrzésekkel Ellenőrzött — többforrásos, emberi felülvizsgálat
Teljesség Sok bejegyzés hiányzik makro/mikro adatokból Minden bejegyzés teljes makro adatokkal rendelkezik; 90%+ teljes mikro profilokkal
Adagméretek Inkonzisztens, gyakran hiányzik Standardizált, mindig jelen van
Kategória taxonómia Közösségi alapú címkék, inkonzisztens Hierarchikus, válogatott taxonómia
Tápanyag lefedettség Bejegyzésenként széles spektrumú Következetes 40+ tápanyag minden bejegyzésben
Adatformátum MongoDB dump, bonyolult beágyazott JSON Tiszta CSV és JSON
Licenc Nyílt Adatbázis Licenc (ODbL) CC BY-SA 4.0

Az Open Food Facts a szélességben jeleskedik — ha egy konkrét ismeretlen terméket kell vonalkód alapján keresned, valószínűleg megtalálod. A Nutrola adatbázis a mélységben és a következetességben jeleskedik — minden bejegyzés megfelel ugyanannak a minőségi mércének, így megbízhatóbb a kvantitatív elemzéshez, ahol az adatgapságok vagy hibák torzíthatják az eredményeket.

Ha vonalkód-olvasó alkalmazást építesz, és maximális termék lefedettségre van szükséged, az Open Food Facts jó kiindulópont. Ha gépi tanulási modellt tanítasz, statisztikai kutatást végzel, vagy olyan alkalmazást építesz, ahol a táplálkozási pontosság számít, a Nutrola adatbázis ellenőrzött adatai erősebb alapot adnak.

Kezdés

Miután letöltötted az adatbázist, itt egy gyors példa a betöltésére és felfedezésére Pythonban:

import pandas as pd

# Az adatbázis betöltése
df = pd.read_csv("nutrola-open-food-dataset-v3.csv")

# Alapvető áttekintés
print(f"Összes bejegyzés: {len(df):,}")
print(f"Fedezett országok: {df['country'].nunique()}")
print(f"Élelmiszer kategóriák (L1): {df['category_l1'].nunique()}")

# Magas fehérjetartalmú, alacsony kalóriatartalmú élelmiszerek keresése
high_protein = df[
    (df["protein_g"] > 20) &
    (df["calories_per_100g"] < 150)
].sort_values("protein_g", ascending=False)

print(high_protein[["food_name", "calories_per_100g", "protein_g"]].head(10))
# Az átlagos makrók elemzése élelmiszer kategóriánként
category_macros = df.groupby("category_l1").agg({
    "calories_per_100g": "mean",
    "protein_g": "mean",
    "fat_total_g": "mean",
    "carbs_total_g": "mean"
}).round(1)

print(category_macros.sort_values("calories_per_100g", ascending=False))

További példák — beleértve R scripteket, SQL import útmutatókat és Jupyter notebookokat — elérhetők a GitHub tároló scripts/ könyvtárában.

GYIK

Az adatbázis valóban ingyenesen használható?

Igen. A Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis a CC BY-SA 4.0 licenc alatt került kiadásra, amely kereskedelmi és nem kereskedelmi felhasználást is megenged. Az egyetlen követelmény, hogy meg kell említened a Nutrolát forrásként, és hogy bármely származékos adatbázist, amelyet terjesztesz, ugyanazzal a licenccel kell ellátnod. Nincsenek API kulcsok, nincsenek használati korlátok, és regisztrációra sincs szükség a fájlok letöltéséhez.

Milyen gyakran frissítik az adatbázist?

Negyedévente új verziókat adunk ki. Minden kiadás új élelmiszerbejegyzéseket ad hozzá, javítja a korábbi verzió óta azonosított hibákat, és frissíti a reformált termékek bejegyzéseit. A GitHub tároló Kiadások oldalán megtalálod a teljes verziótörténetet, és figyelheted a tárolót, hogy értesülj a legújabb verziók megjelenéséről.

Használhatom ezt az adatbázist kereskedelmi alkalmazás építésére?

Igen. A CC BY-SA 4.0 licenc kifejezetten megengedi a kereskedelmi felhasználást. Az adatokat felhasználhatod egy fizetős alkalmazásban, SaaS termékben vagy bármilyen más kereskedelmi kontextusban. A Nutrolát forrásként meg kell említened az alkalmazásodban vagy dokumentációdban, és ha egy módosított verziót terjesztesz az adatbázisból, a módosított verziót is CC BY-SA 4.0 licenc alatt kell terjesztened. Az adatok alkalmazásban való használata (anélkül, hogy a nyers adatbázist újraelosztanád) nem váltja ki a Megosztás követelményt.

Miért csak 500K bejegyzés, amikor a Nutrola teljes adatbázisa 3 millió+?

A nyílt adatbázis olyan bejegyzéseket tartalmaz, amelyeket nyílt licenc alatt tudunk kiadni korlátozások nélkül. A teljes adatbázisunk olyan adatokat tartalmaz, amelyek szabadalmaztatott forrásokból származnak — közvetlen gyártói partnerségek, licencelt laboratóriumi adatok és más források, amelyek szerződéses korlátozásokkal rendelkeznek az újraelosztásra. A nyílt adatbázis 500K bejegyzése kormányzati adatbázisokból, saját laboratóriumi elemzésünkből és közösségi benyújtásokból származik, ahol a hozzájárulók beleegyeztek a nyílt licencbe. Ha a teljes adatbázisra van szükséged, a Nutrition Data API külön kereskedelmi feltételek mellett biztosítja.

Mit tegyek, ha hibát találok az adatbázisban?

Nyiss egy problémát a GitHub tárolón, és írd le a hibás bejegyzés food_id-ját, valamint a hiba leírását. Ha van forráslinked (pl. egy gyártó weboldala, amely más táplálkozási tényeket mutat), azt is csatold. Az adatcsapatunk heti rendszerességgel felülvizsgálja a bejelentett problémákat, és a megerősített javításokat a következő negyedéves kiadásban foglalják bele. Sürgős javítások esetén előfordulhat, hogy a negyedéves frissítések között kiadunk egy javító verziót.

Hogyan kapcsolódik ez a Nutrola Nutrition Data API-hoz?

A nyílt adatbázis egy statikus negyedéves pillanatfelvétel a teljes adatbázisunk válogatott részhalmazáról. Az API valós idejű hozzáférést biztosít a teljes 3 millió+ bejegyzésből álló adatbázishoz keresési, szűrési, vonalkód-keresési és egyéb funkciókkal. Gondolj a nyílt adatbázisra, mint az offline vagy csoportos felhasználási esetek alapjára, és az API-ra, mint a megoldásra a termelési alkalmazások számára, amelyek élő adatokra van szükségük. Sok fejlesztő a nyílt adatbázissal kezdi a prototípusokat, majd az API-ra vált, amikor élesbe állnak.

Készen állsz a táplálkozásod nyomon követésének átalakítására?

Csatlakozz ezrekhez, akik a Nutrolával átalakították az egészségügyi útjukat!