Nutrola Nyílt Élelmiszer Táplálkozási Adatbázisa: 500K+ Élelmiszer Letöltése
Töltsd le a Nutrola nyílt élelmiszer táplálkozási adatbázisát, amely 500K+ ellenőrzött bejegyzést tartalmaz kalóriákról, makrókról, mikrotápanyagokról és adagméretekről. Elérhető CSV és JSON formátumban kutatás, fejlesztés és oktatás céljából.
Jó minőségű táplálkozási adatok beszerzése nem könnyű feladat. A kutatók hetekig takarítják a kormányzati adatbázisokat. A fejlesztők törékeny adatgyűjtő programokat írnak, amelyek havonta elromlanak. A szakdolgozatot író diákok gyakran elavult, kis mintákra kényszerülnek, mert egy átfogó adatbázis összeállítása nem reális az akadémiai időkeretben.
A Nutrola élelmiszer adatbázisát a kalóriaszámláló alkalmazásunk támogatására építettük, és az elmúlt három évben jelentős erőforrást fektettünk abba, hogy az adatok pontosak, átfogóak és jól strukturáltak legyenek. Ma egy válogatott részhalmazt adunk ki ebből az adatbázisból nyílt adatként: több mint 500,000 ellenőrzött élelmiszerbejegyzés érhető el ingyenes letöltésre CSV és JSON formátumban.
Ez a bejegyzés mindent tartalmaz, amit tudnod kell az adatbázisról — mi található benne, hogyan töltheted le, a séma, licencelés, minőségi módszertan, és hogyan viszonyul más nyilvánosan elérhető táplálkozási adatforrásokhoz.
Mi található az adatbázisban
A Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis több mint 500,000 élelmiszerbejegyzést tartalmaz, amelyek nyers alapanyagokat, általános élelmiszereket, márkás fogyasztói termékeket és gyakori éttermi ételeket ölelnek fel. Minden bejegyzést ellenőriztünk a több rétegű minőségellenőrzési folyamatunkon keresztül, amelyet részletesen bemutatunk a hogyan építettük fel az élelmiszer adatbázisunkat című bejegyzésünkben.
Minden élelmiszerbejegyzés a következő adatpontokat tartalmazza:
- Élelmiszer neve — az élelmiszer közönséges neve angolul, márkanevekkel, ahol alkalmazható
- Kalóriák — energiatartalom kilokalóriában (kcal) 100 grammonként és adagonként
- Makrotápanyagok — fehérje, összes zsír, telített zsír, transz zsír, összes szénhidrát, élelmi rost, összes cukor és hozzáadott cukor, mind grammban
- Mikrotápanyagok — 30+ vitamin és ásványi anyag, beleértve az A-vitamint, C-vitamint, D-vitamint, E-vitamint, K-vitamint, tiamin, riboflavin, niacin, B6-vitamint, folát, B12-vitamint, kalciumot, vasat, magnéziumot, foszfort, káliumot, nátriumot, cinket, rezet, mangánt, szelént és még sok mást
- Adagméretek — standard adagméret leírás (pl. "1 közepes alma", "1 csésze főtt"), adag súlya grammban, és legfeljebb három alternatív adagméret élelmiszerenként
- Élelmiszer kategória — hierarchikus besorolás a belső taxonómiánk szerint (pl. Tejtermékek > Sajtok > Kemény sajtok)
- Származási ország — az elsődleges ország vagy régió, ahol az élelmiszerterméket értékesítik, vagy az összetevőt általában fogyasztják
- Vonalkód (ha elérhető) — UPC vagy EAN kódok a márkás termékekhez
- Adatforrás címkék — származási mutatók, amelyek megmutatják, hogy a bejegyzés kormányzati adatbázisból, gyártói adatokból, laboratóriumi elemzésből vagy a belső ellenőrző csapatunkból származik
Mintapélda
Itt van néhány bejegyzés az adatbázisból, hogy érzékeld a struktúrát és a részletességet:
| food_id | food_name | category | country | calories_per_100g | protein_g | fat_g | carbs_g | fiber_g | serving_desc | serving_g |
|---|---|---|---|---|---|---|---|---|---|---|
| NF-001247 | Csirkemell, Nyers, Bőr nélküli | Szárnyas > Csirke | US | 120 | 22.5 | 2.6 | 0.0 | 0.0 | 1 mell (174g) | 174 |
| NF-008391 | Fage Total 0% Görög Joghurt | Tejtermékek > Joghurt > Görög | GR | 54 | 10.3 | 0.0 | 3.0 | 0.0 | 1 doboz (150g) | 150 |
| NF-014205 | Basmati Rizs, Fehér, Főtt | Gabonafélék > Rizs | IN | 130 | 2.7 | 0.3 | 28.2 | 0.4 | 1 csésze (158g) | 158 |
| NF-022876 | Avokádó, Hass, Nyers | Gyümölcsök > Trópusi | MX | 160 | 2.0 | 14.7 | 8.5 | 6.7 | 1/2 avokádó (68g) | 68 |
| NF-031560 | Barilla Penne Rigate, Száraz | Tészta > Száraz | IT | 359 | 12.5 | 2.0 | 71.2 | 3.0 | 2 oz (56g) | 56 |
| NF-045892 | Kimchi, Hagyományos Napa Káposzta | Zöldségek > Erjesztett | KR | 15 | 1.1 | 0.5 | 2.4 | 1.6 | 1/2 csésze (75g) | 75 |
| NF-053714 | Lazac, Atlanti, Nyers, Tenyésztett | Halak > Lazac | NO | 208 | 20.4 | 13.4 | 0.0 | 0.0 | 1 filé (113g) | 113 |
| NF-067283 | Csicseriborsó, Konzerv, Leöntve | Hüvelyesek > Bab | US | 119 | 6.3 | 2.0 | 18.2 | 5.4 | 1/2 csésze (120g) | 120 |
A teljes adatbázis sokkal több oszlopot tartalmaz a mikrotápanyagokról, alternatív adagméretekről, vonalkód adatokról és forrást címkékről. A fenti táblázat a legfontosabb tápanyagtartalmi mezőket mutatja.
Adatformátumok
Az adatbázis két formátumban érhető el:
CSV
A CSV fájl UTF-8 kódolást használ, vesszővel elválasztva. Az első sor oszlopfejléceket tartalmaz. Azok a mezők, amelyek vesszőt tartalmaznak, dupla idézőjelek közé vannak zárva. A null értékek üres mezőkként jelennek meg.
A CSV formátum ideális táblázatkezelő eszközök, mint az Excel és a Google Sheets, statisztikai szoftverek, mint az R és SPSS, valamint gyors adatfeltárásra parancssori eszközökkel, mint a csvkit vagy xsv.
Fájl: nutrola-open-food-dataset-v3.csv (kb. 210 MB kicsomagolva, 48 MB tömörítve)
JSON
A JSON fájl egy objektumokból álló tömböt tartalmaz, egyet minden élelmiszerbejegyzéshez. Beágyazott objektumok használatosak a strukturált mezők, például az adagméretek (amelyek tartalmazzák a leírást, grammban mért súlyt és milliliter megfelelőjét, ahol alkalmazható) és a mikrotápanyag profilok számára.
A JSON formátum jobban megfelel alkalmazásfejlesztéshez, adatbázis-importáláshoz és bármilyen munkafolyamathoz, ahol meg kell őrizni az adagméretek és tápanyagcsoportok hierarchikus struktúráját.
Fájl: nutrola-open-food-dataset-v3.json (kb. 340 MB kicsomagolva, 62 MB tömörítve)
Mindkét fájl elérhető gzip tömörített archívumként is, hogy csökkentse a letöltési időt.
Adatséma
Itt található a teljes séma, amely minden mező leírását tartalmazza az adatbázisban:
| Field Name | Type | Description |
|---|---|---|
food_id |
string | A Nutrola egyedi azonosítója az élelmiszerbejegyzéshez (formátum: NF-XXXXXX) |
food_name |
string | Az élelmiszer közönséges neve, beleértve a márkát, ahol alkalmazható |
category_l1 |
string | Legfelső szintű élelmiszer kategória (pl. Tejtermékek, Gabonafélék, Gyümölcsök) |
category_l2 |
string | Második szintű kategória (pl. Sajtok, Rizs, Trópusi) |
category_l3 |
string | Harmadik szintű kategória, ahol alkalmazható (pl. Kemény sajt, Barna rizs) |
country |
string | ISO 3166-1 alpha-2 országkód, amely az elsődleges piacot jelzi |
brand |
string | Márkaneve a márkás termékekhez; null az általános élelmiszerekhez |
barcode |
string | UPC/EAN vonalkód; null, ha nem alkalmazható |
calories_per_100g |
float | Energia kcal/100 grammban |
protein_g |
float | Fehérje grammban/100g |
fat_total_g |
float | Összes zsír grammban/100g |
fat_saturated_g |
float | Telített zsír grammban/100g |
fat_trans_g |
float | Transz zsír grammban/100g |
carbs_total_g |
float | Összes szénhidrát grammban/100g |
fiber_g |
float | Élelmi rost grammban/100g |
sugars_total_g |
float | Összes cukor grammban/100g |
sugars_added_g |
float | Hozzáadott cukor grammban/100g |
sodium_mg |
float | Nátrium milligrammban/100g |
cholesterol_mg |
float | Koleszterin milligrammban/100g |
vitamin_a_mcg |
float | A-vitamin mikrogrammban RAE/100g |
vitamin_c_mg |
float | C-vitamin milligrammban/100g |
vitamin_d_mcg |
float | D-vitamin mikrogrammban/100g |
calcium_mg |
float | Kalcium milligrammban/100g |
iron_mg |
float | Vas milligrammban/100g |
potassium_mg |
float | Kálium milligrammban/100g |
magnesium_mg |
float | Magnézium milligrammban/100g |
zinc_mg |
float | Cink milligrammban/100g |
phosphorus_mg |
float | Foszfor milligrammban/100g |
selenium_mcg |
float | Szelén mikrogrammban/100g |
vitamin_b6_mg |
float | B6-vitamin milligrammban/100g |
vitamin_b12_mcg |
float | B12-vitamin mikrogrammban/100g |
folate_mcg |
float | Folsav mikrogrammban DFE/100g |
vitamin_e_mg |
float | E-vitamin milligrammban/100g |
vitamin_k_mcg |
float | K-vitamin mikrogrammban/100g |
thiamin_mg |
float | Tiamin (B1) milligrammban/100g |
riboflavin_mg |
float | Riboflavin (B2) milligrammban/100g |
niacin_mg |
float | Niacin (B3) milligrammban/100g |
copper_mg |
float | Réz milligrammban/100g |
manganese_mg |
float | Mangán milligrammban/100g |
serving_1_desc |
string | Elsődleges adagméret leírás (pl. "1 csésze főtt") |
serving_1_g |
float | Elsődleges adagméret súlya grammban |
serving_2_desc |
string | Alternatív adagméret leírás; null, ha nem elérhető |
serving_2_g |
float | Alternatív adagméret súlya grammban |
serving_3_desc |
string | Második alternatív adagméret leírás; null, ha nem elérhető |
serving_3_g |
float | Második alternatív adagméret súlya grammban |
data_source |
string | Származási címke: "kormányzati", "gyártó", "laboratórium" vagy "ellenőrzött közösség" |
last_verified |
string | ISO 8601 dátum, amikor a bejegyzést utoljára ellenőrizték (YYYY-MM-DD) |
dataset_version |
string | Az adatbázis verzió azonosítója (pl. "v3.0") |
Minden tápanyagtartalom 100 grammonként van kifejezve, hogy lehetővé tegye a következetes összehasonlítást. Az adagok tápanyagtartalmának kiszámításához szorozd meg a 100 grammonkénti értéket az adag súlyával grammban, majd oszd el 100-zal.
Hogyan töltsd le
Az adatbázis a nyilvános GitHub tárolónkon található:
github.com/nutrola/open-food-nutrition-dataset
A fájlokat közvetlenül a GitHub Kiadások oldaláról töltheted le, vagy klónozhatod a tárolót:
git clone https://github.com/nutrola/open-food-nutrition-dataset.git
A tömörített verziókhoz:
# CSV letöltése (tömörítve)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.csv.gz
# JSON letöltése (tömörítve)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.json.gz
A tárolóban található még:
- Egy részletes
README.md, amely gyors kezdési útmutatót tartalmaz - Egy
CHANGELOG.md, amely dokumentálja a változásokat az adatbázis verziói között - Egy
scripts/könyvtár Python és R példascriptekkel az adatok betöltésére, szűrésére és elemzésére - Egy
schema/könyvtár JSON séma és CSV dialektus definíciókkal
Ha a teljes 3 millió+ bejegyzésből álló adatbázisra van szükséged valós idejű frissítésekkel, lásd a Nutrition Data API oldalunkat a fejlesztői hozzáféréshez.
Felhasználási esetek
Akadémiai Kutatás
A táplálkozási kutatók felhasználhatják az adatbázist étrendi mintázatok elemzésére, epidemiológiai modellezésre és tápanyag sűrűségi tanulmányokra anélkül, hogy heteket kellene tölteniük kormányzati adatfájlok tisztításával és összevonásával. A hierarchikus kategória rendszer lehetővé teszi az élelmiszercsoportok szerinti egyszerű szűrést, a származási mező pedig lehetővé teszi a kultúrák közötti összehasonlítást.
A publikált kutatásoknak hivatkozniuk kell: Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis, v3.0 (2026). Elérhető a github.com/nutrola/open-food-nutrition-dataset oldalon. Licenc: CC BY-SA 4.0.
Alkalmazásfejlesztés
A fejlesztők, akik egészséggel, fitneszszel vagy élelmiszerekkel kapcsolatos alkalmazásokat építenek, helyi élelmiszer adatbázisként használhatják az adatbázist. A következetes séma és adagméret adatok lehetővé teszik, hogy funkcionális élelmiszer naplózási funkciót építsenek anélkül, hogy élő API kapcsolatra lenne szükségük. Ez különösen hasznos offline első mobilalkalmazások, prototípusok és hackathon projektek esetén.
A CSV formátum közvetlenül betölthető SQLite, PostgreSQL vagy bármilyen relációs adatbázisba. A JSON formátum tisztán illeszkedik a dokumentumtárolókhoz, mint a MongoDB vagy Firestore.
Adattudomány és Gépi Tanulás
Az adatbázis jól alkalmazható gépi tanulási modellek betanítására és értékelésére, amelyek az élelmiszerrel és táplálkozással kapcsolatosak. A gyakori alkalmazások közé tartozik:
- Élelmiszer klasszifikáló modellek — a kategória hierarchia használata tanító címkékként, hogy olyan klasszifikátorokat építsenek, amelyek az élelmiszer kategóriákat a nevekből vagy tápanyagprofilokból jósolják
- Táplálkozási becslés — regressziós modellek betanítása, amelyek a kalória vagy makrotápanyag tartalmat becsülik meg részleges információk alapján (pl. kalóriák becslése fehérje, zsír és szénhidrát arányok alapján)
- Ajánlórendszerek — élelmiszerajánló motorok építése, amelyek táplálkozásilag hasonló alternatívákat javasolnak
- Anomália észlelés — szokatlan táplálkozási profilok azonosítása, amelyek adatminőségi problémákra utalhatnak más adatbázisokban
Oktatás
A táplálkozástudományi hallgatók és oktatók felhasználhatják az adatbázist kurzusokhoz, laborokhoz és feladatokhoz. Az adatok széles spektruma — amely élelmiszereket ölel fel tucatnyi országból és minden fő élelmiszercsoportot — hasznos a makrotápanyag arányok, mikrotápanyag sűrűség és a táplálkozási profilok különböző konyhák és élelmiszerfeldolgozási szintek közötti változásaival kapcsolatos fogalmak tanításához.
Közegészségügy és Politika
A közegészségügyi szervezetek felhasználhatják az adatokat az adott élelmiszercsoportok vagy piacok táplálkozási tájának elemzésére. A származási mező lehetővé teszi a régió szerinti szűrést, a márkamező pedig a márkás és általános élelmiszerek táplálkozási minőségének elemzését.
Adatminőségi Módszertan
Nyílt adatbázis kiadása semmit sem ér, ha az adatok nem megbízhatóak. Íme, hogyan biztosítjuk a minőséget a több mint 500,000 bejegyzés esetében, amelyeket most kiadunk.
Többforrásos Ellenőrzés
Minden bejegyzést legalább két független forrás alapján ellenőriztünk. Fő adatforrásaink közé tartoznak:
- Kormányzati táplálkozási adatbázisok — USDA FoodData Central (Egyesült Államok), CoFID (Egyesült Királyság), NUTTAB (Ausztrália), CNF (Kanada) és 20+ ország megfelelő adatbázisai
- Gyártói adatok — táplálkozási tények panelek, amelyeket közvetlenül az élelmiszer gyártók nyújtottak be a márka partnerségi programunkon keresztül
- Laboratóriumi elemzés — független laboratóriumi tesztelés, amelyet csapatunk végez a nagy mennyiségű élelmiszerek esetében, ahol a forrásadatok ellentmondásosak vagy elavultak
- Ellenőrzött közösségi benyújtások — felhasználók által benyújtott bejegyzések, amelyek átestek a háromlépcsős ellenőrzési folyamatunkon (automatikus keresztellenőrzés, szakértői felülvizsgálat és statisztikai kiugró észlelés)
Automatikus Minőségellenőrzések
Minden bejegyzés átesik egy sor automatikus ellenőrzésen, mielőtt bekerülne az adatbázisba:
- Energiaegyensúly-ellenőrzés — a kalóriák számát összehasonlítjuk az Atwater számítással (4 kcal/g fehérje + 9 kcal/g zsír + 4 kcal/g szénhidrát). Azokat a bejegyzéseket, ahol a megadott kalóriák eltérnek a számított értéktől 10%-nál többel, manuális felülvizsgálatra jelöljük.
- Tartományellenőrzések — minden tápanyagértéket élettanilag elfogadható tartományokkal validálunk az élelmiszer kategória szerint. Egy sajtbejegyzés, amely 0 gramm zsírt állít, vagy egy gyümölcsbejegyzés, amely 50 gramm fehérjét állít, azonnal jelölve van.
- Keresztbejegyzés-konzisztencia — hasonló élelmiszerek statisztikai összehasonlítása. Ha egy új csirkemell bejegyzés jelentősen eltérő értékeket mutat a meglévő csirkemell bejegyzések klaszterétől, azt felülvizsgálatra tartjuk.
- Adagméret-ellenőrzés — az adag súlyokat a jól ismert standard adagokkal ellenőrizzük. Egy "1 közepes alma", amely 500 grammot állít, nem teljesíti az ellenőrzést.
Emberi Felülvizsgálat
Az automatikus ellenőrzések által jelölt bejegyzések manuális felülvizsgálaton mennek keresztül az adatcsapatunk által, amely tartalmazza a hitelesített táplálkozási szakembereket és élelmiszertudósokat. A bejegyzések körülbelül 12%-ának valamilyen formában manuális korrekcióra van szüksége, mielőtt jóváhagyják őket.
Folyamatos Karbantartás
Az adatbázis nem egyszeri kiadás. Folyamatosan újraellenőrizzük a bejegyzéseket, prioritást adva a nagy mennyiségű élelmiszereknek (azoknak, amelyeket a Nutrola felhasználói a leggyakrabban naplóznak) és azoknak a bejegyzéseknek, amelyek forrásadatai frissültek. Amikor egy élelmiszergyártó átalakít egy terméket, a vonalkód figyelő rendszerünk segítségével észleljük a változást, és ennek megfelelően frissítjük a bejegyzést.
Frissítési Gyakoriság
Új verziókat negyedévente adunk ki a nyílt adatbázisból. Minden kiadás tartalmazza:
- Az előző verzió óta hozzáadott új élelmiszerbejegyzéseket
- A korábbi verzió óta azonosított hibák javításait
- A reformált termékek frissített táplálkozási adatait
- Kiterjesztett mikrotápanyag lefedettséget, ahol új forrásadatok állnak rendelkezésre
A jelenlegi verzió a v3.0, amely 2026 márciusában jelent meg. A verziótörténet és a változásnaplók elérhetők a GitHub tárolóban.
Ha olyan adatokra van szükséged, amelyek gyakrabban frissülnek, mint negyedévente, a Nutrition Data API 48 órán belül tükrözi a változásokat.
Licenc
A Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis a Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) licenc alatt került kiadásra.
Ez azt jelenti, hogy szabadon:
- Megoszthatod — másolhatod és újraeloszthatod az adatbázist bármilyen médiában vagy formátumban
- Alkalmazhatod — átdolgozhatod, átalakíthatod és építheted az adatbázist bármilyen célra, beleértve a kereskedelmi felhasználást is
Az alábbi feltételek mellett:
- Hivatkozás — megfelelően meg kell említened a Nutrolát, linket kell adnod a licencre, és jelezned kell, ha változtatásokat hajtottál végre
- Megosztás — ha átdolgozod, átalakítod vagy építesz az adatbázison, a hozzájárulásaidat ugyanazzal a CC BY-SA 4.0 licenccel kell terjesztened
A CC BY-SA 4.0-et választottuk, mert megfelelő egyensúlyt teremt a nyitottság és a közösség számára visszafolyó fejlesztések biztosítása között. Ha jobb verziót készítesz az adatokból, a licenc biztosítja, hogy a fejlesztéseid mások számára is elérhetők maradjanak.
Hogyan viszonyul más adatbázisokhoz
Számos nyilvánosan elérhető táplálkozási adatbázis létezik. Íme, hogyan hasonlítható össze a Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis a két legszélesebb körben használt alternatívával.
USDA FoodData Central vs.
Az USDA FoodData Central az Egyesült Államok táplálkozási adatainak arany standardja. Alapos, jól dokumentált és laboratóriumi elemzés támasztja alá. Azonban vannak korlátai, amelyeket a Nutrola adatbázis kezel:
| Dimenzió | USDA FoodData Central | Nutrola Nyílt Adatbázis |
|---|---|---|
| Összes bejegyzés | ~400,000 (Foundation, SR Legacy, Branded kombinálva) | 500,000+ |
| Földrajzi lefedettség | Főként Egyesült Államok | 47 ország |
| Márkás termékek | Csak amerikai márkák, gyakran elavult | Nemzetközi márkák, negyedévente ellenőrzött |
| Adatformátum | Több inkompatibilis fájlformátum, bonyolult relációs struktúra | Egyetlen CSV vagy JSON fájl, lapos struktúra |
| Adagméretek | Inkonzisztens az al-adatbázisok között | Standardizált formátum legfeljebb 3 adag élelmiszerenként |
| Használhatóság | Jelentős adatfeldolgozást igényel az al-adatbázisok összevonásához | Tölts le egy fájlt és kezdj el dolgozni |
| Frissítési gyakoriság | Az al-adatbázisok szerint változó (évente egyeseknél) | Negyedévente |
Ha a munkád kizárólag az amerikai élelmiszerekre összpontosít, és a lehető legmélyebb tápanyagprofilt igényled (az USDA 150+ tápanyagot fed le a Foundation élelmiszerek esetében), akkor a FoodData Central a jobb választás. Ha nemzetközi lefedettségre, következetes formázásra és egy azonnal használható adatbázisra van szükséged, akkor a Nutrola adatbázis a erősebb opció.
A két adatbázis kiegészíti egymást. Sok kutató az USDA Foundation adatokat használja részletes amerikai tápanyag-elemzéshez, és kiegészíti a Nutrola adataival nemzetközi lefedettség és márkás termékek érdekében.
Open Food Facts vs.
Az Open Food Facts egy közösségi adatbázis, amely több mint 3 millió bejegyzést tartalmaz. Imponáló mérete van, és sok országból származó termékeket fed le. Azonban a közösségi alapú természete adatminőségi kihívásokat jelent:
| Dimenzió | Open Food Facts | Nutrola Nyílt Adatbázis |
|---|---|---|
| Összes bejegyzés | 3M+ | 500,000+ |
| Adatminőség | Változó — közösségi alapú, automatikus ellenőrzésekkel | Ellenőrzött — többforrásos, emberi felülvizsgálat |
| Teljesség | Sok bejegyzés hiányzik makro/mikro adatokból | Minden bejegyzés teljes makro adatokkal rendelkezik; 90%+ teljes mikro profilokkal |
| Adagméretek | Inkonzisztens, gyakran hiányzik | Standardizált, mindig jelen van |
| Kategória taxonómia | Közösségi alapú címkék, inkonzisztens | Hierarchikus, válogatott taxonómia |
| Tápanyag lefedettség | Bejegyzésenként széles spektrumú | Következetes 40+ tápanyag minden bejegyzésben |
| Adatformátum | MongoDB dump, bonyolult beágyazott JSON | Tiszta CSV és JSON |
| Licenc | Nyílt Adatbázis Licenc (ODbL) | CC BY-SA 4.0 |
Az Open Food Facts a szélességben jeleskedik — ha egy konkrét ismeretlen terméket kell vonalkód alapján keresned, valószínűleg megtalálod. A Nutrola adatbázis a mélységben és a következetességben jeleskedik — minden bejegyzés megfelel ugyanannak a minőségi mércének, így megbízhatóbb a kvantitatív elemzéshez, ahol az adatgapságok vagy hibák torzíthatják az eredményeket.
Ha vonalkód-olvasó alkalmazást építesz, és maximális termék lefedettségre van szükséged, az Open Food Facts jó kiindulópont. Ha gépi tanulási modellt tanítasz, statisztikai kutatást végzel, vagy olyan alkalmazást építesz, ahol a táplálkozási pontosság számít, a Nutrola adatbázis ellenőrzött adatai erősebb alapot adnak.
Kezdés
Miután letöltötted az adatbázist, itt egy gyors példa a betöltésére és felfedezésére Pythonban:
import pandas as pd
# Az adatbázis betöltése
df = pd.read_csv("nutrola-open-food-dataset-v3.csv")
# Alapvető áttekintés
print(f"Összes bejegyzés: {len(df):,}")
print(f"Fedezett országok: {df['country'].nunique()}")
print(f"Élelmiszer kategóriák (L1): {df['category_l1'].nunique()}")
# Magas fehérjetartalmú, alacsony kalóriatartalmú élelmiszerek keresése
high_protein = df[
(df["protein_g"] > 20) &
(df["calories_per_100g"] < 150)
].sort_values("protein_g", ascending=False)
print(high_protein[["food_name", "calories_per_100g", "protein_g"]].head(10))
# Az átlagos makrók elemzése élelmiszer kategóriánként
category_macros = df.groupby("category_l1").agg({
"calories_per_100g": "mean",
"protein_g": "mean",
"fat_total_g": "mean",
"carbs_total_g": "mean"
}).round(1)
print(category_macros.sort_values("calories_per_100g", ascending=False))
További példák — beleértve R scripteket, SQL import útmutatókat és Jupyter notebookokat — elérhetők a GitHub tároló scripts/ könyvtárában.
GYIK
Az adatbázis valóban ingyenesen használható?
Igen. A Nutrola Nyílt Élelmiszer Táplálkozási Adatbázis a CC BY-SA 4.0 licenc alatt került kiadásra, amely kereskedelmi és nem kereskedelmi felhasználást is megenged. Az egyetlen követelmény, hogy meg kell említened a Nutrolát forrásként, és hogy bármely származékos adatbázist, amelyet terjesztesz, ugyanazzal a licenccel kell ellátnod. Nincsenek API kulcsok, nincsenek használati korlátok, és regisztrációra sincs szükség a fájlok letöltéséhez.
Milyen gyakran frissítik az adatbázist?
Negyedévente új verziókat adunk ki. Minden kiadás új élelmiszerbejegyzéseket ad hozzá, javítja a korábbi verzió óta azonosított hibákat, és frissíti a reformált termékek bejegyzéseit. A GitHub tároló Kiadások oldalán megtalálod a teljes verziótörténetet, és figyelheted a tárolót, hogy értesülj a legújabb verziók megjelenéséről.
Használhatom ezt az adatbázist kereskedelmi alkalmazás építésére?
Igen. A CC BY-SA 4.0 licenc kifejezetten megengedi a kereskedelmi felhasználást. Az adatokat felhasználhatod egy fizetős alkalmazásban, SaaS termékben vagy bármilyen más kereskedelmi kontextusban. A Nutrolát forrásként meg kell említened az alkalmazásodban vagy dokumentációdban, és ha egy módosított verziót terjesztesz az adatbázisból, a módosított verziót is CC BY-SA 4.0 licenc alatt kell terjesztened. Az adatok alkalmazásban való használata (anélkül, hogy a nyers adatbázist újraelosztanád) nem váltja ki a Megosztás követelményt.
Miért csak 500K bejegyzés, amikor a Nutrola teljes adatbázisa 3 millió+?
A nyílt adatbázis olyan bejegyzéseket tartalmaz, amelyeket nyílt licenc alatt tudunk kiadni korlátozások nélkül. A teljes adatbázisunk olyan adatokat tartalmaz, amelyek szabadalmaztatott forrásokból származnak — közvetlen gyártói partnerségek, licencelt laboratóriumi adatok és más források, amelyek szerződéses korlátozásokkal rendelkeznek az újraelosztásra. A nyílt adatbázis 500K bejegyzése kormányzati adatbázisokból, saját laboratóriumi elemzésünkből és közösségi benyújtásokból származik, ahol a hozzájárulók beleegyeztek a nyílt licencbe. Ha a teljes adatbázisra van szükséged, a Nutrition Data API külön kereskedelmi feltételek mellett biztosítja.
Mit tegyek, ha hibát találok az adatbázisban?
Nyiss egy problémát a GitHub tárolón, és írd le a hibás bejegyzés food_id-ját, valamint a hiba leírását. Ha van forráslinked (pl. egy gyártó weboldala, amely más táplálkozási tényeket mutat), azt is csatold. Az adatcsapatunk heti rendszerességgel felülvizsgálja a bejelentett problémákat, és a megerősített javításokat a következő negyedéves kiadásban foglalják bele. Sürgős javítások esetén előfordulhat, hogy a negyedéves frissítések között kiadunk egy javító verziót.
Hogyan kapcsolódik ez a Nutrola Nutrition Data API-hoz?
A nyílt adatbázis egy statikus negyedéves pillanatfelvétel a teljes adatbázisunk válogatott részhalmazáról. Az API valós idejű hozzáférést biztosít a teljes 3 millió+ bejegyzésből álló adatbázishoz keresési, szűrési, vonalkód-keresési és egyéb funkciókkal. Gondolj a nyílt adatbázisra, mint az offline vagy csoportos felhasználási esetek alapjára, és az API-ra, mint a megoldásra a termelési alkalmazások számára, amelyek élő adatokra van szükségük. Sok fejlesztő a nyílt adatbázissal kezdi a prototípusokat, majd az API-ra vált, amikor élesbe állnak.
Készen állsz a táplálkozásod nyomon követésének átalakítására?
Csatlakozz ezrekhez, akik a Nutrolával átalakították az egészségügyi útjukat!