Dataset Nutrizionale Aperto di Nutrola: Oltre 500K Alimenti Disponibili per il Download
Scarica il dataset nutrizionale aperto di Nutrola con oltre 500K voci verificate, inclusi calorie, macronutrienti, micronutrienti e dimensioni delle porzioni. Disponibile in CSV e JSON per ricerca, sviluppo e istruzione.
Trovare dati nutrizionali affidabili è una sfida. I ricercatori impiegano settimane a ripulire i database governativi. Gli sviluppatori scrivono scraper fragili che si rompono ogni mese. Gli studenti che scrivono tesi si accontentano di campioni piccoli e obsoleti, poiché assemblare un dataset completo da zero non è realistico nei tempi accademici.
Abbiamo creato il database alimentare di Nutrola per alimentare la nostra app di tracciamento delle calorie, e negli ultimi tre anni abbiamo investito molto per rendere questi dati accurati, completi e ben strutturati. Oggi rilasciamo un sottoinsieme curato di quel database come dataset aperto: oltre 500.000 voci alimentari verificate disponibili per il download gratuito nei formati CSV e JSON.
Questo post copre tutto ciò che devi sapere sul dataset: cosa contiene, come scaricarlo, lo schema, la licenza, la metodologia di qualità e come si confronta con altre fonti di dati nutrizionali disponibili pubblicamente.
Cosa Contiene il Dataset
Il Dataset Nutrizionale Aperto di Nutrola contiene oltre 500.000 voci alimentari che spaziano da ingredienti freschi, alimenti generici, prodotti di marca e piatti comuni dei ristoranti. Ogni voce è stata verificata attraverso il nostro sistema di controllo qualità multilivello, lo stesso descritto in dettaglio nel nostro post su come abbiamo costruito il nostro database alimentare.
Ogni voce alimentare include i seguenti punti dati:
- Nome del cibo — il nome comune dell'alimento in inglese, con i nomi dei marchi quando applicabile
- Calorie — contenuto energetico in chilocalorie (kcal) per 100 grammi e per porzione
- Macronutrienti — proteine, grassi totali, grassi saturi, grassi trans, carboidrati totali, fibre alimentari, zuccheri totali e zuccheri aggiunti, tutti in grammi
- Micronutrienti — oltre 30 vitamine e minerali, tra cui vitamina A, vitamina C, vitamina D, vitamina E, vitamina K, tiamina, riboflavina, niacina, vitamina B6, folato, vitamina B12, calcio, ferro, magnesio, fosforo, potassio, sodio, zinco, rame, manganese, selenio e altro
- Dimensioni delle porzioni — descrizione della dimensione della porzione standard (es. "1 mela media", "1 tazza cotta"), peso della porzione in grammi e fino a tre dimensioni alternative per ogni alimento
- Categoria alimentare — classificazione gerarchica utilizzando la nostra tassonomia interna (es. Latticini > Formaggio > Formaggio Duro)
- Paese di origine — il paese o la regione principale in cui il prodotto alimentare è venduto o l'ingrediente è comunemente consumato
- Codice a barre (dove disponibile) — codici UPC o EAN per i prodotti di marca
- Tag di origine dei dati — indicatori di provenienza che mostrano se la voce proviene da database governativi, dati dei produttori, analisi di laboratorio o dal nostro team di verifica interna
Dati di Esempio
Ecco una selezione di voci dal dataset per darti un'idea della struttura e dei dettagli:
| food_id | food_name | category | country | calories_per_100g | protein_g | fat_g | carbs_g | fiber_g | serving_desc | serving_g |
|---|---|---|---|---|---|---|---|---|---|---|
| NF-001247 | Petto di Pollo, Crudo, Senza Pelle | Pollame > Pollo | US | 120 | 22.5 | 2.6 | 0.0 | 0.0 | 1 petto (174g) | 174 |
| NF-008391 | Fage Total 0% Yogurt Greco | Latticini > Yogurt > Greco | GR | 54 | 10.3 | 0.0 | 3.0 | 0.0 | 1 contenitore (150g) | 150 |
| NF-014205 | Riso Basmati, Bianco, Cotto | Cereali > Riso | IN | 130 | 2.7 | 0.3 | 28.2 | 0.4 | 1 tazza (158g) | 158 |
| NF-022876 | Avocado, Hass, Crudo | Frutta > Tropicale | MX | 160 | 2.0 | 14.7 | 8.5 | 6.7 | 1/2 avocado (68g) | 68 |
| NF-031560 | Barilla Penne Rigate, Secco | Pasta > Secca | IT | 359 | 12.5 | 2.0 | 71.2 | 3.0 | 2 oz (56g) | 56 |
| NF-045892 | Kimchi, Cavolo Napa Tradizionale | Verdure > Fermentate | KR | 15 | 1.1 | 0.5 | 2.4 | 1.6 | 1/2 tazza (75g) | 75 |
| NF-053714 | Salmone, Atlantico, Crudo, Allevato | Pesce > Salmone | NO | 208 | 20.4 | 13.4 | 0.0 | 0.0 | 1 filetto (113g) | 113 |
| NF-067283 | Ceci, In Scatola, Scolati | Legumi > Fagioli | US | 119 | 6.3 | 2.0 | 18.2 | 5.4 | 1/2 tazza (120g) | 120 |
Il dataset completo include molte più colonne per i micronutrienti, dimensioni alternative delle porzioni, dati sui codici a barre e tag di origine. La tabella sopra mostra i campi nutrizionali principali.
Formati dei Dati
Il dataset è disponibile in due formati:
CSV
Il file CSV utilizza la codifica UTF-8 con delimitatori a virgola. La prima riga contiene le intestazioni delle colonne. I campi che contengono virgole sono racchiusi tra virgolette. I valori nulli sono rappresentati come campi vuoti.
Il formato CSV è ideale per strumenti di fogli di calcolo come Excel e Google Sheets, software statistici come R e SPSS, e per esplorazioni rapide dei dati con strumenti da riga di comando come csvkit o xsv.
File: nutrola-open-food-dataset-v3.csv (circa 210 MB non compressi, 48 MB gzippati)
JSON
Il file JSON contiene un array di oggetti, uno per ogni voce alimentare. Oggetti annidati sono utilizzati per campi strutturati come le dimensioni delle porzioni (che contengono una descrizione, peso in grammi e millilitri equivalenti dove applicabile) e profili di micronutrienti.
Il formato JSON è più adatto per lo sviluppo di applicazioni, importazioni di database e qualsiasi flusso di lavoro in cui è necessario preservare la struttura gerarchica delle dimensioni delle porzioni e dei gruppi di nutrienti.
File: nutrola-open-food-dataset-v3.json (circa 340 MB non compressi, 62 MB gzippati)
Entrambi i file sono disponibili anche come archivi compressi gzip per ridurre i tempi di download.
Schema dei Dati
Ecco lo schema completo con le descrizioni di ogni campo nel dataset:
| Nome Campo | Tipo | Descrizione |
|---|---|---|
food_id |
string | Identificatore unico Nutrola per la voce alimentare (formato: NF-XXXXXX) |
food_name |
string | Nome comune del cibo, incluso il marchio dove applicabile |
category_l1 |
string | Categoria alimentare di primo livello (es. Latticini, Cereali, Frutta) |
category_l2 |
string | Categoria di secondo livello (es. Formaggio, Riso, Tropicale) |
category_l3 |
string | Categoria di terzo livello dove applicabile (es. Formaggio Duro, Riso Integrale) |
country |
string | Codice paese ISO 3166-1 alpha-2 che indica il mercato principale |
brand |
string | Nome del marchio per i prodotti di marca; nullo per alimenti generici |
barcode |
string | Codice a barre UPC/EAN; nullo se non applicabile |
calories_per_100g |
float | Energia in kcal per 100 grammi |
protein_g |
float | Proteine in grammi per 100g |
fat_total_g |
float | Grassi totali in grammi per 100g |
fat_saturated_g |
float | Grassi saturi in grammi per 100g |
fat_trans_g |
float | Grassi trans in grammi per 100g |
carbs_total_g |
float | Carboidrati totali in grammi per 100g |
fiber_g |
float | Fibre alimentari in grammi per 100g |
sugars_total_g |
float | Zuccheri totali in grammi per 100g |
sugars_added_g |
float | Zuccheri aggiunti in grammi per 100g |
sodium_mg |
float | Sodio in milligrammi per 100g |
cholesterol_mg |
float | Colesterolo in milligrammi per 100g |
vitamin_a_mcg |
float | Vitamina A in microgrammi RAE per 100g |
vitamin_c_mg |
float | Vitamina C in milligrammi per 100g |
vitamin_d_mcg |
float | Vitamina D in microgrammi per 100g |
calcium_mg |
float | Calcio in milligrammi per 100g |
iron_mg |
float | Ferro in milligrammi per 100g |
potassium_mg |
float | Potassio in milligrammi per 100g |
magnesium_mg |
float | Magnesio in milligrammi per 100g |
zinc_mg |
float | Zinco in milligrammi per 100g |
phosphorus_mg |
float | Fosforo in milligrammi per 100g |
selenium_mcg |
float | Selenio in microgrammi per 100g |
vitamin_b6_mg |
float | Vitamina B6 in milligrammi per 100g |
vitamin_b12_mcg |
float | Vitamina B12 in microgrammi per 100g |
folate_mcg |
float | Folato in microgrammi DFE per 100g |
vitamin_e_mg |
float | Vitamina E in milligrammi per 100g |
vitamin_k_mcg |
float | Vitamina K in microgrammi per 100g |
thiamin_mg |
float | Tiamina (B1) in milligrammi per 100g |
riboflavin_mg |
float | Riboflavina (B2) in milligrammi per 100g |
niacin_mg |
float | Niacina (B3) in milligrammi per 100g |
copper_mg |
float | Rame in milligrammi per 100g |
manganese_mg |
float | Manganese in milligrammi per 100g |
serving_1_desc |
string | Descrizione della dimensione della porzione principale (es. "1 tazza cotta") |
serving_1_g |
float | Peso della dimensione della porzione principale in grammi |
serving_2_desc |
string | Descrizione della dimensione della porzione alternativa; nullo se non disponibile |
serving_2_g |
float | Peso della dimensione della porzione alternativa in grammi |
serving_3_desc |
string | Descrizione della seconda dimensione della porzione alternativa; nullo se non disponibile |
serving_3_g |
float | Peso della seconda dimensione della porzione alternativa in grammi |
data_source |
string | Tag di provenienza: "governo", "produttore", "laboratorio" o "comunità_verificata" |
last_verified |
string | Data ISO 8601 in cui la voce è stata verificata per l'ultima volta (YYYY-MM-DD) |
dataset_version |
string | Identificatore della versione del dataset (es. "v3.0") |
Tutti i valori nutrizionali sono espressi per 100 grammi per consentire confronti coerenti. Per calcolare i nutrienti per porzione, moltiplica il valore per 100g per il peso della porzione in grammi e dividi per 100.
Come Scaricare
Il dataset è ospitato nel nostro repository pubblico su GitHub:
github.com/nutrola/open-food-nutrition-dataset
Puoi scaricare i file direttamente dalla pagina delle release di GitHub, oppure clonare il repository:
git clone https://github.com/nutrola/open-food-nutrition-dataset.git
Per le versioni compresse:
# Scarica CSV (gzippato)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.csv.gz
# Scarica JSON (gzippato)
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.json.gz
Il repository contiene anche:
- Un dettagliato
README.mdcon istruzioni per un avvio rapido - Un
CHANGELOG.mdche documenta le modifiche tra le versioni del dataset - Una directory
scripts/con script di esempio in Python e R per caricare, filtrare e analizzare i dati - Una directory
schema/con definizioni di JSON Schema e dialetti CSV
Se hai bisogno del database completo con oltre 3 milioni di voci e aggiornamenti in tempo reale piuttosto che snapshot periodici, consulta la nostra Nutrition Data API per l'accesso agli sviluppatori.
Casi d'Uso
Ricerca Accademica
I ricercatori nutrizionali possono utilizzare il dataset per analisi dei modelli dietetici, modellazione epidemiologica e studi sulla densità nutrizionale senza dover spendere settimane a ripulire e unire file di dati governativi. Il sistema di categorie gerarchiche rende facile filtrare per gruppi alimentari, e il campo paese consente confronti interculturali.
La ricerca pubblicata utilizzando il dataset dovrebbe citarlo come: Dataset Nutrizionale Aperto di Nutrola, v3.0 (2026). Disponibile su github.com/nutrola/open-food-nutrition-dataset. Licenza CC BY-SA 4.0.
Sviluppo di Applicazioni
Gli sviluppatori che costruiscono applicazioni legate alla salute, al fitness o al cibo possono utilizzare il dataset come database alimentare locale. Lo schema coerente e i dati sulle dimensioni delle porzioni significano che puoi costruire una funzionalità di registrazione alimentare senza dipendere da una connessione API attiva. Questo è particolarmente utile per app mobili offline-first, prototipazione e progetti di hackathon.
Il formato CSV si carica direttamente in SQLite, PostgreSQL o qualsiasi database relazionale. Il formato JSON si mappa facilmente su archivi di documenti come MongoDB o Firestore.
Data Science e Machine Learning
Il dataset è ben adatto per addestrare e valutare modelli di machine learning legati al cibo e alla nutrizione. Le applicazioni comuni includono:
- Modelli di classificazione alimentare — utilizza la gerarchia delle categorie come etichette di addestramento per costruire classificatori che prevedono le categorie alimentari dai nomi o dai profili nutrizionali
- Stima nutrizionale — addestra modelli di regressione che prevedono il contenuto calorico o macro da informazioni parziali (es. stimare le calorie da rapporti di proteine, grassi e carboidrati)
- Sistemi di raccomandazione — costruisci motori di raccomandazione alimentare che suggeriscono alternative nutrizionalmente simili
- Rilevamento di anomalie — identifica profili nutrizionali insoliti che potrebbero indicare problemi di qualità dei dati in altri dataset
Istruzione
Gli studenti e gli educatori di scienze nutrizionali possono utilizzare il dataset per corsi, laboratori e compiti. L'ampiezza dei dati — che copre alimenti provenienti da decine di paesi e spazia in ogni principale gruppo alimentare — lo rende utile per insegnare concetti come i rapporti di macronutrienti, la densità di micronutrienti e come i profili nutrizionali variano tra cucine e livelli di lavorazione degli alimenti.
Salute Pubblica e Politica
Le organizzazioni di salute pubblica possono utilizzare i dati per analizzare il panorama nutrizionale di specifiche categorie alimentari o mercati. Il campo paese consente di filtrare per regione, e il campo marchio permette di analizzare la qualità nutrizionale degli alimenti di marca rispetto a quelli generici.
Metodologia di Qualità dei Dati
Rilasciare un dataset aperto non significa nulla se i dati non sono affidabili. Ecco come garantiamo la qualità delle oltre 500.000 voci in questo rilascio.
Verifica Multi-Sorgente
Ogni voce nel dataset è stata verificata contro almeno due fonti indipendenti. Le nostre principali fonti di dati includono:
- Database nutrizionali governativi — USDA FoodData Central (Stati Uniti), CoFID (Regno Unito), NUTTAB (Australia), CNF (Canada) e database equivalenti di oltre 20 paesi
- Dati forniti dai produttori — pannelli nutrizionali forniti direttamente dai produttori alimentari attraverso il nostro programma di partnership con i marchi
- Analisi di laboratorio — test di laboratorio indipendenti condotti dal nostro team per alimenti ad alto volume dove i dati di origine sono conflittuali o obsoleti
- Sottomissioni della comunità verificate — voci inviate dagli utenti che hanno superato il nostro processo di verifica in tre fasi (cross-referencing automatizzato, revisione esperta e rilevamento di outlier statistici)
Controlli di Qualità Automatizzati
Ogni voce passa attraverso una serie di controlli automatizzati prima di entrare nel dataset:
- Validazione del bilancio energetico — il conteggio delle calorie è confrontato con il calcolo di Atwater (4 kcal/g proteine + 9 kcal/g grassi + 4 kcal/g carboidrati). Le voci in cui le calorie dichiarate si discostano dal valore calcolato di oltre il 10% vengono segnalate per revisione manuale.
- Controlli di intervallo — ogni valore nutrizionale è convalidato rispetto a intervalli fisiologicamente plausibili per la categoria alimentare. Una voce di formaggio che afferma 0 grammi di grassi o una voce di frutta che afferma 50 grammi di proteine viene immediatamente segnalata.
- Coerenza tra voci — alimenti simili vengono confrontati statisticamente. Se una nuova voce di petto di pollo ha valori significativamente diversi rispetto al cluster esistente di voci di petto di pollo, viene trattenuta per revisione.
- Validazione delle dimensioni delle porzioni — i pesi delle porzioni vengono controllati rispetto a porzioni standard note. Una "1 mela media" che afferma di pesare 500 grammi non passa.
Revisione Umana
Le voci segnalate dai controlli automatizzati vengono sottoposte a revisione manuale dal nostro team di dati, che include nutrizionisti e scienziati alimentari accreditati. Circa il 12% delle voci richiede qualche forma di correzione manuale prima di essere approvata.
Manutenzione Continua
Il dataset non è un dump una tantum. Rivediamo le voci su base continuativa, dando priorità agli alimenti ad alto volume (quelli più frequentemente registrati dagli utenti di Nutrola) e alle voci i cui dati di origine sono stati aggiornati. Quando un produttore alimentare riformula un prodotto, rileviamo la modifica attraverso il nostro sistema di monitoraggio dei codici a barre e aggiorniamo la voce di conseguenza.
Frequenza di Aggiornamento
Pubbliciamo nuove versioni del dataset aperto trimestralmente. Ogni rilascio include:
- Nuove voci alimentari aggiunte dalla versione precedente
- Correzioni a voci esistenti identificate attraverso il nostro monitoraggio della qualità
- Dati nutrizionali aggiornati per prodotti riformulati
- Copertura ampliata dei micronutrienti dove diventano disponibili nuovi dati di origine
L'attuale versione è la v3.0, rilasciata a marzo 2026. La cronologia delle versioni e i changelog sono disponibili nel repository GitHub.
Se hai bisogno di dati aggiornati più frequentemente di trimestralmente, la nostra Nutrition Data API riflette le modifiche entro 48 ore.
Licenza
Il Dataset Nutrizionale Aperto di Nutrola è rilasciato sotto la licenza Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0).
Questo significa che sei libero di:
- Condividere — copiare e ridistribuire il dataset in qualsiasi mezzo o formato
- Adattare — remixare, trasformare e costruire sul dataset per qualsiasi scopo, incluso l'uso commerciale
Sotto i seguenti termini:
- Attribuzione — devi dare il giusto credito a Nutrola, fornire un link alla licenza e indicare se sono state apportate modifiche
- Condividi allo stesso modo — se remixi, trasformi o costruisci sul dataset, devi distribuire i tuoi contributi sotto la stessa licenza CC BY-SA 4.0
Abbiamo scelto CC BY-SA 4.0 perché trova il giusto equilibrio tra apertura e garanzia che i miglioramenti tornino alla comunità. Se costruisci una versione migliore di questi dati, la licenza garantisce che i tuoi miglioramenti rimangano disponibili anche per tutti gli altri.
Come Si Confronta con Altri Dataset
Esistono diversi dataset nutrizionali disponibili pubblicamente. Ecco come il Dataset Nutrizionale Aperto di Nutrola si confronta con le due alternative più utilizzate.
vs. USDA FoodData Central
USDA FoodData Central è il gold standard per i dati nutrizionali negli Stati Uniti. È completo, ben documentato e supportato da analisi di laboratorio. Tuttavia, ha limitazioni che il dataset Nutrola affronta:
| Dimensione | USDA FoodData Central | Dataset Nutrola Aperto |
|---|---|---|
| Voci totali | ~400.000 (Fondazione, SR Legacy, Branded combinati) | Oltre 500.000 |
| Copertura geografica | Principalmente Stati Uniti | 47 paesi |
| Prodotti di marca | Solo marchi statunitensi, spesso obsoleti | Marchi internazionali, verificati trimestralmente |
| Formato dei dati | Molti formati di file incompatibili, struttura relazionale complessa | Unico file CSV o JSON, struttura piatta |
| Dimensioni delle porzioni | Incoerenti tra i sottodatabase | Formato standardizzato con fino a 3 porzioni per alimento |
| Facilità d'uso | Richiede ingegneria dei dati significativa per unire i sottodatabase | Scarica un file e inizia a lavorare |
| Frequenza di aggiornamento | Varia a seconda del sottodatabase (annuale per alcuni) | Trimestrale |
Se il tuo lavoro è focalizzato esclusivamente su alimenti statunitensi e hai bisogno del profilo nutrizionale più dettagliato (USDA copre oltre 150 nutrienti per gli alimenti di Fondazione), FoodData Central è la scelta migliore. Se hai bisogno di copertura internazionale, formati coerenti e un dataset che funzioni immediatamente, il dataset Nutrola è l'opzione più forte.
I due dataset sono complementari. Molti ricercatori utilizzano i dati della Fondazione USDA per analisi nutrizionali dettagliate negli Stati Uniti e integrano i dati Nutrola per copertura internazionale e prodotti di marca.
vs. Open Food Facts
Open Food Facts è un database crowdsourced con oltre 3 milioni di voci. Ha una scala impressionante e copre prodotti da molti paesi. Tuttavia, la sua natura crowdsourced introduce sfide di qualità dei dati:
| Dimensione | Open Food Facts | Dataset Nutrola Aperto |
|---|---|---|
| Voci totali | 3M+ | Oltre 500.000 |
| Qualità dei dati | Variabile — crowdsourced con controlli automatizzati | Verificato — multi-sorgente, revisionato da umani |
| Completezza | Molte voci mancano di dati macro/micro | Tutte le voci hanno dati macro completi; oltre il 90% ha profili micro completi |
| Dimensioni delle porzioni | Incoerenti, spesso mancanti | Standardizzate, sempre presenti |
| Tassonomia delle categorie | Tag crowdsourced, incoerenti | Tassonomia gerarchica, curata |
| Copertura nutrizionale | Varia ampiamente per voce | Coerente 40+ nutrienti in tutte le voci |
| Formato dei dati | Dump MongoDB, JSON annidato complesso | CSV e JSON puliti |
| Licenza | Open Database License (ODbL) | CC BY-SA 4.0 |
Open Food Facts eccelle in ampiezza: se hai bisogno di cercare un prodotto specifico e oscuro tramite codice a barre, probabilmente lo hanno. Il dataset Nutrola eccelle in profondità e coerenza: ogni voce soddisfa lo stesso standard di qualità, rendendolo più affidabile per analisi quantitative dove lacune o errori nei dati possono distorcere i risultati.
Se stai costruendo un'app di scansione dei codici a barre e hai bisogno della massima copertura dei prodotti, Open Food Facts è un buon punto di partenza. Se stai addestrando un modello di machine learning, conducendo ricerche statistiche o costruendo un'app in cui l'accuratezza nutrizionale è importante, i dati verificati del dataset Nutrola ti forniranno una base più solida.
Iniziare
Una volta scaricato il dataset, ecco un esempio rapido di come caricarlo e esplorarlo in Python:
import pandas as pd
# Carica il dataset
df = pd.read_csv("nutrola-open-food-dataset-v3.csv")
# Panoramica di base
print(f"Voci totali: {len(df):,}")
print(f"Paesi coperti: {df['country'].nunique()}")
print(f"Categorie alimentari (L1): {df['category_l1'].nunique()}")
# Trova alimenti ad alto contenuto proteico e a basso contenuto calorico
high_protein = df[
(df["protein_g"] > 20) &
(df["calories_per_100g"] < 150)
].sort_values("protein_g", ascending=False)
print(high_protein[["food_name", "calories_per_100g", "protein_g"]].head(10))
# Analizza i macro medi per categoria alimentare
category_macros = df.groupby("category_l1").agg({
"calories_per_100g": "mean",
"protein_g": "mean",
"fat_total_g": "mean",
"carbs_total_g": "mean"
}).round(1)
print(category_macros.sort_values("calories_per_100g", ascending=False))
Altri esempi — inclusi script R, guide per l'importazione SQL e notebook Jupyter — sono disponibili nella directory scripts/ del repository GitHub.
Domande Frequenti
Il dataset è davvero gratuito da usare?
Sì. Il Dataset Nutrizionale Aperto di Nutrola è rilasciato sotto la licenza CC BY-SA 4.0, che consente l'uso commerciale e non commerciale. L'unico requisito è che tu accrediti Nutrola come fonte e che eventuali dataset derivati che distribuisci utilizzino la stessa licenza. Non ci sono chiavi API, limiti di utilizzo e non è necessaria registrazione per scaricare i file.
Con quale frequenza viene aggiornato il dataset?
Pubbliciamo nuove versioni trimestralmente. Ogni rilascio aggiunge nuove voci alimentari, corregge eventuali errori identificati dalla versione precedente e aggiorna le voci per i prodotti che sono stati riformulati. La pagina delle release del repository GitHub ha la cronologia completa delle versioni, e puoi seguire il repository per essere notificato quando vengono pubblicate nuove versioni.
Posso utilizzare questo dataset per costruire un'app commerciale?
Sì. La licenza CC BY-SA 4.0 consente esplicitamente l'uso commerciale. Puoi utilizzare i dati in un'app a pagamento, in un prodotto SaaS o in qualsiasi altro contesto commerciale. Devi includere attribuzione a Nutrola nella tua app o documentazione, e se distribuisci una versione modificata del dataset stesso, la versione modificata deve essere anch'essa rilasciata sotto CC BY-SA 4.0. Utilizzare i dati all'interno della tua app (senza ridistribuire il dataset grezzo) non attiva il requisito di Condividi allo stesso modo.
Perché solo 500K voci quando il database completo di Nutrola ha oltre 3 milioni?
Il dataset aperto contiene voci che possiamo rilasciare sotto una licenza aperta senza restrizioni. Il nostro database completo include dati provenienti da fonti proprietarie — partnership dirette con i produttori, dati di laboratorio concessi in licenza e altre fonti con limitazioni contrattuali sulla ridistribuzione. Le 500K voci nel dataset aperto provengono da database governativi, dalla nostra analisi di laboratorio e da sottomissioni della comunità in cui i contributori hanno accettato la licenza aperta. Se hai bisogno di accesso al database completo, la nostra Nutrition Data API lo fornisce con termini commerciali separati.
Cosa devo fare se trovo un errore nel dataset?
Apri un problema nel repository GitHub con il food_id della voce interessata e una descrizione dell'errore. Includi un link alla fonte se ne hai uno (es. un sito web del produttore che mostra fatti nutrizionali diversi). Il nostro team di dati esamina i problemi segnalati settimanalmente, e le correzioni confermate vengono incluse nel rilascio trimestrale successivo. Per correzioni urgenti, potremmo rilasciare una patch tra gli aggiornamenti trimestrali.
Come si relaziona questo con la Nutrola Nutrition Data API?
Il dataset aperto è uno snapshot statico trimestrale di un sottoinsieme curato del nostro database. L'API fornisce accesso in tempo reale al database completo con oltre 3 milioni di voci, con funzionalità di ricerca, filtraggio, ricerca codici a barre e altro. Pensa al dataset aperto come alla base per casi d'uso offline o batch, e all'API come alla soluzione per applicazioni di produzione che necessitano di dati live. Molti sviluppatori iniziano con il dataset aperto per la prototipazione e migrano all'API quando vanno in produzione.
Pronto a trasformare il tuo monitoraggio nutrizionale?
Unisciti a migliaia di persone che hanno trasformato il loro percorso verso la salute con Nutrola!