Nutrola Açık Gıda Beslenme Veritabanı: 500K+ Gıda İndirme İçin Mevcut
Nutrola'nın 500K+ doğrulanmış gıda kaydını içeren açık gıda beslenme veritabanını indirin. Kalori, makro, mikro besinler ve porsiyon boyutları dahil. Araştırma, geliştirme ve eğitim için CSV ve JSON formatında mevcuttur.
İyi beslenme verisi bulmak oldukça zor. Araştırmacılar, devlet veritabanlarını temizlemek için haftalar harcıyor. Geliştiriciler, her ay bozulan kırılgan tarayıcılar yazıyor. Tez yazan öğrenciler, kapsamlı bir veri seti oluşturmanın akademik zaman diliminde gerçekçi olmadığını bildikleri için küçük, güncel olmayan örneklerle yetinmek zorunda kalıyorlar.
Nutrola'nın gıda veritabanını kalori takip uygulamamızı desteklemek için oluşturduk ve son üç yılda bu verilerin doğru, kapsamlı ve iyi yapılandırılmış olmasına büyük yatırımlar yaptık. Bugün, bu veritabanının özenle hazırlanmış bir alt kümesini açık bir veri seti olarak yayımlıyoruz: 500,000'den fazla doğrulanmış gıda kaydı, CSV ve JSON formatlarında ücretsiz indirme için mevcut.
Bu yazıda veri seti hakkında bilmeniz gereken her şeyi ele alıyoruz — içeriği, nasıl indirileceği, şeması, lisanslama, kalite metodolojisi ve diğer kamuya açık beslenme veri kaynaklarıyla nasıl karşılaştırıldığı.
Veri Setinde Neler Var
Nutrola Açık Gıda Beslenme Veritabanı, ham malzemelerden, genel gıdalardan, markalı tüketici ürünlerine ve yaygın restoran öğelerine kadar 500,000'den fazla gıda kaydı içermektedir. Her kayıt, gıda veritabanımızı nasıl oluşturduğumuz başlıklı yazımızda detaylı bir şekilde açıkladığımız çok katmanlı kalite kontrol sürecimizle doğrulanmıştır.
Her gıda kaydı aşağıdaki veri noktalarını içerir:
- Gıda adı — gıda maddesinin İngilizce'deki yaygın adı, markalar varsa
- Kalori — 100 gram ve porsiyon başına enerji içeriği (kcal)
- Makro besinler — protein, toplam yağ, doymuş yağ, trans yağ, toplam karbonhidrat, diyet lifi, toplam şeker ve eklenmiş şeker, hepsi gram cinsinden
- Mikro besinler — A vitamini, C vitamini, D vitamini, E vitamini, K vitamini, tiamin, riboflavin, niasin, B6 vitamini, folat, B12 vitamini, kalsiyum, demir, magnezyum, fosfor, potasyum, sodyum, çinko, bakır, manganez, selenyum ve daha fazlası dahil 30'dan fazla vitamin ve mineral
- Porsiyon boyutları — standart porsiyon boyutu açıklaması (örneğin, "1 orta boy elma," "1 su bardağı pişirilmiş"), gram cinsinden porsiyon ağırlığı ve her gıda için üç alternatif porsiyon boyutu
- Gıda kategorisi — iç sınıflandırmamızı kullanarak hiyerarşik sınıflandırma (örneğin, Süt Ürünleri > Peynir > Sert Peynir)
- Menşei ülke — gıda ürününün satıldığı veya malzemenin yaygın olarak tüketildiği ana ülke veya bölge
- Barkod (varsa) — markalı ürünler için UPC veya EAN kodları
- Veri kaynağı etiketleri — kaydın devlet veritabanlarından, üretici verilerinden, laboratuvar analizlerinden veya iç doğrulama ekibimizden mi geldiğini gösteren kaynak göstergeleri
Örnek Veri
Veri setinin yapısını ve detayını anlamanız için aşağıda bazı kayıtların bir seçkisini bulabilirsiniz:
| food_id | food_name | category | country | calories_per_100g | protein_g | fat_g | carbs_g | fiber_g | serving_desc | serving_g |
|---|---|---|---|---|---|---|---|---|---|---|
| NF-001247 | Tavuk Göğsü, Çiğ, Derisiz | Kümes Hayvanları > Tavuk | ABD | 120 | 22.5 | 2.6 | 0.0 | 0.0 | 1 göğüs (174g) | 174 |
| NF-008391 | Fage Total 0% Yunan Yoğurdu | Süt Ürünleri > Yoğurt > Yunan | Yunanistan | 54 | 10.3 | 0.0 | 3.0 | 0.0 | 1 kap (150g) | 150 |
| NF-014205 | Basmati Pirinci, Beyaz, Pişirilmiş | Tahıllar > Pirinç | Hindistan | 130 | 2.7 | 0.3 | 28.2 | 0.4 | 1 su bardağı (158g) | 158 |
| NF-022876 | Avokado, Hass, Çiğ | Meyveler > Tropikal | Meksika | 160 | 2.0 | 14.7 | 8.5 | 6.7 | 1/2 avokado (68g) | 68 |
| NF-031560 | Barilla Penne Rigate, Kuru | Makarna > Kuru | İtalya | 359 | 12.5 | 2.0 | 71.2 | 3.0 | 2 oz (56g) | 56 |
| NF-045892 | Kimchi, Geleneksel Napa Lahanası | Sebzeler > Fermente | Güney Kore | 15 | 1.1 | 0.5 | 2.4 | 1.6 | 1/2 su bardağı (75g) | 75 |
| NF-053714 | Somon, Atlas, Çiğ, Yetiştirilen | Balık > Somon | Norveç | 208 | 20.4 | 13.4 | 0.0 | 0.0 | 1 dilim (113g) | 113 |
| NF-067283 | Nohut, Konserve, Süzülmüş | Baklagiller > Fasulye | ABD | 119 | 6.3 | 2.0 | 18.2 | 5.4 | 1/2 su bardağı (120g) | 120 |
Tam veri seti, mikro besinler, alternatif porsiyon boyutları, barkod verileri ve kaynak etiketleri için daha fazla sütun içermektedir. Yukarıdaki tablo, temel besin alanlarını göstermektedir.
Veri Formatları
Veri seti iki formatta mevcuttur:
CSV
CSV dosyası, virgül ayırıcıları ile UTF-8 kodlaması kullanır. İlk satır sütun başlıklarını içerir. Virgül içeren alanlar çift tırnak içinde yer alır. Boş değerler, boş alanlar olarak temsil edilir.
CSV formatı, Excel ve Google Sheets gibi elektronik tablo araçları, R ve SPSS gibi istatistik yazılımları ve csvkit veya xsv gibi komut satırı araçlarıyla hızlı veri keşfi için idealdir.
Dosya: nutrola-open-food-dataset-v3.csv (yaklaşık 210 MB sıkıştırılmamış, 48 MB gzipped)
JSON
JSON dosyası, her gıda kaydı için bir nesne içeren bir dizi içerir. Porsiyon boyutları gibi yapılandırılmış alanlar için iç içe nesneler kullanılır (açıklama, gram ağırlığı ve mililitre eşdeğeri içerir) ve mikro besin profilleri.
JSON formatı, uygulama geliştirme, veritabanı içe aktarımları ve porsiyon boyutları ile besin gruplarının hiyerarşik yapısını korumanız gereken herhangi bir iş akışı için daha uygundur.
Dosya: nutrola-open-food-dataset-v3.json (yaklaşık 340 MB sıkıştırılmamış, 62 MB gzipped)
Her iki dosya da indirme sürelerini azaltmak için gzip ile sıkıştırılmış arşivler olarak da mevcuttur.
Veri Şeması
İşte veri setindeki her alan için açıklamalarla birlikte tam şema:
| Alan Adı | Tür | Açıklama |
|---|---|---|
food_id |
string | Gıda kaydı için benzersiz Nutrola tanımlayıcısı (format: NF-XXXXXX) |
food_name |
string | Gıdanın yaygın adı, markalar dahil |
category_l1 |
string | Üst düzey gıda kategorisi (örneğin, Süt Ürünleri, Tahıllar, Meyveler) |
category_l2 |
string | İkinci düzey kategori (örneğin, Peynir, Pirinç, Tropikal) |
category_l3 |
string | Varsa üçüncü düzey kategori (örneğin, Sert Peynir, Kahverengi Pirinç) |
country |
string | Ana pazarın ISO 3166-1 alpha-2 ülke kodu |
brand |
string | Markalı ürünler için marka adı; genel gıdalar için null |
barcode |
string | UPC/EAN barkodu; geçerli değilse null |
calories_per_100g |
float | 100 gram başına enerji (kcal) |
protein_g |
float | 100 gram başına protein (gram) |
fat_total_g |
float | 100 gram başına toplam yağ (gram) |
fat_saturated_g |
float | 100 gram başına doymuş yağ (gram) |
fat_trans_g |
float | 100 gram başına trans yağ (gram) |
carbs_total_g |
float | 100 gram başına toplam karbonhidrat (gram) |
fiber_g |
float | 100 gram başına diyet lifi (gram) |
sugars_total_g |
float | 100 gram başına toplam şeker (gram) |
sugars_added_g |
float | 100 gram başına eklenmiş şeker (gram) |
sodium_mg |
float | 100 gram başına sodyum (miligram) |
cholesterol_mg |
float | 100 gram başına kolesterol (miligram) |
vitamin_a_mcg |
float | 100 gram başına A vitamini (mikrogram RAE) |
vitamin_c_mg |
float | 100 gram başına C vitamini (miligram) |
vitamin_d_mcg |
float | 100 gram başına D vitamini (mikrogram) |
calcium_mg |
float | 100 gram başına kalsiyum (miligram) |
iron_mg |
float | 100 gram başına demir (miligram) |
potassium_mg |
float | 100 gram başına potasyum (miligram) |
magnesium_mg |
float | 100 gram başına magnezyum (miligram) |
zinc_mg |
float | 100 gram başına çinko (miligram) |
phosphorus_mg |
float | 100 gram başına fosfor (miligram) |
selenium_mcg |
float | 100 gram başına selenyum (mikrogram) |
vitamin_b6_mg |
float | 100 gram başına B6 vitamini (miligram) |
vitamin_b12_mcg |
float | 100 gram başına B12 vitamini (mikrogram) |
folate_mcg |
float | 100 gram başına folat (mikrogram DFE) |
vitamin_e_mg |
float | 100 gram başına E vitamini (miligram) |
vitamin_k_mcg |
float | 100 gram başına K vitamini (mikrogram) |
thiamin_mg |
float | 100 gram başına tiamin (B1) (miligram) |
riboflavin_mg |
float | 100 gram başına riboflavin (B2) (miligram) |
niacin_mg |
float | 100 gram başına niasin (B3) (miligram) |
copper_mg |
float | 100 gram başına bakır (miligram) |
manganese_mg |
float | 100 gram başına manganez (miligram) |
serving_1_desc |
string | Birincil porsiyon boyutu açıklaması (örneğin, "1 su bardağı pişirilmiş") |
serving_1_g |
float | Birincil porsiyon boyutu ağırlığı (gram) |
serving_2_desc |
string | Alternatif porsiyon boyutu açıklaması; mevcut değilse null |
serving_2_g |
float | Alternatif porsiyon boyutu ağırlığı (gram) |
serving_3_desc |
string | İkinci alternatif porsiyon boyutu açıklaması; mevcut değilse null |
serving_3_g |
float | İkinci alternatif porsiyon boyutu ağırlığı (gram) |
data_source |
string | Kaynak etiketi: "devlet", "üretici", "laboratuvar" veya "doğrulanmış_topluluk" |
last_verified |
string | Kaydın en son doğrulandığı tarih (YYYY-AA-GG) |
dataset_version |
string | Veri seti sürüm tanımlayıcısı (örneğin, "v3.0") |
Tüm besin değerleri 100 gram başına ifade edilmiştir, böylece tutarlı karşılaştırmalar yapılabilir. Porsiyon başına besin değerlerini hesaplamak için, 100 gram başına değeri porsiyon ağırlığı (gram) ile çarpın ve 100'e bölün.
Nasıl İndirilir
Veri seti, kamuya açık GitHub depomuzda barındırılmaktadır:
github.com/nutrola/open-food-nutrition-dataset
Dosyaları doğrudan GitHub Releases sayfasından indirebilir veya depoyu klonlayabilirsiniz:
git clone https://github.com/nutrola/open-food-nutrition-dataset.git
Sıkıştırılmış sürümler için:
# CSV (gzipped) indirin
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.csv.gz
# JSON (gzipped) indirin
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.json.gz
Depo ayrıca şunları içerir:
- Hızlı başlangıç talimatları ile detaylı bir
README.md - Veri seti sürümleri arasındaki değişiklikleri belgeleyen bir
CHANGELOG.md - Verileri yüklemek, filtrelemek ve analiz etmek için Python ve R örnek betikleri içeren bir
scripts/dizini - JSON Şeması ve CSV lehçesi tanımları içeren bir
schema/dizini
Eğer gerçek zamanlı güncellemelerle 3 milyon+ kayıt içeren tam veritabanına ihtiyacınız varsa, geliştirici erişimi için Beslenme Verisi API'mizi inceleyin.
Kullanım Senaryoları
Akademik Araştırma
Beslenme araştırmacıları, veri setini diyet kalıpları analizi, epidemiyolojik modelleme ve besin yoğunluğu çalışmaları için kullanabilirler. Hiyerarşik kategori sistemi, gıda gruplarına göre filtrelemeyi kolaylaştırır ve ülke alanı, kültürler arası karşılaştırmalara olanak tanır.
Yayınlanan araştırmalar, veri setini şu şekilde atıfta bulunmalıdır: Nutrola Açık Gıda Beslenme Veritabanı, v3.0 (2026). github.com/nutrola/open-food-nutrition-dataset adresinde mevcuttur. CC BY-SA 4.0 lisansı altında lisanslanmıştır.
Uygulama Geliştirme
Sağlık, fitness veya gıda ile ilgili uygulamalar geliştiren geliştiriciler, veri setini yerel bir gıda veritabanı olarak kullanabilirler. Tutarlı şema ve porsiyon boyutu verileri, canlı bir API bağlantısına ihtiyaç duymadan işlevsel bir gıda günlüğü özelliği oluşturmanıza olanak tanır. Bu, özellikle çevrimdışı mobil uygulamalar, prototipleme ve hackathon projeleri için faydalıdır.
CSV formatı, SQLite, PostgreSQL veya herhangi bir ilişkisel veritabanına doğrudan yüklenebilir. JSON formatı, MongoDB veya Firestore gibi belge depolarına temiz bir şekilde eşlenir.
Veri Bilimi ve Makine Öğrenimi
Veri seti, gıda ve beslenme ile ilgili makine öğrenimi modellerinin eğitimi ve değerlendirilmesi için uygundur. Yaygın uygulamalar arasında:
- Gıda sınıflandırma modelleri — gıda isimlerinden veya besin profillerinden gıda kategorilerini tahmin eden sınıflandırıcılar oluşturmak için kategori hiyerarşisini eğitim etiketleri olarak kullanın
- Besin tahmini — protein, yağ ve karbonhidrat oranlarından kalori veya makro içeriği tahmin eden regresyon modelleri eğitin
- Tavsiye sistemleri — besin açısından benzer alternatifleri öneren gıda tavsiye motorları oluşturun
- Anomali tespiti — diğer veri setlerinde veri kalitesi sorunlarını gösterebilecek alışılmadık besin profillerini tanımlayın
Eğitim
Beslenme bilimi öğrencileri ve eğitmenleri, veri setini ders çalışmaları, laboratuvarlar ve ödevler için kullanabilirler. Verinin genişliği — birçok ülkeden gıdaları kapsaması ve her ana gıda grubunu içermesi — makro besin oranları, mikro besin yoğunluğu ve besin profillerinin mutfaklar ve gıda işleme seviyeleri arasında nasıl değiştiği gibi kavramları öğretmek için faydalıdır.
Kamu Sağlığı ve Politika
Kamu sağlığı kuruluşları, belirli gıda kategorileri veya pazarların beslenme manzarasını analiz etmek için verileri kullanabilirler. Ülke alanı, bölgelere göre filtreleme yapmayı sağlar ve marka alanı, markalı ve genel gıda beslenme kalitesinin analizini mümkün kılar.
Veri Kalitesi Metodolojisi
Açık bir veri seti yayımlamak, veriler güvenilir değilse hiçbir anlam ifade etmez. İşte bu sürümdeki 500,000+ kaydın kalitesini nasıl sağladığımız.
Çok Kaynaklı Doğrulama
Veri setindeki her kayıt en az iki bağımsız kaynakla doğrulanmıştır. Ana veri kaynaklarımız şunlardır:
- Devlet beslenme veritabanları — USDA FoodData Central (Amerika Birleşik Devletleri), CoFID (Birleşik Krallık), NUTTAB (Avustralya), CNF (Kanada) ve 20'den fazla ülkeden eşdeğer veritabanları
- Üretici tarafından sağlanan veriler — gıda üreticileri tarafından doğrudan gönderilen besin değerleri panelleri
- Laboratuvar analizi — kaynak verilerin çelişkili veya güncel olmadığı yüksek hacimli gıdalar için ekibimiz tarafından yapılan bağımsız laboratuvar testleri
- Doğrulanmış topluluk katkıları — üç aşamalı doğrulama sürecinden geçmiş kullanıcı tarafından gönderilen kayıtlar (otomatik çapraz kontrol, uzman incelemesi ve istatistiksel aykırı değer tespiti)
Otomatik Kalite Kontrolleri
Her kayıt, veri setine girmeden önce bir dizi otomatik kontrol sürecinden geçer:
- Enerji dengesi doğrulaması — kalori sayısı, Atwater hesaplamasıyla (4 kcal/g protein + 9 kcal/g yağ + 4 kcal/g karbonhidrat) çapraz kontrol edilir. Belirtilen kalorilerin hesaplanan değerden %10'dan fazla sapma gösterdiği kayıtlar manuel inceleme için işaretlenir.
- Aralık kontrolleri — her besin değeri, gıda kategorisi için fizyolojik olarak makul aralıklarla doğrulanır. 0 gram yağ iddia eden bir peynir kaydı veya 50 gram protein iddia eden bir meyve kaydı hemen işaretlenir.
- Kayıtlar arası tutarlılık — benzer gıdalar istatistiksel olarak karşılaştırılır. Yeni bir tavuk göğsü kaydı, mevcut tavuk göğsü kayıt grubundan önemli ölçüde farklı değerlere sahipse, inceleme için bekletilir.
- Porsiyon boyutu doğrulaması — porsiyon ağırlıkları bilinen standart porsiyonlarla kontrol edilir. "1 orta boy elma" 500 gram ağırlığında iddia ediliyorsa geçmez.
İnsan İncelemesi
Otomatik kontroller tarafından işaretlenen kayıtlar, beslenme uzmanları ve gıda bilimcilerinden oluşan veri ekibimiz tarafından manuel incelemeye tabi tutulur. Kayıtların yaklaşık %12'si onaylanmadan önce bazı düzeltmeler gerektirir.
Sürekli Bakım
Veri seti tek seferlik bir döküm değildir. Kayıtları sürekli olarak yeniden doğruluyoruz, yüksek hacimli gıdaları (Nutrola kullanıcıları tarafından en sık kaydedilenler) ve kaynak verileri güncellenmiş kayıtları önceliklendiriyoruz. Bir gıda üreticisi bir ürünü yeniden formüle ettiğinde, değişikliği barkod izleme sistemimiz aracılığıyla yakalıyoruz ve kaydı buna göre güncelliyoruz.
Güncelleme Sıklığı
Açık veri setinin yeni sürümlerini her üç ayda bir yayımlıyoruz. Her sürüm şunları içerir:
- Önceki sürümden bu yana eklenen yeni gıda kayıtları
- Önceki sürümden bu yana tespit edilen hataların düzeltilmesi
- Yeniden formüle edilen ürünler için güncellenmiş besin verileri
- Yeni kaynak verileri mevcut olduğunda genişletilmiş mikro besin kapsamı
Mevcut sürüm v3.0'dır ve Mart 2026'da yayımlanmıştır. Sürüm geçmişi ve değişiklik günlüğü GitHub deposunda mevcuttur.
Eğer üç aydan daha sık güncellenen verilere ihtiyacınız varsa, Beslenme Verisi API'miz değişiklikleri 48 saat içinde yansıtır.
Lisans
Nutrola Açık Gıda Beslenme Veritabanı, Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) lisansı altında yayımlanmıştır.
Bu, şunları yapabileceğiniz anlamına gelir:
- Paylaşma — veri setini herhangi bir ortamda veya formatta kopyalayabilir ve yeniden dağıtabilirsiniz
- Uyarlama — veri setini karıştırabilir, dönüştürebilir ve herhangi bir amaçla, ticari kullanım dahil, üzerine inşa edebilirsiniz
Aşağıdaki şartlarla:
- Atıf — Nutrola'ya uygun bir kredi vermeniz, lisansa bir bağlantı sağlamanız ve değişiklik yapıldıysa belirtmeniz gerekmektedir
- Aynı Lisansla Paylaşma — eğer veri setini karıştırır, dönüştürür veya üzerine inşa ederseniz, katkılarınızı aynı CC BY-SA 4.0 lisansı altında dağıtmalısınız
CC BY-SA 4.0'ı seçtik çünkü açıklık ile iyileştirmelerin topluluğa geri akmasını sağlamak arasında doğru dengeyi sağlıyor. Eğer bu verinin daha iyi bir versiyonunu oluşturursanız, lisans, iyileştirmelerinizin başkalarına da açık kalmasını garanti eder.
Diğer Veri Setleriyle Karşılaştırma
Birçok kamuya açık beslenme veri seti mevcuttur. İşte Nutrola Açık Gıda Beslenme Veritabanı'nın en yaygın iki alternatifle karşılaştırması.
USDA FoodData Central ile Karşılaştırma
USDA FoodData Central, Amerika Birleşik Devletleri'nde beslenme verileri için altın standarttır. Kapsamlı, iyi belgelenmiş ve laboratuvar analizi ile desteklenmektedir. Ancak, Nutrola veri setinin ele aldığı sınırlamaları vardır:
| Boyut | USDA FoodData Central | Nutrola Açık Veri Seti |
|---|---|---|
| Toplam kayıt | ~400,000 (Foundation, SR Legacy, Branded birleştirilmiş) | 500,000+ |
| Coğrafi kapsam | Öncelikle Amerika Birleşik Devletleri | 47 ülke |
| Markalı ürünler | Sadece ABD markaları, genellikle güncel değil | Uluslararası markalar, üç ayda bir doğrulanmış |
| Veri formatı | Birçok uyumsuz dosya formatı, karmaşık ilişkisel yapı | Tek CSV veya JSON dosyası, düz yapı |
| Porsiyon boyutları | Alt veritabanları arasında tutarsız | Her gıda için 3'e kadar standart format |
| Kullanım kolaylığı | Alt veritabanlarını birleştirmek için önemli veri mühendisliği gerektirir | Tek dosyayı indirin ve çalışmaya başlayın |
| Güncelleme sıklığı | Alt veritabanına göre değişir (bazıları yıllık) | Üç ayda bir |
Eğer çalışmanız yalnızca ABD gıdalarına odaklanıyorsa ve en derin besin profiline ihtiyacınız varsa (USDA, Foundation gıdalar için 150'den fazla besin maddesini kapsar), FoodData Central daha iyi bir seçimdir. Eğer uluslararası kapsam, tutarlı format ve kutudan çıktığı gibi çalışan bir veri setine ihtiyacınız varsa, Nutrola veri seti daha güçlü bir seçenektir.
İki veri seti tamamlayıcıdır. Birçok araştırmacı, detaylı ABD besin analizi için USDA Foundation verilerini kullanır ve uluslararası kapsam ve markalı ürünler için Nutrola verilerini tamamlar.
Open Food Facts ile Karşılaştırma
Open Food Facts, 3 milyonun üzerinde kayda sahip bir topluluk destekli veritabanıdır. Etkileyici bir ölçeğe sahiptir ve birçok ülkeden ürünleri kapsar. Ancak, topluluk destekli doğası veri kalitesi sorunları doğurur:
| Boyut | Open Food Facts | Nutrola Açık Veri Seti |
|---|---|---|
| Toplam kayıt | 3M+ | 500,000+ |
| Veri kalitesi | Değişken — topluluk destekli, otomatik kontrollerle | Doğrulanmış — çok kaynaklı, insan incelemeli |
| Tamlık | Birçok kayıtta makro/mikro veri eksik | Tüm kayıtlar tam makro veriye sahiptir; %90'dan fazlası tam mikro profillere sahiptir |
| Porsiyon boyutları | Tutarsız, genellikle eksik | Standartlaştırılmış, her zaman mevcut |
| Kategori taksonomisi | Topluluk destekli etiketler, tutarsız | Hiyerarşik, özenle hazırlanmış taksonomi |
| Besin kapsamı | Kayıtlara göre geniş ölçüde değişir | Tüm kayıtlarda tutarlı 40+ besin maddesi |
| Veri formatı | MongoDB dökümü, karmaşık iç içe JSON | Temiz CSV ve JSON |
| Lisans | Açık Veri Tabanı Lisansı (ODbL) | CC BY-SA 4.0 |
Open Food Facts, genişlikte mükemmeldir — eğer belirli bir nadir ürünü barkod ile arıyorsanız, muhtemelen onu bulurlar. Nutrola veri seti ise derinlik ve tutarlılıkta mükemmeldir — her kayıt aynı kalite standardını karşılar, bu da veri boşlukları veya hataların sonuçları çarpıtabileceği nicel analizler için daha güvenilir hale getirir.
Eğer bir barkod tarayıcı uygulaması geliştiriyorsanız ve maksimum ürün kapsamına ihtiyacınız varsa, Open Food Facts iyi bir başlangıçtır. Eğer bir makine öğrenimi modeli eğitiyor, istatistiksel araştırma yapıyor veya beslenme doğruluğunun önemli olduğu bir uygulama geliştiriyorsanız, Nutrola veri setinin doğrulanmış verileri size daha sağlam bir temel sağlar.
Başlarken
Veri setini indirdikten sonra, Python'da yükleme ve keşfetme ile ilgili hızlı bir örnek:
import pandas as pd
# Veri setini yükle
df = pd.read_csv("nutrola-open-food-dataset-v3.csv")
# Temel genel bakış
print(f"Toplam kayıt: {len(df):,}")
print(f"Kapsanan ülkeler: {df['country'].nunique()}")
print(f"Gıda kategorileri (L1): {df['category_l1'].nunique()}")
# Yüksek protein, düşük kalori gıdaları bul
high_protein = df[
(df["protein_g"] > 20) &
(df["calories_per_100g"] < 150)
].sort_values("protein_g", ascending=False)
print(high_protein[["food_name", "calories_per_100g", "protein_g"]].head(10))
# Gıda kategorisine göre ortalama makroları analiz et
category_macros = df.groupby("category_l1").agg({
"calories_per_100g": "mean",
"protein_g": "mean",
"fat_total_g": "mean",
"carbs_total_g": "mean"
}).round(1)
print(category_macros.sort_values("calories_per_100g", ascending=False))
Daha fazla örnek — R betikleri, SQL içe aktarma kılavuzları ve Jupyter not defterleri dahil — GitHub deposundaki scripts/ dizininde mevcuttur.
Sıkça Sorulan Sorular
Veri seti gerçekten ücretsiz mi?
Evet. Nutrola Açık Gıda Beslenme Veritabanı, CC BY-SA 4.0 lisansı altında yayımlanmıştır, bu da ticari ve ticari olmayan kullanımlara izin verir. Tek gereklilik, Nutrola'yı kaynak olarak belirtmek ve dağıttığınız türev veri setlerinin aynı lisans altında olmasını sağlamaktır. Dosyaları indirmek için API anahtarları, kullanım kısıtlamaları veya kayıt gerekliliği yoktur.
Veri seti ne sıklıkla güncelleniyor?
Yeni sürümleri her üç ayda bir yayımlıyoruz. Her sürüm, yeni gıda kayıtları ekler, önceki sürümden bu yana tespit edilen hataları düzeltir ve yeniden formüle edilen ürünler için kayıtları günceller. GitHub deposunun Releases sayfasında tam sürüm geçmişi mevcuttur ve yeni sürümler yayımlandığında bildirim almak için depoyu izleyebilirsiniz.
Bu veri setini ticari bir uygulama oluşturmak için kullanabilir miyim?
Evet. CC BY-SA 4.0 lisansı açıkça ticari kullanıma izin verir. Verileri ücretli bir uygulamada, bir SaaS ürününde veya herhangi bir ticari bağlamda kullanabilirsiniz. Uygulamanızda veya belgelerinizde Nutrola'ya atıfta bulunmalısınız ve eğer veri setinin değiştirilmiş bir versiyonunu dağıtırsanız, değiştirilmiş versiyon da CC BY-SA 4.0 lisansı altında olmalıdır. Verileri uygulamanız içinde kullanmak (ham veri setini yeniden dağıtmadan) ShareAlike gerekliliğini tetiklemez.
Nutrola'nın tam veritabanında 3 milyon+ kayıt varken neden sadece 500K kayıt var?
Açık veri seti, kısıtlama olmaksızın açık lisans altında yayımlayabileceğimiz kayıtları içermektedir. Tam veritabanımız, özel kaynaklardan — doğrudan üretici ortaklıkları, lisanslı laboratuvar verileri ve yeniden dağıtımda sözleşme kısıtlamaları olan diğer kaynaklardan — gelen verileri içermektedir. Açık veri setindeki 500K kayıt, devlet veritabanlarından, kendi laboratuvar analizlerimizden ve katkıda bulunanların açık lisans anlaşmasına sahip olduğu topluluk katkılarından gelmektedir. Tam veritabanına erişim için, Beslenme Verisi API'mizi ayrı ticari şartlar altında sağlamaktayız.
Veri setinde bir hata bulursam ne yapmalıyım?
GitHub deposunda, etkilenen kaydın food_id'sini ve hatanın açıklamasını içeren bir sorun açın. Eğer varsa bir kaynak bağlantısı ekleyin (örneğin, farklı besin değerlerini gösteren bir üretici web sitesi). Veri ekibimiz, bildirilen sorunları haftalık olarak gözden geçirir ve onaylanan düzeltmeler bir sonraki üç aylık sürüme dahil edilir. Acil düzeltmeler için, üç aylık güncellemeler arasında bir yamanın yayımlanmasını sağlayabiliriz.
Bu, Nutrola Beslenme Verisi API'si ile nasıl ilişkilidir?
Açık veri seti, veritabanımızın özenle hazırlanmış bir alt kümesinin statik üç aylık bir anlık görüntüsüdür. API, arama, filtreleme, barkod sorgulama ve diğer özelliklerle birlikte tam 3 milyon+ kayıt içeren veritabanına gerçek zamanlı erişim sağlar. Açık veri setini çevrimdışı veya toplu kullanım durumları için bir temel olarak düşünün, API ise canlı verilere ihtiyaç duyan üretim uygulamaları için çözümdür. Birçok geliştirici, prototipleme için açık veri seti ile başlar ve üretime geçtiklerinde API'ye geçiş yapar.
Beslenme takibinizi dönüştürmeye hazır mısınız?
Nutrola ile sağlık yolculuklarını dönüştürmüş binlerce kişiye katılın!