Nutrola Açık Gıda Beslenme Veritabanı: 500K+ Gıda İndirme İçin Mevcut

Nutrola'nın 500K+ doğrulanmış gıda kaydını içeren açık gıda beslenme veritabanını indirin. Kalori, makro, mikro besinler ve porsiyon boyutları dahil. Araştırma, geliştirme ve eğitim için CSV ve JSON formatında mevcuttur.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

İyi beslenme verisi bulmak oldukça zor. Araştırmacılar, devlet veritabanlarını temizlemek için haftalar harcıyor. Geliştiriciler, her ay bozulan kırılgan tarayıcılar yazıyor. Tez yazan öğrenciler, kapsamlı bir veri seti oluşturmanın akademik zaman diliminde gerçekçi olmadığını bildikleri için küçük, güncel olmayan örneklerle yetinmek zorunda kalıyorlar.

Nutrola'nın gıda veritabanını kalori takip uygulamamızı desteklemek için oluşturduk ve son üç yılda bu verilerin doğru, kapsamlı ve iyi yapılandırılmış olmasına büyük yatırımlar yaptık. Bugün, bu veritabanının özenle hazırlanmış bir alt kümesini açık bir veri seti olarak yayımlıyoruz: 500,000'den fazla doğrulanmış gıda kaydı, CSV ve JSON formatlarında ücretsiz indirme için mevcut.

Bu yazıda veri seti hakkında bilmeniz gereken her şeyi ele alıyoruz — içeriği, nasıl indirileceği, şeması, lisanslama, kalite metodolojisi ve diğer kamuya açık beslenme veri kaynaklarıyla nasıl karşılaştırıldığı.

Veri Setinde Neler Var

Nutrola Açık Gıda Beslenme Veritabanı, ham malzemelerden, genel gıdalardan, markalı tüketici ürünlerine ve yaygın restoran öğelerine kadar 500,000'den fazla gıda kaydı içermektedir. Her kayıt, gıda veritabanımızı nasıl oluşturduğumuz başlıklı yazımızda detaylı bir şekilde açıkladığımız çok katmanlı kalite kontrol sürecimizle doğrulanmıştır.

Her gıda kaydı aşağıdaki veri noktalarını içerir:

  • Gıda adı — gıda maddesinin İngilizce'deki yaygın adı, markalar varsa
  • Kalori — 100 gram ve porsiyon başına enerji içeriği (kcal)
  • Makro besinler — protein, toplam yağ, doymuş yağ, trans yağ, toplam karbonhidrat, diyet lifi, toplam şeker ve eklenmiş şeker, hepsi gram cinsinden
  • Mikro besinler — A vitamini, C vitamini, D vitamini, E vitamini, K vitamini, tiamin, riboflavin, niasin, B6 vitamini, folat, B12 vitamini, kalsiyum, demir, magnezyum, fosfor, potasyum, sodyum, çinko, bakır, manganez, selenyum ve daha fazlası dahil 30'dan fazla vitamin ve mineral
  • Porsiyon boyutları — standart porsiyon boyutu açıklaması (örneğin, "1 orta boy elma," "1 su bardağı pişirilmiş"), gram cinsinden porsiyon ağırlığı ve her gıda için üç alternatif porsiyon boyutu
  • Gıda kategorisi — iç sınıflandırmamızı kullanarak hiyerarşik sınıflandırma (örneğin, Süt Ürünleri > Peynir > Sert Peynir)
  • Menşei ülke — gıda ürününün satıldığı veya malzemenin yaygın olarak tüketildiği ana ülke veya bölge
  • Barkod (varsa) — markalı ürünler için UPC veya EAN kodları
  • Veri kaynağı etiketleri — kaydın devlet veritabanlarından, üretici verilerinden, laboratuvar analizlerinden veya iç doğrulama ekibimizden mi geldiğini gösteren kaynak göstergeleri

Örnek Veri

Veri setinin yapısını ve detayını anlamanız için aşağıda bazı kayıtların bir seçkisini bulabilirsiniz:

food_id food_name category country calories_per_100g protein_g fat_g carbs_g fiber_g serving_desc serving_g
NF-001247 Tavuk Göğsü, Çiğ, Derisiz Kümes Hayvanları > Tavuk ABD 120 22.5 2.6 0.0 0.0 1 göğüs (174g) 174
NF-008391 Fage Total 0% Yunan Yoğurdu Süt Ürünleri > Yoğurt > Yunan Yunanistan 54 10.3 0.0 3.0 0.0 1 kap (150g) 150
NF-014205 Basmati Pirinci, Beyaz, Pişirilmiş Tahıllar > Pirinç Hindistan 130 2.7 0.3 28.2 0.4 1 su bardağı (158g) 158
NF-022876 Avokado, Hass, Çiğ Meyveler > Tropikal Meksika 160 2.0 14.7 8.5 6.7 1/2 avokado (68g) 68
NF-031560 Barilla Penne Rigate, Kuru Makarna > Kuru İtalya 359 12.5 2.0 71.2 3.0 2 oz (56g) 56
NF-045892 Kimchi, Geleneksel Napa Lahanası Sebzeler > Fermente Güney Kore 15 1.1 0.5 2.4 1.6 1/2 su bardağı (75g) 75
NF-053714 Somon, Atlas, Çiğ, Yetiştirilen Balık > Somon Norveç 208 20.4 13.4 0.0 0.0 1 dilim (113g) 113
NF-067283 Nohut, Konserve, Süzülmüş Baklagiller > Fasulye ABD 119 6.3 2.0 18.2 5.4 1/2 su bardağı (120g) 120

Tam veri seti, mikro besinler, alternatif porsiyon boyutları, barkod verileri ve kaynak etiketleri için daha fazla sütun içermektedir. Yukarıdaki tablo, temel besin alanlarını göstermektedir.

Veri Formatları

Veri seti iki formatta mevcuttur:

CSV

CSV dosyası, virgül ayırıcıları ile UTF-8 kodlaması kullanır. İlk satır sütun başlıklarını içerir. Virgül içeren alanlar çift tırnak içinde yer alır. Boş değerler, boş alanlar olarak temsil edilir.

CSV formatı, Excel ve Google Sheets gibi elektronik tablo araçları, R ve SPSS gibi istatistik yazılımları ve csvkit veya xsv gibi komut satırı araçlarıyla hızlı veri keşfi için idealdir.

Dosya: nutrola-open-food-dataset-v3.csv (yaklaşık 210 MB sıkıştırılmamış, 48 MB gzipped)

JSON

JSON dosyası, her gıda kaydı için bir nesne içeren bir dizi içerir. Porsiyon boyutları gibi yapılandırılmış alanlar için iç içe nesneler kullanılır (açıklama, gram ağırlığı ve mililitre eşdeğeri içerir) ve mikro besin profilleri.

JSON formatı, uygulama geliştirme, veritabanı içe aktarımları ve porsiyon boyutları ile besin gruplarının hiyerarşik yapısını korumanız gereken herhangi bir iş akışı için daha uygundur.

Dosya: nutrola-open-food-dataset-v3.json (yaklaşık 340 MB sıkıştırılmamış, 62 MB gzipped)

Her iki dosya da indirme sürelerini azaltmak için gzip ile sıkıştırılmış arşivler olarak da mevcuttur.

Veri Şeması

İşte veri setindeki her alan için açıklamalarla birlikte tam şema:

Alan Adı Tür Açıklama
food_id string Gıda kaydı için benzersiz Nutrola tanımlayıcısı (format: NF-XXXXXX)
food_name string Gıdanın yaygın adı, markalar dahil
category_l1 string Üst düzey gıda kategorisi (örneğin, Süt Ürünleri, Tahıllar, Meyveler)
category_l2 string İkinci düzey kategori (örneğin, Peynir, Pirinç, Tropikal)
category_l3 string Varsa üçüncü düzey kategori (örneğin, Sert Peynir, Kahverengi Pirinç)
country string Ana pazarın ISO 3166-1 alpha-2 ülke kodu
brand string Markalı ürünler için marka adı; genel gıdalar için null
barcode string UPC/EAN barkodu; geçerli değilse null
calories_per_100g float 100 gram başına enerji (kcal)
protein_g float 100 gram başına protein (gram)
fat_total_g float 100 gram başına toplam yağ (gram)
fat_saturated_g float 100 gram başına doymuş yağ (gram)
fat_trans_g float 100 gram başına trans yağ (gram)
carbs_total_g float 100 gram başına toplam karbonhidrat (gram)
fiber_g float 100 gram başına diyet lifi (gram)
sugars_total_g float 100 gram başına toplam şeker (gram)
sugars_added_g float 100 gram başına eklenmiş şeker (gram)
sodium_mg float 100 gram başına sodyum (miligram)
cholesterol_mg float 100 gram başına kolesterol (miligram)
vitamin_a_mcg float 100 gram başına A vitamini (mikrogram RAE)
vitamin_c_mg float 100 gram başına C vitamini (miligram)
vitamin_d_mcg float 100 gram başına D vitamini (mikrogram)
calcium_mg float 100 gram başına kalsiyum (miligram)
iron_mg float 100 gram başına demir (miligram)
potassium_mg float 100 gram başına potasyum (miligram)
magnesium_mg float 100 gram başına magnezyum (miligram)
zinc_mg float 100 gram başına çinko (miligram)
phosphorus_mg float 100 gram başına fosfor (miligram)
selenium_mcg float 100 gram başına selenyum (mikrogram)
vitamin_b6_mg float 100 gram başına B6 vitamini (miligram)
vitamin_b12_mcg float 100 gram başına B12 vitamini (mikrogram)
folate_mcg float 100 gram başına folat (mikrogram DFE)
vitamin_e_mg float 100 gram başına E vitamini (miligram)
vitamin_k_mcg float 100 gram başına K vitamini (mikrogram)
thiamin_mg float 100 gram başına tiamin (B1) (miligram)
riboflavin_mg float 100 gram başına riboflavin (B2) (miligram)
niacin_mg float 100 gram başına niasin (B3) (miligram)
copper_mg float 100 gram başına bakır (miligram)
manganese_mg float 100 gram başına manganez (miligram)
serving_1_desc string Birincil porsiyon boyutu açıklaması (örneğin, "1 su bardağı pişirilmiş")
serving_1_g float Birincil porsiyon boyutu ağırlığı (gram)
serving_2_desc string Alternatif porsiyon boyutu açıklaması; mevcut değilse null
serving_2_g float Alternatif porsiyon boyutu ağırlığı (gram)
serving_3_desc string İkinci alternatif porsiyon boyutu açıklaması; mevcut değilse null
serving_3_g float İkinci alternatif porsiyon boyutu ağırlığı (gram)
data_source string Kaynak etiketi: "devlet", "üretici", "laboratuvar" veya "doğrulanmış_topluluk"
last_verified string Kaydın en son doğrulandığı tarih (YYYY-AA-GG)
dataset_version string Veri seti sürüm tanımlayıcısı (örneğin, "v3.0")

Tüm besin değerleri 100 gram başına ifade edilmiştir, böylece tutarlı karşılaştırmalar yapılabilir. Porsiyon başına besin değerlerini hesaplamak için, 100 gram başına değeri porsiyon ağırlığı (gram) ile çarpın ve 100'e bölün.

Nasıl İndirilir

Veri seti, kamuya açık GitHub depomuzda barındırılmaktadır:

github.com/nutrola/open-food-nutrition-dataset

Dosyaları doğrudan GitHub Releases sayfasından indirebilir veya depoyu klonlayabilirsiniz:

git clone https://github.com/nutrola/open-food-nutrition-dataset.git

Sıkıştırılmış sürümler için:

# CSV (gzipped) indirin
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.csv.gz

# JSON (gzipped) indirin
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.json.gz

Depo ayrıca şunları içerir:

  • Hızlı başlangıç talimatları ile detaylı bir README.md
  • Veri seti sürümleri arasındaki değişiklikleri belgeleyen bir CHANGELOG.md
  • Verileri yüklemek, filtrelemek ve analiz etmek için Python ve R örnek betikleri içeren bir scripts/ dizini
  • JSON Şeması ve CSV lehçesi tanımları içeren bir schema/ dizini

Eğer gerçek zamanlı güncellemelerle 3 milyon+ kayıt içeren tam veritabanına ihtiyacınız varsa, geliştirici erişimi için Beslenme Verisi API'mizi inceleyin.

Kullanım Senaryoları

Akademik Araştırma

Beslenme araştırmacıları, veri setini diyet kalıpları analizi, epidemiyolojik modelleme ve besin yoğunluğu çalışmaları için kullanabilirler. Hiyerarşik kategori sistemi, gıda gruplarına göre filtrelemeyi kolaylaştırır ve ülke alanı, kültürler arası karşılaştırmalara olanak tanır.

Yayınlanan araştırmalar, veri setini şu şekilde atıfta bulunmalıdır: Nutrola Açık Gıda Beslenme Veritabanı, v3.0 (2026). github.com/nutrola/open-food-nutrition-dataset adresinde mevcuttur. CC BY-SA 4.0 lisansı altında lisanslanmıştır.

Uygulama Geliştirme

Sağlık, fitness veya gıda ile ilgili uygulamalar geliştiren geliştiriciler, veri setini yerel bir gıda veritabanı olarak kullanabilirler. Tutarlı şema ve porsiyon boyutu verileri, canlı bir API bağlantısına ihtiyaç duymadan işlevsel bir gıda günlüğü özelliği oluşturmanıza olanak tanır. Bu, özellikle çevrimdışı mobil uygulamalar, prototipleme ve hackathon projeleri için faydalıdır.

CSV formatı, SQLite, PostgreSQL veya herhangi bir ilişkisel veritabanına doğrudan yüklenebilir. JSON formatı, MongoDB veya Firestore gibi belge depolarına temiz bir şekilde eşlenir.

Veri Bilimi ve Makine Öğrenimi

Veri seti, gıda ve beslenme ile ilgili makine öğrenimi modellerinin eğitimi ve değerlendirilmesi için uygundur. Yaygın uygulamalar arasında:

  • Gıda sınıflandırma modelleri — gıda isimlerinden veya besin profillerinden gıda kategorilerini tahmin eden sınıflandırıcılar oluşturmak için kategori hiyerarşisini eğitim etiketleri olarak kullanın
  • Besin tahmini — protein, yağ ve karbonhidrat oranlarından kalori veya makro içeriği tahmin eden regresyon modelleri eğitin
  • Tavsiye sistemleri — besin açısından benzer alternatifleri öneren gıda tavsiye motorları oluşturun
  • Anomali tespiti — diğer veri setlerinde veri kalitesi sorunlarını gösterebilecek alışılmadık besin profillerini tanımlayın

Eğitim

Beslenme bilimi öğrencileri ve eğitmenleri, veri setini ders çalışmaları, laboratuvarlar ve ödevler için kullanabilirler. Verinin genişliği — birçok ülkeden gıdaları kapsaması ve her ana gıda grubunu içermesi — makro besin oranları, mikro besin yoğunluğu ve besin profillerinin mutfaklar ve gıda işleme seviyeleri arasında nasıl değiştiği gibi kavramları öğretmek için faydalıdır.

Kamu Sağlığı ve Politika

Kamu sağlığı kuruluşları, belirli gıda kategorileri veya pazarların beslenme manzarasını analiz etmek için verileri kullanabilirler. Ülke alanı, bölgelere göre filtreleme yapmayı sağlar ve marka alanı, markalı ve genel gıda beslenme kalitesinin analizini mümkün kılar.

Veri Kalitesi Metodolojisi

Açık bir veri seti yayımlamak, veriler güvenilir değilse hiçbir anlam ifade etmez. İşte bu sürümdeki 500,000+ kaydın kalitesini nasıl sağladığımız.

Çok Kaynaklı Doğrulama

Veri setindeki her kayıt en az iki bağımsız kaynakla doğrulanmıştır. Ana veri kaynaklarımız şunlardır:

  • Devlet beslenme veritabanları — USDA FoodData Central (Amerika Birleşik Devletleri), CoFID (Birleşik Krallık), NUTTAB (Avustralya), CNF (Kanada) ve 20'den fazla ülkeden eşdeğer veritabanları
  • Üretici tarafından sağlanan veriler — gıda üreticileri tarafından doğrudan gönderilen besin değerleri panelleri
  • Laboratuvar analizi — kaynak verilerin çelişkili veya güncel olmadığı yüksek hacimli gıdalar için ekibimiz tarafından yapılan bağımsız laboratuvar testleri
  • Doğrulanmış topluluk katkıları — üç aşamalı doğrulama sürecinden geçmiş kullanıcı tarafından gönderilen kayıtlar (otomatik çapraz kontrol, uzman incelemesi ve istatistiksel aykırı değer tespiti)

Otomatik Kalite Kontrolleri

Her kayıt, veri setine girmeden önce bir dizi otomatik kontrol sürecinden geçer:

  • Enerji dengesi doğrulaması — kalori sayısı, Atwater hesaplamasıyla (4 kcal/g protein + 9 kcal/g yağ + 4 kcal/g karbonhidrat) çapraz kontrol edilir. Belirtilen kalorilerin hesaplanan değerden %10'dan fazla sapma gösterdiği kayıtlar manuel inceleme için işaretlenir.
  • Aralık kontrolleri — her besin değeri, gıda kategorisi için fizyolojik olarak makul aralıklarla doğrulanır. 0 gram yağ iddia eden bir peynir kaydı veya 50 gram protein iddia eden bir meyve kaydı hemen işaretlenir.
  • Kayıtlar arası tutarlılık — benzer gıdalar istatistiksel olarak karşılaştırılır. Yeni bir tavuk göğsü kaydı, mevcut tavuk göğsü kayıt grubundan önemli ölçüde farklı değerlere sahipse, inceleme için bekletilir.
  • Porsiyon boyutu doğrulaması — porsiyon ağırlıkları bilinen standart porsiyonlarla kontrol edilir. "1 orta boy elma" 500 gram ağırlığında iddia ediliyorsa geçmez.

İnsan İncelemesi

Otomatik kontroller tarafından işaretlenen kayıtlar, beslenme uzmanları ve gıda bilimcilerinden oluşan veri ekibimiz tarafından manuel incelemeye tabi tutulur. Kayıtların yaklaşık %12'si onaylanmadan önce bazı düzeltmeler gerektirir.

Sürekli Bakım

Veri seti tek seferlik bir döküm değildir. Kayıtları sürekli olarak yeniden doğruluyoruz, yüksek hacimli gıdaları (Nutrola kullanıcıları tarafından en sık kaydedilenler) ve kaynak verileri güncellenmiş kayıtları önceliklendiriyoruz. Bir gıda üreticisi bir ürünü yeniden formüle ettiğinde, değişikliği barkod izleme sistemimiz aracılığıyla yakalıyoruz ve kaydı buna göre güncelliyoruz.

Güncelleme Sıklığı

Açık veri setinin yeni sürümlerini her üç ayda bir yayımlıyoruz. Her sürüm şunları içerir:

  • Önceki sürümden bu yana eklenen yeni gıda kayıtları
  • Önceki sürümden bu yana tespit edilen hataların düzeltilmesi
  • Yeniden formüle edilen ürünler için güncellenmiş besin verileri
  • Yeni kaynak verileri mevcut olduğunda genişletilmiş mikro besin kapsamı

Mevcut sürüm v3.0'dır ve Mart 2026'da yayımlanmıştır. Sürüm geçmişi ve değişiklik günlüğü GitHub deposunda mevcuttur.

Eğer üç aydan daha sık güncellenen verilere ihtiyacınız varsa, Beslenme Verisi API'miz değişiklikleri 48 saat içinde yansıtır.

Lisans

Nutrola Açık Gıda Beslenme Veritabanı, Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) lisansı altında yayımlanmıştır.

Bu, şunları yapabileceğiniz anlamına gelir:

  • Paylaşma — veri setini herhangi bir ortamda veya formatta kopyalayabilir ve yeniden dağıtabilirsiniz
  • Uyarlama — veri setini karıştırabilir, dönüştürebilir ve herhangi bir amaçla, ticari kullanım dahil, üzerine inşa edebilirsiniz

Aşağıdaki şartlarla:

  • Atıf — Nutrola'ya uygun bir kredi vermeniz, lisansa bir bağlantı sağlamanız ve değişiklik yapıldıysa belirtmeniz gerekmektedir
  • Aynı Lisansla Paylaşma — eğer veri setini karıştırır, dönüştürür veya üzerine inşa ederseniz, katkılarınızı aynı CC BY-SA 4.0 lisansı altında dağıtmalısınız

CC BY-SA 4.0'ı seçtik çünkü açıklık ile iyileştirmelerin topluluğa geri akmasını sağlamak arasında doğru dengeyi sağlıyor. Eğer bu verinin daha iyi bir versiyonunu oluşturursanız, lisans, iyileştirmelerinizin başkalarına da açık kalmasını garanti eder.

Diğer Veri Setleriyle Karşılaştırma

Birçok kamuya açık beslenme veri seti mevcuttur. İşte Nutrola Açık Gıda Beslenme Veritabanı'nın en yaygın iki alternatifle karşılaştırması.

USDA FoodData Central ile Karşılaştırma

USDA FoodData Central, Amerika Birleşik Devletleri'nde beslenme verileri için altın standarttır. Kapsamlı, iyi belgelenmiş ve laboratuvar analizi ile desteklenmektedir. Ancak, Nutrola veri setinin ele aldığı sınırlamaları vardır:

Boyut USDA FoodData Central Nutrola Açık Veri Seti
Toplam kayıt ~400,000 (Foundation, SR Legacy, Branded birleştirilmiş) 500,000+
Coğrafi kapsam Öncelikle Amerika Birleşik Devletleri 47 ülke
Markalı ürünler Sadece ABD markaları, genellikle güncel değil Uluslararası markalar, üç ayda bir doğrulanmış
Veri formatı Birçok uyumsuz dosya formatı, karmaşık ilişkisel yapı Tek CSV veya JSON dosyası, düz yapı
Porsiyon boyutları Alt veritabanları arasında tutarsız Her gıda için 3'e kadar standart format
Kullanım kolaylığı Alt veritabanlarını birleştirmek için önemli veri mühendisliği gerektirir Tek dosyayı indirin ve çalışmaya başlayın
Güncelleme sıklığı Alt veritabanına göre değişir (bazıları yıllık) Üç ayda bir

Eğer çalışmanız yalnızca ABD gıdalarına odaklanıyorsa ve en derin besin profiline ihtiyacınız varsa (USDA, Foundation gıdalar için 150'den fazla besin maddesini kapsar), FoodData Central daha iyi bir seçimdir. Eğer uluslararası kapsam, tutarlı format ve kutudan çıktığı gibi çalışan bir veri setine ihtiyacınız varsa, Nutrola veri seti daha güçlü bir seçenektir.

İki veri seti tamamlayıcıdır. Birçok araştırmacı, detaylı ABD besin analizi için USDA Foundation verilerini kullanır ve uluslararası kapsam ve markalı ürünler için Nutrola verilerini tamamlar.

Open Food Facts ile Karşılaştırma

Open Food Facts, 3 milyonun üzerinde kayda sahip bir topluluk destekli veritabanıdır. Etkileyici bir ölçeğe sahiptir ve birçok ülkeden ürünleri kapsar. Ancak, topluluk destekli doğası veri kalitesi sorunları doğurur:

Boyut Open Food Facts Nutrola Açık Veri Seti
Toplam kayıt 3M+ 500,000+
Veri kalitesi Değişken — topluluk destekli, otomatik kontrollerle Doğrulanmış — çok kaynaklı, insan incelemeli
Tamlık Birçok kayıtta makro/mikro veri eksik Tüm kayıtlar tam makro veriye sahiptir; %90'dan fazlası tam mikro profillere sahiptir
Porsiyon boyutları Tutarsız, genellikle eksik Standartlaştırılmış, her zaman mevcut
Kategori taksonomisi Topluluk destekli etiketler, tutarsız Hiyerarşik, özenle hazırlanmış taksonomi
Besin kapsamı Kayıtlara göre geniş ölçüde değişir Tüm kayıtlarda tutarlı 40+ besin maddesi
Veri formatı MongoDB dökümü, karmaşık iç içe JSON Temiz CSV ve JSON
Lisans Açık Veri Tabanı Lisansı (ODbL) CC BY-SA 4.0

Open Food Facts, genişlikte mükemmeldir — eğer belirli bir nadir ürünü barkod ile arıyorsanız, muhtemelen onu bulurlar. Nutrola veri seti ise derinlik ve tutarlılıkta mükemmeldir — her kayıt aynı kalite standardını karşılar, bu da veri boşlukları veya hataların sonuçları çarpıtabileceği nicel analizler için daha güvenilir hale getirir.

Eğer bir barkod tarayıcı uygulaması geliştiriyorsanız ve maksimum ürün kapsamına ihtiyacınız varsa, Open Food Facts iyi bir başlangıçtır. Eğer bir makine öğrenimi modeli eğitiyor, istatistiksel araştırma yapıyor veya beslenme doğruluğunun önemli olduğu bir uygulama geliştiriyorsanız, Nutrola veri setinin doğrulanmış verileri size daha sağlam bir temel sağlar.

Başlarken

Veri setini indirdikten sonra, Python'da yükleme ve keşfetme ile ilgili hızlı bir örnek:

import pandas as pd

# Veri setini yükle
df = pd.read_csv("nutrola-open-food-dataset-v3.csv")

# Temel genel bakış
print(f"Toplam kayıt: {len(df):,}")
print(f"Kapsanan ülkeler: {df['country'].nunique()}")
print(f"Gıda kategorileri (L1): {df['category_l1'].nunique()}")

# Yüksek protein, düşük kalori gıdaları bul
high_protein = df[
    (df["protein_g"] > 20) &
    (df["calories_per_100g"] < 150)
].sort_values("protein_g", ascending=False)

print(high_protein[["food_name", "calories_per_100g", "protein_g"]].head(10))
# Gıda kategorisine göre ortalama makroları analiz et
category_macros = df.groupby("category_l1").agg({
    "calories_per_100g": "mean",
    "protein_g": "mean",
    "fat_total_g": "mean",
    "carbs_total_g": "mean"
}).round(1)

print(category_macros.sort_values("calories_per_100g", ascending=False))

Daha fazla örnek — R betikleri, SQL içe aktarma kılavuzları ve Jupyter not defterleri dahil — GitHub deposundaki scripts/ dizininde mevcuttur.

Sıkça Sorulan Sorular

Veri seti gerçekten ücretsiz mi?

Evet. Nutrola Açık Gıda Beslenme Veritabanı, CC BY-SA 4.0 lisansı altında yayımlanmıştır, bu da ticari ve ticari olmayan kullanımlara izin verir. Tek gereklilik, Nutrola'yı kaynak olarak belirtmek ve dağıttığınız türev veri setlerinin aynı lisans altında olmasını sağlamaktır. Dosyaları indirmek için API anahtarları, kullanım kısıtlamaları veya kayıt gerekliliği yoktur.

Veri seti ne sıklıkla güncelleniyor?

Yeni sürümleri her üç ayda bir yayımlıyoruz. Her sürüm, yeni gıda kayıtları ekler, önceki sürümden bu yana tespit edilen hataları düzeltir ve yeniden formüle edilen ürünler için kayıtları günceller. GitHub deposunun Releases sayfasında tam sürüm geçmişi mevcuttur ve yeni sürümler yayımlandığında bildirim almak için depoyu izleyebilirsiniz.

Bu veri setini ticari bir uygulama oluşturmak için kullanabilir miyim?

Evet. CC BY-SA 4.0 lisansı açıkça ticari kullanıma izin verir. Verileri ücretli bir uygulamada, bir SaaS ürününde veya herhangi bir ticari bağlamda kullanabilirsiniz. Uygulamanızda veya belgelerinizde Nutrola'ya atıfta bulunmalısınız ve eğer veri setinin değiştirilmiş bir versiyonunu dağıtırsanız, değiştirilmiş versiyon da CC BY-SA 4.0 lisansı altında olmalıdır. Verileri uygulamanız içinde kullanmak (ham veri setini yeniden dağıtmadan) ShareAlike gerekliliğini tetiklemez.

Nutrola'nın tam veritabanında 3 milyon+ kayıt varken neden sadece 500K kayıt var?

Açık veri seti, kısıtlama olmaksızın açık lisans altında yayımlayabileceğimiz kayıtları içermektedir. Tam veritabanımız, özel kaynaklardan — doğrudan üretici ortaklıkları, lisanslı laboratuvar verileri ve yeniden dağıtımda sözleşme kısıtlamaları olan diğer kaynaklardan — gelen verileri içermektedir. Açık veri setindeki 500K kayıt, devlet veritabanlarından, kendi laboratuvar analizlerimizden ve katkıda bulunanların açık lisans anlaşmasına sahip olduğu topluluk katkılarından gelmektedir. Tam veritabanına erişim için, Beslenme Verisi API'mizi ayrı ticari şartlar altında sağlamaktayız.

Veri setinde bir hata bulursam ne yapmalıyım?

GitHub deposunda, etkilenen kaydın food_id'sini ve hatanın açıklamasını içeren bir sorun açın. Eğer varsa bir kaynak bağlantısı ekleyin (örneğin, farklı besin değerlerini gösteren bir üretici web sitesi). Veri ekibimiz, bildirilen sorunları haftalık olarak gözden geçirir ve onaylanan düzeltmeler bir sonraki üç aylık sürüme dahil edilir. Acil düzeltmeler için, üç aylık güncellemeler arasında bir yamanın yayımlanmasını sağlayabiliriz.

Bu, Nutrola Beslenme Verisi API'si ile nasıl ilişkilidir?

Açık veri seti, veritabanımızın özenle hazırlanmış bir alt kümesinin statik üç aylık bir anlık görüntüsüdür. API, arama, filtreleme, barkod sorgulama ve diğer özelliklerle birlikte tam 3 milyon+ kayıt içeren veritabanına gerçek zamanlı erişim sağlar. Açık veri setini çevrimdışı veya toplu kullanım durumları için bir temel olarak düşünün, API ise canlı verilere ihtiyaç duyan üretim uygulamaları için çözümdür. Birçok geliştirici, prototipleme için açık veri seti ile başlar ve üretime geçtiklerinde API'ye geçiş yapar.

Beslenme takibinizi dönüştürmeye hazır mısınız?

Nutrola ile sağlık yolculuklarını dönüştürmüş binlerce kişiye katılın!