Nutrolaのオープンフード栄養データセット:50万以上の食品をダウンロード可能
Nutrolaのオープンフード栄養データセットをダウンロードし、カロリー、マクロ栄養素、微量栄養素、サービングサイズを含む50万以上の検証済みエントリーを手に入れましょう。研究、開発、教育のためにCSVとJSON形式で利用可能です。
良質な栄養データは見つけるのが難しいものです。研究者は政府のデータベースを清掃するのに数週間を無駄にし、開発者は毎月壊れる脆弱なスクレイパーを作成します。論文を書く学生は、包括的なデータセットをゼロから組み立てるのが現実的でないため、小さくて古いサンプルに妥協せざるを得ません。
私たちはNutrolaの食品データベースをカロリー追跡アプリのために構築し、過去3年間でそのデータを正確で包括的、かつ整然としたものにするために多大な投資をしてきました。今日は、そのデータベースの厳選されたサブセットをオープンデータセットとして公開します。50万以上の検証済み食品エントリーが、CSVおよびJSON形式で無料ダウンロード可能です。
この記事では、データセットに関するすべての情報をお届けします。内容、ダウンロード方法、スキーマ、ライセンス、品質方法論、他の公に利用可能な栄養データソースとの比較について説明します。
データセットの内容
Nutrolaオープンフード栄養データセットには、生の食材、一般的な食品、ブランド製品、一般的なレストランメニューを含む50万以上の食品エントリーが含まれています。すべてのエントリーは、私たちの多層品質管理プロセスを通じて検証されており、詳細は私たちの食品データベースの構築方法に記載されています。
各食品エントリーには以下のデータポイントが含まれています:
- 食品名 — 食品項目の一般的な名称(英語)、該当する場合はブランド名も含む
- カロリー — 100グラムおよびサービングあたりのエネルギー量(キロカロリー)
- マクロ栄養素 — タンパク質、総脂肪、飽和脂肪、トランス脂肪、総炭水化物、食物繊維、総糖、添加糖(すべてグラム単位)
- 微量栄養素 — ビタミンA、ビタミンC、ビタミンD、ビタミンE、ビタミンK、チアミン、リボフラビン、ナイアシン、ビタミンB6、葉酸、ビタミンB12、カルシウム、鉄、マグネシウム、リン、カリウム、ナトリウム、亜鉛、銅、マンガン、セレンなど30種類以上のビタミンとミネラル
- サービングサイズ — 標準的なサービングサイズの説明(例:「中サイズのリンゴ1個」、「調理済みの1カップ」)、サービングの重さ(グラム単位)、および各食品に対して最大3つの代替サービングサイズ
- 食品カテゴリ — 内部分類を使用した階層的な分類(例:乳製品 > チーズ > 硬いチーズ)
- 原産国 — 食品製品が販売される主な国または地域、または食材が一般的に消費される場所
- バーコード(該当する場合) — ブランド製品のUPCまたはEANコード
- データソースタグ — エントリーが政府のデータベース、製造者データ、実験室分析、または内部検証チームからのものであるかを示す出所の指標
サンプルデータ
以下は、データセットからのエントリーの選択例です。構造と詳細感を感じていただけるでしょう:
| food_id | food_name | category | country | calories_per_100g | protein_g | fat_g | carbs_g | fiber_g | serving_desc | serving_g |
|---|---|---|---|---|---|---|---|---|---|---|
| NF-001247 | 鶏むね肉、生、皮なし | 鳥肉 > 鶏肉 | US | 120 | 22.5 | 2.6 | 0.0 | 0.0 | 1つのむね肉(174g) | 174 |
| NF-008391 | Fage トータル0% ギリシャヨーグルト | 乳製品 > ヨーグルト > ギリシャ | GR | 54 | 10.3 | 0.0 | 3.0 | 0.0 | 1容器(150g) | 150 |
| NF-014205 | バスマティライス、白、調理済み | 穀物 > 米 | IN | 130 | 2.7 | 0.3 | 28.2 | 0.4 | 1カップ(158g) | 158 |
| NF-022876 | アボカド、ハス、生 | 果物 > 熱帯 | MX | 160 | 2.0 | 14.7 | 8.5 | 6.7 | アボカド1/2個(68g) | 68 |
| NF-031560 | バリラ ペンネ リガーテ、乾燥 | パスタ > 乾燥 | IT | 359 | 12.5 | 2.0 | 71.2 | 3.0 | 2オンス(56g) | 56 |
| NF-045892 | キムチ、伝統的な Napa キャベツ | 野菜 > 発酵 | KR | 15 | 1.1 | 0.5 | 2.4 | 1.6 | 1/2カップ(75g) | 75 |
| NF-053714 | サーモン、アトランティック、生、養殖 | 魚 > サーモン | NO | 208 | 20.4 | 13.4 | 0.0 | 0.0 | 1フィレ(113g) | 113 |
| NF-067283 | ひよこ豆、缶詰、排水済み | 豆類 > 豆 | US | 119 | 6.3 | 2.0 | 18.2 | 5.4 | 1/2カップ(120g) | 120 |
フルデータセットには、微量栄養素、代替サービングサイズ、バーコードデータ、出所タグなど、さらに多くの列が含まれています。上記の表は、主要な栄養フィールドを示しています。
データ形式
データセットは2つの形式で利用可能です:
CSV
CSVファイルはUTF-8エンコーディングを使用し、カンマ区切りです。最初の行には列ヘッダーが含まれています。カンマを含むフィールドは二重引用符で囲まれています。NULL値は空のフィールドとして表されます。
CSV形式は、ExcelやGoogle Sheetsなどのスプレッドシートツール、RやSPSSなどの統計ソフトウェア、csvkitやxsvなどのコマンドラインツールでの迅速なデータ探索に最適です。
ファイル:nutrola-open-food-dataset-v3.csv(約210MBの未圧縮、48MBのgzipped)
JSON
JSONファイルは、各食品エントリーごとに1つのオブジェクトを含む配列です。サービングサイズのような構造化されたフィールドや微量栄養素プロファイルのために、ネストされたオブジェクトが使用されています。
JSON形式は、アプリケーション開発、データベースインポート、サービングサイズや栄養グループの階層構造を保持する必要があるワークフローに適しています。
ファイル:nutrola-open-food-dataset-v3.json(約340MBの未圧縮、62MBのgzipped)
両方のファイルは、ダウンロード時間を短縮するためにgzip圧縮アーカイブとしても利用可能です。
データスキーマ
以下は、データセット内のすべてのフィールドの説明を含む完全なスキーマです:
| フィールド名 | タイプ | 説明 |
|---|---|---|
food_id |
string | 食品エントリーのユニークなNutrola識別子(形式:NF-XXXXXX) |
food_name |
string | 食品の一般名、該当する場合はブランド名も含む |
category_l1 |
string | トップレベルの食品カテゴリ(例:乳製品、穀物、果物) |
category_l2 |
string | セカンドレベルのカテゴリ(例:チーズ、米、熱帯) |
category_l3 |
string | 該当する場合のサードレベルのカテゴリ(例:硬いチーズ、ブラウンライス) |
country |
string | 主な市場を示すISO 3166-1 alpha-2国コード |
brand |
string | ブランド製品のブランド名;一般食品の場合はnull |
barcode |
string | UPC/EANバーコード;該当しない場合はnull |
calories_per_100g |
float | 100グラムあたりのエネルギー(kcal) |
protein_g |
float | 100グラムあたりのタンパク質(グラム) |
fat_total_g |
float | 100グラムあたりの総脂肪(グラム) |
fat_saturated_g |
float | 100グラムあたりの飽和脂肪(グラム) |
fat_trans_g |
float | 100グラムあたりのトランス脂肪(グラム) |
carbs_total_g |
float | 100グラムあたりの総炭水化物(グラム) |
fiber_g |
float | 100グラムあたりの食物繊維(グラム) |
sugars_total_g |
float | 100グラムあたりの総糖(グラム) |
sugars_added_g |
float | 100グラムあたりの添加糖(グラム) |
sodium_mg |
float | 100グラムあたりのナトリウム(ミリグラム) |
cholesterol_mg |
float | 100グラムあたりのコレステロール(ミリグラム) |
vitamin_a_mcg |
float | 100グラムあたりのビタミンA(マイクログラムRAE) |
vitamin_c_mg |
float | 100グラムあたりのビタミンC(ミリグラム) |
vitamin_d_mcg |
float | 100グラムあたりのビタミンD(マイクログラム) |
calcium_mg |
float | 100グラムあたりのカルシウム(ミリグラム) |
iron_mg |
float | 100グラムあたりの鉄(ミリグラム) |
potassium_mg |
float | 100グラムあたりのカリウム(ミリグラム) |
magnesium_mg |
float | 100グラムあたりのマグネシウム(ミリグラム) |
zinc_mg |
float | 100グラムあたりの亜鉛(ミリグラム) |
phosphorus_mg |
float | 100グラムあたりのリン(ミリグラム) |
selenium_mcg |
float | 100グラムあたりのセレン(マイクログラム) |
vitamin_b6_mg |
float | 100グラムあたりのビタミンB6(ミリグラム) |
vitamin_b12_mcg |
float | 100グラムあたりのビタミンB12(マイクログラム) |
folate_mcg |
float | 100グラムあたりの葉酸(マイクログラムDFE) |
vitamin_e_mg |
float | 100グラムあたりのビタミンE(ミリグラム) |
vitamin_k_mcg |
float | 100グラムあたりのビタミンK(マイクログラム) |
thiamin_mg |
float | 100グラムあたりのチアミン(B1)(ミリグラム) |
riboflavin_mg |
float | 100グラムあたりのリボフラビン(B2)(ミリグラム) |
niacin_mg |
float | 100グラムあたりのナイアシン(B3)(ミリグラム) |
copper_mg |
float | 100グラムあたりの銅(ミリグラム) |
manganese_mg |
float | 100グラムあたりのマンガン(ミリグラム) |
serving_1_desc |
string | 主なサービングサイズの説明(例:「調理済みの1カップ」) |
serving_1_g |
float | 主なサービングサイズの重さ(グラム) |
serving_2_desc |
string | 代替サービングサイズの説明;該当しない場合はnull |
serving_2_g |
float | 代替サービングサイズの重さ(グラム) |
serving_3_desc |
string | 2番目の代替サービングサイズの説明;該当しない場合はnull |
serving_3_g |
float | 2番目の代替サービングサイズの重さ(グラム) |
data_source |
string | 出所タグ:「government」、「manufacturer」、「laboratory」、または「verified_community」 |
last_verified |
string | エントリーが最後に検証された日付(YYYY-MM-DD形式) |
dataset_version |
string | データセットのバージョン識別子(例:「v3.0」) |
すべての栄養価は100グラムあたりで表されており、一貫した比較を可能にしています。サービングあたりの栄養素を計算するには、100グラムあたりの値にサービングの重さを掛け、100で割ります。
ダウンロード方法
データセットは私たちの公開GitHubリポジトリにホストされています:
github.com/nutrola/open-food-nutrition-dataset
GitHubのリリースページからファイルを直接ダウンロードするか、リポジトリをクローンできます:
git clone https://github.com/nutrola/open-food-nutrition-dataset.git
圧縮版のダウンロード:
# CSV(gzipped)をダウンロード
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.csv.gz
# JSON(gzipped)をダウンロード
wget https://github.com/nutrola/open-food-nutrition-dataset/releases/latest/download/nutrola-open-food-dataset-v3.json.gz
リポジトリには以下も含まれています:
- クイックスタートの手順が記載された詳細な
README.md - データセットのバージョン間の変更を文書化した
CHANGELOG.md - データを読み込み、フィルタリング、分析するためのPythonおよびRのサンプルスクリプトが含まれる
scripts/ディレクトリ - JSONスキーマおよびCSV方言の定義が含まれる
schema/ディレクトリ
リアルタイムで更新される3百万以上のエントリーを必要とする場合は、開発者アクセスのために私たちの栄養データAPIをご覧ください。
使用例
学術研究
栄養研究者は、このデータセットを使用して、食事パターン分析、疫学モデル、栄養密度研究を行うことができます。政府のデータファイルを清掃して統合するのに数週間を費やす必要がありません。階層的なカテゴリシステムにより、食品群でのフィルタリングが簡単になり、国のフィールドにより文化間の比較が可能です。
データセットを使用した研究は、次のように引用してください:Nutrolaオープンフード栄養データセット、v3.0(2026)。github.com/nutrola/open-food-nutrition-datasetにて入手可能。CC BY-SA 4.0の下でライセンスされています。
アプリケーション開発
健康、フィットネス、食品関連のアプリケーションを構築する開発者は、データセットをローカル食品データベースとして使用できます。一貫したスキーマとサービングサイズデータにより、ライブAPI接続に依存せずに機能的な食品ログ機能を構築できます。これは、オフラインファーストのモバイルアプリ、プロトタイピング、ハッカソンプロジェクトに特に便利です。
CSV形式はSQLite、PostgreSQL、または任意のリレーショナルデータベースに直接ロードできます。JSON形式はMongoDBやFirestoreのようなドキュメントストアにきれいにマッピングされます。
データサイエンスと機械学習
このデータセットは、食品と栄養に関連する機械学習モデルのトレーニングと評価に適しています。一般的なアプリケーションには次のものがあります:
- 食品分類モデル — カテゴリ階層をトレーニングラベルとして使用し、名前や栄養プロファイルから食品カテゴリを予測する分類器を構築
- 栄養推定 — タンパク質、脂肪、炭水化物の比率からカロリーやマクロの内容を予測する回帰モデルをトレーニング
- レコメンデーションシステム — 栄養的に類似した代替食品を提案する食品レコメンデーションエンジンを構築
- 異常検出 — 他のデータセットにおけるデータ品質の問題を示す可能性のある異常な栄養プロファイルを特定
教育
栄養科学の学生や教育者は、コースワーク、実験、課題にこのデータセットを使用できます。データの幅広さは、数十カ国の食品をカバーし、主要な食品群を網羅しているため、マクロ栄養素の比率、微量栄養素の密度、料理や食品加工レベルによる栄養プロファイルの変化などの概念を教えるのに役立ちます。
公衆衛生と政策
公衆衛生機関は、このデータを使用して特定の食品カテゴリや市場の栄養状況を分析できます。国のフィールドにより地域でのフィルタリングが可能になり、ブランドフィールドによりブランド製品と一般食品の栄養品質の分析ができます。
データ品質方法論
オープンデータセットを公開することは、データが信頼できなければ意味がありません。ここでは、今回のリリースに含まれる50万以上のエントリーの品質を確保する方法を説明します。
多元的なソース検証
データセット内のすべてのエントリーは、少なくとも2つの独立したソースに対して検証されています。私たちの主なデータソースには以下が含まれます:
- 政府の栄養データベース — USDA FoodData Central(アメリカ合衆国)、CoFID(イギリス)、NUTTAB(オーストラリア)、CNF(カナダ)、および20カ国以上の同等のデータベース
- 製造者提供データ — ブランドパートナーシッププログラムを通じて食品メーカーから直接提出された栄養成分表示
- 実験室分析 — ソースデータが矛盾しているか古くなっている高ボリューム食品について、私たちのチームが実施した独立したラボテスト
- 検証済みのコミュニティ提出 — 自動クロスリファレンス、専門家レビュー、統計的外れ値検出の3段階の検証プロセスを通過したユーザー提出エントリー
自動品質チェック
すべてのエントリーは、データセットに入る前に一連の自動チェックを通過します:
- エネルギーバランスの検証 — カロリー数はアトウォーター計算(タンパク質4 kcal/g + 脂肪9 kcal/g + 炭水化物4 kcal/g)と照合されます。記載されたカロリーが計算値から10%以上逸脱しているエントリーは手動レビューのためにフラグが立てられます。
- 範囲チェック — すべての栄養価は、食品カテゴリに対して生理的に妥当な範囲と照合されます。脂肪0グラムを主張するチーズエントリーや、タンパク質50グラムを主張する果物エントリーは即座にフラグが立てられます。
- エントリー間の一貫性 — 類似食品は統計的に比較されます。新しい鶏むね肉エントリーが既存の鶏むね肉エントリーのクラスターと大きく異なる値を持つ場合、レビューのために保留されます。
- サービングサイズの検証 — サービングの重さは既知の標準ポーションと照合されます。「中サイズのリンゴ1個」が500グラムと主張する場合は通過しません。
人間によるレビュー
自動チェックでフラグが立てられたエントリーは、私たちのデータチームによる手動レビューを受けます。このチームには、資格を持つ栄養士や食品科学者が含まれています。約12%のエントリーは、承認される前に何らかの手動修正が必要です。
継続的なメンテナンス
データセットは一度限りのダンプではありません。私たちは、Nutrolaユーザーによって最も頻繁にログされた高ボリューム食品や、ソースデータが更新されたエントリーを優先して、エントリーを継続的に再検証します。食品メーカーが製品を再構築した場合、バーコード監視システムを通じて変更を把握し、エントリーを適宜更新します。
更新頻度
オープンデータセットの新しいバージョンは四半期ごとに公開されます。各リリースには以下が含まれます:
- 前のバージョン以降に追加された新しい食品エントリー
- 前のバージョン以降に特定された既存エントリーの修正
- 製品が再構築された場合のエントリーの栄養データの更新
- 新しいソースデータが入手可能になった場合の微量栄養素のカバレッジの拡大
現在のバージョンはv3.0で、2026年3月にリリースされました。バージョン履歴と変更ログはGitHubリポジトリで入手可能です。
より頻繁に更新されたデータが必要な場合は、私たちの栄養データAPIが48時間以内に変更を反映します。
ライセンス
Nutrolaオープンフード栄養データセットは、**クリエイティブ・コモンズ 表示-継承 4.0 国際(CC BY-SA 4.0)**ライセンスの下で公開されています。
これにより、以下のことが自由に行えます:
- 共有 — データセットを任意の媒体または形式でコピーおよび再配布
- 適応 — データセットを改変、変形、構築して、商業利用を含む任意の目的で使用
以下の条件に従って:
- 帰属 — Nutrolaに適切なクレジットを与え、ライセンスへのリンクを提供し、変更があった場合はそれを示す必要があります
- 継承 — データセットを改変、変形、または構築した場合、あなたの貢献物も同じCC BY-SA 4.0ライセンスの下で配布しなければなりません
私たちはCC BY-SA 4.0を選択しました。これはオープン性と、改善がコミュニティに還元されることを確保するバランスを保っています。もしあなたがこのデータのより良いバージョンを構築した場合、そのライセンスにより、あなたの改善が他のすべての人にも利用可能であり続けることが保証されます。
他のデータセットとの比較
公に利用可能な栄養データセットは複数あります。Nutrolaオープンフード栄養データセットが最も広く使用されている2つの代替データセットとどのように比較されるかを以下に示します。
USDA FoodData Centralとの比較
USDA FoodData Centralは、アメリカ合衆国における栄養データのゴールドスタンダードです。徹底的で、文書化が良好で、実験室分析に裏打ちされています。しかし、Nutrolaデータセットが解決する制限があります:
| 次元 | USDA FoodData Central | Nutrolaオープンデータセット |
|---|---|---|
| 総エントリー数 | 約400,000(Foundation、SR Legacy、Brandedを合わせた数) | 50万以上 |
| 地理的カバレッジ | 主にアメリカ合衆国 | 47カ国 |
| ブランド製品 | アメリカのブランドのみ、しばしば古い | 国際的なブランド、四半期ごとに検証 |
| データ形式 | 複数の互換性のないファイル形式、複雑なリレーショナル構造 | 単一のCSVまたはJSONファイル、フラットな構造 |
| サービングサイズ | サブデータベース間で不一致 | 各食品に対して最大3つのサービングを持つ標準化された形式 |
| 使いやすさ | サブデータベースを統合するためにかなりのデータエンジニアリングが必要 | 1つのファイルをダウンロードして作業を開始 |
| 更新頻度 | サブデータベースによって異なる(年間であるものもあり) | 四半期ごと |
もしあなたの研究がアメリカの食品に特化しており、可能な限り詳細な栄養プロファイルが必要な場合、USDAはFoundation食品に対して150以上の栄養素をカバーしています。国際的なカバレッジ、一貫したフォーマット、すぐに使えるデータセットが必要な場合、Nutrolaデータセットがより強力な選択肢です。
この2つのデータセットは補完的です。多くの研究者は、USDA Foundationデータを詳細なアメリカの栄養分析に使用し、Nutrolaデータで国際的なカバレッジとブランド製品を補完します。
Open Food Factsとの比較
Open Food Factsは、300万以上のエントリーを持つクラウドソースのデータベースです。規模が印象的で、多くの国の製品をカバーしています。しかし、そのクラウドソースの性質はデータ品質の課題を引き起こします:
| 次元 | Open Food Facts | Nutrolaオープンデータセット |
|---|---|---|
| 総エントリー数 | 3M+ | 50万以上 |
| データ品質 | 変動あり — クラウドソースで自動チェックあり | 検証済み — 多元的ソース、人的レビュー |
| 完全性 | 多くのエントリーがマクロ/ミクロデータを欠く | すべてのエントリーが完全なマクロデータを持ち、90%以上が完全なミクロプロファイルを持つ |
| サービングサイズ | 不一致で、しばしば欠落 | 標準化され、常に存在 |
| カテゴリ分類 | クラウドソースのタグ、整合性なし | 階層的で厳選された分類 |
| 栄養カバレッジ | エントリーごとに大きく異なる | すべてのエントリーで一貫した40以上の栄養素 |
| データ形式 | MongoDBダンプ、複雑なネストされたJSON | クリーンなCSVおよびJSON |
| ライセンス | オープンデータベースライセンス(ODbL) | CC BY-SA 4.0 |
Open Food Factsは幅広さに優れています。特定の珍しい製品をバーコードで調べる必要がある場合、彼らはそれを持っている可能性が高いです。Nutrolaデータセットは深さと一貫性に優れています。すべてのエントリーが同じ品質基準を満たしており、データのギャップやエラーが結果を歪める可能性がある定量的分析にはより信頼性があります。
バーコードスキャナーアプリを構築する場合、Open Food Factsは良い出発点です。機械学習モデルのトレーニング、統計研究、栄養の正確さが重要なアプリを構築する場合、Nutrolaデータセットの検証済みデータがより強力な基盤を提供します。
始め方
データセットをダウンロードしたら、Pythonでの読み込みと探索の簡単な例を以下に示します:
import pandas as pd
# データセットを読み込む
df = pd.read_csv("nutrola-open-food-dataset-v3.csv")
# 基本的な概要
print(f"総エントリー数: {len(df):,}")
print(f"カバーされている国: {df['country'].nunique()}")
print(f"食品カテゴリ(L1): {df['category_l1'].nunique()}")
# 高タンパク質、低カロリーの食品を探す
high_protein = df[
(df["protein_g"] > 20) &
(df["calories_per_100g"] < 150)
].sort_values("protein_g", ascending=False)
print(high_protein[["food_name", "calories_per_100g", "protein_g"]].head(10))
# 食品カテゴリごとの平均マクロを分析
category_macros = df.groupby("category_l1").agg({
"calories_per_100g": "mean",
"protein_g": "mean",
"fat_total_g": "mean",
"carbs_total_g": "mean"
}).round(1)
print(category_macros.sort_values("calories_per_100g", ascending=False))
さらに多くの例 — Rスクリプト、SQLインポートガイド、Jupyterノートブックを含む — は、GitHubリポジトリのscripts/ディレクトリにあります。
よくある質問
データセットは本当に無料で使用できますか?
はい。Nutrolaオープンフード栄養データセットはCC BY-SA 4.0ライセンスの下で公開されており、商業利用および非商業利用が許可されています。唯一の要件は、Nutrolaを出所としてクレジットし、ライセンスへのリンクを提供し、変更があった場合はそれを示すことです。ファイルをダウンロードするためのAPIキー、使用制限、登録は必要ありません。
データセットはどのくらいの頻度で更新されますか?
新しいバージョンは四半期ごとに公開されます。各リリースには新しい食品エントリーが追加され、前のバージョン以降に特定されたエラーが修正され、再構築された製品のエントリーが更新されます。GitHubリポジトリのリリースページには完全なバージョン履歴があり、新しいバージョンが公開されると通知を受け取るためにリポジトリをウォッチすることができます。
このデータセットを商業アプリを構築するために使用できますか?
はい。CC BY-SA 4.0ライセンスは商業利用を明示的に許可しています。データを有料アプリ、SaaS製品、または他の商業コンテキストで使用することができます。アプリやドキュメントにNutrolaへの帰属を含める必要があり、データセット自体の修正バージョンを配布する場合、修正バージョンもCC BY-SA 4.0の下でライセンスされなければなりません。アプリ内でデータを使用すること(生データセットを再配布しない場合)は、ShareAlike要件を引き起こしません。
Nutrolaのフルデータベースには300万以上のエントリーがあるのに、なぜ50万エントリーだけなのですか?
オープンデータセットには、オープンライセンスの下で制限なしに公開できるエントリーが含まれています。私たちのフルデータベースには、独占的なソースからのデータ(直接の製造者パートナーシップ、ライセンスされた実験室データ、再配布に契約上の制限がある他のソース)が含まれています。オープンデータセットの50万エントリーは、政府のデータベース、私たち自身の実験室分析、オープンライセンスに同意した寄稿者からのコミュニティ提出に由来しています。フルデータベースへのアクセスが必要な場合は、私たちの栄養データAPIが別の商業条件の下で提供しています。
データセットにエラーを見つけた場合はどうすればよいですか?
GitHubリポジトリにfood_idとエラーの説明を含む問題をオープンしてください。ソースリンクがある場合は、それも含めてください(例:異なる栄養成分表示を示す製造者のウェブサイト)。私たちのデータチームは報告された問題を毎週レビューし、確認された修正は次の四半期のリリースに含まれます。緊急の修正が必要な場合、四半期の更新の間にパッチリリースを行うことがあります。
Nutrola栄養データAPIとはどのように関連していますか?
オープンデータセットは、私たちのデータベースのキュレーションされたサブセットの静的な四半期ごとのスナップショットです。APIは、検索、フィルタリング、バーコードルックアップ、その他の機能を持つフル3百万以上のエントリーのデータベースへのリアルタイムアクセスを提供します。オープンデータセットはオフラインまたはバッチ使用ケースの基盤と考え、APIはライブデータが必要なプロダクションアプリケーションのソリューションです。多くの開発者は、プロトタイピングのためにオープンデータセットから始め、プロダクションに移行する際にAPIに移行します。