オープン栄養データセットの比較:USDA、Open Food Facts、Nutrola、FatSecret
USDA FoodData Central、Open Food Facts、Nutrola、FatSecretを含む主要な栄養データセットの詳細な比較。データの質、カバレッジ、更新頻度、APIアクセス、ライセンス、および各データセットがどのような用途に最適かを解説します。
すべての栄養アプリ、食事研究、フードテック製品は、その中心に食品成分データベースを持っています。このデータベースの質、カバレッジ、アクセスのしやすさが、最終的な製品の正確さを決定します。しかし、多くのユーザーや開発者は、画面上のカロリー数値の背後に何があるのかを調べることはありません。異なるデータベースは、それぞれ異なる強みや欠点、更新サイクル、ライセンス条件を持ち、使用方法や場所に影響を与えます。
この記事では、最も広く使用されている4つの栄養データセット、USDA FoodData Central、Open Food Facts、Nutrola、FatSecretを徹底的に比較します。各データセットのカバレッジ、データの質、更新頻度、アクセスのしやすさ、ライセンス、さまざまな使用ケースに対する適合性を評価します。データソースを選ぶ開発者、基準を選ぶ研究者、またはアプリのカロリー数値の出所を知りたい好奇心旺盛なユーザーにとって、このガイドは情報に基づいた選択をする手助けとなるでしょう。
一目でわかる比較
| 特徴 | USDA FoodData Central | Open Food Facts | Nutrola | FatSecret |
|---|---|---|---|---|
| 食品エントリー数 | 370,000以上 | 3,000,000以上 | 900,000以上 | 500,000以上 |
| 主なデータタイプ | 参照 + ブランド | パッケージ製品 | 一般 + ブランド + レストラン | 一般 + ブランド |
| 地理的焦点 | アメリカ合衆国 | グローバル(EU中心) | グローバル(50カ国以上) | グローバル(US中心) |
| エントリーごとの栄養素数 | 最大150 | 変動(5-40) | 30以上の標準 | 15-25 |
| 更新頻度 | 四半期ごと(主要)、逐次(ブランド) | 継続的(クラウドソース) | 月次(主要)、日次(個別) | 継続的 |
| データ収集方法 | ラボ分析 + 製造者 | クラウドソース(ユーザーのスキャン) | 複数ソースの検証 | 複数ソース + コミュニティ |
| APIアクセス | はい(無料) | はい(無料) | はい(無料プラン + 有料) | はい(クレジット表記が必要) |
| バルクダウンロード | はい | はい | 有料プラン | いいえ |
| ライセンス | パブリックドメイン | オープンデータベースライセンス(ODbL) | 独自(APIアクセス) | 独自(APIアクセス) |
| バーコード/UPCデータ | はい(ブランドサブセット) | はい(主な焦点) | はい | はい |
| レストラン食品 | 限定的 | いいえ | はい(広範囲) | はい(中程度) |
| レシピ/複合食品 | はい(調査/FNDDS) | 限定的 | はい | はい |
USDA FoodData Central
概要
USDA FoodData Central(FDC)は、アメリカ合衆国農務省が提供する包括的な食品成分データベースです。これは、アメリカにおける栄養データの権威あるソースであり、他のデータベースがしばしば検証される基準となります。FDCは、2019年に複数の以前のUSDAデータベースを統合したプラットフォームとして立ち上げられました。
データベースの構成要素
FDCは、異なる目的と方法論を持つ5つの独立したデータセットを含んでいます:
Foundation Foods: 約2,300種類の最小限に加工された食品が、全国食品栄養分析プログラム(NFNAP)に基づいて現在の分析方法で分析されています。これらのエントリーは最高のデータ品質を持ち、複数のサンプルからの直接的なラボ分析に基づいています。各エントリーには、栄養値の平均、標準偏差、サンプルサイズが含まれています。
SR Legacy(標準参照レガシー): 約7,800の食品エントリーを含む、歴史的なUSDA標準参照データベースの最終リリースです。SR Legacyは、数十年にわたり研究で引用されてきた栄養値を提供します。もはや更新されていませんが、重要な参照として残ります。
Survey Foods(FNDDS): 食品と栄養データベース(FNDDS)は、約7,000の食品がアメリカ人が実際に食べているものにマッピングされています。これらのエントリーには、レシピに基づく栄養プロファイルを持つ複合料理や混合料理が含まれています。FNDDSは、人口レベルの食事分析にとって非常に貴重です。
Experimental Foods: 特定の研究目的のために分析された食品の小さなコレクションで、新しい作物や実験的な食品製剤などが含まれます。
Branded Foods: USDAのグローバルブランド食品製品データベース(GFBD)から派生した35万以上のエントリーが含まれています。これは、製造者が提出した栄養成分表示からデータを収集しています。エントリー数では最大のコンポーネントですが、製造者の正確さと完全性に依存するため、データ品質は最も変動が大きいです。
データ品質
Foundation Foodsコンポーネントは、食品成分データの金準標準を表しています。栄養値は、複数の場所と季節からの複数のサンプルに対して、湿式化学分析(タンパク質のためのケルダール法、脂肪のための酸加水分解、エネルギーのための爆発カロリーメトリー)を通じて決定されます。分析方法はAOAC Internationalのプロトコルに従い、データは多段階の品質レビューを経ています。
SR Legacyのデータ品質も高いですが、いくつかのエントリーでは古い分析方法とサンプリングプロトコルを反映しています。一部のエントリーは数十年前のもので、分析時には正確でしたが、農業慣行、家畜飼育、食品加工の変化により、食品成分は時間とともに変わる可能性があります。
Branded Foodsのデータ品質はより変動があります。栄養値は製造者が報告した栄養成分表示から得られ、FDAによって特定の許容範囲が認められています。たとえば、FDAはラベル表示されたカロリー数が実際の値よりも最大20%高くなることを許可しており、ビタミンやミネラルはラベル表示された値の80%以上存在することができます。これは、ブランド食品のエントリーがラボ分析された値と異なる可能性があることを意味します。
栄養素の深さ
USDA FDCは、公共データベースの中で最も深い栄養カバレッジを提供しています。Foundation Foodsのエントリーには、すべてのマクロ栄養素、個々のアミノ酸、個々の脂肪酸(飽和、単不飽和、多不飽和、トランス)、ビタミン、ミネラル、カロテノイド、フラボノイド、その他の生理活性化合物を含む150以上の個別の栄養素と食品成分が含まれることがあります。他のデータベースは、分析食品に関してこのレベルの詳細には達していません。
アクセスとライセンス
FDCのデータはパブリックドメインにあり(著作権制限なし)、以下の方法で利用可能です:
- ウェブインターフェース: fdc.nal.usda.gov で手動検索
- API: api.nal.usda.gov で無料のAPIキー登録(1時間あたり1,000リクエスト)
- バルクダウンロード: 完全なデータベースのCSVおよびJSONファイルダウンロード(四半期ごとに更新)
パブリックドメインの状態により、誰でもUSDAデータを商業目的でも非商業目的でも使用でき、帰属要件はありません(ただし、帰属は良い慣行です)。
制限事項
- 米国中心: データベースは主に米国市場で入手可能な食品をカバーしています。国際料理、地域製品、非米国の食品システムからの食品は過小評価されています。
- レストランデータなし: FDCにはレストラン特有のメニュー項目が含まれていません。Chipotleのブリトーは一般的なブリトーとは異なりますが、FDCには一般的なバージョンしかありません。
- 更新の遅れ: Foundation Foodsは頻繁に更新されず(10年以上再分析されていないエントリーもあります)、Branded Foodsの更新は製造者の提出に依存しています。
- 画像なし: FDCには食品の写真が含まれておらず、視覚的な食品認識トレーニングのための単独リソースとしては不適切です。
- 複雑な構造: 異なるIDシステム、栄養カバレッジレベル、データ形式を持つ5つのデータベースアーキテクチャは、統合を困難にします。
Open Food Facts
概要
Open Food Facts(OFF)は、世界中の食品製品のための無料のオープンソースの共同データベースです。2012年に設立され、食品製品のためのウィキペディアに類似した非営利プロジェクトとして運営されています。2026年現在、200以上の国から300万以上の製品エントリーを含み、製品数で最大のオープン食品データベースとなっています。
データ収集方法
Open Food Factsは、完全にクラウドソースの貢献に依存しています。ユーザー(個人および組織パートナー)は、Open Food Factsのモバイルアプリまたはウェブサイトを使用してバーコードをスキャンし、栄養ラベルを撮影することで製品データを提出します。光学文字認識(OCR)がラベル写真からテキストを抽出するのを支援しますが、品質プロセスの中心には人間のレビューと修正があります。
カバレッジ
OFFのカバレッジは、特にヨーロッパにおいて、パッケージ食品や加工食品に対して優れています。フランス、ドイツ、イギリス、アメリカ合衆国が最も多くの製品エントリーを持っています。データベースは以下をキャッチするのに優れています:
- バーコード付きのパッケージスーパーマーケット製品
- 米国中心のデータベースに欠けている国際製品
- 成分リストやアレルゲン情報
- 製品の原産国の形式での栄養ラベルデータ(EU形式、US形式など)
- 添加物や加工指標(NOVA分類)
- Nutri-Score(いくつかのEU諸国で使用されるパッケージ前面の栄養評価)
データ品質の考慮事項
OFFデータはクラウドソースであるため、エントリーごとに品質が大きく異なります:
- 完全性: 多くのエントリーには不完全な栄養データがあります。ある製品にはカロリーとマクロ栄養素が含まれているかもしれませんが、ビタミン、ミネラル、さらには食物繊維が欠けている場合があります。2021年の分析では、OFFエントリーの67%しか完全なマクロ栄養データ(エネルギー、タンパク質、炭水化物、脂肪)を持っておらず、20%未満がナトリウムを超える微量栄養素データを持っていることがわかりました。
- 正確性: OCRエラー、ユーザーの転記ミス、サービングあたりと100gあたりの値の混乱がエラーを引き起こします。コミュニティレビューのプロセスはこれらの多くをキャッチしますが、エラー率はキュレーションされたデータベースよりも高くなります。
- 重複: 同じ製品が異なるバーコード(地域バリアント、再パッケージ製品)で複数回表示されることがあり、異なる貢献者からの矛盾するデータが含まれることもあります。
- タイムリーさ: 製造者が製品を再形成することがありますが、OFFエントリーはユーザーが新しいバージョンをスキャンしない限り更新されません。
OFFは、貢献者の評判システム、データ検証チェック(例:カロリーがおおよそ4 x タンパク質 + 4 x 炭水化物 + 9 x 脂肪に等しくないエントリーをフラグ付け)、コミュニティモデレーションを通じて品質の懸念に対処しています。
ユニークな特徴
成分分析: OFFは成分リストを構造化データに解析し、添加物をE番号コードで特定し、アレルゲンをフラグ付けします。このレベルの成分レベルデータは他のデータベースでは珍しいです。
環境スコアリング: OFFは、製品のカテゴリー、成分、パッケージ、原産地に基づいて環境影響評価であるEco-Scoreを計算します。これにより、持続可能性に焦点を当てたアプリケーションにとってユニークなリソースとなります。
NOVA分類: すべての製品は、NOVA超加工スケール(1 = 未加工、4 = 超加工)で分類され、食品加工レベルに焦点を当てた研究やアプリケーションを可能にします。
アクセスとライセンス
OFFデータはオープンデータベースライセンス(ODbL)の下で利用可能で、帰属とシェアアライク(派生データベースもオープンでなければならない)を要求します。アクセス方法は以下の通りです:
- ウェブインターフェース: world.openfoodfacts.org
- API: 無料で、合理的な使用のために認証は不要
- バルクダウンロード: 完全なデータベースがCSVおよびMongoDBダンプ(数ギガバイトのファイル)として利用可能
- モバイルSDK: バーコードスキャン統合用
ODbLライセンスにより、商業アプリケーションはOFFデータを使用できますが、Open Food Factsへの帰属が必要であり、データベースへの改善をコミュニティに返す必要があります。このシェアアライク要件は、一部の商業利用ケースに制約を与える可能性があります。
制限事項
- パッケージ食品の偏り: OFFは主にパッケージ製品のデータベースです。未包装の全食品(新鮮な農産物、バルク穀物、新鮮な肉)、レストラン料理、家庭料理は十分に表現されていません。
- 変動する完全性: 多くのエントリーが重要な栄養素を欠いています。完全なマクロ栄養素 + 微量栄養素プロファイルが必要なアプリケーションは、OFFだけに依存することはできません。
- 品質の不一致: クラウドソースデータは、専門的にキュレーションされたデータよりもエラーが多くなります。生産アプリケーションは検証レイヤーを実装する必要があります。
- 調理文脈なし: OFFは販売されている食品を記録しており、消費される形ではありません。パスタの箱には乾燥した栄養値が記載されていますが、調理された値(ユーザーが実際に食べるもの)は別途計算する必要があります。
Nutrola
概要
Nutrolaは、AI駆動の栄養追跡のために特別に設計された独自の食品成分データベースを維持しています。このデータベースは、ユーザーが実際に食べる食品の全範囲をカバーするために、複数の権威あるソースとクラウド検証データを組み合わせています:一般的な全食品、ブランド製品、レストランメニュー項目、地域料理、複合料理などです。
データソースと方法論
Nutrolaのデータベースは、複数のソースの集約と検証プロセスを通じて構築されています:
USDA FoodData Central: Foundation FoodsとSR Legacyデータは、一般的な全食品と一般的な調理法の参照層として機能します。USDAデータは、USDAリリースの30日以内に同期されます。
製造者データ: ブランド製品の栄養情報は、製造者が提供したデータから取得され、ラベルスキャンとUSDA Branded Foodsエントリーと照合されます。
レストランパートナーシップ: Nutrolaはレストランチェーンと提携し、FDAのカロリーラベリング規制に基づいて大手米国チェーンが提供するメニュー栄養データを使用してレストラン食品エントリーを充実させています。
クラウド検証エントリー: 上記のソースでカバーされていない食品、特に地域や国際料理に関して、Nutrolaは標準化されたレシピとUSDA成分データに基づいて初期エントリーを作成し、その後ユーザーフィードバックを通じて検証・洗練します。複数のユーザーが同じ方向にエントリーを修正する場合、修正がレビューされ、取り入れられる可能性があります。
AI支援データ入力: Nutrolaは、複数の言語と形式の食品ラベルから栄養データを抽出するためにAIモデルを使用し、国際的なカバレッジを拡大するための手動作業を削減しています。
カバレッジプロファイル
| カテゴリ | おおよそのエントリー数 | ノート |
|---|---|---|
| 一般的な全食品 | 12,000 | USDA Foundation + SR Legacyと照合 |
| ブランド製品(米国) | 380,000 | 製造者データとの定期的な同期 |
| ブランド製品(国際) | 210,000 | EU、UK、AU、アジア太平洋市場に焦点 |
| レストランメニュー項目 | 85,000 | 米国チェーン + 選択された国際チェーン |
| 地域および文化料理 | 45,000 | 50以上の料理、クラウド検証 |
| 複合料理とレシピ | 168,000 | レシピ由来の成分レベルデータ |
| 合計 | 900,000以上 |
データ品質の測定
Nutrolaは、いくつかの品質管理メカニズムを採用しています:
- USDAクロスバリデーション: すべての一般食品エントリーはUSDA参照データとクロスバリデーションされます。マクロ栄養素のいずれかでUSDA参照値から15%以上逸脱しているエントリーはレビューのためにフラグ付けされます。
- 栄養的妥当性チェック: 自動チェックにより、カロリー値がマクロ栄養素の合計と一致していることが確認されます(カロリーはおおよそ4 x タンパク質 + 4 x 炭水化物 + 9 x 脂肪 + 7 x アルコールの範囲内であるべきです)。このチェックに失敗したエントリーは、レビューされるまで隔離されます。
- ユーザー修正分析: ユーザー修正の統計分析により、同じ方向に系統的に修正されるエントリーが特定され、データチームによるレビューがトリガーされます。
- 定期監査: エントリーのランダムサンプルが四半期ごとに主要なソース(USDA、製造者ラベル、レストラン公開データ)に対して監査されます。
栄養素のカバレッジ
標準エントリーには30以上の栄養素が含まれています:エネルギー(kcal)、タンパク質、総炭水化物、総脂肪、飽和脂肪、トランス脂肪、単不飽和脂肪、多不飽和脂肪、コレステロール、ナトリウム、食物繊維、総糖、添加糖、ビタミンA、ビタミンC、ビタミンD、カルシウム、鉄、カリウム、ビタミンB6、ビタミンB12、マグネシウム、亜鉛、その他いくつか。USDA Foundation Foodsから取得されたエントリーは、USDAデータから引き継がれた追加の栄養素を含むことがあります。
アクセス
- API: 無料プラン(500リクエスト/日)と有料プランがあります。詳細はNutrola API開発者ガイドを参照してください。
- アプリ内: Nutrolaのモバイルおよびウェブアプリが消費者のための主要なアクセスポイントを提供します。
- バルクアクセス: 研究および商業パートナー向けのエンタープライズプランで利用可能。
- ライセンス: 独自。APIの使用はNutrolaの開発者利用規約に従います。データは商業ライセンスなしにバルク再配布できません。
制限事項
- 独自性: USDAやOFFとは異なり、Nutrolaのデータは自由にダウンロードしたり再配布したりすることができません。これは、オープンデータを必要とする学術研究での使用を制限します。
- 栄養素の深さ: 30以上の栄養素は、ほとんどの消費者および臨床アプリケーションには十分ですが、専門的な研究のためのUSDA Foundation Foodsの150以上の栄養素の深さには及びません。
- 新しいデータセット: NutrolaのデータベースはUSDAやOFFよりも若く、廃止された製品やレガシー食品アイテムの歴史的カバレッジは不完全です。
FatSecret
概要
FatSecretは、2007年から運営されている最も古い栄養追跡プラットフォームの一つです。その食品データベースは、プロのデータキュレーション、コミュニティの貢献、パートナーシップの組み合わせを通じて、約20年にわたり進化してきました。FatSecret Platform APIは、開発者にこのデータを提供します。
データソース
FatSecretのデータベースは、複数のソースからのデータを引き出しています:
- 独自の食品データチーム: FatSecretは、食品成分表、政府のデータベース、製造者データから栄養データを調達し、一般的な食品エントリーをキュレーションするデータチームを雇用しています。
- コミュニティの貢献: ユーザーは、Open Food Factsと同様に食品エントリーを追加および編集できますが、モデレートされたフレームワーク内で行われます。
- 製造者とのパートナーシップ: 製造者からの提出によるブランド食品データ。
- 国際食品当局: FatSecretは、オーストラリアのFSANZ、イギリスのCOFID/McCance and Widdowson'sなど、複数の国の食品成分データベースを参照して国際的なカバレッジをサポートします。
カバレッジ
FatSecretのデータベースには、約500,000の食品エントリーが含まれており、合理的なグローバルカバレッジを提供しています。データベースは16の言語で利用可能で、FatSecretの国際市場での存在を反映しています。カバレッジは、米国、オーストラリア、ヨーロッパの食品に最も強くなっています。レストラン食品のカバレッジは中程度で、主要な米国チェーンが含まれています。
データ品質
FatSecretは、コミュニティによって貢献されたエントリーのためのモデレーションシステムを使用しており、そのプロフェッショナルなデータチームがコア食品データベースをキュレーションしています。データ品質は、一般的な食品や主要なブランド製品に対して一般的に良好です。しかし、コミュニティの貢献を受け入れるデータベースでは、エッジケースやあまり一般的でないアイテムの正確性が変動する可能性があります。
栄養素のカバレッジは、USDAやNutrolaよりも制限されており、通常、エントリーごとに15-25の栄養素が提供されます。コアマクロ栄養素、ナトリウム、食物繊維、糖、飽和脂肪は一貫して利用可能ですが、微量栄養素のカバレッジはそれほど包括的ではありません。
アクセスとライセンス
- API: FatSecret Platform APIは無料で使用でき、1日あたり5,000リクエストの寛大な制限があります。ただし、無料APIを使用するアプリケーションは、FatSecretのブランドと帰属を表示する必要があります。
- 認証: OAuth 1.0を使用しており、他のプロバイダーが使用するAPIキーやOAuth 2.0メソッドよりも実装が複雑です。
- バルクダウンロード: 利用できません。データはAPIを通じてのみアクセス可能です。
- ライセンス: 無料プランに対して帰属が必要な独自ライセンスです。商業パートナーシップを通じてホワイトラベルオプションが利用可能です。
ユニークな特徴
多言語サポート: 16のサポート言語を持つFatSecretは、ほとんどの競合他社よりも広範な言語カバレッジを提供しています。
長い運営歴: ほぼ20年の運営により、FatSecretのデータベースは広範にテストされ、洗練されてきました。新しいデータベースがまだ発見しているエッジケースは、すでに対処されていることが多いです。
ダイエットとレシピの統合: FatSecretのプラットフォームには、食品データベースと密接に統合されたレシピや食事プラン機能が含まれており、食事計画ツールを構築する開発者にとって即座に使用できるケースを提供します。
制限事項
- バルクダウンロードなし: 開発者は、オフライン分析やローカルホスティングのために完全なデータセットをダウンロードすることができません。すべてのアクセスはAPIを通じて行う必要があります。
- OAuth 1.0認証: 古い認証プロトコルは、他のプロバイダーが使用するシンプルなAPIキー認証と比較して実装の複雑さを加えます。
- 帰属要件: 無料プランのAPIユーザーに対する必須のFatSecretブランドは、一部のアプリケーションデザインやブランド要件と衝突する可能性があります。
- 微量栄養素データの制限: 包括的なビタミンやミネラルデータを必要とするアプリケーションは、FatSecretのカバレッジが不十分であると感じるかもしれません。
- AI認識なし: プラットフォームはAI駆動の食品認識機能を提供していません。
詳細な機能比較
マクロ栄養素データの完全性
「完全なマクロ栄養素データ」とは、エントリーにエネルギー(kcal)、タンパク質(g)、総炭水化物(g)、総脂肪(g)が含まれていることを定義します。
| データベース | 完全なマクロのエントリーの割合 | ノート |
|---|---|---|
| USDA FDC(Foundation) | 100% | ラボ分析 |
| USDA FDC(SR Legacy) | 99.8% | 一部エントリーは計算 |
| USDA FDC(Branded) | 94% | 一部の製造者提出が不完全 |
| Open Food Facts | 約67% | 国や貢献者によって異なる |
| Nutrola | 99.2% | 品質ゲートが不完全なエントリーを防止 |
| FatSecret | 約92% | キュレーションされたものは高いが、コミュニティ追加は低い |
国際食品カバレッジ
| 地域 | USDA | Open Food Facts | Nutrola | FatSecret |
|---|---|---|---|---|
| 北アメリカ | 優秀 | 良好 | 優秀 | 優秀 |
| 西ヨーロッパ | 限定的 | 優秀 | 良好 | 良好 |
| 東アジア | 貧弱 | 中程度 | 良好 | 中程度 |
| 南アジア | 貧弱 | 中程度 | 良好 | 中程度 |
| 東南アジア | 貧弱 | 中程度 | 良好 | 貧弱 |
| ラテンアメリカ | 貧弱 | 中程度 | 良好 | 中程度 |
| 中東 | 貧弱 | 貧弱 | 中程度 | 貧弱 |
| アフリカ | 非常に貧弱 | 貧弱 | 限定的 | 貧弱 |
| オセアニア | 限定的 | 良好 | 良好 | 優秀 |
レストランおよび調理食品カバレッジ
| データベース | 主要な米国チェーン | 地域の米国レストラン | 国際チェーン | 調理済み/デリ食品 |
|---|---|---|---|---|
| USDA | なし | なし | なし | 一般的なもののみ |
| Open Food Facts | 非常に限定的 | なし | 非常に限定的 | なし |
| Nutrola | 85,000以上のアイテム | 増加中 | 選択された市場 | はい |
| FatSecret | 中程度 | 限定的 | 限定的 | 一部 |
開発者体験
| 要因 | USDA | Open Food Facts | Nutrola | FatSecret |
|---|---|---|---|---|
| APIドキュメントの質 | 適切 | 良好 | 優秀 | 良好 |
| 初回成功コールまでの時間 | 15-30分 | 5分(認証なし) | 10分 | 20-30分(OAuth 1.0) |
| SDKの可用性 | 公式なし | Python、JS、Dart | Python、JS(公式) | コミュニティSDK |
| サンドボックス/テスト環境 | なし | 本番 = テスト | はい | なし |
| Webhookサポート | なし | なし | 計画中(2026年) | なし |
| バッチ操作 | はい(ダウンロード) | はい(ダウンロード) | はい(API) | なし |
どのデータセットを選ぶべきか
学術研究向け
主な推奨:USDA FoodData Central
学術研究は通常、最も権威ある、よく文書化された、自由に利用可能なデータを必要とします。特にFoundation Foodsコンポーネントは、統計文書(平均、標準偏差、サンプルサイズ)を伴うラボ分析された栄養値を提供し、査読付き出版物で引用できます。パブリックドメインライセンスにより、法的な複雑さが排除されます。特定の栄養素に焦点を当てた研究には、USDAが唯一の選択肢であり、十分な深さを持っています。
補足として:Open Food Factsを使用し、パッケージ食品製品、食品環境研究、または超加工の評価(NOVA分類)に関する研究を行います。
消費者栄養アプリ向け
主な推奨:NutrolaまたはNutritionix(API経由)
消費者アプリは、実際に人々が食べる食品の広範なカバレッジ、レストランの食事、ブランド製品、国際料理を必要とします。データの質とサービングサイズ情報が一貫していることが求められます(「中程度の鶏の胸肉」ではなく「生のブロイラー鶏肉100グラム」)。NutrolaのAPIは、この組み合わせを自然言語解析とオプションのAI認識で提供します。
補足として:USDAを参照層として使用し、一般的な全食品のデータと微量栄養素データのギャップを埋めます。
パッケージ食品/バーコードスキャンアプリ向け
主な推奨:Open Food Facts
アプリケーションがパッケージ食品のバーコードをスキャンすることに中心を置いている場合、OFFは、完全に無料でオープンな、グローバルカバレッジを持つ最大のバーコードインデックスデータベースを提供します。成分解析、アレルゲンフラグ付け、Nutri-ScoreやEco-Scoreの機能は、栄養データだけでは提供できない付加価値を加えます。
補足として:NutrolaまたはFatSecretを使用し、OFFに欠けている製品や非パッケージ食品のカバレッジを補います。
国際的または多言語アプリケーション向け
主な推奨:Open Food Facts + Nutrola
OFFは、40以上の言語で最も広範な国際的なパッケージ食品カバレッジを提供します。Nutrolaは、8言語での国際的な一般食品とレストランカバレッジを追加し、より高いデータ完全性を提供します。FatSecretの16言語サポートも、消費者向けアプリケーションに関連します。
予算制約のあるプロジェクト向け
主な推奨:FatSecret Platform APIまたはUSDA + Open Food Facts
FatSecretの無料プランは、5,000日々のリクエストを提供し、帰属要件を満たすことができれば、最も寛大なものです。あるいは、USDA(参照データ用)とOpen Food Facts(ブランド製品用)を組み合わせることで、完全に無料でオープンデータスタックを得ることができますが、データの正規化と品質フィルタリングに開発時間を投資する必要があります。
データベース間のエンティティ関係
これらのデータベースがどのように関連しているかを理解することは、複数のソースを統合する際に役立ちます:
USDAは参照権威です:Nutrola、FatSecret、OFFの多くのエントリーは、USDAデータから共通の食品栄養値を派生させています。複数のデータベースで「鶏の胸肉:100gあたり165 kcal」という数値が見られる場合、その数値はUSDA分析から派生しています。
OFFとNutrolaはどちらもUSDAを基礎データとして参照します:両方のデータベースは、一般的な食品エントリーの基盤としてUSDAを使用し、その上に追加データ(ブランド製品、国際食品)を重ねています。
バーコードの重複:OFF、Nutrola、FatSecretはすべて食品をバーコードでインデックス化していますが、カバレッジは異なります。特定のUPCは、すべてのデータベースに存在する場合もあれば、2つのデータベースにのみ存在する場合もあります。複数のデータベースを確認することで、バーコード検索のヒット率が向上します。
レストランデータが重要な差別化要因です:USDAとOFFには基本的にレストランデータがありません。Nutrolaは最も包括的なレストランカバレッジを持ち、FatSecretは中程度のカバレッジを持っています。外食が多いユーザーにサービスを提供するアプリケーションにとって、これはしばしば決定的な要因となります。
データ品質方法論の比較
| 品質測定 | USDA Foundation | USDA Branded | Open Food Facts | Nutrola | FatSecret |
|---|---|---|---|---|---|
| 主なデータソース | ラボ分析(AOAC方法) | 製造者ラベル | ユーザーがスキャンしたラベル | 複数ソースの検証 | 複数ソースのキュレーション |
| サンプルの多様性 | 複数の地域/季節 | 単一ラベル | 単一の貢献 | クロス参照 | 変動 |
| カロリー/マクロの一貫性チェック | ラボ検証 | 系統的ではない | 自動式の数式チェック | 自動化 + 手動監査 | モデレーションレビュー |
| 統計的文書 | はい(SD、n) | いいえ | いいえ | いいえ | いいえ |
| 更新トリガー | 研究プログラムサイクル | 製造者提出 | ユーザー貢献 | 製造者 + ユーザー + 監査 | ユーザー + データチーム |
| エラー修正プロセス | 内部科学レビュー | 限定的 | コミュニティモデレーション | ユーザーフィードバック + データチーム | ユーザー報告 + モデレーション |
よくある質問
どの栄養データベースが最も正確ですか?
一般的な全食品に関しては、USDA FoodData Central Foundation Foodsが最も正確です。これは、標準化された方法を使用した直接的なラボ分析に依存しています。パッケージ食品やブランド製品に関しては、データが製品の最新の製剤に対してどれだけ最新であるかに依存します。すべての食品タイプにおいて、単一のデータベースが普遍的に「最も正確」であることはありません。生産アプリケーションにとって最良のアプローチは、USDAを参照層として使用し、ブランド、レストラン、国際食品のカバレッジが強いデータベースで補うことです。
複数の栄養データベースのデータを組み合わせることはできますか?
はい、これは一般的な実践です。主な課題は、データベース間で栄養素の名前や単位を正規化すること(例:「ビタミンA」は、ソースによってIU、RAE、mcgで報告される場合があります)、異なる栄養値を持つ同じ食品の重複エントリーを処理すること、異なるライセンス要件を管理することです。USDAデータ(パブリックドメイン)は、他の任意のソースと自由に組み合わせることができます。Open Food Factsデータは、組み合わせたデータセットを再配布する場合、ODbLの遵守が必要です。
ローカルの栄養データのコピーをどのくらいの頻度で更新すべきですか?
USDAデータについては、FoundationおよびLegacyデータの四半期ごとの同期が十分です。ブランド食品データはより頻繁に変化するため、月次の同期が推奨されます。Open Food Factsについては、継続的な貢献モデルを考慮して、月次または週次の同期が適切です。NutrolaやFatSecretへのAPIベースのアクセスでは、APIコール時にデータが常に最新であるため、ローカルの同期は必要ありません(キャッシュしている場合を除く)。
なぜ同じ食品のカロリー数がデータベース間で異なるのですか?
いくつかの要因が不一致を引き起こします:異なる分析方法、異なるサンプルソース、「同じ」食品の異なる定義(「玄米」は調理済みか生か?長粒種か短粒種か?塩を加えるかどうか?)、丸めの慣行、データの古さです。同じ食品に対するデータベース間の5-10%の違いは一般的であり、通常はエラーではなく正当な変動を反映しています。
Open Food Factsのデータは、商業アプリケーションに十分な信頼性がありますか?
Open Food Factsのデータは、検証レイヤーを実装すれば商業利用に十分な信頼性があります。ベストプラクティスには、マクロ栄養素-カロリーの一貫性チェックに失敗したエントリーをフィルタリングすること、最低限の完全性基準を要求すること、高トラフィックエントリーのために二次ソースとクロスリファレンスすること、ユーザーにデータの信頼性指標を表示することが含まれます。Yukaや他の食品スキャンアプリの一部のコンポーネントを含む多くの成功したアプリケーションは、これらの予防策を講じた上でOFFデータに依存しています。
NutrolaのデータベースにはUSDAやOpen Food Factsのデータが含まれていますか?
Nutrolaは、一般的な全食品の参照層としてUSDA FoodData Centralを使用し、USDAリリースと定期的に同期しています。NutrolaはOpen Food Factsデータを直接取り込んでいませんが、両方のデータベースが製造者ラベルから派生したパッケージ食品のカバレッジに自然な重複があります。Nutrolaの独自のレイヤーには、レストランデータ、クラウド検証された国際料理、AI検証されたエントリーが含まれており、USDAやOFFにはありません。
Nutritionix、CalorieKing、その他の商業データベースについてはどうですか?
Nutritionixは、特にレストラン食品のカバレッジが強い、1百万以上のエントリーを持つ最大級の商業食品データベースの一つです。CalorieKingは、オーストラリアと米国で人気のある確立されたデータベースです。どちらも商業価格でAPIアクセスを提供する独自のデータベースです。この比較では、開発者や研究者にとって最も実用的なガイダンスを提供するために、無料またはオープンアクセスの層を持つデータベースに焦点を当てました。Nutritionixは、Nutrolaと同様に商業比較においてランク付けされ、価格は高いですが、米国のレストランカバレッジは深いです。
結論
すべての栄養データセットがすべての使用ケースに完璧であるわけではありません。USDA FoodData Centralは、分析精度と栄養深さにおいて金準標準であり、Open Food Factsはパッケージ製品のカバレッジとオープン性でリードし、Nutrolaはカバレッジの広さとデータ品質のバランスを取り、無料APIアクセスの中で最も強力なレストランおよび国際食品カバレッジを提供し、FatSecretは成熟した、よくテストされたデータベースを寛大な無料APIアクセスで提供します。
真剣なアプリケーションにとって最も堅牢なアプローチは、USDAを参照基盤として使用し、Nutrolaのような包括的なデータベースを実世界の食品カバレッジとAPI駆動のアクセスのために使用し、Open Food Factsのような補助的なソースをパッケージ製品の幅を広げるために使用することです。各データセットの強み、制限、方法論を理解することで、アプリケーションを支える栄養データが、食品成分科学の現状が許す限り正確かつ完全であることを保証します。