グローバルブレイン:なぜほとんどのAIはビリヤニ、アレパ、ダルを認識できないのか

ほとんどの食べ物認識AIはハンバーガーやサラダを基に訓練されています。そのため、南アジア、ラテンアメリカ、中東の料理において大きな精度のギャップが生まれています。グローバルに訓練されたモデルがこのギャップを埋める方法をご紹介します。

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

ほとんどの食べ物認識アプリにチキンビリヤニの皿を識別させると、「肉入りご飯」や、ひどい場合は「炒飯」といった結果が返ってくることが多いです。その後のカロリー推定は200〜400カロリーもずれてしまいます。なぜなら、そのモデルはギーで浸されたバスマティライスや、層を重ねたマリネ、揚げ玉ねぎが料理に含まれていることを理解していないからです。

これはニッチな問題ではありません。国連によれば、55億人以上が北アメリカとヨーロッパ以外に住んでいます。彼らの毎日の食事、ナイジェリアのジョロフライスからペルーのセビーチェ、日本のお好み焼きに至るまで、主流の食べ物AIを支えるデータセットには体系的に過小評価されています。その結果、チーズバーガーには効果的でも、世界の大多数には役立たない技術が生まれています。

西洋中心の訓練データの問題

コンピュータビジョンモデルは、訓練に使用される画像から学びます。最も広く使われている公的な食べ物データセットは、バイアスがどこにあるかを明確に示しています。

Food-101は、食べ物認識研究の基礎的なベンチマークの一つで、101の食べ物カテゴリーを含んでいます。その約70%は西ヨーロッパまたは北アメリカの料理で構成されています:ハンバーガー、スパゲッティボロネーゼ、シーザーサラダ、アップルパイ。南アジア料理は一つのカテゴリーでしか表現されておらず、アフリカ料理はゼロです。

UECFOOD-256は、東京電機大学で開発され、日本料理に偏っています。ラーメンや天ぷらの認識には優れていますが、南アメリカや西アフリカの料理にはほとんど対応していません。

これらのデータセットを主に訓練に使用したモデルがチョレバトゥーラの皿に出会うと、全く誤って分類するか、最も近い西洋料理にマッピングするかの二択になります。どちらも正確なカロリー数を生み出しません。

誤分類が思った以上にコストをかける理由

正しい分類と誤った分類の間のカロリーギャップは非常に大きくなる可能性があります。以下の実際の例を考えてみましょう:

  • チキンビリヤニが「チキン炒飯」として分類された場合:ギーと揚げ玉ねぎを使ったビリヤニは、一人前で450〜600カロリーを含むことがあります。一般的なチキン炒飯のデータベースには300〜380カロリーと記載されています。これは、1食あたり200カロリーの過小評価になる可能性があります。
  • アレパが「コーンブレッド」として分類された場合:チーズと豆を詰めたアレパは500カロリーに達することがあります。コーンブレッドの一切れは170〜200カロリーと記載されています。
  • ダルマクニが「レンズ豆スープ」として分類された場合:伝統的なダルマクニに含まれるバターとクリームは、1カップあたり350〜450カロリーに達します。基本的なレンズ豆スープは160〜200カロリーです。

これらの誤りは、1週間の間に何百、あるいは何千カロリーの誤算に繋がり、ダイエットや増量計画を完全に台無しにする可能性があります。

グローバル料理の複雑さ

西洋料理は比較的目に見える、分離可能な要素を持つ傾向があります:タンパク質、炭水化物、野菜。多くの非西洋料理は、コンピュータビジョンにとって根本的に異なる課題を提示します。

層状および混合調理

ビリヤニは層状の料理です。ご飯、肉、スパイス、揚げ玉ねぎ、脂肪が別々に盛り付けられるのではなく、統合されています。表面の写真では、上層しか見えません。オアハカのモーレ・ネグロは、30種類以上の材料が一つのソースに挽かれています。タイのマッサマンカレーは、ココナッツミルク、ローストピーナッツ、ジャガイモ、肉が一つの識別できない混合物になっています。

AIモデルがカロリーを正確に推定するためには、料理の見た目だけでなく、その中身を理解する必要があります。

同じ料理内の地域差

レバノン、シリア、イスラエル、トルコで作られる「フムス」は、オリーブオイルの含有量、タヒニの比率、サービングサイズにおいて大きく異なります。家庭で作るハイデラバード風ビリヤニは、レストランのラクナウ風ビリヤニとは技術とカロリー密度が異なります。タマレスはメキシコと中央アメリカの地域ごとに異なり、具材は鶏肉からラード入りの豚肉まで様々です。

モデルは、信頼できる推定を行うために、料理レベルの認識だけでなく、地域的な文脈も必要です。

見えないカロリーの寄与者

多くのグローバルな料理伝統は、最終的な料理では見えなくなる調理脂肪の豊富な使用に依存しています。インド料理ではギーが使われます。西アフリカ料理ではパームオイルがよく使用されます。ラテンアメリカ料理ではラードやマンテカが使われます。中東料理ではオリーブオイルやバターがたっぷり使われます。

これらの脂肪は、調理中に料理に吸収されます。写真ではそれを明らかにすることはできませんが、全体のカロリーの30〜50%を占めることがあります。

Nutrolaのグローバル食認識へのアプローチ

さまざまな料理で機能する食べ物AIを構築するには、データ収集、モデルアーキテクチャ、認識後の栄養マッピングの各段階で意図的な努力が必要です。

大規模な多様な訓練データ

Nutrolaの訓練データセットには、130か国以上から収集された食べ物の画像が含まれています。西洋中心の公的データセットに依存するのではなく、地域ごとに収集された画像と栄養士によって確認されたラベルを組み込んでいます。これにより、モデルはエチオピアやエリトリアの家庭やレストランで撮影された実際の食事の例を数千件見てきました。

料理レベルの栄養プロファイル

Nutrolaは、すべての料理を一般的な要素に分解するのではなく、実際に調理された方法で料理の栄養プロファイルを維持します。ダルマクニは「レンズ豆+不明な脂肪」ではありません。それは特定の料理であり、調理法が明確で、カロリー推定はそれを定義するバター、クリーム、低温調理技術を反映しています。

このアプローチは地域のバリエーションにも適用されます。システムは、ジャガイモ入りのコルカタ風ビリヤニとハイデラバード風ダムビリヤニを区別します。なぜなら、カロリーのプロファイルが本当に異なるからです。

隠れた成分のためのマルチモーダル入力

写真だけでは不十分な場合、Nutrolaは音声やテキストのプロンプトを使用してギャップを埋めます。ユーザーが「ココナッツオイルで調理された」とか「アレパの中にチーズが入っている」と言うと、システムは推定値を調整します。このマルチモーダルアプローチは、純粋な写真ベースのシステムでは解決できない見えないカロリーの問題に対処します。

ユーザーにとってのより良いグローバル認識の意義

非西洋の食事を日常的に摂る何百万もの人々にとって、正確な食べ物AIは贅沢な機能ではありません。それは、機能する栄養トラッカーと、静かに目標を妨害するトラッカーの違いです。

2023年に発表された栄養学と食事療法のアカデミーのジャーナルに掲載された研究によれば、ユーザーがアプリを不正確だと感じると、栄養追跡の遵守率は40%低下します。トラッカーが食事を一貫して誤って識別する場合、信頼を失い、使用をやめてしまいます。

正確なグローバル食認識は、ディアスポラコミュニティにとっても重要です。週を通じてダル、ロティ、サラダを食べる第二世代のインド系アメリカ人は、両方の料理を同じ精度で扱うアプリが必要です。ロンドンでエグシスープを作るナイジェリアの学生は、AIがその料理を見たことがないために、すべての材料を手動で入力する必要はありません。

食べ物AIの今後の道

食べ物認識の分野は多様性の向上に向かっていますが、進展は不均一です。ISIA Food-500やNutrition5kのような新しいデータセットがカバレッジを拡大しており、転移学習技術により、モデルは少量のラベル付きデータで過小評価された料理に適応できます。

今後の重要な差別化要因は、検証された栄養データです。料理がビリヤニであることを認識するのは問題の半分に過ぎません。その認識を正確なカロリーとマクロの内訳にマッピングするには、一般的な食べ物データベースが提供できる以上の地域特有の栄養知識が必要です。

標準的な西洋料理以外の栄養を追跡している人にとって、どの食べ物AIに対しても尋ねるべき質問は明確です:このシステムは私の食べ物で訓練されているのか?

よくある質問

インド料理のためのベストカロリートラッカーは何ですか?

インド料理のためのベストカロリートラッカーには、二つの要素が必要です:多様な南アジア料理に訓練された認識モデルと、伝統的な調理法を考慮した栄養データベースです。主に西洋のデータセットに訓練されたアプリは、ビリヤニ、パニールティッカ、ダルマクニなどの料理を一般的なエントリーとして誤分類し、重大なカロリー誤差を生じさせます。Nutrolaのモデルは、130か国以上からの食べ物画像で訓練され、実際の調理法を反映した料理特有の栄養プロファイルを維持しています。

なぜ私のカロリートラッカーはエスニック料理に対して誤った結果を出すのですか?

ほとんどの主流の食べ物トラッカーは、Food-101などの西洋料理が支配するデータセットで訓練された認識モデルを使用しています。これらのモデルが馴染みのない料理に出会うと、視覚的に似た西洋料理として誤分類するか、一般的なデータベースエントリーにデフォルトします。これらの誤ったマッチの栄養プロファイルは、特にギー、パームオイル、ココナッツミルクなどの調理脂肪が写真では見えないため、数百カロリーもずれることがあります。

AIは中東料理のカロリーを正確に追跡できますか?

AIは、中東料理がシャワルマ、ファトゥーシュ、キッベ、マンサフなどの料理に特化して訓練され、栄養データベースがオリーブオイル、タヒニ、バターの含有量を考慮している場合、正確に中東料理のカロリーを追跡できます。中東料理の多くの食品は、調理中に組み込まれる脂肪からカロリーの大部分を得ています。写真認識とユーザー提供の調理詳細(使用したオリーブオイルの量など)を組み合わせたシステムは、より信頼性の高い推定を生み出します。

食べ物AIは多くの混合成分を持つ料理をどのように扱いますか?

モーレ、ビリヤニ、シチューなど、混合または層状の成分を持つ複雑な料理は、食べ物認識において最も難しい課題の一つです。純粋な画像ベースのシステムは、目に見える表面だけを分析し、内部の層や吸収された脂肪を見逃します。高度な食べ物AIは、料理レベルの認識を通じて、個々の要素ではなく完全な料理を特定し、ユーザーがテキストや音声で隠れた成分に関する詳細を追加できるマルチモーダル入力を通じてこの問題に対処します。この組み合わせアプローチは、複雑で多成分の調理に対する精度を大幅に向上させます。

クラウドソースされた食データは国際料理に対して正確ですか?

クラウドソースされた栄養データベースは、国際料理に対して最も正確性が低い傾向があります。ジョロフライス、セビーチェ、パッタイなどの料理のエントリーは、地域のバリエーション、調理脂肪、または本格的な調理法を考慮しないユーザーによって提出されることが多いです。「ビリヤニ」という単一のエントリーでは、軽い野菜ビリヤニからリッチなマトンダムビリヤニまでのカロリー範囲を表すことはできません。地域特有の栄養プロファイルとバリエーションレベルの詳細を持つ検証済みのデータベースは、非西洋料理に対してはるかに信頼性の高いデータを提供します。

栄養追跡を革新する準備はできていますか?

Nutrolaで健康の旅を変えた数千人に参加しましょう!