全球大脑:为何大多数人工智能无法识别香饭、阿雷帕和达尔

大多数食品识别人工智能的训练数据集中主要是汉堡和沙拉。这导致南亚、拉丁美洲和中东美食的准确率大幅下降,而全球化训练模型正在弥补这一差距。

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

如果你让大多数食品识别应用识别一盘鸡肉香饭,得到的结果可能是“肉饭”或者更糟的“炒饭”。随之而来的卡路里估算往往会偏差200到400卡路里,因为模型并不了解浸泡在酥油中的巴斯马蒂米饭、层次分明的腌制过程,或是混入菜肴中的炸洋葱。

这并不是一个小众问题。根据联合国的数据,超过55亿人生活在北美和欧洲以外的地区。他们的日常饮食,从尼日利亚的焦米饭到秘鲁的生鱼片,再到日本的御好烧,系统性地在主流食品人工智能的数据集中被低估。结果是,这项技术对汉堡的识别效果良好,却无法满足世界大多数人口的需求。

以西方为中心的训练数据问题

计算机视觉模型是通过训练所用的图像进行学习的。最广泛使用的公共食品数据集清楚地揭示了偏见所在。

Food-101,作为食品识别研究的基础基准之一,包含101个食品类别。其中大约70%是西欧或北美的菜肴:汉堡、意大利面、凯撒沙拉、苹果派。南亚美食仅有一个类别,而非洲美食则完全没有代表。

UECFOOD-256,由东京电机大学开发,主要偏向日本菜。它在识别拉面和天妇罗方面表现出色,但对南美或西非的食品几乎没有任何支持。

当一个主要在这些数据集上训练的模型遇到一盘豆饼时,它有两个选择:要么完全错误分类,要么将其映射到最接近的西方菜肴上。两者都无法提供准确的卡路里计数。

错误分类的成本远超想象

正确与错误分类之间的卡路里差距可能巨大。考虑以下真实案例:

  • 鸡肉香饭被分类为“鸡肉炒饭”:用酥油和炸洋葱制作的香饭每份可能含有450到600卡路里,而普通鸡肉炒饭在通用数据库中的卡路里仅列为300到380卡路里。这意味着每餐可能低估200卡路里。
  • 阿雷帕被分类为“玉米面包”:一份夹有奶酪和豆子的阿雷帕可能达到500卡路里,而一片玉米面包的卡路里仅为170到200卡路里。
  • 达尔玛卡尼被分类为“扁豆汤”:传统的达尔玛卡尼因加入了黄油和奶油,每杯可能含有350到450卡路里,而基本的扁豆汤则为160到200卡路里。

在一周的时间里,这些错误累积可能导致数百甚至数千卡路里的误计,足以完全破坏减脂或增肌的计划。

全球菜肴的复杂性

西方菜肴通常具有相对明显、可分离的成分:一种蛋白质、一种淀粉和一种蔬菜。而许多非西方美食则给计算机视觉带来了根本不同的挑战。

分层和混合的准备方式

香饭是一道分层菜肴。米饭、肉类、香料、炸洋葱和脂肪是融合在一起的,而不是单独摆盘。照片只显示了表层。来自瓦哈卡的黑酱包含超过30种成分研磨成一种酱料。泰国马萨曼咖喱则将椰奶、烤花生、土豆和肉混合成一种不可分辨的混合物。

为了准确估算卡路里,人工智能模型不仅需要理解菜肴的外观,还需要了解其内部成分。

同一道菜的区域差异

在黎巴嫩、叙利亚、以色列和土耳其制作的“鹰嘴豆泥”在橄榄油含量、芝麻酱比例和份量上会有显著差异。家常风味的海得拉巴香饭与餐厅风味的拉克瑙香饭在制作方法和卡路里密度上也有所不同。墨西哥和中美洲的玉米饼因地区不同而各异,馅料从瘦鸡肉到猪肉都有。

模型需要区域背景,而不仅仅是菜肴级别的识别,才能提供可靠的估算。

隐形的卡路里贡献者

许多全球烹饪传统依赖于大量使用烹饪脂肪,而这些脂肪在最终菜肴中变得不可见。印度烹饪使用酥油,西非菜肴通常使用棕榈油,拉丁美洲美食则包含猪油和黄油,中东烹饪则大量使用橄榄油和黄油。

这些脂肪在烹饪过程中被吸收到菜肴中。照片无法揭示它们,但它们可能占总卡路里的30%到50%。

Nutrola如何应对全球食品识别

构建一个能够跨越不同美食的食品人工智能需要在每个阶段进行精心努力:数据收集、模型架构和后期识别的营养映射。

大规模多样化训练数据

Nutrola的训练数据集包括来自130多个国家的食品图像。系统不仅依赖于公开的西方中心数据集,还纳入了经过营养师验证标签的区域收集图像。这意味着模型见过成千上万的以因杰拉和蒂布斯为主的真实菜肴,而不仅仅是库存照片。

菜肴级营养档案

Nutrola并不是将每道菜分解为通用成分,而是保持菜肴在实际准备时的营养档案。达尔玛卡尼并不是“扁豆+未知脂肪”,而是一道特定的菜肴,具有已知的制作方法,卡路里估算反映了黄油、奶油和慢炖技术的特点。

这种方法也扩展到区域变体。系统能够区分加土豆的加尔各答风味香饭和海得拉巴风味的蒸香饭,因为它们的卡路里档案确实不同。

多模态输入以识别隐形成分

当仅凭照片无法满足需求时,Nutrola会使用语音和文本提示来填补空白。用户可以说“这是用椰子油做的”或“阿雷帕里有奶酪”,系统会相应调整估算。这种多模态的方法解决了纯基于照片的系统无法解决的隐形卡路里问题。

更好的全球识别对用户意味着什么

对于每天食用非西方饮食的数百万人来说,准确的食品人工智能并不是奢侈功能,而是一个有效的营养追踪器与一个悄悄破坏他们目标的追踪器之间的区别。

2023年《营养与饮食学会杂志》发表的一项研究发现,当用户认为他们的应用不准确时,营养追踪的依从性下降了40%。如果你的追踪器持续错误识别你的餐食,你就会停止信任它,进而停止使用它。

准确的全球食品识别对侨民社区也至关重要。一个在美国长大的印度裔二代,每周吃混合的达尔、烤饼和沙拉,需要一个能够同样精准处理这两种美食的应用。在伦敦的尼日利亚学生做埃古西汤时,不应该因为人工智能从未见过这道菜而不得不手动输入每一种成分。

食品人工智能的未来之路

食品识别领域正在朝着更大的多样性发展,但进展并不均衡。新的数据集如ISIA Food-500和Nutrition5k正在扩大覆盖面,而迁移学习技术则允许模型以较少的标记数据适应未被充分代表的美食。

未来的关键差异化因素将是经过验证的营养数据。识别一道菜是香饭仅仅是问题的一半。将这种识别映射到准确的卡路里和宏观营养分解上,需要超越通用食品数据库的区域特定营养知识。

对于任何追踪非标准西方饮食的人来说,关于任何食品人工智能的问题很简单:这个系统是否在我的食物上进行过训练?

常见问题解答

哪个是最佳的印度食品卡路里追踪应用?

最佳的印度食品卡路里追踪器需要具备两个条件:一个在多样化南亚菜肴上训练的识别模型,以及一个考虑传统制作方法的营养数据库。主要在西方数据集上训练的应用往往会错误分类香饭、奶酪烤饼和达尔玛卡尼等菜肴,导致显著的卡路里错误。Nutrola的模型经过130多个国家的食品图像训练,并保持反映真实烹饪方法的菜肴特定营养档案,包括酥油、奶油和区域变体。

为什么我的卡路里追踪器对民族食品给出错误结果?

大多数主流食品追踪器使用的识别模型训练于以西方美食为主的数据集,如Food-101。当这些模型遇到不熟悉的菜肴时,它们要么将其错误分类为视觉上相似的西方菜肴,要么默认使用通用数据库条目。这些错误匹配的营养档案往往相差数百卡路里,尤其是对于使用酥油、棕榈油或椰奶等在照片中不可见的烹饪脂肪制作的菜肴。

人工智能能否准确追踪中东食品的卡路里?

如果模型专门针对如沙威玛、法图什、基贝和曼萨夫等菜肴进行训练,并且营养数据库考虑了橄榄油、芝麻酱和黄油的含量,人工智能可以准确追踪中东食品的卡路里。中东美食中的许多食物在烹饪过程中会从脂肪中获得大量卡路里。结合照片识别与用户提供的准备细节(如使用的橄榄油量)的系统将产生更可靠的估算。

食品人工智能如何处理成分复杂的菜肴?

复杂的混合或分层成分的菜肴,如黑酱、香饭和炖菜,是食品识别中最具挑战性的任务之一。纯图像系统只能分析可见的表面,无法捕捉内部层次和吸收的脂肪。先进的食品人工智能通过菜肴级识别来解决这一问题,识别完整的菜肴而不是单独的成分,并通过多模态输入让用户可以通过文本或语音添加有关隐形成分的细节。这种结合的方法显著提高了复杂多成分准备的准确性。

众包食品数据对国际美食的准确性如何?

众包营养数据库在国际美食方面的准确性往往最低。像焦米饭、生鱼片或泰式炒河粉这样的菜肴条目通常由用户提交,这些用户可能没有考虑到区域差异、烹饪脂肪或正宗的制作方法。单一的“香饭”条目无法代表从清淡的素香饭到丰盛的羊肉蒸香饭的卡路里范围。经过验证的数据库提供区域特定的营养档案和变体级细节,为非西方美食提供了更可靠的数据。

准备好改变您的营养追踪方式了吗?

加入成千上万已通过 Nutrola 改变健康之旅的用户!