隐藏的油脂问题:多模态AI如何看见你无法察觉的
烹饪油、黄油和调味汁可能为一餐增加300到500卡路里的隐形热量。单靠照片追踪无法检测到这些热量。多模态AI如何结合图像识别、语音和文本输入,解决卡路里追踪中的最大盲点。
拍一张蔬菜炒菜的照片。看起来是一顿干净、健康的餐:西兰花、彩椒、豌豆和几条鸡肉条铺在米饭上。基于照片的卡路里追踪器可能会估算出400到500卡路里。
但要考虑照片无法显示的内容:在蔬菜入锅之前加了三汤匙的植物油。这额外增加了360卡路里和42克脂肪,虽然它们在菜肴中真实存在,但在图像中却完全不可见。
这就是隐藏的油脂问题,它是照片式卡路里追踪中最大的误差来源。
隐形卡路里的规模
烹饪脂肪是厨房中热量最密集的成分,每克含9卡路里,是蛋白质或碳水化合物热量密度的两倍多。即使适量使用,也会为菜肴增加显著的热量,而这些在食物烹饪后是无法通过视觉检测到的。
以下是常用烹饪脂肪的实际热量贡献:
| 烹饪脂肪 | 用量 | 增加的卡路里 |
|---|---|---|
| 橄榄油 | 2汤匙 | 239 |
| 黄油 | 2汤匙 | 204 |
| 椰子油 | 2汤匙 | 234 |
| 植物油 | 3汤匙 | 360 |
| 酥油 | 2汤匙 | 270 |
| 芝麻油 | 1汤匙 | 120 |
一顿看似500卡路里的家常晚餐,考虑到烹饪脂肪后,实际上可能达到800到900卡路里。在一天的饮食中,这些隐形卡路里可能累计达到500到700卡路里,足以完全抵消计划中的卡路里赤字。
不仅仅是油
隐藏的卡路里问题不仅限于烹饪油,还包括一系列在最终菜肴中变得不可见的高热量添加物:
- 融化在米饭或意大利面的黄油:1汤匙增加102卡路里,融化后无法看见
- 加入汤中的奶油:四分之一杯重奶油为一碗番茄汤增加205卡路里,而看起来与不加奶油的版本完全相同
- 吸收在生菜中的沙拉酱:两汤匙的牧场沙拉酱增加145卡路里,很多在碗底积聚或被生菜吸收
- 腌制在烤肉上的调料:一种照烧腌料每份可能通过糖和油增加50到100卡路里
- 酱料中的糖:一汤匙蜂蜜在炒菜酱中增加64卡路里,视觉上完全无法察觉
为何仅靠照片追踪会失败
计算机视觉在食品识别方面取得了显著进展。现代模型可以识别盘子上的单个食物,利用深度分析估算份量,甚至区分视觉上相似的菜肴。但它们有一个根本的局限性:只能分析可见的内容。
表面问题
照片捕捉的是菜肴的表面。它无法看到吸收在米粒中的油、融化在酱汁中的黄油或混合在咖喱中的奶油。用一汤匙油炒制的炒菜与用四汤匙油炒制的外观几乎相同,但热量差异却高达360卡路里。
无论图像分辨率、模型架构或训练数据如何改进,这个问题都无法解决,因为图像中根本没有这些信息。
统计平均的不足
一些基于照片的系统试图通过统计平均来考虑隐藏的脂肪:根据菜肴类型假设“典型”的油量。这比完全忽略烹饪脂肪要好,但也引入了自身的误差。
家庭烹饪的差异非常大。一个人的“炒菜”可能只用少量油喷洒,而另一个人则可能大量倒入。餐馆的准备工作通常使用的脂肪量是家庭烹饪的两到三倍。统计平均对几乎每个人来说都是错误的,只是方向不同。
多模态AI如何解决隐藏卡路里问题
多模态AI是指结合多种输入类型的系统,例如图像、文本和语音,以构建比任何单一输入更完整的图景。在营养追踪的背景下,这意味着补充相机所见的信息与用户提供的信息。
照片加语音:完整的画面
工作流程很简单。用户拍摄他们的炒菜照片,AI识别可见的成分:西兰花、鸡肉、彩椒、米饭。然后用户添加语音备注:“我用了大约两汤匙的芝麻油和一汤匙的酱油。”
系统现在有了两个数据流:食物项目的视觉识别和用户报告的准备细节。将它们结合起来,产生一个同时考虑可见和不可见成分的热量估算。
Nutrola的多模态方法允许用户在记录时通过语音或文本添加这些上下文信息。系统同时处理这两种输入,根据报告的烹饪方法、油的类型和数量调整营养估算。
智能提示常见盲点
一个智能系统不会仅仅依赖用户自愿提供信息。当AI识别到一种常涉及隐藏脂肪的菜肴类型时,它可以向用户提出针对性的问题。
拍摄一盘意大利面时,系统可能会问:“这是用油还是黄油做的酱?”记录咖喱时,它会问:“这是用椰奶、奶油还是油做的?”
这些上下文提示在记录过程中增加5到10秒,但对于含有显著隐藏脂肪的菜肴,可以提高20到35%的准确性。
学习用户模式
随着时间的推移,多模态系统会学习个体的烹饪模式。如果用户在烹饪蔬菜时始终报告使用两汤匙的橄榄油,系统可以将该基线自动应用于未来的蔬菜菜肴,提示确认而不是每次都从零开始。
这减少了提供准备细节的摩擦,同时保持了准确性的好处。
餐厅问题
在餐厅环境中,隐藏的卡路里问题更为严重,因为用户无法看到准备方法。餐厅厨房通常使用的脂肪量超过家庭厨师的预期。
2016年发表在《美国营养与饮食学会杂志》上的一项研究发现,餐厅餐点的平均热量为1205卡路里,烹饪脂肪大约占总热量的30%,这一比例在研究参与者中普遍被低估。
多模态AI如何处理餐厅餐点
对于餐厅餐点,多模态方法结合了图像识别和上下文知识。当系统识别到餐厅菜肴时,它可以:
- 应用特定于餐厅的份量和准备假设,而不是家庭烹饪的默认值
- 提示用户观察到的细节:“这道菜看起来油腻吗?”或“有没有明显的酱汁?”
- 参考已知的餐厅数据,对于有公开营养信息的连锁餐厅
- 考虑菜系类型的基线:意大利餐厅通常使用更多的橄榄油;印度餐厅使用更多的酥油和奶油;中餐厅在高温下使用更多的植物油
这种分层的方法虽然无法达到实验室的精确度,但显著缩小了估算与实际卡路里含量之间的差距。
追踪隐藏脂肪的实用策略
即使使用多模态AI,对隐藏卡路里的意识也能提高追踪的准确性。以下是基于证据的策略。
烹饪前测量
最有效的策略是,在将烹饪脂肪加入锅中之前进行测量。使用厨房秤或量勺只需10秒钟,完全消除猜测。然后你可以将确切的量报告给你的追踪应用。
了解高风险菜肴
某些菜肴类型始终携带更多的隐藏卡路里:
- 炒菜和煎菜:油是主要的烹饪介质
- 咖喱和炖菜:通常含有椰奶、奶油或酥油
- 烤蔬菜:通常在烤之前用2到4汤匙的油拌匀
- 意大利面菜肴:最后用黄油或橄榄油调味
- 沙拉加调味汁:调味汁通常比蔬菜贡献更多的卡路里
养成语音记录的习惯
养成在每次照片记录后添加3秒语音备注的习惯:“用橄榄油烹饪”或“没有加油,空气炸”。这个小补充在付出最小努力的情况下,显著提高了记录的准确性。
不确定时默认高估
如果你没有准备这顿饭,无法估算脂肪含量,默认高估比低估更有用。低估烹饪脂肪的情况远比高估常见,尤其是在餐厅餐点中。
常见问题解答
烹饪油为一餐增加了多少隐形卡路里?
每汤匙烹饪油大约含有120卡路里和14克脂肪。大多数家常菜使用两到三汤匙,增加240到360卡路里的隐形热量。餐厅菜肴通常使用更多。由于油在烹饪过程中被吸收,这些卡路里无法通过视觉检查或仅靠照片追踪检测到。在一天的家常餐中,隐藏的烹饪脂肪可能增加400到700卡路里,而标准的照片记录却遗漏了这些。
为何照片式卡路里追踪不准确?
照片式卡路里追踪在识别可见食物和估算份量方面是准确的,但无法检测在烹饪过程中被吸收的成分。烹饪油、融化的黄油、奶油酱、腌料中的糖以及吸收到沙拉中的调味汁在照片中都是不可见的。这是基于图像分析的根本局限,而不是任何特定应用技术的缺陷。多模态AI结合了图像识别和用户提供的准备方法上下文,解决了这一局限。
什么是食品追踪中的多模态AI?
多模态AI是指同时处理多种输入类型的人工智能系统。在食品追踪中,这意味着将照片识别(视觉输入)与语音备注或文本描述(语言输入)结合,以构建更完整的营养估算。例如,一张照片识别你盘子上的食物,而语音备注补充你使用了椰子油烹饪。系统整合这两种数据流,生成一个同时考虑可见和不可见卡路里来源的估算。
如何在家烹饪时更准确地追踪卡路里?
最有效的方法结合三种做法。首先,在将烹饪脂肪加入锅中之前,用量勺或厨房秤测量。其次,使用一个允许你在拍摄食物照片时通过语音或文本添加准备细节的多模态追踪应用。最后,了解高风险的隐形卡路里来源:烹饪油、黄油、奶油、调味汁和含糖酱料。记录这些添加物只需几秒钟,但能将你的每日卡路里准确性提高20%到35%。
餐厅使用的油比家庭烹饪多吗?
是的,使用量大得多。研究表明,餐厅餐点约有30%的卡路里来自添加的烹饪脂肪,厨师通常使用比家庭厨师更多的油、黄油和奶油,以增加风味和口感。一道餐厅的炒菜可能使用的油量是同样菜肴的家庭版的三到四倍。这也是餐厅餐点即使在份量看起来合理的情况下,热量常常超出预期的原因之一。