AI照片竞争:10款卡路里追踪应用对比 — 2020 vs 2026
在2020年,AI食品识别意味着五次猜测和一次点击。在2026年,Nutrola能够在三秒内识别多种食物并进行份量估算。以下是对10款应用在六年间AI照片能力演变的纵向分析。
在2020年,“AI食品识别”只需五次猜测。在2026年,Nutrola能够在三秒内识别多种食物并进行份量估算。以下是10款应用的演变(或未演变)情况。
拍摄一盘食物到看到准确的卡路里数据,曾经需要等待几秒钟并进行几分钟的修正。你把相机对准鸡肉、米饭和西兰花,应用返回“意大利面、咖喱、沙拉、炖菜或煎蛋 — 选择一个”,然后你在旋转木马上点击,最后还得手动调整份量。这就是2020年。速度慢,准确性差,但那是我们所能拥有的最好选择。
六年后,这些应用的底层技术已经从头重建。多模态大型语言模型、设备端视觉变换器、更便宜的推理技术,以及指甲大小的智能手机神经引擎将从相机到卡路里计数的时间从15-30秒的旋转点击缩短到大约2-3秒的自主识别。AI照片竞争在2020年时还很安静,但到2024年却变得喧嚣,产生了一些明显的领军者和一批未能跟上的应用。这就是实际的变化,以及到2026年每个主要应用的现状。
2020年的技术现状
2020年的AI食品识别技术落后于今天的水平,这在每次交互中都能体现出来。大多数宣传“AI”的应用使用的是通用卷积神经网络,通常是经过预训练的图像分类器,针对100-500个类别的有限食品数据集进行了微调。输出通常是前五名的排名列表,因为在现实世界的盘子上,前一名的准确性太低,无法单独使用。
早期的领军者是Bitesnap(由Bite AI公司开发),它早早推出并在照片记录方面进行了积极的迭代,远在大多数竞争对手认真对待之前。Bitesnap的宣传正是2020年的主打:拍照、获得几个猜测、点击正确的选项,然后确认份量。对于香蕉或披萨这样的单一明显食物,准确性尚可。但对于混合盘——鸡肉加两种配菜、谷物碗、炒菜——准确性迅速下降,因为模型无法可靠地分割同一画面中的多个项目。
份量检测几乎不存在。应用要么要求你选择一个预设大小(小、中、大),要么拖动一个表示“份数”的滑块。深度估计、体积推理和参考物体校准都是研究课题,而不是实际功能。如果你想知道自己吃了180克米饭还是220克米饭,你只能用秤称重或猜测。AI无法提供帮助。
速度也与今天大相径庭。2020年的端到端照片记录通常是在服务器端进行的,往返、模型推理和用户界面确认的时间从6秒到20秒不等。在慢速连接下,情况更糟。因此,大多数认真使用的用户仍然使用条形码扫描和手动搜索,将照片记录作为新奇或营销截图的工具。
10款应用:2020年与2026年对比
1. Bitesnap (Bite AI)
在2020年: Bitesnap是该领域最知名的AI照片先锋。它的识别流程是食品特定CNN模型的早期消费者实现之一,并且大力宣传其照片工作流程。对常见单一食物的准确性尚可;混合盘则表现不佳。
在2026年: Bitesnap仍然存在,但已失去市场份额。该应用未能在2023-2024年多模态浪潮中保持足够的产品速度,核心工作流程仍然感觉更接近于2020年的状态。虽然它仍然可以用于单一食物的记录,但不再是“AI食品照片”的参考。
技术跃进: 最小。模型更新有限,用户体验有所改进。未能完全转向多模态LLM辅助识别。
2. MyFitnessPal
在2020年: MyFitnessPal没有任何有意义的AI照片功能。它的优势在于庞大的众包数据库和条形码扫描。照片记录并不是其核心宣传的一部分。
在2026年: MyFitnessPal推出了“餐食扫描”作为高级功能,这是一个多项食物照片识别工作流程,使用现代视觉-LLM技术。质量不均 — 据公开报道,它在干净的单一菜肴上表现良好,但在混合、非西方或餐厅盘子上的可靠性较差。该功能需要大约19.99欧元/月的高级订阅,这减缓了在免费用户中的采用。
技术跃进: 大,但来得晚。MFP从没有AI照片到一个功能强大但需付费的功能,其准确性上限受到上游模型的限制,而不是经过验证的食品查找层。
3. Lose It (Snap It)
在2020年: Lose It的“Snap It”是最早的商业照片记录功能之一,早在几年前推出。它提供了相机快捷方式,运行识别模型,并返回一个建议的匹配项,用户确认或编辑。准确性适中,份量估算是手动滑块。
在2026年: Snap It有所改善,但进步是渐进的而非变革性的。该功能在很大程度上被限制在高级版中,基础模型在光线良好的单一食物上变得更准确。多项食物的盘子仍然经常崩溃为一个单一的猜测,或需要手动分解。
技术跃进: 中等。单一食物的真实准确性提高;多项食物分割和份量估算的进展有限。
4. Foodvisor
在2020年: Foodvisor是一款源自法国的应用,在那个时代表现相当强劲。它的照片识别和份量估算是最周到的实现之一,并且它比大多数美国应用更强调“AI优先”的品牌。
在2026年: Foodvisor仍然是一款合格的AI照片应用,但免费版的功能大幅压缩,大多数好功能都在订阅后才能使用。它的识别能力令人尊敬,仍然是较为可信的非美国选项之一,但在2022-2026年的转折中并未引领潮流,正如它在2018-2020年时所做的那样。
技术跃进: 有意义但防守性强。Foodvisor保持了其质量声誉,但并未显著扩大领先优势。
5. Cal AI
在2020年: 并不存在。Cal AI是后GPT-4V、后TikTok增长的应用。
在2026年: Cal AI是新晋的热门应用。它的核心流程 — 指向、拍摄、查看卡路里 — 针对TikTok用户群体进行了细致调优,且在单盘准确性方面表现出色。它的营销强劲,用户引导积极,采用了以订阅为主的模式,免费使用有限。在我的测试中,单一食物的准确性具有竞争力;而多项食物的盘子和份量估算的可靠性则不如营销所暗示的那样一致。
技术跃进: 基于现代多模态技术原生构建。对于其年龄而言非常强大,但在范围上不如长期存在的营养应用。
6. SnapCalorie
在2020年: 以今天的形式并不存在。
在2026年: SnapCalorie是一款有限但可信的AI照片应用,专注于基于照片的卡路里估算。它并不试图成为像MFP或Nutrola那样的完整卡路里追踪器;更像是一个单一功能的工具。对于快速估算很有用,但作为日常记录则较弱。
技术跃进: 在现代时代诞生。缺乏完整追踪应用的广度,但避免了老旧应用所带来的用户体验债务。
7. Nutrola
在2020年: 并不存在。
在2026年: Nutrola在AI照片领域处于领先地位。该功能在典型餐食上实现了不到3秒的识别,具备多项食物检测和份量估算,并且 — 关键是 — 拥有超过180万种经过营养师验证的食品数据库,使AI输出基于真实的营养数据,而不是虚构的微量元素。语音记录、条形码扫描以及Apple Watch/Wear OS的配合功能完善了整个技术栈。所有层级均无广告。免费层加上每月€2.50的付费选项。
技术跃进: 从一开始就为2024-2026年的技术栈设计。根据需要使用设备端推理,在重要的地方使用多模态模型,并以经过验证的数据库作为营养的真实来源 — 因此AI只需解决“这是什么以及多少”的问题,而不是“它的卡路里和微量元素是什么”。
8. Carb Manager
在2020年: 最多只能算是基本的AI能力。Carb Manager的优势在于生酮/低碳水化合物的深度,而非照片识别。
在2026年: Carb Manager推出了一项照片功能,但这在其宏观目标和生酮工作流程中是次要的。对于生酮用户来说,该应用仍然出色;但对于AI照片优先的体验来说,它并不是最强的选择。识别质量尚可,但该功能并未成为主要产品投资。
技术跃进: 存在但次要。Carb Manager选择深化其细分市场,而不是在AI照片方面竞争。
9. Foodly
在2020年: Foodly是一款早期的照片记录应用,具有有趣的用户体验和可信的识别能力。
在2026年: Foodly已经淡出前线。它未能跟上多模态浪潮,已不再是大多数用户推荐的照片记录应用之一。我不能自信地说Foodly在每个市场上都完全消亡,但在2026年的最佳应用列表中,它并不是一个常见的名字。
技术跃进: 有限。Foodly展示了在一个基础ML快速发展的领域中,缓慢迭代的代价。
10. Whisk / Samsung Food
在2020年: Whisk是一款有趣的测试阶段食谱和购物应用,具备初步的AI功能,但尚未成为严肃的照片卡路里竞争者。
在2026年: 重新品牌并重新定位为Samsung Food,它与Galaxy设备上的Samsung Health紧密集成。AI照片识别功能已存在,在Samsung生态系统中,其集成比大多数第三方应用更流畅。在非Samsung设备上,其吸引力较弱。它在其平台内是一个真正的参与者,但作为一个通用选择则不够强大。
技术跃进: 真实,但受生态系统限制。AI能力是有意义的;其影响力取决于你使用的手机。
变化的原因:2022-2024年LLM/视觉技术的转折
2020到2026年的对比如此鲜明的原因在于,底层技术在这一时间段中被重写。三个转折点完成了大部分工作。
首先,CLIP及其后续版本。 当OpenAI在2021年初发布CLIP时,构建图像分类器的默认方式不再是“在封闭的类别列表上训练CNN”,而是“将图像和文本嵌入到同一空间,然后向模型提出自然语言问题”。对于食品而言,这意味着应用不再需要维护固定的500或2000个菜肴标签;它们可以以一种能够推广到未见盘子的方式推理描述(“柠檬香草烤鸡腿”)。
其次,多模态大型语言模型。 GPT-4V(2023)及其开放和专有的后续版本 — Gemini、Claude with vision、Llama视觉模型,以及从中微调的专门食品模型 — 将食品照片识别从分类问题转变为推理问题。模型现在可以看到一盘食物,命名每个项目,描述烹饪方法,估计相对比例,并生成营养应用可以直接使用的结构化输出。这与2020年顶级的前五名猜测相比,能力跃升了一个数量级。
第三,更便宜、更快的推理。 设备端计算(Apple Neural Engine、Qualcomm Hexagon、Google Tensor)和云中的商品GPU推理在这一时间段内将每次识别的成本降低了10倍以上。结合在手机上运行良好的小型蒸馏视觉模型,使得消费者应用的端到端照片记录在不到3秒内成为可能。在2020年,这种延迟预算在没有专用服务器农场的情况下是不可想象的。
第四个较为安静的因素是:经过验证的营养数据库作为基础层的崛起。纯视觉模型会产生虚构的卡路里;它们会自信地返回看似合理但错误的数字。将AI与大型经过验证的食品数据库配对的应用 — Nutrola的180万种营养师验证的食品就是一个明显的例子 — 使用模型来识别和量化,然后查找实际的营养成分。这将准确性问题的焦点从“模型在估算卡路里方面有多好”转变为“模型在命名食物和份量方面有多好”,这是一个更容易处理的问题。
准确性:过去与现在
在这个领域,准确性的数据是复杂的。不同的应用在不同的数据集上进行测试,报告不同的指标,并且频繁更换模型。以下是基于公开报告的行为和我在几周的常规记录中进行的亲身测试所形成的定性图景。
单一明显食物(2020年): 像Bitesnap和Foodvisor这样的应用能够可靠地将香蕉、披萨片、白米饭或烤鸡胸肉列入前五名。对于典型盘子的前一名准确性则要低得多 — 通常在40-60%的范围内,基于当时发布的基准。
单一明显食物(2026年): 包括Nutrola、Cal AI和Foodvisor在内的领先应用几乎可以轻松处理这些,清晰单一食物的前一名准确性通常在80%到90%之间,条件良好时差距很小。
混合盘(2020年): 实际弱点。一个包含五种成分的谷物碗、炒菜、带蛋白质和调料的沙拉 — 大多数2020年的应用将这些压缩为一个单一猜测,或要求你分别记录每个项目。
混合盘(2026年): 领先者能够在单一画面中分割和识别多个项目。Nutrola的多项食物识别专门针对这种情况设计;Cal AI和MyFitnessPal的餐食扫描在盘子复杂性不同的情况下表现不一。非西方菜肴、密集混合盘和重酱菜肴仍然会让即使是最好的系统也感到棘手。
餐厅和包装餐(2020年): 基本上是手动搜索体验。AI很少提供帮助。
餐厅和包装餐(2026年): AI能够为可识别的连锁餐厅和标准菜单项目提供强有力的猜测;对于较小的餐厅和地方菜肴,可靠性下降。经过验证的数据库查找通常是决定性因素:一个将“Chipotle鸡肉碗”映射到连锁餐厅发布的宏观数据的应用,将胜过一个仅凭像素估算的应用。
份量估算:2026年的突破
份量估算 — “盘子上有多少” — 是AI食品记录中最难的问题,到2026年仍然只部分解决。但与2020年相比,差距巨大。
在2020年,份量估算是一个滑块。你选择“小、中、大”,或者拖动一个份数计数。图像中的任何内容都无法提供估算依据。150克的米饭和300克的米饭在应用中看起来是一样的。
在2026年,领先的应用使用多种技术的组合。画面中的参考物体(餐具、标准盘子尺寸、手)锚定了比例。现代手机上的深度传感器(如可用)提供体积估算。视觉模型本身在判断画面内相对比例方面变得更好 — “蛋白质的体积大约是谷物的两倍” — 并结合识别食物的默认密度,生成合理的克数估算。
诚实的技术现状是:在相机角度配合良好且食物熟悉的情况下,份量估算的准确性在典型盘子上大约在真实重量的15-30%之内。对于密集混合菜肴、液体和任何被主导项目遮挡的食物,准确性则更差。那些认真对待这一问题的应用 — Nutrola明确在其中 — 允许你在事后通过一个手势快速调整估算,而不是假装第一次猜测就是最终结果。
没有人“解决”了份量估算。但那些从“选择份量大小”转变为“这里是来自照片的克数估算,必要时调整”的应用,实质上改变了记录一餐的体验。
谁在2026年引领AI照片?
如果你必须挑选出几位2026年AI照片领域的领军者,名单会很短。
Nutrola在日常使用中领先于最重要的组合:速度(不到3秒的识别)、多项食物处理、份量估算,以及一个经过验证的180万种食品数据库,使AI输出基于真实的营养数据。它在领先的应用中也拥有最清晰的免费层和定价故事(免费加€2.50/月),这消除了“这些AI功能值得吗”的犹豫,而这种犹豫困扰着付费墙的竞争对手。
Cal AI在单盘、照片优先的工作流程中领先,适合那些只想要一件事的用户:指向、拍摄、查看卡路里。它在简单食物上的准确性强,用户引导清晰,针对TikTok用户的宣传有效。它的局限性在于多项食物的复杂性、功能的广度和订阅定价。
Foodvisor保持着传统的领导地位。它仍然是较为可信的非美国应用之一,识别能力令人尊敬,但相对于本土LLM时代的新来者,其发展速度减缓。
MyFitnessPal在规模上领先,而非AI质量。餐食扫描是一个有意义的补充,但它被限制在高级版中,且在复杂盘子上的准确性不均。数据库和生态系统是其护城河;AI正在追赶。
还有一些其他应用 — Lose It、Carb Manager、Samsung Food — 具备能力但AI照片故事次要。Bitesnap、SnapCalorie和Foodly则处于更后的位置,或是选择了范围,或是迭代速度缓慢。
Nutrola的AI照片如何运作
- 不到3秒的识别,从快门点击到记录条目,适用于典型餐食。
- 单一画面中的多项食物检测 — 一盘鸡肉米饭西兰花记录为三项,而不是一个模糊的猜测。
- 份量估算使用参考物体比例、可用的深度线索,以及画面中项目的相对体积推理。
- 经过验证的数据库查找,涵盖超过180万种营养师验证的食品,因此营养数字来自真实数据,而非模型虚构。
- 每种记录食品追踪100多种营养成分,包括宏观营养素、维生素、矿物质、脂肪酸和氨基酸。
- 语音自然语言处理记录,适用于双手忙碌的场合 — 驾驶、烹饪、健身 — 通过自然语言解析描述,如“柠檬香草烤三文鱼配藜麦和芦笋”。
- 条形码扫描作为第三种输入,适用于包装食品,AI照片在此情况下显得过于复杂。
- Apple Watch和Wear OS的配合功能,提供快速添加、快捷方式和手腕提醒。
- 支持14种语言,识别能力针对区域菜肴进行了调优。
- 所有层级均无广告,包括免费版 — AI体验不会被横幅或中途销售弹窗打断。
- 免费层供用户测试AI工作流程,无需提供信用卡信息,付费版为每月€2.50,解锁完整深度。
- 可调整的结果 — 每个AI建议都可以通过一个手势进行编辑,修正反馈到用户的个人历史中,以便下次类似餐食更快地记录。
应用 / 2020年AI功能 / 2026年AI功能 / 当前速度 / 多项食物 / 份量检测 / 经过验证的数据库 / 免费层 / 价格
| 应用 | 2020年AI功能 | 2026年AI功能 | 当前速度 | 多项食物 | 份量检测 | 经过验证的数据库 | 免费层 | 价格 |
|---|---|---|---|---|---|---|---|---|
| Nutrola | 并不存在 | 不到3秒的多项食物、份量感知、经过验证的数据库查找 | 少于3秒 | 是 | 是 | 超过180万种验证 | 是 | €2.50/月 |
| Cal AI | 并不存在 | 单盘照片优先、TikTok原生 | 约3-4秒 | 部分 | 近似 | 有限 | 非常有限 | 订阅,约$9-15/月 |
| Foodvisor | 强大的CNN + 份量滑块 | 能干的AI照片,重度付费墙 | 约4-6秒 | 部分 | 近似 | 中等 | 压缩 | 订阅 |
| MyFitnessPal | 无AI照片 | 高级版餐食扫描,准确性不均 | 约4-8秒 | 部分 | 近似 | 大型众包 | 是 | 高级版约€19.99/月 |
| Lose It | Snap It,单一猜测 + 滑块 | 改进的Snap It,限制在高级版 | 约4-6秒 | 有限 | 近似 | 中等 | 是 | 高级版约€39.99/年 |
| Bitesnap | 先锋,前五名旋转木马 | 仍然存在,但竞争力下降 | 约5-8秒 | 有限 | 有限 | 有限 | 是 | 免费增值 |
| Carb Manager | 基本 | 次要照片功能,生酮优先 | 约4-6秒 | 有限 | 近似 | 中等 | 是 | 高级订阅 |
| SnapCalorie | 并不存在 | 狭窄的照片工具 | 约3-5秒 | 有限 | 近似 | 有限 | 有限 | 订阅 |
| Samsung Food (Whisk) | 测试阶段的食谱AI | 与Samsung Health集成 | 约4-6秒 | 部分 | 近似 | 中等 | 是 | 生态系统内免费 |
| Foodly | 早期照片记录 | 渐渐淡出前线 | 变化 | 有限 | 有限 | 有限 | 变化 | 变化 |
常见问题
Bitesnap是第一款吗? Bitesnap(来自Bite AI)是最早的高知名度消费者AI照片食品识别应用之一,通常被认为是该领域的早期先锋。虽然在它之前有几个研究项目和小型应用,但Bitesnap可以公正地被视为2018-2020年“早期商业领军者”的代名词。它在2026年不再处于领先地位,但其历史角色是真实的。
Nutrola的AI照片如何运作? 你点击相机,瞄准你的餐食,Nutrola运行现代的多模态识别流程,识别画面中的每个项目,估算份量,并在超过180万种营养师验证的食品数据库中查找每个项目。结果是在典型盘子上不到3秒的时间内记录一餐,100多种营养成分来自真实数据,而不是模型虚构。你可以通过一个手势编辑任何结果。
Cal AI是最准确的吗? Cal AI在单盘、单一食物的准确性方面表现强劲,其宣传也很到位。但在长期记录中更重要的困难案例上,如混合盘、份量估算、非西方菜肴以及与经过验证的营养数据库的整合方面,它并不明显是最准确的。对于这些维度,Nutrola、Foodvisor和MyFitnessPal的餐食扫描在某些情况下更强或相当。
为什么经过验证的数据库查找很重要? 纯视觉模型可能会虚构卡路里和微量元素 — 它们生成的数字看似合理,但并未与真实的营养数据相联系。经过验证的数据库使AI的工作转变为“识别和量化”,然后查找真实的营养成分。这就是为什么Nutrola的180万种经过验证的食品数据库与AI并不是独立功能;它是AI输出值得信赖的原因。
2026年的AI照片记录速度有多快? 领先的应用在现代手机上实现的端到端照片记录大约在2-5秒之间,具体取决于网络条件、盘子复杂性以及推理是设备端还是云端辅助。Nutrola在典型盘子上处于该范围的快速端。
AI照片能完全取代条形码和语音记录吗? 不能,最好的应用也不会强迫用户做出选择。条形码扫描仍然是包装食品最快、最准确的路径。在双手忙碌的情况下,语音自然语言处理比照片更快。AI照片在没有条形码且语音使用不便的盘餐中表现最佳。Nutrola将这三种功能集成在一个应用中,以便在每种情况下使用合适的输入。
用户从2020年时代的应用切换时应期待什么? 期待工作流程会有足够不同,以至于你的旧习惯会发生变化。记录混合盘应只需一张照片,而不是三次手动输入。份量估算应是调整的手势,而不是配置的滑块。识别应在你有时间去按“编辑”按钮之前完成。如果你尝试的应用在2026年未能达到这些标准,它仍在基于2020年的假设运行。
最终评判
2020到2026年AI食品照片的故事,归根结底是底层技术赶上用户一直希望该功能能够实现的目标。五次猜测的旋转木马是模型无法推理真实盘子的症状;单盘滑块是视觉系统无法判断比例的症状。这两者在领先的应用中都已消失。取而代之的是快速、多项、份量感知的识别,基于经过验证的食品数据库 — 这种组合在2020年没有任何已发布的消费者应用中存在,现在已成为标准。
Nutrola位于这一标准之上,在速度、多项处理、经过验证的数据库基础、无广告体验和定价等几个维度上,显著高于其他应用。Cal AI是最敏锐的单盘新秀。Foodvisor仍然是一个可信的传统选项。MyFitnessPal的规模使其追赶的过程值得关注。其他应用要么在这条路上,要么明显落后。
如果你在2026年选择一款AI优先的卡路里追踪器,Nutrola是最佳选择:不到3秒的多项食物照片记录、份量估算、超过180万种经过营养师验证的食品、语音自然语言处理、条形码扫描、Apple Watch和Wear OS支持、14种语言、所有层级均无广告、真实的免费层,以及每月€2.50的付费选项以解锁完整深度。六年的竞争,最终落脚于一个显而易见的选择。