تصنيف جميع تطبيقات تتبع السعرات الحرارية المدعومة بالذكاء الاصطناعي: اختبار دقة مستقل لعام 2026
قمنا باختبار جميع تطبيقات تتبع السعرات الحرارية المدعومة بالذكاء الاصطناعي باستخدام 50 وجبة متطابقة. كانت الفروق في الدقة مذهلة. إليك النتائج الكاملة.
تدعي معظم تطبيقات تتبع السعرات الحرارية أنها دقيقة، لكن القليل منها يثبت ذلك. وعندما تتعلق هذه الادعاءات بالتعرف على الطعام المدعوم بالذكاء الاصطناعي — وهي التقنية التي تتيح لك التقاط صورة والحصول على تقدير للسعرات الحرارية — يمكن أن يكون الفارق بين وعود التسويق والواقع القابل للقياس شاسعًا.
أردنا أن نعرف مدى اتساع هذا الفارق. لذلك صممنا اختبارًا محكمًا: 50 وجبة، ثمانية تطبيقات، حقيقة واحدة. تم وزن كل وجبة على ميزان غذائي معاير، وتم التحقق من كل مكون مقابل قاعدة بيانات USDA FoodData Central، وتم تسجيل كل نتيجة تحت ظروف متطابقة.
أظهرت النتائج الفرق بين التطبيقات التي تحقق ادعاءاتها من حيث الدقة وتلك التي لا تفعل ذلك. إليك التفاصيل الكاملة.
لماذا يعتبر هذا الاختبار مهمًا
لم يعد تتبع السعرات الحرارية المدعوم بالذكاء الاصطناعي مجرد موضة. إنه ميزة أساسية يعتمد عليها الملايين من الناس في فقدان الوزن، وزيادة الكتلة العضلية، والعلاج الغذائي الطبي، وإدارة الصحة العامة. إذا أخبرك تطبيق أن وجبة تحتوي على 450 سعرة حرارية بينما هي في الواقع 680، فإن الفارق البالغ 230 سعرة حرارية يتراكم عبر كل وجبة، كل يوم. على مدار أسبوع، يمكن أن تمحو هذه الأخطاء النظامية عجز السعرات الحرارية بالكامل.
على الرغم من المخاطر، فإن المقارنات المستقلة للدقة بين التطبيقات نادرة. معظم المقالات "المقارنة" تصنف التطبيقات بناءً على الميزات والأسعار وواجهة المستخدم. هذه الأمور مهمة، لكنها لا تجيب على السؤال الأكثر جوهرية: عندما تسجل وجبة، ما مدى قرب الرقم من الواقع؟
هذا الاختبار يجيب على هذا السؤال.
المنهجية الكاملة
تصميم الاختبار
اخترنا 50 وجبة تم تصميمها لتمثل مجموعة كاملة من أنماط الأكل في العالم الحقيقي. تم تقسيم الوجبات إلى خمس فئات، كل منها تحتوي على عشر وجبات:
وجبات بسيطة ذات عنصر واحد — موزة. صدر دجاج مشوي. وعاء من الأرز الأبيض. بيضة مسلوقة. أطعمة حيث يوجد عنصر واحد يمكن التعرف عليه بوضوح مع حد أدنى من تعقيد التحضير.
وجبات منزلية مطبوخة قياسية — سباغيتي مع صلصة اللحم. دجاج مقلي مع الخضار والأرز. ساندويتش ديك رومي مع خس وطماطم ومايونيز. وجبات تحتوي على ثلاثة إلى ستة مكونات قابلة للتعرف عليها في تحضيرات شائعة.
أطباق معقدة متعددة المكونات — أطباق بوريتو مع سبعة مكونات أو أكثر. سلطة محملة بالحبوب والمكسرات والجبن والصلصة. كاري منزلي مع حليب جوز الهند فوق الأرز. أطباق حيث تتداخل المكونات أو تتكدس أو تكون مخفية جزئيًا.
وجبات على طراز المطاعم — شريحة بيتزا بيبروني. برجر مع بطاطس مقلية. باد تاي. لفائف السوشي. تم تحضير هذه الوجبات لتتناسب مع الوصفات والعروض النموذجية للمطاعم، باستخدام حصص تجارية قياسية.
وجبات غنية بالسعرات ومخادعة — وعاء سموذي مع جرانولا وزبدة مكسرات وعسل. مزيج من المكسرات. سلطة سيزر مع كروتون وجبن بارميزان (التي تبدو خفيفة لكنها ليست كذلك). وجبات تميل إلى خداع كل من البشر والخوارزميات بسبب الدهون والزيوت المخفية والتغطيات الغنية بالسعرات.
حساب الحقيقة الأساسية
لكل وجبة، قمنا بتحديد قيمة السعرات الحرارية والمغذيات الأساسية باستخدام العملية التالية:
- تم وزن كل مكون بشكل فردي على ميزان غذائي رقمي معاير (دقة: زائد أو ناقص 1 جرام).
- تم حساب القيم الغذائية باستخدام قاعدة بيانات USDA FoodData Central (مجموعات البيانات المرجعية القياسية والأغذية الأساسية).
- بالنسبة للأطباق المطبوخة، أخذنا في الاعتبار فقدان الماء وامتصاص الزيت باستخدام عوامل الاحتفاظ من USDA.
- بالنسبة للوجبات المركبة، تم وزن كل مكون وحسابه بشكل منفصل، ثم جمعه.
- قام عضوان من الفريق بحساب القيم المرجعية بشكل مستقل. أي اختلاف أكبر من 2 في المئة تم إعادة التحقق منه وحله.
تمثل القيم الناتجة عن الحقيقة الأساسية أدق تقديرات غذائية يمكن تحقيقها خارج مختبر قياس السعرات الحرارية.
بروتوكول اختبار التطبيقات
تم تصوير كل من الوجبات الخمسين باستخدام آيفون 15 برو في إضاءة مطبخ طبيعية، من زاوية حوالي 45 درجة فوق الطبق على بعد حوالي 30 سنتيمترًا. تم استخدام نفس الصورة عبر جميع التطبيقات التي تدعم التسجيل القائم على الصور.
بالنسبة للتطبيقات التي لا تدعم التسجيل القائم على الصور (أو حيث يكون التسجيل القائم على الذكاء الاصطناعي ميزة ثانوية)، استخدمنا الطريقة الأساسية الموصى بها للتسجيل: إدخال يدوي قائم على البحث من قاعدة بيانات الطعام الخاصة بالتطبيق، مع اختيار العنصر الأقرب وضبط الحصة لتتناسب مع الوزن الذي تم قياسه بأكبر قدر ممكن وفقًا لواجهة التطبيق.
هذه التمييز مهم. اختبرنا كل تطبيق بالطريقة التي سيستخدمها المستخدم الحقيقي، وليس بالطريقة التي ستكون أكثر ملاءمة أو غير ملائمة لأي تطبيق معين.
تم تسجيل كل وجبة في جميع التطبيقات الثمانية خلال نافذة زمنية مدتها 30 دقيقة. تم التقاط الصورة مرة واحدة، وتم تقديم نفس الصورة لكل تطبيق يدعم تسجيل الصور. بالنسبة للتطبيقات القائمة على البحث، قام نفس العضو من الفريق بأداء عملية البحث والاختيار في كل مرة للتحكم في تباين المستخدم.
قمنا بتسجيل ما يلي لكل وجبة في كل تطبيق:
- تقدير إجمالي السعرات الحرارية
- تقدير البروتين (بالجرامات)
- تقدير الدهون (بالجرامات)
- تقدير الكربوهيدرات (بالجرامات)
- الوقت المستغرق لإكمال التسجيل (من فتح التطبيق إلى تأكيد الإدخال)
- ما إذا كان التطبيق قد حدد بشكل صحيح العنصر (العناصر) الغذائية
التطبيقات الثمانية التي تم اختبارها
| التطبيق | النسخة المختبرة | طريقة التسجيل الأساسية | ميزة الذكاء الاصطناعي للصور |
|---|---|---|---|
| Nutrola | 3.2.1 | صورة بالذكاء الاصطناعي + بحث | نعم (ميزة أساسية) |
| MyFitnessPal | 24.8.0 | بحث + رمز شريطي | نعم (محدودة) |
| Lose It! | 16.3.2 | بحث + رمز شريطي | نعم (محدودة) |
| Cronometer | 4.5.0 | بحث + يدوي | لا |
| YAZIO | 8.1.4 | بحث + رمز شريطي | لا |
| FatSecret | 10.2.0 | بحث + رمز شريطي | لا |
| MacroFactor | 2.8.3 | بحث + يدوي | لا |
| AI Food Scanner | 5.0.1 | صورة بالذكاء الاصطناعي فقط | نعم (ميزة أساسية) |
ملاحظة حول "AI Food Scanner": هذا تطبيق تقدير السعرات الحرارية المدعوم بالذكاء الاصطناعي يعتمد بالكامل على تحليل الصور دون وجود خيار بحث يدوي. قمنا بتضمينه لأن هذه الفئة من الماسحات الضوئية المدعومة بالذكاء الاصطناعي قد نمت بسرعة، ويستحق المستخدمون معرفة كيفية مقارنتها بالمنصات الأكثر رسوخًا.
النتائج: التصنيفات العامة
إليك التطبيقات الثمانية مرتبة حسب دقة السعرات الحرارية الإجمالية، مقاسة كنسبة الخطأ المطلقة المتوسطة (MAPE) عبر جميع الوجبات الخمسين.
| الرتبة | التطبيق | متوسط خطأ السعرات الحرارية (%) | متوسط انحراف السعرات الحرارية (سعرة حرارية) | دقة البروتين (% خطأ) | متوسط وقت التسجيل (ثواني) |
|---|---|---|---|---|---|
| 1 | Nutrola | 6.8% | 34 سعرة حرارية | 7.4% | 8 |
| 2 | Cronometer | 8.1% | 41 سعرة حرارية | 8.9% | 47 |
| 3 | MacroFactor | 8.6% | 44 سعرة حرارية | 9.2% | 42 |
| 4 | MyFitnessPal | 11.3% | 58 سعرة حرارية | 13.1% | 35 |
| 5 | Lose It! | 12.7% | 65 سعرة حرارية | 14.6% | 38 |
| 6 | YAZIO | 13.4% | 69 سعرة حرارية | 15.2% | 40 |
| 7 | FatSecret | 14.9% | 76 سعرة حرارية | 16.8% | 44 |
| 8 | AI Food Scanner | 19.2% | 98 سعرة حرارية | 22.4% | 5 |
ماذا تعني التصنيفات
Nutrola قدمت أقل متوسط خطأ عبر جميع الوجبات الخمسين، مع انحراف متوسط في السعرات الحرارية يبلغ 34 سعرة حرارية فقط. كانت التطبيق الوحيد الذي حافظ على متوسط خطأ أقل من 7 في المئة. تم التعرف على العناصر الغذائية الفردية بشكل صحيح في 47 من 50 وجبة، وقدمت تقديرات حصص قابلة للاستخدام دون الحاجة إلى تعديلات يدوية في معظم الحالات.
احتلت Cronometer وMacroFactor المركزين الثاني والثالث، وهو أمر ملحوظ لأن كلا التطبيقين لا يعتمد على تسجيل الصور المدعوم بالذكاء الاصطناعي. تأتي دقتهما من قواعد بيانات غذائية عالية الجودة وموثوقة — حيث تستمد Cronometer بياناتها من NCCDB وUSDA، بينما تستخدم MacroFactor قاعدة بيانات منسقة تحتفظ بها فريق Stronger By Science. العيب هو السرعة: كلاهما يتطلب إدخال يدوي للبحث والحصة، بمتوسط يزيد عن 40 ثانية لكل وجبة مقارنة بـ 8 ثواني لـ Nutrola.
احتل MyFitnessPal المركز الرابع. تعتبر قاعدة بياناته الضخمة المستندة إلى المجتمع هي أكبر نقاط قوته وأكبر نقاط ضعفه في الدقة. عندما توجد إدخالات الطعام الصحيحة، يمكن أن تكون البيانات جيدة جدًا. لكن الحجم الهائل من الإدخالات المكررة والقديمة والمقدمة من المستخدمين يعني أن المستخدمين يختارون في كثير من الأحيان إدخالات بقيم غذائية غير صحيحة. توجد ميزة الصور المدعومة بالذكاء الاصطناعي الجديدة في التطبيق، لكنها أنتجت نتائج غير متسقة في اختباراتنا، وغالبًا ما تتطلب تصحيحًا يدويًا.
أداء Lose It! وYAZIO كان مشابهًا في نطاق الخطأ بين 12 و14 في المئة. كلاهما تطبيقات تتبع كفؤة مع قواعد بيانات قابلة للاستخدام، لكن لم يقدم أي منهما دقة قاعدة البيانات مثل Cronometer أو سرعة الذكاء الاصطناعي لـ Nutrola.
أظهر FatSecret أعلى معدل خطأ بين التطبيقات التقليدية، ويرجع ذلك إلى اعتماده على قاعدة بيانات مستندة إلى المجتمع حيث تكون عملية التحقق غير متسقة.
كان AI Food Scanner هو الأسرع بمتوسط وقت تسجيل يبلغ 5 ثوانٍ، لكنه أيضًا كان لديه أعلى معدل خطأ بفارق كبير عند 19.2 في المئة. غالبًا ما أخطأ في تقدير أحجام الحصص وعانى مع الوجبات متعددة المكونات. السرعة دون دقة تخلق شعورًا زائفًا بالتقدم.
النتائج حسب فئة الوجبة
تخبر التصنيفات العامة جزءًا من القصة. يكشف التحليل على مستوى الفئات عن الأماكن التي يتفوق فيها كل تطبيق وأين يفشل.
وجبات بسيطة ذات عنصر واحد
| الرتبة | التطبيق | متوسط خطأ السعرات الحرارية (%) |
|---|---|---|
| 1 | Nutrola | 3.1% |
| 2 | Cronometer | 3.4% |
| 3 | MacroFactor | 3.7% |
| 4 | MyFitnessPal | 5.2% |
| 5 | YAZIO | 5.8% |
| 6 | Lose It! | 6.1% |
| 7 | FatSecret | 6.9% |
| 8 | AI Food Scanner | 9.4% |
تعتبر الوجبات البسيطة هي المساواة الكبرى. عندما يكون هناك عنصر غذائي واحد يمكن التعرف عليه بوضوح مع حصة واضحة، فإن معظم التطبيقات تؤدي بشكل معقول. كانت التطبيقات الثلاثة الأولى جميعها ضمن نقطة مئوية واحدة من بعضها البعض. حتى أسوأ أداء بقي تحت 10 في المئة.
وجبات منزلية مطبوخة قياسية
| الرتبة | التطبيق | متوسط خطأ السعرات الحرارية (%) |
|---|---|---|
| 1 | Nutrola | 5.4% |
| 2 | Cronometer | 6.8% |
| 3 | MacroFactor | 7.1% |
| 4 | MyFitnessPal | 9.6% |
| 5 | Lose It! | 10.8% |
| 6 | YAZIO | 11.2% |
| 7 | FatSecret | 12.4% |
| 8 | AI Food Scanner | 16.7% |
هنا تبدأ الفجوة. تقدم الوجبات المنزلية المطبوخة متغيرات مثل زيت الطهي، وتفاوت نسب المكونات، ومكونات غير مرئية بشكل فردي في الصورة. تعاملت AI لـ Nutrola مع هذه الأمور بشكل معقول، حيث اكتشفت مكونات متعددة وقدرت الحصص بدقة متوسطة. تطلبت التطبيقات المعتمدة على قواعد البيانات من المستخدمين تسجيل كل مكون بشكل منفصل، وهو أكثر دقة من الناحية النظرية لكنه يقدم خطأ بشريًا ويستغرق وقتًا أطول بكثير.
أطباق معقدة متعددة المكونات
| الرتبة | التطبيق | متوسط خطأ السعرات الحرارية (%) |
|---|---|---|
| 1 | Nutrola | 8.9% |
| 2 | MacroFactor | 10.2% |
| 3 | Cronometer | 10.5% |
| 4 | MyFitnessPal | 14.1% |
| 5 | Lose It! | 15.3% |
| 6 | YAZIO | 16.1% |
| 7 | FatSecret | 17.8% |
| 8 | AI Food Scanner | 24.6% |
تعتبر الأطباق المعقدة هي الأصعب لكل تطبيق، ولم يحقق أي منها أداءً مثاليًا. يعتبر خطأ Nutrola البالغ 8.9 في المئة هو أضعف فئة له مقارنة بأدائه في الوجبات الأبسط. كانت طريقة الفشل الرئيسية هي تقدير الدهون المخفية بشكل أقل — زيت الزيتون في وعاء الحبوب، والزبدة المضافة إلى المعكرونة، وحليب جوز الهند الممزوج في الكاري. هذه مكونات ذات أهمية غذائية ولكنها غير مرئية بصريًا في الصورة.
من المهم التأكيد على أن Nutrola's AI لا تزال تقدر الدهون المخفية بشكل أقل في الأطباق المعقدة. إنه أفضل من البدائل، لكنه لا يحل مشكلة قد تتطلب مستشعرات عمق أو إدخال على مستوى الوصفة لحلها بالكامل. يجب على المستخدمين الذين يتتبعون الوجبات المعقدة أن يأخذوا في اعتبارهم إضافة الزيوت والصلصات عالية الدهون يدويًا عندما يعرفون أن هذه المكونات موجودة.
أغلقت Cronometer وMacroFactor الفجوة في هذه الفئة لأن نهجهما اليدوي في حساب كل مكون يجبر المستخدمين على حساب كل عنصر، بما في ذلك الدهون المخفية، إذا كانوا يعرفون أن عليهم تضمينها.
وجبات على طراز المطاعم
| الرتبة | التطبيق | متوسط خطأ السعرات الحرارية (%) |
|---|---|---|
| 1 | Nutrola | 7.2% |
| 2 | MyFitnessPal | 10.8% |
| 3 | Cronometer | 11.1% |
| 4 | MacroFactor | 11.4% |
| 5 | Lose It! | 13.9% |
| 6 | YAZIO | 14.8% |
| 7 | FatSecret | 16.2% |
| 8 | AI Food Scanner | 20.3% |
أنتجت وجبات المطاعم تحولًا مثيرًا في التصنيفات. قفز MyFitnessPal إلى المركز الثاني لأن قاعدة بياناته الضخمة تشمل عناصر قائمة محددة من آلاف المطاعم. إذا تمكن المستخدم من العثور على الطبق الدقيق من المطعم المحدد، فإن البيانات غالبًا ما تكون دقيقة جدًا. انخفضت Cronometer وMacroFactor قليلاً لأن قواعد بياناتهما تحتوي على إدخالات أقل محددة للمطاعم، مما يجبر المستخدمين على التقدير باستخدام عناصر عامة.
أدى أداء Nutrola الجيد هنا إلى أن AI يمكنها التعرف على الأطباق الشائعة في المطاعم — شريحة بيتزا بيبروني، طبق باد تاي — وربطها ببيانات مرجعية تأخذ في الاعتبار طرق التحضير النموذجية للمطاعم، والتي تميل إلى استخدام المزيد من الزيت والزبدة وقطع أكبر من الوجبات مقارنة بالطهي المنزلي.
وجبات غنية بالسعرات ومخادعة
| الرتبة | التطبيق | متوسط خطأ السعرات الحرارية (%) |
|---|---|---|
| 1 | Nutrola | 9.4% |
| 2 | Cronometer | 9.7% |
| 3 | MacroFactor | 10.3% |
| 4 | MyFitnessPal | 15.6% |
| 5 | YAZIO | 17.1% |
| 6 | Lose It! | 17.4% |
| 7 | FatSecret | 19.3% |
| 8 | AI Food Scanner | 25.1% |
كانت هذه الفئة الأكثر كشفًا. تم تصميم الوجبات الغنية بالسعرات لإظهار الفجوة بين ما يبدو عليه الطعام وما يحتويه فعليًا. يمكن أن يتجاوز وعاء السموذي المزود بالجرانولا وزبدة المكسرات والعسل بسهولة 800 سعرة حرارية بينما يبدو كوجبة إفطار صحية تحتوي على 400 سعرة حرارية. يحتوي مزيج المكسرات على كثافة سعرات حرارية شديدة في حجم بصري صغير.
عانت كل التطبيقات هنا مقارنة بأدائها في الفئات الأبسط. كانت التطبيقات الثلاثة الأولى مفصولة بأقل من نقطة مئوية واحدة. تجاوزت التطبيقات الثلاثة الأخيرة جميعها 17 في المئة من الخطأ، مما يعني في الأرقام المطلقة انحرافًا يتراوح بين 85 إلى 125 سعرة حرارية في وجبة واحدة — وهو ما يكفي لتشويه تتبع يوم كامل.
دقة المغذيات: ما وراء السعرات
تحظى السعرات بأكبر قدر من الاهتمام، لكن دقة المغذيات الأساسية مهمة لأي شخص يتتبع البروتين للحفاظ على العضلات، أو الكربوهيدرات لإدارة نسبة السكر في الدم، أو الدهون للشبع وصحة الهرمونات.
| التطبيق | خطأ البروتين (%) | خطأ الكربوهيدرات (%) | خطأ الدهون (%) |
|---|---|---|---|
| Nutrola | 7.4% | 7.1% | 9.8% |
| Cronometer | 8.9% | 8.3% | 10.4% |
| MacroFactor | 9.2% | 8.8% | 11.1% |
| MyFitnessPal | 13.1% | 11.7% | 14.6% |
| Lose It! | 14.6% | 13.2% | 15.9% |
| YAZIO | 15.2% | 14.1% | 16.4% |
| FatSecret | 16.8% | 15.3% | 18.7% |
| AI Food Scanner | 22.4% | 19.8% | 26.3% |
تظهر نمط متسق عبر جميع التطبيقات: الدهون هي أصعب المغذيات الأساسية للتقدير بدقة. هذا منطقي. غالبًا ما تكون الدهون غير مرئية — مطبوخة في الطعام، مختلطة في الصلصات، تم امتصاصها أثناء القلي. تميل مصادر البروتين والكربوهيدرات إلى أن تكون أكثر وضوحًا بصريًا (قطعة من الدجاج، ملعقة من الأرز)، بينما تختبئ الدهون في كل شيء.
خطأ Nutrola في تقدير الدهون البالغ 9.8 في المئة هو الأدنى في الاختبار لكنه لا يزال أعلى بكثير من دقة البروتين والكربوهيدرات. هذه هي أكبر منطقة حيث تحتاج AI لـ Nutrola إلى تحسين، وهي تحدٍ مشترك بين كل نظام تعرف على الطعام المعتمد على الرؤية الذي اختبرناه.
السرعة: العامل غير المقدر للدقة
قد تبدو سرعة التسجيل غير مرتبطة بالدقة، لكن الأبحاث تظهر باستمرار أن اتساق التسجيل هو أقوى مؤشر على النتائج الغذائية الناجحة. التطبيق الذي يكون دقيقًا ولكنه بطيء يخلق احتكاكًا يؤدي إلى تخطي الوجبات، وإدخالات تقديرية، وفي النهاية التخلي عن التسجيل تمامًا.
| التطبيق | متوسط وقت التسجيل (ثواني) | الطريقة |
|---|---|---|
| AI Food Scanner | 5 | صورة فقط |
| Nutrola | 8 | صورة + تعبئة تلقائية |
| MyFitnessPal | 35 | بحث + اختيار |
| Lose It! | 38 | بحث + اختيار |
| YAZIO | 40 | بحث + اختيار |
| MacroFactor | 42 | بحث + اختيار |
| FatSecret | 44 | بحث + اختيار |
| Cronometer | 47 | بحث + اختيار |
يعتبر AI Food Scanner الأسرع بمتوسط 5 ثوانٍ، لكن كما تظهر بيانات الدقة، فإن السرعة دون دقة تكون غير مثمرة. تقدم Nutrola بمتوسط 8 ثوانٍ ما نعتقد أنه أفضل توازن: سريع بما يكفي لتسجيل كل وجبة دون تعطيل روتينك، ودقيق بما يكفي لإنتاج بيانات يمكنك الوثوق بها.
تتجمع التطبيقات المعتمدة على البحث بين 35 و47 ثانية لكل وجبة. قد لا يبدو هذا كثيرًا، لكن تسجيل ثلاث وجبات ووجبتين خفيفتين يوميًا بمتوسط 40 ثانية لكل منها يضيف ما يزيد عن ثلاث دقائق من وقت التسجيل النشط يوميًا — أكثر من 20 دقيقة في الأسبوع تُقضى في البحث، والتمرير، وضبط الحصص. على مدار أشهر، يتراكم هذا الاحتكاك ليصبح السبب الرئيسي وراء تخلي الناس عن التسجيل.
أين تعاني Nutrola: تقييم صادق
قمنا بإجراء هذا الاختبار، وNutrola هو منتجنا. لذا من المهم أن نكون صادقين بشأن الأماكن التي لم تؤد فيها Nutrola كما نود.
تظل الدهون المخفية هي الضعف الرئيسي. عندما تحتوي وجبة على سعرات حرارية كبيرة من الزيوت أو الزبدة أو الدهون الأخرى التي لا تكون مرئية على سطح الطبق، فإن AI لـ Nutrola تقدرها بشكل منهجي أقل. أثر ذلك بشكل أكبر على الأطباق المعقدة والوجبات الغنية بالسعرات. يعتبر متوسط خطأ تقدير الدهون البالغ 9.8 في المئة هو أكبر فجوة بين Nutrola والكمال. نحن نعمل بنشاط على نماذج تتضمن استنتاج طريقة الطهي السياقية (على سبيل المثال، التعرف على أن القلي السريع من المحتمل أن يحتوي على زيت طهي حتى عندما لا يكون الزيت مرئيًا)، لكن هذه تظل مشكلة غير محلولة.
تربك الحصص الصغيرة جدًا AI. في ثلاث من الوجبات الخمسين، كانت الحصة صغيرة بما يكفي أن AI قدرتها بأكثر من 15 في المئة. تم تقدير بيضة مسلوقة واحدة على أنها 1.3 بيضة. تم تقدير حفنة صغيرة من اللوز بأكثر من 30 في المئة من الوزن الفعلي. تستخدم AI الطبق والسياق المحيط به كمرجع، وعندما يكون هناك كمية صغيرة من الطعام على طبق بحجم قياسي، يمكن أن تضلل إشارات المرجع النموذج.
الأطباق من المأكولات غير الممثلة بدقة أقل. بينما ركز اختبارنا على الوجبات الشائعة، لاحظنا في اختبارات أوسع أن الأطباق من المأكولات التي تحتوي على أمثلة تدريب أقل — بعض الأطباق الأفريقية، وآسيا الوسطى، وجزر المحيط الهادئ — تنتج معدلات خطأ أعلى. نحن نعمل على توسيع بيانات التدريب لدينا باستمرار، لكن لا تزال هناك فجوات في التغطية.
لا يمكن للذكاء الاصطناعي قراءة أفكارك حول التعديلات. إذا طلبت سلطة مع الصلصة على الجانب لكنك سكبتها كلها، أو إذا كانت "دجاج مشوي" الخاص بك مطبوخة في كمية كبيرة من الزبدة، فإن AI تقدّر بناءً على ما تراه وما هو شائع. لا يمكنها حساب التحضير غير القياسي ما لم تخبرها بذلك.
قيود هذا الاختبار
لكل اختبار قيود، والشفافية بشأن تلك القيود أكثر أهمية من التظاهر بعدم وجودها.
حجم العينة. خمسون وجبة كافية لتحديد أنماط ذات دلالة ومعقولة لتصنيف التطبيقات، لكنها ليست دراسة سريرية على نطاق واسع. قد تختلف النتائج الفردية، وقد تنتج أنواع الوجبات أو المأكولات التي لم يتم تمثيلها في عيّنتنا تصنيفات مختلفة.
ظروف الصورة الواحدة. استخدمنا صورة موحدة لكل وجبة. يتضمن الاستخدام في العالم الحقيقي إضاءة وزوايا ومسافات وكاميرات هواتف متغيرة. قد يكون أداء التطبيق في ظروفنا المحكومة أفضل أو أسوأ قليلاً مما يختبره المستخدم في مطعم ذو إضاءة خافتة أو على سطح مطبخ مزدحم.
مهارة المستخدم مع التطبيقات اليدوية. بالنسبة للتطبيقات المعتمدة على البحث مثل Cronometer وMacroFactor، تعتمد الدقة جزئيًا على قدرة المستخدم على العثور على الإدخال الغذائي الصحيح وتقدير الحصة الصحيحة. كان مختبرنا ذو خبرة في تتبع التغذية. قد يرى المستخدم الأقل خبرة معدلات خطأ أعلى مع التطبيقات اليدوية واختلافات أقل نسبية بين الأساليب اليدوية والاعتماد على الذكاء الاصطناعي.
نحن نصنع Nutrola. لقد صممنا وموّلنا هذا الاختبار، وNutrola هو منتجنا. لقد بذلنا كل ما في وسعنا لضمان العدالة المنهجية — باستخدام نفس الصور، نفس الحقيقة الأساسية، نفس معايير التقييم — لكننا ندرك أن القراء يجب أن يأخذوا في الاعتبار هذا السياق. نشجع الفرق الأخرى على تكرار هذا الاختبار بشكل مستقل. سنكون سعداء بمشاركة قائمة الوجبات والصور وبيانات الحقيقة الأساسية مع أي مجموعة بحثية ترغب في التحقق من نتائجنا أو تحديها.
تتغير إصدارات التطبيقات. اختبرنا إصدارات تطبيقات معينة في مارس 2026. تطلق التطبيقات تحديثات بانتظام، وقد تتحسن الدقة أو تزداد سوءًا مع الإصدارات الجديدة. تعكس هذه النتائج لقطة زمنية، وليست تصنيفًا دائمًا.
لا يقيس هذا الاختبار كل ما يهم. الدقة أمر حاسم، لكنها ليست العامل الوحيد في اختيار تطبيق تتبع السعرات الحرارية. واجهة المستخدم، والأسعار، وميزات المجتمع، والتكامل مع الأجهزة القابلة للارتداء، وأدوات تخطيط الوجبات، ودعم العملاء كلها مهمة. قد ينتج عن تطبيق أقل دقة ولكنه يتناسب بشكل أفضل مع روتينك اليومي نتائج أفضل في العالم الحقيقي من تطبيق أكثر دقة تتوقف عن استخدامه بعد أسبوعين.
ما تعلمناه
تظهر ثلاث نقاط بارزة من هذا الاختبار.
أولاً، جودة قاعدة البيانات أهم من حجم قاعدة البيانات. لم تنتج التطبيقات ذات أكبر قواعد بيانات الطعام (MyFitnessPal، Lose It!، FatSecret) النتائج الأكثر دقة. تحتوي قواعد البيانات المستندة إلى المجتمع على الكثير من الإدخالات المكررة وغير الصحيحة والقديمة. تفوقت قواعد البيانات الأصغر الموثوقة مثل تلك المستخدمة من قبل Cronometer وMacroFactor باستمرار على البدائل الضخمة ولكن المزعجة.
ثانيًا، لقد تجاوز تسجيل الصور المدعوم بالذكاء الاصطناعي عتبة الدقة للاستخدام العملي. عندما يقدر AI لـ Nutrola وجبة بمتوسط خطأ يبلغ 6.8 في المئة، فإن ذلك يقع ضمن النطاق الذي يعتبره الباحثون في التغذية مقبولًا لتتبع النظام الغذائي الفعال. أظهرت الدراسات المنشورة أن حتى أخصائيي التغذية المدربين الذين يقدرون الحصص بالعين يحققون متوسط خطأ يتراوح بين 10 إلى 15 في المئة. أصبح نظام الذكاء الاصطناعي المصمم جيدًا الآن تنافسيًا مع التقدير البشري الخبير — ويستغرق ثماني ثوانٍ بدلاً من خمس دقائق.
ثالثًا، لا يوجد تطبيق مثالي، والصدق بشأن ذلك مهم. أنتج كل تطبيق في هذا الاختبار أخطاء. السؤال ليس ما إذا كان متتبع السعرات الحرارية لديك دقيقًا تمامًا — بل ما إذا كان دقيقًا بما يكفي لدعم أهدافك، وما إذا كان سهل الاستخدام بما يكفي للاستخدام المستمر. لا يزال الخطأ بنسبة 7 في المئة المطبق باستمرار عبر كل وجبة يعطيك صورة موثوقة عن أنماط تناولك، والاتجاهات، والتقدم. لا تفعل الخطأ بنسبة 20 في المئة.
الأسئلة الشائعة
كيف ضمنت دقة قيم الحقيقة الأساسية؟
تم وزن كل مكون بشكل فردي على ميزان غذائي رقمي معاير وتم التحقق منه مقابل قاعدة بيانات USDA FoodData Central. قام عضوان من الفريق بحساب القيم الغذائية لكل وجبة بشكل مستقل. تم إعادة التحقق من أي اختلاف أكبر من 2 في المئة. تعكس هذه العملية المنهجية المستخدمة في دراسات التحقق من تقييم النظام الغذائي المنشورة.
لماذا اختبرت 50 وجبة فقط بدلاً من المئات؟
تعتبر خمسون وجبة عبر خمس فئات كافية لتحديد اختلافات ذات دلالة إحصائية بين التطبيقات مع الحفاظ على الاختبار قابل للإدارة وإعادة الإنتاج. ستزيد الاختبارات الأكبر من الثقة في التصنيفات ولكن من غير المرجح أن تغير الترتيب بشكل كبير. اخترنا تنوع أنواع الوجبات على حساب الحجم الصرف.
هل هذا الاختبار متحيز لأن Nutrola قامت بإجرائه؟
قمنا بتصميم المنهجية لتقليل التحيز: نفس الصور لجميع التطبيقات، نفس الحقيقة الأساسية، نفس معايير التقييم، تصنيف معمي حيثما كان ذلك ممكنًا. ومع ذلك، نعترف بالصراع الداخلي المتمثل في المصلحة ونشجع على التكرار المستقل. نحن مستعدون لمشاركة مجموعة البيانات الكاملة لدينا، بما في ذلك الصور والحسابات المرجعية، مع أي مجموعة بحثية أو منشور يطلب ذلك.
لماذا احتلت بعض التطبيقات التي لا تحتوي على ميزات الصور المدعومة بالذكاء الاصطناعي مرتبة أعلى من التطبيقات التي تحتوي على ذلك؟
لأن الدقة تعتمد على النظام بالكامل، وليس فقط على طريقة الإدخال. لا تحتوي Cronometer وMacroFactor على تسجيل الصور المدعوم بالذكاء الاصطناعي، لكن قواعد بياناتهما الموثوقة تعني أنه عندما يجد المستخدم الإدخال الصحيح، تكون البيانات الغذائية موثوقة للغاية. العيب هو السرعة والراحة — هذه التطبيقات دقيقة ولكنها بطيئة.
هل يمكن أن يحل تتبع السعرات الحرارية المدعوم بالذكاء الاصطناعي محل وزن الطعام؟
ليس تمامًا، وهذا ليس الهدف. يظل وزن الطعام وحساب البيانات من USDA هو المعيار الذهبي للدقة. تم تصميم تتبع السعرات الحرارية المدعوم بالذكاء الاصطناعي لتوفير بديل عملي وسريع يكون دقيقًا بما يكفي لأغلب أهداف الصحة واللياقة البدنية. بالنسبة للأشخاص الذين يحتاجون إلى دقة على مستوى سريري — مثل أولئك الذين يديرون حالات طبية معينة — يظل وزن المكونات هو أفضل نهج.
أي تطبيق يجب أن أستخدمه؟
يعتمد ذلك على ما تفضله أكثر. إذا كنت ترغب في أفضل مزيج من الدقة والسرعة، فقد احتلت Nutrola المرتبة الأولى في هذا الاختبار. إذا كنت تفضل التحكم اليدوي وتفاصيل المغذيات الدقيقة، فإن Cronometer ممتاز. إذا كنت بحاجة إلى أكبر قاعدة بيانات للمطاعم، فإن MyFitnessPal يحتوي على أكبر عدد من الإدخالات. إذا كنت ترغب في الحصول على تدريب تكيفي قائم على الأدلة، فإن MacroFactor يقدم قيمة فريدة على الرغم من سرعته البطيئة في التسجيل.
كم مرة تتغير هذه التصنيفات؟
يمكن أن تتغير دقة التطبيقات مع كل تحديث. تتحسن نماذج الذكاء الاصطناعي مع المزيد من بيانات التدريب، وتتم تصحيح قواعد البيانات، وتطلق ميزات جديدة. نخطط لإعادة إجراء هذا الاختبار ربع سنوي ونشر نتائج محدثة. تمثل نتائج مارس 2026 التي تقرأها الآن الحالة الحالية لكل تطبيق في وقت الاختبار.
ماذا عن التطبيقات التي لم يتم تضمينها في هذا الاختبار؟
ركزنا على ثمانية من أكثر تطبيقات تتبع السعرات الحرارية استخدامًا في عام 2026. لم يتم تضمين تطبيقات مثل Carb Manager وCal AI وSnapCalorie وMyNetDiary في هذا الاختبار المحدد ولكن تم تغطيتها في مقالات المقارنة الأخرى لدينا. إذا كان هناك تطبيق معين ترغب في اختباره، فأخبرنا.
هل تؤثر زاوية الصورة أو الإضاءة على دقة الذكاء الاصطناعي؟
نعم. في اختبارنا الموحد، قمنا بالتحكم في هذه المتغيرات، لكن في الاستخدام الواقعي، يمكن أن تقلل الإضاءة السيئة والزوايا الشديدة والخلفيات المزدحمة من دقة الذكاء الاصطناعي. للحصول على أفضل النتائج مع أي تطبيق قائم على الصور، قم بتصوير طعامك من زاوية معتدلة (حوالي 45 درجة) في إضاءة جيدة مع وضوح الطعام في الصورة ومركزيته في الإطار.
هل 6.8 في المئة من الخطأ كافية لفقدان الوزن؟
نعم. يعني متوسط خطأ 6.8 في المئة في وجبة تحتوي على 500 سعرة حرارية حوالي 34 سعرة حرارية من الانحراف. عبر يوم كامل من الأكل عند 2000 سعرة حرارية، حتى لو لم تتعادل الأخطاء (بعض التقديرات أعلى، وبعضها أقل)، فإن الانحراف الإجمالي يقع ضمن الهامش الذي يدعم إدارة الوزن الفعالة. تشير الأبحاث المنشورة إلى أن اتساق التسجيل أهم من دقة التسجيل — وكلما كان التطبيق أسهل في الاستخدام، زادت احتمالية استخدامه بشكل متسق.
الخاتمة
الفجوة في الدقة بين تطبيقات تتبع السعرات الحرارية حقيقية وقابلة للقياس. في اختبارنا المكون من 50 وجبة، كان الفرق بين أكثر التطبيقات دقة وأقلها دقة هو 12.4 نقطة مئوية — الفرق بين صورة غذائية مفيدة ومعلومات مضللة منهجية حول ما تأكله.
احتلت Nutrola المرتبة الأولى بمتوسط خطأ في السعرات الحرارية يبلغ 6.8 في المئة ومتوسط وقت تسجيل يبلغ 8 ثوانٍ. إنها ليست مثالية — فهي تقدر الدهون المخفية بشكل أقل، وأحيانًا تسيء تقدير الحصص الصغيرة، ولديها مجال للتحسين في المأكولات غير الممثلة بدقة. لكنها الخيار الأكثر دقة الذي اختبرناه، وتحقق هذه الدقة في جزء من الوقت المطلوب من البدائل المعتمدة على الإدخال اليدوي.
في النهاية، أفضل تطبيق لتتبع السعرات الحرارية هو التطبيق الذي ستستخدمه يوميًا. لكن إذا كانت الدقة تهمك — وإذا كنت تقرأ اختبار دقة مكون من 3500 كلمة، فمن المحتمل أنها تهمك — يجب أن تساعدك البيانات في هذا الاختبار على اتخاذ هذا القرار بثقة.
مستعد لتحويل تتبع تغذيتك؟
انضم إلى الآلاف الذين حولوا رحلتهم الصحية مع Nutrola!