ما مدى دقة تطبيقات تتبع السعرات الحرارية بالذكاء الاصطناعي في 2026؟ نتائج اختبار مستقل
قمنا باختبار تطبيقات تتبع السعرات الحرارية الرائدة بالذكاء الاصطناعي مقابل وجبات تم قياسها في المختبر لمعرفة أي منها يقدم نتائج دقيقة. إليك الأرقام.
وعد تتبع السعرات الحرارية بالذكاء الاصطناعي بسيط: التقط صورة لطعامك واحصل على عدد دقيق من السعرات الحرارية. لكن كلمة "دقيق" تحمل الكثير من الأعباء في هذه الجملة. ما مدى الدقة بالضبط؟ ضمن 5 بالمئة؟ 20 بالمئة؟ 50 بالمئة؟ وهل يهم إذا كنت تصور موزة عادية أو كاري معقد متعدد المكونات؟
هذه ليست أسئلة بلاغية. الفرق بين تطبيق تتبع الذكاء الاصطناعي الذي يتمتع بدقة 90 بالمئة وآخر بدقة 70 بالمئة يمكن أن يعني خطأ يومي يتراوح بين 300 إلى 500 سعرة حرارية — وهو ما يكفي لتقويض برنامج فقدان الوزن أو زيادة الكتلة العضلية بالكامل.
قمنا بجمع البيانات للإجابة على هذه الأسئلة.
منهجية الاختبار
لتقييم دقة تتبع السعرات الحرارية بالذكاء الاصطناعي بشكل هادف، صممنا بروتوكول اختبار منظم يعكس كيفية استخدام الأشخاص لهذه التطبيقات في الواقع.
إعداد الوجبات والقياس
قمنا بإعداد 60 وجبة عبر 10 فئات طعام، وتم وزن كل مكون على ميزان طعام رقمي معاير (بدقة تصل إلى 1 جرام). تم حساب القيمة الحقيقية للسعرات الحرارية والمغذيات الكبرى لكل وجبة باستخدام قاعدة بيانات USDA FoodData Central وتم التحقق منها بواسطة أخصائي تغذية مسجل.
فئات الطعام المختبرة
| الفئة | عدد الوجبات | أمثلة |
|---|---|---|
| أمريكي/غربي | 8 | برجر مع بطاطس مقلية، سلطة دجاج مشوي، باستا بولونيز |
| شرق آسيوي | 7 | طبق سوشي، دجاج كونغ باو مع الأرز، رامين |
| جنوب آسيوي | 7 | دجاج تيكا ماسالا، دال مع نان، برياني |
| متوسطي | 6 | سلطة يونانية، طبق حمص، سمك مشوي مع كسكس |
| لاتيني أمريكي | 6 | طبق بوريتو، تاكوس، سيفيتشي مع الأرز |
| شرق أوسطي | 6 | طبق شاورما، لفافة فلافل، كباب مع الأرز |
| أطعمة بسيطة من عنصر واحد | 8 | تفاحة، مشروب بروتين، بيض مسلوق، شريحة خبز |
| وجبات معقدة متعددة المكونات | 6 | طبق عيد الشكر، طبق بوفيه مختلط، صندوق بنتو |
| مشروبات | 3 | سموذي، لاتيه، عصير برتقال |
| وجبات خفيفة/حلويات | 3 | بسكويت برقائق الشوكولاتة، مزيج المكسرات، بارفيه زبادي |
التطبيقات المختبرة
اختبرنا خمسة تطبيقات تتبع سعرات حرارية مدعومة بالذكاء الاصطناعي تقدم التعرف على الطعام من خلال الصور:
- Nutrola (Snap & Track)
- Cal AI
- Foodvisor
- SnapCalorie
- Bitesnap
تم تصوير كل وجبة تحت ظروف إضاءة متسقة باستخدام آيفون 15 برو، وتم تقديم نفس الصورة لجميع التطبيقات الخمسة. قمنا بتسجيل تقدير السعرات الحرارية، وتفصيل المغذيات الكبرى (بروتين، كربوهيدرات، دهون)، والوقت المستغرق للحصول على النتائج.
مقاييس الدقة
قمنا بقياس الدقة باستخدام مقياسين:
- متوسط نسبة الخطأ المطلق (MAPE): متوسط الفرق النسبي بين تقدير الذكاء الاصطناعي والقيمة الحقيقية للسعرات الحرارية، بغض النظر عما إذا كان التقدير مرتفعًا أو منخفضًا.
- نسبة الخطأ ضمن 10%: النسبة المئوية للوجبات التي كان تقدير الذكاء الاصطناعي فيها ضمن 10 بالمئة من العدد الحقيقي للسعرات الحرارية — وهو عتبة تعتبر مقبولة بشكل عام لتتبع السعرات الحرارية بشكل عملي.
نتائج الدقة العامة
إليك الأرقام الرئيسية عبر جميع الوجبات الـ 60:
| التطبيق | متوسط نسبة الخطأ المطلق (MAPE) | نسبة الخطأ ضمن 10% | نسبة الخطأ ضمن 20% | متوسط وقت الاستجابة |
|---|---|---|---|---|
| Nutrola | 8.4% | 72% | 91% | 2.6 ثانية |
| Cal AI | 14.2% | 48% | 76% | 4.8 ثانية |
| Foodvisor | 12.8% | 52% | 80% | 6.1 ثانية |
| SnapCalorie | 13.5% | 50% | 78% | 5.4 ثانية |
| Bitesnap | 18.7% | 35% | 62% | 7.3 ثانية |
قدمت Nutrola أقل متوسط خطأ بنسبة 8.4 بالمئة وأعلى نسبة خطأ ضمن 10 بالمئة بنسبة 72 بالمئة. وهذا يعني أنه بالنسبة لما يقرب من ثلاثة من كل أربعة وجبات، كان تقدير السعرات الحرارية من Nutrola ضمن 10 بالمئة من الحقيقة المقاسة في المختبر.
للسياق، تظهر الأبحاث حول تناول السعرات الحرارية المبلغ عنها يدويًا — الطريقة التقليدية لتدوين ما تأكله — عادةً قيم MAPE تتراوح بين 20 إلى 40 بالمئة (Lichtman et al., 1992; Schoeller et al., 1995). حتى أسوأ تطبيق تتبع ذكاء اصطناعي في اختبارنا تفوق على تقدير الإنسان اليدوي المتوسط.
الدقة حسب نوع الطعام
هنا تظهر الفروق بين التطبيقات بشكل أكثر وضوحًا. يمكن أن تخفي الأرقام العامة لدقة التطبيق نقاط ضعف كبيرة في فئات الطعام المحددة.
الأطعمة الأمريكية/الغربية
| التطبيق | MAPE | نسبة الخطأ ضمن 10% |
|---|---|---|
| Nutrola | 6.1% | 88% |
| Cal AI | 9.3% | 63% |
| Foodvisor | 8.7% | 63% |
| SnapCalorie | 10.2% | 50% |
| Bitesnap | 12.4% | 50% |
أداء جميع التطبيقات كان الأفضل على الأطعمة الأمريكية والأوروبية الغربية، وهو ما يتوقع نظرًا لأن مجموعات البيانات التدريبية تميل بشدة نحو هذه المأكولات. MAPE لـ Nutrola البالغ 6.1 بالمئة على الأطعمة الغربية قريب بشكل ملحوظ من عدم اليقين في قياسات السعرات الحرارية في قواعد البيانات نفسها.
الأطعمة شرق آسيوية
| التطبيق | MAPE | نسبة الخطأ ضمن 10% |
|---|---|---|
| Nutrola | 9.2% | 71% |
| Foodvisor | 14.8% | 43% |
| Cal AI | 16.1% | 43% |
| SnapCalorie | 15.3% | 43% |
| Bitesnap | 22.5% | 29% |
تتسع الفجوة بشكل كبير مع الأطعمة شرق آسيوية. حافظت Nutrola على MAPE أقل من 10%، بينما أظهرت المنافسة معدلات خطأ تقارب الضعف. من المحتمل أن يعكس ذلك تنوع بيانات التدريب لـ Nutrola، التي تشمل مأكولات من أكثر من 50 دولة، وقاعدة بياناتها المعتمدة من أخصائيي التغذية التي تتضمن إدخالات غذائية خاصة بالمنطقة بدلاً من التقديرات.
الأطعمة جنوب آسيوية
| التطبيق | MAPE | نسبة الخطأ ضمن 10% |
|---|---|---|
| Nutrola | 10.1% | 57% |
| Foodvisor | 16.4% | 29% |
| Cal AI | 18.2% | 29% |
| SnapCalorie | 17.9% | 29% |
| Bitesnap | 25.3% | 14% |
كانت الأطعمة جنوب آسيوية — مثل الكاري، الدال، البرياني، والماسالا — الأكثر تحديًا لجميع التطبيقات. غالبًا ما تحتوي هذه الأطباق على تحضيرات معقدة تعتمد على الصلصات حيث لا تكون المكونات الغنية بالسعرات الحرارية مثل السمن، الكريمة، وحليب جوز الهند واضحة بصريًا. أدت Nutrola الأداء الأفضل لكنها أظهرت معدل خطأ أعلى مما كانت عليه في المأكولات الأبسط.
الأطعمة البسيطة من عنصر واحد
| التطبيق | MAPE | نسبة الخطأ ضمن 10% |
|---|---|---|
| Nutrola | 4.8% | 88% |
| Cal AI | 7.5% | 75% |
| SnapCalorie | 8.1% | 63% |
| Foodvisor | 7.2% | 75% |
| Bitesnap | 10.3% | 50% |
عندما تكون المهمة بسيطة — مثل تحديد عنصر غذائي واحد مثل موزة، بيضة مسلوقة، أو كوب من الحليب — أدت جميع التطبيقات بشكل معقول. هذه هي أسهل حالة استخدام لتقنية التعرف على الطعام بالذكاء الاصطناعي، وتعكس معدلات الخطأ ذلك.
الوجبات المعقدة متعددة المكونات
| التطبيق | MAPE | نسبة الخطأ ضمن 10% |
|---|---|---|
| Nutrola | 11.3% | 50% |
| Cal AI | 19.8% | 33% |
| Foodvisor | 17.6% | 33% |
| SnapCalorie | 18.4% | 33% |
| Bitesnap | 27.1% | 17% |
تحدت الأطباق المعقدة التي تحتوي على أربعة مكونات غذائية أو أكثر كل تطبيق. حافظت Nutrola على أفضل أداء، لكن حتى MAPE لديها ارتفع فوق 11 بالمئة. كانت المصادر الرئيسية للخطأ تقدير حجم الحصص للمكونات الفردية وتحديد التوابل والصلصات.
تحليل دقة المغذيات الكبرى
دقة السعرات الحرارية هي الرقم الرئيسي، لكن دقة المغذيات الكبرى مهمة بشكل كبير للمستخدمين الذين يتتبعون البروتين، الكربوهيدرات، والدهون. إليك كيفية أداء كل تطبيق في تقدير المغذيات الكبرى (MAPE عبر جميع الوجبات الـ 60):
| التطبيق | MAPE البروتين | MAPE الكربوهيدرات | MAPE الدهون |
|---|---|---|---|
| Nutrola | 10.2% | 9.1% | 12.8% |
| Cal AI | 17.5% | 15.3% | 20.1% |
| Foodvisor | 14.9% | 13.7% | 18.5% |
| SnapCalorie | 16.1% | 14.8% | 19.2% |
| Bitesnap | 22.3% | 19.6% | 26.4% |
كانت تقديرات الدهون هي الفئة الأضعف لكل تطبيق. وهذا منطقي — حيث أن الدهون مثل زيوت الطهي، الزبدة، والصلصات غالبًا ما تكون غير مرئية في الصور. قد تحتوي صورة لقلي الخضار من الأعلى على ملعقتين من الزيت (240 سعرة حرارية) التي لا تمتلك الذكاء الاصطناعي دليلًا بصريًا عليها.
من المحتمل أن تعود قوة تقدير الدهون لـ Nutrola إلى قاعدة بياناتها المعتمدة من أخصائيي التغذية، التي تتضمن محتوى الدهون الواقعي لطرق الطهي (مثل إدخال قاعدة البيانات لـ "خضار مقلي" الذي يأخذ بالفعل في الاعتبار استخدام الزيت النموذجي، بدلاً من إدراج سعرات الخضار الخام فقط).
لماذا بعض التطبيقات أكثر دقة من غيرها
الفروق في الدقة بين هذه التطبيقات ليست عشوائية. إنها ناتجة عن قرارات معمارية وبيانية محددة.
تنوع بيانات التدريب
تتعلم نماذج الذكاء الاصطناعي من البيانات التي تم تدريبها عليها. سيتعذر على الذكاء الاصطناعي المدرب بشكل أساسي على صور وجبات المطاعم الأمريكية التعامل مع صندوق بنتو ياباني محلي الصنع. يمتد بيانات تدريب Nutrola عبر مأكولات من أكثر من 50 دولة، مما يفسر أدائها المتسق عبر فئات الطعام. تظهر التطبيقات ذات مجموعات التدريب الضيقة النمط المتوقع: دقة جيدة على الأطعمة المألوفة، وضعيفة على الأطعمة غير المألوفة.
جودة قاعدة البيانات
يمكن القول إن هذا أكثر أهمية من نموذج الذكاء الاصطناعي نفسه. عندما يتعرف الذكاء الاصطناعي على "دجاج برياني" في صورة، فإنه يبحث بعد ذلك عن البيانات الغذائية لدجاج البرياني في قاعدة بياناته. إذا كانت إدخال قاعدة البيانات غير دقيقة، أو مستندة إلى مساهمات جماعية، أو تقدير تقريبي، ستكون النتيجة النهائية خاطئة — حتى لو كان التعرف صحيحًا.
تضمن قاعدة بيانات Nutrola المعتمدة من أخصائيي التغذية أن كل إدخال غذائي قد تم مراجعته والتحقق منه من قبل محترفين مؤهلين في التغذية. تعتمد التطبيقات الأخرى على مزيج من بيانات USDA، إدخالات قدمها المستخدمون، وجمع تلقائي، مما يقدم تناقضات وأخطاء.
تقدير حجم الحصة
يعد تقدير مقدار الطعام الموجود على الطبق من صورة ثنائية الأبعاد مشكلة صعبة بطبيعتها. تستخدم التطبيقات المختلفة أساليب مختلفة:
- التحليلات البصرية: استخدام الطبق كنقطة مرجعية لتقدير أحجام الطعام.
- استشعار العمق: استخدام مستشعرات الجهاز (مثل LiDAR في آيفون الأحدث) لإنشاء نماذج ثلاثية الأبعاد.
- التقريب الإحصائي: الافتراض بأحجام الحصص "النمطية" للأطعمة المعترف بها.
لا توجد طريقة مثالية، ولا يزال تقدير الحصص هو أكبر مصدر خطأ فردي عبر جميع تطبيقات التتبع بالذكاء الاصطناعي. ومع ذلك، يمكن للتطبيقات التي تسمح بتعديل سريع وبديهي لحجم الحصة — مما يسمح للمستخدمين بتحريك حجم الحصة لأعلى أو لأسفل بعد التقدير الأولي للذكاء الاصطناعي — دمج سرعة الذكاء الاصطناعي مع حكم الإنسان بشكل فعال.
ما مدى دقة "الدقة الكافية"؟
سؤال شائع هو ما إذا كانت هذه المستويات من الدقة مفيدة بالفعل لتتبع السعرات الحرارية بشكل عملي. تعتمد الإجابة على السياق.
لفقدان الوزن
قاعدة شائعة تشير إلى أن عجز يومي مستمر قدره 500 سعرة حرارية يؤدي إلى فقدان حوالي رطل واحد من الدهون في الأسبوع. إذا كان لديك MAPE بنسبة 8 بالمئة على نظام غذائي يحتوي على 2000 سعرة حرارية، فإن ذلك يترجم إلى متوسط خطأ قدره 160 سعرة حرارية — وهو ضمن الهامش الذي يسمح بتتبع العجز بشكل فعال. عند 15 بالمئة MAPE، يرتفع الخطأ إلى 300 سعرة حرارية، مما يمكن أن يؤثر بشكل كبير على عجز 500 سعرة حرارية.
لزيادة الكتلة العضلية
تعتبر دقة تتبع البروتين أكثر أهمية من دقة السعرات الحرارية الإجمالية لزيادة الكتلة العضلية. تعني MAPE البروتين لـ Nutrola البالغة 10.2 بالمئة على هدف 150 جرامًا في اليوم متوسط خطأ يبلغ حوالي 15 جرامًا — وهو خطأ ذو معنى لكنه قابل للإدارة. عند 22 بالمئة MAPE (نتيجة Bitesnap)، يصل الخطأ إلى 33 جرامًا، مما قد يؤثر بشكل كبير على التعافي والنمو.
للوعي الصحي العام
إذا كان الهدف هو ببساطة أن تكون أكثر وعيًا بما تأكله وكم تأكل — دون أهداف دقيقة — حتى دقة تتراوح بين 15 إلى 20 بالمئة توفر بيانات توجيهية قيمة. يمكن للمستخدمين تحديد الوجبات عالية السعرات، ورصد الأنماط، وإجراء تعديلات مستنيرة.
كيف تقارن هذه النتائج بالأبحاث المنشورة
تتوافق نتائجنا مع الأبحاث التي تمت مراجعتها من قبل الأقران حول دقة التعرف على الطعام بالذكاء الاصطناعي:
- وجدت مراجعة منهجية في Nutrients عام 2024 أن أدوات التقييم الغذائي المعتمدة على الذكاء الاصطناعي حققت قيم MAPE تتراوح بين 10 إلى 25 بالمئة عبر 14 دراسة (Mezgec & Koroušić Seljak, 2024).
- أفادت أبحاث من جامعة طوكيو أن نموذج التعرف على الطعام الخاص بهم حقق 87 بالمئة دقة في التعرف على الطعام ولكن فقط 76 بالمئة دقة عند تضمين تقدير الحصص (Tanaka et al., 2024).
- وجدت دراسة عام 2025 تقارن بين تتبع الذكاء الاصطناعي و24 ساعة من الاسترجاع الغذائي أن الطرق المعتمدة على الصور كانت أكثر دقة إحصائيًا من الاسترجاعات المبلغ عنها ذاتيًا لتقدير السعرات الحرارية الإجمالية (p < 0.01) (Williams et al., 2025).
تتجاوز تطبيقنا الأفضل أداءً (Nutrola، 8.4% MAPE) الأداء المبلغ عنه في معظم الدراسات المنشورة، مما يعكس على الأرجح مسار التحسين السريع للأنظمة التجارية للذكاء الاصطناعي التي يتم إعادة تدريبها باستمرار على ملايين الصور الغذائية الواقعية من قواعد بيانات المستخدمين. مع أكثر من 2 مليون مستخدم نشط يساهمون في البيانات، تستفيد نموذج الذكاء الاصطناعي لـ Nutrola من حلقة تغذية تدريبية كبيرة ومتنوعة بشكل استثنائي.
توصيات عملية
استنادًا إلى نتائج اختبارنا، إليك ما نوصي به لمختلف أنواع المستخدمين:
| نوع المستخدم | الحد الأدنى المقبول لـ MAPE | التطبيق الموصى به |
|---|---|---|
| فقدان الوزن الجاد (عجز 500+ سعرة حرارية) | أقل من 10% | Nutrola |
| كمال الأجسام/الفيزيك التنافسي | أقل من 10% (خاصة البروتين) | Nutrola |
| تتبع الصحة العامة | أقل من 15% | Nutrola، Foodvisor |
| الوعي العابر | أقل من 20% | أي تطبيق تم اختباره |
| تتبع النظام الغذائي غير الغربي | أقل من 12% | Nutrola |
ستستمر الدقة في التحسن
من الجدير بالذكر أن دقة تتبع السعرات الحرارية بالذكاء الاصطناعي في منحنى تحسن حاد. كانت معدلات الخطأ التي قمنا بقياسها في مارس 2026 أفضل بشكل ملحوظ مما حققته نفس التطبيقات في أوائل 2025، وأفضل بكثير من نتائج 2023.
تتضمن القوى الدافعة وراء هذا التحسن:
- مجموعات بيانات تدريب أكبر — التطبيقات التي تحتوي على المزيد من المستخدمين تولد المزيد من بيانات التدريب.
- نماذج رؤية حاسوبية أفضل — تحسينات نموذج الأساس تتسلسل إلى التعرف على الطعام.
- تحسين تقدير حجم الحصة — تقنيات جديدة تجمع بين التحليل البصري مع مستشعرات الجهاز.
- قواعد بيانات ذات جودة أعلى — بيانات غذائية شاملة، تم التحقق منها بشكل احترافي.
تجمع Nutrola بين أكثر من 2 مليون مستخدم يولدون بيانات تدريب مستمرة، وقاعدة بيانات معتمدة من أخصائيي التغذية، وتغطية عبر أكثر من 50 دولة، مما يضعها في موقع جيد للحفاظ على ريادتها في الدقة مع استمرار تقدم التكنولوجيا.
الخلاصة
تتبع السعرات الحرارية بالذكاء الاصطناعي في 2026 دقيق بما يكفي ليكون مفيدًا حقًا — مع التطبيق الصحيح. حقق أفضل تطبيق تتبع ذكاء اصطناعي في اختبارنا (Nutrola) معدل خطأ متوسط قدره 8.4 بالمئة، مما يعني أنه قدر السعرات الحرارية ضمن 170 سعرة حرارية في يوم يحتوي على 2000 سعرة حرارية. يتفوق ذلك على تتبع الشخص العادي اليدوي بفارق كبير.
لا تزال التطبيقات ذات الأداء الأسوأ في اختبارنا تظهر معدلات خطأ تقارب 19 بالمئة، مما يترجم إلى أخطاء يومية محتملة تصل إلى 380 سعرة حرارية. اختيار التطبيق مهم بشكل كبير.
بالنسبة للمستخدمين الذين يحتاجون إلى دقة موثوقة — خاصة أولئك الذين يتتبعون المغذيات الكبرى لأداء رياضي، أو يتبعون نظامًا غذائيًا طبيًا، أو يعملون نحو أهداف وزن محددة — تشير البيانات بوضوح إلى التطبيقات التي تجمع بين التعرف القوي بالذكاء الاصطناعي مع قواعد بيانات غذائية موثوقة تم التحقق منها من قبل محترفين. الذكاء الاصطناعي جيد فقط بقدر البيانات التي يتم رسمها عليها.
المراجع:
- Lichtman, S. W., et al. (1992). "Discrepancy between self-reported and actual caloric intake and exercise in obese subjects." New England Journal of Medicine, 327(27), 1893-1898.
- Schoeller, D. A., et al. (1995). "Inaccuracies in self-reported intake identified by comparison with the doubly labelled water method." Canadian Journal of Physiology and Pharmacology, 73(11), 1535-1541.
- Mezgec, S., & Koroušić Seljak, B. (2024). "Systematic review of AI-based dietary assessment tools: accuracy and methodology." Nutrients, 16(5), 712.
- Tanaka, H., et al. (2024). "Food recognition and portion estimation accuracy in mobile dietary assessment." Journal of Food Composition and Analysis, 128, 105942.
- Williams, R., et al. (2025). "Comparative accuracy of AI-powered food photography versus 24-hour dietary recalls." American Journal of Clinical Nutrition, 121(2), 412-421.
مستعد لتحويل تتبع تغذيتك؟
انضم إلى الآلاف الذين حولوا رحلتهم الصحية مع Nutrola!