أساس الأدلة لتتبع التغذية بالذكاء الاصطناعي: ماذا تقول الأبحاث المنشورة عن الدقة
مراجعة منهجية للأبحاث المنشورة حول دقة التعرف على الطعام بالذكاء الاصطناعي وتقدير السعرات الحرارية، تغطي معايير التعلم العميق، ودراسات التحقق السريري، وكيفية مقارنة تتبع الذكاء الاصطناعي بالطرق اليدوية.
ما مدى دقة تتبع التغذية المدعوم بالذكاء الاصطناعي؟ هذا سؤال يهم كل من يعتمد على عداد السعرات الحرارية القائم على الصور لإدارة نظامه الغذائي، ويمكن للأبحاث المنشورة أن تقدم إجابات دقيقة بشكل متزايد.
على مدار العقد الماضي، اختبر الباحثون في مجالات علوم الكمبيوتر، وعلوم التغذية، والطب السريري أنظمة التعرف على الطعام بالذكاء الاصطناعي مقابل بيانات الحقائق، وقاموا بقياس أخطاء تقدير السعرات الحرارية في ظروف محكومة، وقارنوا تتبع الذكاء الاصطناعي بالطرق التقليدية. تلخص هذه المقالة النتائج الرئيسية من هذا الجسم من الأبحاث، مع التركيز على معايير التعلم العميق، ودراسات تقدير حجم الحصص، والتجارب السريرية، والقيود المعترف بها للأنظمة الحالية.
تطور أبحاث التعرف على الطعام بالذكاء الاصطناعي
التقييم الغذائي القائم على الصور في بداياته
فكرة استخدام الصور لتقييم المدخول الغذائي سبقت التعلم العميق. استكشفت الأبحاث المبكرة ما إذا كانت الصور الفوتوغرافية للوجبات، التي تم تحليلها بواسطة مقيمين مدربين، يمكن أن تنتج تقديرات غذائية دقيقة.
طور مارتن وزملاؤه (2009) طريقة تصوير الطعام عن بُعد (RFPM) وأظهروا أن المحللين المدربين يمكنهم تقدير المدخول الحراري من صور الطعام ضمن نطاق يتراوح بين 3 إلى 10 بالمئة من القيم الموزونة للطعام. وقد أسس هذا قاعدة مهمة: يمكن أن تحقق التقييمات البصرية للطعام، حتى من قبل البشر، دقة ملحوظة عند إجرائها بشكل منهجي (British Journal of Nutrition, 101(3), 446-456).
بدأ الانتقال إلى التحليل الآلي للصور بشكل جاد مع تطبيق التعلم العميق على مهام التعرف على الطعام حوالي 2014-2016، عندما بدأت الشبكات العصبية التلافيفية تتفوق بشكل كبير على الأساليب التقليدية للرؤية الحاسوبية في معايير تصنيف الصور.
ثورة التعلم العميق في التعرف على الطعام
نشر ميزغيك وكوروشيتش سيلجاك (2017) واحدة من أولى المراجعات الشاملة لأساليب التعلم العميق في التعرف على الطعام في Nutrients, 9(7), 657. غطت مراجعتهم التقدم السريع من الميزات البصرية المصممة يدويًا إلى نماذج التعلم العميق الشاملة وسجلت تحسينات في الدقة تتراوح بين 20 إلى 30 نقطة مئوية مقارنة بالأساليب التقليدية على مجموعات البيانات القياسية.
حددت المراجعة عدة تقدمات تقنية رئيسية تدفع هذه التحسينات: التعلم الانتقالي من مجموعات بيانات الصور الكبيرة (خصوصًا ImageNet)، وتقنيات تعزيز البيانات الخاصة بصور الطعام، وهياكل التعلم المتعدد المهام التي يمكن أن تحدد العناصر الغذائية وتقدر الحصص في آن واحد (ميزغيك وكوروشيتش سيلجاك، 2017).
مجموعات البيانات القياسية ومقاييس الدقة
يعتمد مجال التعرف على الطعام بالذكاء الاصطناعي على مجموعات بيانات معيارية موحدة لقياس ومقارنة أداء النماذج. فهم هذه المعايير يوفر سياقًا لمطالبات الدقة المقدمة من تطبيقات التغذية.
مجموعات البيانات القياسية الرئيسية
| مجموعة البيانات | السنة | الأطعمة | الصور | الغرض |
|---|---|---|---|---|
| Food-101 | 2014 | 101 فئة | 101,000 | تصنيف الطعام |
| ISIA Food-500 | 2020 | 500 فئة | 399,726 | تصنيف الطعام على نطاق واسع |
| Nutrition5k | 2021 | 5,006 أطباق | 5,006 | تقدير السعرات والماكرو |
| ECUST Food-45 | 2017 | 45 فئة | 4,500 | تقدير الحجم والسعرات |
| UEC Food-100 | 2012 | 100 فئة | 14,361 | التعرف على الطعام الياباني |
| UEC Food-256 | 2014 | 256 فئة | 31,395 | التعرف الموسع على الطعام الياباني |
| Food-2K | 2021 | 2,000 فئة | 1,036,564 | التعرف على الطعام العالمي على نطاق واسع |
Food-101: المعيار القياسي
تحتوي مجموعة Food-101، التي قدمها بوسارد وزملاؤه (2014) في المؤتمر الأوروبي للرؤية الحاسوبية، على 101,000 صورة عبر 101 فئة غذائية. وقد أصبحت المعيار الفعلي لتقييم نماذج التعرف على الطعام.
تحسنت الأداء على Food-101 بشكل مستمر:
| النموذج / الأسلوب | السنة | دقة Top-1 |
|---|---|---|
| Random Forest (الخط الأساسي) | 2014 | 50.8% |
| GoogLeNet (معدل) | 2016 | 79.2% |
| ResNet-152 | 2017 | 88.4% |
| EfficientNet-B7 | 2020 | 93.0% |
| Vision Transformer (ViT-L) | 2021 | 94.7% |
| نماذج مدربة مسبقًا على نطاق واسع | 2023-2025 | 95-97% |
توضح هذه التقدم من 50.8% إلى أكثر من 95% في دقة Top-1 خلال عقد تقريبًا التأثير الكبير للتعلم العميق على أداء التعرف على الطعام (بوسارد وزملاؤه، 2014، ECCV).
ISIA Food-500: التوسع إلى تنوع العالم الحقيقي
قدم مين وزملاؤه (2020) ISIA Food-500، وهي مجموعة بيانات أكبر وأكثر تنوعًا تحتوي على 500 فئة غذائية وحوالي 400,000 صورة. الأداء على هذه المعيار الأكثر تحديًا أقل من Food-101 بسبب العدد الأكبر من الفئات وتنوعها داخل الفئة، لكن النماذج الحديثة لا تزال تحقق دقة Top-1 تتجاوز 65% ودقة Top-5 تتجاوز 85% (Proceedings of the 28th ACM International Conference on Multimedia).
تسلط الفجوة بين أداء Food-101 وISIA Food-500 الضوء على واقع مهم: لا تترجم دقة المعيار على عدد محدود من الفئات مباشرة إلى دقة العالم الحقيقي عبر كامل طيف المأكولات العالمية.
Nutrition5k: من التصنيف إلى تقدير السعرات
قدم ثايمز وزملاؤه (2021) Nutrition5k في مؤتمر IEEE/CVF للرؤية الحاسوبية والتعرف على الأنماط (CVPR). على عكس مجموعات البيانات السابقة التي ركزت على تصنيف الطعام، توفر Nutrition5k بيانات دقيقة عن السعرات والماكرو لـ 5,006 أطباق، تم تصوير كل منها من زوايا علوية وجانبية وتم وزنها على ميزان دقيق.
مكنت هذه المجموعة الباحثين من تقييم دقة تقدير السعرات مباشرة. أظهرت النتائج الأولية أن متوسط الأخطاء النسبية المطلقة لتقدير السعرات تتراوح بين 15 إلى 25 بالمئة باستخدام أساليب تعتمد فقط على الصور، مع تحسين كبير عند دمج تحليل الصور مع معلومات العمق أو الصور متعددة الزوايا (ثايمز وزملاؤه، 2021).
تقدير حجم الحصة: المشكلة الأكثر تعقيدًا
دقة التعرف على الطعام هي جزء فقط من المعادلة. تقدير كمية كل طعام موجود — تقدير حجم الحصة — يُعترف به على نطاق واسع على أنه المهمة الأكثر تحديًا.
الأبحاث حول دقة تقدير الحصة
طور فانغ وزملاؤه (2019) في جامعة بوردو نظام تقدير الحصة القائم على الصور وقاموا بتقييمه مقابل سجلات الطعام الموزونة. حقق نظامهم متوسط أخطاء نسبية تتراوح بين 15 إلى 25 بالمئة لتقدير وزن الحصة عبر مجموعة متنوعة من أنواع الطعام. وأشار البحث إلى أن دقة التقدير تختلف بشكل كبير حسب نوع الطعام، حيث تم تقدير الأطعمة الصلبة ذات الأشكال المنتظمة (مثل صدور الدجاج) بدقة أكبر من الأطعمة غير المنتظمة (مثل الأطباق المختلطة) (IEEE Journal of Biomedical and Health Informatics, 23(5), 1972-1979).
استكشف لو وزملاؤه (2020) الأساليب المعتمدة على استشعار العمق لتقدير الحصة، باستخدام كاميرات ستيريو والضوء المنظم لإنشاء نماذج ثلاثية الأبعاد للعناصر الغذائية. قلل هذا النهج من أخطاء تقدير الحصة بنسبة تتراوح بين 20 إلى 35 بالمئة مقارنة بأساليب الصور الثنائية فقط، مما يشير إلى أن الأساليب متعددة المستشعرات تمثل اتجاهًا واعدًا لتحسين الدقة (Proceedings of the IEEE International Conference on Multimedia and Expo).
خطأ تقدير الحصة حسب نوع الطعام
| نوع الطعام | خطأ التقدير النموذجي | السبب |
|---|---|---|
| البروتينات الصلبة (الدجاج، اللحم) | 8-15% | شكل منتظم، حدود مرئية |
| الحبوب والنشويات (الأرز، المعكرونة) | 10-20% | كثافة متغيرة وأسلوب تقديم |
| الخضروات (سلطة، بروكلي) | 12-22% | أشكال غير منتظمة، تعبئة متغيرة |
| السوائل والشوربات | 15-25% | اختلاف العمق والحاوية |
| الأطباق المختلطة (الكاري، الحساء) | 18-30% | المكونات غير مرئية بشكل فردي |
| الصلصات والزيوت | 25-40% | غالبًا غير مرئية أو مرئية جزئيًا |
تظهر النتائج المتسقة عبر الدراسات أن الأطعمة المخفية أو غير المنتظمة تنتج أخطاء تقدير أكبر، وهو ما يمثل قيدًا جوهريًا لأي نهج قائم على الصور.
الذكاء الاصطناعي مقابل التتبع اليدوي: دراسات مقارنة
قامت عدة دراسات بمقارنة مباشرة بين دقة التقييم الغذائي المدعوم بالذكاء الاصطناعي والطرق اليدوية التقليدية.
مقارنة منهجية
راجع بوشي وزملاؤه (2017) طرق التقييم الغذائي المدعومة بالتكنولوجيا وخلصوا إلى أن الأساليب القائمة على الصور أنتجت تقديرات سعرات حرارية بأخطاء تتراوح بين 10 إلى 20 بالمئة، مقارنةً بتقارير ذاتية يدوية تظهر نقصًا بنسبة 20 إلى 50 بالمئة وفقًا لدراسات التحقق باستخدام الماء المزدوج الوسم (Journal of the Academy of Nutrition and Dietetics, 117(8), 1156-1166).
| الطريقة | خطأ السعرات النموذجي | اتجاه الانحياز |
|---|---|---|
| تتبع الصور بالذكاء الاصطناعي | 10-20% | مختلط (زيادة ونقص) |
| تسجيل التطبيق اليدوي | 20-35% | نقص منهجي |
| دفتر يوميات الطعام الورقي | 25-50% | نقص منهجي |
| استرجاع غذائي لمدة 24 ساعة | 15-30% | نقص منهجي |
| سجل الطعام الموزون | 2-5% | ضئيل (المعيار الذهبي) |
تمييز حاسم هو اتجاه الخطأ. تميل الطرق اليدوية إلى تقليل المدخول بشكل منهجي لأن الناس ينسون العناصر، ويقللون من تقديرات الحصص، ويستبعدون الوجبات الخفيفة. بينما تكون أخطاء الذكاء الاصطناعي أكثر توزيعًا عشوائيًا — أحيانًا تفرط في التقدير، وأحيانًا تقلل — مما يعني أنها أقل عرضة لإنتاج الانحياز المنهجي الذي يعيق التخطيط الغذائي.
التحقق السريري
قيم بندرغاست وزملاؤه (2017) أداة التقييم الغذائي الذاتية الآلية لمدة 24 ساعة (ASA24) ووجدوا أن التقييم الغذائي المدعوم بالتكنولوجيا حسّن من دقة وكمال سجلات المدخول الغذائي مقارنةً بالطرق غير المدعومة. أظهرت الدراسة أن التكنولوجيا قللت من عبء الوقت على المشاركين ومعدل الإدخالات المفقودة أو غير المكتملة (Journal of Nutrition, 147(11), 2128-2137).
القيود المعترف بها في الأدبيات
كانت المجتمع البحثي صريحًا بشأن القيود الحالية لتقييم التغذية المدعوم بالذكاء الاصطناعي.
التحديات المعروفة
المكونات المخفية: أشار زو وزملاؤه (2015) إلى أن الأساليب القائمة على الصور لا يمكنها اكتشاف المكونات التي لا تظهر في الصور بشكل موثوق، مثل الزيوت المستخدمة في الطهي، أو الزبدة المستخدمة في التحضير، أو السكر المذاب في المشروبات. تمثل هذه القيود جزءًا كبيرًا من خطأ تقدير السعرات الملحوظ في دراسات التحقق (IEEE Journal of Biomedical and Health Informatics, 19(1), 377-388).
التحيز الثقافي والإقليمي: أظهر إيج وزميله ياناي (2019) أن نماذج التعرف على الطعام المدربة بشكل أساسي على مجموعات بيانات الطعام الغربية تعمل بشكل أسوأ بشكل ملحوظ على المأكولات الآسيوية والأفريقية والشرق أوسطية. يمكن أن تنخفض دقة Top-1 بمقدار 15 إلى 25 نقطة مئوية عند تقييمها على المأكولات غير الممثلة، مما يبرز الحاجة إلى بيانات تدريب متنوعة عالميًا (Proceedings of ACM Multimedia).
تقدير الحصة في الأطباق المختلطة: وجد لو وزملاؤه (2020) أن خطأ تقدير السعرات تقريبًا يتضاعف عند الانتقال من صور الطعام الفردية إلى الأطباق المختلطة. لا يزال تحدي نسبة الحجم إلى المكونات الفردية داخل طبق مختلط مشكلة بحث مفتوحة (Nutrients, 12(11), 3368).
غموض العمق في الصورة الواحدة: بدون معلومات العمق، يتطلب تقدير الحجم ثلاثي الأبعاد للطعام من صورة ثنائية الأبعاد واحدة افتراضات حول ارتفاع وكثافة الطعام. وثق مايرز وزملاؤه (2015) في أبحاث Google هذا كقيد أساسي لمعلومات التقييم القائم على الصور الأحادية (Proceedings of IEEE International Conference on Computer Vision Workshops).
كيف تطبق Nutrola هذه الأبحاث
تستند نهج Nutrola في تتبع التغذية بالذكاء الاصطناعي إلى النتائج الموثقة في هذا الجسم من الأبحاث.
معالجة القيود المعروفة
استنادًا إلى تحديد الأدبيات للمكونات المخفية كفجوة رئيسية في الدقة، تجمع Nutrola بين التعرف على الصور والمدخلات اللغوية الطبيعية، مما يسمح للمستخدمين بإضافة ملاحظات حول طرق الطهي، والزيوت، والصلصات التي لا يمكن للكاميرا رؤيتها. يعالج هذا النهج متعدد الوسائط القيد الذي حددته زو وزملاؤه (2015).
لمكافحة التحيز الثقافي الذي وثقه إيج وياناي (2019)، تم تدريب نماذج التعرف على الطعام في Nutrola على مجموعة بيانات متنوعة عالميًا تشمل المأكولات من 47 دولة، مع توسيع مستمر للمناطق غير الممثلة.
بالنسبة لتقدير الحصة، تستخدم Nutrola نماذج قياس مرجعية ونماذج حصص متعلمة تم معايرتها مقابل بيانات الطعام الموزونة، بناءً على الأساليب التي تم التحقق منها من قبل فانغ وزملاؤه (2019) ولو وزملاؤه (2020).
التحسين المستمر من خلال ملاحظات المستخدمين
عندما يقوم المستخدمون بتصحيح تعريف الطعام أو تعديل تقدير الحصة، يتم تجميع هذه الملاحظات لتحسين دقة النموذج بمرور الوقت. يعكس هذا النظام المغلق نهج التعلم المستمر الذي أوصى به ميزغيك وكوروشيتش سيلجاك (2017) لنشر أنظمة التعرف على الطعام في العالم الحقيقي.
قاعدة بيانات موثوقة كأساس للدقة
بغض النظر عن مدى دقة الذكاء الاصطناعي في التعرف على عنصر غذائي، فإن القيم الغذائية المعادة جيدة فقط بقدر قاعدة البيانات التي تشير إليها. يضمن استخدام Nutrola لقاعدة بيانات موثوقة متعددة المصادر تحتوي على أكثر من 3 ملايين إدخال، تم التحقق منها مقابل قواعد بيانات حكومية مثل USDA FoodData Central، أن الأطعمة التي تم التعرف عليها بشكل صحيح تعيد بيانات غذائية دقيقة.
مسار تحسين الدقة
يميل خط الاتجاه في أبحاث التعرف على الطعام بالذكاء الاصطناعي إلى الارتفاع بشكل حاد. تحسنت دقة Top-1 على Food-101 من 50.8% إلى أكثر من 95% خلال عقد. انخفضت أخطاء تقدير السعرات من 25-40% في الأنظمة المبكرة إلى 10-20% في الأساليب الحديثة المتطورة. تستمر أنظمة متعددة المستشعرات ومتعددة الزوايا في دفع حدود دقة تقدير الحصة.
مع تنوع مجموعات التدريب، تصبح النماذج أكثر تعقيدًا، وتتحسن تكنولوجيا المستشعرات على الأجهزة المحمولة، ستستمر الفجوة بين تقديرات الذكاء الاصطناعي والحقائق في الانخفاض. توفر الأبحاث التي تمت مراجعتها هنا الثقة في أن تتبع التغذية بالذكاء الاصطناعي أكثر دقة بالفعل من الطرق اليدوية التي يستخدمها معظم الناس، وأنه يتحسن بسرعة.
الأسئلة الشائعة
ما مدى دقة التعرف على الطعام بالذكاء الاصطناعي في الأبحاث المنشورة؟
على معيار Food-101 القياسي، تحقق نماذج التعلم العميق الحديثة دقة Top-1 تتجاوز 95% في التعرف على الطعام. على معايير أكثر تنوعًا وتحديًا مثل ISIA Food-500 التي تحتوي على 500 فئة غذائية، تتجاوز دقة Top-5 85%. عادةً ما تقع دقة العالم الحقيقي في تطبيقات المستهلكين بين هذه المعايير اعتمادًا على تنوع الأطعمة التي يتم مواجهتها.
كيف تقارن تقديرات السعرات الحرارية بالذكاء الاصطناعي بتسجيل الطعام اليدوي؟
تظهر الأبحاث المنشورة أن تتبع الصور بالذكاء الاصطناعي ينتج عنه أخطاء تقدير السعرات الحرارية تتراوح بين 10 إلى 20 بالمئة، بينما يُظهر التسجيل الذاتي اليدوي نقصًا في تقدير المدخول بنسبة 20 إلى 50 بالمئة وفقًا لدراسات التحقق باستخدام الماء المزدوج الوسم. بشكل حاسم، تميل أخطاء الذكاء الاصطناعي إلى أن تكون موزعة عشوائيًا، بينما تكون أخطاء الطرق اليدوية تحتسب بشكل منهجي.
ما هو أكبر مصدر للخطأ في تتبع السعرات الحرارية بالذكاء الاصطناعي؟
وفقًا للأدبيات البحثية، تعتبر المكونات المخفية (مثل الزيوت المستخدمة في الطهي، والزبدة، والصلصات، والتتبيلات غير المرئية في الصور) وتقدير الحصة للأطباق المختلطة أكبر مصادر الخطأ. كما يساهم غموض العمق في الصورة الواحدة، حيث يتطلب تقدير حجم الطعام ثلاثي الأبعاد من صورة ثنائية الأبعاد افتراضات حول ارتفاع وكثافة الطعام.
ما هي مجموعة بيانات Food-101؟
Food-101 هي مجموعة بيانات معيارية قدمها بوسارد وزملاؤه في عام 2014 تحتوي على 101,000 صورة عبر 101 فئة غذائية. إنها الأكثر استخدامًا كمعيار لتقييم أداء نماذج التعرف على الطعام وقد كانت لها دور كبير في تتبع تقدم أساليب التعلم العميق من حوالي 50% إلى أكثر من 95% دقة.
هل يعمل التعرف على الطعام بالذكاء الاصطناعي بنفس الكفاءة لجميع المأكولات؟
لا. أظهرت أبحاث إيج وياناي (2019) أن النماذج المدربة بشكل أساسي على مجموعات بيانات الطعام الغربية تعمل بشكل أسوأ بشكل ملحوظ على المأكولات الآسيوية والأفريقية والشرق أوسطية، مع انخفاض في الدقة يتراوح بين 15 إلى 25 نقطة مئوية. لهذا السبب، تعتبر بيانات التدريب المتنوعة عالميًا ضرورية، ولهذا السبب تقوم Nutrola بالتحديد بالتدريب على صور الطعام من 47 دولة.
هل تتبع السعرات الحرارية بالذكاء الاصطناعي دقيق بما يكفي للاستخدام السريري؟
تشير الأبحاث إلى أن الإجابة هي نعم، مع بعض التحفظات. وجد بوشي وزملاؤه (2017) أن الأساليب القائمة على الصور أنتجت تقديرات سعرات حرارية بأخطاء تتراوح بين 10 إلى 20 بالمئة، وهو ما يعد أفضل بكثير من نقص التقدير بنسبة 25 إلى 50 بالمئة النموذجي في التقييم الغذائي السريري اليدوي. في الإعدادات السريرية، يُوصى بتتبع الذكاء الاصطناعي كتكملة، وليس كبديل كامل، لتقييم المرشدين الغذائيين.
مستعد لتحويل تتبع تغذيتك؟
انضم إلى الآلاف الذين حولوا رحلتهم الصحية مع Nutrola!