المعجم الشامل لتكنولوجيا التغذية بالذكاء الاصطناعي: أكثر من 50 مصطلحًا موضحًا

معجم شامل لأكثر من 50 مصطلحًا في تكنولوجيا التغذية بالذكاء الاصطناعي، يغطي التعلم الآلي، التعرف على الطعام، علوم التغذية، ميزات التطبيقات، ومقاييس الدقة مع تعريفات واضحة وروابط.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

تتداخل علوم التغذية مع الذكاء الاصطناعي لتنتج مفردات جديدة تمزج بين مصطلحات علوم الحاسوب ومفاهيم التغذية. سواء كنت مطورًا يعمل على بناء منتجات تكنولوجيا الطعام، أو أخصائي تغذية يقيم أدوات الذكاء الاصطناعي، أو مستخدمًا فضوليًا يرغب في فهم ما يحدث خلف الكواليس عند تصوير غدائك، فإن هذا المعجم هو دليلك المرجعي.

قمنا بتنظيم أكثر من 50 مصطلحًا في خمس فئات: الذكاء الاصطناعي والتعلم الآلي، التعرف على الطعام، علوم التغذية، ميزات التطبيقات والمنصات، ومقاييس الدقة. يوضح كل تعريف كيف يرتبط المفهوم بالنظام البيئي الأوسع لتتبع التغذية المدعوم بالذكاء الاصطناعي.

الذكاء الاصطناعي والتعلم الآلي

الشبكة العصبية التلافيفية (CNN)

الشبكة العصبية التلافيفية هي نوع من نماذج التعلم العميق المصممة خصيصًا لمعالجة البيانات الشبكية مثل الصور. تستخدم CNN طبقات من المرشحات القابلة للتعلم التي تتحرك عبر الصورة لاكتشاف أنماط مثل الحواف، والملمس، والأشكال. في التعرف على الطعام، تشكل CNN العمود الفقري لكل نظام حديث تقريبًا، حيث تستخرج الميزات البصرية من صورة الوجبة وتقوم بتمريرها عبر طبقات التصنيف لتحديد العناصر الغذائية الفردية.

التعلم العميق

يشير التعلم العميق إلى مجموعة فرعية من التعلم الآلي التي تستخدم الشبكات العصبية ذات الطبقات المخفية العديدة لتعلم تمثيلات هرمية من البيانات. تصف كلمة "عميق" في التعلم العميق عدد الطبقات المكدسة، مما يسمح للنموذج بالتقاط ميزات أكثر تجريدًا. تعتمد أنظمة التعرف على الطعام على التعلم العميق لأن التنوع البصري للوجبات، من السلطة المرتبة بشكل أنيق إلى الكاري المختلط، يتطلب نماذج قادرة على تعلم أنماط معقدة ومتعددة الطبقات تفوق ما يمكن أن تتعامل معه الخوارزميات التقليدية.

التعلم الانتقالي

التعلم الانتقالي هو تقنية يتم فيها تعديل نموذج تم تدريبه على مجموعة بيانات كبيرة واحدة لمهمة مختلفة ولكن ذات صلة. بدلاً من تدريب CNN للتعرف على الطعام من الصفر على مئات الآلاف من صور الطعام، يبدأ المهندسون بنموذج تم تدريبه مسبقًا على مجموعة بيانات صور واسعة مثل ImageNet ثم يقومون بتعديله على بيانات محددة للطعام. هذا يقلل بشكل كبير من وقت التدريب ومتطلبات البيانات بينما غالبًا ما يحسن الدقة، لأن الطبقات السفلية من الشبكة تفهم بالفعل المفاهيم البصرية العامة مثل الحواف وتدرجات الألوان.

التصنيف متعدد التسميات

التصنيف متعدد التسميات هو مهمة في التعلم الآلي حيث يمكن أن ينتمي إدخال واحد، مثل صورة، إلى أكثر من فئة في نفس الوقت. قد تحتوي صورة لطبق العشاء على دجاج مشوي، أرز بني، وبروكلي مطبوخ على البخار، كل منها يمثل تسمية منفصلة. يختلف هذا عن التصنيف متعدد الفئات القياسي، حيث يتم تعيين تسمية واحدة فقط، وهو أمر أساسي لتتبع الوجبات في العالم الحقيقي حيث نادرًا ما تحتوي الأطباق على طعام واحد فقط.

معالجة اللغة الطبيعية (NLP)

معالجة اللغة الطبيعية هي فرع من الذكاء الاصطناعي يركز على تمكين الحواسيب من فهم وتفسير وتوليد اللغة البشرية. في تطبيقات التغذية، تدعم NLP تسجيل الطعام القائم على النص: يمكن للمستخدم كتابة "بيضتان مخفوقتان مع شريحة من خبز القمح الكامل ونصف أفوكادو"، ويقوم النظام بتحليل هذا الإدخال بلغة طبيعية إلى بيانات غذائية منظمة. غالبًا ما تعمل NLP والرؤية الحاسوبية معًا، حيث تتعامل NLP مع الاستفسارات النصية ومدخلات الصوت بينما تعالج الرؤية الحاسوبية الصور.

الرؤية الحاسوبية

الرؤية الحاسوبية هي مجال من الذكاء الاصطناعي يدرب الحواسيب على تفسير واتخاذ قرارات بناءً على البيانات البصرية من العالم الحقيقي. تشمل تصنيف الصور، واكتشاف الكائنات، والتجزئة، وأكثر من ذلك. في مجال تكنولوجيا التغذية، تعتبر الرؤية الحاسوبية التخصص الشامل الذي تعمل ضمنه أنظمة التعرف على الطعام، وتقدير الحصص، واكتشاف الأطعمة المتعددة.

الشبكة العصبية

الشبكة العصبية هي نظام حوسبة مستوحى بشكل فضفاض من الشبكات العصبية البيولوجية في الدماغ البشري. تتكون من عقد مترابطة (خلايا عصبية) منظمة في طبقات تعالج البيانات عن طريق ضبط الاتصالات الموزونة أثناء التدريب. تعتبر الشبكات العصبية الأساس الذي تُبنى عليه CNNs والشبكات المتكررة وهياكل المحولات، مما يجعلها التقنية الأساسية وراء أدوات التغذية بالذكاء الاصطناعي الحديثة.

بيانات التدريب

بيانات التدريب هي مجموعة من الأمثلة الموصوفة المستخدمة لتعليم نموذج التعلم الآلي. بالنسبة لنظام التعرف على الطعام، تتكون بيانات التدريب من آلاف إلى ملايين صور الطعام، كل منها مشروحة بتسميات تحدد ما هي العناصر الغذائية الموجودة وأحيانًا أين تظهر في الصورة. تحدد تنوع وحجم ودقة بيانات التدريب مدى جودة أداء النموذج عبر مختلف المطابخ وظروف الإضاءة وأنماط التقديم.

الاستدلال

الاستدلال هو عملية استخدام نموذج مدرب لإجراء توقعات على بيانات جديدة وغير مرئية. عندما تقوم بتصوير وجبة ويعيد التطبيق تقديرات السعرات الحرارية في غضون ثوانٍ، فإن ذلك هو الاستدلال يحدث على خادم أو مباشرة على جهازك. سرعة الاستدلال مهمة لتجربة المستخدم؛ فالنموذج الذي يستغرق عشر ثوانٍ لإعادة النتائج يبدو بطيئًا مقارنةً بنموذج يستجيب في أقل من ثانيتين.

دقة النموذج

دقة النموذج هي مقياس عام لمدى تكرار إنتاج نموذج التعلم الآلي لتوقعات صحيحة. في التعرف على الطعام، يمكن قياس الدقة بعدة طرق، بما في ذلك دقة Top-1، ودقة Top-5، ومتوسط الدقة، كل منها يلتقط بعدًا مختلفًا من الأداء. تعتبر دقة النموذج العالية ضرورية ولكنها ليست كافية لتجربة مستخدم جيدة، لأن حتى النموذج الذي يحدد العناصر الغذائية بشكل صحيح يمكن أن يفشل في تقدير الحصص.

التعديل الدقيق

التعديل الدقيق هو عملية أخذ نموذج تم تدريبه مسبقًا ومواصلة تدريبه على مجموعة بيانات أصغر محددة للمهمة. قد يقوم نظام التعرف على الطعام بتعديل نموذج صورة عام على مجموعة بيانات مختارة من الأطباق الإقليمية لتحسين الأداء على، على سبيل المثال، المأكولات اليابانية أو المكسيكية. يقوم التعديل الدقيق بضبط أوزان بعض أو كل الطبقات في الشبكة، مما يسمح للنموذج بالتخصص دون التخلي عن المعرفة العامة التي اكتسبها أثناء التدريب المسبق.

زيادة البيانات

زيادة البيانات هي تقنية توسع مجموعة بيانات التدريب بشكل اصطناعي من خلال تطبيق تحويلات على الصور الموجودة، مثل التدوير، والانعكاس، وتغيير الألوان، والقص، وإضافة الضوضاء. بالنسبة للتعرف على الطعام، تساعد الزيادة النموذج على التعميم عبر ظروف إضاءة مختلفة، وزوايا الكاميرا، واتجاهات الأطباق. يمكن أن تولد صورة واحدة لوعاء من المعكرونة عشرات المتغيرات، كل منها يعلم النموذج التعرف على الطبق تحت ظروف مختلفة قليلاً.

التعرف على الطعام

تجزئة الصورة

تجزئة الصورة هي عملية تقسيم الصورة إلى مناطق ذات مغزى، وتعيين كل بكسل إلى فئة معينة. في التعرف على الطعام، تحدد التجزئة الدلالية أي بكسلات تنتمي إلى الأرز، وأيها تنتمي إلى الدجاج، وأيها تنتمي إلى الطبق. هذا الفهم على مستوى البكسل أكثر تفصيلاً من اكتشاف الكائنات وهو أمر حاسم لتقدير الحصص بدقة، لأنه يكشف عن المساحة الدقيقة التي يحتلها كل عنصر غذائي.

اكتشاف الكائنات

اكتشاف الكائنات هو مهمة في الرؤية الحاسوبية تحدد وتحدد مواقع الكائنات داخل صورة باستخدام صناديق محيطة. على عكس التصنيف، الذي يقول فقط ما هو موجود في الصورة، فإن اكتشاف الكائنات يقول أيضًا أين يوجد كل عنصر. تستخدم أنظمة التعرف على الطعام اكتشاف الكائنات كخطوة أولى لتحديد الأطعمة الفردية على الطبق قبل تمرير كل منطقة تم اكتشافها إلى نماذج أكثر تخصصًا للتصنيف وتقدير الحصص.

تقدير الحصص

تقدير الحصص هو عملية تحديد كمية أو حجم عنصر غذائي من صورة فوتوغرافية. يعتبر هذا عمومًا أصعب مشكلة في تتبع الطعام بالذكاء الاصطناعي، لأن الصورة المسطحة تفتقر إلى معلومات العمق، ويمكن أن يبدو نفس الطعام أكبر أو أصغر اعتمادًا على الطبق، وزاوية الكاميرا، والمسافة. تجمع الأنظمة المتقدمة بين تجزئة الصورة وتقدير العمق والأشياء المرجعية لتقدير الحجم، ومن ثم الوزن ومحتوى السعرات الحرارية.

تصنيف الطعام

تصنيف الطعام هو نظام تصنيف هرمي ينظم الأطعمة في فئات، وفئات فرعية، وعناصر فردية. قد يقوم تصنيف مصمم بشكل جيد بتجميع "الحبوب" في المستوى الأعلى، ثم "الأرز" في المستوى التالي، ثم "الأرز البني"، و"الأرز الأبيض"، و"الأرز البسمتي" كعناصر محددة. تساعد تصنيفات الطعام نماذج الذكاء الاصطناعي على إجراء توقعات منظمة وتسمح للنظام بالرجوع إلى فئة الوالد عندما لا يمكنه تمييز الأطعمة ذات الصلة الوثيقة.

اكتشاف الأطعمة المتعددة

اكتشاف الأطعمة المتعددة هو قدرة نظام الذكاء الاصطناعي على تحديد وتحليل عناصر غذائية متعددة بشكل منفصل في صورة واحدة. تحتوي صورة الوجبة في العالم الحقيقي تقريبًا دائمًا على أكثر من طعام واحد، ويجب على النظام اكتشاف كل عنصر بشكل فردي لتوفير بيانات غذائية دقيقة لكل عنصر. يجمع اكتشاف الأطعمة المتعددة بين اكتشاف الكائنات أو التجزئة مع التصنيف متعدد التسميات للتعامل مع الأطباق والأوعية المعقدة.

تقدير العمق

تقدير العمق هو تقنية في الرؤية الحاسوبية تستنتج المسافة بين الكائنات والكاميرا، مما يعيد بناء إحساس ثلاثي الأبعاد من صورة ثنائية الأبعاد. تستخدم بعض أنظمة تتبع الطعام تقدير العمق، أحيانًا بمساعدة مستشعرات LiDAR على الهواتف الذكية الحديثة، لتقدير حجم العناصر الغذائية بشكل أفضل. مع تجزئة الصورة، يحسن تقدير العمق بشكل كبير من دقة الحصص للأطعمة المكدسة أو الطبقات.

صندوق الحدود

صندوق الحدود هو إطار مستطيل مرسوم حول كائن تم اكتشافه في صورة، يتم تعريفه بواسطة إحداثياته. في اكتشاف الطعام، تعزل صناديق الحدود كل عنصر غذائي حتى تتمكن النماذج التالية من التركيز على عنصر واحد في كل مرة. على الرغم من أن صناديق الحدود بسيطة وفعالة من حيث الحوسبة، إلا أنها أقل دقة من أقنعة التجزئة للأطعمة ذات الأشكال غير المنتظمة مثل الموز أو شريحة البيتزا.

خريطة الميزات

خريطة الميزات هي ناتج طبقة تلافيفية في CNN، تمثل وجود ميزات معينة تم تعلمها في مواقع مكانية مختلفة في الصورة. تنتج الطبقات المبكرة خرائط ميزات لأنماط بسيطة مثل الحواف والزوايا، بينما تنتج الطبقات الأعمق خرائط ميزات لأنماط معقدة مثل قوام أو أشكال الطعام. تسمح خرائط الميزات لـ CNN "برؤية" الفرق بين مافن التوت ومافن الشوكولاتة، حتى عندما تكون أشكالهما متشابهة تقريبًا.

علوم التغذية

إجمالي نفقات الطاقة اليومية (TDEE)

إجمالي نفقات الطاقة اليومية هو العدد الإجمالي للسعرات الحرارية التي يحرقها جسمك في فترة 24 ساعة، بما في ذلك الأيض الأساسي، والنشاط البدني، وتأثير الطعام الحراري. TDEE هو الحساب المركزي وراء أي خطة تغذية قائمة على السعرات الحرارية: تناول أقل من TDEE لفقدان الوزن، أو أكثر منه لزيادة الوزن، أو عند مستوى الصيانة للبقاء كما أنت. تقدّر تطبيقات التغذية بالذكاء الاصطناعي TDEE باستخدام بيانات شخصية مثل العمر، والوزن، والطول، ومستوى النشاط، وأحيانًا بيانات الأجهزة القابلة للارتداء.

معدل الأيض الأساسي (BMR)

معدل الأيض الأساسي هو عدد السعرات الحرارية التي يحتاجها جسمك في حالة الراحة التامة للحفاظ على وظائف الحياة الأساسية مثل التنفس، والدورة الدموية، وإنتاج الخلايا. عادةً ما يمثل BMR 60 إلى 75 بالمئة من TDEE ويُقدّر عادةً باستخدام معادلات مثل معادلة ميفلين-سانت جيور. تستخدم تطبيقات التغذية BMR كنقطة انطلاق لحساب TDEE، مضيفةً مضاعفات النشاط وبيانات التمارين.

المغذيات الكبيرة

المغذيات الكبيرة هي واحدة من ثلاثة مغذيات أساسية يحتاجها الجسم بكميات كبيرة: البروتين، والكربوهيدرات، والدهون. توفر كل مغذيات كبيرة عددًا محددًا من السعرات الحرارية لكل جرام (4 للبروتين، 4 للكربوهيدرات، 9 للدهون) وتؤدي أدوارًا فسيولوجية مميزة. يعد تتبع الماكروز، وهو ممارسة مراقبة جرامات كل مغذي كبير يتم تناوله، ميزة أساسية في تطبيقات التغذية بالذكاء الاصطناعي ويوفر صورة أكثر دقة لجودة النظام الغذائي مقارنةً بعد السعرات الحرارية فقط.

المغذيات الدقيقة

المغذيات الدقيقة هي فيتامينات أو معادن يحتاجها الجسم بكميات صغيرة لوظائف فسيولوجية صحيحة. تشمل الأمثلة الحديد، وفيتامين د، والكالسيوم، والزنك، وفيتامينات ب. بينما تركز معظم تطبيقات التغذية بالذكاء الاصطناعي على المغذيات الكبيرة، تتبع المنصات المتقدمة أيضًا المغذيات الدقيقة لمساعدة المستخدمين في تحديد النقص المحتمل، خاصةً للأشخاص الذين يتبعون أنظمة غذائية مقيدة.

العجز في السعرات الحرارية

يحدث العجز في السعرات الحرارية عندما تستهلك سعرات حرارية أقل من TDEE، مما يجبر الجسم على استخدام الطاقة المخزنة (في الغالب الدهون) لتعويض الفرق. يُوصى عمومًا بعجز معتدل ومستدام يتراوح بين 300 إلى 500 سعرة حرارية يوميًا لفقدان الدهون بشكل آمن ومستدام. تساعد أدوات التتبع بالذكاء الاصطناعي المستخدمين في الحفاظ على العجز من خلال توفير تغذية راجعة في الوقت الحقيقي حول تناول الطعام بالنسبة لهدف السعرات الحرارية المخصص لهم.

الفائض في السعرات الحرارية

يحدث الفائض في السعرات الحرارية عندما تستهلك سعرات حرارية أكثر من TDEE، مما يوفر للجسم طاقة زائدة يمكن تخزينها كدهون أو استخدامها لبناء الأنسجة العضلية عند دمجها مع تدريبات المقاومة. يسعى الأشخاص الذين يهدفون إلى زيادة العضلات عمداً للحفاظ على فائض مُتحكم فيه، عادةً 200 إلى 400 سعرة حرارية فوق مستوى الصيانة. الدقة في تتبع الفائض مهمة لأن الفائض المفرط يؤدي إلى زيادة الدهون غير الضرورية.

المدخول اليومي الموصى به (RDI)

المدخول اليومي الموصى به هو إرشاد يشير إلى الكمية اليومية من مغذي ما تعتبر كافية لتلبية احتياجات الغالبية من الأفراد الأصحاء. تختلف قيم RDI حسب العمر، والجنس، ومرحلة الحياة. تشير تطبيقات التغذية إلى قيم RDI لعرض شريط التقدم والتنبيهات، مما يظهر للمستخدمين مدى قربهم من تحقيق أهدافهم اليومية من الفيتامينات، والمعادن، والمغذيات الكبيرة.

المدخول المرجعي الغذائي (DRI)

تشير المدخلات المرجعية الغذائية إلى مجموعة من القيم المرجعية التي تنشرها السلطات الصحية الوطنية والتي تشمل RDI، ومتطلبات المتوسط المقدر، والمدخول الكافي، ومستوى المدخول الأعلى المقبول لكل مغذي. توفر DRI إطارًا أكثر اكتمالًا من RDI وحده، وتستخدم المنصات الغذائية المتطورة بيانات DRI لتقديم توصيات مخصصة تأخذ في الاعتبار الفروق الفردية.

مؤشر نسبة السكر في الدم (GI)

مؤشر نسبة السكر في الدم هو مقياس رقمي من 0 إلى 100 يصنف الأطعمة التي تحتوي على الكربوهيدرات حسب سرعة رفعها لمستويات الجلوكوز في الدم بعد الاستهلاك. تسبب الأطعمة ذات المؤشر العالي مثل الخبز الأبيض ارتفاعات سريعة، بينما تنتج الأطعمة ذات المؤشر المنخفض مثل العدس ارتفاعًا بطيئًا وتدريجيًا. تعرض بعض تطبيقات التغذية بالذكاء الاصطناعي قيم GI جنبًا إلى جنب مع الماكروز، وهو أمر مفيد بشكل خاص للمستخدمين الذين يديرون مرض السكري أو مقاومة الأنسولين.

تصنيف NOVA

نظام تصنيف NOVA يصنف الأطعمة إلى أربع مجموعات بناءً على مدى وهدف المعالجة الصناعية: الأطعمة غير المعالجة أو المعالجة بشكل طفيف، والمكونات الطهو المعالجة، والأطعمة المعالجة، والأطعمة فائقة المعالجة. ربطت الأبحاث الاستهلاك العالي للأطعمة فائقة المعالجة (مجموعة NOVA 4) بزيادة خطر السمنة والأمراض المزمنة. توفر المنصات الغذائية التي تتضمن تصنيف NOVA للمستخدمين نظرة ثاقبة على جودة الطعام بخلاف محتوى السعرات الحرارية والماكروز فقط.

التأثير الحراري للطعام (TEF)

التأثير الحراري للطعام هو الطاقة المستهلكة خلال عملية الهضم، والامتصاص، والمعالجة الأيضية للمغذيات. يمثل TEF عادةً حوالي 10 بالمئة من إجمالي السعرات الحرارية المستهلكة، على الرغم من أنه يختلف حسب المغذي: البروتين له TEF يتراوح بين 20 إلى 30 بالمئة، والكربوهيدرات 5 إلى 10 بالمئة، والدهون 0 إلى 3 بالمئة. يُعتبر TEF أحد المكونات الثلاثة لـ TDEE، جنبًا إلى جنب مع BMR والنشاط البدني، ويشرح لماذا يمكن أن تكون الأنظمة الغذائية الغنية بالبروتين لها ميزة أيضية طفيفة.

الأحماض الأمينية

الأحماض الأمينية هي جزيئات عضوية تعمل كعناصر بناء للبروتين. هناك 20 حمضًا أمينيًا قياسيًا، تسعة منها أساسية، مما يعني أن الجسم لا يمكنه تخليقها ويجب أن تأتي من الطعام. يمكن أن يكسر تتبع التغذية المتقدم تناول البروتين حسب ملف الأحماض الأمينية، وهو أمر مهم للرياضيين والأفراد الذين يتبعون أنظمة غذائية نباتية يحتاجون إلى التأكد من حصولهم على جميع الأحماض الأمينية الأساسية من مصادر غذائية مكملة.

ميزات التطبيقات والمنصات

Snap and Track

Snap and Track هي ميزة تسمح للمستخدمين بتصوير وجبتهم باستخدام كاميرا الهاتف الذكي والحصول على تحليل غذائي تلقائي. يستخدم النظام الرؤية الحاسوبية لتحديد الأطعمة في الصورة، ويقدر الحصص، ويستعلم من قاعدة بيانات التغذية لإرجاع بيانات السعرات الحرارية والماكروز. تقلل Snap and Track من وقت التسجيل من عدة دقائق من البحث اليدوي والدخول إلى ثوانٍ قليلة، مما يحسن بشكل كبير من التزام المستخدم.

مسح الباركود

مسح الباركود هو ميزة تتيح للمستخدمين مسح الباركود على المنتجات الغذائية المعبأة لاسترداد المعلومات الغذائية على الفور من قاعدة بيانات. يقرأ التطبيق الباركود باستخدام كاميرا الجهاز، ويطابقه مع إدخال منتج، ويسجل بيانات التغذية المقابلة. يعتبر مسح الباركود دقيقًا للغاية للأطعمة المعبأة لأنه يستخرج البيانات المبلغ عنها من قبل الشركات المصنعة مباشرة، مما يجعله مكملًا موثوقًا للتعرف على الصور القائم على الذكاء الاصطناعي للوجبات غير المعبأة.

قاعدة بيانات الطعام

قاعدة بيانات الطعام هي مجموعة منظمة من المعلومات الغذائية لآلاف إلى ملايين العناصر الغذائية، بما في ذلك عدد السعرات الحرارية، وتفاصيل الماكروز، وملفات المغذيات الدقيقة، وأحجام الحصص. تحدد دقة وشمولية قاعدة بيانات الطعام جودة تقديرات التغذية التي يمكن أن يوفرها التطبيق. يمكن أن تُستمد قواعد البيانات من وكالات حكومية مثل USDA، أو بيانات الشركات المصنعة، أو تحليلات المختبرات، أو مزيج من الثلاثة.

ملصق التغذية

ملصق التغذية هو لوحة المعلومات القياسية الموجودة على المنتجات الغذائية المعبأة التي تسرد حجم الحصة، والسعرات الحرارية، والماكروز، وبعض المغذيات الدقيقة. يمكن أن تستخدم الأنظمة الذكية التعرف الضوئي على الحروف (OCR) لقراءة ملصقات التغذية من الصور، مما يسمح للمستخدمين بتسجيل المنتجات المخصصة أو الإقليمية التي قد لا تظهر في قاعدة بيانات الباركود الخاصة بالتطبيق. هذا يجسر الفجوة بين مسح الباركود والدخول اليدوي.

واجهة برمجة التطبيقات (API)

واجهة برمجة التطبيقات هي مجموعة من البروتوكولات والأدوات التي تسمح لأنظمة البرمجيات المختلفة بالتواصل مع بعضها البعض. في تكنولوجيا التغذية، تربط واجهات برمجة التطبيقات التطبيق المحمول بنماذج التعرف على الطعام المستندة إلى السحابة، وقواعد بيانات الطعام، وتخزين بيانات المستخدم. تتيح واجهة برمجة التطبيقات المصممة بشكل جيد للمطورين من الأطراف الثالثة دمج تتبع التغذية في تطبيقات اللياقة البدنية، ومنصات الصحة، والأجهزة القابلة للارتداء، مما يوسع نطاق أدوات التغذية بالذكاء الاصطناعي إلى ما هو أبعد من تطبيق واحد.

خصوصية البيانات

تشير خصوصية البيانات إلى الممارسات والسياسات التي تحكم كيفية جمع معلومات المستخدم، بما في ذلك صور الطعام، والعادات الغذائية، ومقاييس الصحة، والتفاصيل الشخصية، وتخزينها ومشاركتها. تتعامل تطبيقات التغذية مع بيانات صحية حساسة، والتي تقع في العديد من الولايات القضائية تحت تنظيمات مثل GDPR أو HIPAA. تعتبر ممارسات خصوصية البيانات القوية، بما في ذلك التشفير، وإخفاء الهوية، وسياسات الموافقة الشفافة، أمرًا حيويًا للحفاظ على ثقة المستخدمين.

تسجيل NLP

تسجيل NLP هو طريقة إدخال الطعام القائمة على النص التي تستخدم معالجة اللغة الطبيعية لتحليل أوصاف الوجبات الحرة إلى بيانات غذائية منظمة. قد يكتب المستخدم "لاتيه كبيرة مع حليب الشوفان ومافن بالموز والجوز"، وتحدد محركات NLP كل عنصر، وتطابقه مع إدخالات قاعدة البيانات، وتقوم بتسجيل المغذيات. يوفر تسجيل NLP بديلاً سريعًا لتسجيل الصور أو البحث اليدوي، خاصةً للوجبات أو الوجبات الخفيفة البسيطة.

مقاييس الدقة

دقة Top-1

دقة Top-1 هي مقياس يقيس مدى تكرار تطابق أعلى توقعات النموذج مع التسمية الصحيحة. إذا نظر نموذج التعرف على الطعام إلى صورة وكان تخمينه الأعلى هو "باد تاي"، فإن دقة Top-1 تقيس مدى صحة ذلك التخمين الأعلى. إنها أكثر مقاييس الدقة صرامة وغالبًا ما يتم الإبلاغ عنها في أبحاث الرؤية الحاسوبية كمؤشر رئيسي لأداء التصنيف.

دقة Top-5

تقيس دقة Top-5 مدى تكرار ظهور التسمية الصحيحة في أي مكان ضمن أعلى خمسة توقعات للنموذج. هذه المقياس أكثر تسامحًا من Top-1 وهو مهم بشكل خاص في التعرف على الطعام، حيث يمكن أن تكون الأطباق المتشابهة بصريًا (مثل أنواع مختلفة من الكاري أو أشكال المعكرونة المختلفة) صعبة التمييز. قد يحقق نموذج بدقة Top-1 تبلغ 85 بالمئة دقة Top-5 تبلغ 97 بالمئة، مما يعني أنه يتضمن تقريبًا دائمًا الإجابة الصحيحة في قائمته القصيرة.

متوسط الدقة (mAP)

متوسط الدقة هو مقياس شامل يستخدم لتقييم نماذج اكتشاف الكائنات. يحسب متوسط الدقة عبر جميع فئات الطعام وعند عدة عتبات تداخل، مما ينتج عنه درجة واحدة تلتقط كل من مدى جودة تحديد النموذج للأطعمة ومدى دقة تحديد مواقعها. يُعتبر mAP المعيار القياسي لمهام الاكتشاف وهو مفيد بشكل خاص في سيناريوهات اكتشاف الأطعمة المتعددة حيث يجب على النموذج العثور على وتصنيف عدة عناصر في صورة واحدة.

تقاطع على اتحاد (IoU)

تقاطع على اتحاد هو مقياس ي quantifies مدى تداخل صندوق الحدود أو قناع التجزئة المتوقع مع التسمية الحقيقية. يتم حسابه عن طريق تقسيم مساحة التداخل بين المناطق المتوقعة والفعلية على مساحة اتحادها. يعني IoU بمقدار 1.0 تداخلًا مثاليًا، بينما يعني IoU بمقدار 0 عدم وجود تداخل على الإطلاق. في اكتشاف الطعام، تحدد عتبات IoU (عادةً 0.5 أو 0.75) ما إذا كان الاكتشاف يُعتبر إيجابيًا حقيقيًا عند حساب mAP.

متوسط الخطأ المطلق (MAE)

متوسط الخطأ المطلق هو مقياس يقيس متوسط حجم الأخطاء في مجموعة من التوقعات، دون النظر إلى اتجاهها. بالنسبة لتقدير الحصص وتوقع السعرات الحرارية، يلتقط MAE مدى بُعد تقديرات النموذج عن القيمة الحقيقية في المتوسط: يعني MAE بمقدار 30 سعرة حرارية أن توقعات النموذج تكون، في المتوسط، 30 سعرة حرارية أعلى أو أقل من القيمة الحقيقية. تشير MAE الأقل إلى تتبع سعرات حرارية أكثر موثوقية وتؤثر مباشرة على نتائج المستخدم.

الدقة

الدقة هي مقياس يقيس نسبة التوقعات الإيجابية التي تكون صحيحة بالفعل. في اكتشاف الطعام، تجيب الدقة على السؤال: "من بين جميع العناصر الغذائية التي قال النموذج إنه وجدها، كم عددها كان موجودًا بالفعل؟" تعني الدقة العالية قلة الإيجابيات الكاذبة، لذا نادرًا ما يتخيل النموذج أطعمة غير موجودة على الطبق. تعتبر الدقة مهمة بشكل خاص في تتبع التغذية لأن العناصر الغذائية الوهمية ستزيد من عدد السعرات الحرارية.

الاستدعاء

الاستدعاء هو مقياس يقيس نسبة الحالات الإيجابية الفعلية التي يحددها النموذج بشكل صحيح. في اكتشاف الطعام، يجيب الاستدعاء على السؤال: "من بين جميع العناصر الغذائية الموجودة بالفعل على الطبق، كم عددها وجدها النموذج؟" تعني الاستدعاء العالي قلة السلبيات الكاذبة، لذا نادرًا ما يفوت النموذج الأطعمة الموجودة. في تتبع السعرات الحرارية، يكون الاستدعاء المنخفض خطيرًا لأن العناصر الغذائية المفقودة تؤدي إلى تقارير ناقصة عن المدخول، مما قد يضعف أهداف المستخدم الغذائية.

الأسئلة الشائعة

لماذا توجد العديد من مقاييس الدقة المختلفة لتكنولوجيا التعرف على الطعام بالذكاء الاصطناعي؟

تلتقط مقاييس مختلفة جوانب مختلفة من الأداء. تقيس دقة Top-1 وTop-5 صحة التصنيف، مما يخبرك ما إذا كان النموذج يحدد الطعام الصحيح. تقيس mAP وIoU جودة الاكتشاف والتحديد، مما يخبرك ما إذا كان النموذج يجد العناصر في الأماكن الصحيحة. يقيس MAE خطأ التقدير للقيم المستمرة مثل السعرات الحرارية أو الجرامات. تلتقط الدقة والاستدعاء التوازن بين الإيجابيات الكاذبة والسلبيات الكاذبة. لا يوجد رقم واحد يخبر القصة كاملة، لذا يستخدم الباحثون والمطورون مجموعة من المقاييس لتقييم نظام التعرف على الطعام بشكل شامل.

كيف يجعل التعلم الانتقالي نماذج التعرف على الطعام أكثر سهولة؟

يتطلب تدريب نموذج التعلم العميق من الصفر ملايين الصور الموصوفة وموارد حوسبة كبيرة. يتجاوز التعلم الانتقالي جزءًا كبيرًا من هذه التكلفة من خلال البدء بنموذج تعلم ميزات بصرية عامة من مجموعة بيانات كبيرة مثل ImageNet. يقوم المهندسون بعد ذلك بتعديل هذا النموذج على مجموعة بيانات أصغر محددة للطعام. تعني هذه الطريقة أن الشركات الصغيرة التي لا تمتلك بنية بيانات ضخمة يمكنها بناء أنظمة التعرف على الطعام التنافسية، مما كان عاملًا رئيسيًا في النمو السريع لتطبيقات التغذية بالذكاء الاصطناعي في السنوات القليلة الماضية.

ما الفرق بين BMR وTDEE، ولماذا يعتبر ذلك مهمًا لتتبع السعرات الحرارية؟

BMR هو الطاقة التي يستخدمها جسمك في حالة الراحة التامة فقط للحفاظ على حياتك، بينما TDEE هو إجمالي حرق السعرات الحرارية على مدار يوم كامل، بما في ذلك النشاط البدني والتأثير الحراري للطعام. يستند هدف السعرات الحرارية الخاص بك في تطبيق التغذية إلى TDEE، وليس BMR، لأن TDEE يعكس احتياجاتك الفعلية من الطاقة. إذا حدد تطبيق هدف السعرات الحرارية لديك بناءً على BMR، فستكون في عجز كبير جدًا في الأيام النشطة، مما قد يضر بالكتلة العضلية وصحة الأيض. لذلك، فإن تقدير TDEE بدقة، المستند إلى بيانات النشاط من الأجهزة القابلة للارتداء والتمارين المبلغ عنها ذاتيًا، أمر حاسم لتحديد أهداف التغذية الآمنة والفعالة.

هل يمكن لتكنولوجيا التعرف على الطعام بالذكاء الاصطناعي التعامل مع الأطباق المختلطة والوجبات المنزلية؟

تعتبر الأطباق المختلطة والوجبات المنزلية من أكبر التحديات لتكنولوجيا التعرف على الطعام بالذكاء الاصطناعي. يحتوي وعاء من القلي، أو كسرولة، أو حساء منزلي على مكونات متعددة مختلطة معًا، مما يجعل من الصعب على التجزئة تحديد العناصر الفردية. تتعامل الأنظمة الحديثة مع هذه المشكلة بعدة طرق: يستخدم البعض التصنيف متعدد التسميات لتحديد المكونات المحتملة، بينما يستند البعض الآخر إلى قاعدة بيانات من الوصفات الشائعة لتقدير الملف الغذائي المدمج، ويحث البعض المستخدمين على تأكيد أو تعديل المكونات المكتشفة. تتحسن الدقة للأطباق المختلطة ولكنها لا تزال أقل من الأداء على الأطعمة المفصولة بوضوح والمقدمة بشكل فردي.

كيف تحسن زيادة البيانات التعرف على الطعام عبر الثقافات والمطابخ المختلفة؟

تختلف الأطعمة بشكل كبير عبر الثقافات، وسينتج نموذج تم تدريبه بشكل أساسي على الأطباق الغربية أداءً ضعيفًا على المأكولات الجنوبية الآسيوية، أو الأفريقية، أو جنوب شرق الآسيوية. تساعد زيادة البيانات من خلال إنشاء تنوع بصري من الصور التدريبية الموجودة، لكنها ليست سوى جزء من الحل. الاستراتيجية الأكثر تأثيرًا هي جمع بيانات تدريب متنوعة تمثل النطاق الكامل للأطعمة العالمية، وأنماط الطهي، وعادات التقديم. ثم تضخم زيادة البيانات مجموعة البيانات المتنوعة هذه من خلال محاكاة إضاءة وزوايا وخلفيات مختلفة. معًا، تقلل جمع البيانات المتنوعة وزيادة البيانات من التحيز الثقافي في أنظمة التعرف على الطعام وتدفع المجال نحو تغطية عالمية حقيقية.

ماذا يجب أن أبحث عنه في قاعدة بيانات الطعام الخاصة بتطبيق التغذية لضمان الدقة؟

يجب أن تستند قاعدة بيانات الطعام الموثوقة إلى مصادر موثوقة مثل قاعدة بيانات USDA FoodData Central، وقواعد البيانات الوطنية للتغذية، وبيانات الشركات المصنعة التي تم تحليلها في المختبر بدلاً من الاعتماد فقط على إدخالات المستخدم التي تم جمعها من قبل، والتي قد تحتوي على أخطاء وتكرارات. ابحث عن تطبيق يوضح بوضوح مصدر بياناته، ويقدم خيارات حجم الحصة التي تتطابق مع الحصص الواقعية، ويقوم بتحديث قاعدة بياناته بانتظام لتعكس المنتجات الجديدة وإعادة صياغتها. يجب أن تغطي قاعدة البيانات أيضًا مجموعة واسعة من المطابخ وطرق الطهي، وليس فقط الأطعمة الغربية المعبأة. أخيرًا، تحقق مما إذا كان التطبيق يستخدم الذكاء الاصطناعي لمراجعة والتحقق من الإدخالات، حيث يمكن أن تساعد هذه الطبقة الإضافية من التحكم في الجودة في اكتشاف الت inconsistencies التي تتسلل حتمًا إلى أي قاعدة بيانات طعام كبيرة.

مستعد لتحويل تتبع تغذيتك؟

انضم إلى الآلاف الذين حولوا رحلتهم الصحية مع Nutrola!