कैसे AI फोटो से भोजन के हिस्से का आकार अनुमान लगाता है: एक तकनीकी गहराई में दृष्टि

10 मार्च 2026

इस लेख में हम देखेंगे कि AI कैसे गहराई के अनुमान, संदर्भ वस्तुओं और मात्रा मॉडलिंग का उपयोग करके एकल फोटो से भोजन के हिस्से का आकार अनुमान लगाता है।

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

AI-संचालित कैलोरी ट्रैकिंग में आपके प्लेट पर भोजन की पहचान करना केवल आधी चुनौती है। दूसरी आधी, और शायद कठिन आधी, यह पता लगाना है कि वहाँ कितना भोजन है। पास्ता का एक सर्विंग 200 कैलोरी हो सकता है या 800 कैलोरी, यह हिस्से पर निर्भर करता है। इस अनुमान को सही तरीके से प्राप्त करना एक उपयोगी पोषण ट्रैकिंग उपकरण को एक नवीनीकरण से अलग करता है।

यह लेख तकनीकी दृष्टि से गहराई में जाकर यह देखता है कि AI सिस्टम फोटो से हिस्से के आकार का अनुमान कैसे लगाते हैं, जिसमें गहराई का अनुमान, संदर्भ वस्तुओं का स्केलिंग, मात्रा मॉडलिंग, और अनुसंधानकर्ताओं और इंजीनियरों को इन अनुमानों को अधिक सटीक बनाने में आने वाली चुनौतियों का विवरण शामिल है।

क्यों हिस्से का अनुमान भोजन की पहचान से कठिन है

भोजन की पहचान मूल रूप से एक वर्गीकरण समस्या है। सिस्टम को खाद्य श्रेणियों के एक सीमित सेट में से चुनना होता है। इसके विपरीत, हिस्से का अनुमान एक प्रतिगमन समस्या है। सिस्टम को केवल दृश्य जानकारी से एक निरंतर मान (ग्राम या मिलीलीटर) का अनुमान लगाना होता है।

कुछ कारक इसे विशेष रूप से चुनौतीपूर्ण बनाते हैं:

2D से 3D समस्या: एक फोटो तीन-आयामी वास्तविकता को दो-आयामी छवि में संकुचित कर देती है। गहराई की जानकारी खो जाती है, जिससे भोजन के पतले फैलाव और मोटे ढेर के बीच अंतर करना मुश्किल हो जाता है।
परिवर्तनीय घनत्व: एक कप हरी पत्तेदार सब्जियाँ और एक कप ग्रेनोला का आकार समान है लेकिन उनका वजन और कैलोरी सामग्री पूरी तरह से भिन्न है। सिस्टम को दोनों, मात्रा और घनत्व का अनुमान लगाना होता है।
परिप्रेक्ष्य विकृति: जिस कोण से फोटो लिया गया है, वह खाद्य वस्तुओं के आकार को प्रभावित करता है। सीधे ऊपर से ली गई प्लेट की फोटो 45 डिग्री के कोण पर ली गई उसी प्लेट से अलग दिखती है।
अस्पष्ट स्केलिंग: यदि फ्रेम में कोई ज्ञात संदर्भ वस्तु नहीं है, तो वस्तुओं के आकार का निर्धारण करना संभव नहीं है। एक छोटे कुकी का क्लोज़-अप एक बड़े पिज्जा की फोटो के समान दिख सकता है जो दूर से लिया गया है।

एकल छवि से गहराई का अनुमान

फोटो से हिस्से का अनुमान लगाने में सक्षम एक प्रमुख प्रगति मोनोकुलर गहराई अनुमान है, जो एकल छवि से गहराई की जानकारी का अनुमान लगाने की क्षमता है, न कि स्टीरियो कैमरों या विशेष हार्डवेयर की आवश्यकता होती है।

मोनोकुलर गहराई अनुमान कैसे काम करता है

मानव दृश्य प्रणाली गहराई का अनुमान कई संकेतों से लगाती है: वस्तुओं का ओवरलैप (निकट की वस्तुएं दूर की वस्तुओं को छिपाती हैं), सापेक्ष आकार (छोटी वस्तुएं आमतौर पर दूर होती हैं), बनावट ग्रेडिएंट (बड़ी दूरी पर बनावट बारीक होती जाती है), और वायुमंडलीय परिप्रेक्ष्य (दूर की वस्तुएं धुंधली दिखती हैं)।

डीप लर्निंग मॉडल इन संकेतों को गहराई मानचित्रों के साथ जोड़ी गई छवियों के बड़े डेटासेट से सीख सकते हैं। जब इसे खाद्य फोटोग्राफी पर लागू किया जाता है, तो ये मॉडल यह अनुमान लगा सकते हैं कि भोजन की कौन सी भाग कैमरे के करीब हैं और कौन से दूर हैं, प्रभावी रूप से एक सपाट छवि से भोजन के तीन-आयामी आकार का पुनर्निर्माण करते हैं।

गहराई मानचित्र और भोजन की मात्रा

एक गहराई मानचित्र छवि में हर पिक्सेल को एक दूरी मान सौंपता है। भोजन के अनुमान के लिए, इसका मतलब है कि सिस्टम यह निर्धारित कर सकता है कि एक कटोरी सूप का केंद्र एक गहराई पर है जबकि कटोरे का किनारा दूसरी गहराई पर है। इन गहराइयों के बीच का अंतर, साथ ही भोजन की पहचान की गई सीमाएँ, सिस्टम को मात्रा का अनुमान लगाने में मदद करती हैं।

आधुनिक स्मार्टफोन कैमरे जिनमें LiDAR सेंसर होते हैं (हाल के iPhone Pro और iPad Pro मॉडल पर उपलब्ध) वास्तविक गहराई डेटा को रंगीन छवि के साथ कैप्चर कर सकते हैं, जो केवल एल्गोरिदमिक अनुमान की तुलना में बहुत अधिक सटीक गहराई की जानकारी प्रदान करते हैं। खाद्य ट्रैकिंग ऐप्स इस हार्डवेयर का लाभ उठा सकते हैं जब यह उपलब्ध हो, जबकि गहराई सेंसर के बिना उपकरणों पर मोनोकुलर अनुमान पर वापस लौट सकते हैं।

संदर्भ वस्तु स्केलिंग

एक ज्ञात संदर्भ बिंदु के बिना, फोटो में वस्तुओं का वास्तविक आकार अस्पष्ट होता है। संदर्भ वस्तु स्केलिंग इस समस्या को हल करती है, ज्ञात आयामों वाली वस्तुओं का उपयोग करके पूरे चित्र के लिए आकार स्केल स्थापित करती है।

सामान्य संदर्भ वस्तुएं

संदर्भ वस्तु	ज्ञात आयाम	सटीकता लाभ
मानक डिनर प्लेट	25-27 सेमी व्यास	भोजन के लिए समग्र स्केल स्थापित करता है
कांटा या चम्मच	~19 सेमी लंबाई	क्लोज़-अप शॉट्स में भी स्केल प्रदान करता है
क्रेडिट कार्ड	8.56 x 5.4 सेमी	सटीक और सार्वभौमिक मानकीकृत
स्मार्टफोन	मॉडल के अनुसार भिन्न लेकिन ज्ञात	स्वचालित रूप से पहचाना और मापा जा सकता है
हाथ	भिन्न लेकिन जनसांख्यिकी से अनुमानित किया जा सकता है	जब कोई अन्य संदर्भ उपलब्ध नहीं हो तो अनुमानित स्केलिंग

स्वचालित संदर्भ पहचान

उपयोगकर्ताओं से भोजन के बगल में संदर्भ कार्ड रखने की आवश्यकता के बजाय (जो उपयोग में बाधा डालता है), आधुनिक सिस्टम स्वचालित रूप से सामान्य संदर्भ वस्तुओं का पता लगाने का प्रयास करते हैं। प्लेटें, कटोरे, बर्तन, और टेबल सभी खाद्य फोटो में अक्सर दिखाई देते हैं और यदि सिस्टम उन्हें पहचान सकता है तो आकार संदर्भ के रूप में कार्य कर सकते हैं।

Nutrola का हिस्से का अनुमान लगाने वाला सिस्टम फ्रेम में प्लेटों, कटोरियों और बर्तनों की स्वचालित पहचान करता है ताकि स्केल स्थापित किया जा सके। जब इन वस्तुओं का पता लगाया जाता है, तो सिस्टम उनके सामान्य आयामों का उपयोग करके खाद्य वस्तुओं के आकार को कैलिब्रेट करता है। जब कोई संदर्भ वस्तु नहीं मिलती है, तो सिस्टम सामान्य खाद्य हिस्सों के बारे में सीखे गए प्राथमिकताओं पर निर्भर करता है और उपयोगकर्ता से पुष्टि करने के लिए कह सकता है।

प्लेट-आधारित कैलिब्रेशन

एक विशेष रूप से प्रभावी दृष्टिकोण प्लेट-आधारित कैलिब्रेशन है। अधिकांश देशों में मानक डिनर प्लेटें एक संकीर्ण आकार सीमा (25 से 27 सेमी व्यास) में आती हैं। छवि में प्लेट की अंडाकार आकृति का पता लगाकर और मानक आकार मानकर, सिस्टम प्लेट पर सब कुछ के लिए एक विश्वसनीय स्केल स्थापित कर सकता है।

यह दृष्टिकोण इसलिए अच्छा काम करता है क्योंकि प्लेटें भोजन की फोटो में लगभग हमेशा मौजूद होती हैं, उनकी अंडाकार आकृति को किसी भी कैमरा कोण से पहचानना आसान होता है, और अंडाकार की परिप्रेक्ष्य विकृति वास्तव में कैमरा कोण के बारे में जानकारी को एन्कोड करती है, जो भोजन पर परिप्रेक्ष्य प्रभावों को सही करने में मदद करती है।

मात्रा अनुमान तकनीक

एक बार जब सिस्टम ने भोजन की पहचान कर ली, गहराई का अनुमान लगा लिया, और स्केल स्थापित कर लिया, तो इसे प्रत्येक खाद्य वस्तु की मात्रा का अनुमान लगाने के लिए इस जानकारी को संयोजित करना होगा।

ज्यामितीय प्राइमिटिव

एक दृष्टिकोण यह है कि खाद्य वस्तुओं का अनुमान सरल ज्यामितीय आकृतियों के संयोजन के रूप में लगाया जाए:

सिलेंडर ऊँचे खाद्य पदार्थों के लिए जैसे पेय, स्टैक्ड पैनकेक या लेयर्ड केक
आधा गोला गोल खाद्य पदार्थों के लिए जैसे चावल के स्कूप, मैश किए हुए आलू के ढेर, या आइसक्रीम के हिस्से
आयताकार प्रिज्म कटी हुई ब्रेड, पनीर के टुकड़े, या बार के लिए
कटे हुए शंकु सूप या अनाज के कटोरों के लिए (कटोरे का आकार मात्रा को परिभाषित करने में मदद करता है)
अनियमित बहुपरिमाण जटिल आकृतियों वाले खाद्य पदार्थों के लिए जैसे चिकन के पैर या पूरे फल

सिस्टम पहचान की गई खाद्य क्षेत्र पर इन प्राइमिटिव में से एक या अधिक को फिट करता है और फिट की गई आकृतियों और स्थापित स्केल से मात्रा की गणना करता है।

वॉक्सेल-आधारित पुनर्निर्माण

एक अधिक उन्नत दृष्टिकोण वॉक्सेल-आधारित पुनर्निर्माण है, जहाँ खाद्य वस्तु को छोटे घनों (वॉक्सेल) के तीन-आयामी ग्रिड के रूप में मॉडल किया जाता है। प्रत्येक वॉक्सेल को गहराई मानचित्र और विभाजन मास्क के आधार पर या तो भोजन या खाली के रूप में वर्गीकृत किया जाता है। कुल मात्रा फिर सभी खाद्य वॉक्सेल का योग होती है।

यह विधि ज्यामितीय प्राइमिटिव की तुलना में अनियमित आकृतियों को बेहतर तरीके से संभालती है लेकिन इसके लिए अधिक गणनात्मक संसाधनों की आवश्यकता होती है। यह विशेष रूप से उन खाद्य पदार्थों के लिए उपयोगी है जो सरल आकृतियों में नहीं आते, जैसे कि एक फटा हुआ ब्रेड का टुकड़ा या एक अनियमित रूप से कटा हुआ फल।

न्यूरल वॉल्यूम अनुमान

हालिया दृष्टिकोण स्पष्ट ज्यामितीय मॉडलिंग को पूरी तरह से छोड़ देता है। इसके बजाय, एक न्यूरल नेटवर्क को छवि से सीधे खाद्य मात्रा का अनुमान लगाने के लिए एंड-टू-एंड प्रशिक्षित किया जाता है। ये मॉडल बड़े डेटासेट से खाद्य ज्यामिति के अंतर्निहित प्रतिनिधित्व सीखते हैं, जिसमें खाद्य छवियों को वास्तविक वजन मापों के साथ जोड़ा जाता है।

यह दृष्टिकोण आशाजनक परिणाम दिखा चुका है क्योंकि यह मात्रा के साथ संबंधित सूक्ष्म दृश्य संकेतों को पकड़ सकता है, जैसे कि तरल की सतह पर प्रकाश का परावर्तन या भोजन के ढेर द्वारा डाले गए छाया पैटर्न। यह गहराई के अनुमान, विभाजन, और ज्यामितीय फिटिंग को अलग-अलग चरणों के रूप में करने पर होने वाली त्रुटियों के संचय से भी बचता है।

मात्रा से वजन और कैलोरी तक

वजन का अनुमान लगाना अंतिम कदम नहीं है। कैलोरी की गणना करने के लिए, सिस्टम को मात्रा को वजन में परिवर्तित करना होगा (भोजन के घनत्व का उपयोग करके) और वजन को कैलोरी में (पोषण संबंधी संरचना डेटा का उपयोग करके)।

खाद्य घनत्व डेटाबेस

विभिन्न खाद्य पदार्थों के घनत्व बहुत भिन्न होते हैं। एक कप तेल का वजन लगभग 220 ग्राम होता है, जबकि एक कप आटे का वजन लगभग 120 ग्राम होता है, और एक कप पॉपकॉर्न का वजन लगभग 8 ग्राम होता है। मात्रा के अनुमानों को वजन के अनुमानों में परिवर्तित करने के लिए सटीक घनत्व डेटा आवश्यक है।

उत्पादन प्रणाली खाद्य वस्तुओं को उनके घनत्व से मानचित्रित करने वाले डेटाबेस बनाए रखती हैं, जिसमें तैयारी विधि (पकाया हुआ बनाम कच्चा, कटा हुआ बनाम पूरा) और सामान्य सेवा शैलियों में भिन्नताओं का ध्यान रखा जाता है।

खाद्य वस्तु	घनत्व (ग्राम/मिलीलीटर)	1 कप वजन (ग्राम)	प्रति कप कैलोरी
पानी	1.00	237	0
संपूर्ण दूध	1.03	244	149
पका हुआ सफेद चावल	0.74	175	205
कच्चा पालक	0.13	30	7
मूंगफली का मक्खन	1.09	258	1517
जैतून का तेल	0.92	218	1909

पोषण संबंधी संरचना

एक बार जब सिस्टम के पास ग्राम में वजन का अनुमान होता है, तो यह व्यापक खाद्य डेटाबेस से प्रति ग्राम पोषण संबंधी संरचना की जानकारी देखता है। ये डेटाबेस आमतौर पर USDA FoodData Central जैसे प्राधिकृत स्रोतों से प्राप्त होते हैं, जिसमें खाद्य निर्माताओं और क्षेत्रीय पोषण डेटाबेस से डेटा जोड़ा जाता है।

Nutrola का डेटाबेस 1.3 मिलियन से अधिक खाद्य पदार्थों को कवर करता है, जिसमें ब्रांडेड उत्पाद, रेस्तरां के मेनू आइटम, और पूर्ण मैक्रो और माइक्रोन्यूट्रिएंट प्रोफाइल के साथ सामान्य खाद्य आइटम शामिल हैं। यह व्यापक कवरेज सुनिश्चित करता है कि एक बार जब किसी खाद्य वस्तु और हिस्से की पहचान हो जाती है, तो पोषण संबंधी गणना सटीक होती है।

सटीकता की चुनौतियाँ और उन्हें कैसे संबोधित किया जाता है

इन तकनीकों की जटिलता के बावजूद, फोटो से हिस्से का अनुमान लगाना एक अधूरा विज्ञान है। त्रुटियों के स्रोतों को समझना यथार्थवादी अपेक्षाएँ स्थापित करने में मदद करता है और इस क्षेत्र में चल रही सुधारों को उजागर करता है।

ज्ञात त्रुटियों के स्रोत

कैमरा कोण में भिन्नता: एक ही हिस्से की फोटो ऊपर से, 45 डिग्री के कोण से, या टेबल के स्तर के पास से ली गई हो, तो वह अलग दिखता है। शीर्ष-से-नीचे की फोटो आमतौर पर सबसे सटीक अनुमानों को उत्पन्न करती है क्योंकि वे परिप्रेक्ष्य विकृति को न्यूनतम करती हैं, लेकिन कई उपयोगकर्ता स्वाभाविक रूप से अपने फोन को कोण पर पकड़ते हैं।

छिपा हुआ भोजन: सॉस, पनीर, या अन्य टॉपिंग के नीचे छिपा हुआ भोजन दृश्य रूप से सीधे मापा नहीं जा सकता। सिस्टम को दृश्य डिश प्रकार और सामान्य तैयारी के आधार पर छिपे हुए हिस्से का अनुमान लगाना होता है।

अनियमित कंटेनर: गैर-मानक कटोरे, मग, और कंटेनर प्लेट-आधारित स्केलिंग को कम विश्वसनीय बनाते हैं। एक बड़े कटोरे में एक छोटा हिस्सा एक छोटे कटोरे में एक बड़े हिस्से से अलग दिखता है, भले ही खाद्य क्षेत्र समान दिखाई दे।

व्यक्तिगत तैयारी में भिन्नताएँ: दो लोग "ओटमील का एक कटोरा" बनाने में बहुत भिन्न मात्रा में ओट्स और पानी का उपयोग कर सकते हैं, जिससे समान प्रतीत होने वाली मात्रा में भिन्न कैलोरी सामग्री होती है।

सटीकता में सुधार के लिए रणनीतियाँ

मल्टी-एंगल कैप्चर: कुछ सिस्टम उपयोगकर्ताओं से कई कोणों से फोटो लेने के लिए कहते हैं, जिससे स्टीरियो पुनर्निर्माण और अधिक सटीक मात्रा का अनुमान लगाना संभव होता है। यह सटीकता में काफी सुधार करता है लेकिन लॉगिंग प्रक्रिया में बाधा डालता है।

उपयोगकर्ता फीडबैक लूप: जब उपयोगकर्ता अपने भोजन को तौलते हैं और अनुमानित हिस्से की पुष्टि या सुधार करते हैं, तो यह प्रशिक्षण डेटा बनाता है जो समय के साथ मॉडल को बेहतर बनाता है। Nutrola उपयोगकर्ताओं को कभी-कभी रसोई के पैमाने के साथ हिस्सों की पुष्टि करने के लिए प्रोत्साहित करता है ताकि AI और उपयोगकर्ता की अपनी हिस्से की जागरूकता को कैलिब्रेट किया जा सके।

संदर्भ प्राथमिकताएँ: सिस्टम संदर्भ जानकारी का उपयोग करके अनुमानों को परिष्कृत कर सकता है। यदि उपयोगकर्ता किसी विशेष रेस्तरां श्रृंखला में हैं, तो सिस्टम ज्ञात सेवा आकार का उपयोग कर सकता है। यदि उपयोगकर्ता नियमित रूप से एक विशेष नाश्ता लॉग करता है, तो सिस्टम उनके सामान्य हिस्से को सीख सकता है।

विश्वसनीयता-जानकारी वाले अनुमानों: एकल संख्या प्रस्तुत करने के बजाय, उन्नत सिस्टम विश्वसनीयता रेंज प्रदान करते हैं। यदि सिस्टम हिस्से के बारे में अनिश्चित है, तो यह अनुमान को एक रेंज के रूप में प्रस्तुत कर सकता है (उदाहरण के लिए, 300 से 450 कैलोरी) और उपयोगकर्ता से अतिरिक्त जानकारी प्रदान करने के लिए कह सकता है।

वर्तमान सटीकता मानक

International Conference on Image Analysis and Processing से अनुसंधान ने दिखाया है कि अत्याधुनिक खाद्य मात्रा अनुमान प्रणाली औसत प्रतिशत त्रुटियों के बीच 15 से 25 प्रतिशत तक पहुँचती हैं। संदर्भ के लिए, अध्ययनों ने दिखाया है कि प्रशिक्षित आहार विशेषज्ञ फोटो से हिस्सों का अनुमान लगाते समय लगभग 10 से 15 प्रतिशत की त्रुटियों को प्राप्त करते हैं, जबकि अप्रशिक्षित व्यक्तियों की औसत त्रुटियाँ 30 से 50 प्रतिशत होती हैं।

इसका मतलब है कि AI हिस्से का अनुमान पहले से ही अधिकांश लोगों की तुलना में काफी बेहतर है और प्रशिक्षित पेशेवरों की सटीकता के करीब पहुँच रहा है। गति और सुविधा के लाभ के साथ, यह AI-सहायता प्राप्त ट्रैकिंग को अधिकांश उपयोगकर्ताओं के लिए मैनुअल लॉगिंग की तुलना में एक महत्वपूर्ण सुधार बनाता है।

उपयोगकर्ता कैलिब्रेशन की भूमिका

AI हिस्से के अनुमान में एक कम सराहना की गई पहलू समय के साथ उपयोगकर्ता कैलिब्रेशन की भूमिका है। जैसे-जैसे उपयोगकर्ता भोजन लॉग करते हैं और कभी-कभी सुधार प्रदान करते हैं, सिस्टम उनके सामान्य हिस्से के आकार और खाद्य प्राथमिकताओं का एक प्रोफ़ाइल बनाता है।

नियमित उपयोगकर्ताओं के लिए, इसका मतलब है कि सिस्टम धीरे-धीरे अधिक सटीक होता जाता है। यदि आप औसत से बड़े हिस्से का चावल परोसने की प्रवृत्ति रखते हैं, तो सिस्टम आपके चावल के अनुमानों को ऊपर की ओर समायोजित करना सीखता है। यदि आप सामान्य नुस्खे की तुलना में कम तेल का उपयोग करते हैं, तो सिस्टम इसे ध्यान में रख सकता है।

Nutrola इस व्यक्तिगतकरण का लाभ उठाता है ताकि ऐप का उपयोग करने के दौरान हिस्से के अनुमान को लगातार अधिक अनुकूलित किया जा सके। नए उपयोगकर्ता जनसंख्या स्तर के औसत से लाभान्वित होते हैं, जबकि अनुभवी उपयोगकर्ताओं को उनके विशिष्ट आदतों के अनुसार कैलिब्रेट किए गए व्यक्तिगत अनुमानों का लाभ मिलता है।

अधिक सटीक हिस्से के अनुमानों के लिए व्यावहारिक सुझाव

हालांकि AI अधिकांश भारी उठाने का काम करता है, उपयोगकर्ता कुछ सरल दिशानिर्देशों का पालन करके सटीकता में सुधार कर सकते हैं:

संभव हो तो ऊपर से फोटो लें। शीर्ष-से-नीचे की फोटो भोजन की सतह क्षेत्र के बारे में सबसे अधिक जानकारी प्रदान करती है और परिप्रेक्ष्य विकृति को न्यूनतम करती है।
फ्रेम में पूरा प्लेट शामिल करें। प्लेट का किनारा स्केलिंग के लिए एक महत्वपूर्ण संदर्भ वस्तु के रूप में कार्य करता है।
अत्यधिक क्लोज़-अप से बचें। सिस्टम को आकार का अनुमान लगाने के लिए संदर्भ की आवश्यकता होती है। एक फोटो जो केवल भोजन को दिखाती है बिना किसी आस-पास की वस्तुओं के, कोई स्केल संदर्भ प्रदान नहीं करती।
मिश्रण से पहले फोटो लें। एक सलाद जिसमें अलग-अलग सामग्री स्पष्ट रूप से दिखाई देती हैं, उसे विश्लेषण करना आसान होता है बनिस्बत एक मिश्रित सलाद के।
अच्छी रोशनी का उपयोग करें। छायाएँ और कम रोशनी भोजन की सीमाओं और गहराई के संकेतों को अस्पष्ट कर सकती हैं।
कभी-कभी पुष्टि या सुधार करें। सप्ताह में एक बार रसोई के पैमाने का उपयोग करके AI अनुमान की पुष्टि करना सिस्टम और आपकी अपनी अंतर्दृष्टि को कैलिब्रेट करने में मदद करता है।

सामान्य प्रश्न

AI हिस्से का अनुमान खाद्य पैमाने की तुलना में कितना सटीक है?

एक खाद्य पैमाना 1 से 2 ग्राम के भीतर सटीकता प्रदान करता है, जो किसी भी दृश्य अनुमान विधि से कहीं अधिक सटीक है। फोटो से AI हिस्से का अनुमान आमतौर पर वास्तविक वजन के 15 से 25 प्रतिशत के भीतर सटीकता प्राप्त करता है। हालाँकि, AI अनुमान की सुविधा (जो 2 सेकंड में होती है जबकि पैमाने के साथ 30 सेकंड या उससे अधिक लगते हैं) का मतलब है कि अधिक लोग वास्तव में लगातार ट्रैक करते हैं, जो अक्सर दीर्घकालिक परिणामों के लिए सही सटीकता से अधिक महत्वपूर्ण होता है।

क्या कैमरा कोण हिस्से के अनुमान की सटीकता को प्रभावित करता है?

हाँ, काफी हद तक। शीर्ष-से-नीचे की फोटो (प्लेट पर सीधे देखने वाली) सबसे अच्छी सटीकता प्रदान करती है क्योंकि वे भोजन की पूरी सतह क्षेत्र को न्यूनतम परिप्रेक्ष्य विकृति के साथ दिखाती हैं। 45 डिग्री के कोण पर ली गई फोटो सबसे सामान्य होती हैं और फिर भी अच्छे अनुमानों का उत्पादन करती हैं। बहुत कम कोण (टेबल के स्तर के पास) सबसे कम सटीक होते हैं क्योंकि अधिकांश भोजन प्लेट के सामने के किनारे द्वारा छिपा होता है।

क्या AI तरल पदार्थों जैसे सूप और स्मूथीज के हिस्से का अनुमान लगा सकता है?

तरल पदार्थ एक अनूठी चुनौती प्रस्तुत करते हैं क्योंकि उनकी मात्रा उनके कंटेनर द्वारा निर्धारित होती है न कि उनके अपने आकार द्वारा। AI सिस्टम तरल हिस्सों का अनुमान लगाने के लिए कंटेनर के प्रकार और भरने के स्तर की पहचान करते हैं। एक कटोरी सूप जो भरपूर होती है, उसकी मात्रा एक आधी भरी कटोरी से भिन्न होती है। जब कंटेनर एक मानक आकार का होता है तो सटीकता आमतौर पर अच्छी होती है लेकिन असामान्य कंटेनरों के साथ कम विश्वसनीय होती है।

AI कभी-कभी मेरे हिस्से का अधिक या कम अनुमान क्यों लगाता है?

अधिक अनुमान लगाने के सामान्य कारणों में घनी प्लेटिंग शामिल होती है जो आकार में बड़ी दिखती है, सजावट जो दृश्य रूप से मात्रा बढ़ाती है लेकिन कैलोरी में महत्वपूर्ण नहीं होती, और बड़े प्लेटों का उपयोग जो सिस्टम को मानने पर मजबूर करते हैं कि अधिक भोजन मौजूद है। कम अनुमान लगाने के सामान्य कारणों में अन्य खाद्य पदार्थों के नीचे छिपा हुआ भोजन, घनी कैलोरी-समृद्ध खाद्य पदार्थ जो छोटे दिखते हैं, और असामान्य सेवा शैलियाँ शामिल हैं। जब अनुमानों में त्रुटियाँ होती हैं, तो फीडबैक प्रदान करने से सिस्टम में सुधार करने में मदद मिलती है।

क्या मुझे सटीक हिस्से के ट्रैकिंग के लिए LiDAR सेंसर वाला फोन चाहिए?

नहीं। जबकि LiDAR-सुसज्जित फोन अधिक सटीक गहराई की जानकारी प्रदान कर सकते हैं, आधुनिक AI मॉडल एक मानक कैमरा छवि से भी गहराई का अनुमान लगाने में काफी अच्छा कर सकते हैं। LiDAR-सुसज्जित और मानक फोन के बीच सटीकता का अंतर तब कम हो गया है जब सॉफ़्टवेयर-आधारित गहराई के अनुमान में सुधार हुआ है। Nutrola किसी भी आधुनिक स्मार्टफोन पर सटीकता से काम करता है।

सिस्टम उन खाद्य पदार्थों को कैसे संभालता है जो स्टैक्ड या लेयर्ड होते हैं?

स्पष्ट रूप से स्टैक्ड खाद्य पदार्थों जैसे पैनकेक या लेयर्ड सैंडविच के लिए, सिस्टम परतों की गिनती कर सकता है और साइड प्रोफ़ाइल से मोटाई का अनुमान लगा सकता है। छिपी परतों वाले खाद्य पदार्थों जैसे लसग्ना या बुरिटोस के लिए, सिस्टम दृश्य बाहरी और डिश प्रकार के आधार पर सामान्य संरचना मॉडल का उपयोग करके अनुमान लगाता है।

क्या आप अपने पोषण ट्रैकिंग को बदलने के लिए तैयार हैं?

उन हजारों में शामिल हों जिन्होंने Nutrola के साथ अपनी स्वास्थ्य यात्रा को बदल दिया!