Nutrola रिसर्च लैब: हम AI खाद्य पहचान सटीकता को प्रयोगशाला विश्लेषण के खिलाफ कैसे मान्य करते हैं
Nutrola रिसर्च लैब की विधियों की विस्तृत जानकारी, जिसमें प्रयोगशाला द्वारा विश्लेषित संदर्भ भोजन, अंधे परीक्षण प्रोटोकॉल, USDA डेटा के खिलाफ क्रॉस-मान्यता, और पारदर्शी सटीकता रिपोर्टिंग शामिल है।
AI पोषण ट्रैकिंग सिस्टम पर भरोसा करने का मतलब एक ही सवाल से है: यह जो आंकड़े देता है, वे वास्तविकता के कितने करीब हैं? अगर कोई सिस्टम 450 कैलोरी की रिपोर्ट करता है जबकि वास्तविक संख्या 620 है, तो यह न केवल गलत है; यह उस डेटा पर आधारित हर आहार निर्णय को कमजोर करता है। Nutrola में, हम मानते हैं कि पारदर्शी विधियों के बिना सटीकता के दावे बेकार हैं।
यह लेख स्पष्ट रूप से बताता है कि Nutrola रिसर्च लैब खाद्य पहचान सटीकता को कैसे मान्य करती है। हम अपने परीक्षण प्रोटोकॉल, संदर्भ मानकों के बारे में बताते हैं, हम त्रुटियों को कैसे वर्गीकृत और कम करते हैं, और जो मैट्रिक्स हम प्रकाशित करते हैं। हमारा लक्ष्य उपयोगकर्ताओं, आहार विशेषज्ञों, डेवलपर्स, और शोधकर्ताओं को यह स्पष्ट समझ देना है कि हमारे संदर्भ में "सटीकता" का क्या अर्थ है और हम इसे सुधारने के लिए क्या करते हैं।
मान्यता का महत्व
अधिकांश पोषण ऐप्स सटीकता की रिपोर्ट करते हैं, जो आंतरिक बेंचमार्क का उपयोग करते हैं, जो अनुकूलित होते हैं ताकि अच्छे परिणाम मिल सकें। एक सामान्य प्रथा यह है कि वे उसी डेटा सेट के एक हिस्से पर परीक्षण करते हैं जिसका उपयोग प्रशिक्षण के लिए किया गया है, जिससे inflated सटीकता के आंकड़े मिलते हैं जो वास्तविक प्रदर्शन को नहीं दर्शाते। एक मॉडल अपने स्वयं के परीक्षण सेट पर 95 प्रतिशत सटीकता प्राप्त कर सकता है, जबकि यह उन खाद्य पदार्थों के साथ संघर्ष कर रहा है जो उसके उपयोगकर्ता वास्तव में खाते हैं।
सही मान्यता के लिए स्वतंत्र ग्राउंड ट्रुथ के खिलाफ परीक्षण करना आवश्यक है, जिसमें पूर्व-प्रविष्ट प्रोटोकॉल का उपयोग किया जाता है जो पूर्वाग्रह को कम करता है। चिकित्सा और वैज्ञानिक संदर्भों में, इसे विश्लेषणात्मक मान्यता कहा जाता है, और इसमें सिस्टम के आउटपुट की तुलना ज्ञात संदर्भ मानक के खिलाफ की जाती है। Nutrola रिसर्च लैब इस सिद्धांत को खाद्य पहचान पर लागू करती है।
हमारा संदर्भ मानक: प्रयोगशाला द्वारा विश्लेषित भोजन
हम संदर्भ भोजन कैसे बनाते हैं
हमारी मान्यता प्रक्रिया की नींव प्रयोगशाला-प्रमाणित पोषण संरचना के साथ संदर्भ भोजन की एक लाइब्रेरी है। हम इन्हें कैसे बनाते हैं:
भोजन का चयन: हम ऐसे भोजन का चयन करते हैं जो Nutrola उपयोगकर्ताओं द्वारा ट्रैक किए गए खाद्य पदार्थों की विविधता का प्रतिनिधित्व करता है। इसमें सामान्य भोजन (चावल के साथ ग्रिल्ड चिकन, टमाटर सॉस के साथ पास्ता), जटिल बहु-घटक व्यंजन (बिबिम्बाप, मिश्रित थाली), चुनौतीपूर्ण मामले (सूप, स्मूदी, भारी सॉस वाले व्यंजन), और कम प्रतिनिधित्व वाले व्यंजनों के आइटम शामिल हैं।
तैयारी और वजन: प्रत्येक भोजन को हमारे परीक्षण रसोई में तैयार किया जाता है या रेस्तरां से प्राप्त किया जाता है। प्रत्येक सामग्री को कैलिब्रेटेड प्रयोगशाला तराजू पर (0.1 ग्राम की पठनीयता) वजन किया जाता है। खाना पकाने के तेल, सॉस, मसाले, और सजावट को सटीकता से मापा जाता है।
फोटोग्राफी: तैयार भोजन की कई परिस्थितियों में फोटो खींची जाती है:
- नियंत्रित प्रकाश (5500K दिन का प्रकाश, फैलाया हुआ)
- प्राकृतिक दिन का प्रकाश (परिवर्तनीय परिस्थितियां)
- इनडोर कृत्रिम प्रकाश (फ्लोरोसेंट, इंकैंडेसेंट, गर्म LED)
- कई कोण (ऊपर से, 45 डिग्री, आंख के स्तर)
- कई उपकरण (हाल का iPhone, Samsung Galaxy, Pixel, मध्य-स्तरीय Android)
- विभिन्न दूरी और रचनाएं
प्रत्येक भोजन इन परिस्थितियों में 15 से 30 फोटोग्राफ उत्पन्न करता है, जो वास्तविक दुनिया की फोटोग्राफिक विविधता को दर्शाता है।
प्रयोगशाला विश्लेषण: उच्चतम सटीकता संदर्भ की आवश्यकता वाले भोजन के एक उपसमुच्चय के लिए, हम तैयार नमूनों को एक प्रमाणित खाद्य विश्लेषण प्रयोगशाला में भेजते हैं (AOAC International विधियों का उपयोग करते हुए)। प्रयोगशाला निम्नलिखित मापती है:
- कुल ऊर्जा (बम कैलोरीमेट्री)
- प्रोटीन (Kjeldahl या Dumas दहन विधि)
- कुल वसा (अम्ल हाइड्रोलिसिस के बाद Soxhlet निष्कर्षण)
- कार्बोहाइड्रेट (फर्क द्वारा: कुल वजन से प्रोटीन, वसा, नमी, और राख घटाना)
- आहार फाइबर (एंजाइमेटिक-ग्रैविमेट्रिक विधि)
- नमी और राख सामग्री
गणना की गई संदर्भ मान: उन भोजन के लिए जहां प्रयोगशाला विश्लेषण नहीं किया गया है, हम सामग्री के वजन से USDA FoodData Central (SR Legacy और FNDDS डेटाबेस) और ब्रांडेड उत्पादों के सत्यापित निर्माता डेटा का उपयोग करके संदर्भ पोषण मानों की गणना करते हैं। ये गणना की गई मान द्वितीयक संदर्भ मानक के रूप में कार्य करती हैं।
संदर्भ भोजन लाइब्रेरी का आकार
Q1 2026 के अनुसार, Nutrola रिसर्च लैब संदर्भ लाइब्रेरी में शामिल हैं:
| श्रेणी | संख्या |
|---|---|
| गणना किए गए संदर्भ मानों के साथ अद्वितीय भोजन | 4,200+ |
| प्रयोगशाला द्वारा विश्लेषित संदर्भ मानों के साथ अद्वितीय भोजन | 680+ |
| कुल संदर्भ फोटोग्राफ | 78,000+ |
| प्रतिनिधित्व किए गए व्यंजन | 42 |
| कवर किए गए आहार पैटर्न (केटो, शाकाहारी, हलाल, आदि) | 18 |
हम हर महीने लगभग 50 नए संदर्भ भोजन जोड़ते हैं और मौजूदा भोजन को अपडेट किए गए मॉडलों के खिलाफ तिमाही रूप से फिर से परीक्षण करते हैं।
अंधा परीक्षण प्रोटोकॉल
इस संदर्भ में "अंधा" का क्या अर्थ है
हमारा परीक्षण प्रोटोकॉल यह सुनिश्चित करने के लिए डिज़ाइन किया गया है कि मॉडल परीक्षण भोजन पर कोई अनुचित लाभ न हो। हम तीन स्तरों का पृथक्करण लागू करते हैं:
डेटा पृथक्करण: कोई भी संदर्भ भोजन फोटो कभी भी किसी प्रशिक्षण डेटा सेट में नहीं दिखाई दिया है। हम परीक्षण लाइब्रेरी और प्रशिक्षण डेटा के बीच एक सख्त एयर गैप बनाए रखते हैं, जिसे हैश-आधारित डेडुप्लिकेशन और एक अलग संग्रहण प्रणाली के माध्यम से लागू किया जाता है जिसमें पहुंच नियंत्रण होते हैं।
मूल्यांकनकर्ता अंधापन: संदर्भ भोजन तैयार करने और फोटो खींचने वाली टीम के सदस्य मॉडल विकसित करने और प्रशिक्षित करने वाली टीम के सदस्यों से अलग होते हैं। मॉडल डेवलपर्स परीक्षण लाइब्रेरी को तब तक नहीं देखते जब तक परिणाम प्रकाशित नहीं होते।
स्वचालित मूल्यांकन: एक बार जब फोटोग्राफ कैप्चर कर लिए जाते हैं और संदर्भ मान रिकॉर्ड कर लिए जाते हैं, तो मूल्यांकन पाइपलाइन स्वचालित रूप से चलती है। फोटोग्राफों को उत्पादन API (वही अंत बिंदु जो वास्तविक उपयोगकर्ताओं को सेवा देता है) पर बिना किसी विशेष ध्वज, हेडर, या पूर्व-प्रसंस्करण के प्रस्तुत किया जाता है। परिणामों की तुलना संदर्भ मानों से प्रोग्रामेटिक रूप से की जाती है, जिससे व्यक्तिपरक निर्णय समाप्त हो जाते हैं।
परीक्षण की आवृत्ति
हम तीन प्रकार के मान्यता परीक्षण करते हैं:
निरंतर रिग्रेशन परीक्षण: हर मॉडल अपडेट को तैनाती से पहले पूर्ण संदर्भ लाइब्रेरी के खिलाफ मूल्यांकन किया जाता है। यदि कोई मॉडल किसी प्रमुख खाद्य श्रेणी में गिरावट करता है, तो इसे तब तक तैनात नहीं किया जाता जब तक कि गिरावट का समाधान नहीं हो जाता। यह हर मॉडल रिलीज के साथ होता है, आमतौर पर हर एक से दो सप्ताह में।
तिमाही व्यापक मूल्यांकन: हर तिमाही, हम एक पूर्ण मूल्यांकन करते हैं जिसमें नए जोड़े गए संदर्भ भोजन, सभी श्रेणियों में अद्यतन सटीकता मैट्रिक्स, पिछले तिमाहियों की तुलना, और त्रुटि पैटर्न का विश्लेषण शामिल होता है।
वार्षिक बाहरी ऑडिट: साल में एक बार, हम एक स्वतंत्र तीसरे पक्ष के मूल्यांकनकर्ता (एक विश्वविद्यालय खाद्य विज्ञान विभाग या एक स्वतंत्र परीक्षण प्रयोगशाला) को शामिल करते हैं ताकि वे अपने तरीके से तैयार और फोटो खींचे गए भोजन के एक उपसमुच्चय के लिए हमारे प्रोटोकॉल का उपयोग करें। यह हमारे अपने भोजन तैयारी या फोटोग्राफी प्रथाओं में प्रणालीगत पूर्वाग्रहों से बचाता है।
हम सटीकता को कैसे मापते हैं
खाद्य पहचान मैट्रिक्स
टॉप-1 सटीकता: परीक्षण छवियों का प्रतिशत जहां मॉडल की उच्चतम-विश्वास भविष्यवाणी संदर्भ खाद्य लेबल से मेल खाती है। हम इसे तीन स्तरों पर रिपोर्ट करते हैं:
- समग्र (सभी खाद्य श्रेणियाँ)
- प्रति-व्यंजन (जैसे, जापानी, मैक्सिकन, भारतीय, इटालियन)
- प्रति-कोशिश स्तर (सरल एकल-आइटम, बहु-घटक प्लेट, मिश्रित व्यंजन)
टॉप-3 सटीकता: परीक्षण छवियों का प्रतिशत जहां सही खाद्य लेबल मॉडल की शीर्ष तीन भविष्यवाणियों में दिखाई देता है। यह प्रासंगिक है क्योंकि कई अस्पष्ट मामलों (जैसे, क्रीम ऑफ मशरूम सूप बनाम क्रीम ऑफ चिकन सूप) को उपयोगकर्ता चयन से हल किया जाता है।
डिटेक्शन रिकॉल: बहु-आइटम प्लेटों के लिए, संदर्भ में मौजूद व्यक्तिगत खाद्य आइटम का प्रतिशत जो मॉडल द्वारा पहचाना जाता है। एक प्लेट जिसमें चिकन, चावल, और ब्रोकोली है, जहां मॉडल चिकन और चावल को पहचानता है लेकिन ब्रोकोली को चूक जाता है, उसकी डिटेक्शन रिकॉल 66.7 प्रतिशत है।
पोषण सटीकता मैट्रिक्स
मीन एब्सोल्यूट एरर (MAE): भविष्यवाणी किए गए और संदर्भ पोषण मानों के बीच का औसत निरपेक्ष अंतर, जो मैक्रोन्यूट्रिएंट्स के लिए ग्राम में और ऊर्जा के लिए किलो कैलोरी में रिपोर्ट किया जाता है।
मीन एब्सोल्यूट पर्सेंटेज एरर (MAPE): MAE को संदर्भ मान के प्रतिशत के रूप में व्यक्त किया जाता है। यह विभिन्न भाग आकारों और कैलोरी घनत्वों के बीच सामान्यीकृत करता है। हम कैलोरी, प्रोटीन, कार्बोहाइड्रेट, वसा, और फाइबर के लिए MAPE को अलग से रिपोर्ट करते हैं।
कोरिलेशन गुणांक (r): परीक्षण सेट में भविष्यवाणी किए गए और संदर्भ मानों के बीच का पियर्सन कोरिलेशन। उच्च कोरिलेशन (r > 0.90) यह दर्शाता है कि मॉडल विश्वसनीय रूप से भोजन को कम से अधिक कैलोरी/पोषण सामग्री के क्रम में रैंक करता है, भले ही निरपेक्ष मानों में कुछ अंतर हो।
ब्लैंड-आल्टमैन विश्लेषण: पोषण अनुमान के लिए, हम भविष्यवाणी किए गए और संदर्भ मानों के बीच सहमति को दृश्य रूप से प्रदर्शित करने के लिए ब्लैंड-आल्टमैन प्लॉट का उपयोग करते हैं। यह विधि, जो नैदानिक विधि-तुलना अध्ययनों में मानक है, यह प्रकट करती है कि क्या त्रुटियाँ मानों की श्रृंखला में सुसंगत हैं (समान पूर्वाग्रह) या क्या सटीकता बहुत छोटे या बहुत बड़े भागों के लिए घटती है (अनुपात पूर्वाग्रह)।
वर्तमान सटीकता बेंचमार्क (Q1 2026)
| मैट्रिक | समग्र | सरल आइटम | बहु-घटक | मिश्रित व्यंजन |
|---|---|---|---|---|
| टॉप-1 खाद्य पहचान सटीकता | 89.3% | 94.1% | 87.6% | 78.4% |
| टॉप-3 खाद्य पहचान सटीकता | 96.1% | 98.7% | 95.2% | 90.3% |
| डिटेक्शन रिकॉल (बहु-आइटम) | 91.8% | N/A | 91.8% | 85.2% |
| कैलोरी MAPE | 17.2% | 12.8% | 18.4% | 24.6% |
| प्रोटीन MAPE | 19.8% | 14.3% | 21.2% | 27.1% |
| कार्बोहाइड्रेट MAPE | 18.5% | 13.6% | 19.7% | 25.8% |
| वसा MAPE | 22.4% | 16.1% | 23.8% | 31.2% |
| कैलोरी कोरिलेशन (r) | 0.94 | 0.97 | 0.93 | 0.88 |
नोट्स: "सरल आइटम" एकल-खाद्य छवियाँ हैं (जैसे, एक सेब, ओटमील का एक कटोरा)। "बहु-घटक" प्लेटों में दो या दो से अधिक अलग, दृश्य रूप से अलग आइटम होते हैं। "मिश्रित व्यंजन" वे आइटम हैं जहां सामग्री को मिलाया जाता है (सूप, कैसरोल, करी, स्मूदी)। वसा MAPE लगातार सबसे उच्च त्रुटि मैट्रिक है क्योंकि खाना पकाने में उपयोग किए जाने वाले वसा को दृश्य रूप से पहचानना सबसे कठिन होता है।
त्रुटि वर्गीकरण
त्रुटियों के स्थान को समझना उनकी मात्रा को मापने के समान महत्वपूर्ण है। हम त्रुटियों को पांच प्रकारों में वर्गीकृत करते हैं:
प्रकार 1: गलत पहचान
मॉडल पूरी तरह से गलत खाद्य पदार्थ की पहचान करता है। उदाहरण: थाई बासिल चिकन को कुंग पाओ चिकन के रूप में वर्गीकृत करना। ये त्रुटियाँ पहचान सटीकता और पोषण अनुमान दोनों को प्रभावित करती हैं। गलत पहचान त्रुटियाँ 2024 में सभी भविष्यवाणियों का 15.2 प्रतिशत से घटकर Q1 2026 में 10.7 प्रतिशत हो गई हैं।
प्रकार 2: भाग अनुमान त्रुटि
खाद्य पदार्थ सही ढंग से पहचाना गया है लेकिन भाग का अनुमान काफी गलत है। उदाहरण: पास्ता को सही ढंग से पहचानना लेकिन 200 ग्राम का अनुमान लगाना जबकि वास्तविक वजन 140 ग्राम है। भाग त्रुटियाँ कैलोरी MAPE में सबसे बड़ा योगदान करती हैं, जो कुल पोषण त्रुटि बजट का लगभग 55 प्रतिशत है।
प्रकार 3: घटक की कमी
मॉडल उस खाद्य आइटम का पता लगाने में असफल होता है जो छवि में मौजूद है। उदाहरण: सलाद पर डाले गए जैतून के तेल का पता नहीं लगाना, या एक छोटे साइड सॉस को छोड़ देना। ये त्रुटियाँ प्रणालीगत कमियों का कारण बनती हैं और विशेष रूप से कैलोरी-घनी वस्तुओं के लिए समस्याग्रस्त होती हैं जो दृश्य रूप से सूक्ष्म हो सकती हैं।
प्रकार 4: तैयारी विधि त्रुटि
खाद्य पदार्थ को आइटम स्तर पर सही ढंग से पहचाना जाता है लेकिन तैयारी विधि गलत होती है। उदाहरण: चिकन ब्रेस्ट को सही ढंग से पहचानना लेकिन इसे ग्रिल किया हुआ वर्गीकृत करना जबकि यह तेल में पैन-फ्राइड है। तैयारी विधि त्रुटियाँ वसा के अनुमानों को असमान रूप से प्रभावित करती हैं क्योंकि खाना पकाने के तरीके वसा की मात्रा को नाटकीय रूप से बदल देते हैं।
प्रकार 5: डेटाबेस मैपिंग त्रुटि
खाद्य पदार्थ को सही ढंग से पहचाना गया है और भाग का अनुमान उचित है, लेकिन जिस पोषण डेटाबेस प्रविष्टि से इसे मैप किया गया है, वह विशिष्ट संस्करण का सही प्रतिनिधित्व नहीं करती। उदाहरण: एक रेस्तरां के लहसुन ब्रेड को एक सामान्य लहसुन ब्रेड प्रविष्टि से मैप करना जो रेस्तरां के अतिरिक्त मक्खन के उपयोग को ध्यान में नहीं रखती। इन त्रुटियों को डेटाबेस विस्तार और रेस्तरां-विशिष्ट प्रविष्टियों के माध्यम से संबोधित किया जाता है।
त्रुटि वितरण (Q1 2026)
| त्रुटि प्रकार | आवृत्ति | कैलोरी त्रुटि में योगदान |
|---|---|---|
| प्रकार 1: गलत पहचान | 10.7% भविष्यवाणियों का | 22% कैलोरी त्रुटि का |
| प्रकार 2: भाग अनुमान | 34.2% भविष्यवाणियों का | 55% कैलोरी त्रुटि का |
| प्रकार 3: घटक की कमी | 8.3% भविष्यवाणियों का | 11% कैलोरी त्रुटि का |
| प्रकार 4: तैयारी विधि | 5.8% भविष्यवाणियों का | 8% कैलोरी त्रुटि का |
| प्रकार 5: डेटाबेस मैपिंग | 3.1% भविष्यवाणियों का | 4% कैलोरी त्रुटि का |
हम त्रुटियों को कैसे कम करते हैं
निरंतर मॉडल सुधार
हमारी प्राथमिक त्रुटि कमी रणनीति सक्रिय लर्निंग पाइपलाइन है। जब उपयोगकर्ता खाद्य पहचान को सही करते हैं या भाग के आकार को समायोजित करते हैं, तो वह सुधार एक मान्यता कतार में प्रवेश करता है। जो सुधार ज्ञात पोषण प्रोफाइल के साथ संगत होते हैं (जैसे, सही की गई आइटम की कैलोरी घनत्व एक संभाव्य सीमा के भीतर होती है) उन्हें अगले मॉडल अपडेट के लिए प्रशिक्षण डेटा सेट में शामिल किया जाता है।
हम हर सप्ताह अपने पहचान मॉडलों को फिर से प्रशिक्षित करते हैं। प्रत्येक अपडेट में नए उपयोगकर्ता-मान्य सुधार, शोध लैब से नए संदर्भ चित्र, और कठिन नकारात्मक खनन (विशेष रूप से उन खाद्य युग्मों को लक्षित करना जिन्हें मॉडल अक्सर भ्रमित करता है) शामिल होते हैं।
लक्षित सटीकता सुधार कार्यक्रम
जब हमारी तिमाही मूल्यांकन किसी श्रेणी में लक्ष्य से कम सटीकता का खुलासा करता है, तो हम एक लक्षित सुधार कार्यक्रम शुरू करते हैं:
- कम प्रदर्शन करने वाली श्रेणी के लिए अतिरिक्त प्रशिक्षण डेटा एकत्र करें
- विशिष्ट त्रुटि पैटर्न का विश्लेषण करें (क्या यह गलत पहचान, भाग अनुमान, या डेटाबेस मैपिंग है?)
- लक्षित सुधार लागू करें (अतिरिक्त प्रशिक्षण डेटा, मॉडल आर्किटेक्चर समायोजन, डेटाबेस अपडेट)
- संदर्भ लाइब्रेरी के खिलाफ सुधार का मान्यता करें
- तैनात करें और निगरानी करें
2025 में, हमने दक्षिण-पूर्व एशियाई करी, मैक्सिकन स्ट्रीट फूड, और मध्य पूर्वी मेज़े प्लेटर्स के लिए लक्षित कार्यक्रम चलाए, प्रत्येक श्रेणी में 8-14 प्रतिशत बिंदु सटीकता सुधार प्राप्त किया।
USDA क्रॉस-मान्यता
हमारे डेटाबेस में हर खाद्य पदार्थ के लिए, हम USDA FoodData Central के खिलाफ पोषण मानों की क्रॉस-मान्यता करते हैं। जब Nutrola की भविष्यवाणी की गई पोषण मान किसी सही पहचान किए गए खाद्य पदार्थ के लिए USDA संदर्भ मान से 15 प्रतिशत से अधिक भिन्न होती है, तो सिस्टम भविष्यवाणी की समीक्षा के लिए इसे चिह्नित करता है।
यह क्रॉस-मान्यता दो प्रकार की समस्याओं को पकड़ती है:
- मॉडल की भविष्यवाणियाँ जो तकनीकी रूप से सही पहचान हैं लेकिन गलत डेटाबेस प्रविष्टियों से मैप की गई हैं
- डेटाबेस प्रविष्टियाँ जो त्रुटियों या पुरानी हैं
हम अपने पोषण डेटाबेस को मासिक रूप से अपडेट करते हैं, जिसमें USDA FoodData Central के अपडेट, निर्माता उत्पाद परिवर्तनों, और क्रॉस-मान्यता के माध्यम से पहचानी गई सुधार शामिल हैं।
उपयोगकर्ता फीडबैक गुणवत्ता नियंत्रण
सभी उपयोगकर्ता सुधार समान रूप से विश्वसनीय नहीं होते। एक उपयोगकर्ता जो "सफेद चावल" को "फूलगोभी चावल" में बदलता है, वह एक महत्वपूर्ण सुधार कर रहा है। एक उपयोगकर्ता जो भाग के आकार को यादृच्छिक रूप से बदलता है, वह शोर पेश कर सकता है। हम गुणवत्ता नियंत्रण फ़िल्टर लागू करते हैं:
- जिन उपयोगकर्ताओं के पास लगातार ट्रैकिंग इतिहास होता है, उनके सुधारों का अधिक वजन होता है
- एक ही खाद्य आइटम के लिए कई उपयोगकर्ताओं द्वारा पुष्टि किए गए सुधारों को प्राथमिकता दी जाती है
- सुधार जो पोषण के लिए असंभव मान (जैसे, 2,000 कैलोरी वाला सलाद) का परिणाम देंगे, उन्हें मैनुअल समीक्षा के लिए चिह्नित किया जाता है
- हम संभावित रूप से गलत सुधारों की पहचान करने के लिए सांख्यिकीय आउटलेयर पहचान का उपयोग करते हैं
पारदर्शिता और सीमाएँ
हम क्या प्रकाशित करते हैं
Nutrola रिसर्च लैब निम्नलिखित जानकारी प्रकाशित करती है:
- सभी श्रेणियों में तिमाही सटीकता मैट्रिक्स (जैसा कि ऊपर की तालिकाओं में दिखाया गया है)
- वर्ष-दर-वर्ष सटीकता प्रवृत्तियाँ
- ज्ञात सीमाएँ और चुनौतीपूर्ण खाद्य श्रेणियाँ
- हमारी परीक्षण विधि (यह लेख)
ज्ञात सीमाएँ जिनके बारे में हम पारदर्शी हैं
छिपी हुई सामग्री सबसे बड़ी अनियंत्रित त्रुटि स्रोत बनी हुई है। खाना पकाने के दौरान जो तेल, मक्खन, चीनी, और नमक जोड़े जाते हैं, वे तस्वीरों में अदृश्य होते हैं। हमारे मॉडल छिपी सामग्री के योगदान का अनुमान लगाने के लिए तैयारी विधि पूर्वाग्रहों का उपयोग करते हैं, लेकिन ये सांख्यिकीय औसत होते हैं जो किसी विशेष रेस्तरां या घरेलू रसोइये की प्रथाओं से मेल नहीं खा सकते।
समरूप खाद्य पदार्थ (सूप, स्मूदी, प्यूरी) की त्रुटि दर अधिक होती है। जब दृश्य विशेषताएँ सीमित होती हैं, तो मॉडल संदर्भ संकेतों और उपयोगकर्ता इनपुट पर बहुत अधिक निर्भर करता है। हम स्पष्ट रूप से ऐप में इन श्रेणियों के लिए कम विश्वास को संप्रेषित करते हैं।
रेस्तरां के भोजन स्वाभाविक रूप से घर के बने भोजन की तुलना में कठिन होते हैं। मानकीकृत व्यंजन स्थान, शेफ, और दिन के अनुसार भिन्न होते हैं। एक रेस्तरां का सीज़र सलाद दूसरे रेस्तरां के संस्करण की तुलना में ड्रेसिंग में दोगुना हो सकता है, और न ही USDA सामान्य प्रविष्टि से मेल खा सकता है।
कम प्रशिक्षण डेटा वाले व्यंजनों के लिए सटीकता कम होती है। जबकि हम सक्रिय रूप से अपने कवरेज का विस्तार करते हैं, कुछ क्षेत्रीय व्यंजनों (केंद्रीय अफ्रीकी, केंद्रीय एशियाई, प्रशांत द्वीप) के पास कम प्रशिक्षण उदाहरण होते हैं और तदनुसार कम सटीकता होती है। हम विश्वास संकेतक प्रदर्शित करते हैं ताकि उपयोगकर्ता देख सकें कि जब मॉडल कम निश्चित होता है।
सटीकता सुधार की प्रवृत्ति
पिछले 18 महीनों में, Nutrola की खाद्य पहचान सटीकता ने एक निरंतर सुधार प्रवृत्ति का पालन किया है:
| तिमाही | टॉप-1 सटीकता | कैलोरी MAPE | प्रमुख सुधार |
|---|---|---|---|
| Q3 2024 | 82.1% | 23.8% | आर्किटेक्चर अपग्रेड के बाद का आधार |
| Q4 2024 | 84.7% | 21.4% | एशियाई व्यंजन प्रशिक्षण डेटा का विस्तार |
| Q1 2025 | 86.3% | 20.1% | LiDAR-संवर्धित भाग अनुमान |
| Q2 2025 | 87.5% | 19.2% | फाउंडेशन मॉडल बैकबोन अपग्रेड |
| Q3 2025 | 88.1% | 18.6% | मल्टी-मोडल संदर्भ एकीकरण |
| Q4 2025 | 88.9% | 17.8% | बेहतर मिश्रित-व्यंजन विघटन |
| Q1 2026 | 89.3% | 17.2% | व्यक्तिगत मॉडल अनुकूलन |
इस स्तर पर प्रत्येक प्रतिशत सुधार के लिए पिछले एक की तुलना में exponentially अधिक प्रयास की आवश्यकता होती है। शेष त्रुटियाँ सबसे कठिन मामलों में केंद्रित होती हैं: दृश्य रूप से अस्पष्ट व्यंजन, छिपी सामग्री, असामान्य भाग आकार, और दुर्लभ खाद्य पदार्थ। निरंतर प्रगति के लिए बेहतर मॉडलों और बेहतर संदर्भ डेटा की आवश्यकता होती है।
अक्सर पूछे जाने वाले प्रश्न
Nutrola की सटीकता की तुलना प्रतिस्पर्धियों से कैसे की जाती है?
प्रत्यक्ष तुलना करना कठिन है क्योंकि अधिकांश प्रतिस्पर्धी अपनी मान्यता विधि या सटीकता मैट्रिक्स को समान स्तर की विस्तृतता के साथ प्रकाशित नहीं करते। सार्वजनिक बेंचमार्क जैसे Food-101 और ISIA Food-500 पर, Nutrola का मॉडल प्रकाशित परिणामों के शीर्ष स्तर में प्रदर्शन करता है। हमारी वास्तविक दुनिया की सटीकता, प्रयोगशाला द्वारा विश्लेषित भोजन के खिलाफ मान्य की गई, वही है जो हम अधिक महत्वपूर्ण मैट्रिक मानते हैं, और हम अन्य कंपनियों को समान मान्यता प्रथाओं को अपनाने के लिए प्रोत्साहित करते हैं।
वसा का अनुमान प्रोटीन या कार्बोहाइड्रेट के अनुमान की तुलना में कम सटीक क्यों है?
वसा का अनुमान दृश्य रूप से करना सबसे कठिन मैक्रोन्यूट्रिएंट है क्योंकि इसका अधिकांश भाग छिपा होता है। खाना पकाने के तेल जो भोजन में अवशोषित होते हैं, सॉस में पिघला हुआ मक्खन, और मांस में वसा की मर्मरता तस्वीरों में अदृश्य या लगभग अदृश्य होती है। इसके अतिरिक्त, वसा की कैलोरी घनत्व सबसे अधिक होती है (9 kcal/g बनाम प्रोटीन और कार्बोहाइड्रेट के लिए 4 kcal/g), इसलिए वसा ग्राम में छोटे अनुमान त्रुटियाँ बड़े कैलोरी त्रुटियों में परिवर्तित होती हैं।
आप उन खाद्य पदार्थों के साथ कैसे व्यवहार करते हैं जो आपके डेटाबेस में नहीं हैं?
जब मॉडल किसी खाद्य पदार्थ का वर्गीकरण करने में पर्याप्त विश्वास नहीं रखता है, तो यह उपयोगकर्ता को अपनी सर्वश्रेष्ठ भविष्यवाणियाँ प्रस्तुत करता है और मैन्युअल रूप से खोजने या आइटम दर्ज करने का विकल्प देता है। ये कम विश्वास वाले मुठभेड़ लॉग किए जाते हैं और भविष्य के प्रशिक्षण डेटा में शामिल करने के लिए प्राथमिकता दी जाती हैं। यदि कोई विशेष पहचान न होने वाला खाद्य पदार्थ कई उपयोगकर्ताओं के बीच बार-बार दिखाई देता है, तो इसे पहचान मॉडल और पोषण डेटाबेस दोनों में जोड़ने के लिए तेजी से प्राथमिकता दी जाती है।
क्या मैं अपने विशेष आहार के लिए सटीकता पर भरोसा कर सकता हूँ?
सटीकता खाद्य प्रकार के अनुसार भिन्न होती है, जैसा कि हमारे प्रकाशित मैट्रिक्स में दिखाया गया है। यदि आप मुख्य रूप से सरल, स्पष्ट भोजन (ग्रिल्ड प्रोटीन, साधारण अनाज, ताजे सब्जियाँ) खाते हैं, तो आप हमारी रेंज के उच्च अंत में सटीकता की अपेक्षा कर सकते हैं। यदि आप अक्सर जटिल मिश्रित व्यंजन, रेस्तरां के भोजन जो अज्ञात तैयारी विधियों के साथ होते हैं, या कम प्रशिक्षण डेटा वाले व्यंजनों के खाद्य पदार्थ खाते हैं, तो सटीकता निम्न अंत में होगी। Nutrola ऐप में विश्वास संकेतक इस परिवर्तनशीलता को प्रति-भविष्यवाणी आधार पर दर्शाता है।
क्या Nutrola मेरे खाद्य फोटोज़ को प्रशिक्षण के लिए बेचता या साझा करता है?
Nutrola की डेटा प्रथाएँ हमारी गोपनीयता नीति में शामिल हैं। उपयोगकर्ता सुधार और खाद्य फोटोज़ का उपयोग केवल हमारे पहचान मॉडलों में सुधार के लिए किया जाता है, केवल उपयोगकर्ता की स्पष्ट सहमति के साथ हमारे डेटा योगदान कार्यक्रम के माध्यम से। जो उपयोगकर्ता बाहर निकलते हैं, वे भी सुधारित मॉडल से लाभान्वित होते हैं (क्योंकि अन्य उपयोगकर्ताओं के योगदान इसे सुधारते हैं) बिना अपने डेटा का योगदान किए। किसी तीसरे पक्ष को कोई व्यक्तिगत पहचान योग्य खाद्य डेटा नहीं बेचा जाता है।
मॉडल कितनी बार अपडेट होता है?
पहचान मॉडल को लगभग साप्ताहिक रूप से फिर से प्रशिक्षित और अपडेट किया जाता है। प्रमुख आर्किटेक्चर परिवर्तन कम बार होते हैं, आमतौर पर साल में एक या दो बार। प्रत्येक अपडेट को उत्पादन में तैनाती से पहले संदर्भ लाइब्रेरी के खिलाफ हमारे पूर्ण रिग्रेशन परीक्षण प्रोटोकॉल के माध्यम से जाना जाता है। उपयोगकर्ताओं को ऐप के माध्यम से स्वचालित रूप से मॉडल अपडेट मिलते हैं, बिना ऐप को स्वयं अपडेट करने की आवश्यकता के।
निष्कर्ष
मान्यता एक ऐसी विशेषता नहीं है जिसे हम एक बार शिप करते हैं और भूल जाते हैं। यह एक निरंतर अनुशासन है जो हर मॉडल सुधार के साथ समानांतर में चलता है। Nutrola रिसर्च लैब का अस्तित्व इस विश्वास पर है कि पारदर्शी सटीकता रिपोर्टिंग उस विश्वास को बनाती है जिसकी AI पोषण ट्रैकिंग को वास्तव में उपयोगी होने की आवश्यकता होती है।
हमारी विधि, प्रयोगशाला द्वारा विश्लेषित संदर्भ भोजन, अंधे परीक्षण प्रोटोकॉल, USDA क्रॉस-मान्यता, प्रणालीगत त्रुटि वर्गीकरण, और प्रकाशित मैट्रिक्स हमें एक ऐसे मानक के प्रति उत्तरदायी बनाए रखने के लिए डिज़ाइन की गई है जो आंतरिक बेंचमार्क से अधिक है। हम परिपूर्ण नहीं हैं। हमारी सटीकता मैट्रिक्स यह साबित करती हैं। लेकिन हम जानते हैं कि हम कहाँ कमज़ोर हैं, और हमारे पास उन अंतरालों को बंद करने के लिए प्रणालीगत प्रक्रियाएँ हैं।
उपयोगकर्ताओं के लिए, व्यावहारिक निहितार्थ सीधा है: Nutrola आपको पोषण संबंधी अनुमान देता है जो उनकी अनिश्चितता के बारे में पारदर्शी होते हैं, जो समय के साथ मापनीय रूप से सुधारते हैं, और जिन्हें हम सबसे कठोर संदर्भ मानक के खिलाफ मान्य करते हैं। यही जिम्मेदार AI पोषण ट्रैकिंग का स्वरूप है।
क्या आप अपने पोषण ट्रैकिंग को बदलने के लिए तैयार हैं?
उन हजारों में शामिल हों जिन्होंने Nutrola के साथ अपनी स्वास्थ्य यात्रा को बदल दिया!