Nutrola की खाद्य पहचान तकनीक के पीछे का शोध

Nutrola फोटो से भोजन की पहचान कैसे करता है, वो भी तीन सेकंड के अंदर? हमारे AI को शक्ति देने वाले कंप्यूटर विज़न, डीप लर्निंग और पोषण विज्ञान के शोध में गहराई से जानें।

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

जब आप अपने डिनर की एक फोटो लेते हैं और Nutrola तीन सेकंड के अंदर एक संपूर्ण पोषण संबंधी विवरण प्रस्तुत करता है, तो इसके पीछे दशकों का कंप्यूटर विज़न शोध, पोषण विज्ञान, और AI इंजीनियरिंग काम कर रही होती है। जो एक क्षण की पहचान लगती है, वह वास्तव में विशेषीकृत मॉडलों की एक श्रृंखला होती है, जो प्रत्येक एक विशिष्ट वैज्ञानिक समस्या को हल करती है। जैसे ही आपका कैमरा शटर क्लिक करता है और मैक्रोन्यूट्रिएंट मान स्क्रीन पर आते हैं, आपकी छवि एक पाइपलाइन से गुजरती है जो स्टैनफोर्ड, MIT, Google DeepMind, और ETH ज्यूरिख कंप्यूटर विज़न लैब जैसे संस्थानों के मौलिक शोध पर आधारित है।

यह लेख उस पाइपलाइन को चरण-दर-चरण दर्शाता है, जिसमें Nutrola की खाद्य पहचान को संभव बनाने वाले वास्तविक शोध और तकनीकी अवधारणाओं का उल्लेख किया गया है।

कंप्यूटर विज़न पाइपलाइन

Nutrola की खाद्य पहचान एकल मॉडल नहीं है। यह एक बहु-चरणीय पाइपलाइन है जहाँ प्रत्येक चरण एक विशिष्ट कार्य संभालता है, और एक चरण का आउटपुट अगले चरण में जाता है।

चरण 1 -- छवि पूर्व-प्रसंस्करण। किसी भी न्यूरल नेटवर्क के आपकी फोटो देखने से पहले, कच्ची छवि का सामान्यीकरण किया जाता है। इसमें मानक इनपुट रिज़ॉल्यूशन में आकार बदलना, सफेद संतुलन और एक्सपोजर भिन्नता के लिए समायोजन करना, और प्रशिक्षण के दौरान डेटा संवर्धन परिवर्तन लागू करना शामिल है। Krizhevsky, Sutskever, और Hinton द्वारा 2012 में प्रकाशित उनके महत्वपूर्ण ImageNet पेपर में दिखाया गया था कि पूर्व-प्रसंस्करण और संवर्धन गहरे संकुचन न्यूरल नेटवर्क (CNNs) में सामान्यीकरण को काफी बेहतर बनाते हैं। आधुनिक पाइपलाइनों में CutMix (Yun et al., 2019) और RandAugment (Cubuk et al., 2020) जैसी तकनीकों का विस्तार किया गया है, जो मॉडल को खाद्य फोटोग्राफी में सामान्यतः होने वाले अवरोध और रंग परिवर्तनों के प्रति मजबूत बनाती हैं।

चरण 2 -- खाद्य पहचान और विभाजन। एक बार पूर्व-प्रसंस्कृत होने के बाद, छवि एक ऑब्जेक्ट डिटेक्शन मॉडल से गुजरती है जो प्लेट पर प्रत्येक विशिष्ट खाद्य वस्तु की पहचान और स्थानीयकरण करती है। यह चरण क्षेत्र-आधारित संकुचन न्यूरल नेटवर्क के शोध पर भारी निर्भर करता है। Faster R-CNN (Ren et al., 2015) ने क्षेत्र प्रस्ताव नेटवर्क का सिद्धांत स्थापित किया, जबकि Facebook AI Research का DETR (Carion et al., 2020) जैसे अधिक हाल के आर्किटेक्चर ट्रांसफार्मर-आधारित ध्यान का उपयोग करते हैं ताकि हाथ से डिज़ाइन किए गए घटकों जैसे एंकर बॉक्स को पूरी तरह से समाप्त किया जा सके। पिक्सेल-स्तरीय सटीकता के लिए, DeepLab (Chen et al., 2017) जैसी आर्किटेक्चर पर आधारित सेमांटिक सेगमेंटेशन मॉडल छवि के प्रत्येक पिक्सेल को एक खाद्य श्रेणी में असाइन करते हैं, जो मिश्रित व्यंजनों के लिए महत्वपूर्ण है जहाँ सामग्री ओवरलैप होती है।

चरण 3 -- खाद्य वर्गीकरण। प्रत्येक पहचानी गई खाद्य क्षेत्र को फिर वर्गीकृत किया जाता है। आधुनिक खाद्य वर्गीकर्ताओं की रीढ़ उन आर्किटेक्चर से आती है जो ImageNet (Deng et al., 2009) पर मान्य किए गए हैं, जो 14 मिलियन लेबल वाली छवियों का डेटासेट है जिसने गहरे शिक्षण क्रांति को उत्प्रेरित किया। खाद्य-विशिष्ट डेटासेट जैसे Food-101 (Bossard et al., 2014), जिसमें 101 श्रेणियों में 101,000 छवियाँ शामिल हैं, और UECFOOD-256 (Kawano और Yanai, 2015), जो जापानी व्यंजनों पर ध्यान केंद्रित करते हुए 256 खाद्य श्रेणियों को कवर करते हैं, इन सामान्य-उद्देश्य आर्किटेक्चर को खाद्य पहचान के लिए ठीक करने के लिए आवश्यक डोमेन-विशिष्ट प्रशिक्षण डेटा प्रदान करते हैं।

चरण 4 -- भाग का अनुमान। प्लेट पर क्या है, यह पहचानने के बाद, सिस्टम यह अनुमान लगाता है कि प्रत्येक आइटम में कितनी मात्रा है। यह खाद्य पहचान शोध में सबसे कठिन अनसुलझी समस्या है और इसमें एकल 2D छवि से गहराई का अनुमान और आयतन संबंधी तर्क शामिल है।

चरण 5 -- पोषण मानचित्रण। अंततः, वर्गीकृत खाद्य वस्तु और इसका अनुमानित भाग आकार एक सत्यापित पोषण डेटाबेस से मैप किया जाता है ताकि कैलोरी, प्रोटीन, कार्बोहाइड्रेट, वसा, और सूक्ष्म पोषक तत्वों के मान उत्पन्न किए जा सकें।

इनमें से प्रत्येक चरण एक सक्रिय शोध क्षेत्र का प्रतिनिधित्व करता है। नीचे के अनुभाग सबसे तकनीकी चुनौतीपूर्ण चरणों की विस्तार से जांच करते हैं।

खाद्य वर्गीकरण: "यह सलाद है" से परे

सलाद और स्टेक के बीच अंतर बताना किसी भी आधुनिक वर्गीकरणकर्ता के लिए सीधा है। असली चुनौती तब शुरू होती है जब सिस्टम को दृश्य रूप से समान व्यंजनों के बीच अंतर करना होता है: चिकन टिक्का मसाला बनाम बटर चिकन, पैड थाई बनाम ड्रंकन नूडल्स, या ग्रीक सलाद बनाम फत्तौश। ये व्यंजन रंग, बनावट, और संरचनात्मक पैटर्न साझा करते हैं लेकिन सामग्री और कैलोरी घनत्व में महत्वपूर्ण रूप से भिन्न होते हैं।

ट्रांसफर लर्निंग और डोमेन अनुकूलन

खाद्य वर्गीकरण के लिए मानक दृष्टिकोण ट्रांसफर लर्निंग पर निर्भर करता है, एक तकनीक जिसे Yosinski et al. (2014) द्वारा औपचारिक रूप से परिभाषित किया गया है, जहाँ एक मॉडल जो ImageNet जैसे बड़े सामान्य डेटासेट पर पूर्व-प्रशिक्षित है, खाद्य-विशिष्ट डेटा पर ठीक किया जाता है। नेटवर्क की निचली परतें, जो किनारों, बनावटों, और बुनियादी आकृतियों का पता लगाती हैं, विभिन्न डोमेन में अच्छी तरह से स्थानांतरित होती हैं। उच्चतर परतें, जो अर्थपूर्णता को संहिताबद्ध करती हैं, खाद्य-विशिष्ट विशेषताओं को सीखने के लिए फिर से प्रशिक्षित की जाती हैं जैसे कि तले हुए सतह की चमक और भाप में पकाए गए की मैट फिनिश के बीच का अंतर।

Hassannejad et al. (2016) द्वारा किए गए शोध ने दिखाया कि Food-101 पर InceptionV3 को ठीक करने से 88.28 प्रतिशत की शीर्ष-1 सटीकता प्राप्त हुई, जो पहले के हस्तनिर्मित विशेषता दृष्टिकोणों की तुलना में एक महत्वपूर्ण छलांग है। Vision Transformers (Dosovitskiy et al., 2020) और उनके खाद्य-विशिष्ट रूपों का उपयोग करते हुए हाल के कार्यों ने Food-101 पर सटीकता को 93 प्रतिशत से ऊपर धकेल दिया है।

जटिल प्लेटों के लिए मल्टी-लेबल वर्गीकरण

वास्तविक भोजन में आमतौर पर एकल आइटम नहीं होता। एक सामान्य डिनर प्लेट में ग्रिल्ड सैल्मन, रोस्टेड एस्पैरेगस, क्विनोआ, और एक नींबू बटर सॉस हो सकता है। मल्टी-लेबल वर्गीकरण, जहाँ एक एकल छवि को कई स्वतंत्र लेबल मिल सकते हैं, इस समस्या का समाधान करता है। Wang et al. (2016) द्वारा मल्टी-लेबल छवि वर्गीकरण के लिए CNN-RNN आर्किटेक्चर पर किए गए शोध ने ऐसे ढांचे स्थापित किए जो लेबल सह-उपस्थिति पैटर्न को कैप्चर करते हैं। खाद्य क्षेत्र में, इसका अर्थ है कि मॉडल यह सीखता है कि चावल और करी अक्सर एक साथ आते हैं, जो व्यक्तिगत खाद्य आइटम की सटीकता में सुधार करने वाला संदर्भ संकेत है।

Nutrola इसे एक पदानुक्रम वर्गीकरण प्रणाली के साथ बढ़ाता है। प्रणाली पहले व्यापक खाद्य श्रेणी (अनाज, प्रोटीन, सब्जी, सॉस) का वर्गीकरण करती है, फिर उस श्रेणी के भीतर विशिष्ट आइटम को संकीर्ण करती है। यह दो-चरणीय दृष्टिकोण विभिन्न श्रेणियों से दृश्य रूप से समान वस्तुओं के बीच भ्रम को कम करता है और पोषण डेटाबेस के संगठन के तरीके को दर्शाता है।

भाग का अनुमान: 3D चुनौती

प्लेट पर खाद्य पदार्थों की पहचान करना समस्या का केवल आधा समाधान है। 100-ग्राम सर्विंग में चिकन ब्रेस्ट 165 कैलोरी होती है। 250-ग्राम सर्विंग में 412 कैलोरी होती हैं। सटीक भाग के अनुमान के बिना, भले ही खाद्य पहचान सही हो, कैलोरी की गणना अविश्वसनीय होती है।

मोनोकुलर गहराई का अनुमान

एकल 2D फोटो से खाद्य पदार्थों के आयतन का अनुमान लगाने के लिए सिस्टम को गहराई का अनुमान लगाना होता है, जिसे मोनोकुलर गहराई का अनुमान कहा जाता है। Eigen, Puhrsch, और Fergus (2014) द्वारा प्रकाशित मौलिक कार्य ने दिखाया कि CNNs एकल छवियों से पिक्सेल-वार गहराई मानचित्रों की भविष्यवाणी कर सकते हैं। Ranftl et al. (2021) द्वारा किए गए हाल के शोध ने MiDaS पेश किया, एक ऐसा मॉडल जो मिश्रित डेटासेट पर प्रशिक्षित है और विविध दृश्यों में मजबूत सापेक्ष गहराई के अनुमान उत्पन्न करता है।

खाद्य अनुप्रयोगों के लिए, गहराई का अनुमान सिस्टम को यह भेद करने की अनुमति देता है कि प्लेट पर फैली हुई सॉस की एक पतली परत है या एक गहरी कटोरी में सूप है। प्लेटों, कटोरियों, और बर्तनों जैसे सामान्य संदर्भ वस्तुओं की ज्ञात ज्यामिति के साथ मिलकर, गहराई मानचित्रों को अनुमानित आयतन के अनुमान में परिवर्तित किया जा सकता है।

आयतन अनुमान के लिए ज्यामितीय दृष्टिकोण

टोक्यो विश्वविद्यालय (Okamoto और Yanai, 2016) के शोध ने दिखाया कि खाद्य आयतन का अनुमान विभाजित खाद्य क्षेत्रों में ज्यामितीय प्राइमिटिव्स जैसे कि सिलेंडर, अर्धगोलाकार, और आयताकार प्रिज्म को फिट करके किया जा सकता है। चावल का एक ढेर एक अर्ध-गोलाकार के रूप में अनुमानित किया जाता है। दूध का एक गिलास एक सिलेंडर के रूप में अनुमानित किया जाता है। ब्रेड का एक टुकड़ा एक आयताकार प्रिज्म के रूप में अनुमानित किया जाता है।

ये ज्यामितीय अनुमानों, ज्ञात घनत्व प्राथमिकताओं (सिस्टम जानता है कि एक निश्चित मात्रा में मैश किए हुए आलू का वजन उसी मात्रा में पॉपकॉर्न से अधिक होता है) के साथ मिलकर वजन के अनुमान उत्पन्न करते हैं, जो शोध ने दिखाया है कि अधिकांश सामान्य खाद्य पदार्थों के लिए वास्तविकता से 15 से 20 प्रतिशत के भीतर होते हैं। Nutrola इन अनुमानों को और बेहतर बनाता है, एक स्वामित्व वाले एंसेंबल दृष्टिकोण का उपयोग करते हुए जो ज्यामितीय तर्क को उन रिग्रेशन मॉडलों के साथ जोड़ता है जो ज्ञात वजन वाली हजारों खाद्य छवियों पर प्रशिक्षित होते हैं।

संदर्भ वस्तु कैलिब्रेशन

कुछ खाद्य पहचान प्रणालियाँ दृश्य में ज्ञात संदर्भ वस्तुओं का उपयोग करती हैं ताकि स्केल कैलिब्रेशन किया जा सके। एक मानक डिनर प्लेट का व्यास लगभग 26 सेंटीमीटर होता है। एक क्रेडिट कार्ड का माप 85.6 बाय 53.98 मिलीमीटर होता है। जब सिस्टम ऐसी वस्तुओं का पता लगाता है, तो यह एक वास्तविक दुनिया का स्केल स्थापित कर सकता है जो आयतन और वजन के अनुमानों में काफी सुधार करता है। Purdue विश्वविद्यालय में Fang et al. (2016) द्वारा किए गए शोध ने दिखाया कि प्लेट-आधारित कैलिब्रेशन ने बिना कैलिब्रेटेड दृष्टिकोण की तुलना में भाग के अनुमान में लगभग 25 प्रतिशत की कमी की।

सत्यापित डेटाबेस परत

AI पहचान अकेले सटीक कैलोरी गणनाएँ प्रदान करने के लिए पर्याप्त नहीं है। भले ही एक मॉडल ग्रिल्ड चिकन ब्रेस्ट की पहचान में 99 प्रतिशत सटीकता हासिल करे, अंतिम पोषण संबंधी आउटपुट पूरी तरह से उस डेटाबेस की गुणवत्ता पर निर्भर करता है जिससे यह मैप करता है।

यहाँ Nutrola का दृष्टिकोण कई प्रतिस्पर्धियों से भिन्न है। अधिकांश खाद्य ट्रैकिंग ऐप्स भीड़-स्रोतित डेटाबेस पर निर्भर करते हैं जहाँ कोई भी उपयोगकर्ता पोषण संबंधी जानकारी प्रस्तुत कर सकता है। अध्ययनों ने पाया है कि भीड़-स्रोतित खाद्य डेटाबेस में 15 से 30 प्रतिशत के बीच त्रुटि दर होती है, कुछ प्रविष्टियाँ प्रमुख मैक्रोन्यूट्रिएंट्स के लिए प्रयोगशाला-सत्यापित मानों से 50 प्रतिशत से अधिक भिन्न होती हैं।

Nutrola एक 100 प्रतिशत सत्यापित पोषण डेटाबेस बनाए रखता है। प्रत्येक प्रविष्टि को USDA FoodData Central, UK राष्ट्रीय स्वास्थ्य सेवा द्वारा उपयोग किए जाने वाले McCance और Widdowson संरचना तालिकाओं, और सहकर्मी-समीक्षित पोषण विश्लेषणों जैसे प्राधिकृत स्रोतों के खिलाफ क्रॉस-रेफरेंस किया जाता है। इसका अर्थ है कि भले ही AI पहचान परत खाद्य पहचान या भाग के अनुमान में एक छोटी सी त्रुटि पेश करे, लेकिन जिस पोषण डेटा से यह मैप करता है, वह विश्वसनीय है।

सत्यापन परत एक सूक्ष्मता को भी संभालती है जो शुद्ध AI दृष्टिकोणों को चूक जाती है: तैयारी की विधि पोषण संबंधी सामग्री को प्रभावित करती है। 150-ग्राम चिकन ब्रेस्ट जो ग्रिल्ड है, लगभग 165 कैलोरी होती है, लेकिन वही ब्रेस्ट जो जैतून के तेल में पैन-फ्राइड है, लगभग 230 कैलोरी होती है। Nutrola का डेटाबेस इन तैयारी-निर्भर भिन्नताओं को कैप्चर करता है, और पहचान मॉडल को दृश्य संकेतों के आधार पर पकाने के तरीकों के बीच अंतर करने के लिए प्रशिक्षित किया गया है, जैसे कि ग्रिल्ड सतह और तले हुए सतह के बीच का अंतर।

निरंतर सीखना और सुधार

खाद्य पहचान एक ऐसी समस्या नहीं है जिसे एक बार हल किया जाए और लागू किया जाए। व्यंजन विकसित होते हैं, नए व्यंजन उभरते हैं, और उपयोगकर्ता की अपेक्षाएँ बढ़ती हैं। Nutrola का सिस्टम मशीन लर्निंग शोध पर आधारित कई तंत्रों के माध्यम से निरंतर सुधार के लिए डिज़ाइन किया गया है।

सक्रिय सीखना

सक्रिय सीखना, जिसे Settles (2009) द्वारा औपचारिक रूप से परिभाषित किया गया है, एक रणनीति है जहाँ मॉडल उन उदाहरणों की पहचान करता है जिन पर उसे सबसे कम विश्वास होता है और मानव समीक्षा और लेबलिंग के लिए उन्हें प्राथमिकता देता है। जब Nutrola का सिस्टम किसी व्यंजन का उच्च विश्वास के साथ वर्गीकरण नहीं कर पाता, तो उस छवि को विशेषज्ञ समीक्षा के लिए चिह्नित किया जाता है। एक बार लेबल किए जाने के बाद, यह प्रशिक्षण पाइपलाइन में प्रवेश करता है और मॉडल ठीक उसी मामलों में सुधार करता है जहाँ यह सबसे कमजोर था।

यह दृष्टिकोण यादृच्छिक रूप से अधिक प्रशिक्षण छवियों को एकत्र करने की तुलना में डेटा-कुशल है। शोध ने लगातार दिखाया है कि सक्रिय सीखना यादृच्छिक नमूनाकरण की तुलना में 30 से 60 प्रतिशत कम लेबल वाले डेटा के साथ समान मॉडल सटीकता प्राप्त कर सकता है।

नए खाद्य पदार्थों और क्षेत्रीय व्यंजनों को संभालना

खाद्य पहचान में सबसे महत्वपूर्ण चुनौतियों में से एक क्षेत्रीय और सांस्कृतिक रूप से विशिष्ट व्यंजनों का कवरेज है। एक मॉडल जो मुख्य रूप से पश्चिमी व्यंजनों पर प्रशिक्षित है, दक्षिण-पूर्व एशियाई मिठाइयों, पश्चिम अफ्रीकी स्ट्यूज, या स्कैंडिनेवियाई किण्वित खाद्य पदार्थों के साथ संघर्ष कर सकता है। Nutrola इस समस्या का समाधान लक्षित डेटा संग्रह अभियानों के माध्यम से करता है जो कम प्रतिनिधित्व वाले व्यंजनों पर केंद्रित होते हैं, साथ ही कुछ-शॉट लर्निंग तकनीकों (Wang et al., 2020) के साथ जो मॉडल को अपेक्षाकृत छोटे उदाहरणों की संख्या से नए खाद्य श्रेणियों को सीखने की अनुमति देती हैं।

उपयोगकर्ता फीडबैक इस प्रक्रिया के लिए एक महत्वपूर्ण इनपुट है। जब कोई उपयोगकर्ता गलत पहचान किए गए खाद्य पदार्थ को सुधारता है, तो वह सुधार प्रशिक्षण पाइपलाइन में वापस feed होता है। विश्व स्तर पर लॉग की गई लाखों भोजन के बीच, ये सुधार वास्तविक लोगों द्वारा उनके दैनिक जीवन में खाए जाने वाले खाद्य पदार्थों को कवर करने वाले सत्य-आधारित डेटा की निरंतर धारा उत्पन्न करते हैं।

यह आपके प्लेट पर कैसे अनुवादित होता है

उपरोक्त शोध ठोस लाभ उत्पन्न करता है जो आप हर बार Nutrola खोलने पर अनुभव करते हैं।

तीन सेकंड में लॉगिंग। पूरी पाइपलाइन, छवि पूर्व-प्रसंस्करण से लेकर पोषण संबंधी खोज तक, एक आधुनिक स्मार्टफोन पर तीन सेकंड के भीतर निष्पादित होती है। मॉडल ऑप्टिमाइजेशन तकनीकों जैसे कि क्वांटाइजेशन (Jacob et al., 2018) और न्यूरल आर्किटेक्चर खोज (Zoph और Le, 2017) जटिल मॉडलों को मोबाइल हार्डवेयर पर बिना सटीकता खोए प्रभावी ढंग से चलाने की अनुमति देती हैं।

जटिल भोजन प्रबंधन। मल्टी-लेबल पहचान और सेमांटिक सेगमेंटेशन का अर्थ है कि आपको प्रत्येक खाद्य आइटम को अलग से फोटो खींचने की आवश्यकता नहीं है। एक भरे हुए डिनर प्लेट की एकल फोटो प्रत्येक घटक के लिए व्यक्तिगत पोषण संबंधी विवरण उत्पन्न करती है।

क्रॉस-कुजीन सटीकता। निरंतर सीखना और लक्षित डेटा संग्रह सुनिश्चित करता है कि सिस्टम काम करता है चाहे आप टोक्यो में सुशी खा रहे हों, मेक्सिको सिटी में टैको, अदीस अबाबा में इनजेरा, या लंदन में रविवार का रोस्ट। मॉडल Nutrola के वैश्विक उपयोगकर्ता आधार के माध्यम से लॉग किए गए प्रत्येक भोजन के साथ सुधारता है।

प्रगतिशील सटीकता सुधार। जितना अधिक आप Nutrola का उपयोग करते हैं, उतना ही यह आपके लिए व्यक्तिगत रूप से और सभी उपयोगकर्ताओं के लिए सामूहिक रूप से बेहतर होता है। सक्रिय सीखना सुनिश्चित करता है कि मॉडल अपने सुधार पर ध्यान केंद्रित करता है ठीक उन्हीं मामलों पर जहाँ इसकी सबसे अधिक आवश्यकता होती है।

सत्यापित पोषण डेटा। उन ऐप्स के विपरीत जो अज्ञात त्रुटि दरों के साथ भीड़-स्रोतित डेटाबेस पर निर्भर करते हैं, Nutrola द्वारा लौटाई गई प्रत्येक कैलोरी गणना प्रयोगशाला-सत्यापित पोषण डेटा द्वारा समर्थित होती है। AI खाद्य पदार्थों की पहचान करता है; सत्यापित डेटाबेस सुनिश्चित करता है कि संख्याएँ सही हैं।

अक्सर पूछे जाने वाले प्रश्न

Nutrola का AI फोटो से भोजन की पहचान कैसे करता है?

Nutrola एक बहु-चरणीय कंप्यूटर विज़न पाइपलाइन का उपयोग करता है। आपकी फोटो पहले छवि पूर्व-प्रसंस्करण से गुजरती है, फिर एक गहरे शिक्षण पहचान मॉडल से गुजरती है जो प्लेट पर प्रत्येक खाद्य आइटम की पहचान और विभाजन करता है। प्रत्येक आइटम को खाद्य-विशिष्ट डेटासेट पर ठीक किए गए संकुचन न्यूरल नेटवर्क का उपयोग करके वर्गीकृत किया जाता है, इसका भाग गहराई और आयतन संबंधी तर्क का उपयोग करके अनुमानित किया जाता है, और परिणाम Nutrola के सत्यापित पोषण डेटाबेस से मैप किया जाता है ताकि कैलोरी और मैक्रोन्यूट्रिएंट मान उत्पन्न किए जा सकें।

Nutrola की खाद्य पहचान तकनीक कितनी सटीक है?

Nutrola के वर्गीकरण मॉडल मानक खाद्य पहचान बेंचमार्क पर 90 प्रतिशत से अधिक की शीर्ष-1 सटीकता दर प्राप्त करते हैं, जबकि शीर्ष-5 सटीकता 95 प्रतिशत से अधिक होती है। भाग के अनुमान के लिए, सिस्टम आमतौर पर वास्तविक वजन के 15 से 20 प्रतिशत के भीतर होता है, जो प्रशिक्षित आहार विशेषज्ञों की अनुमान सटीकता के बराबर या बेहतर है। Nutrola के सत्यापित डेटाबेस के साथ मिलकर, यह कैलोरी के अनुमान उत्पन्न करता है जो मैन्युअल लॉगिंग की तुलना में काफी अधिक विश्वसनीय होते हैं, जो शोध से पता चलता है कि सेवन को 10 से 45 प्रतिशत कम रिपोर्ट करता है।

Nutrola की खाद्य पहचान AI को कौन से शोध और डेटासेट शक्ति प्रदान करते हैं?

Nutrola की तकनीक मौलिक कंप्यूटर विज़न शोध पर आधारित है जिसमें ImageNet पर मान्य किए गए संकुचन न्यूरल नेटवर्क, ऑब्जेक्ट डिटेक्शन आर्किटेक्चर जैसे कि Faster R-CNN और DETR, और खाद्य-विशिष्ट डेटासेट जैसे Food-101 और UECFOOD-256 शामिल हैं। सिस्टम भाग के आकार के लिए मोनोकुलर गहराई के अनुमान के शोध और निरंतर मॉडल सुधार के लिए सक्रिय सीखने के शोध पर भी निर्भर करता है। सभी पोषण डेटा प्राधिकृत स्रोतों जैसे USDA FoodData Central के खिलाफ सत्यापित होते हैं।

क्या Nutrola एक ही प्लेट पर कई खाद्य पदार्थों को पहचान सकता है?

हाँ। Nutrola मल्टी-लेबल पहचान और सेमांटिक सेगमेंटेशन का उपयोग करता है ताकि एक ही फोटो में प्रत्येक विशिष्ट खाद्य आइटम की पहचान और अलग से विश्लेषण किया जा सके। चाहे आपकी प्लेट में दो आइटम हों या आठ, सिस्टम प्रत्येक को अलग करता है, स्वतंत्र रूप से वर्गीकृत करता है, उसके भाग का अनुमान लगाता है, और प्रति आइटम पोषण संबंधी विवरण के साथ भोजन का कुल परिणाम लौटाता है।

Nutrola विभिन्न व्यंजनों और संस्कृतियों से खाद्य पदार्थों को कैसे संभालता है?

Nutrola व्यापक कवरेज प्रशिक्षण डेटा को लक्षित डेटा संग्रह के साथ जोड़ता है जो कम प्रतिनिधित्व वाले व्यंजनों के लिए और कुछ-शॉट लर्निंग तकनीकों का उपयोग करता है जो मॉडल को अपेक्षाकृत छोटे उदाहरणों की संख्या से नए खाद्य श्रेणियों को सीखने की अनुमति देती हैं। Nutrola के वैश्विक उपयोगकर्ता आधार से उपयोगकर्ता सुधार लगातार प्रशिक्षण पाइपलाइन में फीड होते हैं, यह सुनिश्चित करते हुए कि सटीकता उन विशिष्ट व्यंजनों के लिए सुधारती है जो लोग वास्तव में हर क्षेत्र और खाद्य संस्कृति में खाते हैं।

क्या Nutrola की खाद्य पहचान समय के साथ बेहतर होती है?

हाँ। Nutrola सक्रिय सीखने का उपयोग करता है, एक मशीन लर्निंग रणनीति जहाँ सिस्टम उन छवियों की पहचान करता है जिन पर उसे सबसे कम विश्वास होता है और उन्हें विशेषज्ञ समीक्षा और पुनः प्रशिक्षण के लिए प्राथमिकता देता है। वैश्विक स्तर पर लॉग की गई लाखों भोजन से एकत्रित उपयोगकर्ता फीडबैक के साथ मिलकर, इसका अर्थ है कि मॉडल निरंतर सुधारता है। हर भोजन जो आप लॉग करते हैं, Nutrola की पहचान को सभी उपयोगकर्ताओं के लिए अधिक सटीक बनाने में योगदान करता है।

क्या आप अपने पोषण ट्रैकिंग को बदलने के लिए तैयार हैं?

उन हजारों में शामिल हों जिन्होंने Nutrola के साथ अपनी स्वास्थ्य यात्रा को बदल दिया!