Η Έρευνα πίσω από την Τεχνολογία Αναγνώρισης Τροφίμων της Nutrola
Πώς η Nutrola αναγνωρίζει τα τρόφιμα από μια φωτογραφία σε λιγότερο από 3 δευτερόλεπτα; Μια εις βάθος ανάλυση της έρευνας στον τομέα της υπολογιστικής όρασης, της βαθιάς μάθησης και της διατροφικής επιστήμης που τροφοδοτεί την τεχνητή νοημοσύνη μας.
Όταν τραβάτε μια φωτογραφία του δείπνου σας και η Nutrola επιστρέφει μια πλήρη διατροφική ανάλυση σε λιγότερο από τρία δευτερόλεπτα, πίσω από αυτή τη διαδικασία κρύβονται δεκαετίες έρευνας στον τομέα της υπολογιστικής όρασης, της διατροφικής επιστήμης και της μηχανικής τεχνητής νοημοσύνης. Αυτό που φαίνεται ως μια στιγμιαία αναγνώριση είναι στην πραγματικότητα μια αλυσίδα εξειδικευμένων μοντέλων, το καθένα από τα οποία επιλύει ένα συγκεκριμένο επιστημονικό πρόβλημα. Από τη στιγμή που ο φακός της κάμερας ενεργοποιείται μέχρι τη στιγμή που οι τιμές των μακροθρεπτικών συστατικών εμφανίζονται στην οθόνη, η εικόνα σας περνά μέσα από μια διαδικασία που βασίζεται σε θεμελιώδη έρευνα από ιδρύματα όπως το Stanford, το MIT, το Google DeepMind και το ETH Zurich Computer Vision Lab.
Αυτό το άρθρο παρακολουθεί αυτή τη διαδικασία βήμα προς βήμα, αναφέροντας την πραγματική έρευνα και τις τεχνικές έννοιες που καθιστούν δυνατή την αναγνώριση τροφίμων από τη Nutrola.
Η Διαδικασία Υπολογιστικής Όρασης
Η αναγνώριση τροφίμων της Nutrola δεν είναι ένα ενιαίο μοντέλο. Είναι μια πολυδιάστατη διαδικασία όπου κάθε στάδιο αναλαμβάνει μια ξεχωριστή εργασία, και η έξοδος ενός σταδίου τροφοδοτεί το επόμενο.
Στάδιο 1 -- Προεπεξεργασία Εικόνας. Πριν οποιοδήποτε νευρωνικό δίκτυο δει τη φωτογραφία σας, η ακατέργαστη εικόνα υποβάλλεται σε κανονικοποίηση. Αυτό περιλαμβάνει την αλλαγή μεγέθους σε μια τυπική ανάλυση εισόδου, τη ρύθμιση της ισορροπίας λευκού και της έκθεσης, καθώς και την εφαρμογή μετασχηματισμών αύξησης δεδομένων κατά τη διάρκεια της εκπαίδευσης. Η έρευνα των Krizhevsky, Sutskever και Hinton στο ορόσημο άρθρο τους για το ImageNet το 2012 απέδειξε ότι η προεπεξεργασία και η αύξηση δεδομένων βελτιώνουν δραματικά τη γενίκευση στα βαθιά συνελικτικά νευρωνικά δίκτυα (CNNs). Οι σύγχρονες διαδικασίες επεκτείνουν αυτό με τεχνικές όπως το CutMix (Yun et al., 2019) και το RandAugment (Cubuk et al., 2020), οι οποίες διδάσκουν στο μοντέλο να είναι ανθεκτικό σε αποκλεισμούς και αλλαγές χρώματος που είναι κοινές στη φωτογραφία τροφίμων.
Στάδιο 2 -- Ανίχνευση και Διαχωρισμός Τροφίμων. Αφού προεπεξεργαστεί, η εικόνα περνά μέσα από ένα μοντέλο ανίχνευσης αντικειμένων που αναγνωρίζει και εντοπίζει κάθε ξεχωριστό τρόφιμο στο πιάτο. Αυτό το στάδιο βασίζεται σε μεγάλο βαθμό σε έρευνες σχετικά με τα δίκτυα συνελικτικής ανίχνευσης περιοχών. Το Faster R-CNN (Ren et al., 2015) καθόρισε το πρότυπο των δικτύων προτάσεων περιοχών, ενώ πιο πρόσφατες αρχιτεκτονικές όπως το DETR (Carion et al., 2020) από το Facebook AI Research χρησιμοποιούν προσοχή βασισμένη σε μετασχηματιστές για να εξαλείψουν εντελώς τα χειροποίητα στοιχεία όπως τα anchor boxes. Για ακρίβεια σε επίπεδο pixel, τα μοντέλα σημασιολογικού διαχωρισμού που βασίζονται σε αρχιτεκτονικές όπως το DeepLab (Chen et al., 2017) αναθέτουν κάθε pixel στην εικόνα σε μια κατηγορία τροφίμου, κάτι που είναι κρίσιμο για μικτές πιάτες όπου τα συστατικά επικαλύπτονται.
Στάδιο 3 -- Κατηγοριοποίηση Τροφίμων. Κάθε ανιχνευμένη περιοχή τροφίμου κατηγοριοποιείται στη συνέχεια. Ο κορμός των σύγχρονων κατηγοριοποιητών τροφίμων προέρχεται από αρχιτεκτονικές που έχουν επικυρωθεί στο ImageNet (Deng et al., 2009), το σύνολο δεδομένων με 14 εκατομμύρια επισημασμένες εικόνες που πυροδότησε την επανάσταση της βαθιάς μάθησης. Συγκεκριμένα σύνολα δεδομένων τροφίμων όπως το Food-101 (Bossard et al., 2014), που περιέχει 101.000 εικόνες σε 101 κατηγορίες, και το UECFOOD-256 (Kawano και Yanai, 2015), που καλύπτει 256 κατηγορίες τροφίμων με έμφαση στην ιαπωνική κουζίνα, παρέχουν τα δεδομένα εκπαίδευσης που απαιτούνται για τη βελτίωση αυτών των γενικών αρχιτεκτονικών για την αναγνώριση τροφίμων.
Στάδιο 4 -- Εκτίμηση Μερίδας. Αφού αναγνωριστεί τι υπάρχει στο πιάτο, το σύστημα εκτιμά πόσο από κάθε στοιχείο είναι παρόν. Αυτό είναι το πιο δύσκολο άλυτο πρόβλημα στην έρευνα αναγνώρισης τροφίμων και περιλαμβάνει την εκτίμηση βάθους και τον όγκο από μια μόνο 2D εικόνα.
Στάδιο 5 -- Χαρτογράφηση Διατροφικών Στοιχείων. Τέλος, το κατηγοριοποιημένο τρόφιμο και το εκτιμώμενο μέγεθος μερίδας χαρτογραφούνται σε μια επαληθευμένη διατροφική βάση δεδομένων για να παραχθούν οι τιμές θερμίδων, πρωτεϊνών, υδατανθράκων, λιπαρών και μικροθρεπτικών συστατικών.
Κάθε ένα από αυτά τα στάδια αντιπροσωπεύει μια ξεχωριστή περιοχή ενεργής έρευνας. Οι παρακάτω ενότητες εξετάζουν τα πιο τεχνικά απαιτητικά στάδια λεπτομερώς.
Κατηγοριοποίηση Τροφίμων: Πέρα από το "Αυτό είναι μια Σαλάτα"
Η διάκριση μιας σαλάτας από ένα μπριζόλα είναι απλή για οποιονδήποτε σύγχρονο κατηγοριοποιητή. Η πραγματική πρόκληση αρχίζει όταν το σύστημα πρέπει να διακρίνει μεταξύ οπτικά παρόμοιων πιάτων: κοτόπουλο tikka masala έναντι κοτόπουλου με βούτυρο, pad thai έναντι drunken noodles, ή μια ελληνική σαλάτα έναντι ενός fattoush. Αυτά τα πιάτα μοιράζονται χρώματα, υφές και δομικά μοτίβα αλλά διαφέρουν σημαντικά σε συστατικά και πυκνότητα θερμίδων.
Μεταφορά Μάθησης και Προσαρμογή Τομέα
Η τυπική προσέγγιση στην κατηγοριοποίηση τροφίμων βασίζεται στη μεταφορά μάθησης, μια τεχνική που τυποποιήθηκε από τους Yosinski et al. (2014), όπου ένα μοντέλο προεκπαιδεύεται σε ένα μεγάλο γενικό σύνολο δεδομένων όπως το ImageNet και στη συνέχεια βελτιώνεται σε δεδομένα συγκεκριμένα για τρόφιμα. Τα κατώτερα στρώματα του δικτύου, τα οποία ανιχνεύουν άκρα, υφές και βασικά σχήματα, μεταφέρονται καλά μεταξύ των τομέων. Τα ανώτερα στρώματα, τα οποία κωδικοποιούν τη σημασία, εκπαιδεύονται εκ νέου για να μάθουν χαρακτηριστικά συγκεκριμένα για τα τρόφιμα, όπως η διαφορά μεταξύ της γυαλάδας μιας τηγανητής επιφάνειας και της ματ επιφάνειας ενός ατμού.
Η έρευνα των Hassannejad et al. (2016) απέδειξε ότι η βελτίωση του InceptionV3 στο Food-101 πέτυχε ακρίβεια top-1 88,28 τοις εκατό, μια σημαντική αύξηση σε σχέση με τις προηγούμενες προσεγγίσεις με χειροποίητα χαρακτηριστικά. Πιο πρόσφατη εργασία που χρησιμοποιεί Vision Transformers (Dosovitskiy et al., 2020) και τις τροποποιήσεις τους για τρόφιμα έχει αυξήσει την ακρίβεια στο Food-101 πάνω από 93 τοις εκατό.
Πολυδιάστατη Κατηγοριοποίηση για Πολύπλοκα Πιάτα
Τα πραγματικά γεύματα σπάνια περιέχουν ένα μόνο στοιχείο. Ένα τυπικό πιάτο δείπνου μπορεί να περιέχει ψητό σολομό, ψητό σπαράγγι, κινόα και σάλτσα λεμονιού με βούτυρο. Η πολυδιάστατη κατηγοριοποίηση, όπου μια μόνο εικόνα μπορεί να λάβει πολλαπλές ανεξάρτητες ετικέτες, λύνει αυτό το πρόβλημα. Η έρευνα των Wang et al. (2016) σχετικά με αρχιτεκτονικές CNN-RNN για πολυδιάστατη κατηγοριοποίηση εικόνας καθόρισε πλαίσια που καταγράφουν τα μοτίβα συνυπάρξεων ετικετών. Στον τομέα των τροφίμων, αυτό σημαίνει ότι το μοντέλο μαθαίνει ότι το ρύζι και το κάρυ εμφανίζονται συχνά μαζί, κάτι που λειτουργεί ως σημασιολογικό σήμα που βελτιώνει την ακρίβεια των μεμονωμένων στοιχείων τροφίμων.
Η Nutrola επεκτείνει αυτό με ένα ιεραρχικό σύστημα κατηγοριοποίησης. Αντί να προβλέπει μια επίπεδη ετικέτα, το σύστημα πρώτα κατηγοριοποιεί την ευρεία κατηγορία τροφίμου (δημητριακό, πρωτεΐνη, λαχανικό, σάλτσα) και στη συνέχεια περιορίζει το συγκεκριμένο στοιχείο εντός αυτής της κατηγορίας. Αυτή η προσέγγιση δύο σταδίων μειώνει τη σύγχυση μεταξύ οπτικά παρόμοιων στοιχείων από διαφορετικές κατηγορίες και αντικατοπτρίζει τον τρόπο με τον οποίο οργανώνονται οι διατροφικές βάσεις δεδομένων.
Εκτίμηση Μερίδας: Η Πρόκληση του 3D
Η αναγνώριση του τι φαγητό υπάρχει σε ένα πιάτο λύνει μόνο το μισό πρόβλημα. Μια μερίδα 100 γραμμαρίων κοτόπουλου περιέχει 165 θερμίδες. Μια μερίδα 250 γραμμαρίων περιέχει 412 θερμίδες. Χωρίς ακριβή εκτίμηση μερίδας, ακόμη και η τέλεια αναγνώριση τροφίμων παράγει αναξιόπιστους υπολογισμούς θερμίδων.
Εκτίμηση Βάθους με Μονοκυτταρική Εικόνα
Η εκτίμηση του όγκου των τροφίμων από μια μόνο 2D φωτογραφία απαιτεί από το σύστημα να υποθέσει το βάθος, ένα πρόβλημα γνωστό ως εκτίμηση βάθους με μονοκυτταρική εικόνα. Οι Eigen, Puhrsch και Fergus (2014) δημοσίευσαν θεμελιώδη εργασία που αποδεικνύει ότι τα CNNs μπορούν να προβλέψουν χάρτες βάθους pixel-wise από μεμονωμένες εικόνες. Πιο πρόσφατη έρευνα από τους Ranftl et al. (2021) παρουσίασε το MiDaS, ένα μοντέλο εκπαιδευμένο σε μικτά σύνολα δεδομένων που παράγει αξιόπιστες σχετικές εκτιμήσεις βάθους σε διάφορες σκηνές.
Για εφαρμογές τροφίμων, η εκτίμηση βάθους επιτρέπει στο σύστημα να διακρίνει μεταξύ μιας λεπτής στρώσης σάλτσας που απλώνεται σε ένα πιάτο και ενός βαθιού μπολ σούπας. Συνδυασμένα με τη γνωστή γεωμετρία κοινών αναφοράς αντικειμένων όπως πιάτα, μπολ και μαχαιροπίρουνα, οι χάρτες βάθους μπορούν να μετατραπούν σε εκτιμήσεις όγκου.
Γεωμετρικές Προσεγγίσεις για Εκτίμηση Όγκου
Έρευνα από το Πανεπιστήμιο του Τόκιο (Okamoto και Yanai, 2016) απέδειξε ότι ο όγκος των τροφίμων μπορεί να εκτιμηθεί προσαρμόζοντας γεωμετρικά στοιχεία, όπως κύλινδροι, ημισφαίρια και ορθογώνια παραλληλεπίπεδα, σε τμηματοποιημένες περιοχές τροφίμων. Ένα σωρό ρυζιού προσεγγίζει ένα ημι-ελλειψοειδές. Ένα ποτήρι γάλα προσεγγίζει έναν κύλινδρο. Μια φέτα ψωμιού προσεγγίζει ένα ορθογώνιο παραλληλεπίπεδο.
Αυτές οι γεωμετρικές προσεγγίσεις, σε συνδυασμό με γνωστές πυκνότητες (το σύστημα γνωρίζει ότι ένας συγκεκριμένος όγκος πουρέ πατάτας ζυγίζει περισσότερο από τον ίδιο όγκο ποπ κορν), παράγουν εκτιμήσεις βάρους που η έρευνα έχει δείξει ότι κυμαίνονται εντός 15 έως 20 τοις εκατό της πραγματικής τιμής για τα περισσότερα κοινά τρόφιμα. Η Nutrola βελτιώνει αυτές τις εκτιμήσεις περαιτέρω χρησιμοποιώντας μια ιδιόκτητη προσέγγιση συνόλου που συνδυάζει γεωμετρική λογική με μοντέλα παλινδρόμησης που έχουν εκπαιδευτεί σε δεκάδες χιλιάδες εικόνες τροφίμων με γνωστά βάρη.
Βαθμονόμηση Αναφοράς Αντικειμένων
Ορισμένα συστήματα αναγνώρισης τροφίμων χρησιμοποιούν γνωστά αντικείμενα αναφοράς στη σκηνή για βαθμονόμηση κλίμακας. Ένα τυπικό πιάτο δείπνου έχει διάμετρο περίπου 26 εκατοστά. Μια πιστωτική κάρτα μετρά 85,6 x 53,98 χιλιοστά. Όταν το σύστημα ανιχνεύει τέτοια αντικείμενα, μπορεί να καθορίσει μια πραγματική κλίμακα που βελτιώνει σημαντικά τις εκτιμήσεις όγκου και βάρους. Η έρευνα των Fang et al. (2016) στο Purdue University έδειξε ότι η βαθμονόμηση με βάση το πιάτο μείωσε το σφάλμα εκτίμησης μερίδας κατά περίπου 25 τοις εκατό σε σύγκριση με μη βαθμονομημένες προσεγγίσεις.
Η Επαληθευμένη Βάση Δεδομένων
Η αναγνώριση μέσω AI από μόνη της δεν είναι αρκετή για να παραδώσει ακριβείς υπολογισμούς θερμίδων. Ακόμη και αν ένα μοντέλο επιτύχει ακρίβεια 99 τοις εκατό στην αναγνώριση ψητού κοτόπουλου, η τελική διατροφική έξοδος εξαρτάται αποκλειστικά από την ποιότητα της βάσης δεδομένων στην οποία χαρτογραφείται.
Εδώ είναι που η προσέγγιση της Nutrola διαφέρει από πολλές ανταγωνιστικές εφαρμογές. Οι περισσότερες εφαρμογές παρακολούθησης τροφίμων βασίζονται σε βάσεις δεδομένων που έχουν δημιουργηθεί από χρήστες, όπου οποιοσδήποτε χρήστης μπορεί να υποβάλει διατροφικές πληροφορίες. Μελέτες έχουν δείξει ότι οι βάσεις δεδομένων τροφίμων που έχουν δημιουργηθεί από χρήστες περιέχουν ποσοστά σφαλμάτων μεταξύ 15 και 30 τοις εκατό, με ορισμένες καταχωρίσεις να διαφέρουν από εργαστηριακά επαληθευμένες τιμές κατά περισσότερο από 50 τοις εκατό για βασικά μακροθρεπτικά συστατικά.
Η Nutrola διατηρεί μια 100 τοις εκατό επαληθευμένη διατροφική βάση δεδομένων. Κάθε καταχώριση διασταυρώνεται με αξιόπιστες πηγές, συμπεριλαμβανομένων των USDA FoodData Central, των πινάκων σύνθεσης McCance και Widdowson που χρησιμοποιούνται από την Υγειονομική Υπηρεσία του Ηνωμένου Βασιλείου και των αναλύσεων διατροφής που έχουν υποβληθεί σε peer review. Αυτό σημαίνει ότι ακόμη και αν η αναγνωριστική διάσταση AI εισάγει ένα μικρό περιθώριο σφάλματος στην αναγνώριση τροφίμων ή στην εκτίμηση μερίδας, τα διατροφικά δεδομένα στα οποία χαρτογραφείται είναι αξιόπιστα.
Η επαληθευμένη διάσταση χειρίζεται επίσης μια λεπτομέρεια που οι καθαρά AI προσεγγίσεις παραβλέπουν: η μέθοδος προετοιμασίας επηρεάζει το διατροφικό περιεχόμενο. Ένα κοτόπουλο 150 γραμμαρίων που είναι ψητό περιέχει περίπου 165 θερμίδες, αλλά το ίδιο κοτόπουλο τηγανισμένο σε ελαιόλαδο περιέχει περίπου 230 θερμίδες. Η βάση δεδομένων της Nutrola καταγράφει αυτές τις παραλλαγές που εξαρτώνται από την προετοιμασία, και το μοντέλο αναγνώρισης εκπαιδεύεται να διακρίνει τις μεθόδους μαγειρέματος όταν υπάρχουν οπτικά στοιχεία, όπως η διαφορά μεταξύ μιας ψητής επιφάνειας και μιας τηγανητής επιφάνειας.
Συνεχής Μάθηση και Βελτίωση
Η αναγνώριση τροφίμων δεν είναι ένα πρόβλημα που επιλύεται μία φορά και αναπτύσσεται. Οι κουζίνες εξελίσσονται, νέα πιάτα εμφανίζονται και οι προσδοκίες των χρηστών αυξάνονται. Το σύστημα της Nutrola είναι σχεδιασμένο για συνεχή βελτίωση μέσω αρκετών μηχανισμών που βασίζονται στην έρευνα μηχανικής μάθησης.
Ενεργή Μάθηση
Η ενεργή μάθηση, που τυποποιήθηκε από τον Settles (2009), είναι μια στρατηγική όπου το μοντέλο εντοπίζει τα παραδείγματα για τα οποία έχει τη μικρότερη εμπιστοσύνη και προτεραιοποιεί αυτά για ανθρώπινη ανασκόπηση και επισημάνσεις. Όταν το σύστημα της Nutrola συναντά ένα πιάτο που δεν μπορεί να κατηγοριοποιήσει με υψηλή εμπιστοσύνη, αυτή η εικόνα επισημαίνεται για εμπειρογνώμονες. Αφού επισημανθεί, εισέρχεται στη διαδικασία εκπαίδευσης και το μοντέλο βελτιώνεται ακριβώς στις περιπτώσεις όπου ήταν πιο αδύναμο.
Αυτή η προσέγγιση είναι πολύ πιο αποδοτική σε δεδομένα από το να συλλέγουμε τυχαία περισσότερες εικόνες εκπαίδευσης. Η έρευνα έχει δείξει ότι η ενεργή μάθηση μπορεί να επιτύχει ισοδύναμη ακρίβεια μοντέλου με 30 έως 60 τοις εκατό λιγότερα επισημασμένα δεδομένα σε σύγκριση με τυχαία δειγματοληψία.
Διαχείριση Νέων Τροφίμων και Τοπικών Κουζινών
Μία από τις πιο σημαντικές προκλήσεις στην αναγνώριση τροφίμων είναι η κάλυψη περιφερειακών και πολιτιστικά συγκεκριμένων πιάτων. Ένα μοντέλο εκπαιδευμένο κυρίως σε δυτική κουζίνα μπορεί να δυσκολευτεί με επιδόρπια της Νοτιοανατολικής Ασίας, στιφάδο της Δυτικής Αφρικής ή ζυμωμένα τρόφιμα της Σκανδιναβίας. Η Nutrola αντιμετωπίζει αυτό μέσω στοχευμένων εκστρατειών συλλογής δεδομένων που επικεντρώνονται σε υποεκπροσωπούμενες κουζίνες, σε συνδυασμό με τεχνικές λίγων παραδειγμάτων (Wang et al., 2020) που επιτρέπουν στο μοντέλο να μάθει νέες κατηγορίες τροφίμων από σχετικά μικρούς αριθμούς παραδειγμάτων.
Η ανατροφοδότηση χρηστών είναι μια κρίσιμη είσοδος σε αυτή τη διαδικασία. Όταν ένας χρήστης διορθώνει ένα λανθασμένα αναγνωρισμένο τρόφιμο, αυτή η διόρθωση τροφοδοτεί ξανά τη διαδικασία εκπαίδευσης. Συγκεντρωμένα σε εκατομμύρια γεύματα που καταγράφονται παγκοσμίως, αυτές οι διορθώσεις δημιουργούν μια συνεχόμενη ροή δεδομένων αληθείας που καλύπτει ακριβώς τα τρόφιμα που τρώνε οι πραγματικοί άνθρωποι στην καθημερινότητά τους.
Πώς Αυτό Μεταφράζεται στο Πιάτο σας
Η έρευνα που περιγράφεται παραπάνω παράγει συγκεκριμένα οφέλη που βιώνετε κάθε φορά που ανοίγετε τη Nutrola.
Καταγραφή σε τρία δευτερόλεπτα. Ολόκληρη η διαδικασία, από την προεπεξεργασία εικόνας μέχρι την αναζήτηση διατροφικών στοιχείων, εκτελείται σε λιγότερο από τρία δευτερόλεπτα σε ένα σύγχρονο smartphone. Τεχνικές βελτιστοποίησης μοντέλου, συμπεριλαμβανομένης της ποσοτικοποίησης (Jacob et al., 2018) και της αναζήτησης αρχιτεκτονικής νευρωνικών δικτύων (Zoph και Le, 2017), επιτρέπουν σε πολύπλοκα μοντέλα να λειτουργούν αποδοτικά σε κινητό υλικό χωρίς να θυσιάζουν την ακρίβεια.
Διαχείριση πολύπλοκων γευμάτων. Η πολυδιάστατη ανίχνευση και ο σημασιολογικός διαχωρισμός σημαίνουν ότι δεν χρειάζεται να φωτογραφίσετε κάθε στοιχείο τροφίμου ξεχωριστά. Μια μόνο φωτογραφία ενός γεμάτου πιάτου δείπνου παράγει ατομικές διατροφικές αναλύσεις για κάθε συστατικό.
Ακρίβεια διατομής. Η συνεχής μάθηση και η στοχευμένη συλλογή δεδομένων διασφαλίζουν ότι το σύστημα λειτουργεί είτε τρώτε σούσι στο Τόκιο, τάκος στην Πόλη του Μεξικού, injera στην Αδίσ Αμπέμπα ή ένα Κυριακάτικο ψητό στο Λονδίνο. Το μοντέλο βελτιώνεται με κάθε γεύμα που καταγράφεται από τη παγκόσμια βάση χρηστών της Nutrola.
Σταδιακή βελτίωση ακρίβειας. Όσο περισσότερο χρησιμοποιείτε τη Nutrola, τόσο καλύτερη γίνεται, τόσο για εσάς ατομικά όσο και για όλους τους χρήστες συλλογικά. Η ενεργή μάθηση διασφαλίζει ότι το μοντέλο εστιάζει τη βελτίωσή του στις ακριβείς περιπτώσεις όπου χρειάζεται περισσότερο.
Επαληθευμένα διατροφικά δεδομένα. Σε αντίθεση με εφαρμογές που βασίζονται σε βάσεις δεδομένων που έχουν δημιουργηθεί από χρήστες με άγνωστα ποσοστά σφάλματος, κάθε υπολογισμός θερμίδων που επιστρέφει η Nutrola υποστηρίζεται από εργαστηριακά επαληθευμένα διατροφικά δεδομένα. Η AI αναγνωρίζει το φαγητό; Η επαληθευμένη βάση δεδομένων διασφαλίζει ότι οι αριθμοί είναι σωστοί.
Συχνές Ερωτήσεις
Πώς αναγνωρίζει η AI της Nutrola τα τρόφιμα από μια φωτογραφία;
Η Nutrola χρησιμοποιεί μια πολυδιάστατη διαδικασία υπολογιστικής όρασης. Η φωτογραφία σας πρώτα περνά από την προεπεξεργασία εικόνας, στη συνέχεια μέσω ενός μοντέλου ανίχνευσης βαθιάς μάθησης που αναγνωρίζει και τμηματοποιεί κάθε στοιχείο τροφίμου στο πιάτο. Κάθε στοιχείο κατηγοριοποιείται χρησιμοποιώντας συνελικτικά νευρωνικά δίκτυα που έχουν βελτιωθεί σε σύνολα δεδομένων συγκεκριμένα για τρόφιμα, η μερίδα του εκτιμάται χρησιμοποιώντας βάθος και λογική όγκου, και το αποτέλεσμα χαρτογραφείται στη verified διατροφική βάση δεδομένων της Nutrola για να παραχθούν οι τιμές θερμίδων και μακροθρεπτικών συστατικών.
Πόσο ακριβής είναι η τεχνολογία αναγνώρισης τροφίμων της Nutrola;
Τα μοντέλα κατηγοριοποίησης της Nutrola επιτυγχάνουν ποσοστά ακρίβειας πάνω από 90 τοις εκατό σε τυπικά benchmarks αναγνώρισης τροφίμων, με ακρίβεια top-5 που ξεπερνά το 95 τοις εκατό. Για την εκτίμηση μερίδας, το σύστημα συνήθως κυμαίνεται εντός 15 έως 20 τοις εκατό του πραγματικού βάρους, που είναι συγκρίσιμο ή καλύτερο από την ακρίβεια εκτίμησης εκπαιδευμένων διαιτολόγων. Σε συνδυασμό με τη verified βάση δεδομένων της Nutrola, αυτό παράγει εκτιμήσεις θερμίδων που είναι σημαντικά πιο αξιόπιστες από την χειροκίνητη καταγραφή, η οποία σύμφωνα με έρευνες υποεκτιμά την πρόσληψη κατά 10 έως 45 τοις εκατό.
Ποια έρευνα και ποια σύνολα δεδομένων τροφοδοτούν την τεχνητή νοημοσύνη αναγνώρισης τροφίμων της Nutrola;
Η τεχνολογία της Nutrola βασίζεται σε θεμελιώδη έρευνα υπολογιστικής όρασης, συμπεριλαμβανομένων των συνελικτικών νευρωνικών δικτύων που έχουν επικυρωθεί στο ImageNet, αρχιτεκτονικών ανίχνευσης αντικειμένων όπως το Faster R-CNN και το DETR, και σε σύνολα δεδομένων τροφίμων όπως το Food-101 και το UECFOOD-256. Το σύστημα αντλεί επίσης από την έρευνα εκτίμησης βάθους με μονοκυτταρική εικόνα για τον προσδιορισμό μερίδας και από την έρευνα ενεργής μάθησης για τη συνεχή βελτίωση του μοντέλου. Όλα τα διατροφικά δεδομένα επαληθεύονται με αξιόπιστες πηγές όπως το USDA FoodData Central.
Μπορεί η Nutrola να αναγνωρίσει πολλαπλά τρόφιμα σε ένα μόνο πιάτο;
Ναι. Η Nutrola χρησιμοποιεί πολυδιάστατη ανίχνευση και σημασιολογικό διαχωρισμό για να αναγνωρίσει και να αναλύσει ξεχωριστά κάθε στοιχείο τροφίμου σε μια μόνο φωτογραφία. Είτε το πιάτο σας περιέχει δύο στοιχεία είτε οκτώ, το σύστημα απομονώνει το καθένα, το κατηγοριοποιεί ανεξάρτητα, εκτιμά τη μερίδα του και επιστρέφει μια διατροφική ανάλυση ανά στοιχείο μαζί με το συνολικό γεύμα.
Πώς διαχειρίζεται η Nutrola τρόφιμα από διαφορετικές κουζίνες και πολιτισμούς;
Η Nutrola συνδυάζει δεδομένα εκπαίδευσης ευρείας κάλυψης με στοχευμένη συλλογή δεδομένων για υποεκπροσωπούμενες κουζίνες και τεχνικές λίγων παραδειγμάτων που επιτρέπουν στο μοντέλο να μάθει νέες κατηγορίες τροφίμων από σχετικά μικρούς αριθμούς παραδειγμάτων. Οι διορθώσεις χρηστών από τη παγκόσμια βάση χρηστών της Nutrola τροφοδοτούν συνεχώς τη διαδικασία εκπαίδευσης, διασφαλίζοντας ότι η ακρίβεια βελτιώνεται για τα συγκεκριμένα πιάτα που τρώνε οι άνθρωποι σε κάθε περιοχή και πολιτισμό τροφίμων.
Βελτιώνεται η αναγνώριση τροφίμων της Nutrola με την πάροδο του χρόνου;
Ναι. Η Nutrola χρησιμοποιεί ενεργή μάθηση, μια στρατηγική μηχανικής μάθησης όπου το σύστημα εντοπίζει τις εικόνες για τις οποίες έχει τη μικρότερη εμπιστοσύνη και προτεραιοποιεί αυτές για ανασκόπηση από ειδικούς και επανεκπαίδευση. Σε συνδυασμό με συγκεντρωμένη ανατροφοδότηση χρηστών από εκατομμύρια γεύματα που καταγράφονται παγκοσμίως, αυτό σημαίνει ότι το μοντέλο βελτιώνεται συνεχώς. Κάθε γεύμα που καταγράφετε συμβάλλει στη βελτίωση της αναγνώρισης της Nutrola για όλους τους χρήστες.
Έτοιμοι να Μεταμορφώσετε την Παρακολούθηση της Διατροφής σας;
Εγγραφείτε σε χιλιάδες που έχουν μεταμορφώσει το ταξίδι της υγείας τους με το Nutrola!