Η Βάση Αποδείξεων για την Παρακολούθηση Διατροφής με AI: Τι Λέει η Δημοσιευμένη Έρευνα για την Ακρίβεια

Μια συστηματική ανασκόπηση της δημοσιευμένης έρευνας σχετικά με την ακρίβεια αναγνώρισης τροφίμων και εκτίμησης θερμίδων από AI, καλύπτοντας τις αναφορές βαθμολόγησης βαθιάς μάθησης, τις κλινικές μελέτες επικύρωσης και τη σύγκριση της παρακολούθησης με AI με τις παραδοσιακές μεθόδους.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Πόσο ακριβής είναι η παρακολούθηση διατροφής με AI; Είναι ένα ερώτημα που απασχολεί οποιονδήποτε βασίζεται σε μια εφαρμογή καταμέτρησης θερμίδων μέσω φωτογραφιών για να διαχειριστεί τη διατροφή του, και η δημοσιευμένη έρευνα μπορεί να απαντήσει σε αυτό με αυξανόμενη ακρίβεια.

Τα τελευταία δέκα χρόνια, ερευνητές στους τομείς της πληροφορικής, της διατροφής και της κλινικής ιατρικής έχουν δοκιμάσει συστήματα αναγνώρισης τροφίμων με AI σε σύγκριση με δεδομένα αναφοράς, έχουν μετρήσει τα σφάλματα εκτίμησης θερμίδων υπό ελεγχόμενες συνθήκες και έχουν συγκρίνει την παρακολούθηση με τη βοήθεια AI με παραδοσιακές μεθόδους. Αυτό το άρθρο συνοψίζει τα βασικά ευρήματα από αυτή τη σειρά ερευνών, καλύπτοντας τις αναφορές βαθμολόγησης βαθιάς μάθησης, τις μελέτες εκτίμησης μερίδας, τις κλινικές δοκιμές επικύρωσης και τους αναγνωρισμένους περιορισμούς των τρεχουσών συστημάτων.

Η Εξέλιξη της Έρευνας Αναγνώρισης Τροφίμων με AI

Πρώιμη Αξιολόγηση Διατροφής με Εικόνες

Η έννοια της χρήσης εικόνων για την αξιολόγηση της διατροφικής πρόσληψης προϋπήρχε της βαθιάς μάθησης. Πρώιμες έρευνες εξερεύνησαν αν οι φωτογραφίες γευμάτων, που αναλύθηκαν από εκπαιδευμένους ανθρώπινους αξιολογητές, μπορούσαν να παράγουν ακριβείς διατροφικές εκτιμήσεις.

Ο Martin και οι συνεργάτες του (2009) ανέπτυξαν τη Μέθοδο Απομακρυσμένης Φωτογραφίας Τροφίμων (RFPM) και απέδειξαν ότι οι εκπαιδευμένοι αναλυτές μπορούσαν να εκτιμήσουν την θερμιδική πρόσληψη από φωτογραφίες τροφίμων με ακρίβεια 3 έως 10 τοις εκατό σε σχέση με τις μετρημένες τιμές. Αυτό καθόρισε μια σημαντική βάση: η οπτική αξιολόγηση τροφίμων, ακόμη και από ανθρώπους, μπορούσε να επιτύχει ουσιαστική ακρίβεια όταν γινόταν συστηματικά (British Journal of Nutrition, 101(3), 446-456).

Η μετάβαση στην αυτοματοποιημένη ανάλυση εικόνας ξεκίνησε σοβαρά με την εφαρμογή της βαθιάς μάθησης σε καθήκοντα αναγνώρισης τροφίμων γύρω στο 2014-2016, όταν τα συνελικτικά νευρωνικά δίκτυα άρχισαν να υπερτερούν δραματικά σε σχέση με τις παραδοσιακές προσεγγίσεις υπολογιστικής όρασης σε βαθμολογίες ταξινόμησης εικόνας.

Η Επανάσταση της Βαθιάς Μάθησης στην Αναγνώριση Τροφίμων

Οι Mezgec και Koroušić Seljak (2017) δημοσίευσαν μία από τις πρώτες συνολικές ανασκοπήσεις των προσεγγίσεων βαθιάς μάθησης για την αναγνώριση τροφίμων στο περιοδικό Nutrients, 9(7), 657. Η ανασκόπηση κάλυψε την ταχεία πρόοδο από χειροποίητα οπτικά χαρακτηριστικά σε μοντέλα βαθιάς μάθησης και κατέγραψε βελτιώσεις ακρίβειας 20 έως 30 ποσοστιαίων μονάδων σε σχέση με τις παραδοσιακές μεθόδους σε τυπικά σύνολα δεδομένων.

Η ανασκόπηση εντόπισε αρκετές βασικές τεχνικές εξελίξεις που οδηγούν αυτές τις βελτιώσεις: η μεταφορά μάθησης από μεγάλα σύνολα δεδομένων εικόνας (ιδιαίτερα το ImageNet), οι τεχνικές αύξησης δεδομένων ειδικές για εικόνες τροφίμων και οι αρχιτεκτονικές πολυδιάστατης μάθησης που μπορούσαν ταυτόχρονα να αναγνωρίζουν είδη τροφίμων και να εκτιμούν μερίδες (Mezgec & Koroušić Seljak, 2017).

Βαθμολογικά Σύνολα Δεδομένων και Μετρικές Ακρίβειας

Ο τομέας της αναγνώρισης τροφίμων με AI βασίζεται σε τυποποιημένα βαθμολογικά σύνολα δεδομένων για να μετρήσει και να συγκρίνει την απόδοση των μοντέλων. Η κατανόηση αυτών των βαθμολογιών παρέχει συμφραζόμενα για τις αξιώσεις ακρίβειας που κάνουν οι εφαρμογές διατροφής.

Βασικά Βαθμολογικά Σύνολα Δεδομένων

Σύνολο Δεδομένων Έτος Τρόφιμα Εικόνες Σκοπός
Food-101 2014 101 κατηγορίες 101,000 Ταξινόμηση τροφίμων
ISIA Food-500 2020 500 κατηγορίες 399,726 Μεγάλης κλίμακας ταξινόμηση τροφίμων
Nutrition5k 2021 5,006 πιάτα 5,006 Εκτίμηση θερμίδων και μακροθρεπτικών
ECUST Food-45 2017 45 κατηγορίες 4,500 Εκτίμηση όγκου και θερμίδων
UEC Food-100 2012 100 κατηγορίες 14,361 Αναγνώριση ιαπωνικών τροφίμων
UEC Food-256 2014 256 κατηγορίες 31,395 Εκτεταμένη αναγνώριση ιαπωνικών τροφίμων
Food-2K 2021 2,000 κατηγορίες 1,036,564 Μεγάλης κλίμακας παγκόσμια αναγνώριση τροφίμων

Food-101: Η Τυπική Βαθμολογία

Το Food-101, που εισήχθη από τους Bossard et al. (2014) στην Ευρωπαϊκή Διάσκεψη Υπολογιστικής Όρασης, περιέχει 101,000 εικόνες σε 101 κατηγορίες τροφίμων. Έχει γίνει το de facto πρότυπο για την αξιολόγηση μοντέλων αναγνώρισης τροφίμων.

Η απόδοση στο Food-101 έχει βελτιωθεί σταθερά:

Μοντέλο / Προσέγγιση Έτος Ακρίβεια Top-1
Random Forest (βάση) 2014 50.8%
GoogLeNet (βελτιστοποιημένο) 2016 79.2%
ResNet-152 2017 88.4%
EfficientNet-B7 2020 93.0%
Vision Transformer (ViT-L) 2021 94.7%
Μεγάλα προεκπαιδευμένα μοντέλα 2023-2025 95-97%

Η πρόοδος από το 50.8% σε πάνω από 95% ακρίβεια Top-1 σε περίπου μια δεκαετία δείχνει τη δραματική επίδραση της βαθιάς μάθησης στην απόδοση αναγνώρισης τροφίμων (Bossard et al., 2014, ECCV).

ISIA Food-500: Κλιμάκωση στην Πραγματική Ποικιλία

Οι Min et al. (2020) εισήγαγαν το ISIA Food-500, ένα σημαντικά μεγαλύτερο και πιο ποικιλόμορφο σύνολο δεδομένων με 500 κατηγορίες τροφίμων και σχεδόν 400,000 εικόνες. Η απόδοση σε αυτό το πιο απαιτητικό βαθμολογικό σύνολο είναι χαμηλότερη από το Food-101 λόγω του μεγαλύτερου αριθμού κατηγοριών και της ενδοκατηγορικής μεταβλητότητας, αλλά τα μοντέλα αιχμής επιτυγχάνουν ακόμη ακρίβεια πάνω από 65% και ακρίβεια top-5 πάνω από 85% (Proceedings of the 28th ACM International Conference on Multimedia).

Η διαφορά στην απόδοση μεταξύ του Food-101 και του ISIA Food-500 υπογραμμίζει μια σημαντική πραγματικότητα: η ακρίβεια των βαθμολογιών σε περιορισμένο αριθμό κατηγοριών δεν μεταφράζεται άμεσα σε πραγματική ακρίβεια σε όλο το φάσμα των παγκόσμιων κουζινών.

Nutrition5k: Από την Ταξινόμηση στην Εκτίμηση Θερμίδων

Οι Thames et al. (2021) εισήγαγαν το Nutrition5k στην IEEE/CVF Διάσκεψη Υπολογιστικής Όρασης και Αναγνώρισης Προτύπων (CVPR). Σε αντίθεση με τα προηγούμενα σύνολα δεδομένων που επικεντρώνονταν στην ταξινόμηση τροφίμων, το Nutrition5k παρέχει δεδομένα θερμίδων και μακροθρεπτικών στοιχείων για 5,006 πιάτα, το καθένα φωτογραφημένο από πάνω και από πλάγια γωνία και ζυγισμένο σε ακριβή ζυγαριά.

Αυτό το σύνολο δεδομένων επέτρεψε στους ερευνητές να αξιολογήσουν άμεσα την ακρίβεια εκτίμησης θερμίδων. Τα αρχικά αποτελέσματα έδειξαν μέσες απόλυτες ποσοστιαίες αποκλίσεις για την εκτίμηση θερμίδων που κυμαίνονταν από 15 έως 25 τοις εκατό χρησιμοποιώντας μόνο εικόνες, με σημαντική βελτίωση όταν συνδυάζονταν η ανάλυση εικόνας με πληροφορίες βάθους ή πολυθέσιμες εικόνες (Thames et al., 2021).

Εκτίμηση Μερίδας: Το Πιο Δύσκολο Πρόβλημα

Η ακρίβεια αναγνώρισης τροφίμων είναι μόνο μέρος της εξίσωσης. Η εκτίμηση του πόσο από κάθε τροφή είναι παρούσα — η εκτίμηση μερίδας — αναγνωρίζεται ευρέως ως η πιο δύσκολη εργασία.

Έρευνα για την Ακρίβεια Εκτίμησης Μερίδας

Οι Fang et al. (2019) στο Πανεπιστήμιο Purdue ανέπτυξαν ένα σύστημα εκτίμησης μερίδας βασισμένο σε εικόνες και το αξιολόγησαν σε σύγκριση με ζυγισμένα αρχεία τροφίμων. Το σύστημά τους πέτυχε μέσες ποσοστιαίες αποκλίσεις 15 έως 25 τοις εκατό για την εκτίμηση βάρους μερίδας σε μια σειρά τροφίμων. Η μελέτη σημείωσε ότι η ακρίβεια εκτίμησης διαφέρει σημαντικά ανάλογα με τον τύπο τροφής, με στερεές, κανονικά σχηματισμένες τροφές (όπως στήθος κοτόπουλου) να εκτιμώνται πιο ακριβώς από αμορφωμένες τροφές (όπως ένα stir-fry) (IEEE Journal of Biomedical and Health Informatics, 23(5), 1972-1979).

Οι Lo et al. (2020) εξερεύνησαν προσεγγίσεις ανίχνευσης βάθους για την εκτίμηση μερίδας, χρησιμοποιώντας στερεοσκοπικές κάμερες και δομημένο φως για να δημιουργήσουν 3D μοντέλα τροφίμων. Αυτή η προσέγγιση μείωσε τα σφάλματα εκτίμησης μερίδας κατά 20 έως 35 τοις εκατό σε σύγκριση με μεθόδους μόνο 2D, υποδεικνύοντας ότι οι προσεγγίσεις πολλαπλών αισθητήρων αντιπροσωπεύουν μια υποσχόμενη κατεύθυνση για τη βελτίωση της ακρίβειας (Proceedings of the IEEE International Conference on Multimedia and Expo).

Σφάλμα Εκτίμησης Μερίδας κατά Τύπο Τροφής

Τύπος Τροφής Τυπικό Σφάλμα Εκτίμησης Λόγος
Στερεές πρωτεΐνες (κοτόπουλο, μπριζόλα) 8-15% Κανονικό σχήμα, ορατά όρια
Δημητριακά και άμυλα (ρύζι, ζυμαρικά) 10-20% Μεταβλητή πυκνότητα και στυλ σερβιρίσματος
Λαχανικά (σαλάτα, μπρόκολο) 12-22% Ακανόνιστα σχήματα, μεταβλητή συσκευασία
Υγρά και σούπες 15-25% Μεταβλητότητα βάθους και δοχείου
Μικτά πιάτα (κάρυ, στιφάδο) 18-30% Τα συστατικά δεν είναι ορατά ξεχωριστά
Σάλτσες και έλαια 25-40% Συχνά αόρατα ή μερικώς ορατά

Η συνεπής διαπίστωση σε όλες τις μελέτες είναι ότι τα κρυμμένα ή αμορφωμένα τρόφιμα παράγουν μεγαλύτερα σφάλματα εκτίμησης, κάτι που αποτελεί εγγενή περιορισμό οποιασδήποτε προσέγγισης βασισμένης σε εικόνες.

AI vs. Χειροκίνητη Παρακολούθηση: Συγκριτικές Μελέτες

Πολλές μελέτες έχουν συγκρίνει άμεσα την ακρίβεια της διατροφικής αξιολόγησης με τη βοήθεια AI με τις παραδοσιακές χειροκίνητες μεθόδους.

Συστηματική Σύγκριση

Οι Boushey et al. (2017) ανέφεραν τις μεθόδους διατροφικής αξιολόγησης με τη βοήθεια τεχνολογίας και κατέληξαν στο συμπέρασμα ότι οι προσεγγίσεις βασισμένες σε εικόνες παρήγαγαν εκτιμήσεις θερμίδων με σφάλματα 10 έως 20 τοις εκατό, σε σύγκριση με 20 έως 50 τοις εκατό υποεκτίμηση που καταγράφηκε για την χειροκίνητη αυτοαναφορά χρησιμοποιώντας επικυρώσεις με διπλά επισημασμένο νερό (Journal of the Academy of Nutrition and Dietetics, 117(8), 1156-1166).

Μέθοδος Τυπικό Σφάλμα Θερμίδων Κατεύθυνση Σφάλματος
AI παρακολούθηση με φωτογραφίες 10-20% Μικτή (υπερ και υπο)
Χειροκίνητη καταγραφή εφαρμογής 20-35% Συστηματική υποεκτίμηση
Χειρόγραφη διατροφή 25-50% Συστηματική υποεκτίμηση
24ωρη διατροφική ανάκληση 15-30% Συστηματική υποεκτίμηση
Ζυγισμένο αρχείο τροφίμων 2-5% Ελάχιστο (χρυσό πρότυπο)

Μια κρίσιμη διάκριση είναι η κατεύθυνση του σφάλματος. Οι χειροκίνητες μέθοδοι υποεκτιμούν σταθερά την πρόσληψη, επειδή οι άνθρωποι ξεχνούν στοιχεία, υποτιμούν μερίδες και παραλείπουν σνακ. Τα σφάλματα που προκύπτουν από το AI είναι πιο τυχαία — μερικές φορές υπερεκτιμώντας, μερικές φορές υποεκτιμώντας — γεγονός που σημαίνει ότι είναι λιγότερο πιθανό να παράγουν τη συστηματική προκατάληψη που μπορεί να ανατρέψει τον προγραμματισμό της διατροφής.

Κλινική Επικύρωση

Οι Pendergast et al. (2017) αξιολόγησαν το Αυτόματο Εργαλείο Αυτοδιαχείρισης 24ωρης Διατροφικής Αξιολόγησης (ASA24) και διαπίστωσαν ότι η τεχνολογία βελτίωσε την ακρίβεια και την πληρότητα των αρχείων διατροφής σε σύγκριση με τις μη υποστηριζόμενες μεθόδους. Η μελέτη απέδειξε ότι η τεχνολογία μείωσε τόσο το βάρος χρόνου για τους συμμετέχοντες όσο και το ποσοστό των ελλιπών ή μη ολοκληρωμένων καταχωρήσεων (Journal of Nutrition, 147(11), 2128-2137).

Αναγνωρισμένοι Περιορισμοί στη Λογοτεχνία

Η ερευνητική κοινότητα έχει είναι διαφανής σχετικά με τους τρέχοντες περιορισμούς της διατροφικής αξιολόγησης με AI.

Γνωστές Προκλήσεις

Κρυμμένα συστατικά: Οι Zhu et al. (2015) σημείωσαν ότι οι μέθοδοι βασισμένες σε εικόνες δεν μπορούν να ανιχνεύσουν αξιόπιστα συστατικά που δεν είναι ορατά στις φωτογραφίες, όπως έλαια μαγειρέματος, βούτυρο που χρησιμοποιείται στην προετοιμασία ή ζάχαρη που διαλύεται σε ποτά. Αυτός ο περιορισμός αντιπροσωπεύει ένα σημαντικό ποσοστό του σφάλματος εκτίμησης θερμίδων που παρατηρείται σε μελέτες επικύρωσης (IEEE Journal of Biomedical and Health Informatics, 19(1), 377-388).

Πολιτισμική και περιφερειακή προκατάληψη: Οι Ege και Yanai (2019) απέδειξαν ότι τα μοντέλα αναγνώρισης τροφίμων που εκπαιδεύτηκαν κυρίως σε δυτικά σύνολα δεδομένων τροφίμων αποδίδουν σημαντικά χειρότερα σε ασιακές, αφρικανικές και μεσανατολικές κουζίνες. Η ακρίβεια Top-1 μπορεί να μειωθεί κατά 15 έως 25 ποσοστιαίες μονάδες όταν αξιολογούνται σε υποεκπροσωπούμενες κουζίνες, υπογραμμίζοντας την ανάγκη για παγκόσμια ποικιλία δεδομένων εκπαίδευσης (Proceedings of ACM Multimedia).

Εκτίμηση μερίδας σε μικτά πιάτα: Οι Lu et al. (2020) διαπίστωσαν ότι το σφάλμα εκτίμησης θερμίδων σχεδόν διπλασιάζεται όταν μεταβαίνουμε από εικόνες μεμονωμένων τροφίμων σε πιάτα με μικτά τρόφιμα. Η πρόκληση της αποδοχής όγκου σε επιμέρους συστατικά εντός ενός μικτού πιάτου παραμένει ένα ανοιχτό ερευνητικό πρόβλημα (Nutrients, 12(11), 3368).

Αμφιβολία βάθους από μία μόνο εικόνα: Χωρίς πληροφορίες βάθους, η εκτίμηση του τρισδιάστατου όγκου τροφίμων από μια μόνο δισδιάστατη φωτογραφία απαιτεί υποθέσεις σχετικά με το ύψος και την πυκνότητα των τροφίμων. Οι Meyers et al. (2015) στην Google Research κατέγραψαν αυτό ως έναν θεμελιώδη περιορισμό πληροφοριών της μονοδιάστατης αξιολόγησης βασισμένης σε εικόνες (Proceedings of IEEE International Conference on Computer Vision Workshops).

Πώς Εφαρμόζει η Nutrola Αυτή την Έρευνα

Η προσέγγιση της Nutrola στην παρακολούθηση διατροφής με AI ενημερώνεται από τα ευρήματα που καταγράφονται σε αυτή τη σειρά ερευνών.

Αντιμετώπιση Γνωστών Περιορισμών

Βασισμένη στην αναγνώριση της λογοτεχνίας σχετικά με τα κρυμμένα συστατικά ως βασικό κενό ακρίβειας, η Nutrola συνδυάζει την αναγνώριση φωτογραφιών με φυσική γλώσσα, επιτρέποντας στους χρήστες να προσθέτουν σημειώσεις σχετικά με τις μεθόδους μαγειρέματος, τα έλαια και τις σάλτσες που η κάμερα δεν μπορεί να δει. Αυτή η πολυδιάστατη προσέγγιση αντιμετωπίζει τον περιορισμό που εντόπισαν οι Zhu et al. (2015).

Για να καταπολεμήσει την πολιτισμική προκατάληψη που καταγράφηκε από τους Ege και Yanai (2019), τα μοντέλα αναγνώρισης τροφίμων της Nutrola εκπαιδεύονται σε ένα παγκόσμια ποικιλόμορφο σύνολο δεδομένων που καλύπτει κουζίνες από 47 χώρες, με συνεχή επέκταση σε υποεκπροσωπούμενες περιοχές.

Για την εκτίμηση μερίδας, η Nutrola χρησιμοποιεί κλίμακα αναφοράς αντικειμένων και μοντέλα μερίδας που έχουν εκπαιδευτεί με βάση δεδομένα ζυγισμένων τροφίμων, βασισμένα στις προσεγγίσεις που επικυρώθηκαν από τους Fang et al. (2019) και Lo et al. (2020).

Συνεχής Βελτίωση Μέσω Ανατροφοδότησης Χρηστών

Όταν οι χρήστες διορθώνουν μια αναγνώριση τροφίμου ή προσαρμόζουν μια εκτίμηση μερίδας, αυτή η ανατροφοδότηση συγκεντρώνεται για να βελτιώσει την ακρίβεια του μοντέλου με την πάροδο του χρόνου. Αυτό το κλειστό σύστημα ανατροφοδότησης αντικατοπτρίζει την προσέγγιση συνεχούς μάθησης που προτείνουν οι Mezgec και Koroušić Seljak (2017) για την πραγματική εφαρμογή συστημάτων αναγνώρισης τροφίμων.

Επαληθευμένη Βάση Δεδομένων ως Θεμέλιο Ακρίβειας

Ανεξαρτήτως του πόσο ακριβώς αναγνωρίζει το AI ένα είδος τροφίμου, οι διατροφικές τιμές που επιστρέφονται είναι μόνο τόσο καλές όσο η βάση δεδομένων στην οποία αναφέρονται. Η χρήση μιας επαληθευμένης βάσης δεδομένων πολλαπλών πηγών με πάνω από 3 εκατομμύρια καταχωρήσεις, διασταυρωμένων με κυβερνητικές βάσεις δεδομένων όπως το USDA FoodData Central, διασφαλίζει ότι τα σωστά αναγνωρισμένα τρόφιμα επιστρέφουν ακριβή διατροφικά δεδομένα.

Η Πορεία Βελτίωσης της Ακρίβειας

Η τάση στην έρευνα αναγνώρισης τροφίμων με AI είναι έντονα ανοδική. Η ακρίβεια Top-1 στο Food-101 έχει βελτιωθεί από 50.8% σε πάνω από 95% σε μια δεκαετία. Τα σφάλματα εκτίμησης θερμίδων έχουν μειωθεί από 25-40% στα πρώιμα συστήματα σε 10-20% στις τρέχουσες προσεγγίσεις αιχμής. Τα συστήματα πολλαπλών αισθητήρων και πολυθέσιμων συνεχίζουν να επεκτείνουν τα όρια της ακρίβειας εκτίμησης μερίδας.

Καθώς τα σύνολα δεδομένων εκπαίδευσης γίνονται πιο ποικιλόμορφα, τα μοντέλα γίνονται πιο εξελιγμένα και η τεχνολογία αισθητήρων στις κινητές συσκευές βελτιώνεται, το χάσμα μεταξύ της εκτίμησης AI και της πραγματικής αλήθειας θα συνεχίσει να μειώνεται. Η έρευνα που ανασκοπήθηκε εδώ παρέχει εμπιστοσύνη ότι η παρακολούθηση διατροφής με AI είναι ήδη πιο ακριβής από τις χειροκίνητες μεθόδους που χρησιμοποιούν οι περισσότεροι άνθρωποι, και βελτιώνεται με ταχύ ρυθμό.

Συχνές Ερωτήσεις

Πόσο ακριβής είναι η αναγνώριση τροφίμων με AI στη δημοσιευμένη έρευνα;

Στο τυπικό βαθμολογικό σύνολο Food-101, τα μοντέλα βαθιάς μάθησης αιχμής επιτυγχάνουν ακρίβεια πάνω από 95% για την αναγνώριση τροφίμων. Σε πιο ποικιλόμορφα και απαιτητικά βαθμολογικά σύνολα όπως το ISIA Food-500 με 500 κατηγορίες τροφίμων, η ακρίβεια top-5 ξεπερνά το 85%. Η πραγματική ακρίβεια σε εφαρμογές καταναλωτών κυμαίνεται συνήθως μεταξύ αυτών των βαθμολογιών, ανάλογα με την ποικιλία των τροφίμων που συναντώνται.

Πώς συγκρίνεται η εκτίμηση θερμίδων με AI με την χειροκίνητη καταγραφή τροφίμων;

Η δημοσιευμένη έρευνα δείχνει ότι η παρακολούθηση με φωτογραφίες AI παράγει σφάλματα εκτίμησης θερμίδων 10 έως 20 τοις εκατό, ενώ η χειροκίνητη αυτοαναφορά υποεκτιμά την πρόσληψη κατά 20 έως 50 τοις εκατό σύμφωνα με μελέτες επικύρωσης με διπλά επισημασμένο νερό. Κρίσιμα, τα σφάλματα του AI τείνουν να είναι τυχαία κατανεμημένα, ενώ οι χειροκίνητες μέθοδοι συστηματικά υπολογίζουν λιγότερες θερμίδες.

Ποια είναι η μεγαλύτερη πηγή σφάλματος στην παρακολούθηση θερμίδων με AI;

Σύμφωνα με τη βιβλιογραφία έρευνας, τα κρυμμένα συστατικά (έλαια μαγειρέματος, βούτυρο, σάλτσες και ντρέσινγκ που δεν είναι ορατά στις φωτογραφίες) και η εκτίμηση μερίδας για μικτά πιάτα είναι οι μεγαλύτερες πηγές σφάλματος. Η αμφιβολία βάθους από μια μόνο εικόνα συμβάλλει επίσης, καθώς η εκτίμηση του τρισδιάστατου όγκου τροφίμων από μια δισδιάστατη φωτογραφία απαιτεί υποθέσεις σχετικά με το ύψος και την πυκνότητα των τροφίμων.

Τι είναι το σύνολο δεδομένων Food-101;

Το Food-101 είναι ένα βαθμολογικό σύνολο δεδομένων που εισήχθη από τους Bossard et al. το 2014 και περιέχει 101,000 εικόνες σε 101 κατηγορίες τροφίμων. Είναι το πιο ευρέως χρησιμοποιούμενο πρότυπο για την αξιολόγηση της απόδοσης μοντέλων αναγνώρισης τροφίμων και έχει διαδραματίσει καθοριστικό ρόλο στην παρακολούθηση της προόδου των προσεγγίσεων βαθιάς μάθησης από περίπου 50% σε πάνω από 95% ακρίβεια.

Λειτουργεί η αναγνώριση τροφίμων με AI εξίσου καλά για όλες τις κουζίνες;

Όχι. Η έρευνα από τους Ege και Yanai (2019) απέδειξε ότι τα μοντέλα που εκπαιδεύτηκαν κυρίως σε δυτικά σύνολα δεδομένων τροφίμων αποδίδουν σημαντικά χειρότερα σε ασιακές, αφρικανικές και μεσανατολικές κουζίνες, με πτώσεις ακρίβειας 15 έως 25 ποσοστιαίων μονάδων. Γι' αυτό είναι απαραίτητη η παγκόσμια ποικιλία δεδομένων εκπαίδευσης, και γι' αυτό η Nutrola εκπαιδεύει συγκεκριμένα σε εικόνες τροφίμων από 47 χώρες.

Είναι η παρακολούθηση θερμίδων με AI αρκετά ακριβής για κλινική χρήση;

Η έρευνα υποδεικνύει ότι ναι, με επιφυλάξεις. Οι Boushey et al. (2017) διαπίστωσαν ότι οι προσεγγίσεις βασισμένες σε εικόνες παρήγαγαν εκτιμήσεις θερμίδων με σφάλμα 10 έως 20 τοις εκατό, που είναι σημαντικά καλύτερο από την υποεκτίμηση 25 έως 50 τοις εκατό που είναι τυπική για την κλινική διατροφική αξιολόγηση. Για κλινικά περιβάλλοντα, η παρακολούθηση AI συνιστάται ως συμπλήρωμα και όχι ως πλήρης αντικατάσταση για την καθοδηγούμενη από διαιτολόγο αξιολόγηση.

Έτοιμοι να Μεταμορφώσετε την Παρακολούθηση της Διατροφής σας;

Εγγραφείτε σε χιλιάδες που έχουν μεταμορφώσει το ταξίδι της υγείας τους με το Nutrola!