Πώς η Τεχνητή Νοημοσύνη Εκτιμά Μεγέθη Μερίδων από Φωτογραφίες: Μια Τεχνική Βαθιά Εξέταση
Μια λεπτομερής ματιά στο πώς η Τεχνητή Νοημοσύνη χρησιμοποιεί την εκτίμηση βάθους, αντικείμενα αναφοράς και μοντελοποίηση όγκου για να εκτιμήσει τα μεγέθη μερίδων τροφίμων από μια μόνο φωτογραφία.
Η αναγνώριση του τι υπάρχει στο πιάτο σας είναι μόνο το μισό της πρόκλησης για την παρακολούθηση θερμίδων με τη βοήθεια της Τεχνητής Νοημοσύνης. Το άλλο μισό, και ίσως το πιο δύσκολο, είναι να καταλάβετε πόσο φαγητό υπάρχει. Μια μερίδα ζυμαρικών μπορεί να έχει 200 θερμίδες ή 800 θερμίδες, ανάλογα με το μέγεθος της μερίδας. Η σωστή εκτίμηση είναι αυτή που διαχωρίζει ένα χρήσιμο εργαλείο παρακολούθησης διατροφής από μια απλή καινοτομία.
Αυτό το άρθρο εξετάζει σε βάθος πώς τα συστήματα Τεχνητής Νοημοσύνης εκτιμούν τα μεγέθη μερίδων από φωτογραφίες, καλύπτοντας την εκτίμηση βάθους, την κλιμάκωση με αντικείμενα αναφοράς, τη μοντελοποίηση όγκου και τις συνεχιζόμενες προκλήσεις που αντιμετωπίζουν οι ερευνητές και οι μηχανικοί για να κάνουν αυτές τις εκτιμήσεις πιο ακριβείς.
Γιατί η Εκτίμηση Μερίδων Είναι Πιο Δύσκολη από την Αναγνώριση Τροφίμων
Η αναγνώριση τροφίμων είναι θεμελιωδώς ένα πρόβλημα κατηγοριοποίησης. Το σύστημα πρέπει να επιλέξει από ένα πεπερασμένο σύνολο κατηγοριών τροφίμων. Αντίθετα, η εκτίμηση μερίδων είναι ένα πρόβλημα παλινδρόμησης. Το σύστημα πρέπει να προβλέψει μια συνεχόμενη τιμή (γραμμάρια ή χιλιοστόλιτρα) μόνο από οπτικές πληροφορίες.
Πολλοί παράγοντες καθιστούν αυτή τη διαδικασία ιδιαίτερα δύσκολη:
- Το πρόβλημα 2D προς 3D: Μια φωτογραφία συμπιέζει την τρισδιάστατη πραγματικότητα σε μια δισδιάστατη εικόνα. Οι πληροφορίες βάθους χάνονται, καθιστώντας δύσκολη τη διάκριση μεταξύ ενός λεπτού στρώματος φαγητού και μιας παχιάς στοίβας.
- Μεταβλητή πυκνότητα: Ένα φλιτζάνι φύλλων και ένα φλιτζάνι granola έχουν τον ίδιο όγκο αλλά εντελώς διαφορετικά βάρη και περιεχόμενο θερμίδων. Το σύστημα πρέπει να εκτιμήσει τόσο τον όγκο όσο και την πυκνότητα.
- Παραμόρφωση προοπτικής: Η γωνία λήψης μιας φωτογραφίας επηρεάζει το πώς φαίνονται τα φαγητά. Ένα πιάτο που έχει φωτογραφηθεί από πάνω φαίνεται διαφορετικό από το ίδιο πιάτο που έχει φωτογραφηθεί από γωνία 45 μοιρών.
- Ασαφής κλιμάκωση: Χωρίς ένα γνωστό αντικείμενο αναφοράς στο πλαίσιο, δεν υπάρχει τρόπος να προσδιοριστεί το απόλυτο μέγεθος. Μια κοντινή λήψη ενός μικρού μπισκότου μπορεί να φαίνεται παρόμοια με μια φωτογραφία μιας μεγάλης πίτσας που έχει τραβηχτεί από πιο μακριά.
Εκτίμηση Βάθους από Μια Μοναδική Εικόνα
Μία από τις βασικές ανακαλύψεις που επιτρέπουν την εκτίμηση μερίδων από φωτογραφίες είναι η μοναδική εκτίμηση βάθους, η ικανότητα να αντλείται πληροφορία βάθους από μια μόνο εικόνα χωρίς να απαιτούνται στερεοσκοπικές κάμερες ή εξειδικευμένος εξοπλισμός.
Πώς Λειτουργεί η Μοναδική Εκτίμηση Βάθους
Το ανθρώπινο οπτικό σύστημα αντλεί βάθος από πολλές ενδείξεις: επικάλυψη αντικειμένων (τα πιο κοντά αντικείμενα καλύπτουν τα πιο μακριά), σχετική μεγέθυνση (μικρότερα αντικείμενα είναι συνήθως πιο μακριά), κλίμακες υφής (οι υφές γίνονται πιο λεπτές σε μεγαλύτερες αποστάσεις) και ατμοσφαιρική προοπτική (τα μακρινά αντικείμενα φαίνονται πιο θολά).
Τα μοντέλα βαθιάς μάθησης μπορούν να μάθουν αυτές τις ίδιες ενδείξεις από μεγάλες βάσεις δεδομένων εικόνων που συνδυάζονται με χάρτες βάθους. Όταν εφαρμόζονται στη φωτογραφία τροφίμων, αυτά τα μοντέλα μπορούν να εκτιμήσουν ποια μέρη ενός τροφίμου είναι πιο κοντά στην κάμερα και ποια είναι πιο μακριά, ανακατασκευάζοντας αποτελεσματικά το τρισδιάστατο σχήμα του φαγητού από μια επίπεδη εικόνα.
Χάρτες Βάθους και Όγκος Τροφίμων
Ένας χάρτης βάθους ανα assigns a distance value to every pixel in the image. Για την εκτίμηση τροφίμων, αυτό σημαίνει ότι το σύστημα μπορεί να προσδιορίσει ότι το κέντρο ενός μπολ σούπας είναι σε ένα βάθος ενώ η άκρη του μπολ είναι σε άλλο βάθος. Η διαφορά μεταξύ αυτών των βάθους, σε συνδυασμό με τα ανιχνευμένα όρια του φαγητού, επιτρέπει στο σύστημα να εκτιμήσει τον όγκο.
Οι σύγχρονες κάμερες smartphone με αισθητήρες LiDAR (διαθέσιμες σε πρόσφατα μοντέλα iPhone Pro και iPad Pro) μπορούν να καταγράψουν πραγματικά δεδομένα βάθους μαζί με την έγχρωμη εικόνα, παρέχοντας πολύ πιο ακριβείς πληροφορίες βάθους από την αλγοριθμική εκτίμηση μόνο. Οι εφαρμογές παρακολούθησης τροφίμων μπορούν να εκμεταλλευτούν αυτόν τον εξοπλισμό όταν είναι διαθέσιμος, ενώ επιστρέφουν σε μοναδική εκτίμηση σε συσκευές χωρίς αισθητήρες βάθους.
Κλιμάκωση με Αντικείμενα Αναφοράς
Χωρίς ένα γνωστό σημείο αναφοράς, το απόλυτο μέγεθος των αντικειμένων σε μια φωτογραφία είναι ασαφές. Η κλιμάκωση με αντικείμενα αναφοράς επιλύει αυτό το πρόβλημα χρησιμοποιώντας αντικείμενα γνωστών διαστάσεων για να καθορίσει μια κλίμακα μεγέθους για ολόκληρη την εικόνα.
Κοινά Αντικείμενα Αναφοράς
| Αντικείμενο Αναφοράς | Γνωστή Διάσταση | Όφελος Ακρίβειας |
|---|---|---|
| Τυπικό πιάτο δείπνου | 25-27 εκ. διάμετρος | Καθορίζει τη συνολική κλίμακα για το γεύμα |
| Πιρούνι ή κουτάλι | ~19 εκ. μήκος | Παρέχει κλίμακα ακόμα και σε κοντινές λήψεις |
| Πιστωτική κάρτα | 8.56 x 5.4 εκ. | Ακριβές και καθολικά τυποποιημένο |
| Smartphone | Διαφέρει ανά μοντέλο αλλά γνωστό | Μπορεί να ανιχνευθεί και να μετρηθεί αλγοριθμικά |
| Χέρι | Διαφέρει αλλά μπορεί να εκτιμηθεί από δημογραφικά στοιχεία | Προσεγγιστική κλίμακα όταν δεν υπάρχει άλλο σημείο αναφοράς |
Αυτόματη Ανίχνευση Αναφοράς
Αντί να απαιτεί από τους χρήστες να τοποθετήσουν μια κάρτα αναφοράς δίπλα στο φαγητό τους (που προσθέτει τριβή και αποθαρρύνει τη χρήση), τα σύγχρονα συστήματα προσπαθούν να ανιχνεύσουν αυτόματα κοινά αντικείμενα αναφοράς. Πιάτα, μπολ, μαχαιροπίρουνα και τραπέζια εμφανίζονται συχνά σε φωτογραφίες φαγητού και μπορούν να χρησιμεύσουν ως αναφορές μεγέθους αν το σύστημα μπορεί να τα αναγνωρίσει.
Το σύστημα εκτίμησης μερίδων της Nutrola αναζητά αυτόματα πιάτα, μπολ και μαχαιροπίρουνα στο πλαίσιο για να καθορίσει την κλίμακα. Όταν αυτά τα αντικείμενα ανιχνεύονται, το σύστημα χρησιμοποιεί τις τυπικές τους διαστάσεις για να καλιμπράρει το μέγεθος των τροφίμων. Όταν δεν βρεθεί αντικείμενο αναφοράς, το σύστημα βασίζεται σε μάθηση σχετικά με τις τυπικές μερίδες τροφίμων και μπορεί να ζητήσει από τον χρήστη να επιβεβαιώσει.
Καλιμπράρισμα με Πιάτο
Μια ιδιαίτερα αποτελεσματική προσέγγιση είναι η καλιμπράρισμα με πιάτο. Τα τυπικά πιάτα δείπνου στις περισσότερες χώρες κυμαίνονται σε στενές διαστάσεις (25 έως 27 εκ. διάμετρος). Ανιχνεύοντας το ελλειπτικό περίγραμμα ενός πιάτου στην εικόνα και υποθέτοντας ένα τυπικό μέγεθος, το σύστημα μπορεί να καθορίσει μια αξιόπιστη κλίμακα για όλα όσα υπάρχουν στο πιάτο.
Αυτή η προσέγγιση λειτουργεί καλά γιατί τα πιάτα είναι σχεδόν πάντα παρόντα σε φωτογραφίες γευμάτων, το ελλειπτικό τους σχήμα είναι εύκολο να ανιχνευθεί ανεξαρτήτως γωνίας κάμερας, και η παραμόρφωση προοπτικής της έλλειψης κωδικοποιεί πληροφορίες σχετικά με την γωνία της κάμερας, που βοηθά στη διόρθωση των προοπτικών επιδράσεων στο φαγητό.
Τεχνικές Εκτίμησης Όγκου
Αφού το σύστημα έχει αναγνωρίσει το φαγητό, εκτιμήσει το βάθος και καθορίσει την κλίμακα, πρέπει να συνδυάσει αυτές τις πληροφορίες για να εκτιμήσει τον όγκο κάθε τροφίμου.
Γεωμετρικά Πρωτότυπα
Μια προσέγγιση είναι να προσεγγίσουμε τα τρόφιμα ως συνδυασμούς απλών γεωμετρικών σχημάτων:
- Κύλινδροι για ψηλά τρόφιμα όπως ποτά, στοιβαγμένα pancakes ή στρώματα κέικ
- Ημισφαίρια για στρογγυλά τρόφιμα όπως κουταλιές ρυζιού, σωρούς πουρέ ή μερίδες παγωτού
- Ορθογώνια πρίσματα για φέτες ψωμιού, κομμάτια τυριού ή μπάρες
- Κωνικά κομμένα για μπολ σούπας ή δημητριακών (το σχήμα του μπολ βοηθά στον καθορισμό του όγκου)
- Άτυπα πολύεδρα για τρόφιμα με πολύπλοκα σχήματα όπως πόδια κοτόπουλου ή ολόκληρα φρούτα
Το σύστημα εφαρμόζει ένα ή περισσότερα από αυτά τα πρωτότυπα στην ανιχνευμένη περιοχή τροφίμου και υπολογίζει τον όγκο από τα προσαρμοσμένα σχήματα και την καθορισμένη κλίμακα.
Ανακατασκευή με Voxel
Μια πιο εξελιγμένη προσέγγιση περιλαμβάνει την ανακατασκευή με voxel, όπου το τρόφιμο μοντελοποιείται ως ένα τρισδιάστατο πλέγμα μικρών κύβων (voxels). Κάθε voxel ταξινομείται ως περιέχον φαγητό ή κενό με βάση τον χάρτη βάθους και τη μάσκα τμηματοποίησης. Ο συνολικός όγκος είναι στη συνέχεια το άθροισμα όλων των voxels που περιέχουν φαγητό.
Αυτή η μέθοδος χειρίζεται καλύτερα τα άτυπα σχήματα από τα γεωμετρικά πρωτότυπα αλλά απαιτεί περισσότερους υπολογιστικούς πόρους. Είναι ιδιαίτερα χρήσιμη για τρόφιμα που δεν συμμορφώνονται με απλά σχήματα, όπως ένα σκισμένο κομμάτι ψωμιού ή ένα ανώμαλα κομμένο κομμάτι φρούτου.
Νευρωνική Εκτίμηση Όγκου
Η πιο πρόσφατη προσέγγιση παραλείπει εντελώς την ρητή γεωμετρική μοντελοποίηση. Αντίθετα, ένα νευρωνικό δίκτυο εκπαιδεύεται από την αρχή για να προβλέψει τον όγκο τροφίμου απευθείας από την εικόνα. Αυτά τα μοντέλα μαθαίνουν έμμεσες αναπαραστάσεις γεωμετρίας τροφίμων από μεγάλες βάσεις δεδομένων εικόνων τροφίμων που συνδυάζονται με πραγματικές μετρήσεις βάρους.
Αυτή η προσέγγιση έχει δείξει υποσχόμενα αποτελέσματα γιατί μπορεί να συλλάβει λεπτές οπτικές ενδείξεις που σχετίζονται με τον όγκο, όπως ο τρόπος που το φως αντανακλάται από την επιφάνεια ενός υγρού ή το μοτίβο σκιάς που ρίχνεται από έναν σωρό φαγητού. Επίσης, αποφεύγει την συσσώρευση σφαλμάτων που μπορεί να προκύψει όταν η εκτίμηση βάθους, η τμηματοποίηση και η γεωμετρική προσαρμογή εκτελούνται ως ξεχωριστά βήματα.
Από τον Όγκο στο Βάρος και στις Θερμίδες
Η εκτίμηση του όγκου δεν είναι το τελικό βήμα. Για να υπολογίσει τις θερμίδες, το σύστημα πρέπει να μετατρέψει τον όγκο σε βάρος (χρησιμοποιώντας την πυκνότητα των τροφίμων) και το βάρος σε θερμίδες (χρησιμοποιώντας δεδομένα διατροφικής σύνθεσης).
Βάσεις Δεδομένων Πυκνότητας Τροφίμων
Διαφορετικά τρόφιμα έχουν πολύ διαφορετικές πυκνότητες. Ένα φλιτζάνι ελαίου ζυγίζει περίπου 220 γραμμάρια, ενώ ένα φλιτζάνι αλευριού ζυγίζει περίπου 120 γραμμάρια και ένα φλιτζάνι ποπ κορν ζυγίζει περίπου 8 γραμμάρια. Ακριβή δεδομένα πυκνότητας είναι απαραίτητα για τη μετατροπή εκτιμήσεων όγκου σε εκτιμήσεις βάρους.
Τα συστήματα παραγωγής διατηρούν βάσεις δεδομένων που αντιστοιχούν τα τρόφιμα με τις πυκνότητές τους, λαμβάνοντας υπόψη τις διακυμάνσεις στη μέθοδο παρασκευής (μαγειρεμένα vs. ωμά, κομμένα vs. ολόκληρα) και τους κοινούς τρόπους σερβιρίσματος.
| Τρόφιμο | Πυκνότητα (g/mL) | Βάρος 1 Φλιτζανιού (g) | Θερμίδες ανά Φλιτζάνι |
|---|---|---|---|
| Νερό | 1.00 | 237 | 0 |
| Γάλα πλήρες | 1.03 | 244 | 149 |
| Μαγειρεμένο λευκό ρύζι | 0.74 | 175 | 205 |
| Ωμό σπανάκι | 0.13 | 30 | 7 |
| Φυστικοβούτυρο | 1.09 | 258 | 1517 |
| Ελαιόλαδο | 0.92 | 218 | 1909 |
Διατροφική Σύνθεση
Αφού το σύστημα έχει μια εκτίμηση βάρους σε γραμμάρια, αναζητά τη διατροφική σύνθεση ανά γραμμάριο από μια ολοκληρωμένη βάση δεδομένων τροφίμων. Αυτές οι βάσεις δεδομένων προέρχονται συνήθως από αξιόπιστες πηγές όπως το USDA FoodData Central, συμπληρωμένες με δεδομένα από κατασκευαστές τροφίμων και περιφερειακές βάσεις δεδομένων διατροφής.
Η βάση δεδομένων της Nutrola καλύπτει περισσότερα από 1.3 εκατομμύρια τρόφιμα, συμπεριλαμβανομένων επώνυμων προϊόντων, μενού εστιατορίων και γενικών τροφίμων με πλήρη προφίλ μακρο- και μικροθρεπτικών συστατικών. Αυτή η ολοκληρωμένη κάλυψη διασφαλίζει ότι μόλις αναγνωριστεί ένα τρόφιμο και μια μερίδα, ο υπολογισμός της διατροφής είναι ακριβής.
Προκλήσεις Ακρίβειας και Πώς Αντιμετωπίζονται
Παρά την πολυπλοκότητα αυτών των τεχνικών, η εκτίμηση μερίδων από φωτογραφίες παραμένει μια ατελής επιστήμη. Η κατανόηση των πηγών σφαλμάτων βοηθά στην καθορισμένη προσδοκία και αναδεικνύει τις συνεχείς βελτιώσεις στον τομέα.
Γνωστές Πηγές Σφάλματος
Μεταβολή γωνίας κάμερας: Η ίδια μερίδα φαίνεται διαφορετική ανάλογα με το αν η φωτογραφία έχει ληφθεί από πάνω, από γωνία 45 μοιρών ή από κοντά στο επίπεδο του τραπεζιού. Οι φωτογραφίες από πάνω γενικά παρέχουν τις πιο ακριβείς εκτιμήσεις γιατί ελαχιστοποιούν την παραμόρφωση προοπτικής, αλλά πολλοί χρήστες φυσικά κρατούν το τηλέφωνό τους υπό γωνία.
Κρυφό φαγητό: Το φαγητό που κρύβεται κάτω από σάλτσες, τυριά ή άλλες επικάλυψεις δεν μπορεί να μετρηθεί οπτικά. Το σύστημα πρέπει να υποθέσει την κρυφή μερίδα με βάση τον ορατό τύπο πιάτου και την τυπική παρασκευή.
Άτυποι περιέκτες: Μη τυπικά μπολ, κούπες και περιέκτες καθιστούν την κλιμάκωση με βάση το πιάτο λιγότερο αξιόπιστη. Μια μικρή μερίδα σε ένα μεγάλο μπολ φαίνεται διαφορετική από μια μεγάλη μερίδα σε ένα μικρό μπολ, ακόμα κι αν η περιοχή του φαγητού φαίνεται παρόμοια.
Διαφορές ατομικής παρασκευής: Δύο άτομα που ετοιμάζουν "ένα μπολ βρώμης" μπορεί να χρησιμοποιούν εντελώς διαφορετικές ποσότητες βρώμης και νερού, με αποτέλεσμα την ίδια φαινομενική ποσότητα αλλά διαφορετικό περιεχόμενο θερμίδων.
Στρατηγικές για Βελτίωση της Ακρίβειας
Λήψη από πολλές γωνίες: Ορισμένα συστήματα ζητούν από τους χρήστες να τραβήξουν φωτογραφίες από πολλές γωνίες, επιτρέποντας στερεοσκοπική ανακατασκευή και πιο ακριβή εκτίμηση όγκου. Αυτό βελτιώνει σημαντικά την ακρίβεια αλλά προσθέτει τριβή στη διαδικασία καταγραφής.
Κύκλοι ανατροφοδότησης χρηστών: Όταν οι χρήστες ζυγίζουν το φαγητό τους και επιβεβαιώνουν ή διορθώνουν την εκτιμημένη μερίδα, αυτό δημιουργεί δεδομένα εκπαίδευσης που βελτιώνουν το μοντέλο με την πάροδο του χρόνου. Η Nutrola ενθαρρύνει τους χρήστες να επιβεβαιώνουν περιοδικά τις μερίδες με μια κουζίνα ζυγαριά για να καλιμπράρουν τόσο την Τεχνητή Νοημοσύνη όσο και τη δική τους αντίληψη μερίδων.
Συγκείμενα προτεραιότητας: Το σύστημα μπορεί να χρησιμοποιήσει πληροφορίες συγκείμενου για να βελτιώσει τις εκτιμήσεις. Αν ο χρήστης βρίσκεται σε μια συγκεκριμένη αλυσίδα εστιατορίων, το σύστημα μπορεί να χρησιμοποιήσει γνωστές μερίδες. Αν ο χρήστης καταγράφει τακτικά ένα συγκεκριμένο πρωινό, το σύστημα μπορεί να μάθει την τυπική του μερίδα.
Εκτιμήσεις με βάση την εμπιστοσύνη: Αντί να παρουσιάζουν έναν μόνο αριθμό, οι εξελιγμένα συστήματα παρέχουν ένα εύρος εμπιστοσύνης. Αν το σύστημα είναι αβέβαιο για τη μερίδα, μπορεί να παρουσιάσει την εκτίμηση ως εύρος (για παράδειγμα, 300 έως 450 θερμίδες) και να ζητήσει από τον χρήστη να παρέχει πρόσθετες πληροφορίες.
Τρέχοντα Πρότυπα Ακρίβειας
Έρευνες από το Διεθνές Συνέδριο Ανάλυσης και Επεξεργασίας Εικόνας έχουν δείξει ότι τα συστήματα εκτίμησης όγκου τροφίμων τελευταίας τεχνολογίας επιτυγχάνουν μέσες απόλυτες ποσοστιαίες αποκλίσεις μεταξύ 15 και 25 τοις εκατό. Για σύγκριση, μελέτες έχουν δείξει ότι εκπαιδευμένοι διαιτολόγοι που εκτιμούν μερίδες από φωτογραφίες επιτυγχάνουν σφάλματα περίπου 10 έως 15 τοις εκατό, ενώ οι μη εκπαιδευμένοι μέσοι όροι σφαλμάτων 30 έως 50 τοις εκατό.
Αυτό σημαίνει ότι η εκτίμηση μερίδων από την Τεχνητή Νοημοσύνη είναι ήδη σημαντικά καλύτερη από ό,τι μπορεί να κάνει ο περισσότερος κόσμος χωρίς βοήθεια και πλησιάζει την ακρίβεια των εκπαιδευμένων επαγγελματιών. Συνδυασμένη με το πλεονέκτημα ταχύτητας και ευκολίας, αυτό καθιστά την παρακολούθηση με τη βοήθεια της Τεχνητής Νοημοσύνης μια σημαντική βελτίωση σε σχέση με την χειροκίνητη καταγραφή για την πλειονότητα των χρηστών.
Ο Ρόλος της Καλιμπράρισής Χρήστη
Ένας λιγότερο εκτιμημένος τομέας της εκτίμησης μερίδων από την Τεχνητή Νοημοσύνη είναι ο ρόλος της καλιμπράρισής του χρήστη με την πάροδο του χρόνου. Καθώς ένας χρήστης καταγράφει γεύματα και περιστασιακά παρέχει διορθώσεις, το σύστημα δημιουργεί ένα προφίλ των τυπικών μεγεθών μερίδων και προτιμήσεων τροφίμων του.
Για τους τακτικούς χρήστες, αυτό σημαίνει ότι το σύστημα γίνεται σταδιακά πιο ακριβές. Αν τείνετε να σερβίρετε μεγαλύτερες μερίδες ρυζιού από το μέσο όρο, το σύστημα μαθαίνει να προσαρμόζει προς τα πάνω τις εκτιμήσεις σας για το ρύζι. Αν συνήθως χρησιμοποιείτε λιγότερο λάδι από τη стандартική συνταγή, το σύστημα μπορεί να το λάβει υπόψη.
Η Nutrola εκμεταλλεύεται αυτή την εξατομίκευση για να παρέχει ολοένα και πιο προσαρμοσμένες εκτιμήσεις μερίδων όσο περισσότερο χρησιμοποιείτε την εφαρμογή. Οι νέοι χρήστες επωφελούνται από μέσους όρους σε επίπεδο πληθυσμού, ενώ οι έμπειροι χρήστες λαμβάνουν εξατομικευμένες εκτιμήσεις που έχουν καλιμπραριστεί στις συγκεκριμένες συνήθειές τους.
Πρακτικές Συμβουλές για Πιο Ακριβείς Εκτιμήσεις Μερίδων
Ενώ η Τεχνητή Νοημοσύνη αναλαμβάνει το μεγαλύτερο μέρος της δουλειάς, οι χρήστες μπορούν να βελτιώσουν την ακρίβεια ακολουθώντας μερικές απλές οδηγίες:
- Φωτογραφίστε από πάνω όταν είναι δυνατόν. Οι φωτογραφίες από πάνω παρέχουν τις περισσότερες πληροφορίες σχετικά με την επιφάνεια του φαγητού και ελαχιστοποιούν την παραμόρφωση προοπτικής.
- Συμπεριλάβετε ολόκληρο το πιάτο στο καρέ. Η άκρη του πιάτου χρησιμεύει ως κρίσιμο αντικείμενο αναφοράς για την κλίμακα.
- Αποφύγετε τις εξαιρετικά κοντινές λήψεις. Το σύστημα χρειάζεται συγκείμενο για να κρίνει το μέγεθος. Μια φωτογραφία που δείχνει μόνο το φαγητό χωρίς κανένα περιβάλλον αντικείμενο δεν προσφέρει καμία αναφορά κλίμακας.
- Φωτογραφίστε πριν από την ανάμειξη. Μια σαλάτα με ορατά ξεχωριστά συστατικά είναι πιο εύκολη στην ανάλυση από μια που έχει ανακατευτεί.
- Χρησιμοποιήστε καλό φωτισμό. Οι σκιές και ο χαμηλός φωτισμός μπορούν να αποκρύψουν τα όρια του φαγητού και τις ενδείξεις βάθους.
- Επιβεβαιώστε ή διορθώστε περιστασιακά. Χρησιμοποιώντας μια κουζίνα ζυγαριά μία φορά την εβδομάδα για να επιβεβαιώσετε την εκτίμηση της Τεχνητής Νοημοσύνης βοηθά στην καλιμπράρισή της και στη δική σας διαίσθηση.
Συχνές Ερωτήσεις
Πόσο ακριβής είναι η εκτίμηση μερίδων από την Τεχνητή Νοημοσύνη σε σύγκριση με τη χρήση ζυγαριάς τροφίμων;
Μια ζυγαριά τροφίμων παρέχει ακρίβεια εντός 1 έως 2 γραμμαρίων, που είναι πολύ πιο ακριβής από οποιαδήποτε μέθοδο οπτικής εκτίμησης. Η εκτίμηση μερίδων από την Τεχνητή Νοημοσύνη από φωτογραφίες επιτυγχάνει συνήθως ακρίβεια εντός 15 έως 25 τοις εκατό του πραγματικού βάρους. Ωστόσο, το πλεονέκτημα ευκολίας της εκτίμησης Τεχνητής Νοημοσύνης (που διαρκεί 2 δευτερόλεπτα σε σύγκριση με 30 δευτερόλεπτα ή περισσότερα με μια ζυγαριά) σημαίνει ότι περισσότεροι άνθρωποι παρακολουθούν πραγματικά με συνέπεια, κάτι που συχνά έχει μεγαλύτερη σημασία για τα μακροχρόνια αποτελέσματα από την τέλεια ακρίβεια.
Επηρεάζει η γωνία της κάμερας την ακρίβεια της εκτίμησης μερίδων;
Ναι, σημαντικά. Οι φωτογραφίες από πάνω (κοιτάζοντας κατευθείαν το πιάτο) παρέχουν την καλύτερη ακρίβεια γιατί δείχνουν την πλήρη επιφάνεια του φαγητού με ελάχιστη παραμόρφωση προοπτικής. Οι φωτογραφίες που λαμβάνονται από γωνία 45 μοιρών είναι οι πιο κοινές και εξακολουθούν να παράγουν καλές εκτιμήσεις. Πολύ χαμηλές γωνίες (κοντά στο επίπεδο του τραπεζιού) είναι οι λιγότερο ακριβείς γιατί το μεγαλύτερο μέρος του φαγητού αποκρύπτεται από την μπροστινή άκρη του πιάτου.
Μπορεί η Τεχνητή Νοημοσύνη να εκτιμήσει μερίδες για υγρά όπως σούπες και smoothies;
Τα υγρά παρουσιάζουν μια μοναδική πρόκληση γιατί ο όγκος τους καθορίζεται από τον περιέκτη τους και όχι από το σχήμα τους. Τα συστήματα Τεχνητής Νοημοσύνης εκτιμούν τις μερίδες υγρών αναγνωρίζοντας τον τύπο του περιέκτη και το επίπεδο πλήρωσης. Ένα μπολ σούπας γεμάτο μέχρι πάνω έχει διαφορετικό όγκο από ένα γεμάτο μέχρι τη μέση. Η ακρίβεια είναι γενικά καλή όταν ο περιέκτης έχει τυπικό σχήμα αλλά λιγότερο αξιόπιστη με ασυνήθιστους περιέκτες.
Γιατί η Τεχνητή Νοημοσύνη μερικές φορές υπερεκτιμά ή υποεκτιμά τη μερίδα μου;
Κοινές αιτίες υπερεκτίμησης περιλαμβάνουν πυκνή τοποθέτηση που φαίνεται μεγαλύτερη από ό,τι είναι, γαρνιτούρες που προσθέτουν οπτικό όγκο χωρίς σημαντικές θερμίδες και τη χρήση μεγάλων πιάτων που κάνουν το σύστημα να υποθέτει ότι υπάρχει περισσότερη τροφή. Κοινές αιτίες υποεκτίμησης περιλαμβάνουν φαγητό που κρύβεται κάτω από άλλα φαγητά, πυκνά τρόφιμα πλούσια σε θερμίδες που φαίνονται μικρά και ασυνήθιστους τρόπους σερβιρίσματος. Η παροχή ανατροφοδότησης όταν οι εκτιμήσεις είναι λανθασμένες βοηθά το σύστημα να βελτιωθεί.
Χρειάζομαι ένα τηλέφωνο με αισθητήρα LiDAR για ακριβή παρακολούθηση μερίδων;
Όχι. Ενώ τα τηλέφωνα με LiDAR μπορούν να παρέχουν πιο ακριβείς πληροφορίες βάθους, τα σύγχρονα μοντέλα Τεχνητής Νοημοσύνης μπορούν να εκτιμήσουν το βάθος αρκετά καλά από μια τυπική εικόνα κάμερας. Η διαφορά ακρίβειας μεταξύ τηλεφώνων με LiDAR και τυπικών έχει μειωθεί καθώς η εκτίμηση βάθους μέσω λογισμικού έχει βελτιωθεί. Η Nutrola λειτουργεί ακριβώς σε οποιοδήποτε σύγχρονο smartphone.
Πώς το σύστημα χειρίζεται τρόφιμα που είναι στοιβαγμένα ή στρωμένα;
Για ορατά στοιβαγμένα τρόφιμα όπως pancakes ή στρωμένα σάντουιτς, το σύστημα μπορεί να μετρήσει τα στρώματα και να εκτιμήσει το πάχος από το προφίλ πλευράς. Για τρόφιμα με κρυφά στρώματα όπως η λαζάνια ή τα burritos, το σύστημα βασίζεται σε μοντέλα σύνθεσης που εκτιμούν τη συνήθη εσωτερική δομή με βάση την ορατή εξωτερική επιφάνεια και τον τύπο του πιάτου.
Έτοιμοι να Μεταμορφώσετε την Παρακολούθηση της Διατροφής σας;
Εγγραφείτε σε χιλιάδες που έχουν μεταμορφώσει το ταξίδι της υγείας τους με το Nutrola!