Ο Παγκόσμιος Εγκέφαλος: Γιατί οι περισσότερες AI δεν αναγνωρίζουν το Biryani, τις Arepas και το Dal
Οι περισσότερες AI αναγνώρισης τροφίμων εκπαιδεύτηκαν σε μπέργκερ και σαλάτες. Δείτε γιατί αυτό δημιουργεί ένα τεράστιο κενό ακρίβειας για τις κουζίνες της Νότιας Ασίας, της Λατινικής Αμερικής και της Μέσης Ανατολής, και πώς τα παγκόσμια εκπαιδευμένα μοντέλα το κλείνουν.
Ρωτήστε τις περισσότερες εφαρμογές αναγνώρισης τροφίμων να αναγνωρίσουν ένα πιάτο κοτόπουλο biryani και πιθανότατα θα σας πουν "ρύζι με κρέας" ή, χειρότερα, "τηγανητό ρύζι." Η εκτίμηση θερμίδων που ακολουθεί θα είναι λανθασμένη κατά 200 έως 400 θερμίδες, καθώς το μοντέλο δεν έχει καμία αντίληψη για το γκι, το μαριναρισμένο ρύζι basmati ή τα τηγανητά κρεμμύδια που είναι ενσωματωμένα στο πιάτο.
Αυτό δεν είναι ένα περιθωριακό πρόβλημα. Σύμφωνα με τον ΟΗΕ, πάνω από 5,5 δισεκατομμύρια άνθρωποι ζουν εκτός Βόρειας Αμερικής και Ευρώπης. Τα καθημερινά τους γεύματα, από το νιγηριανό jollof rice μέχρι το περουβιανό ceviche και το ιαπωνικό okonomiyaki, είναι συστηματικά υποεκπροσωπημένα στα σύνολα δεδομένων που τροφοδοτούν την κυρίαρχη AI τροφίμων. Το αποτέλεσμα είναι μια τεχνολογία που λειτουργεί καλά για ένα cheeseburger αλλά αποτυγχάνει για την πλειοψηφία του παγκόσμιου πληθυσμού.
Το Πρόβλημα των Δεδομένων Εκπαίδευσης Κεντρικά Δυτικών
Τα μοντέλα υπολογιστικής όρασης μαθαίνουν από τις εικόνες στις οποίες εκπαιδεύονται. Τα πιο ευρέως χρησιμοποιούμενα δημόσια σύνολα δεδομένων τροφίμων διηγούνται μια σαφή ιστορία για το πού βρίσκεται η προκατάληψη.
Food-101, ένα από τα θεμελιώδη benchmarks στην έρευνα αναγνώρισης τροφίμων, περιέχει 101 κατηγορίες τροφίμων. Περίπου το 70% από αυτές είναι πιάτα Δυτικής Ευρώπης ή Βόρειας Αμερικής: μπέργκερ, σπαγγέτι μπολονέζ, σαλάτα Caesar, μηλόπιτα. Η κουζίνα της Νότιας Ασίας εκπροσωπείται από μία μόνο κατηγορία. Η αφρικανική κουζίνα δεν έχει καμία εκπροσώπηση.
UECFOOD-256, που αναπτύχθηκε στο Πανεπιστήμιο Ηλεκτρονικών Επικοινωνιών στο Τόκιο, επικεντρώνεται κυρίως σε ιαπωνικά πιάτα. Είναι εξαιρετική για την αναγνώριση ramen και tempura, αλλά προσφέρει σχεδόν τίποτα για τα νότια αμερικανικά ή δυτικοαφρικανικά φαγητά.
Όταν ένα μοντέλο εκπαιδευμένο κυρίως σε αυτά τα σύνολα δεδομένων συναντήσει ένα πιάτο chole bhature, έχει δύο επιλογές: να το ταξινομήσει λανθασμένα ή να το αντιστοιχίσει στο πλησιέστερο Δυτικό ισοδύναμο. Ούτε η μία ούτε η άλλη παράγουν ακριβή εκτίμηση θερμίδων.
Γιατί η Λανθασμένη Ταξινόμηση Κοστίζει Περισσότερο Από Ό,τι Νομίζετε
Η διαφορά θερμίδων μεταξύ μιας σωστής και μιας λανθασμένης ταξινόμησης μπορεί να είναι τεράστια. Σκεφτείτε αυτά τα πραγματικά παραδείγματα:
- Κοτόπουλο biryani ταξινομημένο ως "τηγανητό ρύζι κοτόπουλου": το biryani που φτιάχνεται με γκι και τηγανητά κρεμμύδια μπορεί να περιέχει 450 έως 600 θερμίδες ανά μερίδα. Μια τυπική καταχώρηση τηγανητού ρυζιού σε μια γενική βάση δεδομένων αναφέρει 300 έως 380 θερμίδες. Αυτό σημαίνει μια πιθανή υποεκτίμηση 200 θερμίδων ανά γεύμα.
- Arepas ταξινομημένες ως "ψωμί καλαμποκιού": μια γεμιστή arepa με τυρί και φασόλια μπορεί να φτάσει τις 500 θερμίδες. Μια φέτα ψωμιού καλαμποκιού καταγράφεται στις 170 έως 200 θερμίδες.
- Dal makhani ταξινομημένο ως "σούπα φακής": το βούτυρο και η κρέμα στο παραδοσιακό dal makhani το ανεβάζουν στις 350 έως 450 θερμίδες ανά φλιτζάνι. Μια βασική σούπα φακής έχει 160 έως 200 θερμίδες.
Καθ' όλη τη διάρκεια μιας εβδομάδας, αυτά τα λάθη συσσωρεύονται σε εκατοντάδες ή ακόμα και χιλιάδες λανθασμένες θερμίδες, αρκετές για να υπονομεύσουν πλήρως μια δίαιτα ή μια αύξηση βάρους.
Η Πολυπλοκότητα των Παγκόσμιων Πιάτων
Τα Δυτικά πιάτα τείνουν να έχουν σχετικά ορατά, διαχωρίσιμα συστατικά: μια πρωτεΐνη, έναν υδατάνθρακα, ένα λαχανικό. Πολλές μη Δυτικές κουζίνες παρουσιάζουν μια θεμελιωδώς διαφορετική πρόκληση για την υπολογιστική όραση.
Στρωματοποιημένες και Μικτές Προετοιμασίες
Το biryani είναι ένα στρωματοποιημένο πιάτο. Το ρύζι, το κρέας, τα μπαχαρικά, τα τηγανητά κρεμμύδια και το λίπος είναι ενσωματωμένα και όχι σερβιρισμένα ξεχωριστά. Μια φωτογραφία της επιφάνειας αποκαλύπτει μόνο την κορυφή. Το mole negro από το Oaxaca περιέχει πάνω από 30 συστατικά αλεσμένα σε μια μόνο σάλτσα. Το ταϊλανδέζικο massaman curry συνδυάζει γάλα καρύδας, ψητούς ξηρούς καρπούς, πατάτες και κρέας σε ένα αδιαχώριστο μείγμα.
Για να εκτιμήσει σωστά τις θερμίδες, ένα μοντέλο AI πρέπει να κατανοήσει όχι μόνο πώς φαίνεται το πιάτο, αλλά και τι περιέχει.
Περιφερειακή Διαφορετικότητα Μέσα στο Ίδιο Πιάτο
Το "χούμους" που παρασκευάζεται στον Λίβανο, τη Συρία, το Ισραήλ και την Τουρκία θα διαφέρει σημαντικά σε περιεκτικότητα ελαιολάδου, αναλογία ταχινιού και μέγεθος μερίδας. Ένα σπιτικό hyderabadi biryani διαφέρει από ένα εστιατορικό lucknowi biryani τόσο σε τεχνική όσο και σε πυκνότητα θερμίδων. Τα tamales διαφέρουν από περιοχή σε περιοχή σε όλη τη Μεξικό και την Κεντρική Αμερική, με γέμιση που κυμαίνεται από άπαχο κοτόπουλο έως χοιρινό σε λαρδί.
Ένα μοντέλο χρειάζεται περιφερειακό πλαίσιο, όχι μόνο αναγνώριση σε επίπεδο πιάτου, για να παράγει αξιόπιστες εκτιμήσεις.
Αόρατοι Συντελεστές Θερμίδων
Πολλές παγκόσμιες μαγειρικές παραδόσεις βασίζονται στη γενναιόδωρη χρήση μαγειρικών λιπαρών που γίνονται αόρατα στο τελικό πιάτο. Η ινδική κουζίνα χρησιμοποιεί γκι. Οι δυτικοαφρικανικές συνταγές συχνά χρησιμοποιούν φοινικέλαιο. Η λατινοαμερικανική κουζίνα περιλαμβάνει λαρδί και manteca. Η μεσανατολική κουζίνα χρησιμοποιεί γενναιόδωρες ποσότητες ελαιολάδου και βουτύρου.
Αυτά τα λιπαρά απορροφώνται στο πιάτο κατά την παρασκευή. Μια φωτογραφία δεν μπορεί να τα αποκαλύψει, αλλά μπορούν να αντιπροσωπεύουν το 30 έως 50% των συνολικών θερμίδων.
Πώς η Nutrola Προσεγγίζει την Αναγνώριση Παγκόσμιων Τροφίμων
Η δημιουργία μιας AI τροφίμων που λειτουργεί σε όλες τις κουζίνες απαιτεί συνειδητή προσπάθεια σε κάθε στάδιο: συλλογή δεδομένων, αρχιτεκτονική μοντέλου και μετα-αναγνώριση διατροφικών στοιχείων.
Ποικιλόμορφα Δεδομένα Εκπαίδευσης σε Μεγάλη Κλίμακα
Το σύνολο δεδομένων εκπαίδευσης της Nutrola περιλαμβάνει εικόνες τροφίμων από πάνω από 130 χώρες. Αντί να βασίζεται αποκλειστικά σε δημόσια διαθέσιμα Δυτικά σύνολα δεδομένων, το σύστημα ενσωματώνει εικόνες που συλλέγονται από περιοχές με ετικέτες επιβεβαιωμένες από διατροφολόγους. Αυτό σημαίνει ότι το μοντέλο έχει δει χιλιάδες παραδείγματα injera με tibs, όχι μόνο στοκ φωτογραφίες αλλά πραγματικά γεύματα φωτογραφημένα σε σπίτια και εστιατόρια σε όλη την Αιθιοπία και την Ερυθραία.
Διατροφικά Προφίλ σε Επίπεδο Πιάτου
Αντί να αποσυνθέτει κάθε πιάτο σε γενικά συστατικά, η Nutrola διατηρεί διατροφικά προφίλ για πιάτα όπως πραγματικά παρασκευάζονται. Το dal makhani δεν είναι "φακές + άγνωστο λίπος." Είναι ένα συγκεκριμένο πιάτο με γνωστή μέθοδο παρασκευής, και η εκτίμηση θερμίδων αντικατοπτρίζει το βούτυρο, την κρέμα και την τεχνική αργού μαγειρέματος που το καθορίζει.
Αυτή η προσέγγιση επεκτείνεται και σε περιφερειακές παραλλαγές. Το σύστημα διακρίνει μεταξύ ενός Kolkata-style biryani με πατάτες και ενός Hyderabadi dum biryani, καθώς τα θερμιδικά προφίλ είναι πραγματικά διαφορετικά.
Πολυδιάστατη Είσοδος για Κρυφά Συστατικά
Όταν μια φωτογραφία από μόνη της δεν είναι αρκετή, η Nutrola χρησιμοποιεί φωνητικές και κειμενικές προτροπές για να καλύψει τα κενά. Ένας χρήστης μπορεί να πει "αυτό μαγειρεύτηκε σε λάδι καρύδας" ή "υπάρχει τυρί μέσα στην arepa" και το σύστημα προσαρμόζει την εκτίμηση ανάλογα. Αυτή η πολυδιάστατη προσέγγιση αντιμετωπίζει το πρόβλημα των αόρατων θερμίδων που τα καθαρά φωτογραφικά συστήματα δεν μπορούν να λύσουν.
Τι Σημαίνει η Καλύτερη Παγκόσμια Αναγνώριση για τους Χρήστες
Για τα εκατομμύρια ανθρώπων που καταναλώνουν μη Δυτικές δίαιτες καθημερινά, η ακριβής AI τροφίμων δεν είναι μια πολυτέλεια. Είναι η διαφορά μεταξύ ενός παρακολουθητή διατροφής που λειτουργεί και ενός που υπονομεύει σιωπηλά τους στόχους τους.
Μια μελέτη του 2023 που δημοσιεύθηκε στο Journal of the Academy of Nutrition and Dietetics διαπίστωσε ότι η συμμόρφωση στην παρακολούθηση διατροφής μειώνεται κατά 40% όταν οι χρήστες θεωρούν την εφαρμογή τους ανακριβή. Αν ο παρακολουθητής σας συνεχώς αναγνωρίζει λανθασμένα τα γεύματά σας, σταματάτε να τον εμπιστεύεστε και στη συνέχεια σταματάτε να τον χρησιμοποιείτε.
Η ακριβής παγκόσμια αναγνώριση τροφίμων έχει σημασία και για τις διασπορικές κοινότητες. Ένας δεύτερης γενιάς Ινδοαμερικανός που τρώει ένα μείγμα dal, roti και σαλάτες κατά τη διάρκεια της εβδομάδας χρειάζεται μια εφαρμογή που να χειρίζεται και τις δύο κουζίνες με ίση ακρίβεια. Ένας Νιγηριανός φοιτητής στο Λονδίνο που μαγειρεύει egusi soup δεν θα πρέπει να εισάγει χειροκίνητα κάθε συστατικό επειδή η AI δεν έχει δει το πιάτο.
Ο Δρόμος Μπροστά για την AI Τροφίμων
Ο τομέας της αναγνώρισης τροφίμων κινείται προς μεγαλύτερη ποικιλία, αλλά η πρόοδος είναι άνιση. Νέα σύνολα δεδομένων όπως το ISIA Food-500 και το Nutrition5k επεκτείνουν την κάλυψη, και οι τεχνικές μεταφοράς μάθησης επιτρέπουν στα μοντέλα να προσαρμόζονται σε υποεκπροσωπημένες κουζίνες με μικρότερες ποσότητες επισημασμένων δεδομένων.
Ο βασικός διαφοροποιητής στο μέλλον θα είναι τα επαληθευμένα διατροφικά δεδομένα. Η αναγνώριση ότι ένα πιάτο είναι biryani είναι μόνο το μισό πρόβλημα. Η αντιστοίχιση αυτής της αναγνώρισης σε μια ακριβή διάσπαση θερμίδων και μακροθρεπτικών στοιχείων απαιτεί γνώση διατροφής που είναι ειδική για την περιοχή και ξεπερνά αυτά που μπορεί να προσφέρει μια γενική βάση δεδομένων τροφίμων.
Για οποιονδήποτε παρακολουθεί τη διατροφή του εκτός ενός τυπικού Δυτικού διαιτολογίου, η ερώτηση που πρέπει να κάνετε για οποιαδήποτε AI τροφίμων είναι απλή: εκπαιδεύτηκε αυτό το σύστημα στα τρόφιμά μου;
Συχνές Ερωτήσεις
Ποια είναι η καλύτερη εφαρμογή παρακολούθησης θερμίδων για ινδικό φαγητό;
Η καλύτερη εφαρμογή παρακολούθησης θερμίδων για ινδικό φαγητό χρειάζεται δύο πράγματα: ένα μοντέλο αναγνώρισης εκπαιδευμένο σε ποικιλόμορφα πιάτα της Νότιας Ασίας και μια διατροφική βάση δεδομένων που να λαμβάνει υπόψη τις παραδοσιακές μεθόδους παρασκευής. Οι εφαρμογές που εκπαιδεύτηκαν κυρίως σε Δυτικά σύνολα δεδομένων τείνουν να ταξινομούν λανθασμένα πιάτα όπως το biryani, το paneer tikka και το dal makhani ως γενικές καταχωρήσεις, παράγοντας σημαντικά λάθη θερμίδων. Το μοντέλο της Nutrola είναι εκπαιδευμένο σε εικόνες τροφίμων από πάνω από 130 χώρες και διατηρεί διατροφικά προφίλ που αντικατοπτρίζουν πραγματικές μεθόδους μαγειρέματος, συμπεριλαμβανομένων του γκι, της κρέμας και των περιφερειακών παραλλαγών.
Γιατί ο μετρητής θερμίδων μου δίνει λανθασμένα αποτελέσματα για εθνοτική κουζίνα;
Οι περισσότερες mainstream εφαρμογές παρακολούθησης τροφίμων χρησιμοποιούν μοντέλα αναγνώρισης εκπαιδευμένα σε σύνολα δεδομένων που κυριαρχούνται από Δυτικές κουζίνες όπως το Food-101. Όταν αυτά τα μοντέλα συναντούν άγνωστα πιάτα, είτε τα ταξινομούν λανθασμένα ως οπτικά παρόμοιο Δυτικό πιάτο είτε προχωρούν σε γενικές καταχωρήσεις βάσης δεδομένων. Τα διατροφικά προφίλ για αυτές τις λανθασμένες αντιστοιχίσεις είναι συχνά εκατοντάδες θερμίδες εκτός, ειδικά για πιάτα που παρασκευάζονται με μαγειρικά λιπαρά όπως το γκι, το φοινικέλαιο ή το γάλα καρύδας που είναι αόρατα στις φωτογραφίες.
Μπορεί η AI να παρακολουθεί με ακρίβεια τις θερμίδες για μεσανατολικό φαγητό;
Η AI μπορεί να παρακολουθεί με ακρίβεια το μεσανατολικό φαγητό αν το μοντέλο έχει εκπαιδευτεί ειδικά σε πιάτα όπως το shawarma, το fattoush, το kibbeh και το mansaf, και αν η διατροφική βάση δεδομένων λαμβάνει υπόψη την περιεκτικότητα σε ελαιόλαδο, ταχίνι και βούτυρο. Πολλά τρόφιμα στη μεσανατολική κουζίνα αντλούν σημαντικό ποσοστό των θερμίδων τους από λιπαρά που ενσωματώνονται κατά την παρασκευή. Ένα σύστημα που συνδυάζει την αναγνώριση φωτογραφιών με λεπτομέρειες παρασκευής που παρέχονται από τον χρήστη, όπως η ποσότητα ελαιολάδου που χρησιμοποιείται, θα παράγει πιο αξιόπιστες εκτιμήσεις.
Πώς η AI τροφίμων διαχειρίζεται πιάτα με πολλά μικτά συστατικά;
Σύνθετα πιάτα με μικτά ή στρωματοποιημένα συστατικά, όπως το mole, το biryani και οι σούπες, είναι από τις πιο δύσκολες προκλήσεις στην αναγνώριση τροφίμων. Τα καθαρά συστήματα βασισμένα σε εικόνες μπορούν να αναλύσουν μόνο την ορατή επιφάνεια, χάνοντας εσωτερικά στρώματα και απορροφημένα λιπαρά. Η προηγμένη AI τροφίμων αντιμετωπίζει αυτό το ζήτημα μέσω αναγνώρισης σε επίπεδο πιάτου, αναγνωρίζοντας το πλήρες πιάτο αντί για μεμονωμένα συστατικά, και μέσω πολυδιάστατης εισόδου όπου οι χρήστες μπορούν να προσθέσουν λεπτομέρειες σχετικά με κρυφά συστατικά μέσω κειμένου ή φωνής. Αυτή η συνδυασμένη προσέγγιση βελτιώνει σημαντικά την ακρίβεια για σύνθετες, πολυ-συστατικές παρασκευές.
Είναι ακριβή τα δεδομένα τροφίμων που προέρχονται από το πλήθος για διεθνείς κουζίνες;
Οι crowdsourced διατροφικές βάσεις δεδομένων τείνουν να είναι λιγότερο ακριβείς για διεθνείς κουζίνες. Οι καταχωρήσεις για πιάτα όπως το jollof rice, το ceviche ή το pad Thai υποβάλλονται συχνά από χρήστες που μπορεί να μην λαμβάνουν υπόψη τις περιφερειακές παραλλαγές, τα μαγειρικά λιπαρά ή τις αυθεντικές μεθόδους παρασκευής. Μια μοναδική καταχώρηση "biryani" δεν μπορεί να εκπροσωπήσει το θερμιδικό εύρος από ένα ελαφρύ λαχανικό biryani έως ένα πλούσιο mutton dum biryani. Οι επαληθευμένες βάσεις δεδομένων με διατροφικά προφίλ ειδικά για την περιοχή και λεπτομέρειες σε επίπεδο παραλλαγής παρέχουν σημαντικά πιο αξιόπιστα δεδομένα για μη Δυτικές κουζίνες.
Έτοιμοι να Μεταμορφώσετε την Παρακολούθηση της Διατροφής σας;
Εγγραφείτε σε χιλιάδες που έχουν μεταμορφώσει το ταξίδι της υγείας τους με το Nutrola!