Η Τεχνητή Νοημοσύνη σας Ονειρεύεται; Ο Κίνδυνος Χρήσης Γενικών LLMs για Διατροφικές Συμβουλές
Το ChatGPT και το Gemini μπορούν να γράψουν ποίηση, αλλά μπορούν να μετρήσουν τις θερμίδες σας; Δοκιμάσαμε γενικά LLMs σε σχέση με επαληθευμένα διατροφικά δεδομένα και τα αποτελέσματα θα πρέπει να ανησυχούν οποιονδήποτε τα χρησιμοποιεί για παρακολούθηση διατροφής.
"Γεια σου ChatGPT, πόσες θερμίδες έχει το κοτόπουλο stir-fry μου;"
Η απάντηση έρχεται αμέσως και με αυτοπεποίθηση: "Ένα τυπικό κοτόπουλο stir-fry περιέχει περίπου 350 έως 450 θερμίδες ανά μερίδα." Ακούγεται λογικό. Ακόμα και αναλύει τα μακροθρεπτικά στοιχεία. Αλλά υπάρχει ένα πρόβλημα: ο αριθμός είναι κατασκευασμένος. Όχι εκτιμημένος, όχι προσεγγισμένος, αλλά παραγμένος από στατιστικά μοτίβα σε δεδομένα κειμένου χωρίς καμία σύνδεση με μια πραγματική διατροφική βάση δεδομένων.
Αυτό είναι που οι ερευνητές AI αποκαλούν παραισθήση, και όταν συμβαίνει στο πλαίσιο της διατροφής, οι συνέπειες ξεπερνούν μια κακή έκθεση ή μια λάθος απάντηση σε κουίζ. Οι άνθρωποι παίρνουν πραγματικές διατροφικές αποφάσεις με βάση αυτούς τους αριθμούς, και αυτές οι αποφάσεις επηρεάζουν την υγεία τους.
Τι Σημαίνει "Παραισθήση" στο Πλαίσιο της Διατροφής
Στην ορολογία των μεγάλων γλωσσικών μοντέλων, μια παραισθήση συμβαίνει όταν το μοντέλο παράγει πληροφορίες που ακούγονται πειστικές αλλά είναι factually incorrect. Τα LLMs δεν αναζητούν γεγονότα σε μια βάση δεδομένων. Προβλέπουν την επόμενη πιο πιθανή λέξη σε μια ακολουθία με βάση τα μοτίβα που έχουν μάθει κατά την εκπαίδευση.
Όταν ρωτάτε το ChatGPT για την περιεκτικότητα σε θερμίδες ενός τροφίμου, δεν αναζητά στη βάση δεδομένων USDA FoodData Central ή δεν διασταυρώνει με την NCCDB. Δημιουργεί μια απάντηση που στατιστικά μοιάζει με τον τύπο της απάντησης που θα εμφανιζόταν στα δεδομένα εκπαίδευσής του. Μερικές φορές αυτή η απάντηση είναι κοντά στην αλήθεια. Άλλες φορές είναι εντελώς λανθασμένη.
Ο κίνδυνος είναι ότι το επίπεδο αυτοπεποίθησης είναι το ίδιο και στις δύο περιπτώσεις. Ένας παραισθητικός αριθμός θερμίδων διαβάζεται ακριβώς όπως ένας ακριβής.
Πού Τα Γενικά LLMs Αποτυγχάνουν στη Διατροφή
Διεξήγαμε μια σειρά δοκιμών ζητώντας από το ChatGPT (GPT-4o), το Gemini και το Claude να εκτιμήσουν τη διατροφική περιεκτικότητα κοινών γευμάτων. Στη συνέχεια, συγκρίναμε αυτές τις εκτιμήσεις με τις επαληθευμένες τιμές αναφοράς του USDA και τη βάση δεδομένων που έχει αξιολογηθεί από διατροφολόγους της Nutrola. Τα μοτίβα αποτυχίας ήταν συνεπή και αποκαλυπτικά.
Κατασκευασμένη Ακρίβεια
Ρωτήστε ένα LLM "πόσες θερμίδες έχει μια κουταλιά ελαιόλαδου;" και συχνά θα πάρετε μια σωστή απάντηση: περίπου 119 θερμίδες. Αυτό συμβαίνει επειδή αυτό το συγκεκριμένο γεγονός εμφανίζεται συχνά στα δεδομένα εκπαίδευσης.
Αλλά ρωτήστε "πόσες θερμίδες έχει το σπιτικό κοτόπουλο tikka masala με naan;" και το μοντέλο πρέπει να αυτοσχεδιάσει. Στις δοκιμές μας, το GPT-4o επέστρεψε εκτιμήσεις που κυμαίνονταν από 450 έως 750 θερμίδες για το ίδιο περιγραφόμενο γεύμα σε διαφορετικές συνομιλίες. Η πραγματική τιμή, υπολογισμένη από μια τυπική συνταγή με επαληθευμένα δεδομένα συστατικών, ήταν 685 θερμίδες. Μια απάντηση ήταν κοντά. Άλλες απέχουν πάνω από 200 θερμίδες.
Το μοντέλο δεν έχει τρόπο να σηματοδοτήσει ποιες απαντήσεις είναι αξιόπιστες αναζητήσεις και ποιες είναι αυτοσχεδιασμένες εικασίες.
Τυφλότητα Μεθόδου Προετοιμασίας
Τα LLMs έχουν ένα θεμελιώδες κενό γύρω από το πώς προετοιμάζεται το φαγητό. "Γαλοπούλα ψητή" και "τηγανητή γαλοπούλα σε βούτυρο" μπορεί να λάβουν παρόμοιες εκτιμήσεις θερμίδων επειδή το μοντέλο επικεντρώνεται στο κύριο συστατικό αντί στη μέθοδο μαγειρέματος.
Στις δοκιμές μας, όταν ρωτήσαμε για "σολομό" χωρίς να προσδιορίσουμε την προετοιμασία, οι απαντήσεις σταθερά προεπιλέγονταν σε μια ψητή ή ψητή εκτίμηση γύρω από 230 έως 280 θερμίδες για ένα φιλέτο 6 ουγκιών. Ένα φιλέτο σολομού 6 ουγκιών τηγανισμένο σε δύο κουταλιές βούτυρο με γλάσο teriyaki περιέχει στην πραγματικότητα κοντά στις 450 έως 500 θερμίδες. Η διαφορά είναι σημαντική για να υπονομεύσει μια θερμιδική έλλειψη με την πάροδο του χρόνου.
Παραισθήσεις Μεγέθους Μερίδας
Ίσως η πιο επικίνδυνη αποτυχία είναι η υπόθεση μεγέθους μερίδας. Όταν ρωτάτε ένα γενικό LLM για τις θερμίδες ενός φαγητού, πρέπει να υποθέσει ένα μέγεθος μερίδας. Αυτές οι υποθέσεις είναι ασυνεπείς και συχνά μη καθορισμένες.
"Ένα μπολ ζυμαρικών" μπορεί να εκτιμηθεί σε 300 έως 400 θερμίδες. Αλλά ποιο μπολ; Μια τυπική μερίδα 2 ουγκιών ξηρών ζυμαρικών με μαρινάρα είναι περίπου 280 θερμίδες. Μια μερίδα εστιατορίου 4 έως 6 ουγκιών ξηρών ζυμαρικών με σάλτσα φτάνει εύκολα τις 600 έως 900 θερμίδες. Το LLM επιλέγει έναν αριθμό στη μέση και τον παρουσιάζει ως γεγονός.
Συσσώρευση Σφαλμάτων σε Σχέδια Γευμάτων
Ο κίνδυνος κλιμακώνεται όταν οι χρήστες ζητούν από τα LLMs να δημιουργήσουν πλήρη σχέδια γευμάτων. Κάθε ατομική εκτίμηση φέρει σφάλμα, και αυτά τα σφάλματα συσσωρεύονται σε γεύματα και ημέρες. Ένα σχέδιο γευμάτων που ισχυρίζεται ότι παρέχει 1.800 θερμίδες την ημέρα μπορεί στην πραγματικότητα να παρέχει 2.200 ή 1.400 ανάλογα με την κατεύθυνση των σφαλμάτων.
Για κάποιον που χρησιμοποιεί ένα σχέδιο γευμάτων για να διαχειριστεί μια ιατρική κατάσταση όπως ο διαβήτης ή για να επιτύχει συγκεκριμένους στόχους αθλητικής απόδοσης, αυτό το επίπεδο ανακρίβειας δεν είναι απλώς μη χρήσιμο. Είναι δυνητικά επιβλαβές.
Γιατί Η Ειδικά Σχεδιασμένη Διατροφική AI Είναι Διαφορετική
Η διάκριση μεταξύ ενός γενικού LLM και ενός ειδικά σχεδιασμένου διατροφικού συστήματος είναι αρχιτεκτονική, όχι καλλωπιστική.
Αντιδράσεις Βασισμένες σε Βάσεις Δεδομένων
Η AI της Nutrola δεν παράγει εκτιμήσεις θερμίδων από γλωσσικά μοτίβα. Όταν εντοπίζει ένα τρόφιμο, το αντιστοιχεί σε μια επαληθευμένη καταχώριση σε μια διατροφική βάση δεδομένων. Η βάση δεδομένων περιέχει καταχωρίσεις που προέρχονται από το USDA FoodData Central, εθνικές διατροφικές βάσεις δεδομένων από πολλές χώρες και καταχωρίσεις που έχουν αξιολογηθεί από διατροφολόγους εσωτερικά.
Αυτό σημαίνει ότι το σύστημα δεν μπορεί να παραισθήσει έναν αριθμό θερμίδων. Ο αριθμός προέρχεται από μια συγκεκριμένη, ελέγξιμη καταχώριση βάσης δεδομένων, όχι από ένα στατιστικό γλωσσικό μοντέλο.
Οπτική Επαλήθευση
Όταν ένας χρήστης φωτογραφίζει ένα γεύμα, το μοντέλο υπολογιστικής όρασης της Nutrola αναγνωρίζει τα ατομικά τρόφιμα και εκτιμά τα μεγέθη μερίδας με βάση οπτική ανάλυση. Αυτή η οπτική θεμελίωση παρέχει έναν έλεγχο που τα LLMs μόνο κειμένου δεν μπορούν να εκτελέσουν. Το σύστημα κοιτάζει κυριολεκτικά αυτό που τρώτε αντί να μαντεύει από μια περιγραφή κειμένου.
Διαφανής Αβεβαιότητα
Ένα καλά σχεδιασμένο διατροφικό σύστημα αναγνωρίζει πότε είναι αβέβαιο. Εάν ένα πιάτο είναι ασαφές ή ένα μέγεθος μερίδας είναι δύσκολο να εκτιμηθεί από μια φωτογραφία, το σύστημα μπορεί να σηματοδοτήσει αυτή την αβεβαιότητα και να ζητήσει διευκρίνιση από τον χρήστη. Τα γενικά LLMs σχεδόν ποτέ δεν υποδεικνύουν πότε οι διατροφικές τους εκτιμήσεις είναι χαμηλής αυτοπεποίθησης, επειδή δεν έχουν μηχανισμό για να μετρήσουν τη δική τους αυτοπεποίθηση σε γεγονότα.
Οι Πραγματικοί Κίνδυνοι για την Υγεία
Οι ανακριβείς θερμιδικές πληροφορίες από την AI δεν είναι ένα αφηρημένο πρόβλημα. Εκδηλώνονται με συγκεκριμένους τρόπους.
Αποτυχία διαχείρισης βάρους. Μια σταθερή υπερεκτίμηση ή υποεκτίμηση 200 θερμίδων την ημέρα αλλάζει το αποτέλεσμα οποιασδήποτε δίαιτας. Σε 30 ημέρες, αυτό είναι ένα σφάλμα 6.000 θερμίδων, περίπου ισοδύναμο με 1,7 κιλά σωματικού λίπους προς οποιαδήποτε κατεύθυνση.
Τυφλότητα σε μικροθρεπτικά συστατικά. Τα LLMs σπάνια παρέχουν δεδομένα μικροθρεπτικών συστατικών, και όταν το κάνουν, οι αριθμοί είναι ακόμη λιγότερο αξιόπιστοι από τις εκτιμήσεις θερμίδων τους. Κάποιος που παρακολουθεί την πρόσληψη σιδήρου κατά τη διάρκεια της εγκυμοσύνης ή παρακολουθεί το νάτριο για υπέρταση δεν μπορεί να βασιστεί σε παραγόμενες εκτιμήσεις.
Ψευδής αυτοπεποίθηση. Ο πιο ύπουλος κίνδυνος είναι ότι ο χρήστης πιστεύει ότι έχει ακριβή δεδομένα όταν δεν έχει. Αυτή η ψευδής αυτοπεποίθηση τους εμποδίζει να αναζητήσουν καλύτερα εργαλεία ή να κάνουν προσαρμογές με βάση τα πραγματικά αποτελέσματα.
Πότε Είναι Αποδεκτό να Ρωτήσετε ένα LLM για Φαγητό
Τα γενικά LLMs δεν είναι άχρηστα για τη διατροφή. Είναι αποτελεσματικά για ορισμένους τύπους ερωτήσεων:
- Γενική εκπαίδευση: "Ποια τρόφιμα είναι πλούσια σε κάλιο;" ή "Πια είναι η διαφορά μεταξύ διαλυτών και αδιάλυτων ινών;" Αυτές είναι ερωτήσεις γνώσης όπου οι προσεγγιστικές απαντήσεις είναι κατάλληλες.
- Ιδέες συνταγών: "Δώστε μου μια ιδέα για μεσημεριανό πλούσιο σε πρωτεΐνη κάτω από 500 θερμίδες" μπορεί να παράγει χρήσιμη έμπνευση, ακόμα κι αν η ακριβής καταμέτρηση θερμίδων πρέπει να επιβεβαιωθεί.
- Κατανόηση εννοιών: "Εξηγήστε τι είναι η θερμιδική έλλειψη" ή "Πώς βοηθά η πρωτεΐνη στην αποκατάσταση των μυών;" είναι τομείς όπου τα LLMs αποδίδουν καλά.
Η γραμμή είναι σαφής: χρησιμοποιήστε τα LLMs για να μάθετε για τη διατροφή. Χρησιμοποιήστε επαληθευμένα, βάσει βάσεων δεδομένων εργαλεία για την παρακολούθησή της.
Πώς να Επαληθεύσετε Οποιαδήποτε Διατροφική Αξίωση AI
Είτε χρησιμοποιείτε ένα chatbot είτε οποιοδήποτε άλλο εργαλείο, υπάρχουν πρακτικά βήματα για να ελέγξετε τα δεδομένα που λαμβάνετε:
- Διασταυρώστε με το USDA FoodData Central. Η βάση δεδομένων του USDA είναι δωρεάν, δημόσια και ελεγμένη από εργαστήρια. Εάν η εκτίμηση ενός AI αποκλίνει σημαντικά από την καταχώριση του USDA για το ίδιο τρόφιμο, το AI πιθανότατα είναι λάθος.
- Ελέγξτε τις υποθέσεις μεγέθους μερίδας. Ρωτήστε πάντα ή επιβεβαιώστε με ποιο μέγεθος μερίδας βασίζεται η εκτίμηση. Ένας αριθμός θερμίδων χωρίς μέγεθος μερίδας είναι άχρηστος.
- Λάβετε υπόψη τη μέθοδο προετοιμασίας. Το ίδιο συστατικό μπορεί να διαφέρει κατά 2 έως 3 φορές στην πυκνότητα θερμίδων ανάλογα με το αν είναι ωμό, ψητό, τηγανητό ή σοταρισμένο σε λάδι.
- Να είστε σκεπτικιστές με τους στρογγυλούς αριθμούς. Εάν ένα AI σας πει ότι ένα γεύμα έχει "ακριβώς 500 θερμίδες", αυτό είναι μια παραγόμενη εκτίμηση, όχι μια μετρημένη τιμή. Τα πραγματικά διατροφικά δεδομένα έχουν συγκεκριμένους αριθμούς όπως 487 ή 523.
Συχνές Ερωτήσεις
Είναι το ChatGPT ακριβές για την καταμέτρηση θερμίδων;
Το ChatGPT και παρόμοια μεγάλα γλωσσικά μοντέλα δεν είναι αξιόπιστα για την καταμέτρηση θερμίδων. Δημιουργούν εκτιμήσεις με βάση μοτίβα κειμένου αντί να αναζητούν τιμές σε επαληθευμένες διατροφικές βάσεις δεδομένων. Σε δοκιμές, οι εκτιμήσεις θερμίδων LLM για σύνθετα γεύματα κυμαίνονταν κατά 200 έως 300 θερμίδες σε διαφορετικές ερωτήσεις για το ίδιο φαγητό. Για απλά, γνωστά στοιχεία όπως "ένα μεγάλο αυγό", οι εκτιμήσεις τείνουν να είναι κοντά επειδή τα δεδομένα εμφανίζονται συχνά στο κείμενο εκπαίδευσης. Για προετοιμασμένα γεύματα, πιάτα εστιατορίου και τρόφιμα με πολλά συστατικά, το ποσοστό σφάλματος αυξάνεται σημαντικά.
Μπορώ να χρησιμοποιήσω το ChatGPT για να παρακολουθήσω τα μακροθρεπτικά μου;
Η χρήση του ChatGPT για παρακολούθηση μακροθρεπτικών συστατικών δεν συνιστάται για κανέναν που επιδιώκει συγκεκριμένους στόχους υγείας ή φυσικής κατάστασης. Το μοντέλο δεν μπορεί να υπολογίσει τα πραγματικά σας μεγέθη μερίδας, τις μεθόδους μαγειρέματος ή τα συγκεκριμένα συστατικά. Επίσης, λείπει η συνέπεια; ρωτώντας την ίδια ερώτηση δύο φορές μπορεί να παράγει διαφορετικές αναλύσεις μακροθρεπτικών συστατικών. Για γενική ενημέρωση σχετικά με το αν ένα τρόφιμο είναι πλούσιο σε πρωτεΐνη ή υδατάνθρακες, ένα LLM μπορεί να παρέχει χρήσιμες κατευθυντήριες πληροφορίες. Για ακριβή παρακολούθηση, μια ειδικά σχεδιασμένη διατροφική εφαρμογή με επαληθευμένη βάση δεδομένων θα παράγει σημαντικά πιο ακριβή και συνεπή αποτελέσματα.
Τι είναι η παραισθήση AI στη διατροφή;
Η παραισθήση AI στη διατροφή αναφέρεται στην περίπτωση που ένα γλωσσικό μοντέλο παράγει διατροφικά δεδομένα, όπως θερμίδες, αναλύσεις μακροθρεπτικών συστατικών ή τιμές μικροθρεπτικών συστατικών, που ακούγονται αυθεντικά αλλά είναι factually incorrect. Το μοντέλο δεν ψεύδεται σκόπιμα; προβλέπει πειστικά κείμενα με βάση μοτίβα. Το αποτέλεσμα είναι μια καταμέτρηση θερμίδων που διαβάζεται σαν γεγονός αλλά δεν έχει ποτέ επαληθευτεί σε καμία διατροφική βάση δεδομένων. Αυτό είναι ιδιαίτερα επικίνδυνο επειδή οι χρήστες δεν έχουν τρόπο να διακρίνουν μια παραισθητική εκτίμηση από μια ακριβή χωρίς χειροκίνητη διασταύρωση.
Πώς μπορώ να ξέρω αν η διατροφική AI μου δίνει ακριβή δεδομένα;
Ελέγξτε τρία πράγματα. Πρώτον, ρωτήστε αν το εργαλείο αντλεί από μια επαληθευμένη διατροφική βάση δεδομένων όπως το USDA FoodData Central ή NCCDB, αντί να δημιουργεί εκτιμήσεις από ένα γλωσσικό μοντέλο. Δεύτερον, επιβεβαιώστε ότι λαμβάνει υπόψη τις μεθόδους προετοιμασίας, καθώς η μέθοδος μαγειρέματος μπορεί να αλλάξει την περιεκτικότητα σε θερμίδες ενός φαγητού κατά 50 έως 200 τοις εκατό. Τρίτον, ελέγξτε αν το εργαλείο προσδιορίζει το ακριβές μέγεθος μερίδας από το οποίο βασίζεται η εκτίμηση. Μια αξιόπιστη διατροφική AI θα πρέπει να είναι διαφανής σχετικά με τις πηγές δεδομένων της και να σηματοδοτεί αβέβαιες εκτιμήσεις αντί να παρουσιάζει κάθε αριθμό με ίση αυτοπεποίθηση.
Είναι ασφαλές να ακολουθήσω ένα σχέδιο γευμάτων που δημιουργήθηκε από AI;
Τα σχέδια γευμάτων που δημιουργούνται από AI μπορούν να είναι χρήσιμα ως αρχικά πλαίσια, αλλά δεν θα πρέπει να ακολουθούνται τυφλά για συγκεκριμένους ιατρικούς ή αθλητικούς στόχους. Κάθε εκτίμηση θερμίδων στο σχέδιο φέρει πιθανό σφάλμα, και αυτά τα σφάλματα συσσωρεύονται σε ολόκληρη την ημέρα της διατροφής. Εάν το σχέδιο ισχυρίζεται ότι παρέχει 1.800 θερμίδες αλλά κάθε εκτίμηση γεύματος είναι λανθασμένη κατά 10 έως 15 τοις εκατό, η πραγματική ημερήσια πρόσληψη μπορεί να κυμαίνεται από 1.500 έως 2.100 θερμίδες. Για γενική έμπνευση υγιεινής διατροφής, τα σχέδια γευμάτων AI είναι ένα λογικό σημείο εκκίνησης. Για κλινική διαχείριση διατροφής, προγράμματα απώλειας βάρους ή δίαιτες αθλητικής απόδοσης, οι θερμιδικοί και μακροθρεπτικοί στόχοι θα πρέπει να επαληθεύονται σε σχέση με ένα εργαλείο που βασίζεται σε βάσεις δεδομένων.
Έτοιμοι να Μεταμορφώσετε την Παρακολούθηση της Διατροφής σας;
Εγγραφείτε σε χιλιάδες που έχουν μεταμορφώσει το ταξίδι της υγείας τους με το Nutrola!