Îți Hallucinează AI-ul? Pericolul Utilizării LLM-urilor Generice pentru Sfaturi Dietetice
ChatGPT și Gemini pot scrie poezii, dar pot să-ți numere caloriile? Am testat LLM-uri generice comparativ cu datele nutriționale verificate și rezultatele ar trebui să îngrijoreze pe oricine le folosește pentru urmărirea dietei.
"Hei ChatGPT, câte calorii sunt în stir-fry-ul meu de pui?"
Răspunsul vine instantaneu și cu încredere: "Un stir-fry de pui tipic conține aproximativ 350 până la 450 de calorii pe porție." Sună rezonabil. Chiar detaliază macronutrienții. Dar există o problemă: numărul este fabricat. Nu este estimat, nu este aproximat, ci generat din modele statistice în datele textuale, fără legătură cu o bază de date nutrițională reală.
Aceasta este ceea ce cercetătorii AI numesc o halucinație, iar când se întâmplă în contextul nutriției, consecințele depășesc un eseu prost sau un răspuns greșit la un trivia. Oamenii iau decizii alimentare reale bazate pe aceste numere, iar aceste decizii le afectează sănătatea.
Ce Înseamnă "Halucinație" în Contextul Nutriției
În terminologia modelului de limbaj mare, o halucinație apare atunci când modelul generează informații care sună plauzibil, dar sunt factualmente incorecte. LLM-urile nu caută faptele într-o bază de date. Ele prezic următorul cuvânt cel mai probabil într-o secvență, bazându-se pe modele învățate în timpul antrenamentului.
Când întrebi ChatGPT despre conținutul caloric al unui aliment, nu consultă baza de date USDA FoodData Central sau nu face referințe încrucișate cu NCCDB. Generează un răspuns care seamănă statistic cu tipul de răspuns care ar apărea în datele sale de antrenament. Uneori, acel răspuns este aproape corect. Alteori, este complet greșit.
Pericolul este că nivelul de încredere este identic în ambele cazuri. Un număr de calorii halucinat sună exact ca unul corect.
De Ce Greșesc LLM-urile Generice în Nutriție
Am realizat o serie de teste cerând lui ChatGPT (GPT-4o), Gemini și Claude să estimeze conținutul nutrițional al meselor comune. Apoi, am comparat aceste estimări cu valorile de referință verificate de USDA și baza de date revizuită de nutriționiști de la Nutrola. Modelele de eșec au fost consistente și revelatoare.
Precizie Fabricată
Întreabă un LLM "câte calorii sunt într-o lingură de ulei de măsline?" și vei obține adesea un răspuns corect: aproximativ 119 calorii. Acest lucru se datorează faptului că acel fapt specific apare frecvent în datele de antrenament.
Dar întreabă "câte calorii sunt în tikka masala de pui făcut acasă cu naan?" și modelul trebuie să improvizeze. În testele noastre, GPT-4o a returnat estimări variind de la 450 la 750 de calorii pentru aceeași masă descrisă în conversații diferite. Valoarea reală, calculată dintr-o rețetă standard cu date verificate despre ingrediente, era de 685 de calorii. Un răspuns a fost aproape corect. Altele au fost greșite cu peste 200 de calorii.
Modelul nu are nicio modalitate de a semnala care răspunsuri sunt căutări fiabile și care sunt ghiciri improvizate.
Orbirea Metodei de Preparare
LLM-urile au un punct orb fundamental în ceea ce privește modul în care este preparat alimentul. "Piept de pui la grătar" și "piept de pui prăjit în unt" ar putea primi estimări calorice similare, deoarece modelul se concentrează pe ingredientul principal, mai degrabă decât pe metoda de gătire.
În testele noastre, când am întrebat despre "somon" fără a specifica metoda de preparare, răspunsurile au revenit constant la o estimare coaptă sau la grătar de aproximativ 230 până la 280 de calorii pentru un file de 6 uncii. Un file de somon de 6 uncii prăjit în două linguri de unt cu un glazură teriyaki conține, de fapt, mai aproape de 450 până la 500 de calorii. Diferența este suficient de semnificativă pentru a submina un deficit caloric în timp.
Halucinația Dimensiunii Porției
Poate cea mai periculoasă modalitate de eșec este presupunerea dimensiunii porției. Când întrebi un LLM generic despre caloriile unui aliment, trebuie să presupună o dimensiune a porției. Aceste presupuneri sunt inconsistent și adesea nespecificate.
"O farfurie de paste" ar putea fi estimată la 300 până la 400 de calorii. Dar a cui farfurie? O porție standard de 2 uncii de spaghete cu marinara are aproximativ 280 de calorii. O porție de restaurant de 4 până la 6 uncii de paste uscate cu sos ajunge ușor la 600 până la 900 de calorii. LLM-ul alege un număr din mijloc și îl prezintă ca pe un fapt.
Erori Compuse în Planurile de Masă
Riscul crește atunci când utilizatorii cer LLM-urilor să genereze planuri complete de mese. Fiecare estimare individuală poartă o eroare, iar aceste erori se compun pe parcursul meselor și zilelor. Un plan de masă care pretinde că oferă 1,800 de calorii pe zi ar putea, de fapt, să ofere 2,200 sau 1,400, în funcție de direcția erorilor.
Pentru cineva care folosește un plan de masă pentru a gestiona o afecțiune medicală precum diabetul, sau pentru a atinge anumite obiective de performanță sportivă, acest nivel de inexactitate nu este doar neutil. Este potențial dăunător.
De Ce AI-ul Dedicat Nutriției Este Diferit
Distincția dintre un LLM generic și un sistem de nutriție dedicat este arhitecturală, nu cosmetică.
Răspunsuri Bazate pe Baze de Date
AI-ul Nutrola nu generează estimări calorice din modele de limbaj. Atunci când identifică un aliment, îl mapează la o intrare verificată într-o bază de date nutrițională. Baza de date conține intrări provenite din USDA FoodData Central, baze de date naționale de nutriție din mai multe țări și intrări revizuite de nutriționiști interne.
Aceasta înseamnă că sistemul nu poate halucina un număr de calorii. Numărul provine dintr-o intrare specifică, auditabilă, nu dintr-un model de limbaj statistic.
Verificare Vizuală
Când un utilizator fotografiază o masă, modelul de viziune computerizată al Nutrola identifică elementele alimentare individuale și estimează dimensiunile porțiilor pe baza analizei vizuale. Această ancorare vizuală oferă un control pe care LLM-urile doar textuale nu îl pot efectua. Sistemul se uită literalmente la ceea ce mănânci, în loc să ghicească dintr-o descriere textuală.
Incertitudine Transparentă
Un sistem de nutriție bine conceput recunoaște atunci când este incert. Dacă un fel de mâncare este ambiguu sau o dimensiune a porției este greu de estimat dintr-o fotografie, sistemul poate semnala acea incertitudine și poate cere utilizatorului clarificări. LLM-urile generice aproape niciodată nu indică atunci când estimările lor nutriționale sunt de încredere scăzută, deoarece nu au nicio modalitate de a măsura propria încredere în afirmațiile factuale.
Riscurile Reale pentru Sănătate
Datele calorice inexacte provenite de la AI nu sunt o problemă abstractă. Ele se manifestă în moduri concrete.
Eșec în gestionarea greutății. O supraestimare sau subestimare constantă de 200 de calorii pe zi schimbă rezultatul oricărei diete. În 30 de zile, aceasta reprezintă o eroare de 6,000 de calorii, echivalentul a aproximativ 1.7 kilograme de grăsime corporală în orice direcție.
Orbirea micronutrienților. LLM-urile rareori oferă date despre micronutrienți, iar când o fac, numerele sunt și mai puțin fiabile decât estimările lor calorice. Cineva care urmărește aportul de fier în timpul sarcinii sau monitorizează sodiu pentru hipertensiune nu se poate baza pe estimările generate.
Încredere falsă. Cel mai insidios risc este că utilizatorul crede că are date precise când, de fapt, nu are. Această încredere falsă îi împiedică să caute instrumente mai bune sau să facă ajustări bazate pe rezultate reale.
Când Este În Regulă Să Întrebi un LLM Despre Alimente
LLM-urile generice nu sunt inutile pentru nutriție. Ele sunt eficiente pentru anumite tipuri de întrebări:
- Educație generală: "Ce alimente sunt bogate în potasiu?" sau "Care este diferența dintre fibra solubilă și cea insolubilă?" Acestea sunt întrebări de cunoștințe unde răspunsurile aproximative sunt adecvate.
- Idei de rețete: "Dă-mi o idee de prânz bogat în proteine sub 500 de calorii" poate oferi inspirație utilă, chiar dacă numărul exact de calorii ar trebui verificat.
- Înțelegerea conceptelor: "Explică ce este un deficit caloric" sau "Cum ajută proteinele la recuperarea musculară?" sunt domenii în care LLM-urile performează bine.
Linia este clară: folosește LLM-urile pentru a învăța despre nutriție. Folosește instrumente verificate, bazate pe baze de date pentru a o urmări.
Cum Să Verifici Orice Afirmație Nutrițională AI
Indiferent dacă folosești un chatbot sau orice alt instrument, există pași practici pentru a verifica datele pe care le primești:
- Verifică cu USDA FoodData Central. Baza de date USDA este gratuită, publică și verificată în laborator. Dacă estimarea unui AI se abate semnificativ de la intrarea USDA pentru același aliment, AI-ul este probabil greșit.
- Verifică presupunerile privind dimensiunea porției. Întreabă întotdeauna sau verifică pe ce dimensiune a porției se bazează estimarea. Un număr de calorii fără o dimensiune a porției este lipsit de sens.
- Ține cont de metoda de preparare. Același ingredient poate varia de 2 până la 3 ori în densitatea calorică, în funcție de modul în care este crud, copt, prăjit sau sotat în ulei.
- Fii sceptic față de numerele rotunde. Dacă un AI îți spune că o masă are "exact 500 de calorii", aceasta este o estimare generată, nu o valoare măsurată. Datele nutriționale reale au numere specifice precum 487 sau 523.
Întrebări Frecvente
Este ChatGPT precis pentru numărarea caloriilor?
ChatGPT și modelele de limbaj mari similare nu sunt fiabile pentru numărarea caloriilor. Ele generează estimări pe baza modelelor textuale, mai degrabă decât să caute valori în baze de date nutriționale verificate. În teste, estimările de calorii ale LLM pentru mese complexe au variat cu 200 până la 300 de calorii între diferite întrebări pentru același aliment. Pentru articole simple, bine cunoscute, precum "un ou mare", estimările tind să fie aproape corecte, deoarece datele apar frecvent în textul de antrenament. Pentru mese preparate, feluri de mâncare de restaurant și alimente cu ingrediente mixte, rata de eroare crește semnificativ.
Pot folosi ChatGPT pentru a-mi urmări macronutrienții?
Folosirea ChatGPT pentru urmărirea macronutrienților nu este recomandată pentru nimeni care urmărește obiective specifice de sănătate sau fitness. Modelul nu poate ține cont de dimensiunile tale reale ale porțiilor, metodele de gătire sau ingredientele specifice. De asemenea, nu este consistent; întrebând aceeași întrebare de două ori poate produce diferite descompuneri ale macronutrienților. Pentru o conștientizare generală a faptului că un aliment este bogat în proteine sau carbohidrați, un LLM poate oferi informații utile. Pentru o urmărire precisă, o aplicație de nutriție dedicată, cu o bază de date verificată, va produce rezultate mult mai precise și consistente.
Ce este halucinația AI în nutriție?
Halucinația AI în nutriție se referă la atunci când un model de limbaj generează date nutriționale, cum ar fi numerele de calorii, descompunerile macronutrienților sau valorile micronutrienților, care sună autoritar, dar sunt factualmente incorecte. Modelul nu minte deliberat; prezice text care sună plauzibil pe baza modelelor. Rezultatul este un număr de calorii care pare un fapt, dar nu a fost niciodată verificat împotriva unei baze de date nutriționale. Acest lucru este deosebit de periculos deoarece utilizatorii nu au nicio modalitate de a distinge o estimare halucinată de una precisă fără o verificare manuală.
Cum știu dacă AI-ul meu de nutriție oferă date precise?
Verifică trei lucruri. În primul rând, întreabă dacă instrumentul extrage dintr-o bază de date nutrițională verificată, precum USDA FoodData Central sau NCCDB, mai degrabă decât să genereze estimări dintr-un model de limbaj. În al doilea rând, verifică dacă ia în considerare metodele de preparare, deoarece metoda de gătire poate schimba conținutul caloric al unui aliment cu 50 până la 200 la sută. În al treilea rând, verifică dacă instrumentul specifică dimensiunea exactă a porției pe care se bazează estimarea sa. Un AI de nutriție de încredere ar trebui să fie transparent în legătură cu sursele sale de date și să semnaleze estimările incerte, mai degrabă decât să prezinte fiecare număr cu aceeași încredere.
Este sigur să urmez un plan de masă creat de AI?
Planurile de masă generate de AI pot fi utile ca cadre de început, dar nu ar trebui urmate orbește pentru obiective specifice medicale sau de performanță. Fiecare estimare calorică din plan poartă o eroare potențială, iar aceste erori se compun pe parcursul unei zile întregi de alimentație. Dacă planul pretinde că oferă 1,800 de calorii, dar fiecare estimare a mesei este greșită cu 10 până la 15 procente, aportul zilnic real ar putea varia de la 1,500 la 2,100 de calorii. Pentru inspirație generală în alimentația sănătoasă, planurile de mese AI sunt un punct de plecare rezonabil. Pentru gestionarea nutriției clinice, programele de pierdere în greutate sau dietele pentru performanța sportivă, țintele calorice și macro ar trebui verificate împotriva unui instrument bazat pe baze de date.
Ești gata să îți transformi urmărirea nutriției?
Alătură-te celor mii care și-au transformat călătoria de sănătate cu Nutrola!