Onko AI:si harhaileva? Yleisten LLM:ien vaarat ruokavaliosuosituksissa

ChatGPT ja Gemini osaavat kirjoittaa runoja, mutta osaavatko ne laskea kaloreita? Testasimme yleisiä LLM:ia verrattuna varmennettuihin ravitsemustietoihin, ja tulokset huolestuttavat kaikkia, jotka käyttävät niitä ruokavalion seurannassa.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

"Hei ChatGPT, kuinka paljon kaloreita on kanapadassani?"

Vastaus tulee heti ja itsevarmasti: "Tyypillisessä kanapadassa on noin 350–450 kaloria annosta kohti." Kuulostaa järkevältä. Se jopa erittelee makroravinteet. Mutta ongelma on se, että luku on keksitty. Ei arvioitu, ei arvioitu, vaan luotu tilastollisista tekstidatoista, joilla ei ole mitään yhteyttä todellisiin ravitsemustietoihin.

Tätä AI-tutkijat kutsuvat harhailemiseksi, ja kun se tapahtuu ravitsemuksen kontekstissa, seuraukset ovat vakavampia kuin huono essee tai väärä tietovisa. Ihmiset tekevät todellisia ruokavalintoja näiden lukujen perusteella, ja nämä valinnat vaikuttavat heidän terveyteensä.

Mitä "harhaisuus" tarkoittaa ravitsemuksen kontekstissa

Suuren kielimallin terminologiassa harhaisuus tapahtuu, kun malli tuottaa tietoa, joka kuulostaa uskottavalta, mutta on tosiasiallisesti väärää. LLM:t eivät etsi faktoja tietokannasta. Ne ennustavat seuraavaa todennäköisintä sanaa lauseessa sen perusteella, mitä ne ovat oppineet koulutuksen aikana.

Kun kysyt ChatGPT:ltä ruoan kalorisisältöä, se ei kysy USDA:n FoodData Central -tietokannasta tai vertaa NCCDB:tä. Se tuottaa vastauksen, joka tilastollisesti muistuttaa sitä, millaisia vastauksia sen koulutusdatassa esiintyy. Joskus vastaus on lähellä totuutta. Joskus se on täysin pielessä.

Vaarana on, että itsevarmuustaso on identtinen molemmissa tapauksissa. Harhaileva kalorilaskelma kuulostaa täsmälliseltä.

Miten yleiset LLM:t erehtyvät ravitsemuksessa

Suoritimme sarjan testejä, joissa kysyimme ChatGPT:ltä (GPT-4o), Geminiltä ja Claudelta yleisten ruokien ravintosisältöä. Vertasimme näitä arvioita USDA:n varmennettuihin viitearvoihin ja Nutrolan ravitsemusterapeutin tarkistamaan tietokantaan. Erojen mallit olivat johdonmukaisia ja paljastavia.

Keksitty tarkkuus

Kysy LLM:ltä "kuinka paljon kaloreita on ruokalusikallisessa oliiviöljyä?" ja saat usein oikean vastauksen: noin 119 kaloria. Tämä johtuu siitä, että tämä erityinen fakta esiintyy usein koulutusdatassa.

Mutta kysy "kuinka paljon kaloreita on kotitekoisessa kanatikka masalassa naan-leivän kanssa?" ja malli joutuu improvisoimaan. Testeissämme GPT-4o antoi arvioita, jotka vaihtelivat 450:stä 750:een kaloriin saman kuvauksen perusteella eri keskusteluissa. Todellinen arvo, joka laskettiin varmennetuista raaka-aineista koostuvan reseptin mukaan, oli 685 kaloria. Yksi vastaus oli lähellä oikeaa. Muut olivat yli 200 kaloria pielessä.

Mallilla ei ole keinoa ilmoittaa, mitkä vastaukset ovat luotettavia ja mitkä improvisoituja arvauksia.

Valmistustavan sokeus

LLM:illä on perustavanlaatuinen sokeus siihen, miten ruoka valmistetaan. "Grillattu kananrinta" ja "voissa paistettu kananrinta" saattavat saada samankaltaiset kaloriarviot, koska malli keskittyy pääraaka-aineeseen sen sijaan, että huomioisi valmistustavan.

Testissämme, kun kysyimme "lohta" ilman tarkennusta valmistustavasta, vastaukset oletusarvoisesti viittasivat uunissa tai grillissä valmistettuun arvioon, joka oli noin 230–280 kaloria 6 unssin fileelle. 6 unssin lohifilee, joka on paistettu kahdessa ruokalusikallisessa voita teriyaki-glaseerauksella, sisältää todellisuudessa lähempänä 450–500 kaloria. Ero on riittävän merkittävä, jotta se voi heikentää kalorivajetta ajan myötä.

Annoskoko-harhaisuus

Ehkä vaarallisin virhetilanne on annoskoko-oletus. Kun kysyt yleiseltä LLM:ltä ruoan kaloreista, sen on oletettava annoskoko. Nämä oletukset ovat epäjohdonmukaisia ja usein määrittelemättömiä.

"Yksi kulhollinen pastaa" saatetaan arvioida 300–400 kaloriin. Mutta kenen kulho? Standardi 2 unssin kuiva annos spagettia marinara-kastikkeen kanssa on noin 280 kaloria. Ravintola-annos 4–6 unssia kuivapastaa kastikkeen kanssa voi helposti ylittää 600–900 kaloria. LLM valitsee keskiluvun ja esittää sen faktana.

Virheiden kumuloituminen ateriasuunnitelmissa

Riski kasvaa, kun käyttäjät pyytävät LLM:iltä koko ateriasuunnitelmia. Jokainen yksittäinen arvio sisältää virheen, ja nämä virheet kumuloituvat aterioiden ja päivien myötä. Ateriasuunnitelma, joka väittää tuottavansa 1 800 kaloria päivässä, saattaa todellisuudessa tuottaa 2 200 tai 1 400 kaloria virheiden suuntaan riippuen.

Jos joku käyttää ateriasuunnitelmaa hallitakseen lääketieteellistä tilaa, kuten diabetesta, tai saavuttaakseen erityisiä urheilusuoritustavoitteita, tämä virheiden taso ei ole vain hyödyllinen. Se voi olla jopa haitallista.

Miksi erityisesti ravitsemukseen suunniteltu AI on erilainen

Ero yleisen LLM:n ja erityisesti ravitsemukseen suunnitellun järjestelmän välillä on arkkitehtoninen, ei kosmeettinen.

Tietokantapohjaiset vastaukset

Nutrolan AI ei luo kalorilaskelmia kielimallin kaavoista. Kun se tunnistaa ruoka-aineen, se yhdistää sen varmennettuun merkintään ravitsemustietokannassa. Tietokanta sisältää merkintöjä, jotka on kerätty USDA:n FoodData Centralista, useiden maiden kansallisista ravitsemustietokannoista ja sisäisesti ravitsemusterapeutin tarkistamista merkinnöistä.

Tämä tarkoittaa, että järjestelmä ei voi harhailla kalorilaskelmassa. Luku tulee tietyistä, auditoitavista tietokannan merkinnöistä, ei tilastollisesta kielimallista.

Visuaalinen varmennus

Kun käyttäjä valokuvaa aterian, Nutrolan tietokonenäkömalli tunnistaa yksittäiset ruoka-aineet ja arvioi annoskoot visuaalisen analyysin perusteella. Tämä visuaalinen pohja tarjoaa tarkistuksen, jota pelkät tekstipohjaiset LLM:t eivät voi suorittaa. Järjestelmä katsoo kirjaimellisesti sitä, mitä syöt, sen sijaan että arvailee tekstikuvauksen perusteella.

Läpinäkyvä epävarmuus

Hyvin suunniteltu ravitsemusjärjestelmä tunnustaa, kun se on epävarma. Jos ruoka on epäselvä tai annoskoon arvioiminen valokuvasta on vaikeaa, järjestelmä voi merkitä epävarmuuden ja pyytää käyttäjältä tarkennusta. Yleiset LLM:t harvoin ilmoittavat, kun niiden ravitsemusarviot ovat matalan varmuuden, koska niillä ei ole mekanismia mitata omaa varmuuttaan tosiasiallisissa väitteissä.

Todelliset terveysriskit

Epätarkat kaloridatat AI:sta eivät ole abstrakti ongelma. Ne ilmenevät konkreettisina seurauksina.

Painonhallinnan epäonnistuminen. Jatkuva 200 kalorin yli- tai aliarviointi muuttaa minkä tahansa ruokavalion tulosta. 30 päivässä se tarkoittaa 6 000 kalorin virhettä, mikä vastaa noin 1,7 paunaa kehon rasvaa kumpaankin suuntaan.

Mikroravinteiden sokeus. LLM:t tarjoavat harvoin mikroravinteiden tietoja, ja kun ne tarjoavat, luvut ovat vielä vähemmän luotettavia kuin kalorilaskelmat. Joku, joka seuraa raudan saantia raskauden aikana tai valvoo natriumia kohonneen verenpaineen vuoksi, ei voi luottaa tuotettuihin arvioihin.

Väärä itsevarmuus. Salakavalin riski on se, että käyttäjä uskoo, että heillä on tarkkaa tietoa, vaikka näin ei ole. Tämä väärä itsevarmuus estää heitä etsimästä parempia työkaluja tai tekemästä säätöjä todellisten tulosten perusteella.

Milloin on okei kysyä LLM:ltä ruoasta

Yleiset LLM:t eivät ole täysin hyödyttömiä ravitsemuksessa. Ne ovat tehokkaita tietyissä kysymyksissä:

  • Yleinen koulutus: "Mitkä ruoat ovat rikkaita kaliumissa?" tai "Mikä on ero liukoisen ja liukenemattoman kuidun välillä?" Nämä ovat tietokysymyksiä, joissa arvioiden on sopivaa olla likimääräisiä.
  • Reseptiehdotukset: "Anna minulle korkean proteiinin lounasidea alle 500 kalorin" voi tuottaa hyödyllistä inspiraatiota, vaikka tarkka kalorimäärä tulisi vahvistaa.
  • Käsitteiden ymmärtäminen: "Selitä, mitä kalorivaje on" tai "Miten proteiini auttaa lihasten palautumisessa?" ovat alueita, joissa LLM:t suoriutuvat hyvin.

Raja on selkeä: käytä LLM:iä ravitsemustiedon oppimiseen. Käytä varmennettuja, tietokantapohjaisia työkaluja sen seuraamiseen.

Kuinka vahvistaa mikä tahansa AI:n ravitsemusväite

Olitpa käyttämässä chatbotia tai mitä tahansa muuta työkalua, on käytännön vaiheita tarkistaa saamasi tiedot:

  1. Ristiinviittaa USDA:n FoodData Centralin kanssa. USDA:n tietokanta on ilmainen, julkinen ja laboratoriovarmennettu. Jos AI:n arvio poikkeaa merkittävästi USDA:n merkinnästä samasta ruoasta, AI on todennäköisesti väärässä.
  2. Tarkista annoskoko-oletukset. Kysy aina tai vahvista, mihin annoskoko arvio perustuu. Kaloriluku ilman annoskokoa on merkityksetön.
  3. Ota huomioon valmistustapa. Sama raaka-aine voi vaihdella kaloritiheydeltään 2–3 kertaa riippuen siitä, onko se raaka, paistettu, friteerattu vai paistettu öljyssä.
  4. Ole skeptinen pyöreitä lukuja kohtaan. Jos AI kertoo, että ateria sisältää "täsmälleen 500 kaloria", se on tuotettu arvio, ei mitattu arvo. Todellinen ravitsemustieto sisältää tarkkoja lukuja, kuten 487 tai 523.

Usein kysytyt kysymykset

Onko ChatGPT tarkka kalorilaskennassa?

ChatGPT ja vastaavat suuret kielimallit eivät ole luotettavia kalorilaskennassa. Ne tuottavat arvioita tekstikaavojen perusteella sen sijaan, että etsisivät arvoja varmennetuista ravitsemustietokannoista. Testauksessa LLM:n kalorilaskelmat monimutkaisille aterioille vaihtelivat 200–300 kaloria eri kyselyissä saman ruoan osalta. Yksinkertaisille, hyvin tunnetuille tuotteille, kuten "yksi iso muna", arviot ovat yleensä lähellä oikeaa, koska tiedot esiintyvät usein koulutusdatassa. Valmistetuille aterioille, ravintolaruoille ja sekoitetuille ruoka-aineille virheiden määrä kasvaa merkittävästi.

Voinko käyttää ChatGPT:tä makrojen seuraamiseen?

ChatGPT:n käyttö makrojen seuraamiseen ei ole suositeltavaa kenellekään, joka tavoittelee erityisiä terveys- tai kuntoilutavoitteita. Malli ei voi ottaa huomioon todellisia annoskokoja, valmistusmenetelmiä tai erityisiä raaka-aineita. Se myös puuttuu johdonmukaisuudesta; kysymällä samaa kysymystä kahdesti voi saada erilaisia makrojakautumia. Yleiseen tietoisuuteen siitä, onko ruoka runsasta proteiinia tai hiilihydraatteja, LLM voi tarjota hyödyllistä suuntaa antavaa tietoa. Tarkkaa seurantaa varten erityisesti ravitsemukseen suunniteltu sovellus varmennettujen tietokantojen kanssa tuottaa huomattavasti tarkempia ja johdonmukaisempia tuloksia.

Mikä on AI-harhaisuus ravitsemuksessa?

AI-harhaisuus ravitsemuksessa viittaa siihen, kun kielimalli tuottaa ravitsemustietoja, kuten kalorilaskelmia, makrojakautumia tai mikroravinteiden arvoja, jotka kuulostavat asiantuntevilta, mutta ovat tosiasiallisesti vääriä. Malli ei valehtele tahallaan; se ennustaa uskottavalta kuulostavaa tekstiä kaavojen perusteella. Tulos on kalorilaskelma, joka vaikuttaa faktalta, mutta jota ei koskaan ole vahvistettu minkään ravitsemustietokannan mukaan. Tämä on erityisen vaarallista, koska käyttäjillä ei ole keinoa erottaa harhailevaa arviota tarkasta ilman manuaalista ristiinviittausta.

Miten tiedän, onko ravitsemus-AI:ni antama data tarkkaa?

Tarkista kolme asiaa. Ensinnäkin, kysy, käyttääkö työkalu varmennettua ravitsemustietokantaa, kuten USDA:n FoodData Centralia tai NCCDB:tä, sen sijaan, että se tuottaisi arvioita kielimallista. Toiseksi, varmista, että se ottaa huomioon valmistusmenetelmät, sillä valmistustapa voi muuttaa ruoan kalorisisältöä 50–200 prosenttia. Kolmanneksi, tarkista, mainitseeko työkalu tarkasti, mihin annoskoko sen arvio perustuu. Luotettavan ravitsemus-AI:n tulisi olla läpinäkyvä tietolähteistään ja merkitä epävarmat arviot sen sijaan, että esittäisi jokaisen numeron yhtä itsevarmana.

Onko turvallista seurata AI:n laatimaa ateriasuunnitelmaa?

AI:n laatimat ateriasuunnitelmat voivat olla hyödyllisiä lähtökohtina, mutta niitä ei tule seurata sokeasti erityisten lääketieteellisten tai suorituskykytavoitteiden saavuttamiseksi. Jokainen kalorilaskelma suunnitelmassa sisältää mahdollisen virheen, ja nämä virheet kumuloituvat koko päivän syömisen aikana. Jos suunnitelma väittää tuottavansa 1 800 kaloria, mutta jokaisen aterian arvio on 10–15 prosenttia pielessä, todellinen päivittäinen saanti voi vaihdella 1 500–2 100 kalorin välillä. Yleiseen terveelliseen ruokailuinspiraatioon AI-ateriasuunnitelmat ovat kohtuullinen lähtökohta. Lääketieteellisen ravitsemuksen hallintaan, painonpudotusohjelmiin tai urheilusuoritusten ruokavalioihin kalorija ja makrotavoitteet tulisi vahvistaa tietokantapohjaisella työkalulla.

Valmis muuttamaan ravitsemusseurantaasi?

Liity tuhansien joukkoon, jotka ovat muuttaneet terveysmatkansa Nutrola avulla!