Yapay Zekânız Halüsinasyon Mu Yapıyor? Genel LLM'lerin Diyet Tavsiyesi için Tehlikesi
ChatGPT ve Gemini şiir yazabilir, ama kalorilerinizi sayabilirler mi? Genel LLM'leri doğrulanmış beslenme verileriyle test ettik ve sonuçlar, bunları diyet takibi için kullanan herkesin endişelenmesi gereken bir durum.
"Hey ChatGPT, tavuk sote yemeğimde kaç kalori var?"
Cevap anında ve kendinden emin bir şekilde geliyor: "Tipik bir tavuk sote yemeği, porsiyon başına yaklaşık 350 ila 450 kalori içerir." Mantıklı görünüyor. Hatta makroları da detaylandırıyor. Ama bir sorun var: bu sayı uydurulmuş. Tahmin edilmemiş, yaklaşık olarak belirtilmemiş; tamamen metin verilerindeki istatistiksel kalıplardan üretilmiş ve gerçek bir beslenme veritabanıyla hiçbir bağlantısı yok.
Bu, yapay zeka araştırmacılarının halüsinasyon olarak adlandırdığı bir durumdur ve beslenme bağlamında gerçekleştiğinde sonuçları, kötü bir makale veya yanlış bir bilgi yanıtından çok daha fazlasını etkiler. İnsanlar bu sayılara dayanarak gerçek diyet kararları alıyor ve bu kararlar sağlıklarını etkiliyor.
Beslenme Bağlamında "Halüsinasyon" Ne Anlama Gelir?
Büyük dil modeli terminolojisinde, halüsinasyon, modelin mantıklı gibi görünen ancak gerçekte yanlış olan bilgileri üretmesi durumudur. LLM'ler gerçekleri bir veritabanında aramaz. Eğitim sırasında öğrendikleri kalıplara dayanarak bir dizideki bir sonraki en olası kelimeyi tahmin ederler.
ChatGPT'ye bir gıdanın kalori içeriğini sorduğunuzda, USDA FoodData Central veritabanını sorgulamıyor veya NCCDB ile karşılaştırma yapmıyor. Eğitim verilerinde yer alan cevap türüne istatistiksel olarak benzeyen bir yanıt üretiyor. Bazen bu yanıt doğruya yakın olurken, bazen de tamamen yanlıştır.
Tehlike, her iki durumda da güven seviyesinin aynı olmasıdır. Uydurulmuş bir kalori sayısı, doğru bir kalori sayısı kadar güvenilir bir şekilde okunur.
Genel LLM'ler Beslenmede Nerede Yanılıyor?
ChatGPT (GPT-4o), Gemini ve Claude'ya yaygın yemeklerin besin içeriğini tahmin etmesi için bir dizi test yaptık. Bu tahminleri USDA onaylı referans değerleri ve Nutrola'nın beslenme uzmanı tarafından incelenmiş veritabanıyla karşılaştırdık. Başarısızlık kalıpları tutarlı ve öğreticiydi.
Uydurulmuş Kesinlik
Bir LLM'ye "bir yemek kaşığı zeytinyağında kaç kalori var?" diye sorduğunuzda, genellikle doğru bir yanıt alırsınız: yaklaşık 119 kalori. Bu, bu spesifik bilginin eğitim verilerinde sıkça yer alması nedeniyledir.
Ama "ev yapımı tavuk tikka masala ve naan'da kaç kalori var?" diye sorduğunuzda, modelin doğaçlama yapması gerekir. Testlerimizde, GPT-4o, tanımlanan aynı yemek için farklı konuşmalar arasında 450 ila 750 kalori arasında tahminler verdi. Doğru değer, doğrulanmış malzeme verilerinden hesaplanan standart bir tarifle 685 kaloriydi. Bir yanıt yakındı. Diğerleri ise 200 kaloriden fazla yanlıştı.
Modelin hangi yanıtların güvenilir bilgi arayışından geldiğini ve hangilerinin doğaçlama tahminler olduğunu belirtme imkânı yoktur.
Hazırlama Yöntemi Körlüğü
LLM'lerin gıdanın nasıl hazırlandığı konusunda temel bir kör noktası vardır. "Izgara tavuk göğsü" ve "tereyağında tavada kızartılmış tavuk göğsü" benzer kalori tahminleri alabilir çünkü model, ana malzemeye odaklanır, pişirme yöntemine değil.
Testlerimizde, "somon" hakkında hazırlama yöntemini belirtmeden sorduğumuzda, yanıtlar sürekli olarak 6 onsluk bir filetoda 230 ila 280 kalori tahminine dönüşüyordu. İki yemek kaşığı tereyağında kızartılmış ve teriyaki sosuyla kaplanmış 6 ons somon filetosu ise aslında 450 ila 500 kalori içeriyor. Fark, zamanla kalori açığını tehlikeye atacak kadar büyüktür.
Porsiyon Boyutu Halüsinasyonu
Belki de en tehlikeli hata modu, porsiyon boyutu varsayımıdır. Genel bir LLM'ye bir gıdanın kalorileri hakkında sorduğunuzda, bir porsiyon boyutu varsaymak zorundadır. Bu varsayımlar tutarsızdır ve genellikle belirtilmez.
"Bir kâse makarna" 300 ila 400 kalori olarak tahmin edilebilir. Ama kimin kasesi? Standart 2 ons kuru spagetti ve marinara sosu yaklaşık 280 kalori içerir. Bir restoran porsiyonu 4 ila 6 ons kuru makarna ve sosla 600 ila 900 kaloriye ulaşabilir. LLM, ortalama bir sayı alır ve bunu gerçek olarak sunar.
Yemek Planlarındaki Hataların Birikimi
Kullanıcılar LLM'lerden tam yemek planları oluşturmasını istediğinde risk artar. Her bir tahmin hata taşır ve bu hatalar yemekler ve günler boyunca birikir. Günlük 1,800 kalori sağlamayı vaat eden bir yemek planı, hataların yönüne bağlı olarak aslında 2,200 veya 1,400 kalori sunabilir.
Diyabet gibi bir tıbbi durumu yönetmek veya belirli atletik performans hedeflerine ulaşmak için bir yemek planı kullanan biri için bu seviyede bir yanlışlık sadece yardımcı değildir. Potansiyel olarak zararlıdır.
Neden Özel Olarak Tasarlanmış Beslenme AI'sı Farklıdır?
Genel bir LLM ile özel olarak tasarlanmış bir beslenme sistemi arasındaki fark mimaridir, kozmetik değil.
Veritabanına Dayalı Yanıtlar
Nutrola'nın AI'sı kalori tahminlerini dil kalıplarından üretmez. Bir gıda maddesini tanımladığında, bu tanımı doğrulanmış bir beslenme veritabanındaki bir girişle eşleştirir. Veritabanı, USDA FoodData Central'dan, birçok ülkeden ulusal beslenme veritabanlarından ve iç uzmanlar tarafından incelenmiş girişlerden elde edilen verileri içerir.
Bu, sistemin bir kalori sayısını halüsinasyon yapamayacağı anlamına gelir. Sayı, belirli, denetlenebilir bir veritabanı girişinden gelir, istatistiksel bir dil modelinden değil.
Görsel Doğrulama
Bir kullanıcı bir yemeğin fotoğrafını çektiğinde, Nutrola'nın bilgisayarla görme modeli bireysel gıda maddelerini tanımlar ve görsel analiz yoluyla porsiyon boyutlarını tahmin eder. Bu görsel zemin, yalnızca metin tabanlı LLM'lerin gerçekleştiremeyeceği bir kontrol sağlar. Sistem, ne yediğinizi gerçekten görerek, metin açıklamasından tahmin yapmaktan ziyade bakıyor.
Şeffaf Belirsizlik
İyi tasarlanmış bir beslenme sistemi belirsizlik olduğunda bunu kabul eder. Eğer bir yemek belirsizse veya bir fotoğraftan porsiyon boyutunu tahmin etmek zor ise, sistem bu belirsizliği işaret edebilir ve kullanıcıdan açıklama isteyebilir. Genel LLM'ler, beslenme tahminlerinin düşük güvenle olduğunu neredeyse hiç belirtmez, çünkü kendi güvenlerini ölçme mekanizmaları yoktur.
Gerçek Sağlık Riskleri
Yapay zekadan gelen yanlış kalori verileri soyut bir sorun değildir. Somut şekillerde kendini gösterir.
Kilo yönetimi başarısızlığı. Günlük 200 kalori fazla veya eksik saymak, herhangi bir diyetin sonucunu değiştirir. 30 gün boyunca bu, yaklaşık 6,000 kalori hatası demektir; bu da yaklaşık 1.7 pound vücut yağının her iki yönde kaybına eşdeğerdir.
Mikro besin körlüğü. LLM'ler nadiren mikro besin verileri sağlar ve sağladıklarında, bu sayılar kalori tahminlerinden daha az güvenilirdir. Hamilelikte demir alımını takip eden veya hipertansiyon için sodyumu izleyen biri, üretilen tahminlere güvenemez.
Yanlış güven. En sinsi risk, kullanıcının doğru verilere sahip olduğuna inanmasıdır. Bu yanlış güven, daha iyi araçlar aramaktan veya gerçek sonuçlara dayalı ayarlamalar yapmaktan alıkoyar.
Bir LLM'den Gıda Hakkında Ne Zaman Sormak Uygundur?
Genel LLM'ler beslenme için işe yaramaz değildir. Belirli türdeki sorgular için etkilidirler:
- Genel eğitim: "Hangi gıdalar potasyum açısından zengindir?" veya "Çözünebilen ve çözünemez lif arasındaki fark nedir?" gibi bilgi soruları, yaklaşık yanıtların uygun olduğu alanlardır.
- Tarif fikirleri: "500 kalorinin altında yüksek proteinli bir öğle yemeği fikri ver" gibi sorular, tam kalori sayısı doğrulanması gerekse bile faydalı ilham verebilir.
- Kavramları anlama: "Kalori açığı nedir?" veya "Protein kas iyileşmesine nasıl yardımcı olur?" gibi konular, LLM'lerin iyi performans gösterdiği alanlardır.
Çizgi net: LLM'leri beslenme hakkında öğrenmek için kullanın. Takip için doğrulanmış, veritabanına dayalı araçları tercih edin.
Herhangi Bir AI Beslenme İddiasını Nasıl Doğrulamalıyım?
Bir sohbet robotu veya başka bir araç kullanıyor olsanız da, aldığınız verileri kontrol etmek için pratik adımlar vardır:
- USDA FoodData Central ile karşılaştırın. USDA veritabanı ücretsiz, kamuya açık ve laboratuvar onaylıdır. Bir AI'nın tahmini, aynı gıda için USDA girişinden önemli ölçüde farklıysa, AI muhtemelen yanlıştır.
- Porsiyon boyutu varsayımlarını kontrol edin. Tahminin hangi porsiyon boyutuna dayandığını her zaman sorun veya doğrulayın. Porsiyon boyutu belirtilmeden verilen bir kalori sayısı anlamsızdır.
- Hazırlama yöntemini dikkate alın. Aynı malzeme, çiğ, fırınlanmış, kızartılmış veya yağda sotelenmiş olmasına bağlı olarak kalori yoğunluğunda 2 ila 3 kat değişiklik gösterebilir.
- Yuvarlak sayılara şüpheyle yaklaşın. Eğer bir AI size bir yemeğin "tam olarak 500 kalori" olduğunu söylüyorsa, bu bir tahmindir, ölçülen bir değer değil. Gerçek beslenme verileri, 487 veya 523 gibi belirli sayılar içerir.
Sıkça Sorulan Sorular
ChatGPT kalori sayımı için ne kadar doğru?
ChatGPT ve benzeri büyük dil modelleri kalori sayımı için güvenilir değildir. Onlar, doğrulanmış beslenme veritabanlarında değerleri aramak yerine metin kalıplarına dayanarak tahminler üretirler. Testlerde, LLM kalori tahminleri karmaşık yemekler için aynı gıda için farklı sorgularda 200 ila 300 kalori arasında değişiklik göstermiştir. "Bir büyük yumurta" gibi basit ve iyi bilinen ürünler için tahminler genellikle yakın olur çünkü bu veriler eğitim metinlerinde sıkça yer alır. Hazırlanmış yemekler, restoran yemekleri ve karışık malzemeli gıdalar için hata oranı önemli ölçüde artar.
ChatGPT'yi makro takibi için kullanabilir miyim?
ChatGPT'yi makro takibi için kullanmak, belirli sağlık veya fitness hedefleri olan herkes için önerilmez. Model, sizin gerçek porsiyon boyutlarınızı, pişirme yöntemlerinizi veya spesifik malzemelerinizi dikkate alamaz. Ayrıca tutarlılığı yoktur; aynı soruyu iki kez sormak farklı makro dağılımları üretebilir. Bir gıdanın yüksek protein veya karbonhidrat içerip içermediği konusunda genel bir farkındalık için, LLM faydalı yönlendirmeler sağlayabilir. Ancak hassas takip için, doğrulanmış bir veritabanına sahip özel bir beslenme uygulaması çok daha doğru ve tutarlı sonuçlar verir.
Beslenmede yapay zeka halüsinasyonu nedir?
Beslenmede yapay zeka halüsinasyonu, bir dil modelinin kalori sayıları, makro dağılımları veya mikro besin değerleri gibi beslenme verilerini, otoriter bir şekilde görünmesine rağmen gerçekte yanlış bir şekilde üretmesidir. Model kasıtlı olarak yalan söylemez; mantıklı görünen metni kalıplara dayanarak tahmin eder. Sonuç, bir gerçek gibi okunan ancak hiçbir beslenme veritabanıyla doğrulanmamış bir kalori sayısıdır. Bu özellikle tehlikelidir çünkü kullanıcılar, halüsinasyonla üretilmiş bir tahmini doğru olandan ayırt etme şansına sahip değildir.
Beslenme AI'mın doğru veri verdiğini nasıl anlarım?
Üç şeyi kontrol edin. İlk olarak, aracın, bir dil modelinden tahminler üretmek yerine, USDA FoodData Central veya NCCDB gibi doğrulanmış bir beslenme veritabanından veri çekip çekmediğini sorun. İkincisi, hazırlama yöntemlerini dikkate alıp almadığını doğrulayın; çünkü pişirme yöntemi bir gıdanın kalori içeriğini %50 ila %200 oranında değiştirebilir. Üçüncüsü, tahmininin hangi porsiyon boyutuna dayandığını belirtip belirtmediğini kontrol edin. Güvenilir bir beslenme AI'sı, veri kaynakları hakkında şeffaf olmalı ve belirsiz tahminleri işaret etmelidir; her sayıyı eşit güvenle sunmamalıdır.
AI tarafından oluşturulan bir yemek planını takip etmek güvenli mi?
AI tarafından oluşturulan yemek planları, başlangıç çerçeveleri olarak faydalı olabilir, ancak belirli tıbbi veya performans hedefleri için körü körüne takip edilmemelidir. Plandaki her kalori tahmini potansiyel hata taşır ve bu hatalar tüm bir gün boyunca birikir. Plan, 1,800 kalori sağlamayı vaat ediyorsa ancak her yemek tahmini %10 ila %15 oranında yanlışa sahipse, gerçek günlük alım 1,500 ila 2,100 kalori arasında değişebilir. Genel sağlıklı beslenme ilhamı için AI yemek planları makul bir başlangıç noktasıdır. Klinik beslenme yönetimi, kilo verme programları veya atletik performans diyetleri için kalori ve makro hedefleri, veritabanına dayalı bir araçla doğrulanmalıdır.
Beslenme takibinizi dönüştürmeye hazır mısınız?
Nutrola ile sağlık yolculuklarını dönüştürmüş binlerce kişiye katılın!