Глобальний мозок: Чому більшість ШІ не розпізнає бір'яні, арепи та дал

Більшість ШІ для розпізнавання їжі навчали на бургерах і салатах. Ось чому це створює величезний розрив в точності для кухонь Південної Азії, Латинської Америки та Близького Сходу, і як глобально навчені моделі це виправляють.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Запитайте більшість додатків для розпізнавання їжі, щоб ідентифікувати тарілку курячої бір'яні, і ви, ймовірно, отримаєте відповідь "рис з м'ясом" або, ще гірше, "смажений рис". Оцінка калорій, яка йде за цим, буде помилковою на 200-400 калорій, оскільки модель не має уявлення про гхи, що просочився басматі, багатошарову маринацію або смажену цибулю, що додається до страви.

Це не є нішевою проблемою. За даними Організації Об'єднаних Націй, понад 5,5 мільярдів людей живуть поза межами Північної Америки та Європи. Їхні щоденні страви, від нігерійського джолофу до перуанського севиче та японського окономіякі, систематично недопредставлені в наборах даних, які живлять основні технології розпізнавання їжі. В результаті ми маємо технологію, яка добре працює для чизбургера, але не справляється з більшістю населення світу.

Проблема західноцентричних навчальних даних

Моделі комп'ютерного зору навчаються на зображеннях, на яких вони тренуються. Найбільш поширені публічні набори даних про їжу чітко демонструють, де лежить упередженість.

Food-101, один з основних еталонів у дослідженнях розпізнавання їжі, містить 101 категорію їжі. Приблизно 70 відсотків з них — це страви західноєвропейської або північноамериканської кухні: гамбургери, спагетті болоньєзе, салат "Цезар", яблучний пиріг. Південноазійська кухня представлена лише однією категорією. Африканська кухня взагалі не представлена.

UECFOOD-256, розроблений в Університеті електро-комунікацій у Токіо, сильно орієнтований на японські страви. Він чудово розпізнає рамен і темпуру, але майже нічого не пропонує для південноамериканських чи західноафриканських страв.

Коли модель, навчена переважно на цих наборах даних, стикається з тарілкою чоле бхатуре, вона має два варіанти: або зовсім неправильно класифікувати страву, або зіставити її з найближчим західним еквівалентом. Жоден з варіантів не дає точного підрахунку калорій.

Чому помилкова класифікація коштує більше, ніж ви думаєте

Різниця в калоріях між правильною та неправильною класифікацією може бути величезною. Розгляньте ці реальні приклади:

  • Куряча бір'яні, класифікована як "курячий смажений рис": бір'яні, приготоване з гхи та смаженою цибулею, може містити 450-600 калорій на порцію. Зазвичай курячий смажений рис у загальному базі даних має 300-380 калорій. Це потенційний недооблік у 200 калорій на страву.
  • Арепи, класифіковані як "кукурудзяний хліб": фарширована арепа з сиром і бобами може досягати 500 калорій. Скибка кукурудзяного хліба зафіксована на 170-200 калорій.
  • Дал макхані, класифікований як "суп з сочевиці": масло і вершки в традиційному дал макхані підвищують його до 350-450 калорій на чашку. Звичайний суп з сочевиці має 160-200 калорій.

Протягом тижня ці помилки накопичуються в сотні або навіть тисячі неправильно підрахованих калорій, що може повністю зруйнувати план зниження ваги або набору м'язової маси.

Складність глобальних страв

Західні страв зазвичай мають відносно видимі, відокремлені компоненти: білок, крохмаль, овочі. Багато не західних кухонь представляють собою принципово іншу проблему для комп'ютерного зору.

Шаруваті та змішані приготування

Бір'яні — це шарувата страва. Рис, м'ясо, спеції, смажена цибуля та жир інтегровані, а не подані окремо. Фото поверхні показує лише верхній шар. Моле негро з Оахаки містить понад 30 інгредієнтів, подрібнених в один соус. Тайський масаман каррі поєднує кокосове молоко, смажені арахіс, картоплю та м'ясо в одній невіддільній суміші.

Щоб модель ШІ точно оцінила калорії, їй потрібно розуміти не лише, як виглядає страва, а й що в ній міститься.

Регіональні варіації однієї і тієї ж страви

"Хумус", приготований в Лівані, Сирії, Ізраїлі та Туреччині, суттєво відрізняється за вмістом оливкової олії, співвідношенням тахіні та розміром порції. Бір'яні домашнього приготування в Хайдарабаді відрізняється від ресторанної бір'яні в Лакнау як технікою, так і калорійною щільністю. Тамалі варіюються від регіону до регіону в Мексиці та Центральній Америці, з начинками від нежирного курячого м'яса до свинини в свинячому жирі.

Модель потребує регіонального контексту, а не лише розпізнавання страв, щоб надати надійні оцінки.

Невидимі калорійні складові

Багато глобальних кулінарних традицій покладаються на щедре використання кулінарних жирів, які стають невидимими в готовій страві. Індійська кухня використовує гхи. Західноафриканські страви часто готуються з пальмовою олією. Латиноамериканська кухня включає сало та мантека. Близькосхідна кухня використовує щедрі порції оливкової олії та масла.

Ці жири всмоктуються в страву під час приготування. Фото не може їх показати, але вони можуть становити 30-50 відсотків від загальної кількості калорій.

Як Nutrola підходить до глобального розпізнавання їжі

Створення ШІ для їжі, який працює з різними кухнями, вимагає свідомих зусиль на кожному етапі: збір даних, архітектура моделі та пост-розпізнавальне картографування харчування.

Різноманітні навчальні дані в масштабах

Навчальний набір даних Nutrola включає зображення їжі з понад 130 країн. Замість того, щоб покладатися виключно на публічно доступні західноцентричні набори даних, система включає регіонально зібрані зображення з перевіреними дієтологами етикетками. Це означає, що модель бачила тисячі прикладів інджери з тибс, а не лише стокові фотографії, а реальні страви, сфотографовані в домах і ресторанах по всій Ефіопії та Еритреї.

Харчові профілі на рівні страв

Замість того, щоб розкладати кожну страву на загальні компоненти, Nutrola підтримує харчові профілі страв так, як їх насправді готують. Дал макхані — це не "сочевиця + невідомий жир". Це специфічна страва з відомим методом приготування, і оцінка калорій відображає масло, вершки та повільний метод приготування, які її визначають.

Цей підхід поширюється і на регіональні варіанти. Система розрізняє бір'яні в стилі Калькутти з картоплею та бір'яні в стилі Хайдарабаду, оскільки їх калорійні профілі дійсно різні.

Багатомодальний ввід для прихованих інгредієнтів

Коли одне фото недостатньо, Nutrola використовує голосові та текстові підказки, щоб заповнити прогалини. Користувач може сказати "це було приготовано на кокосовій олії" або "в арепі є сир", і система відповідно коригує оцінку. Цей багатомодальний підхід вирішує проблему невидимих калорій, яку не можуть вирішити чисто фотоорієнтовані системи.

Що означає краща глобальна ідентифікація для користувачів

Для мільйонів людей, які щодня споживають не західну їжу, точний ШІ для їжі — це не розкішна функція. Це різниця між трекером харчування, який працює, і тим, що тихо підриває їхні цілі.

Дослідження 2023 року, опубліковане в Journal of the Academy of Nutrition and Dietetics, показало, що дотримання харчування знижується на 40 відсотків, коли користувачі вважають свій додаток неточним. Якщо ваш трекер постійно неправильно ідентифікує ваші страви, ви перестаєте йому довіряти, а потім і зовсім перестаєте його використовувати.

Точне глобальне розпізнавання їжі також важливо для діаспорних спільнот. Друге покоління індійсько-американців, яке їсть суміш дал, роти та салатів протягом тижня, потребує додатка, який однаково точно обробляє обидві кухні. Нігерійський студент у Лондоні, який готує суп егусі, не повинен вручну вводити кожен інгредієнт, оскільки ШІ ніколи не бачив цієї страви.

Шлях вперед для ШІ в харчуванні

Сфера розпізнавання їжі рухається до більшої різноманітності, але прогрес нерівномірний. Нові набори даних, такі як ISIA Food-500 і Nutrition5k, розширюють охоплення, а техніки переносу навчання дозволяють моделям адаптуватися до недостатньо представлених кухонь з меншими обсягами маркованих даних.

Ключовим фактором у майбутньому буде перевірена харчова інформація. Розпізнати, що страва — це бір'яні, лише половина проблеми. Зіставлення цього розпізнавання з точною оцінкою калорій і макроелементів вимагає знань про харчування, специфічних для регіону, які виходять за межі того, що може надати загальна база даних про їжу.

Для всіх, хто стежить за харчуванням поза стандартною західною дієтою, питання, яке потрібно задати про будь-який ШІ для їжі, є простим: чи була ця система навчена на моїй їжі?

Часто задавані питання

Який найкращий додаток для трекінгу калорій для індійської їжі?

Найкращий трекер калорій для індійської їжі має дві речі: модель розпізнавання, навчена на різноманітних південноазійських стравах, та харчову базу даних, яка враховує традиційні методи приготування. Додатки, які в основному навчалися на західних наборах даних, схильні неправильно класифікувати такі страви, як бір'яні, панір тікка та дал макхані, як загальні записи, що призводить до значних помилок у калоріях. Модель Nutrola навчена на зображеннях їжі з понад 130 країн і підтримує специфічні харчові профілі страв, які відображають реальні методи приготування, включаючи гхи, вершки та регіональні варіації.

Чому мій трекер калорій дає неправильні результати для етнічної їжі?

Більшість основних трекерів їжі використовують моделі розпізнавання, навчальні на наборах даних, домінованих західними кухнями, такими як Food-101. Коли ці моделі стикаються з незнайомими стравами, вони або неправильно класифікують їх як візуально схожу західну страву, або повертаються до загальних записів бази даних. Харчові профілі для цих неправильних відповідностей часто відрізняються на сотні калорій, особливо для страв, приготованих з кулінарними жирами, такими як гхи, пальмова олія або кокосове молоко, які невидимі на фотографіях.

Чи може ШІ точно відстежувати калорії для близькосхідної їжі?

ШІ може точно відстежувати близькосхідну їжу, якщо модель була спеціально навчена на таких стравах, як шаурма, фаттуш, кіббе та мансаф, і якщо харчова база даних враховує вміст оливкової олії, тахіні та масла. Багато страв близькосхідної кухні отримують значну частину своїх калорій з жирів, які вбираються під час приготування. Система, яка поєднує розпізнавання зображень з деталями приготування, наданими користувачем, такими як кількість використаної оливкової олії, забезпечить більш надійні оцінки.

Як ШІ для їжі обробляє страви з багатьма змішаними інгредієнтами?

Складні страви з змішаними або шаруватими інгредієнтами, такі як моле, бір'яні та рагу, є одними з найскладніших викликів у розпізнаванні їжі. Чисто фотоорієнтовані системи можуть лише аналізувати видиму поверхню, пропускаючи внутрішні шари та всмоктані жири. Сучасний ШІ для їжі вирішує цю проблему через розпізнавання на рівні страв, ідентифікуючи повну страву, а не окремі компоненти, а також через багатомодальний ввід, де користувачі можуть додавати деталі про приховані інгредієнти через текст або голос. Цей комбінований підхід значно покращує точність для складних, багатокомпонентних приготувань.

Чи є краудсорсингові дані про їжу точними для міжнародних кухонь?

Краудсорсингові харчові бази даних, як правило, найменш точні для міжнародних кухонь. Записи для страв, таких як джолоф, севиче або пад тай, часто надходять від користувачів, які можуть не враховувати регіональні варіації, кулінарні жири або автентичні методи приготування. Один запис "бір'яні" не може представляти калорійний діапазон від легкої овочевої бір'яні до багатої бір'яні з бараниною. Перевірені бази даних з регіональними харчовими профілями та деталями варіантів забезпечують значно надійніші дані для не західних кухонь.

Готові трансформувати своє відстеження харчування?

Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!