Чи є відстеження калорій за допомогою ШІ просто трюком? Технології розпізнавання їжі

Розпізнавання їжі за допомогою ШІ має реальну наукову основу — але також і реальні обмеження. Ось чесний погляд на те, що комп'ютерне зору може і не може зробити для відстеження калорій, і чому база даних, що стоїть за ШІ, важливіша за сам ШІ.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Розпізнавання їжі за допомогою ШІ — це застосування комп'ютерного зору та глибокого навчання для ідентифікації продуктів на фотографіях та оцінки їх харчової цінності. Це звучить вражаюче в маркетингових матеріалах, і скептицизм цілком зрозумілий: чи може камера телефону дійсно сказати, скільки калорій на вашій тарілці? Чи є це справжньою технологією, чи просто яскравою функцією, розробленою для залучення завантажень?

Чесна відповідь полягає в тому, що розпізнавання їжі за допомогою ШІ — це реальна, корисна та недосконала технологія — одночасно. Ось що насправді робить ця технологія, що говорить дослідження про її точність, де вона зазнає невдачі та що відрізняє справжнє відстеження на основі ШІ від трюкових реалізацій.

Як насправді працює розпізнавання їжі за допомогою ШІ

Розуміння технології допомагає відокремити суть від гіпу. Сучасні системи розпізнавання їжі використовують згорткові нейронні мережі (CNN), навчальні на мільйонах зображень їжі. Процес складається з трьох етапів:

Етап 1: Виявлення їжі. ШІ ідентифікує окремі продукти на фотографії — розділяючи курку, рис і овочі на вашій тарілці.

Етап 2: Класифікація їжі. Кожен ідентифікований продукт співвідноситься з навченою моделлю категорій їжі. Система визначає, що білий продукт — це рис, а не картопляне пюре чи цвітна капуста.

Етап 3: Оцінка порцій. Використовуючи контрольні точки на зображенні (розмір тарілки, розмір приладів, оцінка глибини), система оцінює кількість кожного продукту та розраховує харчові значення на основі відповідного запису в базі даних.

Це не магія, і це не трюк. Це та ж категорія технологій, що використовується в аналізі медичних зображень, виявленні об'єктів в автономних транспортних засобах та контролі якості в промисловості. У застосуванні до їжі вона новіша і менш зріла, ніж ці додатки — але наукова основа комп'ютерного зору добре відома.

Що говорить дослідження про точність?

Кілька рецензованих досліджень оцінили точність розпізнавання їжі за допомогою ШІ:

  • Mezgec і Korousic Seljak (2017) опублікували всебічний огляд у Nutrients, показуючи, що системи розпізнавання їжі на основі глибокого навчання досягли показників точності top-1 від 79% до 93% на стандартних наборах зображень їжі, з варіацією точності залежно від складності їжі та якості зображення.
  • Liang і Li (2017) продемонстрували в дослідженні про розпізнавання їжі за допомогою глибокого навчання, що сучасні архітектури CNN досягли понад 90% точності класифікації на наборах зображень з одноразовими продуктами.
  • Thames та ін. (2021) опублікували дослідження в IEEE Access, показуючи, що сучасні моделі розпізнавання їжі можуть ідентифікувати продукти в складних сценах страв з точністю 80-90%, з найвищою точністю для окремих, добре розділених продуктів.
  • Lu та ін. (2020) розробили модель оцінки порцій, опубліковану в IEEE Transactions on Multimedia, яка оцінювала об'єм їжі в межах 15-25% від фактичних вимірювань, що є значним покращенням у порівнянні з оцінкою без допомоги.

Точність за складністю страв

Тип страв Точність розпізнавання ШІ Точність оцінки порцій Приклад
Один продукт 90-95% В межах 10-15% Яблуко, банан, шматок піци
Проста страва (2-3 інгредієнти) 85-92% В межах 15-20% Грильована курка з рисом і броколі
Складна страва (4+ інгредієнти) 80-88% В межах 20-25% Смажені овочі з соусом
Змішані страви (інгредієнти змішані) 70-85% В межах 25-35% Запіканки, карі, густі супи
Упаковані продукти з етикетками 95%+ (штрих-код) Практично точні (відповідність базі даних) Будь-який продукт з штрих-кодом

Ці цифри реальні та документовані. Вони також мають чіткі обмеження, які будь-яка чесна оцінка повинна визнати.

Де розпізнавання їжі за допомогою ШІ зазнає невдачі

Прозорість щодо обмежень — це те, що відрізняє справжню технологію від трюків. Розпізнавання їжі за допомогою ШІ стикається з певними, передбачуваними проблемами:

Сховані інгредієнти. ШІ не може побачити, що змішано в соусі, шарувато в сендвічі або розчинено в супі. Кремовий соус для пасти виглядає подібно до олійного, але різниця в калоріях є значною.

Неоднозначність методу приготування. Грильована куряча грудинка та смажена на сковороді можуть виглядати ідентично на фотографії, але різниця в калоріях від поглинутої олії може становити 100-200 калорій.

Гомогенні змішані страви. Коли кілька інгредієнтів змішуються в одній страві — запіканки, смузі, густі рагу — ШІ не може візуально розділити компоненти, які фізично нероздільні.

Оцінка глибини порцій. Чаша супу може містити 200 мл або 500 мл — ШІ бачить поверхню, але оцінка глибини з одного фото вводить значну похибку.

Незвичайні або регіональні страви. Моделі ШІ навчені на наборах даних, які схиляються до поширених західних страв. Менш представлені кухні можуть мати нижчу точність розпізнавання.

Це реальні обмеження. Будь-хто, хто стверджує про 99% точності розпізнавання їжі за допомогою ШІ в усіх сценаріях, продає гіп, а не технологію.

ШІ-тільки проти ШІ + перевірена база даних: критична різниця

Ось де розмова стає дійсно важливою для тих, хто оцінює інструменти відстеження калорій. Існують два принципово різні підходи до розпізнавання їжі за допомогою ШІ на ринку:

Підхід 1: ШІ-тільки (без перевіреної бази даних)

Деякі додатки — включаючи Cal AI та SnapCalorie — покладаються переважно на оцінку ШІ без комплексної перевіреної бази даних, що стоїть за розпізнаванням. Коли ШІ ідентифікує "курячу грудинку", він може згенерувати харчову оцінку на основі своїх навчальних даних, а не витягувати перевірені харчові дані з кураторської бази даних.

Проблема: Коли ШІ помиляється — а він помилиться в 5-30% випадків залежно від складності страви — немає запасного варіанту. Користувач отримує неправильну оцінку без легкого способу виправити її за перевіреними даними.

Підхід 2: ШІ + перевірена база даних (підхід Nutrola)

Nutrola вирішує проблему точності, використовуючи розпізнавання їжі за допомогою ШІ як вхідний шар і перевірену базу даних з 1.8 мільйона записів як шар даних. Коли ШІ ідентифікує "грильовану курячу грудинку", він не генерує оцінку калорій на основі навчальних даних — він витягує перевірений харчовий профіль з запису бази даних, який був перевірений фахівцями з харчування.

Чому це важливо: Коли класифікація ШІ є правильною (85-95% випадків для простих страв), користувач отримує перевірені харчові дані. Коли класифікація ШІ є неправильною, користувач може швидко знайти правильний продукт у перевіреній базі даних. ШІ зменшує зусилля; база даних забезпечує точність.

Функція Додатки ШІ-тільки ШІ + перевірена база даних (Nutrola)
Швидкість ведення Швидко (фото) Швидко (фото)
Джерело даних для харчової інформації Оцінка, згенерована ШІ Перевірена база даних (1.8M+ записів)
Коли ШІ правильний Розумна оцінка Перевірені точні дані
Коли ШІ помиляється Немає надійного шляху для виправлення Повна перевірена база даних для ручного виправлення
Покриття поживних речовин Зазвичай тільки калорії + макроелементи 100+ поживних речовин
Узгодженість даних Варіюється між оцінками Узгоджені перевірені значення

Ця різниця є найважливішим фактором при оцінці, чи є функція відстеження калорій за допомогою ШІ трюком або справжнім покращенням у порівнянні з ручним відстеженням.

Чи є це трюком? Рамки для оцінки

Замість загального "так" або "ні", ось як оцінити, чи є конкретна реалізація відстеження їжі за допомогою ШІ суттєвою чи трюковою:

Ознаки трюка

  • Заяви про 99%+ точності для всіх типів їжі
  • Відсутність запасного варіанту до перевіреної бази даних, коли ШІ помиляється
  • Харчові оцінки, згенеровані виключно ШІ без кураторського джерела даних
  • Відсутність можливості редагувати або виправляти результати ШІ
  • Маркетинг зосереджений на "магії" ШІ, а не на точності результатів
  • Обмежене покриття поживних речовин (тільки калорії, без макро- або мікроелементів)

Ознаки справжньої технології

  • Прозорість щодо діапазонів точності та обмежень
  • ШІ служить як метод введення, перевірена база даних надає харчові дані
  • Користувачі можуть легко виправляти помилки ідентифікації ШІ
  • Комплексне покриття поживних речовин (макро + мікроелементи)
  • Постійне покращення моделі на основі даних про виправлення
  • Кілька методів введення (фото, голос, штрих-код, ручний пошук) для різних ситуацій

Як ШІ порівнюється з оцінкою людини

Найважливіший контекст для оцінки точності ШІ — це не досконалість — це порівняння з альтернативою. А альтернативою для більшості людей є оцінка людини, яка, як показують дослідження, є вкрай поганою:

  • Lichtman та ін. (1992) виявили, що учасники недооцінювали своє споживання калорій в середньому на 47%, опубліковано в New England Journal of Medicine
  • Wansink і Chandon (2006) продемонстрували, що помилки в оцінці розміру порцій зростають зі збільшенням розміру страви та калорійної щільності
  • Schoeller та ін. (1990) показали, використовуючи методологію з подвійно міченою водою, що самозвітне споживання систематично недооцінювалося на 20-50%
Метод оцінки Середня точність Схильність
Оцінка людини (не навчені) 50-60% Систематичне недооцінювання
Оцінка людини (навчені в харчуванні) 70-80% Помірне недооцінювання
Розпізнавання їжі за допомогою ШІ (прості страви) 85-95% Випадкова похибка, без систематичного упередження
ШІ + перевірена база даних (прості страви) 90-95% Виправна випадкова похибка
Ваги для їжі + перевірена база даних 95-99% Майже точне вимірювання

Розпізнавання їжі за допомогою ШІ з точністю 85% з перевіреною базою даних не є досконалим. Але воно значно точніше, ніж 50-60%, які більшість людей досягає лише через оцінку. Важливе порівняння — це не "ШІ проти досконалості", а "ШІ проти того, що я б зробив без нього".

Технологія реальна, але реалізація має значення

Розпізнавання їжі за допомогою ШІ не є трюком. Це легітимне застосування комп'ютерного зору, яке було підтверджено в рецензованих дослідженнях і впроваджено в комерційні продукти, які використовують мільйони людей. Основна технологія є надійною.

Але не всі реалізації створені однаково. Цінність розпізнавання їжі за допомогою ШІ залежить виключно від того, що стоїть за ним: якість бази даних, механізми виправлення, покриття поживних речовин і чесність щодо обмежень.

Nutrola поєднує розпізнавання фото їжі за допомогою ШІ з перевіреною базою даних з 1.8 мільйона записів, голосовим введенням на 15 мовах, скануванням штрих-кодів і можливістю відстежувати понад 100 поживних речовин. ШІ робить ведення швидким. Перевірена база даних забезпечує точність. Це поєднання вирішує законне занепокоєння, що ШІ сам по собі недостатньо надійний, щоб йому довіряти.

З безкоштовною пробною версією та €2.50 на місяць після — без жодної реклами — ви можете перевірити, чи технологія виправдовує свої обіцянки, не покладаючись на чиїсь слова.

Часто задавані питання

Як розпізнавання їжі за допомогою ШІ порівнюється зі скануванням штрих-кодів за точністю?

Сканування штрих-кодів є більш точним для упакованих продуктів, оскільки воно співвідносить конкретний продукт з конкретним записом у базі даних. Розпізнавання їжі за допомогою ШІ вводить оцінку як для ідентифікації, так і для розміру порції. Для упакованих продуктів завжди використовуйте сканування штрих-кодів. Для приготованих страв, свіжих продуктів та страв з ресторанів розпізнавання їжі за допомогою фото є найпрактичнішим доступним методом введення.

Чи може ШІ розпізнавати домашні страви?

Так, з застереженнями. ШІ може ідентифікувати видимі компоненти домашньої страви (грильована курка, парена броколі, рис) з високою точністю. Він стикається з труднощами з прихованими інгредієнтами, такими як олії для приготування, соуси, змішані в стравах, і приправи, які додають калорії без видимих ознак. Для домашнього приготування фотографування страви, а потім коригування на основі олій для приготування та прихованих інгредієнтів дає найкращі результати.

Чи покращується ШІ з часом?

Так. Сучасні системи розпізнавання їжі використовують безперервне навчання, де виправлення користувачів покращують точність моделі для майбутніх розпізнань. ШІ Nutrola покращується, оскільки його база користувачів з понад 2 мільйонів осіб надає дані для виправлення. Крім того, перевірена база даних постійно розширюється, покращуючи рівень відповідності між розпізнаванням ШІ та записами бази даних.

Чи є розпізнавання їжі за допомогою ШІ достатньо точним для серйозних цілей фітнесу?

Для точності на рівні бодібілдингу (відстеження до 50 калорій на день) розпізнавання їжі за допомогою ШІ саме по собі не є достатнім — вага їжі з перевіреною базою даних залишається золотим стандартом. Для загального фітнесу, схуднення та відстеження здоров'я (з точністю в межах 10-15%) розпізнавання їжі за допомогою ШІ з перевіреною базою даних є більш ніж достатнім і значно більш стійким, ніж зважування кожної страви.

Чому деякі калорійні трекери на основі ШІ дають різні результати для однієї й тієї ж фотографії?

Це виявляє різницю між реалізаціями ШІ. Додатки, які генерують харчові оцінки на основі навчальних даних ШІ (а не витягують з перевіреної бази даних), будуть варіюватися залежно від їх навчальних даних та алгоритмів оцінки. Додатки, які використовують ШІ для ідентифікації їжі, а потім витягують дані з перевіреної бази даних, дадуть більш послідовні результати, оскільки джерело харчових даних стандартизоване.

Чи може ШІ розпізнавати їжу з різних кухонь?

Точність розпізнавання варіюється залежно від кухні в залежності від представлення навчальних даних. Звичайні західні страви, як правило, мають найвищу точність. Східноазійські, південноазійські, близькосхідні та африканські кухні все більше представлені в навчальних наборах даних, але можуть мати нижчу точність для менш поширених страв. Підтримка Nutrola для 15 мов і зростаюча база даних міжнародних продуктів вирішує цю проблему, але це залишається областю постійного вдосконалення в галузі.

Готові трансформувати своє відстеження харчування?

Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!