Еволюція AI для розпізнавання їжі: від ручного ведення до миттєвого фото-трекінгу

Прослідкуйте історію технологій трекінгу їжі від рукописних щоденників до AI-розпізнавання за фото та дізнайтеся, куди рухається ця технологія далі.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Спосіб, яким люди відстежують своє харчування, змінився за останнє десятиліття більше, ніж за попереднє століття. Те, що починалося з ручних харчових щоденників, пройшло шлях через сканери штрих-кодів та бази даних з пошуком за ключовими словами, щоб дійти до сучасного AI-розпізнавання за фото. Кожне покоління технологій зменшувало труднощі та підвищувало точність, наближаючи нас до мети беззусильного та точного трекінгу харчування.

Ця стаття прослідковує весь шлях цієї еволюції, аналізує ключові досягнення, які дозволили зробити кожен крок вперед, і заглядає в майбутнє технологій трекінгу їжі.

Ера ручних харчових щоденників (1900-ті до 1990-х)

Ще до появи додатків, трекінг харчування був прерогативою клінічних дієтологів, дослідників та найвідданіших прихильників здорового способу життя. Інструменти були простими: зошит, ручка та довідник з харчовими складниками.

Як працювало ручне ведення

Людина записувала все, що їла протягом дня, оцінюючи порції в домашніх вимірах, таких як чашки, столові ложки та "штуки". Наприкінці дня або тижня вона (або дієтолог) шукала кожен продукт у довіднику, наприклад, у посібнику USDA з складу продуктів, і вручну підраховувала калорії та поживні речовини.

Цей метод був трудомістким, схильним до помилок і незручним для більшості людей. Дослідження того часу постійно показували, що ручні записи харчування страждали від кількох систематичних упереджень:

  • Недооцінка: Люди постійно недооцінювали споживання калорій на 20-50 відсотків
  • Упередженість соціальної бажаності: Люди рідше записували нездорову їжу
  • Помилки в оцінці порцій: Без вимірювальних інструментів оцінки порцій часто були дуже неточними
  • Проблеми з пам'яттю: Якщо не записати одразу, страви частково або повністю забувалися
  • Втома від ведення записів: Навіть мотивовані учасники рідко підтримували записи більше ніж кілька тижнів

Цінність незважаючи на обмеження

Незважаючи на ці обмеження, ера ручного ведення встановила важливий висновок, який залишається актуальним і сьогодні: акт самоконтролю за споживанням їжі, хоч і недосконалий, призводить до зміни поведінки. Дослідження показали, що люди, які вели харчові щоденники, навіть неточні, втрачали більше ваги та підтримували кращі харчові звички, ніж ті, хто взагалі не відстежував.

Цей висновок, що усвідомленість сприяє зміні поведінки, став основною мотивацією для кожної наступної технології трекінгу їжі.

Ера пошуку в базах даних (2005 до 2015)

Революція смартфонів та запуск магазинів додатків у 2008 році перетворили трекінг їжі з клінічної практики на споживчий продукт. Додатки, такі як MyFitnessPal (заснований у 2005 році, додаток запущений у 2009) та LoseIt (2008), оцифрували харчовий щоденник і зробили його доступним для мільйонів.

Ключові інновації цієї ери

Пошукові бази даних продуктів: Замість того, щоб переглядати довідники, користувачі могли ввести назву продукту та шукати в базі даних сотень тисяч позицій. Це зменшило час на запис з хвилин до секунд.

Сканування штрих-кодів: Можливість сканувати штрих-код упакованої їжі та миттєво отримувати інформацію про харчування стала революційною для оброблених і упакованих продуктів. Це усунуло необхідність шукати або оцінювати харчову інформацію для будь-якого товару з штрих-кодом.

Дані, надані спільнотою: Краудсорсингові бази даних дозволили користувачам додавати відсутні продукти, швидко розширюючи охоплення. База даних MyFitnessPal зросла до понад 11 мільйонів продуктів, в основному завдяки внескам користувачів.

Збереження страв і рецептів: Користувачі могли зберігати часто споживані страви та рецепти, зменшуючи зусилля на повторне введення звичних продуктів до одного натискання.

Проблема тертя залишалася

Хоча додатки для пошуку в базах даних представляли величезний прогрес у порівнянні з паперовими щоденниками, вони все ще страждали від значного тертя:

Проблема Вплив
Пошук і вибір правильного запису 30 до 60 секунд на продукт
Неоднозначні відповідності в базі даних "Курячий салат" повертає сотні записів з різними калорійними значеннями
Відсутність інтелекту оцінки порцій Користувачі все ще повинні були оцінювати грами або порції вручну
Багатокомпонентні страви Запис домашнього стір-фраю вимагав запису кожного інгредієнта окремо
Ресторанна та домашня їжа Погано представлені в базах даних
Втома від ведення записів Середній користувач залишав трекінг через 2 тижні

Дослідження, опубліковане в JMIR mHealth and uHealth, показало, що навіть з додатками для трекінгу середній користувач записував страви лише 10-14 днів, перш ніж зупинитися. Тертя від пошуку, вибору та оцінки залишалося занадто високим для тривалого використання.

Перше покоління фото-трекінгу (2015 до 2020)

Злиття проривів у глибокому навчанні, покращення камер смартфонів та хмарних обчислень зробило розпізнавання їжі за фото можливим як споживчу функцію приблизно з 2015 року. Перше покоління систем фото-трекінгу з'явилося в цей період.

Ранні підходи та обмеження

Перші комерційні системи розпізнавання їжі були, по суті, інструментами класифікації з обмеженим обсягом. Вони могли ідентифікувати один продукт на добре освітленій, акуратно складеній фотографії. Їх типовий робочий процес виглядав так:

  1. Користувач робить фото одного продукту
  2. Система повертає список з п'яти кандидатів
  3. Користувач вибирає правильний продукт
  4. Користувач все ще вручну вводить розмір порції

Ці системи зменшили етап пошуку, але не усунули його повністю, і не вирішили проблему оцінки порцій. Точність була помірною, зазвичай 60-75% точності на стандартних тестах, а продуктивність значно знижувалася на складних стравах з кількома компонентами.

Ключові технічні виклики першого покоління

Обмежені навчальні дані: Ранні моделі навчалися на відносно малих наборах даних (10 000 до 100 000 зображень), які не відображали всю різноманітність реальних страв.

Класифікація з одним ярликом: Більшість систем могли призначити лише один ярлик всьому зображенню, що робило їх неефективними для тарілок з кількома продуктами.

Відсутність оцінки порцій: Візуальна оцінка порцій ще не була достатньо надійною для виробничого використання, тому користувачі все ще повинні були вводити кількість вручну.

Висока затримка: Обробка вимагала хмарних серверів, і час реакції від 5 до 10 секунд був звичним, створюючи незручну паузу в процесі ведення записів.

Наукові прориви, які змінили все

Кілька наукових проривів між 2015 і 2020 роками заклали основу для наступного покоління розпізнавання їжі:

Трансферне навчання: Виявлення, що моделі розпізнавання зображень, навчені на великих загальних наборах даних (таких як ImageNet), можуть бути адаптовані для розпізнавання їжі з набагато меншими наборами даних, специфічними для їжі. Це значно зменшило кількість специфічних для їжі навчальних даних, необхідних для навчання.

Прогрес у виявленні об'єктів: YOLO (You Only Look Once) та подібні архітектури дозволили в реальному часі виявляти кілька об'єктів на одному зображенні, вирішуючи проблему багатокомпонентних тарілок.

Мобільні архітектури нейронних мереж: MobileNet, EfficientNet та подібні архітектури зробили можливим запуск нейронних мереж безпосередньо на смартфонах, зменшуючи затримку та усуваючи необхідність постійного підключення до хмари.

Оцінка глибини з одного зображення: Моделі оцінки глибини з монокулярних зображень досягли достатньої точності, щоб дозволити візуальну оцінку порцій, відсутній елемент, який зрештою дозволив трекінг від фото до калорій.

Сучасна ера AI-трекінгу їжі (2020 до сьогодні)

Сучасне покоління додатків для трекінгу їжі є кульмінацією понад десятирічних досліджень у сфері AI. Сучасні системи можуть ідентифікувати кілька продуктів на фотографії, оцінювати розміри порцій і розраховувати повний харчовий склад за менш ніж дві секунди.

Що можуть зробити сучасні системи

Сьогоднішні AI для розпізнавання їжі, як це демонструє функція Snap & Track від Nutrola, пропонують можливості, які здавалося б неможливими ще десять років тому:

  • Виявлення кількох продуктів: Ідентифікувати та окремо аналізувати 5 або більше продуктів на одній тарілці
  • Оцінка порцій: Оцінювати вагу їжі з точністю 15-25 відсотків, використовуючи лише візуальні підказки
  • Глобальне покриття кухонь: Розпізнавати страви з кухонь усього світу, постійно вдосконалюючись завдяки збору нових даних
  • Обробка в реальному часі: Повернення результатів за менш ніж 2 секунди, роблячи фото-трекінг швидшим за введення тексту
  • Контекстуальне навчання: Поліпшувати точність з часом на основі індивідуальних патернів користувачів
  • Повний харчовий аналіз: Розраховувати не лише калорії, а й повні профілі макро- та мікроелементів

Ефект даних

Мабуть, найбільшою перевагою сучасних систем трекінгу їжі є ефект "даних". З мільйонами активних користувачів, такі додатки, як Nutrola, обробляють мільйони зображень їжі щодня. Кожне зображення, разом з підтвердженням або виправленням користувача, стає навчальною точкою.

Це створює позитивний зворотний зв'язок:

  1. Більше користувачів генерують більше різноманітних зображень їжі
  2. Більше зображень покращують точність моделей для більшої кількості продуктів і кухонь
  3. Краща точність приваблює більше користувачів
  4. Більше користувачів генерують більше зображень

Цей цикл значно прискорив темп покращень. Точність розпізнавання Nutrola помітно покращується з кожним кварталом, завдяки постійно зростаючому набору даних від понад 2 мільйонів користувачів у більш ніж 50 країнах.

AI-асистент дієти

Окрім розпізнавання за фото, сучасні додатки впровадили розмовні AI-інтерфейси, які доповнюють візуальне розпізнавання. AI-асистент дієти Nutrola дозволяє користувачам описувати страви природною мовою ("Я з'їв два шматки піци з пепероні та дієтичну колу") та отримувати миттєве харчове ведення.

Цей багатоканальний підхід, що поєднує розпізнавання за фото та обробку природної мови, охоплює весь спектр сценаріїв ведення записів. Фото найкраще підходять для видимих страв, тоді як текстовий ввід обробляє ситуації, коли фото недоцільне (наприклад, при згадуванні страви, з'їденої раніше) або коли користувач хоче вказати деталі, які камера не може зафіксувати (наприклад, використану олію).

Порівняння поколінь: Хронологія прогресу

Функція Ручний щоденник Пошук у базі даних Перше покоління фото AI Сучасний AI (Nutrola)
Час на запис страви 5-10 хвилин 2-5 хвилин 1-3 хвилини Менше 10 секунд
Оцінка порцій Оцінка користувача Введення користувача Введення користувача Оцінка AI
Багатокомпонентні страви Ручне введення Ручне введення Лише один продукт Автоматично
Точність 50-80% 70-90% 60-75% 85-95%
Середня тривалість використання Дні до тижнів Середнє 10-14 днів 2-3 тижні Місяці до років
Покриття кухонь Обмежене довідниками Залежить від бази даних Західноцентричне Глобальне
Доступно для Клінічних пацієнтів Власників смартфонів Власників смартфонів Власників смартфонів

Куди рухається технологія трекінгу їжі

Темпи інновацій у AI для розпізнавання їжі не показують ознак уповільнення. Кілька нових технологій готові ще більше трансформувати спосіб, яким ми відстежуємо харчування.

Носимий та амбієнтний трекінг

Дослідницькі лабораторії розробляють носимі пристрої, які можуть відстежувати споживання їжі без будь-якого активного ведення записів. До них належать:

  • Акустичні сенсори, що носяться на щелепі, які виявляють патерни жування та можуть розрізняти різні текстури їжі
  • Сенсори, що носяться на зап'ясті, які виявляють жести їжі та запускають автоматичне захоплення фото
  • Розумні кухонні ваги, які ідентифікують продукти за змінами ваги та візуальним розпізнаванням одночасно
  • Розумні прилади, які вимірюють розмір укусу та швидкість їжі

Хоча більшість з цих технологій все ще перебуває на стадії дослідження, вони вказують на майбутнє, де трекінг їжі відбувається пасивно, без свідомих зусиль з боку користувача.

Прогнозування харчування

Сучасні системи повідомляють вам про те, що ви вже з'їли. Майбутні системи прогнозуватимуть, що ви, ймовірно, з'їсте, і проактивно пропонуватимуть рекомендації. Аналізуючи патерни в часі прийому їжі, виборі продуктів, даних про місцезнаходження та навіть погоді, AI може пропонувати страви, які заповнять харчові прогалини до їх виникнення.

Уявіть, що ви відкриваєте свій додаток для харчування в обідній час і бачите пропозицію: "Сьогодні у вас недостатньо заліза та клітковини. Ось три варіанти обіду неподалік, які допоможуть." Цей перехід від реактивного трекінгу до проактивного керівництва представляє наступний рубіж.

Інтеграція з даними про здоров'я

Оскільки додатки для трекінгу їжі інтегруються з носимими пристроями для здоров'я, зворотний зв'язок між харчуванням і результатами здоров'я стане більш тісним. Безперервні монітори глюкози можуть показати глікемічний вплив конкретних страв. Дані про варіабельність серцевого ритму можуть виявити, як різні продукти впливають на відновлення та сон. Ваги для вимірювання складу тіла можуть відстежувати довгострокові ефекти змін у харчуванні.

Ця інтеграція дозволить створити дійсно персоналізовані рекомендації щодо харчування на основі того, як ваше тіло реагує на різні продукти, а не лише на середні показники для населення.

Доповнена реальність у харчуванні

AR-окуляри та функції AR у смартфонах можуть накладати інформацію про харчування на їжу в реальному часі. Наведіть телефон на меню ресторану та побачте оцінки калорій для кожного пункту. Подивіться на полицю в магазині та дізнайтеся, як кожен продукт відповідає вашим щоденним харчовим цілям. Пройдіть через буфет і побачте загальну кількість того, що на вашій тарілці.

Поліпшена точність завдяки багатоканальному AI

Злиття великих мовних моделей, моделей зору та структурованих харчових даних створює багатоканальні AI-системи, які можуть міркувати про їжу так, як попередні покоління не могли. Ці системи можуть одночасно враховувати зображення їжі, контекст (час доби, місцезнаходження, історію користувача) та описи природною мовою, щоб забезпечити більш точні та корисні оцінки харчування.

Ширший вплив на громадське здоров'я

Еволюція технологій трекінгу їжі має наслідки, які виходять за межі окремих користувачів. Оскільки трекінг стає простішим і більш поширеним, агреговані дані можуть інформувати дослідження в галузі громадського здоров'я, харчову політику та рекомендації щодо харчування.

Анонімізовані, агреговані дані про харчування від мільйонів користувачів можуть виявити дієтичні патерни на рівні населення, регіональні дефіцити харчування та реальний вплив змін у харчовій політиці. Це представляє значне покращення в порівнянні з невеликими, короткостроковими дієтичними дослідженнями, які традиційно інформували науку про харчування.

Глобальна база користувачів Nutrola в більш ніж 50 країнах надає унікальне вікно в реальні дієтичні патерни, які традиційні методи дослідження не можуть легко зафіксувати. Оскільки технологія продовжує розвиватися, потенціал для покращення не лише індивідуального харчування, але й здоров'я населення стає все більш реальним.

Питання та відповіді

Коли AI для розпізнавання їжі став достатньо точним для практичного використання?

AI для розпізнавання їжі досяг порогу практичної корисності приблизно в 2019-2020 роках, коли точність на стандартних тестах перевищила 85 відсотків, а виявлення кількох продуктів стало надійним. Відтоді точність продовжує стабільно покращуватися, сучасні системи досягають понад 90 відсотків точності для звичайних продуктів.

Як еволюціонувало сканування штрих-кодів разом з AI-розпізнаванням?

Сканування штрих-кодів залишається дуже точним для упакованих продуктів і продовжує бути основною функцією додатків для харчування, включаючи Nutrola. Однак воно обмежене лише упакованими товарами зі штрих-кодами. AI-розпізнавання за фото доповнює сканування штрих-кодів, охоплюючи свіжі продукти, ресторанні страви, домашні страви та будь-яку їжу, яка не упакована. Обидві технології працюють разом, щоб охопити весь спектр продуктів, які люди споживають.

Чи буде AI-трекінг їжі колись 100% точним?

Ідеальна точність малоймовірна через вроджені обмеження візуальної оцінки. Сховані інгредієнти, змінні методи приготування та природна варіація в складі їжі всі вводять невизначеність, яку жодна візуальна система не може повністю вирішити. Однак мета полягає не в досконалості, а в "достатній" точності в поєднанні з низьким тертям, щоб люди дійсно могли вести записи постійно. Оцінка, яка є в межах 10-15 відсотків і займає 2 секунди, є більш цінною для довгострокового здоров'я, ніж ідеальне вимірювання, яке займає 5 хвилин і призводить до втоми від ведення записів.

Як сучасні додатки для трекінгу їжі обробляють конфіденційність?

Сучасні додатки обробляють зображення їжі за допомогою комбінації обчислень на пристрої та в хмарі. Додатки, що дбають про конфіденційність, такі як Nutrola, зменшують зберігання даних, обробляють зображення безпечно та не діляться окремими фотографіями їжі з третіми особами. Користувачі повинні ознайомитися з політикою конфіденційності будь-якого додатку для харчування, щоб зрозуміти, як обробляються їхні дані.

Який найбільший залишковий виклик у технології трекінгу їжі?

Найбільшим залишковим викликом є точна оцінка порцій для складних, змішаних і прихованих продуктів. Хоча точність ідентифікації їжі досягла вражаючих рівнів, оцінка точної ваги інгредієнтів у буріто або кількості олії, використаної для приготування, залишається складною. Дослідження в області оцінки глибини, захоплення з кількох кутів та навчальних композиційних моделей продовжують досягати прогресу в цьому напрямку.

Чи може AI-трекінг замінити роботу з дієтологом?

AI-трекінг їжі є потужним інструментом для самоконтролю харчування, але не може замінити клінічне судження, поведінкове консультування та персоналізовані рекомендації, які надає зареєстрований дієтолог. Ідеальний підхід для багатьох людей полягає в тому, щоб використовувати AI-трекінг для підтримки щоденної усвідомленості та ділитися отриманими даними з дієтологом для періодичного перегляду та рекомендацій. Комплексні дані, які генерує AI-трекінг, насправді роблять консультації з дієтологами більш продуктивними, надаючи об'єктивні дані про харчування, а не покладаючись лише на спогади.

Готові трансформувати своє відстеження харчування?

Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!