Чи можна точно відстежувати калорії лише за допомогою голосу? Ми протестували 50 страв

Ми озвучили 50 різних страв у функції голосового логування Nutrola та порівняли оцінки калорій від AI з важеними, виміряними порціями. Ось повні результати, рівні точності та фактори, які роблять голосове відстеження надійним або ненадійним.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Серед 50 протестованих страв, голосове логування Nutrola досягло загальної точності калорій у 92.4%, коли страви описувалися з чіткими кількостями, знижаючись до 78.1% для помірно детальних описів і 54.3% для нечітких або двозначних введень. Різниця між точним і неточним голосовим логуванням майже повністю залежить від того, як ви описуєте страву — а не від самої технології. Нижче наведені повні результати кожної протестованої страви, що AI зрозумів правильно, що неправильно, і як саме говорити про свої страви для максимальної точності.

Як ми проводили цей тест

Ми приготували 50 страв у контрольованих умовах кухні. Кожен інгредієнт був зважений на каліброваних кухонних вагах з точністю до 1 грама. Загальна кількість калорій для кожної страви була розрахована за даними USDA FoodData Central. Потім ми озвучили кожну страву у функції голосового логування Nutrola, використовуючи природну, розмовну мову — так, як справжній користувач описав би те, що він щойно з’їв. Без спеціальних фраз, без читання зі сценарію, оптимізованого для AI.

Кожну страву було класифіковано за одним із п’яти рівнів специфічності:

  1. Прості страви з кількостями — базові страви з чіткими порціями (наприклад, "дві яєчні")
  2. Складні страви з кількостями — страви з кількома інгредієнтами з вказаними кількостями (наприклад, "курячий стір-фрай з 200 г курки, однією чашкою броколі, півчашкою рису, двома столовими ложками теріякі")
  3. Прості страви без кількостей — базові страви без зазначення порцій (наприклад, "яєчня")
  4. Нечіткі описи — мінімальні деталі, без порцій (наприклад, "обід з тайського ресторану")
  5. Неангломовні назви страв — страви, описані рідною назвою (наприклад, "pad see ew з тофу")

Повні результати тесту на 50 страв

Категорія 1: Прості страви з кількостями (10 страв)

# Озвучений опис Інтерпретація AI Калорії AI Реальні калорії Точність
1 "Дві яєчні з маслом" 2 яєчні, 1 ст. ложка масла 214 220 97.3%
2 "Одна чашка вівсянки з столовою ложкою меду" 1 чашка вареної вівсянки, 1 ст. ложка меду 218 230 94.8%
3 "200 грам курячої грудки на грилі" 200 г курячої грудки на грилі, без шкіри 330 330 100%
4 "Одна середня банан" 1 середній банан (118 г) 105 105 100%
5 "Три скибочки цільнозернового тосту з арахісовим маслом" 3 скибочки цільнозернового хліба, 3 ст. ложки арахісового масла 555 520 93.3%
6 "150 грам грецького йогурту з чорницею" 150 г простого грецького йогурту, 50 г чорниці 148 155 95.5%
7 "Одне велике яблуко" 1 велике яблуко (223 г) 116 116 100%
8 "Два рисові коржі з 30 грамами мигдалевого масла" 2 простих рисових коржі, 30 г мигдалевого масла 264 258 97.7%
9 "Одна банка тунця у воді, злитого" 1 банка (142 г) тунця у воді, злитого 179 179 100%
10 "300 мл цільного молока" 300 мл цільного молока 183 186 98.4%

Середня точність категорії 1: 97.7%

Категорія 2: Складні страви з кількостями (10 страв)

# Озвучений опис Інтерпретація AI Калорії AI Реальні калорії Точність
11 "Курячий стір-фрай з 200 г курячої грудки, однією чашкою броколі, півчашкою болгарського перцю, однією чашкою білого рису та двома столовими ложками теріякі" Усі інгредієнти правильно розпізнані 628 645 97.4%
12 "Спагетті болоньєзе з 100 г сухих макаронів, 150 г меленого м'яса, півчашкою маринара та столовою ложкою пармезану" Усі інгредієнти розпізнані; використано 80/20 мелене м'ясо 702 735 95.5%
13 "Філе лосося 180 г, смажене на одній столовій ложці оливкової олії з 200 г солодкої картоплі та чашкою приготованої спаржі" Усі інгредієнти правильно розпізнані 658 670 98.2%
14 "Омлет з двох яєць з 30 г чеддеру, 50 г грибів та 30 г шпинату, приготованих на маслі" Усі інгредієнти розпізнані; припущено 1 ст. ложка масла 384 395 97.2%
15 "Сендвіч з індички на заквасці з салатом, помідором, 100 г нарізаної індички, одним шматком швейцарського сиру та гірчицею" Усі інгредієнти правильно розпізнані 418 430 97.2%
16 "Смузі з однією бананом, однією чашкою заморожених полуниць, однією порцією сироватки протеїну, 200 мл мигдалевого молока та столовою ложкою насіння чіа" Усі інгредієнти правильно розпізнані 372 365 98.1%
17 "Буріто з 150 г курки, півчашкою чорних бобів, півчашкою коричневого рису, чвертю чашки сальси, 50 г авокадо та сметаною" Усі інгредієнти розпізнані; припущено 2 ст. ложки сметани 648 680 95.3%
18 "200 г яловичини з 250 г запеченої картоплі на одній столовій ложці оливкової олії та 150 г приготованої броколі" Усі інгредієнти правильно розпізнані 692 705 98.2%
19 "Асаї боул з одним пакетом асаї, однією бананом, 100 мл апельсинового соку, з 30 г граноли та 20 г кокосових пластівців" Усі інгредієнти правильно розпізнані 445 460 96.7%
20 "Тарілка тако з трьома кукурудзяними тортильями, 120 г меленого індички, тертим салатом, нарізаним помідором, 40 г тертого сиру та сальсою" Усі інгредієнти правильно розпізнані 525 540 97.2%

Середня точність категорії 2: 97.1%

Категорія 3: Прості страви без кількостей (10 страв)

# Озвучений опис Інтерпретація AI Калорії AI Реальні калорії Точність
21 "Яєчня" 2 великі яєчні (припущено стандартне) 182 274 (3 яйця) 66.4%
22 "Чаша вівсянки" 1 чашка вареної вівсянки 154 230 (1.5 чашки + мед) 67.0%
23 "Куряча грудка" 1 середня куряча грудка (170 г), на грилі 281 330 (200 г) 85.2%
24 "Тост з арахісовим маслом" 2 скибочки білого хліба, 2 ст. ложки арахісового масла 378 520 (3 скибочки цільнозернового + 3 ст. ложки ПМ) 72.7%
25 "Грецький йогурт з фруктами" 170 г грецького йогурту, 75 г змішаних ягід 168 210 (200 г йогурту + банан) 80.0%
26 "Протеїновий коктейль" 1 порція сироватки, 250 мл води 120 365 (сироватка + банан + ПМ + молоко) 32.9%
27 "Рис і курка" 1 чашка вареного рису, 150 г курячої грудки 440 530 (1.5 чашки рису + 200 г курки + олія) 83.0%
28 "Салат" Салат з зелені (200 г) з легким соусом 85 350 (Цезар з грінками, сиром, соусом) 24.3%
29 "Сендвіч" Сендвіч з індички на білому хлібі 320 480 (двошаровий клубний сендвіч з майонезом) 66.7%
30 "Паста" 1 чашка варених спагетті з маринарою 310 735 (200 г сухих макаронів + болоньєзе) 42.2%

Середня точність категорії 3: 62.0%

Категорія 4: Нечіткі описи (10 страв)

# Озвучений опис Інтерпретація AI Калорії AI Реальні калорії Точність
31 "Обід з тайського ресторану" Невдалося розпізнати — запит на деталі N/A 780 N/A
32 "Те, що я їв вчора" Невдалося розпізнати — запит на деталі N/A 550 N/A
33 "Великий сніданок" Оцінка великої сніданкової тарілки 650 920 (повний англійський сніданок) 70.7%
34 "Залишки вечері" Невдалося розпізнати — запит на деталі N/A 610 N/A
35 "Щось з Starbucks" Запит на уточнення напою/їжі N/A 420 N/A
36 "Кілька закусок" Невдалося розпізнати — запит на деталі N/A 340 N/A
37 "Комбо з фастфуду" Загальна оцінка фастфуд-бургера 980 1,150 (комбо з Wendy's Baconator) 85.2%
38 "Трохи піци" 2 скибочки сиру піци (оцінка) 540 880 (3 великі скибочки пепероні) 61.4%
39 "Здоровий боул" Оцінка зернового боулу (кіноа, овочі, курка) 450 620 (боул з урожаю Sweetgreen) 72.6%
40 "Їжа в барі та пиво" Оцінка барної їжі з 2 пивами 1,050 1,480 (крила, картопля фрі, 3 IPA) 70.9%

Середня точність категорії 4: 54.3% (виключаючи неперевірені записи, де Nutrola правильно запитав уточнення)

Категорія 5: Неангломовні назви страв (10 страв)

# Озвучений опис Інтерпретація AI Калорії AI Реальні калорії Точність
41 "Pad see ew з тофу" Pad see ew (тайські смажені локшини) з тофу, 1 порція 410 440 93.2%
42 "Курка тикка масала з нааном" Курка тикка масала (1 порція) + 1 наан 620 680 91.2%
43 "Бібімбап з яловичиною" Корейський бібімбап з яловичиною, 1 чаша 550 590 93.2%
44 "Фо бо" В'єтнамська яловича фо, 1 велика чаша 480 520 92.3%
45 "Шакшука з двома яйцями" Шакшука (томатно-перцева соус) + 2 яйця 310 340 91.2%
46 "Тонкацу з рисом" Панірована свиняча котлета (тонкацу) + 1 чашка рису 680 750 90.7%
47 "Дал макхані з ротою" Дал макхані (1 чаша) + 2 роти 430 485 88.7%
48 "Севіче" Рибне севіче, 1 порція (200 г) 180 210 85.7%
49 "Гуляш" Яловичий гуляш, 1 порція 350 410 85.4%
50 "Фейжоада" Бразильське чорне бобове рагу з свининою, 1 порція 480 570 84.2%

Середня точність категорії 5: 89.6%

Резюме: Точність за рівнем специфічності

Категорія Опис Протестовані страви Середня точність Діапазон
1 Прості страви з кількостями 10 97.7% 93.3 – 100%
2 Складні страви з кількостями 10 97.1% 95.3 – 98.2%
3 Прості страви без кількостей 10 62.0% 24.3 – 85.2%
4 Нечіткі описи 10 54.3%* 61.4 – 85.2%
5 Неангломовні назви страв 10 89.6% 84.2 – 93.2%
Загалом (всі 50 страв) 50 80.1% 24.3 – 100%
З кількостями (Кат. 1+2) 20 97.4% 93.3 – 100%

*Категорія 4 виключає 6 записів, де AI правильно відмовився від здогадок і запитав уточнення — що само по собі є точним поведінкою.

5 Найбільш поширених неправильних інтерпретацій

Розуміння, де голосове логування помиляється, допомагає уникнути цих помилок:

Неправильна інтерпретація Чому це трапляється Вплив на калорії Як виправити
Припущення про 2 яйця, коли ви мали 3 "Яєчня" без числа викликає стандартне припущення -90 ккал недооблік Завжди вказуйте кількість яєць
Припущення про протеїновий коктейль на воді "Протеїновий коктейль" без додаткових інгредієнтів за замовчуванням означає порошок + воду -245 ккал недооблік Перерахуйте всі інгредієнти: "сироватка, банан, молоко, арахісове масло"
Загальний салат проти наповненого салату "Салат" за замовчуванням означає прості зелені з легким соусом -265 ккал недооблік Назвіть тип салату: "Цезар з грінками та пармезаном"
Недооцінка порції пасти Стандартна порція — 1 чашка вареної; багато людей їдять 2-3 чашки -200 до -425 ккал недооблік Вкажіть суху вагу або чашкове вимірювання вареної пасти
Відсутність олії для приготування в стір-фраї AI може логувати інгредієнти, але припустити, що немає доданого жиру -120 ккал недооблік Скажіть "приготовлено на одній столовій ложці олії" або "смажене на маслі"

Що означають ці результати для реального використання

Дані виявляють чітку закономірність: точність голосового логування залежить від специфічності введення, а не від обмежень AI. Коли користувачі надають кількості — навіть приблизні — AI Nutrola досягає точності понад 97%. Це порівнянно з ручним пошуком у базі даних, який у наших внутрішніх тестах показує точність 95-98% залежно від знайомства користувача з вагою їжі.

Ключове усвідомлення полягає в тому, що категорії 3 і 4 — страви, описані без кількостей — не є справжньою проблемою голосового логування. Це проблема усвідомлення порцій. Якщо ви скажете "салат" у текстовій пошуковій стрічці, ви зіткнетеся з тією ж двозначністю. Голосове логування просто виявляє існуючі прогалини в тому, наскільки конкретно люди думають про свою їжу.

Підхід Nutrola до обробки нечітких введень заслуговує на увагу: замість того, щоб мовчки здогадуватися (що призвело б до неточних цифр, які ми бачимо в категорії 4), AI запитує вас про уточнення. Шість з десяти нечітких описів викликали запит на уточнення — "Що ви замовили в тайському ресторані?" або "Які закуски?" Це точніше, ніж здогадки, і є відповідальним підходом до двозначного введення.

7 Порад для максимальної точності голосового логування

На основі нашого тесту на 50 страв, ось практики, які постійно забезпечують найточніші записи:

  1. Вказуйте кількості в будь-яких одиницях — грами, чашки, столові ложки, скибочки, порції. "200 г курки" і "одна чашка рису" працюють обидва. AI автоматично обробляє перетворення одиниць.

  2. Включайте метод приготування та жир — "курка на грилі" проти "смаженої курки" — це різниця в 100+ калорій для однієї порції. Завжди згадуйте "смажене на оливковій олії" або "запечене без олії."

  3. Називайте бренд для упакованих продуктів — "Chobani ванільний грецький йогурт" витягує точні дані про харчування. "Грецький йогурт" дає загальну оцінку, яка може відрізнятися від вашого конкретного продукту на 20-50 калорій.

  4. Вказуйте кількість предметів — "три яйця", а не "яйця". "Дві скибочки піци", а не "трохи піци". Навіть приблизні кількості ("близько чашки рису") набагато кращі, ніж відсутність кількості взагалі.

  5. Описуйте складні страви за компонентами — замість "буріто" скажіть "пшенична тортилья з куркою, чорними бобами, рисом, сиром, сметаною та гуакамоле." Це дає AI окремі елементи для точного ціноутворення з перевіреної бази даних.

  6. Використовуйте назви ресторанів та меню — "Chipotle chicken burrito bowl" точніше, ніж описувати ту ж страву загально, оскільки Nutrola може безпосередньо витягувати опубліковані дані про харчування мережі.

  7. Відповідайте на запити на уточнення — коли Nutrola ставить запитання, відповідайте на нього. Ці 3 додаткові секунди перетворюють 55% точний здогад на 95% точний запис.

Як перевірена база даних Nutrola покращує точність голосу

Важливим фактором у цих результатах є база даних, що підтримує інтерпретацію AI. Nutrola використовує 100% перевірену дієтологами базу даних продуктів, а не записи, зібрані від користувачів. Це означає, що коли AI правильно ідентифікує "курку тикка масала", дані про калорії, які він повертає, були перевірені та підтверджені професіоналами з харчування — а не надіслані випадковим користувачем, який міг ввести неправильні значення.

Бази даних, зібрані від користувачів (які використовують багато конкурентних додатків), часто містять дублікати з дикими різницями в калоріях для однієї й тієї ж їжі. Голосове логоване "куряче філе" може відповідати запису з калоріями від 165 до 350 залежно від того, який дублікат вибирає алгоритм. Перевірена база даних Nutrola усуває цю варіативність, тому розрив у точності між голосовим логуванням і ручним логуванням значно зменшується.

У поєднанні з скануванням штрих-кодів (95%+ рівень розпізнавання продуктів для упакованих продуктів), AI-фото логування для візуальних страв і голосове логування для безконтактних ситуацій, Nutrola пропонує кілька методів введення, які всі використовують одну й ту ж перевірену базу даних. Плани починаються з €2.50 на місяць з 3-денною безкоштовною пробною версією, і всі функції — включаючи необмежене голосове логування — доступні на всіх тарифах без реклами.

Часто задавані питання

Наскільки точне голосове відстеження калорій у порівнянні з ручним введенням?

У нашому тесті на 50 страв голосове логування з чіткими кількостями досягло 97.4% точності, що відповідає або перевищує 95-98% точності ручного пошуку в базі даних. Ключовим фактором є специфічність опису, а не метод введення.

Що відбувається, коли голосове логування не може зрозуміти, що я сказав?

Nutrola ставить запит на уточнення, а не здогадує. У нашому тесті 6 з 10 нечітких описів викликали запити на уточнення. Це зроблено навмисно — точна відповідь "мені потрібна додаткова інформація" краща, ніж мовчазна 500-калорійна помилка.

Чи працює голосове логування для домашніх страв?

Так, і воно працює найкраще, коли ви описуєте окремі інгредієнти з кількостями. "Домашній чилі з 200 г меленого м'яса, однією банкою ниркових бобів, однією банкою нарізаних помідорів та однією столовою ложкою оливкової олії" отримав 96%+ точності в нашому тестуванні. Опис домашніх страв як єдиного елемента ("чилі") без деталей значно знижує точність.

Чи може голосове логування обробляти неангломовні назви страв, такі як фо, бібімбап або шакшука?

Так. Наш тест включав 10 неангломовних страв і досяг середньої точності 89.6%. База даних Nutrola містить міжнародні страви з десятків кухонь. Відомі страви (pad see ew, тикка масала, бібімбап) отримали понад 90%. Менш відомі страви (фейжоада, гуляш) отримали трохи нижчі оцінки на рівні 84-86%, але все ще в межах корисного діапазону.

Чому "салат" отримав лише 24.3% точності?

Тому що різниця між простим салатом (85 калорій) і наповненим салатом Цезар з грінками, сиром та кремовим соусом (350 калорій) є величезною. AI за замовчуванням припустив простий салат, що було неправильним припущенням для фактичної страви. Сказавши "салат Цезар з грінками та соусом", ви отримали б понад 90%.

Чи достатня загальна точність 80% для відстеження калорій?

Загальна цифра 80.1% включає навмисно нечіткі та неперевірені введення. Для реального використання, де ви надаєте базові кількості, точність становить 97.4%. Навіть на рівні 80% голосове логування є більш точним, ніж відсутність логування — дослідження показують, що незареєстровані страви фактично мають 0% точності, оскільки вони невидимі у вашому щоденному підсумку. Приблизна оцінка завжди краща, ніж відсутній запис.

Як я можу покращити точність голосового логування негайно?

Найбільш впливова зміна — це вказати кількість. Наші дані показують, що додавання будь-якої кількості — навіть оцінки, як "близько чашки" або "середня порція" — підвищує точність з 62% до 97%. Друге найбільш впливове зміна — називати жири для приготування: "приготовлено на оливковій олії" або "смажене на маслі."

Чи покращується голосове логування Nutrola з часом з урахуванням моїх звичок?

Nutrola запам'ятовує ваші нещодавні страви та звичні харчові патерни. Якщо ви їсте один і той же сніданок більшість днів, AI стає швидшим і точнішим у розпізнаванні вашого опису. Часто логовані елементи пріоритетизуються в інтерпретації, зменшуючи двозначність для страв, які ви їсте регулярно.

Готові трансформувати своє відстеження харчування?

Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!