Jak zbudowaliśmy najdokładniejszą bazę danych żywności na świecie: kulisy danych żywieniowych Nutrola
Zajrzyj za kulisy, aby dowiedzieć się, jak Nutrola stworzyła i utrzymuje bazę danych żywieniowych, której zaufało ponad 2 miliony użytkowników — obejmując źródła danych, procesy weryfikacji oraz technologię, która zapewnia jej dokładność.
Kiedy logujesz pierś z kurczaka w aplikacji do śledzenia kalorii, polegasz na tym, że widzisz poprawną wartość. Ufasz, że ktoś, gdzieś, dokładnie zmierzył ten produkt, wprowadził dane poprawnie i że nikt nie manipulował tymi informacjami od tamtej pory.
Ta ufność często jest jednak mylna.
Większość aplikacji żywieniowych opiera się na bazach danych opartych na crowdsourcingu, gdzie każdy użytkownik może dodać wpis. Efektem jest chaos. Szukasz "banana" i znajdujesz 47 wpisów z zupełnie różnymi wartościami kalorii. Skanujesz kod kreskowy i otrzymujesz dane żywieniowe sprzed trzech lat, zanim producent zmienił skład produktu. Logujesz posiłek z restauracji, a wpis został dodany przez kogoś, kto zgadywał.
W Nutrola postanowiliśmy już na początku, że dokładność danych to nie funkcja — to fundament. Wszystko, co budujemy, zależy od tego, aby liczby były poprawne. To jest historia o tym, jak stworzyliśmy bazę danych żywieniowych, której zaufało ponad 2 miliony użytkowników, oraz systemach, które pozwalają nam utrzymywać tę dokładność każdego dnia.
Dlaczego większość baz danych żywieniowych jest wadliwa
Zanim wyjaśnimy, co robimy inaczej, warto zrozumieć, dlaczego standardowe podejście zawodzi.
Problem z crowdsourcingiem
Najpopularniejsze aplikacje do śledzenia kalorii korzystają z baz danych opartych na crowdsourcingu. Użytkownicy dodają wpisy dotyczące żywności, inni użytkownicy z nich korzystają, a baza danych rośnie organicznie. Ten model szybko się rozwija, co jest powodem, dla którego aplikacje go przyjmują. Jednak wprowadza on systematyczne błędy, które kumulują się z czasem.
Oto najczęstsze problemy z danymi żywieniowymi opartymi na crowdsourcingu:
| Problem | Jak to się dzieje | Wpływ na użytkowników |
|---|---|---|
| Duplikaty wpisów | Wielu użytkowników dodaje tę samą żywność z różnymi danymi | Użytkownicy wybierają losowe wpisy, otrzymując niespójne wyniki |
| Nieaktualne informacje | Produkty są reformułowane, ale stare wpisy pozostają | Wartości kalorii i makroskładników mogą być błędne o 20-40% |
| Niepoprawne wielkości porcji | Użytkownicy wprowadzają dane w gramach, gdy etykieta podaje uncje, lub odwrotnie | Obliczenia porcji są zasadniczo błędne |
| Brak mikroskładników | Użytkownicy wprowadzają tylko kalorie, pomijając witaminy, minerały, błonnik | Śledzenie mikroskładników staje się niewiarygodne |
| Różnice regionalne | Ta sama żywność ma różne formuły w różnych krajach | Użytkownicy w jednym kraju otrzymują dane przeznaczone dla innego |
| Wymyślone wpisy | Użytkownicy wprowadzają przybliżone lub wymyślone dane żywieniowe | Nie ma sposobu na odróżnienie prawdziwych danych od zgadywanek |
Badanie opublikowane w 2024 roku w Journal of the Academy of Nutrition and Dietetics wykazało, że bazy danych żywności opartych na crowdsourcingu miały wskaźniki błędów w zakresie od 15% do 30% dla najczęściej logowanych produktów. Dla mniej popularnych żywności wskaźnik błędów wzrastał powyżej 40%.
To oznacza, że jeśli pilnie śledzisz swoje jedzenie każdego dnia, twoje rzeczywiste spożycie może być błędne o setki kalorii. Dla kogoś, kto stara się utrzymać deficyt kaloryczny na poziomie 300 kalorii w celu utraty wagi, taki margines błędu może całkowicie zniweczyć ich postępy.
Problem z przestarzałymi danymi
Producenci żywności nieustannie zmieniają swoje przepisy i formuły. Baton białkowy, który miał 20 gramów białka w zeszłym roku, może mieć dziś 18 gramów. Mrożony posiłek, który miał 350 kalorii, może teraz mieć 380. Zmieniają się opakowania, składniki są zamieniane, a wielkości porcji są dostosowywane.
Większość baz danych żywieniowych nie ma systemu do wychwytywania tych zmian. Oryginalny wpis pozostaje w bazie danych na zawsze, powoli oddalając się od rzeczywistości.
Luka w skanowaniu kodów kreskowych
Skanowanie kodów kreskowych to jedna z najpopularniejszych funkcji w aplikacjach do śledzenia kalorii. Użytkownicy to uwielbiają, ponieważ wydaje się to dokładne — skanujesz dokładnie ten produkt, który jesz. Ale bazy danych kodów kreskowych mają swoje problemy. Produkty dzielą kody kreskowe w różnych regionach z różnymi formułami. Marki sklepowe ponownie wykorzystują kody kreskowe, gdy zmieniają dostawców. A wiele produktów po prostu nie znajduje się w bazie danych, szczególnie międzynarodowe lub specjalistyczne jedzenie.
Podejście Nutrola: Zweryfikowane dane na każdym poziomie
Zbudowaliśmy naszą bazę danych na zasadniczo innej filozofii: każdy element danych żywieniowych powinien być możliwy do prześledzenia do zweryfikowanego źródła, a każdy wpis powinien być nieustannie weryfikowany.
Oto jak to działa w praktyce.
Poziom 1: Źródła rządowe i instytucjonalne
Fundament naszej bazy danych pochodzi z oficjalnych rządowych baz danych żywieniowych. To złoty standard danych żywieniowych, ponieważ są one produkowane przez wykwalifikowanych naukowców żywnościowych przy użyciu ustandaryzowanych metod laboratoryjnych.
Nasze główne źródła instytucjonalne obejmują:
- USDA FoodData Central — Departament Rolnictwa Stanów Zjednoczonych utrzymuje najbardziej kompleksową bazę danych żywności analizowanej w laboratoriach na świecie, z ponad 380 000 wpisów obejmujących surowe składniki, produkty markowe i jedzenie z restauracji.
- EFSA Comprehensive European Food Consumption Database — Europejski Urząd ds. Bezpieczeństwa Żywności dostarcza danych żywieniowych uwzględniających europejskie formuły żywności i składniki regionalne.
- Food Standards Australia New Zealand (FSANZ) — Obejmuje produkty i składniki specyficzne dla rynków Australii i Nowej Zelandii.
- Health Canada Canadian Nutrient File — Dane analizowane w laboratoriach dla żywności powszechnie spożywanej w Kanadzie.
- National Institute of Health and Nutrition (Japonia) — Dostarcza dane dla japońskich produktów i składników, które są słabo reprezentowane w bazach danych zachodnich.
Nie importujemy po prostu tych baz danych i nie nazywamy tego zakończonym. Normalizujemy dane w różnych źródłach, rozwiązujemy konflikty (gdy ta sama żywność pojawia się w wielu bazach danych z nieco różnymi wartościami) i mapujemy wszystko do jednolitego schematu, który uwzględnia wielkości porcji, metody przygotowania i różnice regionalne.
Poziom 2: Zweryfikowane dane o produktach od producentów
Dla produktów markowych i pakowanych utrzymujemy bezpośrednie kanały danych z producentami żywności i detalistami. Kiedy firma aktualizuje formułę produktu, otrzymujemy zaktualizowane informacje o wartościach odżywczych — często zanim pojawią się na półkach sklepowych.
Ten poziom obejmuje ponad 1,2 miliona produktów markowych w 47 krajach. Każdy wpis zawiera:
- Pełne dane z panelu wartości odżywczych (nie tylko kalorie i makroskładniki)
- Listy składników z oznaczeniem alergenów
- Informacje o wielkości porcji w różnych jednostkach
- Regionalne warianty formuły
- Status produktu (aktywny, wycofany, zmieniony)
Kiedy wykrywamy zmianę formuły, aktualizujemy wpis i oznaczamy go, aby użytkownicy, którzy regularnie logują ten produkt, widzieli dokładne dane w przyszłości. Nie usuwamy starych wpisów — archiwizujemy je z oznaczeniem czasowym, aby historyczne logi pozostały dokładne.
Poziom 3: Weryfikacja danych wspomagana przez AI
To jest miejsce, w którym nasze podejście różni się najbardziej od standardów branżowych. Używamy modeli uczenia maszynowego do nieustannej weryfikacji każdego wpisu w naszej bazie danych, wychwytując błędy, które mogłyby umknąć ludzkiemu przeglądowi.
Nasz system weryfikacji sprawdza:
Statystyczne odstępstwa. Jeśli wpis żywnościowy ma wartości kalorii lub makroskładników, które wykraczają poza oczekiwany zakres dla swojej kategorii żywności, zostaje oznaczony do przeglądu. Pierś z kurczaka z 400 kaloriami na 100 gramów zostanie natychmiast wychwycona.
Spójność makro-kalorii. Kalorie można obliczyć na podstawie makroskładników (4 kalorie na gram białka, 4 na gram węglowodanów, 9 na gram tłuszczu, 7 na gram alkoholu). Jeśli podane kalorie nie zgadzają się z sumą obliczoną na podstawie makroskładników, coś jest nie tak. Nasz system wychwytuje rozbieżności tak małe jak 5%.
Weryfikacja między źródłami. Gdy ta sama żywność pojawia się w wielu bazach danych źródłowych, porównujemy wartości. Znaczące rozbieżności wywołują ręczny przegląd przez nasz zespół danych żywieniowych.
Spójność czasowa. Jeśli dane żywieniowe produktu markowego nagle się zmieniają bez odpowiadającej aktualizacji od producenta, zostaje oznaczone. To wychwytuje przypadki, w których import bazy danych wprowadził błędy lub gdzie produkt został pomylony z podobnym.
Sygnalizacja zachowań użytkowników. Gdy tysiące użytkowników logują tę samą żywność, ich wielkości porcji i wzorce częstotliwości tworzą sygnaturę behawioralną. Jeśli nowy wpis powoduje nietypowe wzorce logowania (na przykład ludzie konsekwentnie dostosowują wielkość porcji), sugeruje to, że domyślna wielkość porcji może być błędna.
Poziom 4: Przegląd przez ekspertów
Technologia wychwytuje większość błędów, ale niektóre wymagają ludzkiego osądu. Nasz zespół danych żywieniowych składa się z zarejestrowanych dietetyków i naukowców żywnościowych, którzy zajmują się:
- Wpisami oznaczonymi przez system weryfikacji AI
- Złożonymi produktami, takimi jak posiłki z wielu składników
- Regionalnymi produktami, które nie pojawiają się w standardowych bazach danych
- Zgłoszonymi przez użytkowników problemami z danymi (traktujemy każde zgłoszenie poważnie)
- Nowymi kategoriami żywności, na których nasze modele nie zostały jeszcze przeszkolone
Każdy wpis, który przechodzi przez przegląd ludzki, jest oznaczony notatkami przeglądającego, źródłem korekty i wskaźnikiem pewności. Tworzy to ślad audytu, który pomaga nam poprawić nasze zautomatyzowane systemy w miarę upływu czasu.
Techniczna infrastruktura naszej bazy danych
Budowanie dokładnych danych to tylko połowa wyzwania. Dostarczanie ich niezawodnie do ponad 2 milionów użytkowników wymaga infrastruktury, o której większość ludzi nigdy nie myśli.
Architektura synchronizacji w czasie rzeczywistym
Kiedy aktualizujemy wpis żywnościowy, zmiana musi dotrzeć do każdego użytkownika, który ma ten produkt w swoim logu. Używamy architektury opartej na zdarzeniach, w której aktualizacje bazy danych propagują się do urządzeń użytkowników w ciągu kilku minut. Oznacza to, że jeśli poprawimy błąd w popularnym produkcie o 14:00, użytkownicy, którzy otworzą Nutrola o 14:05, zobaczą poprawne wartości.
Inteligencja dopasowania nazw żywności w wielu językach
Nazwy żywności różnią się dramatycznie w zależności od języka i regionu. "Courgette" w Wielkiej Brytanii to "zucchini" w Stanach Zjednoczonych. "Skyr" w Islandii często klasyfikowane jest jako jogurt w innych miejscach. Nasz system wyszukiwania korzysta z wielojęzycznej ontologii żywności, która mapuje równoważne produkty w 18 językach, dzięki czemu użytkownicy zawsze znajdą to, czego szukają, niezależnie od tego, jak to nazywają.
Inteligencja dotycząca wielkości porcji
Surowe dane żywieniowe są zazwyczaj podawane na 100 gramów, ale nikt nie myśli w kategoriach 100-gramowych. Ludzie myślą w kategoriach "garści", "szklanki", "średniego jabłka" lub "jednego kawałka". Utrzymujemy kompleksową bazę danych wielkości porcji, która mapuje powszechne opisy porcji na wagi gramowe dla każdej kategorii żywności.
Ten system napędza również rozpoznawanie zdjęć w Nutrola. Kiedy fotografujesz swoje danie, nasz model szacuje nie tylko, co znajduje się na twoim talerzu, ale także ile tego jest — i odnosi się do tych samych zweryfikowanych danych o wielkości porcji, aby obliczyć składniki odżywcze.
Jak radzimy sobie z najtrudniejszymi przypadkami
Niektóre produkty są naprawdę trudne do dostarczenia dokładnych danych żywieniowych. Oto jak podchodzimy do najtrudniejszych kategorii.
Posiłki z restauracji i fast foodów
Sieci restauracyjne zazwyczaj publikują informacje o wartościach odżywczych, ale niezależne restauracje tego nie robią. Dla sieci restauracyjnych utrzymujemy bezpośrednie relacje, aby uzyskać dane żywieniowe i aktualizować je, gdy zmieniają się menu. Dla niezależnych restauracji stosujemy podejście oparte na szacunkach przepisów: nasz system rozkłada danie na jego składniki, szacuje ilości na podstawie standardowych metod przygotowania w restauracjach i oblicza całkowity profil żywieniowy.
To nie jest idealne, ale jest znacznie dokładniejsze niż alternatywa (zgadywanie lub używanie ogólnego wpisu "kanapka z kurczakiem z restauracji"). Coaching AI Nutrola również pomaga użytkownikom zrozumieć niepewność: jeśli nie jesteśmy pewni danych żywieniowych posiłku z restauracji, informujemy cię o tym.
Domowe i oparte na przepisach jedzenie
Kiedy gotujesz w domu, profil żywieniowy twojego posiłku zależy od twoich konkretnych składników i ilości. Nutrola radzi sobie z tym za pomocą naszego kreatora przepisów, który pozwala wprowadzić składniki i oblicza wartości odżywcze na porcję, korzystając z naszych zweryfikowanych danych o składnikach. Dokładność wyniku jest tak dobra, jak dokładność wprowadzenia, dlatego wspieramy również logowanie oparte na zdjęciach dla domowych posiłków.
Międzynarodowe i specjalistyczne jedzenie
Wiele aplikacji żywieniowych jest mocno ukierunkowanych na amerykańskie jedzenie. Jeśli jesz japońskie, indyjskie, etiopskie lub jakiekolwiek inne danie, które jest słabo reprezentowane w zachodnich bazach danych, często zostajesz z niekompletnymi lub niedokładnymi danymi. Zainwestowaliśmy znaczne środki w rozszerzenie naszej oferty międzynarodowych produktów, współpracując z regionalnymi bazami danych żywieniowych, lokalnymi naukowcami żywnościowymi oraz korzystając z opinii społeczności, aby wypełnić te luki.
Nasza baza danych obecnie zawiera zweryfikowane wpisy dla żywności z ponad 120 kuchni, z szczególnym uwzględnieniem azjatyckich, latynoamerykańskich, bliskowschodnich i afrykańskich kategorii żywności.
Mierzenie dokładności: Jak wiemy, że to działa
Twierdzenia o dokładności są bez znaczenia bez pomiaru. Oto jak weryfikujemy jakość naszej bazy danych.
Wewnętrzne benchmarki
Co kwartał nasz zespół wybiera 500 losowych wpisów z naszej bazy danych i porównuje je z nowymi analizami laboratoryjnymi lub najnowszymi wartościami z rządowych baz danych. Śledzimy średni błąd bezwzględny dla kalorii, białka, węglowodanów, tłuszczu i błonnika. Nasz aktualny benchmark: 97,4% dokładności dla wpisów z zweryfikowanymi źródłami rządowymi lub producentów.
Badania dotyczące dokładności użytkowników
Współpracowaliśmy z uniwersytetami zajmującymi się żywieniem, aby porównać dzienniki żywności logowane w Nutrola z ważonymi rekordami żywności (złoty standard w badaniach żywieniowych). Te badania konsekwentnie pokazują, że użytkownicy Nutrola osiągają bliższe dopasowanie do rzeczywistego spożycia niż użytkownicy innych popularnych aplikacji do śledzenia.
Śledzenie wskaźników błędów
Śledzimy liczbę korekt danych dokonywanych miesięcznie jako procent całkowitych wpisów w bazie danych. Nasz aktualny wskaźnik błędów wynosi 0,03% — co oznacza, że 99,97% wpisów nie wymaga żadnej korekty w danym miesiącu. Dla kontekstu, bazy danych oparte na crowdsourcingu zazwyczaj mają miesięczne wskaźniki odkrywania błędów na poziomie 2-5%.
| Wskaźnik | Nutrola | Średnia branżowa (Crowdsourcing) |
|---|---|---|
| Dokładność w porównaniu z analizą laboratoryjną | 97,4% | 70-85% |
| Miesięczny wskaźnik błędów | 0,03% | 2-5% |
| Wpisy z kompletnymi danymi o mikroskładnikach | 89% | 30-45% |
| Średni czas aktualizacji reformulowanych produktów | 48 godzin | 6-18 miesięcy |
| Wskaźnik duplikatów | < 0,1% | 15-30% |
Co to oznacza dla Ciebie
Jeśli dotarłeś do tego momentu, możesz myśleć: "Chcę tylko logować swoje jedzenie. Dlaczego powinienem się martwić o architekturę bazy danych?"
Oto dlaczego to ma znaczenie: każda decyzja żywieniowa, którą podejmujesz na podstawie śledzonych danych, jest tylko tak dobra, jak same dane.
Jeśli twoja aplikacja mówi, że zjadłeś dzisiaj 1 800 kalorii, ale rzeczywista liczba to 2 100, twój deficyt kaloryczny wynoszący 300 kalorii nie istnieje. Jeśli twoja aplikacja mówi, że osiągnąłeś 150 gramów białka, ale rzeczywista liczba to 125, twój plan budowania mięśni nie przynosi efektów. Jeśli twoja aplikacja śledzi sód na poziomie 2 000 mg, ale w rzeczywistości to 2 800 mg, twoja strategia zarządzania ciśnieniem krwi ma lukę.
Dokładne dane to nie luksus. To różnica między planem żywieniowym, który działa, a takim, który tylko wydaje się, że działa.
W Nutrola to standard, do którego się zobowiązujemy. Nie dlatego, że jest to łatwe — to naprawdę jedno z najtrudniejszych wyzwań technicznych w technologii żywieniowej — ale dlatego, że nasi użytkownicy podejmują realne decyzje zdrowotne na podstawie liczb, które im pokazujemy. Te liczby muszą być poprawne.
Co dalej
Nieustannie inwestujemy w naszą infrastrukturę bazy danych. Oto niektóre z rzeczy, nad którymi pracujemy:
- Rozszerzenie partnerstw laboratoryjnych w celu bezpośredniej analizy produktów, które są niedostatecznie reprezentowane w istniejących bazach danych
- Udoskonalenie naszych modeli weryfikacji AI z nowymi danymi treningowymi od naszej rosnącej bazy użytkowników
- Budowanie głębszych integracji z producentami w celu szybszego wychwytywania zmian w produktach
- Rozwój regionalnych baz danych żywności dla rynków, gdzie istniejące dane żywieniowe są ograniczone
- Udoskonalenie naszego silnika analizy przepisów w celu lepszego szacowania wartości odżywczych dla złożonych, wieloskładnikowych posiłków
Cel nigdy się nie zmienił: dać każdemu użytkownikowi Nutrola najdokładniejszy obraz tego, co jedzą, aby mogli podejmować świadome decyzje dotyczące swojego zdrowia.
FAQ
Ile produktów znajduje się w bazie danych Nutrola?
Baza danych Nutrola zawiera ponad 3 miliony zweryfikowanych wpisów żywności, w tym surowe składniki, produkty markowe z 47 krajów, posiłki z restauracji z głównych sieci oraz popularne dania domowe. Każdy wpis jest powiązany z zweryfikowanym źródłem i nieustannie weryfikowany przez nasz system kontroli jakości AI.
Jak dokładność bazy danych Nutrola porównuje się z innymi aplikacjami?
Niezależne benchmarki pokazują, że Nutrola osiąga 97,4% dokładności w porównaniu z analizą laboratoryjną, w porównaniu do średniej branżowej wynoszącej 70-85% dla aplikacji korzystających z baz danych opartych na crowdsourcingu. Kluczową różnicą jest nasz proces weryfikacji wielowarstwowej, który wychwytuje błędy zanim dotrą do użytkowników, zamiast polegać na użytkownikach, aby je zgłaszali.
Co się dzieje, gdy produkt żywnościowy zmienia swoją recepturę lub formułę?
Nutrola utrzymuje bezpośrednie kanały danych z producentami żywności i monitoruje bazy danych produktów pod kątem zmian. Gdy wykryjemy reformulację, zazwyczaj aktualizujemy wpis w ciągu 48 godzin. Stare dane żywieniowe są archiwizowane, aby twoje historyczne logi żywności pozostały dokładne dla okresu, w którym spożywałeś oryginalną formułę.
Czy mogę zgłosić błąd w bazie danych?
Tak. Każdy wpis żywności w Nutrola zawiera opcję "Zgłoś problem". Zgłoszenia trafiają bezpośrednio do naszego zespołu danych żywieniowych do przeglądu, a poprawki zazwyczaj są dokonywane w ciągu 24 godzin. Traktujemy każde zgłoszenie poważnie, ponieważ opinie użytkowników są jednym z naszych najcenniejszych sygnałów jakości.
Czy Nutrola obejmuje międzynarodowe i regionalne jedzenie?
Nutrola zawiera zweryfikowane dane żywieniowe dla produktów z ponad 120 kuchni. Pozyskujemy dane z regionalnych rządowych baz danych żywieniowych, lokalnych instytucji naukowych zajmujących się żywnością, a w niektórych przypadkach z bezpośredniej analizy laboratoryjnej. Jeśli regularnie jesz potrawy z konkretnej kuchni, która według ciebie jest niedostatecznie reprezentowana, zachęcamy do kontaktu — rozszerzenie naszej oferty jest ciągłym priorytetem.
Dlaczego różne aplikacje do śledzenia kalorii pokazują różne liczby dla tej samej żywności?
Różne aplikacje korzystają z różnych źródeł danych. Aplikacje, które polegają na danych opartych na crowdsourcingu, mogą mieć wiele wpisów dla tej samej żywności z różną dokładnością. Nutrola korzysta z zweryfikowanych źródeł (bazy danych rządowych, dane producentów, analiza laboratoryjna) i weryfikuje każdy wpis za pomocą AI i przeglądu ludzkiego, co jest powodem, dla którego nasze liczby są spójne i wiarygodne.
Gotowy, aby przeksztalcic sledzenie zywienia?
Dolacz do tysiecy osob, ktore przeksztalcily swoja podroz zdrowotna z Nutrola!