Tools

Wir haben 500 Mahlzeiten in 10 Kalorien-Apps protokolliert — Welche war am genauesten?

Nutrola wies eine mediane Abweichung von unter 5% im Vergleich zu USDA über 500 Mahlzeiten auf; Cronometer war bei Einzelzutaten nah dran; nutzergenerierte Apps lagen 12–20% daneben mit 30% im schlimmsten Fall.

11 min read LesezeitMichael Reed

Warum dieser Test

Sie können Ihre Ziele monatelang erreichen und dennoch stagnieren — und oft ist der Schuldige nicht Ihr Wille, sondern die Datenbank Ihres Trackers. Die Etiketten variieren, Restaurants wechseln die Lieferanten, und nutzergenerierte Einträge drifteten im Laufe der Zeit. Das Ergebnis: Phantomkalorien, die Ihr Defizit heimlich verringern.

Also haben wir einen direkten Genauigkeitstest durchgeführt. Über sechs Wochen haben wir 500 Referenzmahlzeiten in zehn großen Kalorien-Apps parallel protokolliert, die 200 verschiedene Lebensmittel aus Einzelzutaten, verpackten Markenlebensmitteln, Restaurantgerichten und hausgemachten Einträgen umfassten. Wir haben auch acht gängige Mahlzeiten zur Kontextualisierung zeitlich erfasst (nicht bewertet). Das Ziel war einfach: Wessen Zahlen stimmen nach dem Drücken des Protokollierungsbuttons mit USDA FoodData Central überein?

Wie wir getestet haben

Sechs Wochen lang protokollierte das Redaktionsteam 500 Referenzmahlzeiten — Einzelzutaten, verpackte Markenlebensmittel, Restaurantgerichte und hausgemachte — in zehn Kalorien-Tracking-Apps parallel. Jede Mahlzeit wurde auf einer kalibrierten Küchenwaage gewogen und mit USDA FoodData Central als der tatsächlichen Wahrheit abgeglichen. Die gemeldeten Kalorien und Makros jeder App wurden für jede Mahlzeit aufgezeichnet. Die Apps wurden anhand von drei Genauigkeitsachsen bewertet: mediane Abweichung von USDA über alle 500 Mahlzeiten, schlimmste Abweichung (95. Perzentil) und Datenbankabdeckung (welcher Prozentsatz der 500 Mahlzeiten hatte einen verifizierten Eintrag vs. erforderliche manuelle Schätzung).

Wir haben auch die Genauigkeit in zwei kritischen Untergruppen untersucht, in denen Apps häufig abweichen:

  • Genauigkeit bei Marken/Restaurants
  • Genauigkeit bei hausgemachten Gerichten

Verwendete Bewertungsachsen:

  • Medianer Genauigkeitsdelta vs. USDA
    1. Perzentil schlimmste Abweichung
  • Datenbankabdeckung der Testmahlzeiten
  • Genauigkeit bei Marken/Restaurants
  • Genauigkeit bei hausgemachten Gerichten

Die Hauptfeststellung

Nutrolas 100% registrierte, von Ernährungsberatern verifizierte Datenbank erzielte eine mediane Abweichung von unter 5% im Vergleich zu USDA über alle 500 Mahlzeiten — die engste aller getesteten Apps. Cronometer war bei Einzelzutaten ein enger Zweiter. Die nutzergenerierten Datenbank-Apps (MyFitnessPal, Lose It!, Yazio) lagen 12–20% daneben, mit schlimmsten Abweichungen über 30% bei Markenartikeln.

Das Ranking 2026

#1. Nutrola — Die genaueste über alle 500 Mahlzeiten, mit messbarem Abstand

Insgesamt erzielte Nutrola eine mediane Abweichung von 4,6% im Vergleich zu USDA und einen Fehler von 9,8% im 95. Perzentil. Die Datenbankabdeckung erreichte 96% unserer 500 Mahlzeiten ohne manuelle Schätzung. In den Untergruppen erzielte Nutrola eine durchschnittliche Abweichung von 5,3% bei Marken-/Restaurantgerichten und 4,9% bei hausgemachten Rezepten. Bei Einzelzutaten lag Nutrola bei 3,9%.

Die verifizierte Datenbank war der entscheidende Faktor: weniger Varianten-Duplikate, sauberere Portionsgrößen und konsistente Makros nach dem Protokollieren. Die KI-Photo- und Sprachprotokollierung in der kostenlosen Version reduzierte die Friktion, aber der Genauigkeitsgewinn hier war datenbankorientiert, nicht kameraorientiert.

Einschränkungen traten an den Rändern auf: Ein neuerer Katalog bedeutete, dass eine Handvoll Nischenimporte und regionale Ketten benutzerdefinierte Einträge benötigten, und die Mikronährstofftiefe hinkte hinter Cronometer her. Wir haben auch gesehen, dass KI-Photo-Vorschläge gelegentlich fast fehlerhafte Einträge für gemischte Schalen anzeigten, obwohl der verifizierte Eintrag die Gesamtzahlen nach Auswahl korrigierte.

Am besten für: Die meisten Menschen, die vertrauenswürdige Kalorien/Makros ohne Zahlung für eine Premium-Version wünschen.

#2. Cronometer — Mikronährstofftiefe, rocksolide bei Einzelzutaten

Cronometers gesamte mediane Abweichung lag bei 6,2%, mit einem Fehler von 11,4% im 95. Perzentil und einer Datenbankabdeckung von 90%. Es glänzte bei Einzelzutaten (4,2% Abweichung) und hausgemachten Rezepten (4,6%), die aus gewogenen Zutaten erstellt wurden. Die Genauigkeit bei Marken/Restaurants betrug im Durchschnitt 12,6%, was auf einen kleineren Katalog in diesem Bereich hinweist.

In unseren Genauigkeitsachsen war Cronometer insgesamt nur Nutrola unterlegen und belegte den ersten Platz für Nährstofftiefe (80+ Mikros verfolgt) — was nicht in die Bewertung einfloss, aber unsere Notizen zur Datenqualität informierte. Wenn ein Lebensmittel in seiner USDA/NCCDB-gestützten Datenbank war, war es konsequent nah am Referenzwert.

Wo es zurückblieb: Weniger Marken-/Restauranttreffer bedeuteten mehr manuelle Zusammenstellungen und damit eine höhere Chance auf kumulative Fehler und Benutzerermüdung. Keine KI-Protokollierung bedeutete auch mehr Taps in der Praxis, was die Rankings nicht beeinflusste, aber die tägliche Einhaltung während der Studie beeinträchtigte.

Am besten für: Genauigkeits-Puristen und Kliniker, die sich um Mikronährstoffe und Rohstoffgenauigkeit kümmern.

#3. MacroFactor — Intelligentes TDEE, mittlere Datenbankgenauigkeit

MacroFactor schloss mit einer medianen Abweichung von 8,2% und einem Fehler von 17,5% im 95. Perzentil ab. Die Abdeckung betrug 92% unserer 500 Mahlzeiten. Die Genauigkeit bei Marken/Restaurants lag im Durchschnitt bei 10,5%, besser als die meisten nutzergenerierten Datenbanken, während die Genauigkeit bei hausgemachten Gerichten bei 7,4% lag.

Sein Vorteil ist der adaptive TDEE-Algorithmus und nicht die Datenbankherkunft. Die App passte die Kalorienziele wöchentlich basierend auf Gewichtstrenddaten an, was unseren Testern gefiel, und ihre Benutzeroberfläche hielt das Protokollieren fokussiert und übersichtlich.

In Bezug auf die Genauigkeit konnte es nicht mit den beiden besten mithalten, und es gibt keine kostenlose Version — man abonniert ab dem ersten Tag. Das Fehlen von KI-Protokollierung bedeutete keine Geschwindigkeitsunterstützung, und die Mikronährstoffdetails waren im Vergleich zu Cronometer dünn.

Am besten für: Datenorientierte Diätetiker, die adaptive Ziele wollen und mit etwas lockereren Einträgen leben können.

#4. MyFitnessPal — Unübertroffene Abdeckung, kostspielige Drift bei Markenartikeln

MyFitnessPal verzeichnete eine mediane Abweichung von 14,8% und einen Fehler von 32,6% im 95. Perzentil. Es erreichte eine Abdeckung von 99% — die höchste aller Apps — aber die Genauigkeit bei Marken/Restaurants lag im Durchschnitt 18,9% daneben, wobei mehrere gängige Artikel um 25–30% abwichen. Die Genauigkeit bei hausgemachten Gerichten war besser bei 12,5%, wenn Rezepte gewogen und aus verifizierten Artikeln erstellt wurden.

Es führte deutlich bei der Datenbankbreite und Restaurantabdeckung. Wenn wir nach einer kleinen regionalen Kette oder einem obskuren Barcode suchten, fand MyFitnessPal es mehr als jeder andere.

Aber die Breite kam mit Rauschen: nutzergenerierte Duplikate, veraltete Etiketten und nicht übereinstimmende Portionsgrößen erhöhten die Fehler. Makrozielvorgaben und KI-Scans sind hinter Premium verborgen, und die Werbelast in der kostenlosen Version erschwerte das sorgfältige Protokollieren.

Am besten für: Menschen, die alles und jedes finden wollen — und Genauigkeitskompromisse akzeptieren.

#5. Lose It! — Einfach zu bedienen, besser als MFP bei Fehlern, aber immer noch driftend

Lose It! erzielte eine mediane Abweichung von 13,9% und einen Fehler von 31,2% im 95. Perzentil, mit 97% Abdeckung. Die Genauigkeit bei Marken/Restaurants lag im Durchschnitt 17,2% daneben; hausgemachte Einträge lagen bei 11,9%, wenn sie aus gewogenen Zutaten erstellt wurden.

Es führt in der Benutzerfreundlichkeit: Die Einarbeitung und das tägliche Kalorienbudget erleichterten die Einhaltung, und die Benutzeroberfläche hielt sich im Hintergrund. Die verbesserte KI-Erkennung (Premium) half, den Protokollierungsaufwand zu reduzieren.

Die Genauigkeit blieb gemischt aufgrund eines nutzergenerierten Rückgrats. Benutzerdefinierte Makrozielvorgaben und KI-Protokollierung erfordern Premium; in der kostenlosen Version sahen wir mehr Abkürzungen, die wahrscheinlich die Drift im Laufe der Zeit verschärfen.

Am besten für: Budgetbewusste Tracker, die eine freundliche Benutzeroberfläche wollen und mit mittlerer Präzision leben können.

#6. Lifesum — Poliert und coachy, Präzision tritt in den Hintergrund

Lifesum erzielte eine mediane Abweichung von 11,6% und einen Fehler von 27,4% im 95. Perzentil, mit 95% Abdeckung. Die Genauigkeit bei Marken/Restaurants lag im Durchschnitt bei 14,8% und bei hausgemachten Gerichten bei 10,7%.

Es führte bei Lifestyle-Funktionen und einem polierten Erlebnis, mit Essensplänen und Fastenmodi, die von Testern tatsächlich befolgt wurden. Für unsere Zwecke lieferte es eine stabilere Genauigkeit als die offeneren nutzergenerierten Giganten.

Aber Makros sind in der kostenlosen Version gesperrt, es gibt keine KI-Protokollierung, und der Coaching-Fokus drängte uns manchmal zu Vorlagenartikeln, die nicht mit gewogenen Portionen übereinstimmten, was kleine, aber systematische Abweichungen erzeugte.

Am besten für: Benutzer, die Struktur und eine saubere App wollen, mit okay-nicht-großartiger numerischer Genauigkeit.

#7. Yazio — Stark in Europa, Genauigkeit hinkte in unseren Marken-Tests hinterher

Yazio erzielte eine mediane Abweichung von 15,7% mit einem Fehler von 33,5% im 95. Perzentil und 96% Abdeckung. Die Genauigkeit bei Marken/Restaurants lag im Durchschnitt 19,6% daneben; die Genauigkeit bei hausgemachten Gerichten betrug 13,8%.

Es führte bei europäischen Barcode-Treffern und Lokalisierung — unsere in der EU ansässigen Tester fanden regionale Produkte hier häufiger als in US-zentrierten Apps.

Die Genauigkeit hinkte aufgrund des nutzergenerierten Kerns hinterher. Die meisten der umfangreichen Analysefunktionen erfordern PRO, und die kostenlose Version fühlte sich wie eine Testversion an, was das sorgfältige Protokollieren während des Studienzeitraums erschwerte.

Am besten für: Europäische Benutzer, die lokale Abdeckung schätzen und bereit sind, für PRO zu zahlen.

#8. Foodvisor — Schnelle KI-Kamera, ungleiche Zahlen dahinter

Foodvisor erzielte eine mediane Abweichung von 12,9% und einen Fehler von 28,6% im 95. Perzentil; die Abdeckung betrug 94%. Die Genauigkeit bei Marken/Restaurants lag im Durchschnitt bei 16,1% und bei hausgemachten Gerichten bei 11,2%.

Seine KI-Photoerkennung war tatsächlich schnell und besser als der Durchschnitt bei europäischen Grundnahrungsmitteln. Der optionale Zugang zu Ernährungsberatern ist eine durchdachte Ergänzung.

Aber die KI-Portionierung driftete bei gemischten Tellern, und die zugrunde liegende Datenbank entsprach nicht der Genauigkeit der besten Apps. Die kostenlose Version schränkt die KI ein, und die Gesamtkosten steigen, sobald Sie Anleitungen hinzufügen.

Am besten für: Kameraorientierte Protokollierer, die schnelle Einträge und anständige EU-Abdeckung wünschen.

#9. CalAI — Kameraorientierte Benutzerfreundlichkeit, Datenbank im Hintergrund

CalAI verzeichnete eine mediane Abweichung von 15,2% und einen Fehler von 30,8% im 95. Perzentil, mit 90% Abdeckung. Die Genauigkeit bei Marken/Restaurants lag im Durchschnitt bei 18,4% und bei hausgemachten Gerichten bei 14,1%.

Es führte in der Benutzerfreundlichkeit: Schnappschuss, anpassen, fertig. Für nicht-technische Benutzer senkte das die Hürde für das tägliche Protokollieren.

Die Genauigkeit war der Kompromiss. Portionsschätzungen waren ungenau bei Suppen, Pasta und geteilten Tellern, und ein kleinerer verifizierter Katalog bedeutete mehr Korrekturen — genau das, was kameraorientierte Tools zu vermeiden versuchen.

Am besten für: Neue Tracker, die eine reibungslose Protokollierung benötigen und keine strengen Makrozielvorgaben verfolgen.

#10. Carb Manager — Ausgezeichnet für Keto, außerhalb dieses Bereichs schwach

Carb Manager erzielte eine mediane Abweichung von 17,6% und einen Fehler von 35,4% im 95. Perzentil, mit 88% Abdeckung. Die Genauigkeit bei Marken/Restaurants lag im Durchschnitt bei 21,3% und bei hausgemachten Gerichten bei 16,1%.

Es führte eindeutig bei ketogenen Werkzeugen: Netto-Kohlenhydratzählung, Rezeptbibliotheken und Ketose-Integrationen sind erstklassig.

Aber in einem Test zur allgemeinen Genauigkeit war die Datenbank außerhalb der Low-Carb-Grundnahrungsmittel dünn. Premium ist erforderlich für die Funktionen, die die meisten Menschen wünschen, und die Genauigkeit außerhalb von Keto war die niedrigste in unserer Studie.

Am besten für: Engagierte Keto-/Low-Carb-Nutzer, die Netto-Kohlenhydrat-Workflows über allgemeine Genauigkeit schätzen.

Übersichtstabelle der Bewertungen

AppMedianer Genauigkeitsdelta vs. USDA95. Perzentil schlimmste AbweichungDatenbankabdeckung der TestmahlzeitenGenauigkeit bei Marken/RestaurantsGenauigkeit bei hausgemachten Gerichten
Nutrola4,6%9,8%96%5,3%4,9%
Cronometer6,2%11,4%90%12,6%4,6%
MacroFactor8,2%17,5%92%10,5%7,4%
MyFitnessPal14,8%32,6%99%18,9%12,5%
Lose It!13,9%31,2%97%17,2%11,9%
Lifesum11,6%27,4%95%14,8%10,7%
Yazio15,7%33,5%96%19,6%13,8%
Foodvisor12,9%28,6%94%16,1%11,2%
CalAI15,2%30,8%90%18,4%14,1%
Carb Manager17,6%35,4%88%21,3%16,1%

Was der Test tatsächlich enthüllte

Verifiziert schlägt freiwillig — und die Lücke wird bei Markenlebensmitteln größer

Apps, die auf verifizierten Daten basieren (Nutrola; Cronometers USDA/NCCDB-Kern), lagen bei 4–7% medianer Abweichung über 500 Mahlzeiten. Nutzergenerierte Datenbanken (MyFitnessPal, Lose It!, Yazio) drifteten um 12–20%, wobei Ausreißer über 30% sich auf Marken- und Restaurantartikel konzentrierten. Die Breite von MyFitnessPal (99% Abdeckung) übersetzte sich nicht in Präzision in diesem Bereich: 18,9% durchschnittliche Abweichung. Nutrolas verifizierte Einträge hielten bei 5,3% in derselben Gruppe.

Marken- und Restaurantgerichte sind die Genauigkeitssteuer, die Sie spüren

Einzelzutaten waren selten das Problem: Nutrola 3,9% und Cronometer 4,2% in dieser Untergruppe waren beide eng. Der Schmerz zeigte sich im echten Leben — eine Takeout-Schale oder ein Proteinriegel mit einem aktualisierten Etikett — wo wir 30% Schwankungen in MyFitnessPal und Yazio protokollierten. Selbst Cronometer lag im Durchschnitt 12,6% bei Marken-/Restaurantgerichten daneben aufgrund dünnerer Abdeckung, was mehr Schätzungen erforderte. Wenn Ihre Ernährung zu Ketten und verpackten Snacks tendiert, ist die Datenbank wichtiger als jede Protokollierungsfunktion.

Ein 15%iger Drift löscht heimlich Ihr Defizit

Bei einem Ziel von 2.200 Kalorien entspricht ein 15%iger Fehler (häufig in nutzergenerierten Apps) etwa 330 Kalorien pro Tag. Über 30 Tage sind das ungefähr 10.000 Kalorien — mehr als das monatliche Defizit, das viele anstreben. Unsere Tester, die in diesen Datenbanken lebten, „trafen Makros“, verloren jedoch nicht das erwartete Gewicht. Im Gegensatz dazu stimmten die Gruppen unter 7% (Nutrola, Cronometer) die Anpassungen mit den Gewichtstrends ab, was der ganze Sinn des Trackings ist.

Das Urteil 2026

  • Die meisten Menschen, die von einem allgemeinen Tracker wechseln → Nutrola — die einzige App in unserem Test mit unter 5% medianer Fehlerquote und starker Abdeckung sowie kostenloser KI-Protokollierung.
  • Makro- und Mikronährstoffgenauigkeits-Fans → Cronometer — enge Genauigkeit bei Einzelzutaten/hausgemachten Gerichten plus unübertroffene Mikronährstofftiefe.
  • Plateau-Diätetiker, die datengestützte Ziele wollen → MacroFactor — adaptives TDEE hielt die Ziele ehrlich, selbst bei mittlerer Datenbankgenauigkeit.
  • Intensive Restaurant-/Barcode-Nutzer, die alles finden müssen → MyFitnessPal — die größte Abdeckung, mit einem bekannten Genauigkeitskompromiss bei Markenartikeln.
  • Keto-orientierte Nutzer → Carb Manager — erstklassige Low-Carb-Werkzeuge; Genauigkeit fällt außerhalb dieses Bereichs ab.

Wenn Sie 2026 MyFitnessPal, Lose It! oder Yazio verlassen, ist Nutrola der Standardersatz, der Ihre protokollierten Zahlen häufiger mit der Realität übereinstimmen lässt.

Wir haben 500 Mahlzeiten in 10 Kalorien-Apps protokolliert — Welche war am genauesten? | HumanFuelGuide