Die Flut an digitalen Fitness- und Gesundheitsanwendungen wächst rasant. Fitnesstracker, Ernährungs-Apps und virtuelle Trainingsangebote versprechen schnelle Ergebnisse und eine gesteigerte Lebensqualität.
Doch diese Vielfalt stellt Betreiber und Entscheider in der Fitness- und Gesundheitsbranche vor eine zentrale Herausforderung: Wie lässt sich in diesem unübersichtlichen Markt das Potenzial digitaler Tools zuverlässig bewerten?
Sowohl objektive als auch subjektive Kriterien sind entscheidend für eine umfassende Bewertung digitaler Fitness- und Gesundheitsanwendungen.
Prof. Dr. Marco Speicher – Fachbereichsleiter Informatik DHfPG
Angesichts fehlender einheitlicher Standards und vieler Werbeversprechen wird eine objektive Evaluierung unverzichtbar, um tragfähige Entscheidungen für den Einsatz dieser Anwendungen zu treffen – sei es zur Erweiterung des eigenen Portfolios, zur Optimierung von Dienstleistungen oder zur Steigerung der Kundenzufriedenheit.
Was macht gute Fitness-Apps aus?
Die Evaluierung digitaler Fitness- und Gesundheitsanwendungen erfordert daher eine differenzierte Betrachtung, die sowohl objektive als auch subjektive Aspekte berücksichtigt (Bowman, Kruijff, LaViola & Poupyrev, 2004).
Objektive Kriterien beziehen sich auf messbare Eigenschaften der Anwendung, wie beispielsweise die Genauigkeit von Sensordaten, die Reaktionszeit des Systems, die Anzahl an Klicks oder die technische Stabilität.
Subjektive Kriterien werden in der Regel durch qualitative Methoden, wie beispielsweise Befragungen oder Beobachtungen, erhoben. Es existieren aber auch quantitative Methoden, wie z. B. standardisierte Fragebögen.
Ziel einer benutzer- und menschzentrierten Evaluierung einer digitalen Anwendung ist es, die Frustrationen der Nutzer, die durch Fehler oder Hindernisse entstehen, zu verringern und so dem Nutzer eine möglichst optimale Nutzungserfahrung bieten zu können.
Eine gute Fitness-App muss also mehr können als nur Daten sammeln. Wie genau zählt sie Schritte? Wie schnell lädt sie? Das sind Fragen, die man bei der Bewertung einer Fitness-App stellt. Aber mindestens genauso wichtig ist, wie die App auf die Nutzerin oder den Nutzer wirkt: Gefällt sie ihr oder ihm? Ist sie einfach zu bedienen? Das sind die Fragen, die über den Erfolg einer App entscheiden.
Um eine umfassende Bewertung zu ermöglichen, müssen drei Hauptbereiche betrachtet werden: die reine Leistung der App (Systemleistung), wie gut sie genutzt werden kann (Benutzerleistung) und wie sehr sie den Nutzern gefällt (Benutzerpräferenzen).
Systemleistung
Bei der Leistung eines Systems (auch System Performance) geht es um die Leistungsfähigkeit der Anwendung selbst. Dazu gehören Aspekte wie Genauigkeit, Reaktionszeit oder Stabilität. Die Genauigkeit eines Systems gibt beispielsweise an, wie genau die Anwendung die relevanten Daten (z. B. Herzfrequenz, Schrittzahl) erfasst.
Dem gegenüber steht die Reaktionszeit der Anwendung auf Eingaben des Nutzers sowie die Zuverlässigkeit der Anwendung unter verschiedenen Bedingungen.
Für die Bewertung der Systemleistung werden die Leistungsdaten der Anwendung mit etablierten Standards oder anderen Anwendungen in sogenannten Benchmarks und Stresstests verglichen.
Das Ziel dabei ist die Überprüfung der Leistung und Stabilität unter extremen Bedingungen. Zur Identifizierung eines Fitnesstrackers mit der höchsten Genauigkeit und der geringsten Abweichung von den Referenzwerten werden beim Benchmarking zum Beispiel verschiedene Fitnesstracker parallel während eines standardisierten Spaziergangs getragen.
Benchmarking und Stresstests dienen der Überprüfung der technischen Leistungsfähigkeit digitaler Gesundheitslösungen.
Prof. Dr. Marco Speicher – Fachbereichsleiter Informatik DHfPG
Die gemessenen Schrittzahlen werden dann mit denen eines professionellen Pedometers oder einer Referenzstrecke verglichen. Stresstests werden hingegen genutzt, um beispielsweise eine hohe Anzahl gleichzeitiger Nutzerinnen und Nutzer zu simulieren, die alle gleichzeitig Daten übertragen und Funktionen einer Fitness-App nutzen. So wird die Stabilität der Server und der App unter extremen Bedingungen überprüft, um Abstürze oder Leistungseinbrüche zu vermeiden.
Benutzerleistung
Der Bereich der Benutzerleistung befasst sich hingegen mit der Leistung der Nutzenden beim Umgang mit der Anwendung. Auch hier stehen die Genauigkeit und Zeit im Fokus der Bewertung, wobei sich die Instrumente in dieser Kategorie auf den Nutzer und dessen Aufgabe in der Anwendung beziehen.
Hat der oder die Nutzende beispielsweise die Aufgabe, auf einer Website eines Fitnessstudios die Trainingszeiten zu finden, werden dabei zum Beispiel die Zeit und Anzahl der Klicks gemessen, die er oder sie bis zum Erreichen des Ziels benötigt.
Bei der Bewertung der Benutzerleistung einer Fitnessstudiowebsite geht es darum, wie effizient und genau Nutzer die gewünschten Informationen finden und Aufgaben erledigen können. Dazu zählen u. a. Richtigkeit, Vollständigkeit und Aktualität der Informationen.
Die Fehlerhäufigkeit gibt Aufschluss darüber, wie effizient eine Anwendung gebaut ist. Neben der Genauigkeit ist die Zeit der wesentliche Faktor für die Benutzerleistung, das heißt, wie lange Nutzer benötigen, um bestimmte Informationen zu finden (z. B. Preise für eine Mitgliedschaft, Informationen zu einem bestimmten Kurs).
Mögliche Methoden zur Messung der Benutzerleistung sind die Nutzerbeobachtung, die Analyse der Blickbewegungen, um zu verstehen, auf welche Elemente Nutzer ihre Aufmerksamkeit richten, visuelle Darstellungen der Bereiche, auf die Nutzer am häufigsten klicken, und die Analyse der Nutzerinteraktionen, um statistische Daten über die Nutzung der Anwendung zu erhalten.
Benutzerpräferenzen
Die subjektive Wahrnehmung und Bewertung einer digitalen Anwendung, wie z. B. einer Fitnessstudiowebsite, durch den Nutzer spielt eine entscheidende Rolle für deren Erfolg.
Neben der reinen Funktionalität ist es essenziell, dass die Anwendung auch den individuellen Bedürfnissen und Vorlieben der Nutzer entspricht. Um diese subjektiven Aspekte zu messen, werden häufig standardisierte Fragebögen eingesetzt, die sich auf verschiedene Dimensionen der Nutzererfahrung konzentrieren.
NASA-TLX, SUS und UEQ sind gängige Methoden zur Messung der Nutzererfahrung und -zufriedenheit.
Prof. Dr. Marco Speicher – Fachbereichsleiter Informatik DHfPG
Mit dem Task-Load-Index (TLX) der NASA wird beispielsweise die physische, mentale und zeitliche Belastung des Nutzers bei der Interaktion mit der Webseite erfasst, um herauszufinden, an welchen Stellen eine Anwendung überfordert oder unterfordert (Hart & Staveland, 1988).
Im Kontext einer Fitnessstudiowebsite könnte beispielsweise die Suche nach einem bestimmten Fitnesskurs als besonders belastend empfunden werden, wenn die Informationen unübersichtlich präsentiert werden.
Ein weit verbreitetes Instrument zur Messung der allgemeinen Benutzerfreundlichkeit ist der System-Usability-Scale (SUS) Fragebogen. Dieser spezielle und kurze Fragebogen erfasst die Wahrnehmung des Nutzers hinsichtlich der Einfachheit der Bedienung, der Effizienz, der Lernbarkeit, der Fehleranfälligkeit und der Zufriedenheit (Brooke, 1995).
Ein hoher SUS-Wert deutet auf eine hohe Benutzerfreundlichkeit hin. Für eine Fitnessstudiowebsite könnte ein niedriger SUS-Wert darauf hindeuten, dass die Buchung eines Kurses zu komplex oder nicht intuitiv ist. Um die Nutzererfahrung einer Anwendung zu erfassen, werden im User-Experience-Questionnaire (UEQ)-Fragebogen folgende Dimensionen betrachtet: Attraktivität, Effizienz, Stimulation, Vertrautheit, Originalität und Praktikabilität (Laugwitz, Held & Schrepp, 2008).
Durch den UEQ kann beispielsweise ermittelt werden, ob die Website ansprechend und modern wahrgenommen wird oder ob sie eher langweilig und veraltet wirkt. Im Zusammenhang mit einer Fitnessstudiowebsite könnte ein niedriger Wert bei der Dimension 'Stimulation' darauf hindeuten, dass die Website nicht ausreichend motiviert, aktiv zu werden.
Angenommen, eine Nutzerin möchte auf einer Fitnessstudiowebsite einen neuen Kurs buchen. Mithilfe des NASA-TLX könnte ermittelt werden, wie stark sie sich bei der Suche nach dem passenden Kurs konzentrieren musste.
Der SUS würde Aufschluss darüber geben, wie einfach sie die Buchung durchführen konnte, während der UEQ zeigen würde, wie attraktiv und motivierend die gesamte Website auf sie gewirkt hat. Betreiber können diese Informationen zum Beispiel nutzen, um gezielt Schwachstellen in der Nutzererfahrung einer digitalen Anwendung zu identifizieren und zu optimieren.
Erkenntnisse aus dem NASA-TLX, SUS und UEQ ermöglichen es, sowohl die kognitive Belastung zu reduzieren als auch die Benutzerfreundlichkeit und Attraktivität der Plattform zu steigern.
So können langfristig die Kundenzufriedenheit erhöht, Abbruchraten gesenkt und die Buchungszahlen gesteigert werden.
Fazit
Eine Bewertung digitaler Anwendungen sollte sowohl objektive als auch subjektive Kriterien berücksichtigen. Die Wahrnehmung von Nutzerfreundlichkeit wird von Faktoren wie Alter und technischer Affinität beeinflusst. Ergebnisse müssen im Kontext der Zielgruppe interpretiert und durch qualitative Methoden ergänzt werden. Fitnessstudios, die neben Systemleistung auch subjektive Wahrnehmungen ernst nehmen, können Mitglieder binden und neue Kundschaft gewinnen.
Auszug aus der Literaturliste
Bowman, D., Kruijff, E., LaViola, J. & Poupyrev, I. (2004). (2017). 3D User Interfaces: Theory and Practice. Addison-Wesley Professional.
Brooke, J. (1996). SUS-A quick and dirty usability scale. Usability evaluation in industry, 189 (194), 4–7.
Für eine vollständige Literaturliste kontaktieren Sie bitte literatur@fitnessmanagement.de.
Diesen Artikel kannst du folgendermaßen zitieren:
Speicher, M.(2025). Wie fit sind unsere Apps? fitness MANAGEMENT international, 1 (177), 86-88.