Wie viele Teilnehmende sind nötig, damit eine VR-Sprachtherapiestudie nützlich ist?

Es gibt keine absolute Regel, aber als grober Anhaltspunkt: Fünf Teilnehmende sind ein Pilot, fünfzehn sind eine kleine Studie, fünfzig beginnen eine Studie zu sein, deren Befunde generalisieren. Klinisch wichtig ist, ob die Population den Personen entspricht, die Sie in der Klinik sehen. Hat eine Studie nicht-klinische Studierende rekrutiert und Sie arbeiten mit stotternden Erwachsenen, übertragen sich die Befunde nicht zwangsläufig.

Welche Studiendesigns werden in der VR-Sprachtherapie-Forschung verwendet?

Die wichtigsten Designs sind within-subjects (jede:r Teilnehmende macht jede Bedingung), between-subjects (verschiedene Teilnehmende in verschiedenen Bedingungen), pre-post (vor und nach einer Intervention gemessen) und randomisierte kontrollierte Studien. RCTs sind das stärkste Design für kausale Aussagen, aber in frühen VR-Arbeiten seltener. Die Schlüsselfrage: Wenn die Intervention überhaupt keinen Effekt hätte, gibt es andere Gründe, warum die Outcomes sich verändert haben könnten?

Auf welche Outcome-Maße sollte ich in VR-Sprachtherapiestudien achten?

Die überzeugendsten Studien kombinieren Maße: Selbstbericht (Fragebögen, SUDS, Selbstvertrauensbewertungen), beobachtetes Verhalten (Sprecherwechsel, Sprechzeit), physiologisch (Herzfrequenz, Hautleitwert) und akustisch (Grundfrequenz, Intensität). Steigt Angst auf SUDS und verschieben sich Herzfrequenz- und Stimm-Maße konsistent, ist das stärkere Evidenz als ein einzelnes Maß. Studien, die nur einen Maßtyp berichten, erzählen eine Teilgeschichte.

Warum sind Effektstärken wichtiger als p-Werte?

Ein Befund kann statistisch signifikant und praktisch bedeutungslos sein. Statistische Signifikanz hängt von der Stichprobengröße ab: Ein winziger Unterschied wird statistisch signifikant, wenn die Stichprobe groß genug ist. Effektstärken (Cohen's d, Korrelation r, partielles Eta-Quadrat) sagen, ob der Effekt tatsächlich groß ist. Cohen's d von 0,2 ist klein, 0,5 ist mittel, 0,8 ist groß. Berichtet ein Paper nur p-Werte ohne Effektstärken, ist das eine Schwäche.

Was ist der Unterschied zwischen einer Machbarkeitsstudie und einer Effektstudie?

Eine Machbarkeitsstudie fragt: Lässt sich das überhaupt durchführen? Tolerieren Teilnehmende es? Funktioniert die Ausrüstung? Sie testet nicht, ob die Intervention wirkt. Eine Machbarkeitsstudie mit fünf Teilnehmenden, die zeigt, dass Angst über eine Woche abnimmt, sagt, dass eine Übungswoche machbar ist; sie sagt nicht, dass VR die Veränderung verursacht hat. Wenn Sie eine Pre-Post-VR-Studie mit kleiner Stichprobe und günstigen Ergebnissen sehen, fragen Sie, ob es ein Pilot in Richtung größerer Studie ist oder ob es als Effektnachweis präsentiert wird.

Wie erkenne ich, ob eine VR-Studie auf reales Sprechen generalisiert?

Die meisten VR-Studien messen Reaktionen innerhalb der virtuellen Umgebung. Weniger messen, ob Gewinne in reale Situationen übertragen werden. Halten Sie drei Fragen offen: Hat die Studie etwas außerhalb des VR-Settings gemessen? Gab es Follow-up-Messungen nach Ende der VR-Sitzungen? Berichteten Teilnehmende von Veränderungen in alltäglichen Sprecherfahrungen? Ist nichts davon vorhanden, kann die Studie wenig über realen Transfer sagen.

Diese Seite wurde aus dem Englischen übersetzt. Wenn etwas seltsam klingt, wechseln Sie zur englischen Version. Auf Englisch ansehen.

Tipps für Sprachtherapeuten

Wie eine VR-Sprachtherapiestudie zu lesen ist: Ein Leitfaden für klinisch tätige Personen

Von Gareth Walkom · 22. April 2026 · 8 Min. Lesezeit

Sprachtherapeutische Fachkräfte in einem Workshop diskutieren, wie eine Forschungsstudie zu VR in der Sprachtherapie zu bewerten ist.

Wichtigste Erkenntnisse

Beginnen Sie mit dem Abschnitt Teilnehmende, nicht mit dem Abstract - Stichprobengröße, Population und Rekrutierungsmethode bestimmen, was die Ergebnisse aussagen können.
Schauen Sie auf das Design - RCTs stützen kausale Aussagen; Pre-Post-Studien ohne Kontrollgruppe sind anfällig für Übungs-, Erwartungs- und Regressions-zur-Mitte-Effekte.
Überzeugende Studien kombinieren mehrere Arten von Endpunkten (Selbstauskunft, beobachtetes Verhalten, physiologisch, akustisch), statt sich auf eine Art zu stützen.
Die Effektstärke wiegt schwerer als die statistische Signifikanz - ein signifikantes Ergebnis mit winzigem Effekt verändert die klinische Praxis möglicherweise nicht.
Ein dünner Abschnitt Limitationen ist ein Warnsignal - das Fehlen anerkannter Grenzen heißt nicht, dass eine Studie keine hat.

Ein Paper landet in Ihrem Posteingang. Jemand aus Ihrem Team sagt: „Schau dir diese VR-Studie an, sie klingt nützlich.” Sie möchten wissen, was davon zu halten ist, bevor Ihre nächste Sitzung oder Ihr nächstes Beauftragungsgespräch ansteht. Wo fängt man überhaupt an?

Dies ist ein kurzer Leitfaden zum Lesen einer VR-Sprachtherapiestudie mit kritischem Blick. Kein Methodenkurs. Keine Statistik-Einführung. Nur ein praktischer Satz Fragen, den eine sprachtherapeutische Fachkraft im Hinterkopf halten kann, um den Unterschied zu erkennen zwischen einer Studie, die eine klinische Entscheidung stützt, und einer, die interessant ist, aber nicht bereit, das eigene Vorgehen zu ändern.

Mit dem „Wer”, nicht dem „Was” beginnen

Lesen Sie zuerst den Abschnitt Teilnehmende. Wer war in dieser Studie?

Wie viele Teilnehmende? Fünf ist ein Pilot. Fünfzehn ist eine kleine Studie. Fünfzig beginnt eine Studie zu sein, deren Befunde generalisieren. Keine absolute Regel, aber ein nützlicher grober Anhaltspunkt.
Welche Population? Nicht-klinische Studierende? Stotternde Erwachsene aus einer Klinik? Kinder mit Sprachunterschieden? Die Population prägt, was die Befunde Ihnen sagen können.
Wurden die Teilnehmenden bezahlt, rekrutiert oder waren sie freiwillige? Wie wurden sie ausgewählt?

Wenn die Population in der Studie sehr verschieden ist von den Personen, die Sie in der Klinik sehen, übertragen sich die Befunde nicht zwangsläufig. Das ist keine Kritik an der Studie. Es ist eine Erinnerung daran, dass keine einzelne Studie jede Frage beantwortet und Evidenz an die Population angepasst werden muss, die Ihnen wichtig ist.

Verstehen, was tatsächlich verglichen wurde

Der nächste lesenswerte Abschnitt ist das Design. Was haben die Forschenden verglichen?

Within-subjects: Jede:r Teilnehmende absolvierte jede Bedingung. Gut für die Kontrolle individueller Unterschiede. Kann für Teilnehmende ermüdend sein.
Between-subjects: Verschiedene Teilnehmende absolvierten verschiedene Bedingungen. Benötigt größere Stichproben. Zufällige Zuordnung ist wichtig.
Pre-Post: Teilnehmende werden vor und nach einer Intervention gemessen. Nützlich, aber anfällig für Übungs-, Erwartungs- und Regressions-zur-Mitte-Effekte, sofern keine Kontrolle besteht.
Randomisierte kontrollierte Studie (RCT): Teilnehmende werden zufällig der Intervention oder Kontrolle zugeteilt. Stärkstes Design für kausale Aussagen, aber seltener in frühen Arbeiten.

Fragen Sie sich: Wenn die Intervention überhaupt keinen Effekt hätte, gibt es einen anderen Grund, warum sich die Outcomes zwischen den Bedingungen verändert haben könnten? Ist die Antwort „ja, viele Gründe”, ist das Design schwach für eine kausale Aussage. Ein gutes Studiendesign schließt die meisten Alternativen aus.

Schauen, was sie gemessen haben

Der Abschnitt Outcome-Maße sagt Ihnen, was die Forschenden als Evidenz gewertet haben. Das ist wichtig, weil verschiedene Maße verschiedene Geschichten erzählen.

Selbstbericht (Fragebögen, SUDS-Bewertungen, Selbstvertrauensbewertungen) erfasst die Erfahrung der Teilnehmenden. Hohe ökologische Bedeutung, aber empfindlich für Erwartungen und Demand-Charakteristika.
Beobachtetes Verhalten (Sprecherwechsel, Sprechzeit) ist näher an objektiv, erfordert aber dennoch Interpretation und stützt sich oft auf menschliche Bewertende.
Physiologisch (Herzfrequenz, Hautleitwert) ist schwerer zu fälschen, lässt sich aber nicht immer sauber auf das gefühlte Erleben abbilden.
Akustisch (Grundfrequenz, Intensität, Variabilität) misst Eigenschaften des Stimmsignals direkt, unabhängig vom Selbstbericht.

Die überzeugendsten VR-Validierungsstudien kombinieren Maße. Steigt Angst auf SUDS und verschieben sich Herzfrequenz- und Stimm-Maße konsistent, ist das stärkere Evidenz als ein einzelnes Maß allein. Achten Sie auf Studien, die nur einen Maßtyp berichten - sie erzählen eine Teilgeschichte.

Prüfen, ob der Effekt tatsächlich groß ist

Ein Befund kann statistisch signifikant und praktisch bedeutungslos sein. Das ist eine harte Lektion. Sie geschieht, weil statistische Signifikanz von der Stichprobengröße abhängt: Ein winziger Unterschied wird statistisch signifikant, wenn die Stichprobe groß genug ist.

Was Sie wollen, ist eine Effektstärke. In dieser Literatur häufig:

Cohen’s d: grob 0,2 ist klein, 0,5 ist mittel, 0,8 ist groß. Winzige d-Werte (< 0,1) bedeuten, dass der Effekt kaum vorhanden ist, selbst wenn „signifikant”.
Korrelation r: 0,1 klein, 0,3 mittel, 0,5 groß. Werte über 0,7 sind beeindruckend.
Partielles Eta-Quadrat (η²ₚ): 0,01 klein, 0,06 mittel, 0,14 groß.

Berichtet ein Paper nur p-Werte ohne Effektstärken, ist das eine Schwäche. Berichtet es Effektstärken, prüfen Sie sie. Ein großer p-Wert mit kleiner Effektstärke kann klinisch uninteressant sein, selbst wenn die Statistik legitim ist.

Den Limitations-Abschnitt lesen (im Ernst)

Autor:innen kennen die Limitationen ihrer eigenen Studien besser als Sie. Lesen Sie, was sie sagen. Ein guter Limitations-Abschnitt sagt Ihnen:

Was die Stichprobengröße begrenzt
Was die Population begrenzt (auf wen die Befunde möglicherweise nicht zutreffen)
Was das Design nicht ausschließen kann
Was der Follow-up-Zeitraum über langfristige Effekte aussagt oder nicht aussagt

Ist der Limitations-Abschnitt eines Papers ein einzelner, beiläufiger Absatz, behandeln Sie die Befunde mit Vorsicht. Haben die Autor:innen sorgfältig darüber nachgedacht, was ihre Studie aussagen kann und was nicht, geben Sie dem Paper mehr Gewicht.

Machbarkeit von Effekt unterscheiden

Viel frühe VR-Forschung handelt von Machbarkeit statt von Effekt. Eine Machbarkeitsstudie fragt: „Lässt sich das überhaupt durchführen? Tolerieren Teilnehmende es? Funktioniert die Ausrüstung wie beabsichtigt?” Das sind legitime Forschungsfragen, und die Befunde können informativ sein - aber sie sind kein Nachweis, dass die Intervention wirkt.

Eine Machbarkeitsstudie mit fünf Teilnehmenden, die zeigt, dass Angst über eine Woche abnimmt, sagt Ihnen, dass eine Übungswoche machbar ist. Sie sagt Ihnen nicht, dass VR die Veränderung verursacht hat. Andere Dinge könnten es - Übungseffekte, Erwartung, die Aufmerksamkeit der Forschungsperson, Regression zur Mitte.

Wenn Sie eine Pre-Post-VR-Studie mit kleiner Stichprobe und günstigen Ergebnissen sehen, fragen Sie: „Ist das ein Pilot, der mir sagt, dass die Idee eine größere Studie wert ist, oder wird das als Effektnachweis präsentiert?” Ersteres ist nützlich. Letzteres wäre eine Überdehnung.

Ehrlich nach Generalisierung fragen

Die meisten VR-Studien messen Reaktionen innerhalb der virtuellen Umgebung. Weniger messen, ob Gewinne in reale Situationen übertragen werden. Und doch wollen Klient:innen meist Veränderung im realen Leben, nicht in einem virtuellen Raum.

Fragen, die offenzuhalten sind:

Hat die Studie etwas außerhalb des VR-Settings gemessen?
Gab es Follow-up-Messungen nach Ende der VR-Sitzungen?
Berichteten Teilnehmende über Veränderungen in ihren alltäglichen Sprecherfahrungen?

Ist nichts davon vorhanden, kann die Studie Ihnen wenig über realen Transfer sagen. Das ist kein Mangel - es ist eine Begrenzung des Geltungsbereichs. Aber es zählt, wenn Sie entscheiden, was eine Studie stützt.

Prüfen, wer die Studie finanziert hat

Die Erklärungen zu Förderung und Interessenkonflikten sind lesenswert. Unabhängige Förderung durch Forschungsräte, Universitäten oder staatliche Stellen ist etwas anderes als Industriefinanzierung oder eine Studie, die ein Unternehmen zu seinem eigenen Produkt durchgeführt hat.

Keine Art von Finanzierung entwertet eine Studie automatisch. Aber zu wissen, wer dafür bezahlt hat und wer ein finanzielles Interesse an den Ergebnissen hat, hilft, die Befunde zu gewichten. Eine Studie zu virtuellen Publika, finanziert von einem Forschungsrat, hat ein anderes Gewicht als eine Studie zu einem bestimmten VR-Produkt, durchgeführt vom Unternehmen dieses Produkts.

Eine kurze Checkliste

Wenn eine VR-Sprachtherapiestudie auf Ihren Schreibtisch kommt, bringen diese sechs Fragen Sie zum größten Teil voran:

Die 6-Fragen-Checkliste

Eine VR-Sprachtherapiestudie mit kritischem Blick lesen

Diese Karte ausdrucken oder speichern. Keine dieser Fragen erfordert einen Statistik-Hintergrund - sie fragen, was das Paper selbst meist allgemeinverständlich beantwortet.

Nichts davon erfordert einen Statistik-Hintergrund. Es erfordert, langsamer zu werden und die Fragen zu stellen, die Autor:innen meist allgemeinverständlich irgendwo im Paper beantworten.

Weiterführende Lektüre

Evidence Hub - peer-reviewte Forschung zu VR in der Sprachtherapie, mit allgemeinverständlichen Zusammenfassungen
Wie Studien bewertet werden - das Sicherheitsschema, das im Evidence Hub verwendet wird
Glossar des Evidence Hub - Definitionen der in diesen Studien verwendeten Forschungsbegriffe
Weiterführende Lektüre - Bücher und Communities, die die aktuelle Praxis prägen
Technologie-Checkliste für sprachtherapeutische Fachkräfte - breiterer Rahmen zur Bewertung neuer Technologie

Weiterlesen

Tipps für Sprachtherapeuten

Expositionstherapie bei sozialer Angst: Ein praktischer Leitfaden zur Durchführung gestufter Exposition

Wie Expositionstherapie bei sozialer Angst tatsächlich funktioniert, die realen Probleme beim Abstufen, Wiederholen und Aufgeben von Expositionen, und wo kontrollierbare VR-Übung hineinpasst, geschrieben für die Behandelnden, die sie durchführen.

18. Juni 2026 · 11 Min. Lesezeit Mehr lesen

Tipps für Sprachtherapeuten

Transfer in der Sprachtherapie: Warum Fähigkeiten nicht im Alltag ankommen und was hilft

Warum mühsam erarbeitete Fortschritte in der Sprachtherapie außerhalb des Therapieraums ins Stocken geraten und welche praktischen, am sozialen Modell orientierten Wege es gibt, um Transfer in genau die Alltagssituationen aufzubauen, an denen ein Klient tatsächlich teilhaben möchte.

16. Juni 2026 · 9 Min. Lesezeit Mehr lesen

Tipps für Sprachtherapeuten

Ist Therapy withVR ein Medizinprodukt? Die ehrliche Antwort

Therapy withVR ist kein Medizinprodukt, nicht FDA-zugelassen und nicht CE-gekennzeichnet - und das ist eine bewusste, ehrliche Entscheidung für ein klinisch gesteuertes Übungswerkzeug, keine Lücke. Hier ist, warum, in klarer Sprache.

16. Juni 2026 · 7 Min. Lesezeit Mehr lesen

Überzeugen Sie sich selbst von der Software

Ob Sie Fragen haben, die Software sehen möchten oder bereit sind loszulegen - wir helfen Ihnen gerne.

Kontakt aufnehmen

Unverbindlich - sehen Sie die Software, bevor Sie sich entscheiden