Die meisten Personen, mit denen ich arbeite und die Therapy withVR nutzen, erforschen keine Angst. Es sind sprachtherapeutische Fachkräfte, die stotternde Klient:innen, Klient:innen in Stimmarbeit, autistische Erwachsene in Vorbereitung auf schwierige Gespräche oder jemanden vor einem Vorstellungsgespräch unterstützen. Aber Angst taucht fast immer auf. Eine sprechende Person, deren Sprechen im Praxisraum leichtfällt und vor einem Meeting blockiert. Ein:e Klient:in der Stimmarbeit, dessen Tonhöhe und Resonanz mit der SLP genau richtig sind und in dem Moment verschwinden, in dem sie mit einer fremden Person sprechen. Ein:e Jugendliche:r, der die Worte hat, aber nicht die Bereitschaft, sie im Unterricht zu nutzen.
Über Jahrzehnte stammen die Behandlungen, die am explizitesten für diese Art sozial-evaluativer Angst entwickelt wurden, aus der Literatur zu Angststörungen, nicht aus der sprachtherapeutischen Literatur. Diese Lücke schließt sich - es gibt nun bedeutsame direkte Arbeit zu Sprechangst in Stotter- und Stimmkontexten -, aber die tiefste Evidenzbasis zu VR bei sozial-evaluativem Sprechen liegt in Studien zu sozialer Angststörung und Angst vor öffentlichem Sprechen. Wenn mich also eine klinisch tätige Person zu Recht fragt, welche Evidenz VR als Mittel stützt, Klient:innen in alltäglichen Sprechsituationen zu unterstützen, erfordert die ehrliche Antwort den Rückgriff auf das, was diese benachbarten Literaturen tatsächlich zeigen.
Dieser Beitrag fasst drei randomisierte kontrollierte Studien und eine Metaanalyse zusammen. Jede ist eine Studie, die Sie ernst nehmen können - angemessen groß, methodisch sorgfältig, peer-reviewt in angesehenen Foren. Keine wurde speziell entwickelt, um Sprachtherapie zu testen. Aber jede sagt etwas Nützliches darüber, ob und wie VR-basierte Übung Personen in den alltäglichen Sprechsituationen unterstützen kann, die ihnen wichtig sind.
Die vier Studien im Überblick
VR-basierte Exposition bei sozialer Angst und Angst vor öffentlichem Sprechen
Anderson et al. - VR-Exposition gleichwertig zu Gruppen-KVT
Beide aktiven Gruppen besserten sich signifikant gegenüber Wartelistenkontrolle; kein statistischer Unterschied zwischen VR-Exposition und Gruppen-KVT. Gewinne wurden im 12-Monats-Follow-up gehalten.
Wallach, Safir & Bar-Zvi - VR-KVT gleich traditionelle KVT, niedrigere Abbruchrate
Äquivalente Reduktionen der Angst vor öffentlichem Sprechen. Die Abbruchrate war in der VR-Bedingung niedriger; Teilnehmende bewerteten VR-KVT als attraktiver.
Bouchard et al. - vorab registrierte Überlegenheit von VR gegenüber in-vivo
VR-Exposition war signifikant wirksamer als reale Exposition auf dem primären Outcome zum Behandlungsende und im 6-Monats-Follow-up. Autor:innen dokumentierten praktische Vorteile: weniger umständlich, geringere Kosten, leichtere Vertraulichkeit.
Opriş et al. - Dosis-Wirkungs-Beziehung in der Literatur
Gepoolte Effektstärken zeigen große Gewinne gegenüber Wartelistenkontrolle und äquivalente Effekte zu nicht-VR-aktiven Behandlungen. Mehr Sitzungen erzeugten größere Gewinne - ein klares Dosis-Wirkungs-Muster.
Alle vier Studien sind in den Abschnitten unten und im Evidence Hub einzeln verlinkt. Stichprobengrößen zeigen den Vergleich: unter 20 = Pilot, 20-50 = klein, 50+ = generalisierbar.
Anderson 2013: VR-Exposition entspricht Gruppen-KVT, mit anhaltenden Gewinnen
Anderson und Kolleg:innen (2013) führten eine randomisierte kontrollierte Studie mit 97 Erwachsenen mit sozialer Angst durch. Die Teilnehmenden wurden einer von drei Gruppen zugeordnet: VR-Exposition als Einzelsitzungen, Gruppen-kognitive Verhaltenstherapie als gut etablierter aktiver Vergleich oder einer Wartelistenkontrolle. Beide aktiven Bedingungen liefen über die gleiche Anzahl an Sitzungen im selben Zeitraum.
Beide aktiven Gruppen erzeugten signifikante Verbesserungen gegenüber der Wartelistenkontrolle. Die beiden aktiven Gruppen erzeugten gegeneinander äquivalente Verbesserungen. Es gab keinen statistischen Unterschied zwischen individuell durchgeführter VR-Exposition und Gruppen-kognitiver Verhaltenstherapie in einer Gruppensetting. Und die Gewinne hielten im 12-Monats-Follow-up an - nicht nur für ein paar Wochen stabil, sondern über ein Jahr stabil.
Was ich daraus für die sprachtherapeutische Praxis mitnehme: Gruppen-KVT ist logistisch anspruchsvoll und nicht immer zugänglich. Sie verlangt zudem von der Person, in einem Gruppensetting teilzunehmen, was oft genau das ist, was sie am schwierigsten findet. VR-Exposition gibt klinisch tätigen Personen einen Weg, eine äquivalente expositionsbasierte Erfahrung individuell anzubieten. Für Klient:innen, die Gruppen aus denselben Gründen meiden, die sie überhaupt in die Therapie geführt haben, ist das wichtig.
Wallach 2009: VR-KVT entspricht traditioneller KVT bei Angst vor öffentlichem Sprechen, mit niedrigerer Abbruchrate
Wallach, Safir und Bar-Zvi (2009) führten eine RCT mit 88 Personen durch, gezielt zu Angst vor öffentlichem Sprechen. Die Teilnehmenden wurden zufällig VR-basierter kognitiver Verhaltenstherapie, traditioneller KVT oder einer Wartelistenkontrolle zugeordnet. Beide aktiven Bedingungen liefen über 12 wöchentliche Sitzungen.
Das Hauptergebnis war, dass VR-KVT und traditionelle KVT äquivalente Reduktionen der Angst vor öffentlichem Sprechen erzeugten, beide signifikant größer als der Wartelisteneffekt. Aber es gab ein sekundäres Ergebnis, das meiner Meinung nach zu wenig Aufmerksamkeit erhält. Die Abbruchrate war in der VR-Bedingung niedriger. Teilnehmende bewerteten VR-KVT als attraktiver als traditionelle KVT.
Reale Behandlungseffekte hängen von zwei Dingen ab, nicht nur von einem. Sie hängen von der Wirksamkeit pro Sitzung ab und davon, ob Personen den Behandlungszyklus abschließen. Eine Modalität, die pro Sitzung gleich wirksam ist, aber weniger Abbrüche produziert, liefert auf Bevölkerungsebene mehr Gesamtnutzen, als ihr Pro-Sitzungs-Effekt allein vermuten lässt. Wenn zwanzig Personen eine Intervention beginnen und fünfzehn sie beenden, hilft diese Intervention fünfzehn Personen. Wenn zwanzig Personen eine andere, gleich wirksame Intervention beginnen und achtzehn sie beenden, hilft diese Intervention achtzehn Personen. Der Unterschied bei der Abbruchrate ist keine Randnotiz.
Bouchard 2017: vorab registrierte Überlegenheitsstudie zeigt, dass VR reale Exposition übertrifft
Die Studie, die ich methodisch am interessantesten finde, ist Bouchard und Kolleg:innen (2017), veröffentlicht im British Journal of Psychiatry. Sie führten eine dreiarmige RCT mit 59 Erwachsenen mit Diagnose einer sozialen Angststörung durch. Die drei Arme waren KVT mit in-virtuo (VR)-Exposition, KVT mit in-vivo (realer) Exposition und eine Wartelistenkontrolle. Beide aktiven Arme erhielten 14 wöchentliche Sitzungen identischer Struktur - nur die Modalität der Exposition unterschied sich.
Das entscheidende methodische Detail ist, dass dies eine vorab registrierte Überlegenheitsstudie war. Die Forschenden verpflichteten sich im Voraus zu testen, ob VR-Exposition wirksamer als in-vivo-Exposition ist - eine Hypothese, die eine höhere Hürde setzt als Äquivalenz. Vorab-Registrierung ist wichtig, weil sie einen Teil der nachträglichen analytischen Flexibilität ausschließt, die in der klinischen Forschung historisch Effektschätzungen aufgeblasen hat.
Das Ergebnis: VR-Exposition war signifikant wirksamer als in-vivo-Exposition. Auf dem primären Outcome (LSAS-SR) übertraf VR die in-vivo-Exposition zum Behandlungsende (t(56)=2.02, p<.05) und im 6-Monats-Follow-up (F(1,37)=4.78, p<.05). Die Raten zuverlässiger Veränderung lagen bei 76.5% für VR und 68.3% für in-vivo - ein in der Richtung konsistenter Abstand, der für sich genommen keine statistische Signifikanz erreichte, während das primäre kontinuierliche Outcome dies tat. Die Forschenden dokumentierten zudem praktische Vorteile für die VR-Bedingung. In ihren eigenen Worten war in-virtuo-Exposition „significantly less cumbersome and costly to conduct than in vivo ones, in terms of having access to relevant stimuli to induce ridicule, duration, preparation, worries about confidentiality, costs of gathering staff members to attend at public speaking exercises”.
Bouchard et al. 2017 · n = 59 · vorab registrierte dreiarmige RCT
Zuverlässige Veränderung nach 14 Wochen KVT bei sozialer Angst
Beide aktiven Behandlungen erzeugten substanziell mehr zuverlässige Veränderung als die Warteliste. VR übertraf in-vivo hier leicht; der Abstand war in der Richtung konsistent, aber das kontinuierliche LSAS-SR-Outcome war dort, wo die Signifikanz lag.
Quelle: Bouchard S, Dumoulin S, Robillard G, et al. (2017). Virtual reality compared with in vivo exposure in the treatment of social anxiety disorder: a three-arm randomised controlled trial. British Journal of Psychiatry, 210(4), 276-283. DOI: 10.1192/bjp.bp.116.184234.
Ich möchte daraus eine bestimmte Implikation ziehen. Das Argument für VR-basierte Sprechübung wird manchmal als „VR ist ein nützlicher Vorbereitungsschritt vor der realen Praxis” gerahmt. Diese Studie stützt eine stärkere Lesart. VR-Exposition ist kein Mittel, um sich auf reale Exposition vorzubereiten. Sie ist eine Expositionsmodalität an sich - eine, die in dieser Studie überlegene Ergebnisse auf dem primären Maß erzeugte, bei deutlich geringerem Aufwand in der Durchführung.
Opriş 2012: ein metaanalytisches Dosis-Wirkungs-Muster
Die vierte Studie, die ich besprechen möchte, ist keine Studie, sondern eine Metaanalyse. Opriş und Kolleg:innen (2012) poolten Effektstärken über mehrere Primärstudien zu VR-Exposition bei Angststörungen. Sie fanden, wie auch die oben besprochenen Studien nahelegen, dass VR-Exposition große Effektstärken gegenüber Wartelistenkontrolle und äquivalente Effekte zu nicht-VR-evidenzbasierten Interventionen erzeugte.
Aber das Ergebnis, das ich hervorheben möchte, ist ein anderes: die Dosis-Wirkungs-Beziehung. Über Studien hinweg erzeugten mehr Sitzungen größere Gewinne. Das ist ein Muster, das damit konsistent ist, wie expositionsbasierte Therapien theoretisch wirken - durch wiederholte, strukturierte Auseinandersetzung mit der gefürchteten Situation, sodass Habituation und kognitive Veränderung sich akkumulieren können. Es ist keine VR-spezifische Eigenschaft, hat aber eine spezifische klinische Implikation für VR-basierte Arbeit.
Die Implikation ist: Eine Ein-Sitzungs-Demonstration ist nicht der richtige Test dafür, was VR-basierte Sprechübung leisten kann. Der Mechanismus ist anhaltende, mehrsitzige Übung - gestuft, kontrolliert, wiederholt -, und die Evidenz legt nahe, dass die Vorteile mit dem Übungsumfang skalieren. Klinisch tätige Personen, die mit VR arbeiten, sollten mehrsitzige Übungs-Progressionen planen, nicht Einzelversuche.
Vier Studien, eine Richtung
Effektstärken-Forest-Plot der VR-vs.-Vergleichs-Kontraste
Vier Studien zu sozialer Angst, abgebildet mit berichteten Effektstärken
Oberes Panel: Gegen aktive Vergleichsbedingungen bevorzugte keine Studie den Vergleich gegenüber VR; eine (Bouchard 2017) bevorzugte VR. Unteres Panel: Gegen Wartelistenkontrolle ohne Behandlung erzeugte VR große gepoolte Effekte. Konvergente Evidenz mit konsistenter Richtung über Studiendesigns hinweg.
Quellen: Anderson et al. 2013 (J Consult Clin Psychol), Wallach et al. 2009 (Behav Modif), Bouchard et al. 2017 (Br J Psychiatry, DOI), Opriş et al. 2012 (Depress Anxiety, DOI). Anderson 2013 wird qualitativ dargestellt, weil das ursprüngliche PDF gerastert ist und spezifische Cohen's-d-Werte nicht maschinell extrahiert werden konnten; das Quellpaper berichtet Äquivalenz zwischen VR und Gruppen-KVT auf der LSAS. Bouchards d-Schätzung ist aus dem berichteten t(56)=2.02 über d = 2t/√df abgeleitet. Wallachs d ist der gepoolte VRCBT+CBT-vs-WL-Effekt auf LSAS-Avoidance. Opriş ist das metaanalytische Cohen's d, gewichtet über primäre Outcomes.
Was das für die Sprachtherapie bedeutet
Diese vier Studien wurden zur Untersuchung sozialer Angststörung und Angst vor öffentlichem Sprechen entwickelt, nicht für Stottern, Stimmarbeit, autistische Kommunikation oder einen anderen kommunikationsspezifischen Kontext. Ich möchte vorsichtig sein, nicht zu überdehnen. Der Transfer von „VR-Exposition wirkt bei sozialer Angst” zu „VR-Übung unterstützt Sprech-Selbstvertrauen bei einer stotternden Person” ist ein Evidenztransfer über Populationen hinweg, und dieser Transfer braucht eine eigene Validierung. Der Evidence Hub enthält bereits direkte Studien zu VR mit stotternden Personen - Brundage und Hancock (2015), Brock (2023), Kumar (2024) - und wachsende Arbeit zu Stimme. Der jüngste direkte Test im Bereich Autismus ist McCleery et al. (2026), eine parallele RCT bei autistischen Jugendlichen und Erwachsenen, die drei kurze VR-Sitzungen mit Video-Modeling für die Übung von Polizeiinteraktionen verglich. Die VR-Gruppe gab signifikant angemessenere Reaktionen und zeigte ruhigere Körpersprache während eines realen Post-Tests mit echten Polizistinnen und Polizisten; die Video-Modeling-Kontrolle nicht. Diese direkten Studien leisten den Großteil der Arbeit für populationsspezifische Aussagen.
Was die Literatur zu sozialer Angst etabliert, sind vier Dinge, die als Hintergrund nützlich sind.
Erstens: gestufte, steuerbare, wiederholbare Exposition wirkt. Der Mechanismus ist über mehrere Angsterkrankungen in Studien mit aktiven Vergleichen und angemessenen Stichproben etabliert. Der Wirkstoff ist nicht VR an sich - es ist Exposition, die so geliefert wird, dass die klinisch tätige Person Intensität steuern, zuverlässig wiederholen und in für die Person handhabbaren Schritten fortschreiten kann. VR ist ein Weg, diese Eigenschaften zu liefern; die Eigenschaften zählen mehr als das Medium.
Zweitens: VR kann in-vivo-Exposition ersetzen, nicht nur ihr vorausgehen. Bouchards Überlegenheits-Befund macht diesen Punkt direkter, als Äquivalenz es täte. Für klinisch tätige Personen in Settings, in denen reale Sprechübungen schwer zu arrangieren sind - ländliche Gebiete, Schulen mit Datenschutz-Beschränkungen, Kontexte, in denen Vertraulichkeit zählt -, ist das mehr als eine Lizenz. VR ist kein Notnagel, wenn in vivo nicht verfügbar ist; es ist eine Expositionsmodalität an sich - eine, die in dieser Studie überlegene Ergebnisse auf dem primären Maß bei deutlich geringerem logistischem Aufwand erzeugte.
Drittens: Abbruchrate ist genauso wichtig wie Pro-Sitzungs-Wirksamkeit. Der Wallach-Befund verdient mehr klinische Aufmerksamkeit, als er erhält. Eine Modalität, die Personen genug einbindet, um sie in Behandlung zu halten, liefert mehr Gesamtnutzen, selbst bei äquivalenten Pro-Sitzungs-Effekten.
Viertens: Dosis zählt, und eine Sitzung ist nicht der Test. Das Dosis-Wirkungs-Muster in der Metaanalyse spricht für die Planung mehrsitzigen Übungs-Progressionen statt VR als Einmaldemonstration zu behandeln. Ein häufiger Fehlermodus, den ich im frühen klinischen Einsatz sehe, ist das Übergewicht des „Wow”-Effekts der ersten Sitzung. Die Evidenz legt nahe, dass das der falsche Ort ist, das Gewicht zu legen.
Was ich nicht behaupte
Ich behaupte nicht, dass diese Studien beweisen, dass VR-basierte Übung bei Stottern, Stimmarbeit oder einem anderen kommunikationsspezifischen Kontext wirkt. Die direkten Studien in diesen Bereichen sind kleiner, weniger ausgereift und in einem anderen Stadium der Evidenzentwicklung. Die ehrliche Rahmung lautet: Eine robuste benachbarte Evidenzbasis stützt die Modalität und ihren zugrunde liegenden Mechanismus, die direkte Evidenz ist kleiner und wächst, und klinisch tätige Personen sollten beides abwägen.
Ich behaupte auch nicht, dass VR klinische Expertise ersetzt. Jede Studie oben wurde von klinisch tätigen Personen entworfen, mit klinischem Urteil durchgeführt und unter klinischer Aufsicht ausgewertet. Die Technologie ist das Medium, nicht die ausübende Person. Die Befunde übertragen sich, wenn die Praxis gute Praxis ist.
Eine Anmerkung zu den nächsten zwanzig Jahren
Vieles der hier referenzierten VR-Arbeit zu sozialer Angst ist nun zehn bis zwanzig Jahre alt. Die Technologie hat sich substanziell verändert - von kabelgebundenen Headsets in Forschungslaboren zu Standalone-Verbrauchergeräten, die in eine Klinikbtasche passen. Die Struktur der Praxis hat sich nicht verändert. Gestufte, steuerbare, wiederholbare Exposition bleibt der aktive Mechanismus. Was sich ändert, ist Zugang: wer es liefern kann, wo und zu welchen Kosten.
Deshalb glaube ich, dass die Evidenz, die wir bereits haben - so benachbart sie auch ist - vorsichtige Zuversicht über die Richtung des Feldes stützt, selbst während direkte Evidenz in den spezifischen Bereichen, in denen sprachtherapeutische Fachkräfte arbeiten, weiter wächst. Die Lücke schließt sich. Und in der Zwischenzeit leisten zwei Jahrzehnte VR-Forschung zu sozialer Angst mehr nützliche Arbeit für die sprachtherapeutische Praxis, als ihnen manchmal zugutegehalten wird.
Weiterführende Lektüre
- Sprechangst - Evidence-Hub-Thema mit allen Hub-Studien zu Sprechangst
- Anderson et al. (2013) - Die 97-Personen-RCT zu sozialer Angst
- Bouchard et al. (2017) - Vorab registrierte Überlegenheit von VR gegenüber in-vivo-Exposition
- Wallach et al. (2009) - RCT zu Angst vor öffentlichem Sprechen mit dem Befund zur niedrigeren Abbruchrate
- Opriş et al. (2012) - Metaanalyse mit dem Dosis-Wirkungs-Muster
- Ökologische Validität in der VR-Sprachtherapie - Was die Evidenz zu virtuellem versus realem Publikum zeigt
- VR für geschlechtsangleichende Stimmtherapie: Was die erste RCT ergab - Direkte Anwendung des Bereitschafts-zur-Kommunikation-Befundes auf Stimmarbeit
- Wie der NHS VR nutzt, um junge stotternde Menschen zu unterstützen - Dieselbe Forschung, angewendet in NHS-Settings
- Wie eine VR-Sprachtherapiestudie zu lesen ist - Ein Leitfaden zur Interpretation solcher Forschung
- Weiterführende Lektüre - Bücher und Communities, die die aktuelle Praxis prägen