Es gibt zwei sehr unterschiedliche Technologien, die beide „Virtual Reality“ genannt werden, und der Unterschied ist weit bedeutsamer, als kaum jemand offen ausspricht. Die eine ist 360-Grad-Video: reales Filmmaterial, mit einer speziellen Kamera aufgenommen, das man über ein Headset ansieht und in dem man sich umsehen kann. Die andere ist interaktive, computergenerierte VR: eine gebaute, reaktive Welt, durch die man sich bewegen und in der man handeln kann und in der die Umgebung auf das eigene Tun reagiert.

Dieser Beitrag ist eine sachliche Zusammenfassung dessen, was die veröffentlichte Forschung über beide sagt. Es ist kein Meinungsbeitrag. Ich habe sie aus dem Evidence Hub auf dieser Website und aus der breiteren Literatur über Bildung, Medizin, Psychologie, Training und Rehabilitation zusammengetragen. Wo die Evidenz gemischt oder dünn ist, sage ich das. Wo 360-Grad-Video klar gewinnt, sage ich das ebenfalls.

Ich entwickle interaktive VR für die Sprach- und Kommunikationstherapie, also habe ich ein eigenes Interesse daran. Genau deshalb habe ich versucht, die Argumentation von den Quellen tragen zu lassen statt von meinen Vorlieben. Das Muster, das sich aus der Literatur ergibt, ist konsistent - und es ist nicht das, was die meisten Menschen annehmen.

Zwei Arten von VR und warum man sie verwechselt

Die Verwechslung ist nachvollziehbar, denn beide setzen einem ein Headset auf und umgeben einen mit einer Szene. Aber unter der Haube sind sie Gegenteile.

360-Grad-Video (auch cinematische VR, Cine-VR oder immersives Video genannt) wird aufgenommen. Eine 360-Grad-Kamera filmt einen realen Ort - ein Klassenzimmer, ein Café, eine Menschenmenge - und das Material wird im Headset um einen herum gelegt. Man kann den Kopf drehen und überallhin schauen, aber man sieht sich eine Aufzeichnung an. Man kann nicht zu jemandem hinübergehen, nichts aufheben und nichts am Geschehen ändern. Die Szene läuft jedes Mal gleich ab. In der Trainingsliteratur wird dies unverblümt als „nur lesbar“ beschrieben (Kittel et al., 2020).

Interaktive, computergenerierte VR wird gebaut, nicht gefilmt. Jedes Objekt, jede Figur und jeder Ton wird in einer Game-Engine erzeugt, und genau das macht die Welt reaktiv. Die Umgebung kann in Echtzeit auf einen reagieren, der Schwierigkeitsgrad lässt sich anpassen, Figuren können antworten, und man kann sich durch den Raum bewegen. Das ist die Art von VR, die Therapy withVR verwendet, und es ist das, was die meisten Menschen vor Augen haben, wenn sie an ein VR-„Erlebnis“ denken.

Eine kurze Anmerkung zu den Begriffen, denn das Feld ist nicht ordentlich aufgeräumt: Vieles im Marketing nennt 360-Grad-Video „VR“, und manche Fachleute bestreiten, ob es überhaupt dazu zählt, da echte VR üblicherweise Echtzeit-Interaktion und Bewegungstracking voraussetzt. Für diesen Beitrag ist die nützliche Unterscheidung nicht, wie wir sie nennen, sondern was sie einem ermöglichen.

3DoF vs. 6DoF: der ganze Unterschied in einem Gedanken

Wenn Sie sich ein Stück Fachjargon merken, dann dieses, denn es erfasst die gesamte Trennlinie.

Diese Lücke ist kein Qualitätsproblem, das bessere Kameras beheben werden. Sie ist strukturell. Ein vorab aufgezeichneter Film wird von einem festen Punkt aus gefilmt und kann einem daher niemals die Freiheit geben, sich zu bewegen und zu handeln. Deshalb hat sich die Consumer-VR-Branche schon vor Jahren von 3DoF abgewandt: Die frühen 3DoF-Headsets, die um 360-Grad-Inhalte herum gebaut waren - etwa Google Daydream und die Oculus Go -, wurden beide eingestellt, und die Plattform standardisierte sich auf 6DoF.

Die eigentliche Bruchlinie: Handlungsfähigkeit, nicht Realismus

Hier ist der Befund, der sich durch jedes Feld zieht, das ich mir angesehen habe. Das, was die beiden Technologien in der Forschung trennt, ist die Handlungsfähigkeit - ob man handeln kann und auf einen reagiert wird - nicht, wie realistisch das Bild ist.

Der klarste Rahmen stammt vom VR-Wissenschaftler Mel Slater, der das Gefühl des „Dort-Seins“ in zwei Teile aufteilt (Slater, 2009). Der erste ist die Place Illusion: das Empfinden, sich an einem Ort zu befinden. Sowohl 360-Grad-Video als auch interaktive VR können dies erzeugen. Der zweite ist die Plausibility Illusion: das Empfinden, dass das, was geschieht, wirklich einem selbst geschieht. Diese hängt davon ab, dass die Welt auf einen reagiert, sich auf einen bezieht und sich so verhält, wie man es erwarten würde. Eine Aufzeichnung kann das nicht, denn sie weiß nicht, dass man da ist.

Die Lernwissenschaft sagt dasselbe mit anderen Worten. Ein bekanntes Modell des Engagements, ICAP, ordnet Lernmodi danach, wie aktiv sie sind, mit passivem Zuschauen ganz unten und interaktivem Engagement ganz oben (Chi und Wylie, 2014). Zuschauen ist der schwächste Modus; Tun und Reagieren sind die stärksten.

Und die Literatur zur Expositionstherapie landet an genau derselben Stelle. Eine Scoping-Review zu VR bei sozialer Angst - die bemerkenswerterweise auch betrachtet, wie man sie für das Stottern anpassen kann - bringt es deutlich auf den Punkt: Bei 360-Grad-Video „sind die Nutzenden auf eine passive Navigation in der Umgebung beschränkt“, während „die Steuerung der Umgebung auf Basis des Verhaltens der nutzenden Person in computergenerierten Umgebungen möglich ist, was eine größere Handlungsfähigkeit erzeugt“. Ihre Schlussfolgerung lautet, dass „computergenerierte Umgebungen besser dafür geeignet sein könnten, soziale Interaktion zu adressieren“ (Chard und van Zalk, 2022).

Das ist der Kern der Sache. 360-Grad-Video macht einen zum Zeugen. Interaktive VR macht einen zum Teilnehmer.

Spielt Interaktivität tatsächlich eine Rolle? Was die Evidenz zeigt

Sie tut es, und am nützlichsten lässt sich das auf eine zunächst überraschende Weise erkennen: In der gesamten Forschung schlägt „interaktiv“ das „immersiv“. Realismus und Präsenz sind nicht das, was die messbaren Ergebnisse antreibt. Interaktion ist es. Einige der stärksten Befunde:

Zusammengenommen weisen diese in eine Richtung: Der Wirkstoff in VR ist die Fähigkeit der nutzenden Person, zu handeln und eine Reaktion zu erhalten. Das ist genau der Wirkstoff, den 360-Grad-Video aufgibt.

Wo 360-Grad-Video wirklich gewinnt

Dies ist kein Plädoyer gegen 360-Grad-Video. Es hat echte, evidenzgestützte Stärken, und gerade die Ehrlichkeit darüber macht den Rest glaubwürdig. Es gewinnt, wenn das Ziel ist, etwas zu empfinden oder zu beobachten, statt zu handeln.

Wenn Ihre Aufgabe darin besteht, jemanden in einen realen Ort hineinzuversetzen und ihn auf sich wirken zu lassen, ist 360-Grad-Video ein gutes Werkzeug. Die Frage ist, ob Ihre Aufgabe Beobachtung ist - oder Interaktion.

Eine Bewertung: Welches gewinnt, und wofür

Keine Technologie gewinnt bei allem. Die ehrliche Antwort ist, dass der Gewinner von der Aufgabe abhängt, und das ist genau der Punkt. So ordnet sich die Evidenz.

Was die VR leisten sollWelches gewinntWarum
Der nutzenden Person ermöglichen, zu handeln, zu interagieren und sich abzuwechselnInteraktiv360-Grad-Video ist „nur lesbar“, auf passive Navigation beschränkt
Den Schwierigkeitsgrad auf den Einzelfall zuschneiden und abstufenInteraktiv360-Grad-Video ist Einheitsgröße; eine gebaute Szene lässt sich live anpassen
Eine Fertigkeit aufbauen, die sich auf das echte Leben überträgtInteraktivKompetenzzuwächse folgen der Interaktivität, nicht der Immersion
Sich durch den Raum bewegen und ihn erkundenInteraktiv6DoF vs. 3DoF - der aufgezeichnete Blickpunkt ist fest
Ein Gefühl von Präsenz erzeugenOft interaktivInteraktive VR erreichte oder übertraf reales Filmmaterial bei der Präsenz
Fotorealistische reale Orte und Gesichter zeigen360-Grad-VideoEs ist eine echte Aufnahme der realen Welt
Etwas schnell und günstig produzieren360-Grad-VideoFilmen schlägt den Bau einer 3D-Welt
Von Schmerz oder Belastung ablenken (passiv)360-Grad-VideoPassive Inhalte sind zur Ablenkung mindestens ebenso wirksam
Eine unmittelbare emotionale Reaktion erzeugen360-Grad-VideoStark, aber meist kurzlebig
Dauerhafte Veränderung von Verhalten oder Fertigkeit bewirkenInteraktivHandeln und Reagieren übertrifft das Zusehen

Die Faktenlage

Immersive VR-Studien in der Sprach- und Kommunikationstherapie, nach Methode

Interaktive VR56
360°-Video4

Von den immersiven VR-Studien (mit Headset) in der Sprach- und Kommunikationstherapie nutzten 56 interaktive, computergenerierte VR und nur 4 ein 360-Grad-Video.

Die Zahlen, die man sich merken sollte

Was das für die Sprach- und Kommunikationstherapie bedeutet

Kommunikation ist per Definition interaktiv. Ein Gespräch ist eine Folge von Reaktionen: Jemand spricht, man reagiert, die andere Person reagiert auf die eigene Reaktion, und der Schwierigkeitsgrad verschiebt sich in Echtzeit. Das sinnvoll zu üben bedeutet, genau diese Schleife zu üben - auf einem an die Person angepassten Niveau, mit einer Szene, die reagiert. Das sind genau die Dinge, die eine feste Aufzeichnung nicht leisten kann.

Es ist also kein Zufall, dass sich die Forschung zu Sprache und Kommunikation überwältigend um die interaktive VR gesammelt hat. Die Aufteilung 56 zu 4 im Evidence Hub ist keine Eigenheit dessen, welche Studien ich zufällig aufgenommen habe; sie spiegelt wider, wo der Wirkmechanismus tatsächlich liegt. Die Handvoll 360-Grad-Video-Studien im Feld ergibt ein gemischtes Bild - ein positives Ergebnis bei der Redeangst (Reeves 2021), ein Nullergebnis bei der Stimme (Bostyn 2026) und ein paar kleine Machbarkeitsstudien (Chard 2023, deLeyer-Tiarks 2020) -, was ungefähr dem entspricht, was man von einem für die Beobachtung gebauten Medium erwarten würde, das auf eine auf Interaktion gebaute Aufgabe angewendet wird.

Deshalb ist Therapy withVR interaktiv statt gefilmt. Das Argument dafür lautet nicht „interaktiv ist immer besser“. Es ist enger gefasst und, wie ich finde, robuster: Kommunikationsübungen brauchen, dass die Szene auf die Person reagiert und auf sie abstimmbar ist, und nur interaktive VR kann das leisten. Wenn Sie die längere Fassung dieser Begründung möchten, sie steht auf der Seite Warum Therapy withVR.

Eine Anmerkung für Forschende

In all dem steckt ein praktischer Punkt, und ich möchte ihn sorgfältig formulieren, als Beobachtung und nicht als Urteil.

Die zentrale Einschränkung von 360-Grad-Video - keine Interaktion, keine Individualisierung, ein fester Blickpunkt - ist strukturell. Sie lässt sich innerhalb des Mediums nicht wegtechnisieren, und sie ist seit Jahren dokumentiert. Wenn 360-Grad-Video auf Aufgaben angewendet wird, die von Interaktion abhängen, stoßen Studien tendenziell wieder an dieselbe Decke. Das ist keine Kritik an einer einzelnen Studie; es ist eine Eigenschaft des Werkzeugs.

Die konstruktive Lesart betrifft die Frage, wo Forschungsenergie am weitesten reicht. Die Fragen, die noch wirklich offen sind, lauten nicht „unterstützt ein nicht-interaktives Medium interaktives Üben“ - die Literatur weist bereits auf die Antwort hin. Es sind Fragen wie: Wo genau passt 360-Grad-Video am besten, wie schneiden hybride Designs ab und was lässt in VR gelernte Fertigkeiten auf das echte Leben generalisieren. Diese sind förderwürdig. Eine bekannte strukturelle Decke erneut zu testen, ist schwerer zu begründen.

Wohin sich VR entwickelt

Die Entwicklung des gesamten Feldes bekräftigt dieselbe Richtung. Die Technologien, die derzeit die meiste Aufmerksamkeit auf sich ziehen, sind diejenigen, die aufgenommene Inhalte interaktiv machen: volumetrisches Video, mit dem man um eine reale, gefilmte Person herumgehen kann, und Echtzeitverfahren wie 3D Gaussian Splatting, die fotorealistische aufgenommene Szenen rendern, durch die man sich mit voller Bildrate bewegen kann (Kerbl et al., 2023). Hinzu kommt, dass Game-Engines Figuren erhalten, die von dialogfähiger KI gesteuert werden und in Echtzeit reagieren können.

Der gemeinsame Nenner ist, dass das Feld auf „fotorealistisch und interaktiv“ zuläuft. Der Realismusvorteil, der 360-Grad-Video einst attraktiv machte, schließt sich, während die Interaktivität, die ihm fehlt, zum Standard wird. Auf Interaktion zu setzen, ist heute nicht nur vertretbar; es ist die Richtung, in die die Technologie geht.

Das Fazit

Wenn Sie sehen möchten, wie eine interaktive, von der klinisch tätigen Person gesteuerte VR-Sitzung tatsächlich abläuft, nehmen Sie Kontakt auf.

Häufig gestellte Fragen

Ist 360-Grad-Video dasselbe wie Virtual Reality? Nicht ganz. 360-Grad-Video ist vorab aufgezeichnetes Material der realen Welt, in dem man sich über ein Headset umsieht. Es wird manchmal cinematische VR genannt, aber ihm fehlen die Echtzeit-Interaktion und Bewegung, die Virtual Reality üblicherweise ausmachen. Viele Menschen und Produkte verwenden „VR“ lose für beides, aber technisch sind die beiden verschieden.

Was ist der Unterschied zwischen 360-Grad-Video und interaktiver VR? 360-Grad-Video wird mit einer Kamera aufgenommen und ist fest: Man kann sich umsehen, aber man kann sich nicht in die Szene hineinbewegen, mit Objekten interagieren oder das Geschehen ändern. Interaktive VR wird in einer Game-Engine gebaut und ist reaktiv: Die Welt reagiert auf einen, der Schwierigkeitsgrad lässt sich anpassen, und man kann sich durch den Raum bewegen und in ihm handeln.

Kann man mit 360-Grad-Video interagieren? Nur auf sehr begrenzte Weise. Man kann in jede Richtung schauen, und manche Versionen fügen anklickbare Hotspots hinzu, aber man kann nicht umhergehen, Dinge aufheben oder Figuren in Echtzeit auf sich reagieren lassen. Deshalb beschreibt die Trainingsliteratur 360-Grad-Video als „nur lesbar“.

Was ist 3DoF vs. 6DoF? Freiheitsgrade beschreiben, wie man sich bewegen kann. 3DoF (drei Freiheitsgrade) lässt einen nur den Kopf drehen - der Standard für 360-Grad-Video. 6DoF (sechs Freiheitsgrade) fügt die Bewegung des Körpers durch den Raum hinzu, sodass man schreiten, sich lehnen und greifen kann. Interaktive VR ist 6DoF.

Was ist besser, 360-Grad-Video oder interaktive VR? Das hängt von der Aufgabe ab. 360-Grad-Video ist besser, um reale Orte günstig zu zeigen, für passive Erlebnisse wie die Schmerzablenkung und für starke unmittelbare Emotion. Interaktive VR ist besser für alles, was Handeln, Abwechseln, das Individualisieren des Schwierigkeitsgrades oder den Aufbau einer Fertigkeit erfordert, die sich auf das echte Leben überträgt.

Ist 360-Grad-Video für die Sprachtherapie geeignet? Für Beobachtung und Besprechung kann es helfen. Aber Kommunikationsübungen hängen davon ab, in Echtzeit auf Menschen zu reagieren und den Schwierigkeitsgrad an den Einzelfall anzupassen, was 360-Grad-Video nicht leisten kann. In der Forschung hat sich VR für Sprache und Kommunikation überwältigend um interaktive VR statt um 360-Grad-Video gesammelt.

Was ist cinematische VR (Cine-VR)? Cinematische VR, oder Cine-VR, ist eine andere Bezeichnung für narratives 360-Grad-Video, das in einem Headset betrachtet wird - reales Material mit räumlichem Audio, strukturiert wie ein Film. Es teilt die Stärken und Grenzen von 360-Grad-Video: hoher Realismus, aber keine Echtzeit-Interaktion.

Weiterführende Lektüre