Diese Seite wurde aus dem Englischen übersetzt. Wenn etwas seltsam klingt, wechseln Sie zur englischen Version. Auf Englisch ansehen.

In VR steuert die scheinbare Entfernung der zuhörenden Person die Stimmlautstärke stärker als die Raumgröße

Daşdöğen Ü et al. · 2026 · Journal of Speech, Language, and Hearing Research · Experimentell · n = 15 · Fünfzehn stimmgesunde Erwachsene (12 weiblich, drei männlich... · DOI
Sicherheit der Evidenz: Niedrige Sicherheit
Wie dies bewertet wurde

Diese Sicherheitsbewertung spiegelt das Vertrauen in die Evidenz für den klinischen oder therapeutischen Einsatz wider - nicht die Belastbarkeit des zugrunde liegenden Befunds, der stark ist und die frühere Arbeit des Teams repliziert (Daşdöğen et al., 2023). Die Studie ist peer-reviewt im Journal of Speech, Language, and Hearing Research (ASHA), IRB-genehmigt und NIH/NIDCD-finanziert (R21-DC020494), mit der Stimmwissenschaftlerin Katherine Verdolini-Abbott als Multiple Principal Investigator. Stärken des Designs: Das auditive Feedback wurde über alle Bedingungen hinweg konstant gehalten, sodass der visuell-räumliche Input als Ursache isoliert wurde; die mechanistische Frage (Raumgröße versus Sprecher-Zuhörer-Entfernung) wurde sauber getrennt, anders als in der früheren Arbeit des Teams, die beide gemeinsam variierte; es wurden drei Sprechaufgaben verwendet; der SPL wurde extern kalibriert; und die Analyse ist ein gut begründeter Rahmen aus linearen gemischten Modellen mit Tukey-Kramer-Post-hoc-Kontrasten. Was die Sicherheit für die klinische Anwendung niedrig hält: kleine Gesamtstichprobe (N = 15) mit unausgewogenem Geschlechterverhältnis (12 weiblich, 3 männlich); ausschließlich stimmgesunde Erwachsene, also bislang keine Evidenz bei Populationen mit Stimmstörungen; eine einzige Sitzung; ein akustischer Surrogatendpunkt (SPL) anstelle eines klinischen Stimmendpunkts; simulierte Umgebungen, die weder reale Akustik noch lebendige soziale Dynamiken abbilden; keine selbstberichtete Stimmanstrengung oder perzeptive Ergebnisse; und selbstberichtetes (nicht objektiv überprüftes) Hören. Die Studie belegt den visuell-räumlichen Mechanismus robust; die therapeutische Wirksamkeit und der Transfer in die reale Welt sind davon getrennte Fragen, die größere, mehrsitzige Studien in klinischen Populationen mit Kontrollvergleichen erfordern.

Die Bewertungen verwenden ein vereinfachtes vierstufiges Schema (Hoch, Mittel, Niedrig, Sehr niedrig), angelehnt an die GRADE working group. Mehr darüber erfahren, wie Studien bewertet werden.

Mithilfe der Rooms-Situation von Therapy withVR sprachen 15 stimmgesunde Erwachsene bei konstant gehaltenem Schall über virtuelle Bedingungen hinweg, die Raumgröße und Sprecher-Zuhörer-Entfernung variierten. Die Entfernung war der wesentliche Treiber der Stimmintensität - je weiter entfernt die virtuelle zuhörende Person erschien, desto lauter sprachen die Teilnehmenden -, während die Raumgröße als Moderator wirkte, der den Entfernungseffekt verstärkte, besonders bei den größten Entfernungen. Da sich nur die visuellen Reize änderten, zeigt die Studie, dass visuell-räumliche Reize allein die Stimme skalieren können.

Klinische Kernaussage

Eine NIH-finanzierte, peer-reviewte experimentelle Studie, die die visuellen Treiber der Stimmintensität in immersiver VR isoliert. Über drei Sprechaufgaben hinweg (ein gehaltener Vokal, eine Standardphrase und Spontansprache) steigerten 15 stimmgesunde Erwachsene ihre Lautstärke, je weiter sich die virtuelle zuhörende Person entfernte, wobei die Raumgröße den Effekt moderierte - am stärksten im großen Raum bei der weiten Entfernung (15 m). Das Konstanthalten des Schalls über alle Bedingungen hinweg isolierte das Sehen als Ursache. Die Statistik ist robust (lineare gemischte Modelle; alle Haupteffekte und die Wechselwirkung Raumgröße x Entfernung bei p < .001). Die Studie ist begrenzt durch eine kleine Stichprobe (N = 15), ein unausgewogenes Geschlechterverhältnis (12 weiblich, 3 männlich), ausschließlich stimmgesunde Erwachsene und eine einzige Sitzung - sie belegt also den Mechanismus, nicht die klinische Wirksamkeit. Die Studie nutzte die Rooms-Situation von Therapy withVR, und der Gründer von withVR baute die darin verwendeten maßgeschneiderten Umgebungen.

Wichtigste Ergebnisse

  • Über alle drei Sprechaufgaben hinweg war die Sprecher-Zuhörer-Entfernung der wesentliche Treiber der Stimmintensität (SPL): Je weiter entfernt die virtuelle zuhörende Person erschien, desto lauter sprachen die Teilnehmenden (Haupteffekt der Zuhörerentfernung p < .0001 für jede Aufgabe)
  • Die Raumgröße hatte einen kleineren, sekundären Effekt und wirkte als Moderator - eine signifikante Wechselwirkung Raumgröße x Entfernung (p < .0001 über die Aufgaben hinweg) zeigte, dass der Entfernungseffekt im großen Raum bei der weiten Zuhörerentfernung (15 m) am stärksten war
  • Beim gehaltenen Vokal war die Bedingung großer Raum mit weiter Entfernung etwa 4,4 dB lauter als der große Raum allein, und die Verschiebung der zuhörenden Person auf 15 m im großen Raum erhöhte die Intensität um etwa 2,9 dB
  • Die Zuhörerentfernung war über alle drei Aufgaben hinweg der wesentliche Treiber; der Effekt war beim gehaltenen Vokal und der gelesenen Phrase größer (Aufgabentypen, die von Natur aus eine lautere, gleichmäßigere Stimmgebung hervorrufen), während in der Spontansprache der spezifische Post-hoc-Kontrast 3 m vs. 15 m keine Signifikanz erreichte
  • Das auditive Feedback wurde über alle Bedingungen hinweg identisch gehalten, sodass die Stimmveränderungen allein durch visuell-räumlichen Input ausgelöst wurden und nicht durch eine Veränderung dessen, was die Teilnehmenden hörten
  • Robuste Analyse (lineare gemischte Modelle, Tukey-Kramer-Post-hoc): Für die Spontansprache Zuhörerentfernung F(3, 112) = 84.6, Raumgröße F(2, 112) = 51.6 und die Wechselwirkung F(3, 112) = 53.0, alle p < .0001

Hintergrund

Wenn wir sprechen, passen wir unsere Stimme unbewusst an die Situation an - wir projizieren über einen großen Saal hinweg, heben unsere Lautstärke an, wenn eine zuhörende Person weit entfernt ist, und nehmen sie zurück, wenn sie nah ist. Eine langjährige Herausforderung in der Stimmtherapie besteht darin, dass die in einem ruhigen Praxisraum erzielten Fortschritte oft nicht in diese realen Umgebungen übertragen werden, in denen die Anforderungen an die Stimme völlig andere sind.

Eine wachsende Forschungslinie fragt, ob immersive virtuelle Realität (IVR) diese Anforderungen so genau nachbilden kann, dass sie reales Stimmverhalten auslöst - und schließlich trainiert. Daşdöğen und Kolleg:innen hatten bereits gezeigt, dass virtuelle Raumgröße und Zuhörerentfernung verändern können, wie laut Menschen sprechen, doch weil sie beide gleichzeitig variierten, ließ sich nicht feststellen, welcher Reiz die Wirkung erzeugte. Diese Studie machte sich daran, die beiden zu trennen.

Was die Forschenden taten

Fünfzehn stimmgesunde Erwachsene absolvierten drei Sprechaufgaben - einen gehaltenen Vokal /a/, die Standardphrase “We were away a year ago” und eine spontane Antwort - über acht immersive VR-Bedingungen hinweg, die über die Rooms-Situation von Therapy withVR auf einem Oculus Quest 3 Headset präsentiert wurden. Die Bedingungen variierten Raumgröße (ein kleiner Raum mit 5 x 4 x 4 m versus ein großer Raum mit 20 x 20 x 20 m), Sprecher-Zuhörer-Entfernung (1 m, 3 m oder 15 m) und Kombinationen aus beidem, hinzu kamen reine Zuhörerbedingungen ohne Raum.

Entscheidend ist, dass der Schall über jede Bedingung hinweg identisch gehalten wurde - die Teilnehmenden trugen Ohrstöpsel und geschlossene Kopfhörer, und die natürliche Raumakustik wurde konstant gehalten -, sodass sich nur das änderte, was sie sahen. Dieses Design erlaubt es der Studie, jede Veränderung der Stimme allein dem visuell-räumlichen Input zuzuschreiben. Der Schalldruckpegel (SPL) wurde mit einem kalibrierten kopfmontierten Mikrofon aufgezeichnet und mit linearen gemischten Modellen analysiert. Die Arbeit wurde durch einen Zuschuss der US National Institutes of Health finanziert, mit der Stimmwissenschaftlerin Katherine Verdolini-Abbott als Multiple Principal Investigator.

Was sie fanden

Die Sprecher-Zuhörer-Entfernung war der wesentliche Treiber der Stimmintensität. Über alle drei Aufgaben hinweg sprachen die Teilnehmenden umso lauter, je weiter entfernt die virtuelle zuhörende Person erschien - ein starker, statistisch robuster Effekt (p < .0001 in jeder Aufgabe). Der Effekt war bei den strukturierten Aufgaben (dem gehaltenen Vokal und der gelesenen Phrase, die von Natur aus eine lautere, gleichmäßigere Stimmgebung hervorrufen) größer; in der Spontansprache hielt der Entfernungseffekt insgesamt zwar weiterhin, doch der spezifische Kontrast 3 m vs. 15 m erreichte keine Signifikanz.

Die Raumgröße war ein sekundärer, moderierender Reiz. Die Raumgröße für sich genommen erzeugte kleinere Veränderungen, verstärkte aber den Entfernungseffekt: Eine signifikante Wechselwirkung Raumgröße x Entfernung zeigte, dass der Anstieg der Lautstärke bei der weiten Entfernung (15 m) im großen Raum am größten war. In der Lesart der Autor:innen ist die Entfernung die verhaltensrelevante Randbedingung, und die Raumgröße ist ein kontextueller “Verstärkungsfaktor”, der diese Randbedingung hoch- oder herunterregelt.

Da sich der Schall nie änderte, wurden diese Stimmanpassungen allein durch das Sehen erzeugt.

Warum das wichtig ist

Diese Studie legt einen sauberen, steuerbaren Hebel für die Stimmarbeit fest: die scheinbare Entfernung einer zuhörenden Person. Eine behandelnde Person kann diese Entfernung in VR hoch- oder herunterregeln, um gestufte Veränderungen in der Stimmprojektion auszulösen, mit der Raumgröße als sekundärem Reiz, um die Anforderung zu verstärken - all das, ohne die Praxis zu verlassen, und all das messbar. Erst die präzise Steuerung, die die Plattform bietet, machte es möglich, eine Variable nach der anderen zu isolieren, was in einem realen Raum nicht durchführbar ist.

Sie ergänzt zudem die breitere Argumentation für ökologisch valides Üben in der Stimm- und Sprechrehabilitation um rigorose, NIH-finanzierte Evidenz: Die Kontexte, in denen eine Person ihre Stimme braucht, lassen sich gut genug nachbilden, um reales Stimmverhalten zu verändern - die Grundlage dafür, in diesen Kontexten zu üben statt in einem reizarmen Raum.

Limitationen

Die Stichprobe war klein (15 Teilnehmende) und nicht geschlechtsausgewogen (12 weiblich, drei männlich), und alle waren stimmgesund - die Ergebnisse sagen also noch nichts über Menschen mit Stimmstörungen aus, wo der klinische Wert läge. Es war eine einzige Sitzung, und es wurden nur objektive akustische Maße erhoben, ohne Daten zu selbstberichteter Stimmanstrengung, Komfort oder wahrgenommener Entfernung, die die SPL-Veränderungen mit dem Erleben verknüpfen würden. Das Konstanthalten des Schalls war für die Isolierung des Sehens unerlässlich, entfernte aber auch die multisensorische und soziale Komplexität realer Kommunikation, und die simulierten Szenen bilden keine lebendigen, reagierenden zuhörenden Personen ab. Die Studie belegt den visuell-räumlichen Mechanismus; ob entfernungsgesteuertes Üben in VR auf den alltäglichen Stimmgebrauch übertragbar ist, bleibt zu prüfen.

Implikationen für die Praxis

Für Logopäd:innen im Stimmbereich, die immersive VR einsetzen oder bewerten: Diese Studie zeigt, dass ein einzelner, quantifizierbarer visueller Parameter - wie weit entfernt die zuhörende Person erscheint - die Stimmintensität zuverlässig skaliert, selbst wenn die Person weiß, dass die Szene simuliert ist, und selbst wenn sich der Schall nie ändert. Das macht die virtuelle Sprecher-Zuhörer-Entfernung zu einem sauberen, steuerbaren Regler für gestufte Übungen zur Stimmprojektion (zum Beispiel den Aufbau von Lautstärke für eine weit entfernte zuhörende Person oder das Einüben einer komfortablen Projektion über verschiedene Entfernungen hinweg) - ohne die Praxis zu verlassen. Die Raumgröße versteht man am besten als sekundären, kontextverstärkenden Reiz und nicht als den wesentlichen Hebel. Die Entfernung skalierte die Stimme über alle drei Aufgabentypen hinweg, mit den größten und am saubersten getrennten Effekten bei den strukturierten Aufgaben (einem gehaltenen Vokal und einer gelesenen Phrase) - ein praktischer Ausgangspunkt für gestufte Übungen, auch wenn die Studie nicht darauf ausgelegt war, Aufgaben zu vergleichen. Die Ergebnisse fügen sich gut in das soziale Modell der Kommunikation ein: Die Anforderungen, die die Stimme formen, liegen in den Kontexten, in denen die Stimme gebraucht wird, und das Üben in diesen Kontexten - anstatt in einem reizarmen Praxisraum - ist es, was die Evidenz stützt. Die Arbeit wurde an stimmgesunden Erwachsenen durchgeführt, sodass die direkte Erprobung bei Menschen mit Stimmunterschieden noch aussteht, bevor Aussagen zur klinischen Wirksamkeit getroffen werden können.

Implikationen für die Forschung

Replikation und Erweiterung sind nötig in: (a) größeren, geschlechtsausgewogenen Stichproben, die für die Analyse individueller Unterschiede gepowert sind; (b) Populationen mit Stimmstörungen (z. B. Presbyphonie, muskuläre Verspannungsdysphonie, hypophone Stimme bei Parkinson), wo der klinische Nutzen läge; (c) mehrsitzigen Protokollen, die das Lernen, die Beibehaltung und den Transfer der entfernungsgesteuerten Stimmskalierung auf reales Sprechen prüfen, da die Generalisierung der zentrale ungedeckte Bedarf ist; (d) Designs, die die SPL-Veränderungen mit perzeptiven und selbstberichteten Ergebnissen (Stimmanstrengung, Komfort, wahrgenommene Entfernung) innerhalb derselben Durchgänge verknüpfen; und (e) Bedingungen, die auditive und soziale Komplexität wieder einführen (Lärm, Nachhall, reagierende lebendige zuhörende Personen), um zu prüfen, wie der isolierte visuelle Effekt in ökologisch reicheren Szenen standhält.

Redaktionelle Anmerkungen von withVR

Anknüpfungspunkte zu Therapy withVR

Die oben genannte Studie ist unabhängige Forschung und enthält keine Aussage über ein bestimmtes Produkt. Die folgenden Anmerkungen sind Kommentare von withVR dazu, wie die Themen dieser Forschung an Funktionen von Therapy withVR anknüpfen. Die Forschungsergebnisse stellen keine Aussagen über Therapy withVR dar.

Avatar-Abstandssteuerung

Diese Studie stellte die Sprecher-Zuhörer-Entfernung als wesentlichen Treiber der Stimmintensität fest - Therapy withVR ermöglicht es, den zuhörenden Avatar näher oder weiter weg zu bewegen, um dieselben gestuften Entfernungsreize für Übungen zur Stimmprojektion zu schaffen.

Raum-Situation mit anpassbaren Abmessungen

Die Studie modellierte einen kleinen (5 x 4 x 4 m) und einen großen (20 x 20 x 20 m) Raum - die Raum-Situation von Therapy withVR ermöglicht die Anpassung von Breite, Länge und Höhe, um den räumlichen Kontext zu reproduzieren, der den Entfernungseffekt moderierte.

Beleuchtungssteuerung

Passen Sie die Gesamtbeleuchtung und die Beleuchtung pro Position an, um die unterschiedlichen, kontrollierten visuellen Szenen zu schaffen, mit denen diese Studie die visuell-räumlichen Einflüsse auf die Stimme isolierte.

Diese Studie zitieren

Wenn Sie diese Studie in Ihrer Arbeit zitieren, sind dies die kanonischen Zitierformate:

APA 7th
Daşdöğen Ü, Hitchcock, J., Ahn, S., Ng, B. B., & Verdolini-Abbott, K. (2026). Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality. Journal of Speech, Language, and Hearing Research. https://doi.org/10.1044/2026_JSLHR-25-00798.
AMA 11th
Daşdöğen Ü, Hitchcock J, Ahn S, Ng BB, Verdolini-Abbott K. Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality. Journal of Speech, Language, and Hearing Research. 2026. doi:10.1044/2026_JSLHR-25-00798.
BibTeX
@article{daden2026,
  author = {Daşdöğen Ü and Hitchcock, J. and Ahn, S. and Ng, B. B. and Verdolini-Abbott, K.},
  title = {Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality},
  journal = {Journal of Speech, Language, and Hearing Research},
  year = {2026},
  doi = {10.1044/2026_JSLHR-25-00798},
  url = {https://withvr.app/de/evidence/studies/dasdogen-2026-distance}
}
RIS
TY  - JOUR
AU  - Daşdöğen Ü
AU  - Hitchcock, J.
AU  - Ahn, S.
AU  - Ng, B. B.
AU  - Verdolini-Abbott, K.
TI  - Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality
JO  - Journal of Speech, Language, and Hearing Research
PY  - 2026
DO  - 10.1044/2026_JSLHR-25-00798
UR  - https://withvr.app/de/evidence/studies/dasdogen-2026-distance
ER  - 

Kennen Sie Forschung, die in diese Evidenzbasis gehört? Wenn eine relevante peer-reviewte Studie hier nicht aufgeführt ist, senden Sie die Quellenangabe an hello@withvr.app. Die Evidenzbasis wird aktuell gehalten, während die Literatur wächst.

Finanzierung & Unabhängigkeit

Diese Studie wurde durch einen Zuschuss der US National Institutes of Health / NIDCD finanziert (R21-DC020494, vergeben an Ümit Daşdöğen und Katherine Verdolini-Abbott als Multiple Principal Investigators). Sie nutzte die Rooms-Situation von Therapy withVR, und der Gründer von withVR, Gareth Walkom, baute die in der Studie verwendeten maßgeschneiderten virtuellen Umgebungen. Die Forschung ist unabhängig von withVR BV - das Unternehmen hat sie weder finanziert noch konzipiert oder verfasst, und die Autor:innen erklärten keine konkurrierenden Interessen. Die vollständige Offenlegung der Autor:innen findet sich in der Publikation.

Zuletzt geprüft: 2026-06-26 Nächste Überprüfung geplant: 2027-06-26 Geprüft von: Gareth Walkom