Was hat Bartyzel et al. (2025) herausgefunden?

Engineering- und Nutzerakzeptanz-Studie, veröffentlicht im Sonderteil XRIOS 2024 von Computers & Graphics Sprachgesteuertes VR-System: Virtuelle Charaktere reagieren DYNAMISCH in Echtzeit auf die Sprachparameter (Tonhöhe, Klangfarbe, Sprechgeschwindigkeit) der sprechenden Person Sprachaufnahme-Korpus: 529 Äußerungen während Präsentationen von 15 Studierenden Sprachparameter werden mit Methoden der Sprachverarbeitung extrahiert: Tonhöhe, Klangfarbe, Sprechgeschwindigkeit – und anschließend auf die Echtzeit-Animationssteuerung virtueller Charaktere abgebildet Sechs erfahrene Annotator:innen bewerteten das in jeder Präsentation vorhandene Stressniveau – ein Mixed-Methods-Merkmal für stressmodulierte Charakterreaktionen Polnisch-britische internationale Kooperation: AGH University of Science and Technology (Krakau), SWPS University (Warschau), Polnische Akademie der Wissenschaften (Krakau), Technische Universität Kielce, University of Cambridge Veranschaulichte entstehende VR-Affordanz: Virtuelle Charaktere, die DYNAMISCH auf das Verhalten der sprechenden Person reagieren – Bewegung weg von vorab aufgezeichneten Publikumsanimationen hin zu echten responsiven Social-VR-Systemen

Wer hat an dieser Studie teilgenommen?

Diese Studie umfasste 15 Teilnehmende: Nicht-klinische Studierende für Sprachkorpus zur Stresserkennung

Diese Seite wurde aus dem Englischen übersetzt. Wenn etwas seltsam klingt, wechseln Sie zur englischen Version. Auf Englisch ansehen.

Sprachgesteuertes VR-System für Stimm- und Präsentationstraining, hinsichtlich Nutzerakzeptanz mit 15 Studierenden evaluiert

Bartyzel P et al. · 2025 · Computers & Graphics · Experimentell · n = 15 · Nicht-klinische Studierende für Sprachkorpus zur Stresserkennung · DOI

Sicherheit der Evidenz: Niedrige Sicherheit

Wie dies bewertet wurde

Engineering- / Nutzerakzeptanz-Studie mit einem 15-Personen-Sprachkorpus und 6 erfahrenen Annotator:innen. Peer-reviewed in Computers & Graphics (Elsevier, Sonderteil XRIOS 2024). Der Beitrag der Arbeit ist Systemdesign und Nutzerakzeptanz-Evaluation, nicht klinische Wirksamkeit. Limitationen: keine klinische Studie; der Sprachkorpus ist klein für die Generalisierbarkeit auf klinische Populationen; die extrahierten Sprachparameter sind technische Engineering-Merkmale (Tonhöhe, Klangfarbe, Geschwindigkeit) und nicht klinisch validierte Stimm-Handicap-Maße.

Die Bewertungen verwenden ein vereinfachtes vierstufiges Schema (Hoch, Mittel, Niedrig, Sehr niedrig), angelehnt an die GRADE working group. Mehr darüber erfahren, wie Studien bewertet werden.

Eine Engineering- und Nutzerakzeptanz-Studie, veröffentlicht im Sonderteil XRIOS 2024 von Computers & Graphics. Polnisch-britische Kooperation (AGH Krakau, SWPS Warschau, Polnische Akademie der Wissenschaften, Technische Universität Kielce, University of Cambridge). Das System basiert auf einem Sprachaufnahme-Korpus von 529 Äußerungen während Präsentationen von 15 Studierenden. Extrahierte Sprachparameter: Tonhöhe, Klangfarbe, Sprechgeschwindigkeit. Sechs erfahrene Annotator:innen bewerteten das Stressniveau pro Präsentation. Die Multiparameter-Analyse wählt Merkmale für die Echtzeitanimation virtueller Charaktere aus, die dynamisch auf Sprachveränderungen reagieren. Der Beitrag liegt in Design und Evaluation der Nutzerakzeptanz, nicht in klinischer Wirksamkeit.

Klinische Kernaussage

Eine Engineering- / Nutzerakzeptanz-Studie zu einem sprachgesteuerten VR-System für Stimm- und Präsentationstraining. Der Beitrag liegt in der Design-Methodik (Sprachkorpus, Parameterextraktion, Echtzeit-Animationssteuerung) und nicht in klinischer Evidenz. Für Stimmtherapeut:innen und Forschende veranschaulicht dieser Beitrag eine entstehende Affordanz in VR: virtuelle Charaktere, die DYNAMISCH in Echtzeit auf die Sprachparameter der sprechenden Person reagieren. Nicht als klinische Wirksamkeitszitation geeignet; nützlich als Methodik- und Designreferenz für die nächste Generation von VR-Stimmtrainingssystemen.

Wichtigste Ergebnisse

Engineering- und Nutzerakzeptanz-Studie, veröffentlicht im Sonderteil XRIOS 2024 von Computers & Graphics
Sprachgesteuertes VR-System: Virtuelle Charaktere reagieren DYNAMISCH in Echtzeit auf die Sprachparameter (Tonhöhe, Klangfarbe, Sprechgeschwindigkeit) der sprechenden Person
Sprachaufnahme-Korpus: 529 Äußerungen während Präsentationen von 15 Studierenden
Sprachparameter werden mit Methoden der Sprachverarbeitung extrahiert: Tonhöhe, Klangfarbe, Sprechgeschwindigkeit – und anschließend auf die Echtzeit-Animationssteuerung virtueller Charaktere abgebildet
Sechs erfahrene Annotator:innen bewerteten das in jeder Präsentation vorhandene Stressniveau – ein Mixed-Methods-Merkmal für stressmodulierte Charakterreaktionen
Polnisch-britische internationale Kooperation: AGH University of Science and Technology (Krakau), SWPS University (Warschau), Polnische Akademie der Wissenschaften (Krakau), Technische Universität Kielce, University of Cambridge
Veranschaulichte entstehende VR-Affordanz: Virtuelle Charaktere, die DYNAMISCH auf das Verhalten der sprechenden Person reagieren – Bewegung weg von vorab aufgezeichneten Publikumsanimationen hin zu echten responsiven Social-VR-Systemen

Hintergrund

Die meisten VR-Systeme für Stimm- und Präsentationstraining verwenden vorab aufgezeichnete Publikumsanimationen – das virtuelle Publikum reagiert nicht darauf, was die sprechende Person tatsächlich sagt oder wie sie es sagt. Sprachgesteuerte, in Echtzeit reagierende virtuelle Charaktere, die auf Sprachparameter und Stressniveau reagieren, sind eine Designrichtung der nächsten Generation. Bis 2024/2025 reifte die Engineering-Pipeline dafür heran.

Was die Forschenden taten und herausfanden

Ein sprachgesteuertes VR-System wurde auf Basis eines Korpus aus 529 Präsentationsäußerungen von 15 Studierenden aufgebaut. Sprachparameter (Tonhöhe, Klangfarbe, Sprechgeschwindigkeit) wurden mit Methoden der Sprachverarbeitung extrahiert. Sechs erfahrene Annotator:innen bewerteten das Stressniveau. Die Multiparameter-Analyse wählte Merkmale für die Echtzeit-Animationssteuerung virtueller Charaktere aus, die dynamisch auf Sprachveränderungen reagieren. Anschließend folgte eine Nutzerakzeptanz-Evaluation.

Warum das wichtig ist

Für Stimmtherapeut:innen und Logopädie-Forschende veranschaulicht diese Arbeit die Engineering-Trajektorie hin zu responsiven virtuellen Charakteren in VR-Stimmtrainingskontexten. Methodik- und Designreferenz für klinische VR-Systeme der nächsten Generation.

Limitationen

Keine klinische Studie. Kleiner Sprachkorpus. Engineering-orientierte Sprachparameter statt klinisch validierter Stimm-Handicap-Maße.

Implikationen für die Praxis

Für Stimmtherapeut:innen und Logopädie-Forschende veranschaulicht diese Arbeit die Engineering-Trajektorie hin zu VR-Systemen mit virtuellen Charakteren, die DYNAMISCH auf Stimm- und Stressparameter der sprechenden Person reagieren. Dies ist eine bedeutsame Designrichtung für die nächste Generation von VR-Trainingssystemen für Stimme und Präsentation – weg von statischen oder vorab aufgezeichneten virtuellen Publika hin zu responsiven Social-VR-Kontexten. Nicht als klinische Wirksamkeitsevidenz geeignet; einsetzbar als Methodikreferenz für klinisch-technische Kooperation. Für das Produktdesign von Therapy withVR ist die Pipeline von Sprachparametern zur Charakteranimation eine relevante entstehende Affordanz.

Diese Studie zitieren

Wenn Sie diese Studie in Ihrer Arbeit zitieren, sind dies die kanonischen Zitierformate:

APA 7th

Bartyzel, P., Igras-Cybulska, M., Hekiert, D., Majdak, M., Łukawski, G., Bohné, T., & Tadeja, S. (2025). Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. https://doi.org/10.1016/j.cag.2024.104104.

AMA 11th

Bartyzel P, Igras-Cybulska M, Hekiert D, Majdak M, Łukawski G, Bohné T, Tadeja S. Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. 2025. doi:10.1016/j.cag.2024.104104.

BibTeX

@article{bartyzel2025,
  author = {Bartyzel, P. and Igras-Cybulska, M. and Hekiert, D. and Majdak, M. and Łukawski, G. and Bohné, T. and Tadeja, S.},
  title = {Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training},
  journal = {Computers & Graphics},
  year = {2025},
  doi = {10.1016/j.cag.2024.104104},
  url = {https://withvr.app/de/evidence/studies/bartyzel-2025}
}

RIS

TY  - JOUR
AU  - Bartyzel, P.
AU  - Igras-Cybulska, M.
AU  - Hekiert, D.
AU  - Majdak, M.
AU  - Łukawski, G.
AU  - Bohné, T.
AU  - Tadeja, S.
TI  - Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training
JO  - Computers & Graphics
PY  - 2025
DO  - 10.1016/j.cag.2024.104104
UR  - https://withvr.app/de/evidence/studies/bartyzel-2025
ER  -

Kennen Sie Forschung, die in diese Evidenzbasis gehört? Wenn eine relevante peer-reviewte Studie hier nicht aufgeführt ist, senden Sie die Quellenangabe an hello@withvr.app. Die Evidenzbasis wird aktuell gehalten, während die Literatur wächst.

Finanzierung & Unabhängigkeit

Affiliationen: AGH University Krakau, SWPS University Warschau, Polnische Akademie der Wissenschaften, Technische Universität Kielce, University of Cambridge. Finanzierungsquellen im veröffentlichten Artikel angegeben. Peer-reviewed in Computers & Graphics (Elsevier). Keine Beteiligung von withVR BV.

Zuletzt geprüft: 2026-05-17 Nächste Überprüfung geplant: 2027-05-17 Geprüft von: Gareth Walkom

Sprachgesteuertes VR-System für Stimm- und Präsentationstraining, hinsichtlich Nutzerakzeptanz mit 15 Studierenden evaluiert

Wichtigste Ergebnisse

Hintergrund

Was die Forschenden taten und herausfanden

Warum das wichtig ist

Limitationen

Implikationen für die Praxis

Verwandte Studien

Externer Aufmerksamkeitsfokus in VR fördert flexiblere Sprechbewegungen bei stotternden Erwachsenen

Within-Subjects-Studie (n=31): auditive, visuelle und audiovisuelle VR-Raumhinweise verändern Stimmlautstärke, -anstrengung und -ausgabe

Virtuelle Raumgröße und Zuhörerentfernung beeinflussen den Stimmgebrauch

Siebenjährige Fallstudie zur Mit-Gestaltung einer VR-Küche für die Logopädie und das altersgerechte Wohnen

VR-basierte Meditation reduzierte Angst vor der Stimmtherapie in einer kleinen explorativen RCT, mit niedrigerer Abbruchquote im VR-Arm

VR-basiertes Sprechtraining erhöht die Kommunikationsbereitschaft im geschlechtsangleichenden Stimmtraining

Diese Studie zitieren

Finanzierung & Unabhängigkeit