Diese Seite wurde aus dem Englischen übersetzt. Wenn etwas seltsam klingt, wechseln Sie zur englischen Version. Auf Englisch ansehen.

Engineering- und Nutzerakzeptanz-Studie (Computers & Graphics 2025) zu einem sprachgesteuerten VR-System für Stimm- und Präsentationstraining: Extraktion von Tonhöhe / Klangfarbe / Sprechgeschwindigkeit aus 529 Äußerungen von 15 Studierenden für die Echtzeitreaktion virtueller Charaktere

Bartyzel P et al. · 2025 · Computers & Graphics · Experimentell · n = 15 · Nicht-klinische Studierende für Sprachkorpus zur Stresserkennung · DOI
Sicherheit der Evidenz: Niedrige Sicherheit
Wie dies bewertet wurde

Engineering- / Nutzerakzeptanz-Studie mit einem 15-Personen-Sprachkorpus und 6 erfahrenen Annotator:innen. Peer-reviewed in Computers & Graphics (Elsevier, Sonderteil XRIOS 2024). Der Beitrag der Arbeit ist Systemdesign und Nutzerakzeptanz-Evaluation, nicht klinische Wirksamkeit. Limitationen: keine klinische Studie; der Sprachkorpus ist klein für die Generalisierbarkeit auf klinische Populationen; die extrahierten Sprachparameter sind technische Engineering-Merkmale (Tonhöhe, Klangfarbe, Geschwindigkeit) und nicht klinisch validierte Stimm-Handicap-Maße.

Die Bewertungen verwenden ein vereinfachtes vierstufiges Schema (Hoch, Mittel, Niedrig, Sehr niedrig), angelehnt an die GRADE working group. Mehr darüber erfahren, wie Studien bewertet werden.

Eine Engineering- und Nutzerakzeptanz-Studie, veröffentlicht im Sonderteil XRIOS 2024 von Computers & Graphics. Polnisch-britische Kooperation (AGH Krakau, SWPS Warschau, Polnische Akademie der Wissenschaften, Technische Universität Kielce, University of Cambridge). Das System basiert auf einem Sprachaufnahme-Korpus von 529 Äußerungen während Präsentationen von 15 Studierenden. Extrahierte Sprachparameter: Tonhöhe, Klangfarbe, Sprechgeschwindigkeit. Sechs erfahrene Annotator:innen bewerteten das Stressniveau pro Präsentation. Die Multiparameter-Analyse wählt Merkmale für die Echtzeitanimation virtueller Charaktere aus, die dynamisch auf Sprachveränderungen reagieren. Der Beitrag liegt in Design und Evaluation der Nutzerakzeptanz, nicht in klinischer Wirksamkeit.

Klinische Kernaussage

Eine Engineering- / Nutzerakzeptanz-Studie zu einem sprachgesteuerten VR-System für Stimm- und Präsentationstraining. Der Beitrag liegt in der Design-Methodik (Sprachkorpus, Parameterextraktion, Echtzeit-Animationssteuerung) und nicht in klinischer Evidenz. Für Stimmtherapeut:innen und Forschende veranschaulicht dieser Beitrag eine entstehende Affordanz in VR: virtuelle Charaktere, die DYNAMISCH in Echtzeit auf die Sprachparameter der sprechenden Person reagieren. Nicht als klinische Wirksamkeitszitation geeignet; nützlich als Methodik- und Designreferenz für die nächste Generation von VR-Stimmtrainingssystemen.

Wichtigste Ergebnisse

  • Engineering- und Nutzerakzeptanz-Studie, veröffentlicht im Sonderteil XRIOS 2024 von Computers & Graphics
  • Sprachgesteuertes VR-System: Virtuelle Charaktere reagieren DYNAMISCH in Echtzeit auf die Sprachparameter (Tonhöhe, Klangfarbe, Sprechgeschwindigkeit) der sprechenden Person
  • Sprachaufnahme-Korpus: 529 Äußerungen während Präsentationen von 15 Studierenden
  • Sprachparameter werden mit Methoden der Sprachverarbeitung extrahiert: Tonhöhe, Klangfarbe, Sprechgeschwindigkeit – und anschließend auf die Echtzeit-Animationssteuerung virtueller Charaktere abgebildet
  • Sechs erfahrene Annotator:innen bewerteten das in jeder Präsentation vorhandene Stressniveau – ein Mixed-Methods-Merkmal für stressmodulierte Charakterreaktionen
  • Polnisch-britische internationale Kooperation: AGH University of Science and Technology (Krakau), SWPS University (Warschau), Polnische Akademie der Wissenschaften (Krakau), Technische Universität Kielce, University of Cambridge
  • Veranschaulichte entstehende VR-Affordanz: Virtuelle Charaktere, die DYNAMISCH auf das Verhalten der sprechenden Person reagieren – Bewegung weg von vorab aufgezeichneten Publikumsanimationen hin zu echten responsiven Social-VR-Systemen

Hintergrund

Die meisten VR-Systeme für Stimm- und Präsentationstraining verwenden vorab aufgezeichnete Publikumsanimationen – das virtuelle Publikum reagiert nicht darauf, was die sprechende Person tatsächlich sagt oder wie sie es sagt. Sprachgesteuerte, in Echtzeit reagierende virtuelle Charaktere, die auf Sprachparameter und Stressniveau reagieren, sind eine Designrichtung der nächsten Generation. Bis 2024/2025 reifte die Engineering-Pipeline dafür heran.

Was die Forschenden taten und herausfanden

Ein sprachgesteuertes VR-System wurde auf Basis eines Korpus aus 529 Präsentationsäußerungen von 15 Studierenden aufgebaut. Sprachparameter (Tonhöhe, Klangfarbe, Sprechgeschwindigkeit) wurden mit Methoden der Sprachverarbeitung extrahiert. Sechs erfahrene Annotator:innen bewerteten das Stressniveau. Die Multiparameter-Analyse wählte Merkmale für die Echtzeit-Animationssteuerung virtueller Charaktere aus, die dynamisch auf Sprachveränderungen reagieren. Anschließend folgte eine Nutzerakzeptanz-Evaluation.

Warum das wichtig ist

Für Stimmtherapeut:innen und Logopädie-Forschende veranschaulicht diese Arbeit die Engineering-Trajektorie hin zu responsiven virtuellen Charakteren in VR-Stimmtrainingskontexten. Methodik- und Designreferenz für klinische VR-Systeme der nächsten Generation.

Limitationen

Keine klinische Studie. Kleiner Sprachkorpus. Engineering-orientierte Sprachparameter statt klinisch validierter Stimm-Handicap-Maße.

Implikationen für die Praxis

Für Stimmtherapeut:innen und Logopädie-Forschende veranschaulicht diese Arbeit die Engineering-Trajektorie hin zu VR-Systemen mit virtuellen Charakteren, die DYNAMISCH auf Stimm- und Stressparameter der sprechenden Person reagieren. Dies ist eine bedeutsame Designrichtung für die nächste Generation von VR-Trainingssystemen für Stimme und Präsentation – weg von statischen oder vorab aufgezeichneten virtuellen Publika hin zu responsiven Social-VR-Kontexten. Nicht als klinische Wirksamkeitsevidenz geeignet; einsetzbar als Methodikreferenz für klinisch-technische Kooperation. Für das Produktdesign von Therapy withVR ist die Pipeline von Sprachparametern zur Charakteranimation eine relevante entstehende Affordanz.

Diese Studie zitieren

Wenn Sie diese Studie in Ihrer Arbeit zitieren, sind dies die kanonischen Zitierformate:

APA 7th
Bartyzel, P., Igras-Cybulska, M., Hekiert, D., Majdak, M., Łukawski, G., Bohné, T., & Tadeja, S. (2025). Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. https://doi.org/10.1016/j.cag.2024.104104.
AMA 11th
Bartyzel P, Igras-Cybulska M, Hekiert D, Majdak M, Łukawski G, Bohné T, Tadeja S. Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. 2025. doi:10.1016/j.cag.2024.104104.
BibTeX
@article{bartyzel2025,
  author = {Bartyzel, P. and Igras-Cybulska, M. and Hekiert, D. and Majdak, M. and Łukawski, G. and Bohné, T. and Tadeja, S.},
  title = {Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training},
  journal = {Computers & Graphics},
  year = {2025},
  doi = {10.1016/j.cag.2024.104104},
  url = {https://withvr.app/de/evidence/studies/bartyzel-2025}
}
RIS
TY  - JOUR
AU  - Bartyzel, P.
AU  - Igras-Cybulska, M.
AU  - Hekiert, D.
AU  - Majdak, M.
AU  - Łukawski, G.
AU  - Bohné, T.
AU  - Tadeja, S.
TI  - Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training
JO  - Computers & Graphics
PY  - 2025
DO  - 10.1016/j.cag.2024.104104
UR  - https://withvr.app/de/evidence/studies/bartyzel-2025
ER  - 

Kennen Sie Forschung, die in diese Evidenzbasis gehört? Wenn eine relevante peer-reviewte Studie hier nicht aufgeführt ist, senden Sie die Quellenangabe an hello@withvr.app. Die Evidenzbasis wird aktuell gehalten, während die Literatur wächst.

Finanzierung & Unabhängigkeit

Affiliationen: AGH University Krakau, SWPS University Warschau, Polnische Akademie der Wissenschaften, Technische Universität Kielce, University of Cambridge. Finanzierungsquellen im veröffentlichten Artikel angegeben. Peer-reviewed in Computers & Graphics (Elsevier). Keine Beteiligung von withVR BV.

Zuletzt geprüft: 2026-05-17 Nächste Überprüfung geplant: 2027-05-17 Geprüft von: Gareth Walkom