Cette page a été traduite de l'anglais. Si une phrase semble étrange, passez à la version anglaise. Voir en anglais.
Étude d'ingénierie et de réception utilisateur (Computers & Graphics 2025) d'un système VR contrôlé par la voix pour l'entraînement à la voix et à la prise de parole en public : extraction de la hauteur / du timbre / du débit de parole à partir de 529 énoncés de 15 étudiants pour une réponse en temps réel des personnages virtuels
Comment cela a été évalué
Étude d'ingénierie / réception utilisateur avec un corpus de parole de 15 participants et 6 annotateurs experts. Évaluée par les pairs dans Computers & Graphics (Elsevier, section spéciale XRIOS 2024). La contribution de l'article porte sur la conception du système et l'évaluation de la réception utilisateur, et non sur l'efficacité clinique. Limites : il ne s'agit pas d'un essai clinique ; le corpus de parole est de petite taille pour la généralisation aux populations cliniques ; les paramètres vocaux extraits sont des caractéristiques techniques d'ingénierie (hauteur, timbre, débit) plutôt que des mesures de handicap vocal validées cliniquement.
Les évaluations suivent un schéma simplifié à quatre niveaux (Élevée, Modérée, Faible, Très faible), inspiré du GRADE working group. En savoir plus sur la méthode d'évaluation des études.
Une étude d'ingénierie et de réception utilisateur publiée dans la section spéciale XRIOS 2024 de Computers & Graphics. Collaboration polono-britannique (AGH Krakow, SWPS Varsovie, Académie polonaise des sciences, Université technologique de Kielce, Université de Cambridge). Le système s'appuie sur un corpus d'enregistrements de parole de 529 énoncés produits durant des présentations par 15 étudiants. Paramètres vocaux extraits : hauteur, timbre, débit de parole. Six annotateurs experts ont évalué les niveaux de stress par présentation. L'analyse multi-paramètres sélectionne les caractéristiques pour l'animation en temps réel de personnages virtuels qui répondent dynamiquement aux variations de la parole. La contribution porte sur le design et l'évaluation de la réception utilisateur plutôt que sur l'efficacité clinique.
Une étude d'ingénierie / de réception utilisateur d'un système VR contrôlé par la voix pour l'entraînement à la voix et à la prise de parole en public. La contribution est méthodologique (corpus de parole, extraction de paramètres, contrôle d'animation en temps réel) plutôt qu'une preuve clinique. Pour les cliniciens de la voix et les chercheurs, cet article illustre une affordance émergente en VR : des personnages virtuels qui répondent DYNAMIQUEMENT en temps réel aux paramètres vocaux du locuteur. Inapproprié comme citation d'efficacité clinique ; utile comme référence méthodologique et de design pour la prochaine génération de systèmes VR d'entraînement vocal.
Principaux résultats
- Étude d'ingénierie et de réception utilisateur publiée dans la section spéciale XRIOS 2024 de Computers & Graphics
- Système VR contrôlé par la voix : les personnages virtuels répondent DYNAMIQUEMENT en temps réel aux paramètres vocaux du locuteur (hauteur, timbre, débit de parole)
- Corpus d'enregistrements de parole : 529 énoncés produits lors de présentations par 15 étudiants
- Paramètres vocaux extraits par des méthodes de traitement de la parole : hauteur, timbre, débit de parole - puis mis en correspondance avec le contrôle d'animation en temps réel de personnages virtuels
- Six annotateurs experts ont évalué les niveaux de stress présents dans chaque présentation - caractéristique mixte pour une réponse de personnage modulée par le stress
- Collaboration internationale polono-britannique : AGH University of Science and Technology (Krakow), SWPS University (Varsovie), Académie polonaise des sciences (Krakow), Université technologique de Kielce, Université de Cambridge
- Affordance VR émergente illustrée : des personnages virtuels qui répondent DYNAMIQUEMENT au comportement du locuteur - dépassement des animations d'audience préenregistrées vers de véritables systèmes sociaux VR réactifs
Contexte
La plupart des systèmes VR d’entraînement à la voix et à la prise de parole en public utilisent des animations d’audience préenregistrées - l’audience virtuelle ne répond pas à ce que dit réellement le locuteur ni à la manière dont il le dit. Des personnages virtuels contrôlés par la voix en temps réel qui répondent aux paramètres vocaux et aux niveaux de stress du locuteur constituent une direction de design de prochaine génération. En 2024-2025, le pipeline d’ingénierie pour cela arrivait à maturité.
Ce qu’ils ont fait et trouvé
Un système VR contrôlé par la voix a été construit sur un corpus de 529 énoncés de présentation issus de 15 étudiants. Les paramètres vocaux (hauteur, timbre, débit de parole) ont été extraits à l’aide de méthodes de traitement de la parole. Six annotateurs experts ont évalué les niveaux de stress. L’analyse multi-paramètres a sélectionné les caractéristiques pour le contrôle en temps réel de l’animation de personnages virtuels qui répondent dynamiquement aux variations de parole. Une évaluation de la réception utilisateur a suivi.
Pourquoi c’est important
Pour les cliniciens de la voix et les chercheurs en orthophonie, cet article illustre la trajectoire d’ingénierie vers des personnages virtuels réactifs dans les contextes d’entraînement vocal en VR. Référence méthodologique et de design pour les systèmes cliniques VR de prochaine génération.
Limites
Il ne s’agit pas d’un essai clinique. Petit corpus de parole. Paramètres vocaux d’ingénierie plutôt que mesures de handicap vocal validées cliniquement.
Implications pour la pratique
Pour les cliniciens de la voix et les chercheurs en orthophonie, cet article illustre la trajectoire d'ingénierie vers des systèmes VR comprenant des personnages virtuels qui répondent DYNAMIQUEMENT aux paramètres vocaux et de stress du locuteur. Il s'agit d'une direction de design significative pour la prochaine génération de systèmes VR d'entraînement à la voix et à la prise de parole en public - dépassant les audiences virtuelles statiques ou préenregistrées vers des contextes sociaux VR réactifs. Inapproprié comme preuve d'efficacité clinique ; à utiliser comme référence méthodologique pour la collaboration clinico-ingénierie. Pour la conception du produit Therapy withVR, le pipeline allant des paramètres de parole à l'animation des personnages est une affordance émergente pertinente.
Citer cette étude
Si vous référencez cette étude dans votre travail, voici les formats de citation canoniques :
@article{bartyzel2025,
author = {Bartyzel, P. and Igras-Cybulska, M. and Hekiert, D. and Majdak, M. and Łukawski, G. and Bohné, T. and Tadeja, S.},
title = {Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training},
journal = {Computers & Graphics},
year = {2025},
doi = {10.1016/j.cag.2024.104104},
url = {https://withvr.app/fr/evidence/studies/bartyzel-2025}
}TY - JOUR
AU - Bartyzel, P.
AU - Igras-Cybulska, M.
AU - Hekiert, D.
AU - Majdak, M.
AU - Łukawski, G.
AU - Bohné, T.
AU - Tadeja, S.
TI - Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training
JO - Computers & Graphics
PY - 2025
DO - 10.1016/j.cag.2024.104104
UR - https://withvr.app/fr/evidence/studies/bartyzel-2025
ER - Vous connaissez des travaux qui auraient leur place dans cette base ? Si une étude pertinente évaluée par les pairs n'y figure pas, envoyez la référence à hello@withvr.app. La base est tenue à jour au fil de la littérature.
Financement et indépendance
Affiliations : AGH University Krakow, SWPS University Varsovie, Académie polonaise des sciences, Université technologique de Kielce, Université de Cambridge. Sources de financement rapportées dans l'article publié. Évalué par les pairs dans Computers & Graphics (Elsevier). Aucune implication de withVR BV.