« Est-ce suffisamment réel pour avoir de l’importance ? » est une question raisonnable à poser à tout environnement virtuel utilisé pour entraîner la communication. Si un café virtuel n’évoque pas les réactions qu’évoque un vrai café, alors l’entraînement dans le café virtuel a peu de chances de transférer. S’il les évoque, cela ouvre un type d’espace d’entraînement qu’il est par ailleurs difficile à mettre en place.
Au cours de la dernière décennie, un corpus restreint mais croissant de recherches évaluées par les pairs a tenté de répondre à cette question. Pas dans l’abstrait - mais avec des mesures de l’anxiété, du rythme cardiaque, de l’acoustique vocale et d’autres comportements de parole entre des conditions réelles et virtuelles appariées. Cet article rassemble ce que cinq de ces études nous disent et ce que les preuves suggèrent pour la pratique au quotidien.
La question
La validité écologique est la mesure dans laquelle une situation de recherche produit les comportements et réponses qui se produiraient dans la situation réelle qu’elle est censée représenter. Un café virtuel qui paraît plausible mais ne déclenche aucune anxiété possède une faible validité écologique pour l’étude de l’anxiété de parole. Un café virtuel qui déclenche le même type de réactions qu’un vrai café possède une haute validité écologique.
La validité n’est pas une propriété unique d’un environnement VR. Elle dépend de ce que vous voulez étudier ou pratiquer. Un dispositif VR peut être écologiquement valide pour la prise de parole adulte en public et non pour la participation en classe d’un enfant, ou valide pour l’anxiété de parole et non pour la production vocale, ou valide pour certaines personnes et non pour d’autres.
Ce que montrent cinq études
Les cinq études en un coup d'œil
Preuves de validité écologique des environnements VR de prise de parole
Brundage & Hancock - les publics virtuels et réels produisent une parole quasi identique
La mesure principale de parole corrèle à r = 0,99 entre les conditions virtuelle et réelle. Les évaluations d'appréhension communicative et de confiance étaient étroitement comparables.
Bettahi et al. - les publics virtuels déclenchent une vraie anxiété et de vrais changements vocaux
L'anxiété d'anticipation (SUDS), le rythme cardiaque et les mesures vocales (F0, variabilité de F0) étaient comparables entre les conditions de public réel et virtuel. Une présence rapportée plus élevée = des réponses plus proches.
Dasdogen & Hitchcock - la distance virtuelle seule modifie le comportement vocal
Les indices visuels de distance ont significativement affecté l'intensité vocale et la hauteur, même à acoustique constante. Les chanteuses formées s'ajustaient plus systématiquement que les locutrices non formées.
Walkom - prototype précoce, pilote honnête
L'anxiété auto-déclarée a diminué au fil des séances ; une activation physiologique est apparue lors de l'exposition ; les observateurs ont rapporté des changements de schémas de parole dès la séance 2. Faisabilité, pas effet.
Kumar, Cecil & Tetnowski - faisabilité de la pratique VR à domicile
La fréquence du bégaiement est passée de 18,67 % à 9,71 % des syllabes en une semaine ; le rythme cardiaque a également baissé. Pas de condition de comparaison - preuve de faisabilité, pas d'effet causal.
Chaque étude est résumée ci-dessous. Les tailles d'échantillon sont petites ; la convergence entre plusieurs types de mesures importe plus que toute conclusion isolée.
Brundage et Hancock, 2015 : les publics virtuels et réels produisent des réponses de bégaiement quasi identiques
Brundage et Hancock (2015) ont fait parler dix adultes qui bégaient dans une condition de public réel et une condition de public virtuel. La mesure principale de parole a montré une corrélation quasi parfaite entre les conditions virtuelle et réelle (r = 0,99). Les évaluations d’appréhension communicative et de confiance du locuteur étaient étroitement comparables d’une condition à l’autre.
Cette étude est souvent citée comme la démonstration fondatrice que les publics virtuels sont écologiquement valides pour étudier le bégaiement sous pression d’un public. L’échantillon est petit, mais la corrélation est forte et le design appariait individuellement les participants entre les deux conditions.
Bettahi et collègues, 2026 : les publics virtuels déclenchent une vraie anxiété et de vrais changements vocaux
Bettahi et al. (2026) ont étendu la question de la validation à la voix et à la physiologie. Soixante étudiants universitaires se sont exprimés devant un public réel, un public virtuel et une salle virtuelle vide. Le public virtuel a produit une anxiété d’anticipation (mesurée par SUDS) et des augmentations de rythme cardiaque comparables à celles du public réel. Les mesures vocales (fréquence fondamentale et sa variabilité) étaient largement équivalentes entre les conditions de public réel et virtuel.
Une conclusion notable : les participants qui rapportaient des sentiments de présence plus forts en VR montraient des réponses les plus proches de leurs réponses en public réel. La présence semble être l’une des variables qui détermine si un environnement donné est écologiquement valide pour une personne donnée.
Dasdogen et Hitchcock, 2026 : la distance virtuelle seule modifie l’usage de la voix
Dasdogen et Hitchcock (2026) se sont penchés sur une question différente : si les propriétés visuelles de l’environnement virtuel (taille de la pièce, distance locuteur-auditeur) modifient le comportement vocal même lorsque l’environnement acoustique est maintenu constant. À l’aide de la situation Rooms de Therapy withVR, ils ont constaté que les indices de distance affectaient significativement l’intensité vocale et la hauteur. Les chanteuses formées ajustaient leur voix plus systématiquement que les locutrices non formées.
C’est une étude plus petite (huit femmes adultes), mais conceptuellement importante. Elle montre que l’environnement virtuel visuel peut piloter à lui seul le comportement vocal - la voix répond au contexte de parole perçu, et non uniquement à l’acoustique physique.
Walkom, 2016 : prototype précoce, pilote honnête
Le premier pilote de ce groupe a testé un outil VR sur mesure de prise de parole en public avec six adultes qui bégaient. L’anxiété auto-déclarée a diminué au fil des séances, une activation physiologique est apparue lors de l’exposition, et les observateurs ont rapporté des changements visibles de schémas de parole dès la séance 2. Six participants ne constituent pas une preuve d’effet - mais le pilote a soutenu la faisabilité et a soulevé des questions utiles pour la suite des travaux.
Kumar et collègues, 2024 : faisabilité de la pratique VR à domicile
Kumar, Cecil et Tetnowski (2024) ont franchi l’étape suivante en sortant la VR du laboratoire. Cinq adolescents et jeunes adultes qui bégaient ont utilisé des casques VR grand public à domicile pendant une semaine, avec des scénarios de prise de parole gradués. La fréquence du bégaiement est passée de 18,67 % à 9,71 % des syllabes, et le rythme cardiaque a également baissé. Encore une fois, cinq participants sans condition de comparaison ne constituent pas une preuve d’effet, mais l’étude démontre que les programmes VR à domicile sont faisables et méritent d’être testés à plus grande échelle.
Un aperçu façon forest plot de la convergence
Forest plot des statistiques de convergence des trois études en comparaison directe
À quel point les réponses VR suivent leurs équivalents en monde réel, selon la corrélation et l'effet rapportés
Les trois études en comparaison directe convergent : Brundage montre une correspondance quasi parfaite des rangs entre publics VR et réels pour le bégaiement et l'appréhension. Bettahi montre des effets de condition faibles à modérés (c.-à-d. les conditions réelle et VR sont similaires) sur la plupart des mesures vocales. Daşdöğen montre que les indices visuels seuls modifient significativement la production vocale même à acoustique constante. Walkom 2016 (n=6, pilote mixte) et Kumar 2024 (n=5, faisabilité à domicile) ne sont pas tracés ici car ils ne testent pas directement la correspondance public virtuel-vs-réel.
Sources : Brundage & Hancock 2015 (American Journal of Speech-Language Pathology, DOI) ; Bettahi et al. 2026 (Frontiers in Virtual Reality) ; Daşdöğen & Hitchcock 2026 (Journal of Voice). Un η² partiel plus faible chez Bettahi signifie que les conditions VR et réelle ont produit des réponses plus similaires ; pour la mesure des disfluences, l'effet de la condition était non significatif après correction de Bonferroni (c.-à-d. performance comparable entre conditions). Les valeurs F significatives de Daşdöğen pour la distance de l'auditeur montrent que les indices visuels de distance seuls modifient de manière fiable l'intensité vocale et la hauteur. Note : les comptes de fréquence façon %SS sont rapportés ici tels que les études originales les ont mesurés ; le domaine s'oriente de plus en plus vers la confiance auto-évaluée, la volonté de communiquer et les mesures orientées participation.
Ce que les preuves suggèrent
À travers ces cinq études, et l’Evidence Hub plus large dans lequel elles s’inscrivent, plusieurs schémas émergent.
Des publics virtuels bien conçus produisent des réponses qui ressemblent aux réponses face à un public réel. C’est ce qu’ont montré à la fois Brundage et Hancock et Bettahi et collègues, en utilisant différentes mesures de résultats (rythme cardiaque, voix, anxiété et observation comportementale). La convergence entre les mesures est plus convaincante que toute conclusion isolée.
La présence compte, et elle varie d’une personne à l’autre. La présence est le sentiment subjectif d’être là à l’intérieur d’un environnement virtuel. Une présence plus élevée est associée à des réponses plus proches des équivalents du monde réel. Cela suggère que la validité écologique est en partie une propriété de la personne qui utilise l’environnement, pas seulement de l’environnement lui-même.
Le contexte visuel seul peut façonner le comportement vocal et communicatif. L’étude Dasdogen et Hitchcock montre que les gens ajustent leur voix en fonction du contexte virtuel perçu, même lorsque l’acoustique est maintenue constante. Cela importe pour le travail vocal et pour toute question relative à la manière dont les locuteurs calibrent leur production en fonction des publics.
La base de preuves reste limitée. Les tailles d’échantillon sont majoritairement inférieures à vingt. Les populations sont souvent non cliniques ou étroites. Le transfert à long terme vers les situations quotidiennes est largement non testé. Ce sont de réelles limites qui devraient façonner la confiance avec laquelle toute conclusion est appliquée.
Ce que cela signifie pour la pratique au quotidien
Quelques conclusions provisoires pour les professionnels de l’orthophonie qui envisagent l’entraînement VR dans le cadre de leur travail :
- L’entraînement à la prise de parole basé sur la VR semble engager d’authentiques réponses communicatives, pas seulement performatives. Une séance face à un public virtuel se rapproche davantage d’un public d’entraînement que d’un jeu de rôle.
- Les différences individuelles de présence méritent attention. Si une personne ne se sent pas immergée, l’environnement n’effectue probablement pas le travail écologique attendu. Vérifier la présence est peu coûteux et informatif.
- La généralisation n’est pas garantie. Ce qui se passe dans un café virtuel se passe dans un café virtuel. Que cela se reporte ou non dans un vrai café dépend de facteurs que les études ci-dessus n’éclairent pas encore complètement. Intégrer la généralisation dans le plan (pratiquer la même compétence dans plusieurs situations, vérifier l’expérience dans le monde réel) est une option par défaut sensée.
- La VR ne remplace pas les autres formes de pratique. Elle ajoute un contexte d’entraînement contrôlé et gradué aux options disponibles. Les preuves la soutiennent comme un outil dans une boîte, pas comme un traitement autonome.
Notes éditoriales de withVR
Les thèmes de cette recherche ont façonné la conception de Therapy withVR. La situation Auditorium existe en raison de travaux comme ceux de Brundage et Hancock et Bettahi. La situation Room existe en raison d’études comme celle de Dasdogen et Hitchcock. La fonctionnalité Goal existe pour soutenir la question de la généralisation - en permettant aux personnes d’évaluer leur propre confiance avant et après une séance, plutôt que de s’appuyer sur des cibles de production.
Rien de tout cela ne signifie que les conclusions de recherche sur d’autres systèmes VR transfèrent directement à Therapy withVR. Elles ne le font pas. Ce que Therapy withVR essaie de faire, c’est offrir un environnement d’entraînement cohérent avec les thèmes que les preuves soulèvent : situations graduées, contrôle clinicien en temps réel, confiance auto-évaluée dans le temps et environnements dans lesquels les personnes rapportent se sentir présentes.
Pour aller plus loin
- Brundage et Hancock (2015) - L’étude fondatrice virtuel-vs-réel sur le bégaiement
- Bettahi et al. (2026) - Validation multi-mesures entre publics réels et virtuels
- Dasdogen et Hitchcock (2026) - Indices visuels de distance et comportement vocal
- Recherches sur Therapy withVR - Études qui ont utilisé directement le logiciel
- Ce que vingt ans de recherche VR sur l’anxiété sociale signifient pour la pratique de l’orthophonie - Base de preuves adjacente issue de la littérature des ECR sur l’anxiété sociale
- Glossaire de l’Evidence Hub - Termes clés utilisés dans les résumés de recherche
- Pour aller plus loin - Ouvrages et communautés qui façonnent la pratique actuelle