« Est-ce suffisamment réel pour avoir de l’importance ? » est une question raisonnable à poser à tout environnement virtuel utilisé pour entraîner la communication. Si un café virtuel n’évoque pas les réactions qu’évoque un vrai café, alors l’entraînement dans le café virtuel a peu de chances de transférer. S’il les évoque, cela ouvre un type d’espace d’entraînement qu’il est par ailleurs difficile à mettre en place.

Au cours de la dernière décennie, un corpus restreint mais croissant de recherches évaluées par les pairs a tenté de répondre à cette question. Pas dans l’abstrait - mais avec des mesures de l’anxiété, du rythme cardiaque, de l’acoustique vocale et d’autres comportements de parole entre des conditions réelles et virtuelles appariées. Cet article rassemble ce que cinq de ces études nous disent et ce que les preuves suggèrent pour la pratique au quotidien.

La question

La validité écologique est la mesure dans laquelle une situation de recherche produit les comportements et réponses qui se produiraient dans la situation réelle qu’elle est censée représenter. Un café virtuel qui paraît plausible mais ne déclenche aucune anxiété possède une faible validité écologique pour l’étude de l’anxiété de parole. Un café virtuel qui déclenche le même type de réactions qu’un vrai café possède une haute validité écologique.

La validité n’est pas une propriété unique d’un environnement VR. Elle dépend de ce que vous voulez étudier ou pratiquer. Un dispositif VR peut être écologiquement valide pour la prise de parole adulte en public et non pour la participation en classe d’un enfant, ou valide pour l’anxiété de parole et non pour la production vocale, ou valide pour certaines personnes et non pour d’autres.

Ce que montrent cinq études

Les cinq études en un coup d'œil

Preuves de validité écologique des environnements VR de prise de parole

  1. 2015n = 10 · intra-sujets

    Brundage & Hancock - les publics virtuels et réels produisent une parole quasi identique

    La mesure principale de parole corrèle à r = 0,99 entre les conditions virtuelle et réelle. Les évaluations d'appréhension communicative et de confiance étaient étroitement comparables.

  2. 2026n = 60 · 3 conditions

    Bettahi et al. - les publics virtuels déclenchent une vraie anxiété et de vrais changements vocaux

    L'anxiété d'anticipation (SUDS), le rythme cardiaque et les mesures vocales (F0, variabilité de F0) étaient comparables entre les conditions de public réel et virtuel. Une présence rapportée plus élevée = des réponses plus proches.

  3. 2026n = 8 · intra-sujets

    Dasdogen & Hitchcock - la distance virtuelle seule modifie le comportement vocal

    Les indices visuels de distance ont significativement affecté l'intensité vocale et la hauteur, même à acoustique constante. Les chanteuses formées s'ajustaient plus systématiquement que les locutrices non formées.

  4. 2016n = 6 · pilote

    Walkom - prototype précoce, pilote honnête

    L'anxiété auto-déclarée a diminué au fil des séances ; une activation physiologique est apparue lors de l'exposition ; les observateurs ont rapporté des changements de schémas de parole dès la séance 2. Faisabilité, pas effet.

  5. 2024n = 5 · faisabilité

    Kumar, Cecil & Tetnowski - faisabilité de la pratique VR à domicile

    La fréquence du bégaiement est passée de 18,67 % à 9,71 % des syllabes en une semaine ; le rythme cardiaque a également baissé. Pas de condition de comparaison - preuve de faisabilité, pas d'effet causal.

Chaque étude est résumée ci-dessous. Les tailles d'échantillon sont petites ; la convergence entre plusieurs types de mesures importe plus que toute conclusion isolée.

Brundage et Hancock, 2015 : les publics virtuels et réels produisent des réponses de bégaiement quasi identiques

Brundage et Hancock (2015) ont fait parler dix adultes qui bégaient dans une condition de public réel et une condition de public virtuel. La mesure principale de parole a montré une corrélation quasi parfaite entre les conditions virtuelle et réelle (r = 0,99). Les évaluations d’appréhension communicative et de confiance du locuteur étaient étroitement comparables d’une condition à l’autre.

Cette étude est souvent citée comme la démonstration fondatrice que les publics virtuels sont écologiquement valides pour étudier le bégaiement sous pression d’un public. L’échantillon est petit, mais la corrélation est forte et le design appariait individuellement les participants entre les deux conditions.

Bettahi et collègues, 2026 : les publics virtuels déclenchent une vraie anxiété et de vrais changements vocaux

Bettahi et al. (2026) ont étendu la question de la validation à la voix et à la physiologie. Soixante étudiants universitaires se sont exprimés devant un public réel, un public virtuel et une salle virtuelle vide. Le public virtuel a produit une anxiété d’anticipation (mesurée par SUDS) et des augmentations de rythme cardiaque comparables à celles du public réel. Les mesures vocales (fréquence fondamentale et sa variabilité) étaient largement équivalentes entre les conditions de public réel et virtuel.

Une conclusion notable : les participants qui rapportaient des sentiments de présence plus forts en VR montraient des réponses les plus proches de leurs réponses en public réel. La présence semble être l’une des variables qui détermine si un environnement donné est écologiquement valide pour une personne donnée.

Dasdogen et Hitchcock, 2026 : la distance virtuelle seule modifie l’usage de la voix

Dasdogen et Hitchcock (2026) se sont penchés sur une question différente : si les propriétés visuelles de l’environnement virtuel (taille de la pièce, distance locuteur-auditeur) modifient le comportement vocal même lorsque l’environnement acoustique est maintenu constant. À l’aide de la situation Rooms de Therapy withVR, ils ont constaté que les indices de distance affectaient significativement l’intensité vocale et la hauteur. Les chanteuses formées ajustaient leur voix plus systématiquement que les locutrices non formées.

C’est une étude plus petite (huit femmes adultes), mais conceptuellement importante. Elle montre que l’environnement virtuel visuel peut piloter à lui seul le comportement vocal - la voix répond au contexte de parole perçu, et non uniquement à l’acoustique physique.

Walkom, 2016 : prototype précoce, pilote honnête

Le premier pilote de ce groupe a testé un outil VR sur mesure de prise de parole en public avec six adultes qui bégaient. L’anxiété auto-déclarée a diminué au fil des séances, une activation physiologique est apparue lors de l’exposition, et les observateurs ont rapporté des changements visibles de schémas de parole dès la séance 2. Six participants ne constituent pas une preuve d’effet - mais le pilote a soutenu la faisabilité et a soulevé des questions utiles pour la suite des travaux.

Kumar et collègues, 2024 : faisabilité de la pratique VR à domicile

Kumar, Cecil et Tetnowski (2024) ont franchi l’étape suivante en sortant la VR du laboratoire. Cinq adolescents et jeunes adultes qui bégaient ont utilisé des casques VR grand public à domicile pendant une semaine, avec des scénarios de prise de parole gradués. La fréquence du bégaiement est passée de 18,67 % à 9,71 % des syllabes, et le rythme cardiaque a également baissé. Encore une fois, cinq participants sans condition de comparaison ne constituent pas une preuve d’effet, mais l’étude démontre que les programmes VR à domicile sont faisables et méritent d’être testés à plus grande échelle.

Un aperçu façon forest plot de la convergence

Forest plot des statistiques de convergence des trois études en comparaison directe

À quel point les réponses VR suivent leurs équivalents en monde réel, selon la corrélation et l'effet rapportés

Brundage & Hancock 2015 (n = 10 PWS)Corrélation entre conditions de public VR et réel, par mesure00.250.50.751.0Coefficient de corrélation (ρ de Spearman ou r de Pearson)Comportement de parole - VA exigeantρ = 0.99Comportement de parole - VA neutreρ = 0.82PRCS - confiancer = 0.88PRCA-24 - appréhensionr = 0.82Bettahi et al. 2026 (n = 60)Effet de la condition (ANOVA à 3 niveaux : public réel / virtuel / vide virtuel), η² partiel00.050.100.150.20η² partiel (plus petit = plus similaire entre conditions)Disfluences totalesη²ₓ = 0.05 (ns)Pauses pleinesη²ₓ = 0.11, p=.001F0 moyenne (hauteur)η²ₓ = 0.12, p=.002Daşdöğen & Hitchcock 2026 (n = 8)Statistique F pour l'effet de distance de l'auditeur (acoustique constante)0510152025Valeur FSPL (intensité)F=21.74, p<.001F0 (hauteur)F=7.86, p<.001

Les trois études en comparaison directe convergent : Brundage montre une correspondance quasi parfaite des rangs entre publics VR et réels pour le bégaiement et l'appréhension. Bettahi montre des effets de condition faibles à modérés (c.-à-d. les conditions réelle et VR sont similaires) sur la plupart des mesures vocales. Daşdöğen montre que les indices visuels seuls modifient significativement la production vocale même à acoustique constante. Walkom 2016 (n=6, pilote mixte) et Kumar 2024 (n=5, faisabilité à domicile) ne sont pas tracés ici car ils ne testent pas directement la correspondance public virtuel-vs-réel.

Sources : Brundage & Hancock 2015 (American Journal of Speech-Language Pathology, DOI) ; Bettahi et al. 2026 (Frontiers in Virtual Reality) ; Daşdöğen & Hitchcock 2026 (Journal of Voice). Un η² partiel plus faible chez Bettahi signifie que les conditions VR et réelle ont produit des réponses plus similaires ; pour la mesure des disfluences, l'effet de la condition était non significatif après correction de Bonferroni (c.-à-d. performance comparable entre conditions). Les valeurs F significatives de Daşdöğen pour la distance de l'auditeur montrent que les indices visuels de distance seuls modifient de manière fiable l'intensité vocale et la hauteur. Note : les comptes de fréquence façon %SS sont rapportés ici tels que les études originales les ont mesurés ; le domaine s'oriente de plus en plus vers la confiance auto-évaluée, la volonté de communiquer et les mesures orientées participation.

Ce que les preuves suggèrent

À travers ces cinq études, et l’Evidence Hub plus large dans lequel elles s’inscrivent, plusieurs schémas émergent.

Des publics virtuels bien conçus produisent des réponses qui ressemblent aux réponses face à un public réel. C’est ce qu’ont montré à la fois Brundage et Hancock et Bettahi et collègues, en utilisant différentes mesures de résultats (rythme cardiaque, voix, anxiété et observation comportementale). La convergence entre les mesures est plus convaincante que toute conclusion isolée.

La présence compte, et elle varie d’une personne à l’autre. La présence est le sentiment subjectif d’être là à l’intérieur d’un environnement virtuel. Une présence plus élevée est associée à des réponses plus proches des équivalents du monde réel. Cela suggère que la validité écologique est en partie une propriété de la personne qui utilise l’environnement, pas seulement de l’environnement lui-même.

Le contexte visuel seul peut façonner le comportement vocal et communicatif. L’étude Dasdogen et Hitchcock montre que les gens ajustent leur voix en fonction du contexte virtuel perçu, même lorsque l’acoustique est maintenue constante. Cela importe pour le travail vocal et pour toute question relative à la manière dont les locuteurs calibrent leur production en fonction des publics.

La base de preuves reste limitée. Les tailles d’échantillon sont majoritairement inférieures à vingt. Les populations sont souvent non cliniques ou étroites. Le transfert à long terme vers les situations quotidiennes est largement non testé. Ce sont de réelles limites qui devraient façonner la confiance avec laquelle toute conclusion est appliquée.

Ce que cela signifie pour la pratique au quotidien

Quelques conclusions provisoires pour les professionnels de l’orthophonie qui envisagent l’entraînement VR dans le cadre de leur travail :

Notes éditoriales de withVR

Les thèmes de cette recherche ont façonné la conception de Therapy withVR. La situation Auditorium existe en raison de travaux comme ceux de Brundage et Hancock et Bettahi. La situation Room existe en raison d’études comme celle de Dasdogen et Hitchcock. La fonctionnalité Goal existe pour soutenir la question de la généralisation - en permettant aux personnes d’évaluer leur propre confiance avant et après une séance, plutôt que de s’appuyer sur des cibles de production.

Rien de tout cela ne signifie que les conclusions de recherche sur d’autres systèmes VR transfèrent directement à Therapy withVR. Elles ne le font pas. Ce que Therapy withVR essaie de faire, c’est offrir un environnement d’entraînement cohérent avec les thèmes que les preuves soulèvent : situations graduées, contrôle clinicien en temps réel, confiance auto-évaluée dans le temps et environnements dans lesquels les personnes rapportent se sentir présentes.

Pour aller plus loin