Qu'a trouvé Daşdöğen et al. (2026) ?

Sur les trois tâches de parole, la distance locuteur-auditeur était le principal déterminant de l'intensité vocale (SPL) : plus l'auditeur virtuel paraissait éloigné, plus les participants parlaient fort (effet principal de la distance de l'auditeur p < .0001 pour chaque tâche) La taille de la pièce avait un effet plus faible et secondaire et agissait comme un modérateur - une interaction significative Taille de la pièce x Distance (p < .0001 selon les tâches) montrait que l'effet de distance était le plus marqué dans la grande pièce, à la distance d'auditeur la plus éloignée (15 m) Pour la voyelle tenue, la condition grande pièce à distance éloignée était environ 4,4 dB plus forte que la grande pièce seule, et déplacer l'auditeur à 15 m dans la grande pièce augmentait l'intensité d'environ 2,9 dB La distance de l'auditeur était le principal déterminant sur les trois tâches ; l'effet était plus important pour la voyelle tenue et la phrase lue (des types de tâches qui suscitent naturellement une phonation plus forte et plus stable), tandis qu'en parole spontanée le contraste post-hoc spécifique 3 m vs 15 m n'atteignait pas la significativité Le retour auditif a été maintenu identique dans toutes les conditions, de sorte que les modifications vocales étaient induites par la seule entrée visuo-spatiale, et non par un changement de ce que les participants entendaient Analyse robuste (modèles linéaires mixtes, post-hoc de Tukey-Kramer) : pour la parole spontanée, distance de l'auditeur F(3, 112) = 84.6, taille de la pièce F(2, 112) = 51.6, et l'interaction F(3, 112) = 53.0, tous p < .0001

Qui a participé à cette étude ?

Cette étude a inclus 15 participants : Quinze adultes à la voix saine (12 femmes, trois hommes ; âge moyen 39 ans, étendue 30-55), recrutés selon le critère de l'absence de trouble de la voix durant plus de deux semaines. Locuteurs natifs de l'anglais, avec audition normale autorapportée et vision normale ou corrigée. Dix-sept personnes ont été initialement recrutées ; deux ont été exclues pour des problèmes techniques.

Cette page a été traduite de l'anglais. Si une phrase semble étrange, passez à la version anglaise. Voir en anglais.

En RV, c'est la distance apparente de l'auditeur, plus que la taille de la pièce, qui détermine l'intensité de la voix

Daşdöğen Ü et al. · 2026 · Journal of Speech, Language, and Hearing Research · Expérimentale · n = 15 · Quinze adultes à la voix saine (12 femmes, trois hommes ... · DOI

Niveau de certitude : Certitude faible

Comment cela a été évalué

Ce niveau de certitude reflète la confiance dans les données pour un usage clinique ou thérapeutique - et non la robustesse du résultat sous-jacent, qui est solide et réplique les travaux antérieurs de l'équipe (Daşdöğen et al., 2023). L'étude est évaluée par les pairs dans le Journal of Speech, Language, and Hearing Research (ASHA), approuvée par un IRB et financée par le NIH/NIDCD (R21-DC020494), avec la scientifique de la voix Katherine Verdolini-Abbott comme investigatrice principale multiple. Forces du protocole : le retour auditif a été maintenu constant dans toutes les conditions, de sorte que l'entrée visuo-spatiale a pu être isolée comme cause ; la question mécanistique (taille de la pièce versus distance locuteur-auditeur) a été clairement dissociée, contrairement aux travaux antérieurs de l'équipe qui les faisaient varier ensemble ; trois tâches de parole ont été utilisées ; le SPL a été calibré de façon externe ; et l'analyse repose sur un cadre défendable de modèles linéaires mixtes avec contrastes post-hoc de Tukey-Kramer. Limites qui maintiennent un faible niveau de certitude pour une application clinique : échantillon total réduit (N = 15) avec un déséquilibre des sexes (12 femmes, trois hommes) ; uniquement des adultes à la voix saine, donc aucune donnée encore chez les personnes présentant un trouble de la voix ; une seule séance ; une issue acoustique de substitution (SPL) plutôt qu'une issue vocale clinique ; des environnements simulés qui ne reproduisent pas l'acoustique du monde réel ni la dynamique sociale en direct ; aucune mesure autorapportée d'effort vocal ni d'issue perceptive ; et une audition autorapportée (et non objectivement dépistée). L'étude établit solidement le mécanisme visuo-spatial ; l'efficacité thérapeutique et le transfert en situation réelle sont des questions distinctes qui nécessitent des études plus larges et multiséances dans des populations cliniques avec groupes témoins.

Les évaluations suivent un schéma simplifié à quatre niveaux (Élevée, Modérée, Faible, Très faible), inspiré du GRADE working group. En savoir plus sur la méthode d'évaluation des études.

À l'aide de la situation de la salle dans Therapy withVR, avec un son maintenu constant, 15 adultes à la voix saine ont parlé dans des conditions virtuelles faisant varier la taille de la pièce et la distance locuteur-auditeur. La distance était le principal déterminant de l'intensité vocale - plus l'auditeur virtuel paraissait éloigné, plus les personnes parlaient fort - tandis que la taille de la pièce agissait comme un modérateur qui renforçait l'effet de distance, surtout aux distances les plus grandes. Comme seuls les indices visuels changeaient, l'étude montre que les indices visuo-spatiaux suffisent à eux seuls à moduler la voix.

Message clinique essentiel

Une étude expérimentale financée par le NIH et évaluée par les pairs, qui isole les déterminants visuels de l'intensité vocale en RV immersive. Sur trois tâches de parole (une voyelle tenue, une phrase standard et une parole spontanée), 15 adultes à la voix saine ont augmenté leur intensité à mesure que l'auditeur virtuel s'éloignait, la taille de la pièce modérant cet effet - le plus marqué dans la grande pièce, à la distance la plus éloignée (15 m). Le maintien d'un son identique entre les conditions a permis d'isoler la vision comme cause. Les statistiques sont robustes (modèles linéaires mixtes ; tous les effets principaux et l'interaction Taille de la pièce x Distance à p < .001). L'étude est limitée par un petit échantillon (N = 15), un déséquilibre des sexes (12 femmes, trois hommes), des participants à la voix saine uniquement et une seule séance - elle établit donc le mécanisme, et non l'efficacité clinique. L'étude a utilisé la situation de la salle dans Therapy withVR, et le fondateur de withVR a construit les environnements personnalisés qui y ont été utilisés.

Principaux résultats

Sur les trois tâches de parole, la distance locuteur-auditeur était le principal déterminant de l'intensité vocale (SPL) : plus l'auditeur virtuel paraissait éloigné, plus les participants parlaient fort (effet principal de la distance de l'auditeur p < .0001 pour chaque tâche)
La taille de la pièce avait un effet plus faible et secondaire et agissait comme un modérateur - une interaction significative Taille de la pièce x Distance (p < .0001 selon les tâches) montrait que l'effet de distance était le plus marqué dans la grande pièce, à la distance d'auditeur la plus éloignée (15 m)
Pour la voyelle tenue, la condition grande pièce à distance éloignée était environ 4,4 dB plus forte que la grande pièce seule, et déplacer l'auditeur à 15 m dans la grande pièce augmentait l'intensité d'environ 2,9 dB
La distance de l'auditeur était le principal déterminant sur les trois tâches ; l'effet était plus important pour la voyelle tenue et la phrase lue (des types de tâches qui suscitent naturellement une phonation plus forte et plus stable), tandis qu'en parole spontanée le contraste post-hoc spécifique 3 m vs 15 m n'atteignait pas la significativité
Le retour auditif a été maintenu identique dans toutes les conditions, de sorte que les modifications vocales étaient induites par la seule entrée visuo-spatiale, et non par un changement de ce que les participants entendaient
Analyse robuste (modèles linéaires mixtes, post-hoc de Tukey-Kramer) : pour la parole spontanée, distance de l'auditeur F(3, 112) = 84.6, taille de la pièce F(2, 112) = 51.6, et l'interaction F(3, 112) = 53.0, tous p < .0001

Contexte

Lorsque nous parlons, nous ajustons notre voix à la situation sans y penser : nous projetons dans une grande salle, nous élevons le volume lorsqu’un auditeur est éloigné, nous l’atténuons lorsqu’il est proche. Un défi de longue date en thérapie de la voix tient au fait que les progrès réalisés dans un cabinet calme ne se transfèrent souvent pas à ces situations réelles, où les exigences sur la voix sont totalement différentes.

Un courant de recherche grandissant se demande si la réalité virtuelle immersive (IVR) peut recréer ces exigences avec assez de fidélité pour induire - et à terme entraîner - un comportement vocal réel. Daşdöğen et ses collègues avaient déjà montré que la taille de la pièce virtuelle et la distance de l’auditeur pouvaient modifier l’intensité avec laquelle les personnes parlent, mais comme ils faisaient varier les deux à la fois, ils ne pouvaient pas dire lequel des deux indices opérait. Cette étude a entrepris de les dissocier.

Ce que les chercheurs ont fait

Quinze adultes à la voix saine ont réalisé trois tâches de parole - une voyelle tenue /a/, la phrase standard « We were away a year ago » et une réponse spontanée - dans huit conditions de RV immersive présentées via la situation de la salle dans Therapy withVR sur un casque Oculus Quest 3. Les conditions faisaient varier la taille de la pièce (une petite pièce de 5 m × 4 m × 4 m versus une grande pièce de 20 m × 20 m × 20 m), la distance locuteur-auditeur (1 m, 3 m ou 15 m) et des combinaisons des deux, ainsi que des conditions avec auditeur seul, sans pièce.

Point crucial, le son a été maintenu identique dans chaque condition - les participants portaient des bouchons d’oreilles et un casque circum-aural fermé, et l’acoustique naturelle de la pièce était maintenue constante - de sorte que la seule chose qui changeait était ce qu’ils voyaient. Ce protocole permet à l’étude d’attribuer toute modification de la voix à la seule entrée visuo-spatiale. Le niveau de pression acoustique (SPL) a été enregistré avec un microphone serre-tête calibré et analysé avec des modèles linéaires mixtes. Ce travail a été financé par une subvention des National Institutes of Health des États-Unis, avec la scientifique de la voix Katherine Verdolini-Abbott comme investigatrice principale multiple.

Ce qu’ils ont trouvé

La distance locuteur-auditeur était le principal déterminant de l’intensité vocale. Sur les trois tâches, plus l’auditeur virtuel paraissait éloigné, plus les participants parlaient fort - un effet marqué et statistiquement robuste (p < .0001 dans chaque tâche). L’effet était plus important dans les tâches structurées (la voyelle tenue et la phrase lue, qui suscitent naturellement une phonation plus forte et plus stable) ; en parole spontanée, l’effet global de distance se maintenait, bien que le contraste spécifique 3 m vs 15 m n’atteignît pas la significativité.

La taille de la pièce était un indice secondaire et modérateur. La taille de la pièce à elle seule produisait des modifications plus faibles, mais elle renforçait l’effet de distance : une interaction significative Taille de la pièce x Distance montrait que le saut d’intensité à la distance la plus éloignée (15 m) était le plus important dans la grande pièce. Dans le cadre proposé par les auteurs, la distance est la contrainte pertinente sur le plan comportemental, et la taille de la pièce est un facteur de « gain » contextuel qui augmente ou diminue cette contrainte.

Comme le son ne changeait jamais, ces ajustements vocaux étaient produits par la seule vision.

Pourquoi cela compte

Cette étude met en évidence un levier clair et contrôlable pour le travail de la voix : la distance apparente d’un auditeur. Un clinicien peut augmenter ou diminuer cette distance en RV pour susciter des modifications graduées de la projection vocale, avec la taille de la pièce comme indice secondaire pour amplifier l’exigence - le tout sans quitter le cabinet, et le tout mesurable. C’est le contrôle précis qu’offre la plateforme qui a rendu possible l’isolement d’une variable à la fois, ce qui n’est pas réalisable dans une pièce réelle.

Elle ajoute aussi des données rigoureuses, financées par le NIH, à l’argumentaire plus large en faveur d’une pratique écologiquement valide en rééducation de la voix et de la parole : les contextes dans lesquels une personne a besoin de sa voix peuvent être recréés avec assez de fidélité pour modifier le comportement vocal réel, ce qui constitue le fondement d’une pratique dans ces contextes plutôt que dans une pièce épurée.

Limites

L’échantillon était petit (15 participants) et non équilibré selon le sexe (12 femmes, trois hommes), et tous étaient à la voix saine - les résultats ne renseignent donc pas encore sur les personnes présentant un trouble de la voix, où se situerait l’intérêt clinique. Il s’agissait d’une seule séance, et seules des mesures acoustiques objectives ont été recueillies, sans donnée autorapportée d’effort vocal, de confort ou de distance perçue permettant de relier les variations de SPL à l’expérience vécue. Maintenir le son constant était essentiel pour isoler la vision, mais cela a aussi supprimé la complexité multisensorielle et sociale de la communication réelle, et les scènes simulées ne reproduisent pas des auditeurs vivants et réactifs. L’étude établit le mécanisme visuo-spatial ; la question de savoir si une pratique en RV guidée par la distance se transfère à l’usage quotidien de la voix reste à tester.

Implications pour la pratique

Pour les cliniciens de la voix qui utilisent ou évaluent la RV immersive : cette étude montre qu'un seul paramètre visuel quantifiable - la distance apparente de l'auditeur - module de façon fiable l'intensité vocale, même lorsque la personne sait que la scène est simulée et même lorsque le son ne change jamais. Cela fait de la distance virtuelle locuteur-auditeur un curseur clair et contrôlable pour un travail gradué de projection vocale (par exemple, augmenter l'intensité pour un auditeur éloigné, ou s'exercer à une projection confortable selon les distances) sans quitter le cabinet. La taille de la pièce se comprend mieux comme un indice secondaire, qui renforce le contexte, plutôt que comme le levier principal. La distance a modulé la voix sur les trois types de tâches, les effets les plus importants et les plus nettement dissociés s'observant dans les tâches structurées (une voyelle tenue et une phrase lue) - un point de départ pratique pour des exercices gradués, même si l'étude n'était pas conçue pour comparer les tâches. Ces résultats s'accordent bien avec le modèle social de la communication : les exigences qui façonnent la voix résident dans les contextes où la voix est utilisée, et c'est l'entraînement dans ces contextes - plutôt que dans un cabinet épuré - qui est étayé par les données. Le travail porte sur des adultes à la voix saine ; des tests directs chez des personnes présentant des différences vocales restent donc nécessaires avant toute revendication d'efficacité clinique.

Implications pour la recherche

Une réplication et une extension sont nécessaires dans : (a) des échantillons plus larges, équilibrés selon le sexe et dimensionnés pour une analyse des différences individuelles ; (b) des populations présentant un trouble de la voix (par exemple presbyphonie, dysphonie de tension musculaire, hypophonie parkinsonienne), où se situerait le bénéfice clinique ; (c) des protocoles multiséances qui testent l'apprentissage, la rétention et le transfert de la mise à l'échelle vocale induite par la distance vers la parole en situation réelle, la généralisation étant le besoin central non satisfait ; (d) des protocoles qui relient les variations de SPL à des issues perceptives et autorapportées (effort vocal, confort, distance perçue) au sein des mêmes essais ; et (e) des conditions qui réintroduisent la complexité auditive et sociale (bruit, réverbération, auditeurs vivants et réactifs) afin de tester la robustesse de l'effet visuel isolé dans des scènes écologiquement plus riches.

Notes éditoriales de withVR

Liens avec Therapy withVR

L'étude ci-dessus est une recherche indépendante et ne porte aucun jugement sur quelque produit que ce soit. Les notes ci-dessous sont un commentaire de withVR sur la manière dont les thèmes de cette recherche rejoignent des fonctionnalités de Therapy withVR. Les résultats de la recherche ne constituent pas des allégations concernant Therapy withVR.

Contrôles de distance des avatars

Cette étude a identifié la distance locuteur-auditeur comme le principal déterminant de l'intensité vocale - Therapy withVR permet de rapprocher ou d'éloigner l'avatar auditeur pour créer les mêmes indices de distance gradués pour le travail de projection vocale.

Situation de la salle avec dimensions personnalisables

L'étude a modélisé une petite pièce (5 m × 4 m × 4 m) et une grande pièce (20 m × 20 m × 20 m) - la situation de la salle de Therapy withVR permet d'ajuster la largeur, la longueur et la hauteur pour reproduire le contexte spatial qui modérait l'effet de distance.

Contrôles d'éclairage

Ajustez l'éclairage général et par position pour construire les scènes visuelles variées et contrôlées que cette étude a utilisées afin d'isoler les influences visuo-spatiales sur la voix.

Citer cette étude

Si vous référencez cette étude dans votre travail, voici les formats de citation canoniques :

APA 7th

Daşdöğen Ü, Hitchcock, J., Ahn, S., Ng, B. B., & Verdolini-Abbott, K. (2026). Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality. Journal of Speech, Language, and Hearing Research. https://doi.org/10.1044/2026_JSLHR-25-00798.

AMA 11th

Daşdöğen Ü, Hitchcock J, Ahn S, Ng BB, Verdolini-Abbott K. Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality. Journal of Speech, Language, and Hearing Research. 2026. doi:10.1044/2026_JSLHR-25-00798.

BibTeX

@article{daden2026,
  author = {Daşdöğen Ü and Hitchcock, J. and Ahn, S. and Ng, B. B. and Verdolini-Abbott, K.},
  title = {Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality},
  journal = {Journal of Speech, Language, and Hearing Research},
  year = {2026},
  doi = {10.1044/2026_JSLHR-25-00798},
  url = {https://withvr.app/fr/evidence/studies/dasdogen-2026-distance}
}

RIS

TY  - JOUR
AU  - Daşdöğen Ü
AU  - Hitchcock, J.
AU  - Ahn, S.
AU  - Ng, B. B.
AU  - Verdolini-Abbott, K.
TI  - Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality
JO  - Journal of Speech, Language, and Hearing Research
PY  - 2026
DO  - 10.1044/2026_JSLHR-25-00798
UR  - https://withvr.app/fr/evidence/studies/dasdogen-2026-distance
ER  -

Vous connaissez des travaux qui auraient leur place dans cette base ? Si une étude pertinente évaluée par les pairs n'y figure pas, envoyez la référence à hello@withvr.app. La base est tenue à jour au fil de la littérature.

Financement et indépendance

Cette étude a été financée par une subvention des National Institutes of Health / NIDCD des États-Unis (R21-DC020494, attribuée à Ümit Daşdöğen et Katherine Verdolini-Abbott en tant qu'investigateurs principaux multiples). Elle a utilisé la situation de la salle dans Therapy withVR, et le fondateur de withVR, Gareth Walkom, a construit les environnements virtuels personnalisés utilisés dans l'étude. La recherche est indépendante de withVR BV : l'entreprise n'a ni financé, ni conçu, ni rédigé l'étude, et les auteurs n'ont déclaré aucun conflit d'intérêts. Voir la publication pour la déclaration complète des auteurs.

Dernière évaluation : 2026-06-26 Prochaine évaluation prévue : 2027-06-26 Évalué par : Gareth Walkom

En RV, c'est la distance apparente de l'auditeur, plus que la taille de la pièce, qui détermine l'intensité de la voix

Principaux résultats

Contexte

Ce que les chercheurs ont fait

Ce qu’ils ont trouvé

Pourquoi cela compte

Limites

Implications pour la pratique

Implications pour la recherche

Liens avec Therapy withVR

Contrôles de distance des avatars

Situation de la salle avec dimensions personnalisables

Contrôles d'éclairage

Études associées

Le focus attentionnel externe en VR favorise des mouvements de parole plus flexibles chez les adultes qui bégaient

Étude intra-sujets (n=31) : les indices auditifs, visuels et audiovisuels de la pièce en VR modifient sonorité, effort et production vocale

Pilote d'Immersive VoiceSpace VR (N=17) : les locuteurs ont modulé intensité et hauteur selon des conditions graduées de restaurant virtuel

La taille virtuelle de la pièce et la distance de l'auditeur influencent la façon dont les personnes utilisent leur voix

La prise de parole en VR augmente la volonté de communiquer dans l'entraînement vocal d'affirmation de genre

Articles de blog associés

Why VR Speaking Situations Feel Like the Real Thing

Citer cette étude

Financement et indépendance