Esta página fue traducida del inglés. Si algo suena extraño, cambia a la versión en inglés. Ver en inglés.

VozValidez ecológica Therapy withVR

En RV, la distancia a la que aparece el oyente determina la sonoridad vocal más que el tamaño de la sala

Daşdöğen Ü et al. · 2026 · Journal of Speech, Language, and Hearing Research · Experimental · n = 15 · Quince adultos con la voz sana (12 mujeres, tres hombres... · DOI
Grado de certeza: Certeza baja
Cómo se ha evaluado

Esta calificación de certeza refleja la confianza en la evidencia para el uso clínico o terapéutico - no la solidez del hallazgo subyacente, que es fuerte y replica el trabajo anterior del equipo (Daşdöğen et al., 2023). El estudio está revisado por pares en el Journal of Speech, Language, and Hearing Research (ASHA), aprobado por un IRB y financiado por los NIH/NIDCD (R21-DC020494), con la científica de la voz Katherine Verdolini-Abbott como investigadora principal múltiple. Fortalezas del diseño: la retroalimentación auditiva se mantuvo constante en todas las condiciones, de modo que la entrada visual-espacial quedó aislada como causa; la pregunta mecanística (tamaño de la sala frente a distancia entre el hablante y el oyente) se separó de forma limpia, a diferencia del trabajo anterior del equipo que las variaba juntas; se usaron tres tareas de habla; el SPL se calibró externamente; y el análisis es un marco defendible de modelos lineales mixtos con contrastes post-hoc de Tukey-Kramer. Lo que mantiene baja la certeza para la aplicación clínica: muestra total pequeña (N = 15) con una proporción de sexos no equilibrada (12 mujeres, 3 hombres); únicamente adultos con la voz sana, por lo que aún no hay evidencia en poblaciones con diferencias de voz; una sola sesión; un resultado acústico indirecto (SPL) en lugar de un resultado vocal clínico; entornos simulados que no captan la acústica del mundo real ni la dinámica social en vivo; ningún dato de esfuerzo vocal o resultados perceptivos autoinformados; y audición autoinformada (no cribada objetivamente). El estudio establece de forma sólida el mecanismo visual-espacial; la eficacia terapéutica y la transferencia al mundo real son cuestiones distintas que requieren estudios más amplios y multisesión en poblaciones clínicas con comparadores de control.

Las valoraciones utilizan un esquema simplificado de cuatro niveles (Alta, Moderada, Baja, Muy baja), basado en el GRADE working group. Más información sobre cómo se evalúan los estudios.

Usando la situación Rooms en Therapy withVR con el sonido mantenido constante, 15 adultos con la voz sana hablaron en condiciones virtuales que variaban el tamaño de la sala y la distancia entre el hablante y el oyente. La distancia fue el principal motor de la intensidad vocal - cuanto más lejos aparecía el oyente virtual, más fuerte hablaban las personas - mientras que el tamaño de la sala actuó como un moderador que reforzaba el efecto de la distancia, sobre todo en las distancias más largas. Como solo cambiaban las imágenes, el estudio demuestra que las señales visuales-espaciales por sí solas pueden escalar la voz.

Mensaje clínico clave

Un estudio experimental revisado por pares y financiado por los NIH que aísla los factores visuales de la intensidad vocal en RV inmersiva. A lo largo de tres tareas de habla (una vocal sostenida, una frase estándar y habla espontánea), 15 adultos con la voz sana elevaron su sonoridad a medida que el oyente virtual se alejaba, con el tamaño de la sala moderando el efecto - más intenso en la sala grande a la distancia lejana (15 m). Mantener el sonido idéntico en todas las condiciones aisló la visión como causa. Las estadísticas son sólidas (modelos lineales mixtos; todos los efectos principales y la interacción Tamaño de la sala x Distancia con p < ,001). Está limitado por una muestra pequeña (N = 15), una proporción de sexos no equilibrada (12 mujeres, 3 hombres), únicamente adultos con la voz sana y una sola sesión - de modo que establece el mecanismo, no la eficacia clínica. El estudio utilizó la situación Rooms en Therapy withVR, y el fundador de withVR construyó los entornos personalizados que se emplearon en él.

Hallazgos principales

  • En las tres tareas de habla, la distancia entre el hablante y el oyente fue el principal motor de la intensidad vocal (SPL): cuanto más lejos aparecía el oyente virtual, más fuerte hablaban los participantes (efecto principal de la distancia del oyente p &lt; ,0001 en todas las tareas)
  • El tamaño de la sala tuvo un efecto menor y secundario y actuó como moderador - una interacción significativa Tamaño de la sala x Distancia (p &lt; ,0001 en todas las tareas) mostró que el efecto de la distancia era más fuerte en la sala grande a la distancia lejana (15 m) del oyente
  • Para la vocal sostenida, la condición de sala grande a distancia lejana fue unos 4,4 dB más fuerte que la sala grande por sí sola, y mover al oyente a 15 m en la sala grande elevó la intensidad en unos 2,9 dB
  • La distancia del oyente fue el principal motor en las tres tareas; el efecto fue mayor para la vocal sostenida y la frase leída (tipos de tarea que provocan de forma natural una emisión más fuerte y estable), mientras que en el habla espontánea el contraste post-hoc específico de 3 m vs 15 m no alcanzó la significación
  • La retroalimentación auditiva se mantuvo idéntica en todas las condiciones, de modo que los cambios vocales fueron impulsados únicamente por la entrada visual-espacial, no por ningún cambio en lo que oían los participantes
  • Análisis sólido (modelos lineales mixtos, post-hoc de Tukey-Kramer): para el habla espontánea, distancia del oyente F(3, 112) = 84.6, tamaño de la sala F(2, 112) = 51.6, y la interacción F(3, 112) = 53.0, todos con p &lt; ,0001

Contexto

Cuando hablamos, ajustamos la voz a la situación sin pensar en ello - proyectando a través de una sala grande, subiendo el volumen cuando un oyente está lejos, suavizándola cuando está cerca. Un reto de larga data en la terapia de la voz es que las mejoras logradas en una sala clínica silenciosa a menudo no se trasladan a estos entornos del mundo real, donde las exigencias sobre la voz son completamente distintas.

Una línea de trabajo creciente se pregunta si la realidad virtual inmersiva (IVR) puede recrear esas exigencias con la suficiente fidelidad como para impulsar - y, con el tiempo, entrenar - un comportamiento vocal real. Daşdöğen y sus colegas ya habían demostrado que el tamaño de la sala virtual y la distancia del oyente pueden cambiar la sonoridad con la que habla la gente, pero como variaban ambos a la vez, no podían saber cuál de las dos señales hacía el trabajo. Este estudio se propuso separarlas.

Lo que hicieron los investigadores

Quince adultos con la voz sana completaron tres tareas de habla - una vocal sostenida /a/, la frase estándar “We were away a year ago” y una respuesta espontánea - a través de ocho condiciones de RV inmersiva entregadas mediante la situación Rooms en Therapy withVR en un visor Oculus Quest 3. Las condiciones variaron el tamaño de la sala (una sala pequeña de 5 x 4 x 4 m frente a una grande de 20 x 20 x 20 m), la distancia entre el hablante y el oyente (1 m, 3 m o 15 m) y combinaciones de ambas, además de condiciones de solo oyente sin sala.

Lo fundamental es que el sonido se mantuvo idéntico en todas las condiciones - los participantes llevaban tapones para los oídos y auriculares cerrados, y la acústica natural de la sala se mantuvo constante - de modo que lo único que cambiaba era lo que veían. Ese diseño permite atribuir cualquier cambio en la voz únicamente a la entrada visual-espacial. El nivel de presión sonora (SPL) se registró con un micrófono montado en la cabeza y calibrado, y se analizó con modelos lineales mixtos. El trabajo fue financiado por una subvención de los Institutos Nacionales de Salud de EE. UU., con la científica de la voz Katherine Verdolini-Abbott como investigadora principal múltiple.

Lo que encontraron

La distancia entre el hablante y el oyente fue el principal motor de la intensidad vocal. En las tres tareas, cuanto más lejos aparecía el oyente virtual, más fuerte hablaban los participantes - un efecto fuerte y estadísticamente sólido (p < ,0001 en todas las tareas). El efecto fue mayor en las tareas estructuradas (la vocal sostenida y la frase leída, que provocan de forma natural una emisión más fuerte y estable); en el habla espontánea el efecto global de la distancia se mantuvo, aunque el contraste específico de 3 m vs 15 m no alcanzó la significación.

El tamaño de la sala fue una señal secundaria y moderadora. El tamaño de la sala por sí solo produjo cambios menores, pero reforzó el efecto de la distancia: una interacción significativa Tamaño de la sala x Distancia mostró que el salto de sonoridad a la distancia lejana (15 m) era mayor en la sala grande. En el planteamiento de los autores, la distancia es la restricción relevante para el comportamiento, y el tamaño de la sala es un factor contextual de “ganancia” que sube o baja esa restricción.

Como el sonido nunca cambió, estos ajustes vocales fueron producidos únicamente por la visión.

Por qué es importante

Este estudio fija una palanca limpia y controlable para el trabajo con la voz: la distancia aparente de un oyente. Un clínico puede subir o bajar esa distancia en RV para provocar cambios graduados en la proyección vocal, con el tamaño de la sala disponible como señal secundaria para amplificar la exigencia - todo ello sin salir de la clínica y todo medible. El control preciso que ofrece la plataforma es lo que hizo posible aislar una variable cada vez, algo que no es factible en una sala real.

También aporta evidencia rigurosa y financiada por los NIH al argumento más amplio a favor de la práctica ecológicamente válida en la rehabilitación de la voz y el habla: los contextos en los que una persona necesita su voz pueden recrearse lo bastante bien como para cambiar el comportamiento vocal real, lo que constituye la base para practicar en esos contextos en lugar de en una sala despojada de estímulos.

Limitaciones

La muestra fue pequeña (15 participantes) y no equilibrada por sexo (12 mujeres, tres hombres), y todos tenían la voz sana - de modo que los hallazgos aún no dicen nada sobre las personas con trastornos de la voz, donde residiría el valor clínico. Fue una sola sesión, y solo se recogieron medidas acústicas objetivas, sin datos de esfuerzo vocal, comodidad o distancia percibida autoinformados que vincularan los cambios de SPL con la experiencia. Mantener el sonido constante fue esencial para aislar la visión, pero también eliminó la complejidad multisensorial y social de la comunicación real, y las escenas simuladas no captan a oyentes vivos que respondan. El estudio establece el mecanismo visual-espacial; queda por comprobar si la práctica guiada por la distancia en RV se transfiere al uso cotidiano de la voz.

Implicaciones para la práctica

Para los logopedas que utilizan o evalúan la RV inmersiva: este estudio muestra que un único parámetro visual cuantificable - la distancia a la que aparece el oyente - escala de forma fiable la intensidad vocal, incluso cuando la persona sabe que la escena es simulada y aunque el sonido nunca cambie. Eso convierte la distancia virtual entre el hablante y el oyente en un mando limpio y controlable para la práctica graduada de la proyección de la voz (por ejemplo, ganar sonoridad para un oyente lejano, o ensayar una proyección cómoda a distintas distancias) sin salir de la clínica. El tamaño de la sala se entiende mejor como una señal secundaria que refuerza el contexto, más que como la palanca principal. La distancia escaló la voz en los tres tipos de tarea, con los efectos más grandes y mejor diferenciados en las tareas estructuradas (una vocal sostenida y una frase leída) - un punto de partida práctico para los ejercicios graduados, aunque el estudio no se diseñó para comparar tareas. Los hallazgos encajan bien con el modelo social de la comunicación: las exigencias que moldean la voz viven en los contextos donde la voz se usa, y ensayar en esos contextos - en lugar de en una sala clínica despojada de estímulos - es lo que respalda la evidencia. El trabajo se realizó en adultos con la voz sana, por lo que aún hace falta probarlo directamente en personas con diferencias de voz antes de afirmar nada sobre su eficacia clínica.

Implicaciones para la investigación

Se necesita replicación y ampliación en: (a) muestras más amplias y equilibradas por sexo, con potencia para el análisis de diferencias individuales; (b) poblaciones con diferencias de voz (p. ej., presbifonía, disfonía por tensión muscular, hipofonía del Parkinson), donde estaría el beneficio clínico; (c) protocolos multisesión que evalúen el aprendizaje, la retención y la transferencia del escalado vocal guiado por la distancia al habla del mundo real, ya que la generalización es la principal necesidad no cubierta; (d) diseños que vinculen los cambios de SPL con resultados perceptivos y autoinformados (esfuerzo vocal, comodidad, distancia percibida) dentro de los mismos ensayos; y (e) condiciones que reintroduzcan la complejidad auditiva y social (ruido, reverberación, oyentes vivos que respondan) para comprobar cómo se sostiene el efecto visual aislado en escenas ecológicamente más ricas.

Notas editoriales de withVR

Cómo se relaciona esto con Therapy withVR

El estudio anterior es investigación independiente y no respalda ningún producto. Las notas siguientes son comentarios de withVR sobre cómo los temas de esta investigación se relacionan con funcionalidades de Therapy withVR. Los hallazgos de la investigación no constituyen afirmaciones sobre Therapy withVR.

Controles de distancia de los avatares

Este estudio encontró que la distancia entre el hablante y el oyente era el principal motor de la intensidad vocal - Therapy withVR permite acercar o alejar el avatar oyente para crear esas mismas señales graduadas de distancia en la práctica de la proyección de la voz.

Situación de Sala con dimensiones personalizables

El estudio modeló una sala pequeña (5 x 4 x 4 m) y una grande (20 x 20 x 20 m) - la situación de Sala de Therapy withVR permite ajustar el ancho, la longitud y la altura para reproducir el contexto espacial que moderó el efecto de la distancia.

Controles de iluminación

Ajuste la iluminación general y por posición para crear las escenas visuales variadas y controladas que este estudio utilizó para aislar las influencias visuales-espaciales sobre la voz.

Cita este estudio

Si haces referencia a este estudio en tu trabajo, estos son los formatos de cita canónicos:

APA 7th
Daşdöğen Ü, Hitchcock, J., Ahn, S., Ng, B. B., & Verdolini-Abbott, K. (2026). Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality. Journal of Speech, Language, and Hearing Research. https://doi.org/10.1044/2026_JSLHR-25-00798.
AMA 11th
Daşdöğen Ü, Hitchcock J, Ahn S, Ng BB, Verdolini-Abbott K. Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality. Journal of Speech, Language, and Hearing Research. 2026. doi:10.1044/2026_JSLHR-25-00798.
BibTeX
@article{daden2026,
  author = {Daşdöğen Ü and Hitchcock, J. and Ahn, S. and Ng, B. B. and Verdolini-Abbott, K.},
  title = {Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality},
  journal = {Journal of Speech, Language, and Hearing Research},
  year = {2026},
  doi = {10.1044/2026_JSLHR-25-00798},
  url = {https://withvr.app/es/evidence/studies/dasdogen-2026-distance}
}
RIS
TY  - JOUR
AU  - Daşdöğen Ü
AU  - Hitchcock, J.
AU  - Ahn, S.
AU  - Ng, B. B.
AU  - Verdolini-Abbott, K.
TI  - Visual–Spatial Influences on Vocal Intensity: Effects of Speaker-to-Listener Distance and Room Size in Immersive Virtual Reality
JO  - Journal of Speech, Language, and Hearing Research
PY  - 2026
DO  - 10.1044/2026_JSLHR-25-00798
UR  - https://withvr.app/es/evidence/studies/dasdogen-2026-distance
ER  - 

¿Conoce alguna investigación que debería estar en esta base? Si un estudio relevante revisado por pares no figura aquí, envíe la referencia a hello@withvr.app. La base se mantiene actualizada a medida que crece la literatura.

Financiación e independencia

Este estudio fue financiado por una subvención de los Institutos Nacionales de Salud de EE. UU. / NIDCD (R21-DC020494, concedida a Ümit Daşdöğen y Katherine Verdolini-Abbott como investigadores principales múltiples). Utilizó la situación Rooms en Therapy withVR, y el fundador de withVR, Gareth Walkom, construyó los entornos virtuales personalizados empleados en el estudio. La investigación es independiente de withVR BV - la empresa no la financió, diseñó ni participó como autora, y los autores declararon no tener conflictos de interés. Consulte la publicación para la declaración completa de los autores.

Última revisión: 2026-06-26 Próxima revisión prevista: 2027-06-26 Revisado por: Gareth Walkom