«¿Se siente lo bastante real para que importe?» es una pregunta razonable que cabe hacer a cualquier entorno virtual utilizado en la práctica de la comunicación. Si un café virtual no evoca las reacciones que un café real evoca, entonces la práctica en el virtual difícilmente se transferirá. Si las evoca, abre un tipo de espacio de práctica que de otro modo es difícil de organizar.
Durante la última década, un cuerpo pequeño pero creciente de investigación revisada por pares ha intentado responder a esta pregunta. No en abstracto, sino con mediciones de ansiedad, frecuencia cardiaca, acústica vocal y otros comportamientos del habla en condiciones reales y virtuales emparejadas. Esta entrada reúne lo que cinco de esos estudios nos dicen y lo que la evidencia sugiere para la práctica diaria.
La pregunta
La validez ecológica es el grado en que una situación de investigación produce los comportamientos y las respuestas que ocurrirían en la situación del mundo real que se pretende representar. Un café virtual que parece plausible pero no genera ansiedad alguna tiene baja validez ecológica para estudiar la ansiedad al hablar. Un café virtual que desencadena los mismos tipos de reacciones que desencadena un café real tiene alta validez ecológica.
La validez no es una propiedad única de un entorno de VR. Depende de lo que se quiera estudiar o practicar. Una configuración de VR puede ser ecológicamente válida para hablar en público en adultos y no serlo para la participación en el aula infantil, o ser válida para la ansiedad al hablar y no para la producción vocal, o serlo para algunas personas y no para otras.
Lo que muestran cinco estudios
Los cinco estudios de un vistazo
Evidencia de validez ecológica para entornos de habla en VR
Brundage y Hancock - los públicos virtuales y reales producen un habla casi idéntica
La medida primaria del habla correlacionó a r = 0,99 entre las condiciones virtual y real. Las puntuaciones de aprensión comunicativa y de confianza coincidieron estrechamente.
Bettahi et al. - los públicos virtuales desencadenan ansiedad y cambios de voz reales
La ansiedad anticipatoria (SUDS), la frecuencia cardiaca y las medidas de voz (F0, variabilidad de F0) fueron comparables entre las condiciones de público real y virtual. Mayor presencia reportada = respuestas más cercanas.
Dasdogen y Hitchcock - la distancia virtual por sí sola cambia el comportamiento vocal
Las pistas visuales de distancia afectaron significativamente a la intensidad y al tono vocal incluso con la acústica constante. Los cantantes con formación se ajustaron de forma más sistemática que los hablantes no formados.
Walkom - prototipo temprano, piloto honesto
La ansiedad autoinformada disminuyó a lo largo de las sesiones; apareció activación fisiológica durante la exposición; los observadores reportaron cambios en los patrones del habla en la sesión 2. Viabilidad, no efecto.
Kumar, Cecil y Tetnowski - viabilidad de la práctica de VR en casa
La frecuencia de tartamudez bajó del 18,67% al 9,71% de las sílabas a lo largo de una semana; la frecuencia cardiaca también bajó. Sin condición de comparación: evidencia de viabilidad, no efecto causal.
Cada estudio se resume a continuación. Los tamaños muestrales son pequeños; la convergencia entre múltiples tipos de medida importa más que cualquier hallazgo individual.
Brundage y Hancock, 2015: los públicos virtuales y reales producen respuestas de tartamudez casi idénticas
Brundage y Hancock (2015) hicieron que diez adultos que tartamudean hablaran tanto en una condición de público en directo como en una condición de público virtual. La medida primaria del habla mostró una correlación casi perfecta entre las condiciones virtual y en directo (r = 0,99). Las puntuaciones de aprensión comunicativa y de confianza del hablante coincidieron estrechamente entre condiciones también.
Este estudio se cita a menudo como la demostración fundacional de que los públicos virtuales son ecológicamente válidos para estudiar la tartamudez bajo presión del público. La muestra es pequeña, pero la correlación es fuerte y el diseño emparejó a los participantes individuales en ambas condiciones.
Bettahi y colegas, 2026: los públicos virtuales desencadenan ansiedad y cambios de voz reales
Bettahi et al. (2026) extendieron la pregunta de validación a la voz y la fisiología. Sesenta estudiantes universitarios presentaron ante un público real, un público virtual y una sala virtual vacía. El público virtual produjo ansiedad anticipatoria (medida con SUDS) y aumentos de frecuencia cardiaca comparables al público real. Las medidas de voz (frecuencia fundamental y su variabilidad) fueron en gran medida equivalentes entre las condiciones de público real y virtual.
Un hallazgo notable: los participantes que reportaron sentimientos de presencia más fuertes en VR mostraron respuestas más cercanas a las de su público real. La presencia parece ser una de las variables que determina si un entorno determinado es ecológicamente válido para una persona determinada.
Dasdogen y Hitchcock, 2026: la distancia virtual por sí sola cambia cómo las personas usan su voz
Dasdogen y Hitchcock (2026) se ocuparon de una pregunta diferente: si las propiedades visuales del entorno virtual (tamaño de la sala, distancia entre hablante y oyente) cambiarían el comportamiento vocal incluso cuando el entorno acústico se mantiene constante. Utilizando la situación de Salas de Therapy withVR, encontraron que las pistas de distancia afectaban significativamente a la intensidad y al tono vocal. Los cantantes con formación ajustaron su voz de forma más sistemática que los hablantes no formados.
Este es un estudio más pequeño (ocho mujeres adultas) pero importante conceptualmente. Muestra que el entorno virtual visual puede impulsar el comportamiento vocal por sí solo: la voz responde al contexto comunicativo percibido, no solo a la acústica física.
Walkom, 2016: prototipo temprano, piloto honesto
El piloto más temprano de este grupo probó una herramienta personalizada de VR para hablar en público con seis adultos que tartamudean. La ansiedad autoinformada disminuyó a lo largo de las sesiones, apareció activación fisiológica durante la exposición y los observadores reportaron cambios visibles en los patrones del habla en la sesión 2. Seis participantes no son evidencia de efecto, pero el piloto respaldó la viabilidad y planteó preguntas útiles para el trabajo posterior.
Kumar y colegas, 2024: viabilidad de la práctica de VR en casa
Kumar, Cecil y Tetnowski (2024) dieron el siguiente paso al sacar la VR del laboratorio. Cinco adolescentes y adultos jóvenes que tartamudean utilizaron visores comerciales de VR en casa durante una semana con escenarios de habla graduados. La frecuencia de tartamudez bajó del 18,67% al 9,71% de las sílabas, y la frecuencia cardiaca también bajó. Una vez más, cinco participantes sin una condición de comparación no son evidencia de efecto, pero el estudio demuestra que los programas de VR en casa son viables y vale la pena probarlos a escala.
Una vista tipo forest de la convergencia
Forest plot de estadísticos de convergencia de los tres estudios de comparación directa
Qué tan cerca siguieron las respuestas en VR a los equivalentes del mundo real, según correlación y efecto reportados
Los tres estudios de comparación directa convergen: Brundage muestra una correspondencia casi perfecta de orden de rango entre los públicos en VR y en directo en tartamudez y aprensión. Bettahi muestra efectos de la condición de pequeños a moderados (es decir, real vs. VR son similares) en la mayoría de las medidas de voz. Daşdöğen muestra que las pistas visuales por sí solas desplazan significativamente la producción vocal incluso con la acústica constante. Walkom 2016 (n=6, piloto mixto) y Kumar 2024 (n=5, viabilidad en casa) no se grafican aquí porque no prueban directamente la correspondencia entre público virtual y real.
Fuentes: Brundage & Hancock 2015 (American Journal of Speech-Language Pathology, DOI); Bettahi et al. 2026 (Frontiers in Virtual Reality); Daşdöğen & Hitchcock 2026 (Journal of Voice). Un η² parcial más bajo en Bettahi significa que las condiciones de VR y real produjeron respuestas más similares; para la medida de disfluencias, el efecto de la condición no fue significativo tras la corrección de Bonferroni (es decir, desempeño comparable entre condiciones). Los valores F significativos de Daşdöğen para la distancia al oyente muestran que las pistas visuales de distancia por sí solas desplazan de forma fiable la intensidad y el tono vocales. Nota: los recuentos de frecuencia tipo %SS se reportan aquí tal como los midieron los estudios originales; el campo se mueve cada vez más hacia la confianza autoevaluada, la disposición a comunicar y medidas orientadas a la participación.
Lo que sugiere la evidencia
A partir de estos cinco estudios, y del Evidence Hub más amplio en el que se sitúan, surgen varios patrones.
Los públicos virtuales bien diseñados producen respuestas que se parecen a las respuestas ante públicos reales. Esto es lo que mostraron tanto Brundage y Hancock como Bettahi y colegas, utilizando diferentes medidas de resultado (frecuencia cardiaca, voz, ansiedad y observación conductual). La convergencia entre medidas es más convincente que cualquier hallazgo individual.
La presencia importa, y varía entre personas. La presencia es la sensación subjetiva de estar dentro de un entorno virtual. Una mayor presencia se asocia con respuestas más cercanas a los equivalentes del mundo real. Esto sugiere que la validez ecológica es en parte una propiedad de la persona que utiliza el entorno, no solo del entorno en sí.
Solo el contexto visual puede dar forma al comportamiento vocal y comunicativo. El estudio de Dasdogen y Hitchcock muestra que las personas ajustan su voz en función del contexto virtual percibido, incluso cuando la acústica se mantiene constante. Esto importa para el trabajo de voz y para cualquier pregunta sobre cómo los hablantes calibran su producción ante los públicos.
La base de evidencia sigue siendo pequeña. Los tamaños muestrales son en su mayoría inferiores a veinte. Las poblaciones son a menudo no clínicas o estrechas. La transferencia a largo plazo a situaciones cotidianas está en gran parte sin probar. Estas son limitaciones reales que deberían moldear con qué confianza se aplica cualquier hallazgo.
Qué significa esto para la práctica diaria
Algunas conclusiones tentativas para los profesionales del habla y del lenguaje que consideran la práctica con VR como parte de su trabajo:
- La práctica del habla basada en VR parece implicar respuestas comunicativas genuinas, no solo performativas. Una sesión en un público virtual está más cerca de un público de práctica que de un juego de rol.
- Las diferencias individuales en presencia merecen atención. Si una persona no se siente inmersa, el entorno probablemente no esté haciendo el trabajo ecológico que se desea. Comprobar la presencia es barato e informativo.
- La generalización no está garantizada. Lo que ocurre en un café virtual ocurre en un café virtual. Si se traslada a un café real depende de factores que los estudios anteriores aún no responden plenamente. Incorporar la generalización a un plan (practicar la misma habilidad en varias situaciones, comprobar la experiencia en el mundo real) es un valor por defecto sensato.
- La VR no sustituye otras formas de práctica. Añade un contexto de práctica controlado y graduado a las opciones disponibles. La evidencia la respalda como una herramienta dentro de un kit, no como un tratamiento autónomo.
Notas editoriales de withVR
Los temas de esta investigación dieron forma al diseño de Therapy withVR. La situación del Auditorio existe gracias a trabajos como los de Brundage y Hancock y Bettahi. La situación de la Sala existe gracias a estudios como los de Dasdogen y Hitchcock. La función Goal existe para apoyar la cuestión de la generalización: permitir que las personas valoren su propia confianza antes y después de una sesión, en lugar de depender de objetivos de producción.
Nada de esto significa que los hallazgos de investigación de estudios sobre otros sistemas de VR se transfieran directamente a Therapy withVR. No lo hacen. Lo que Therapy withVR intenta hacer es proporcionar un entorno de práctica coherente con los temas que la evidencia plantea: situaciones graduadas, control clínico en tiempo real, confianza autoevaluada a lo largo del tiempo y entornos en los que las personas reportan sentirse presentes.
Lecturas complementarias
- Brundage y Hancock (2015) - el estudio fundacional sobre tartamudez en virtual frente a en directo
- Bettahi et al. (2026) - validación con múltiples medidas entre públicos reales y virtuales
- Dasdogen y Hitchcock (2026) - pistas visuales de distancia y comportamiento vocal
- Investigación sobre Therapy withVR - estudios que utilizaron el software directamente
- Lo que dos décadas de investigación de VR sobre ansiedad social significan para la práctica logopédica - base de evidencia adyacente de la literatura de ECA sobre ansiedad social
- Glosario del Evidence Hub - términos clave utilizados en los resúmenes de investigación
- Lecturas complementarias - libros y comunidades que dan forma a la práctica actual