La mayoría de las personas con las que trabajo que utilizan Therapy withVR no investigan la ansiedad. Son profesionales del habla y del lenguaje que apoyan a clientes que tartamudean, clientes haciendo trabajo de voz, personas adultas autistas que se preparan para conversaciones difíciles, o alguien al borde de una entrevista de trabajo. Pero la ansiedad casi siempre aparece. Un hablante cuya habla se siente fácil en la sala clínica y se bloquea ante una reunión. Un cliente de voz cuyo tono y resonancia son exactamente los adecuados con el logopeda y desaparecen en el momento en que habla con un desconocido. Un adolescente que tiene las palabras pero no la disposición para usarlas en clase.

Durante décadas, los tratamientos diseñados de forma más explícita para este tipo de ansiedad social-evaluativa han salido de la literatura sobre trastornos de ansiedad, no de la literatura de logopedia. Esa brecha se está cerrando -ya hay trabajo directo significativo sobre la ansiedad al hablar en contextos de tartamudez y de voz- pero el cuerpo de evidencia más profundo sobre la VR para el habla socialmente evaluativa vive en ensayos hechos sobre el trastorno de ansiedad social y el miedo a hablar en público. Así que cuando un clínico me pregunta, con razón, qué evidencia respalda la VR como forma de apoyar a los clientes en situaciones cotidianas de habla, la respuesta honesta implica volver a recorrer lo que esas literaturas adyacentes muestran realmente.

Esta entrada reúne tres ensayos controlados aleatorizados y un metaanálisis. Cada uno es un estudio que se puede tomar en serio: con tamaño adecuado, metodológicamente cuidadoso, revisado por pares en publicaciones respetadas. Ninguno fue diseñado específicamente para probar logopedia. Pero cada uno nos dice algo útil sobre si y cómo la práctica basada en VR puede apoyar a las personas en los tipos de situaciones cotidianas de habla que les importan.

Los cuatro estudios de un vistazo

Exposición basada en VR para ansiedad social y al hablar en público

  1. 2013n = 97 · ECA

    Anderson et al. - exposición con VR equivalente a TCC en grupo

    Ambos grupos activos mejoraron significativamente sobre la lista de espera; sin diferencia estadística entre exposición con VR y TCC en grupo. Ganancias mantenidas en el seguimiento a 12 meses.

  2. 2009n = 88 · ECA

    Wallach, Safir y Bar-Zvi - TCC con VR equivale a TCC tradicional, con menor abandono

    Reducciones equivalentes en ansiedad al hablar en público. El abandono fue menor en la condición de VR; las personas participantes valoraron la TCC con VR como más atractiva.

  3. 2017n = 59 · ECA

    Bouchard et al. - ensayo de superioridad preregistrado: la VR supera a la exposición in vivo

    La exposición con VR fue significativamente más eficaz que la exposición en el mundo real en la LSAS-SR (t(56)=2.02, p<.05). Los autores también documentaron ventajas prácticas: menos engorroso, menor coste, confidencialidad más fácil.

  4. 2012metaanálisis

    Opriş et al. - relación dosis-respuesta en la literatura

    Los tamaños del efecto agrupados muestran grandes ganancias frente a la lista de espera y efectos equivalentes a tratamientos activos no basados en VR. Más sesiones produjeron mayores ganancias: un patrón claro de dosis-respuesta.

Los cuatro estudios están enlazados individualmente en las secciones de abajo y en el Evidence Hub. Los tamaños muestrales muestran cómo se compara cada uno: menos de 20 = piloto, 20-50 = pequeño, 50+ = generalizable.

Anderson 2013: la exposición con VR iguala a la TCC en grupo, con ganancias que perduran

Anderson y colegas (2013) realizaron un ensayo controlado aleatorizado con 97 personas adultas que experimentaban ansiedad social. Las personas participantes fueron asignadas a uno de tres grupos: exposición con VR como sesiones individuales, terapia cognitivo-conductual en grupo como comparador activo bien establecido, o lista de espera. Ambas condiciones activas se ejecutaron durante el mismo número de sesiones a lo largo del mismo periodo.

Ambos grupos activos produjeron mejoras significativas sobre la lista de espera. Los dos grupos activos produjeron mejoras equivalentes entre sí. No hubo diferencia estadística entre la exposición con VR realizada individualmente y la terapia cognitivo-conductual en grupo realizada en formato grupal. Y las ganancias se mantuvieron en el seguimiento a 12 meses, no solo duraderas durante unas semanas, sino estables a lo largo de un año.

Lo que me llevo de esto para la práctica logopédica. La TCC en grupo es logísticamente exigente y no siempre accesible. También requiere que la persona participe en un contexto grupal, que a menudo es precisamente lo que más le cuesta. La exposición con VR ofrece a los clínicos una forma de impartir una experiencia equivalente basada en la exposición de manera individual. Para los clientes que evitan los grupos por las mismas razones que les llevaron a terapia en primer lugar, esto importa.

Wallach 2009: la TCC con VR iguala a la TCC tradicional para la ansiedad al hablar en público, con menor abandono

Wallach, Safir y Bar-Zvi (2009) realizaron un ECA con 88 personas centrado específicamente en la ansiedad al hablar en público. Las personas participantes fueron asignadas aleatoriamente a terapia cognitivo-conductual basada en VR, TCC tradicional o lista de espera. Ambas condiciones activas se realizaron durante 12 sesiones semanales.

El hallazgo principal fue que la TCC con VR y la TCC tradicional produjeron reducciones equivalentes en la ansiedad al hablar en público, ambas significativamente mayores que el efecto de la lista de espera. Pero hubo un hallazgo secundario al que pienso se le presta poca atención. El abandono fue menor en la condición de VR. Las personas participantes valoraron la TCC con VR como más atractiva que la TCC tradicional.

Los efectos del tratamiento en el mundo real dependen de dos cosas, no de una. Dependen de la eficacia por sesión y de si las personas completan el curso de tratamiento. Una modalidad que sea igualmente eficaz por sesión pero produzca menos abandono ofrece más beneficio agregado a nivel poblacional que su efecto por sesión por sí solo sugeriría. Si veinte personas comienzan una intervención y quince la terminan, esa intervención ayuda a quince. Si veinte personas comienzan una intervención distinta pero igual de eficaz y dieciocho la terminan, esa intervención ayuda a dieciocho. La diferencia en abandono no es una nota al margen.

Bouchard 2017: un ensayo de superioridad preregistrado muestra que la VR supera a la exposición en el mundo real

El ensayo que encuentro metodológicamente más interesante es Bouchard y colegas (2017), publicado en British Journal of Psychiatry. Realizaron un ECA de tres brazos con 59 personas adultas diagnosticadas con trastorno de ansiedad social. Los tres brazos fueron TCC con exposición in virtuo (VR), TCC con exposición in vivo (mundo real) y un control de lista de espera. Ambos brazos activos recibieron 14 sesiones semanales de estructura idéntica: solo difería la modalidad de exposición.

El detalle metodológico crucial es que este fue un ensayo de superioridad preregistrado. Los investigadores se comprometieron por adelantado a probar si la exposición con VR era más eficaz que la exposición in vivo: una hipótesis que sitúa el listón más alto que la equivalencia. El preregistro importa porque cierra parte de la flexibilidad analítica posterior que históricamente ha inflado las estimaciones de efecto en investigación clínica.

El resultado: la exposición con VR fue significativamente más eficaz que la exposición in vivo. En la medida de resultado primaria (LSAS-SR), la VR superó a la exposición in vivo al postratamiento (t(56)=2.02, p<.05) y en el seguimiento a 6 meses (F(1,37)=4.78, p<.05). Las tasas de cambio fiable fueron del 76,5 % para la VR y del 68,3 % para la in vivo: una diferencia direccionalmente coherente que no alcanzó significación estadística por sí sola, pero la medida primaria continua sí. Los investigadores también documentaron ventajas prácticas para la condición de VR. En sus propias palabras, la exposición in virtuo fue «significantly less cumbersome and costly to conduct than in vivo ones, in terms of having access to relevant stimuli to induce ridicule, duration, preparation, worries about confidentiality, costs of gathering staff members to attend at public speaking exercises».

Bouchard et al. 2017 · n = 59 · ECA de tres brazos preregistrado

Cambio fiable tras 14 semanas de TCC para la ansiedad social

0%25%50%75%100%Índice de cambio fiable (% de personas participantes)76.5%TCC + exposición con VR13 / 17 personas participantes68.3%TCC + exposición in vivo15 / 22 personas participantes30.0%Control de lista de espera6 / 20 personas participantesχ²(2) = 9.78 global,p < .01. La medida continua primaria (LSAS-SR) favoreció significativamente a la VR.

Ambos tratamientos activos produjeron sustancialmente más cambio fiable que la lista de espera. La VR superó ligeramente a la in vivo aquí; la diferencia fue direccionalmente coherente, pero la significación se concretó en la medida continua LSAS-SR.

Fuente: Bouchard S, Dumoulin S, Robillard G, et al. (2017). Virtual reality compared with in vivo exposure in the treatment of social anxiety disorder: a three-arm randomised controlled trial. British Journal of Psychiatry, 210(4), 276-283. DOI: 10.1192/bjp.bp.116.184234.

Quiero extraer una implicación específica de esto. El argumento a favor de la práctica del habla basada en VR a veces se enmarca como «la VR es un paso preparatorio útil antes de la práctica en el mundo real». Este ensayo respalda una lectura más fuerte. La exposición con VR no es una forma de prepararse para la exposición en el mundo real. Es una modalidad de exposición por derecho propio, que en este ensayo produjo resultados superiores en la medida primaria con un esfuerzo de implementación significativamente menor.

Opriş 2012: un patrón meta-analítico de dosis-respuesta

El cuarto estudio que quiero discutir no es un ensayo, sino un metaanálisis. Opriş y colegas (2012) agruparon tamaños del efecto de múltiples estudios primarios de exposición con VR para trastornos de ansiedad. Encontraron, como también sugieren los ensayos revisados arriba, que la exposición con VR produjo grandes tamaños del efecto frente a la lista de espera y efectos equivalentes a las intervenciones basadas en evidencia no basadas en VR.

Pero el hallazgo que quiero destacar es otro distinto: la relación dosis-respuesta. A lo largo de los estudios, más sesiones produjeron mayores ganancias. Este es un patrón coherente con cómo se teoriza que funcionan las terapias basadas en exposición: a través de un compromiso repetido y estructurado con la situación temida, permitiendo que se acumulen la habituación y el cambio cognitivo. No es una propiedad exclusiva de la VR, pero tiene una implicación clínica específica para el trabajo basado en VR.

La implicación es esta: una demostración de una sola sesión no es la prueba adecuada de lo que la práctica de habla basada en VR puede hacer. El mecanismo es la práctica sostenida, multisesión -graduada, controlada, repetida- y la evidencia sugiere que sus beneficios escalan con el volumen de práctica. Los clínicos que trabajan con VR deberían planificar progresiones de práctica multisesión, no ensayos puntuales.

Cuatro estudios, una dirección

Forest plot de tamaños del efecto para los contrastes de VR frente a la comparación

Cuatro estudios sobre ansiedad social, graficados con los tamaños del efecto reportados

VR frente a comparador activo-1.0-0.500.51.0d de Cohen (VR menos comparador)favorece al comparador ←→ favorece a la VRAnderson 2013n=97 - vs. TCC en grupoequivalente al post + 12 meses(d específica no extraída)Wallach 2009n=88 - vs. TCC tradicionalequivalente en 4 de 5 medidasabandono VR 18% vs. TCC 33%Bouchard 2017n=59 - vs. exposición in vivod ≈ 0.54t(56)=2.02, p<.05Opriş 2012 meta15 estudios - n > 535d = 0.16 [-0.03, 0.36]equivalencia con EBT, p>,05VR frente a lista de espera00.51.01.52.0d de Cohen (VR frente a sin tratamiento)Wallach 2009VRCBT+CBT agrupado, LSAS-Evit.d = 1.00 [0.42, 1.15]efecto grande, p<,0001Opriş 2012 meta8 estudios (VR vs. lista de espera)d = 1.12 [0.71, 1.52]gran efecto agrupado, p<,05Contraste equivalente / nuloVR favorecida (estadísticamente significativo)Barras horizontales = intervalo de confianza del 95% (cuando se reporta)

Panel superior: frente a condiciones de comparación activas, ningún estudio favoreció al comparador sobre la VR; uno (Bouchard 2017) favoreció a la VR. Panel inferior: frente a lista de espera sin tratamiento, la VR produjo grandes efectos agrupados. Evidencia convergente con dirección coherente entre los distintos diseños de estudio.

Fuentes: Anderson et al. 2013 (J Consult Clin Psychol), Wallach et al. 2009 (Behav Modif), Bouchard et al. 2017 (Br J Psychiatry, DOI), Opriş et al. 2012 (Depress Anxiety, DOI). Anderson 2013 se muestra cualitativamente porque el PDF original está rasterizado y los valores específicos de la d de Cohen no se pudieron extraer por medios automáticos; el artículo fuente reporta equivalencia entre VR y TCC en grupo en la LSAS. La estimación de la d de Bouchard se deriva del t(56)=2.02 reportado mediante d = 2t/√df. La d de Wallach es el efecto agrupado VRCBT+CBT frente a lista de espera en LSAS-Evitación. La de Opriş es la d de Cohen metaanalítica ponderada entre los resultados primarios.

Qué significa esto para la logopedia

Estos cuatro estudios fueron diseñados para abordar el trastorno de ansiedad social y el miedo a hablar en público, no la tartamudez, el trabajo de voz, la comunicación autista o cualquier otro contexto específico de comunicación. Quiero tener cuidado de no sobreafirmar. La transferencia de «la exposición con VR funciona para la ansiedad social» a «la práctica con VR apoya la confianza al hablar en una persona que tartamudea» es una transferencia de evidencia entre poblaciones, y esa transferencia necesita su propia validación. El Evidence Hub ya tiene estudios directos de VR con personas que tartamudean -Brundage y Hancock (2015), Brock (2023), Kumar (2024)- y trabajo creciente en voz. La prueba directa más reciente en autismo es McCleery et al. (2026), un ECA paralelo en adolescentes y personas adultas autistas que comparó tres sesiones cortas de VR con video modelling para la práctica de interacción con la policía. El grupo de VR dio respuestas significativamente más apropiadas y mostró un lenguaje corporal más tranquilo durante una post-prueba en el mundo real con agentes reales; el control de video modelling no. Esos estudios directos hacen la mayor parte del trabajo pesado para las afirmaciones específicas por población.

Lo que hace la literatura sobre ansiedad social es establecer cuatro cosas que son útiles como contexto.

Una: la exposición graduada, controlable y repetible funciona. El mecanismo está establecido en múltiples condiciones de ansiedad en ensayos con comparadores activos y muestras adecuadas. El ingrediente activo no es la VR per se, es la exposición impartida de una forma que permite al clínico controlar la intensidad, repetir de forma fiable y progresar en pasos que la persona pueda manejar. La VR es una forma de impartir esas propiedades; las propiedades importan más que el medio.

Dos: la VR puede sustituir a la exposición in vivo, no solo precederla. El hallazgo de superioridad de Bouchard plantea esta cuestión de forma más directa que la equivalencia. Para los clínicos que trabajan en contextos donde organizar la práctica de habla en el mundo real es difícil -zonas rurales, escuelas con limitaciones de privacidad, contextos donde la confidencialidad importa- esto va más allá de una autorización. La VR no es un recurso secundario cuando la in vivo no está disponible; es una modalidad de exposición por derecho propio, que en este ensayo produjo resultados superiores en la medida primaria con una carga logística significativamente menor.

Tres: el abandono importa tanto como la eficacia por sesión. El hallazgo de Wallach merece más atención clínica de la que recibe. Una modalidad que implica suficientemente a las personas como para mantenerlas en tratamiento ofrece más beneficio agregado, incluso con efectos por sesión equivalentes.

Cuatro: la dosis importa, y una sesión no es la prueba. El patrón de dosis-respuesta del metaanálisis aboga por planificar progresiones de práctica multisesión en lugar de tratar la VR como una demostración puntual. Un fallo común que veo en uso clínico temprano es depender en exceso del «wow» de la primera sesión. La evidencia sugiere que ese es el lugar equivocado para poner el peso.

Lo que no afirmo

No afirmo que estos estudios prueben que la práctica basada en VR funciona para la tartamudez, el trabajo de voz o cualquier otro contexto específico de comunicación. Los estudios directos en esas áreas son más pequeños, menos maduros y se encuentran en una fase distinta de desarrollo de evidencia. El encuadre honesto es: una base de evidencia adyacente robusta respalda la modalidad y su mecanismo subyacente, la evidencia directa es más pequeña y crece, y los clínicos deberían sopesar ambas.

Tampoco afirmo que la VR sustituya a la experiencia clínica. Cada ensayo anterior fue diseñado por clínicos, impartido con criterio clínico y evaluado con supervisión clínica. La tecnología es el medio, no el profesional. Los hallazgos se trasladan cuando la práctica es buena práctica.

Una nota sobre los próximos veinte años

Gran parte del trabajo de VR sobre ansiedad social al que me he referido aquí tiene ahora entre diez y veinte años. La tecnología ha cambiado sustancialmente, de visores con cable en laboratorios de investigación a dispositivos de consumo autónomos que caben en la maleta de un clínico. La estructura de la práctica no ha cambiado. La exposición graduada, controlable y repetible sigue siendo el mecanismo activo. Lo que cambia es el acceso: quién puede impartirla, dónde y a qué coste.

Por eso pienso que la evidencia que ya tenemos -aunque adyacente- respalda una confianza cautelosa sobre la dirección del campo, incluso mientras la evidencia directa sigue acumulándose en las áreas específicas en las que trabajan los profesionales del habla y del lenguaje. La brecha se está cerrando. Y mientras tanto, dos décadas de investigación de VR sobre ansiedad social están haciendo más trabajo útil para la práctica logopédica del que a veces se les reconoce.

Lecturas complementarias