¿Quiénes participaron en este estudio?

Este estudio incluyó 12 participantes: Niños y adolescentes que tartamudean (6 niñas, edad 9-18)

Esta página fue traducida del inglés. Si algo suena extraño, cambia a la versión en inglés. Ver en inglés.

ECA piloto en jóvenes que tartamudean: la RV con avatar fotorrealista en directo fue bien aceptada, pero no superó al juego de roles

Delangle M et al. · 2026 · Journal of Fluency Disorders · ECA · n = 12 · Niños y adolescentes que tartamudean (6 niñas, edad 9-18) · DOI

Grado de certeza: Certeza baja

Cómo se ha evaluado

ECA piloto con asignación aleatoria (n=12; 6 por grupo), inferencia bootstrap (10.000 remuestreos) apropiada para muestras pequeñas y objetivos preespecificados. El Objetivo 1 (aceptabilidad, presencia) fue apoyado; el Objetivo 2 (provocar respuestas fisiológicas) fue parcialmente apoyado con una disminución inesperada de FC en ambos grupos; el Objetivo 3 (valor añadido de RV frente a juego de roles con logopeda tras una sola sesión) NO fue apoyado. Limitaciones que restringen la certeza: muestra muy pequeña, sesión de entrenamiento única, dos actores-profesores distintos en la Sesión 2, SUDS retrospectivo, ausencia de medida de tendencias inmersivas, y una relación académico-industrial relevante: el coautor Stephane Bouchard es asesor y accionista de Cliniques et Developpement In Virtuo (empresa de desarrollo de RV), aunque el artículo señala que esa empresa no creó los entornos utilizados en este estudio.

Las valoraciones utilizan un esquema simplificado de cuatro niveles (Alta, Moderada, Baja, Muy baja), basado en el GRADE working group. Más información sobre cómo se evalúan los estudios.

ECA piloto que aleatorizó a 12 niños y adolescentes que tartamudean (edades 9-18) a dos condiciones antes de afrontar a un actor-profesor desconocido: conversación con un profesor virtual fotorrealista en RV controlado por su logopeda mediante captura facial (n=6), o juego de roles cara a cara con el logopeda (n=6). El sistema fue bien aceptado (alta presencia, bajo cibermareo). La conductancia de la piel se elevó en el grupo de RV; el juego de roles aumentó más la ansiedad autoinformada. Una sesión no superó al juego de roles en autoeficacia ni ansiedad in vivo posterior.

Mensaje clínico clave

Un ECA piloto con muestra reducida (n=12, 6 por grupo) que muestra que un sistema de RV con avatar fotorrealista en tiempo real controlado por el logopeda mediante captura de movimiento facial es aceptable y factible para adolescentes que tartamudean y provoca activación fisiológica durante la conversación cara a cara. El estudio NO demostró un valor añadido de una sesión de RV frente a una sesión de juego de roles con logopeda en autoeficacia o en la reducción de la ansiedad durante una conversación in vivo posterior. Se interpreta mejor como un estudio de factibilidad y como señal para investigación de múltiples sesiones, no como evidencia de efectividad clínica.

Hallazgos principales

La aceptabilidad del sistema y la presencia fueron elevadas: ITC-SOPI Presencia Espacial M=3,60/5 (DE=0,70), Compromiso M=3,87/5 (DE=0,78), Validez Ecológica M=3,27/5 (DE=1,53), Efectos Negativos M=1,58/5 (DE=0,60). Los ítems IWA mostraron 'sentí que estaba hablando con una persona real' M=8,43/10, 'las situaciones practicadas eran relevantes' M=9,29/10, 'me gustaría usar esta herramienta para situaciones estresantes' M=9,57/10
La mayoría de los participantes NO reconocieron a su propio logopeda detrás del avatar (ítem IWA 2 M=2,86/10; menor es mejor aquí). La modulación de voz (Clownfish Voice Changer) más la captura de movimiento facial Live Link Face fue efectiva, excepto para los dos participantes de mayor edad (16 y 18 años) que reconocieron la prosodia de su logopeda (puntuaciones 10 y 8 respectivamente)
El nivel de conductancia de la piel (SCL) del grupo experimental fue significativamente más elevado respecto a la línea base durante la preparación del discurso y la conversación en la Sesión 1 (in virtuo p=,006 y p=,009) y la Sesión 2 (in vivo p<,001 y p=,008). El grupo de control de juego de roles con logopeda NO mostró elevación significativa de SCL respecto a la línea base en ninguna fase de ninguna sesión
Las respuestas de conductancia de la piel (SCR) ante estímulos específicos inductores de ansiedad fueron significativamente MÁS frecuentes en el grupo de juego de roles con logopeda que en el grupo de RV durante la Sesión 1, especialmente para el fruncimiento del ceño (t=-3,79, p<,05) y para todos los estímulos combinados (t=-3,76, p<,05). Dentro del grupo experimental, las tasas de detección de SCR fueron comparables entre las condiciones in virtuo (Sesión 1) e in vivo (Sesión 2) (t(4)=-1,07, p=,35)
El SUDS autoinformado del grupo de RV NO difirió significativamente de la línea base durante la conversación in virtuo, mientras que el SUDS del grupo de juego de roles con logopeda fue significativamente más elevado que la línea base (p<,001 tanto al inicio como al final de la conversación). El efecto entre grupos al final de la conversación fue grande (d=1,35, IC 95% [-2,77, -0,67], p=,031)
Inesperadamente, la frecuencia cardíaca DISMINUYÓ respecto a la línea base en ambos grupos en la mayoría de las fases (por ejemplo, experimental Sesión 1 conversación FC IC 95% [-9,828, -2,325], p=,002; control Sesión 1 conversación FC IC 95% [-6,038, -2,029], p<,001), y el RMSSD a menudo AUMENTÓ, interpretado por los autores como adaptación o habituación autonómica más que como el aumento de activación predicho
La autoeficacia NO difirió significativamente entre grupos en ningún punto temporal (todos p>,58) y NO cambió significativamente dentro de ningún grupo desde la Sesión 1 hasta la Sesión 2 (experimental Z=-1,36, p=,17, r=,60; control Z=-0,94, p=,345, r=,39). Los tamaños del efecto moderados dentro del grupo (r=0,36-0,60) sugieren tendencias potenciales que muestras más grandes podrían detectar
Una única sesión de entrenamiento en cualquiera de las dos condiciones NO redujo la ansiedad durante la conversación in vivo posterior con el actor-profesor desconocido: ambos grupos mostraron SUDS elevado al inicio de la conversación en la Sesión 2 (experimental p=,003; control p=,002), volviendo cerca de la línea base al final de la conversación

Contexto

La tartamudez en niños y adolescentes en edad escolar va acompañada con frecuencia de ansiedad social. Iverach et al. (2016) informaron de que los niños que tartamudean tienen aproximadamente seis veces más probabilidades que sus compañeros no tartamudos de desarrollar un trastorno de ansiedad social, y la ansiedad social en esta población tiende a aumentar a lo largo de la adolescencia. La TCC con exposición graduada es eficaz para reducir la ansiedad social en adultos que tartamudean, pero pocas intervenciones empíricas han abordado específicamente la ansiedad en jóvenes que tartamudean.

La terapia de exposición se basa tradicionalmente en experiencias in vivo o en juegos de roles en consulta con el clínico. Ambas presentan limitaciones: la exposición in vivo es logísticamente difícil y ofrece al terapeuta poco control sobre la situación, mientras que el juego de roles está limitado por la conciencia de los participantes de que el clínico es una figura familiar y segura, no un desconocido. La realidad virtual ha sido propuesta como un punto intermedio controlable, pero la mayor parte del trabajo de RV en tartamudez hasta la fecha ha utilizado escenarios de grupo o audiencia (Brundage et al. 2006, 2016; Brundage y Hancock 2015; Moise-Richard et al. 2021) en lugar de conversación cara a cara naturalista individual, y se ha basado en comportamientos de avatar preprogramados o estáticos en lugar de respuestas dinámicas en tiempo real.

Delangle y colegas (el mismo equipo de investigación que Moise-Richard et al. 2021) se propusieron abordar dos vacíos: la ausencia de medidas fisiológicas en el trabajo previo del equipo con aulas virtuales, y la ausencia de un escenario de RV cara a cara en tiempo real que simule la dinámica naturalista y recíproca de la conversación cotidiana.

Qué hicieron los investigadores

Trece niños y adolescentes que tartamudean fueron reclutados en el Centre de Réadaptation Marie Enfant (CHU Sainte-Justine), el Institut Raymond-Dewar y clínicas privadas de logopedia en Montreal, Quebec. Se excluyó a una adolescente (exposición previa a RV similar durante la grabación de un programa de televisión), dejando doce participantes en el análisis (6 niñas; edades 9-18, M=13,1, DE=3,0). Todos habían sido diagnosticados profesionalmente de tartamudez por un logopeda certificado, estaban en tratamiento terapéutico activo y habían completado al menos tres sesiones con su propio terapeuta. La asignación aleatoria mediante generador de números aleatorios produjo dos grupos equilibrados (n=6 por brazo). Las medidas de línea base de ansiedad social (LSAS-CA) y confianza para hablar en público (PRCS forma breve) no mostraron diferencias significativas entre grupos.

El sistema de RV. Se construyó un profesor virtual fotorrealista usando MetaHuman y se renderizó en una Meta Quest 2 en Unreal Engine 5.03. Desde una sala adyacente, el logopeda controlaba el avatar en tiempo real: un iPhone 11 con Live Link Face capturaba los movimientos de labios, boca, ojos, cejas y cabeza del terapeuta y los transmitía al avatar; Clownfish Voice Changer aplicaba un efecto de voz masculina consistente (las logopedas eran mayoritariamente femeninas, y se eligió un avatar masculino de aproximadamente 40-50 años específicamente para limitar el reconocimiento). El logopeda veía un espejo en vivo de la perspectiva del participante en un portátil, lo que permitía respuestas verbales y no verbales dinámicas. Una animación corporal sutil del avatar (ligero balanceo, movimiento neutro de brazos) era impulsada por Adobe Mixamo para evitar una apariencia estática antinatural. La geometría del escritorio del aula virtual y la sala de experimentación estaban emparejadas para mejorar la sensación de encarnación.

Procedimiento. Cada participante completó dos sesiones separadas aproximadamente dos semanas (M=12 días, DE=11,3, rango 3-42). Cada sesión tuvo tres fases:

Línea base - una conversación de 3 minutos con un miembro desconocido del equipo de investigación (distinto del logopeda y del actor-profesor) sobre temas neutros (aficiones, música, destinos de viaje) para capturar la activación relacionada con el habla.
Preparación del discurso - una discusión de 3 minutos con el mismo miembro del equipo sobre posibles adaptaciones en el aula que el participante podría solicitar en relación con su tartamudez.
Tarea conversacional - una conversación de 5 minutos (M=4,7 min, DE=1,6) con el “profesor” en la que el participante informaba de su tartamudez y negociaba adaptaciones en el aula. El profesor introdujo tres categorías de estímulos inductores de ansiedad, presentados al menos una vez cada uno: fruncimiento del ceño, bostezos y frases incómodas programadas (“No es justo para los demás estudiantes”, “¿Por qué debería hacerte adaptaciones especiales?”). Los logopedas recibieron entrenamiento para esperar al menos 20 segundos entre estímulos y no introducir dos simultáneamente; se les instruyó para no reforzar la búsqueda de tranquilización ni las conductas de evitación.

En la Sesión 1, la Tarea Conversacional del grupo experimental fue in virtuo (su propio logopeda controlaba el avatar desde la sala adyacente); la del grupo de control fue un juego de roles presencial con el logopeda. En la Sesión 2 (in vivo, para ambos grupos), la Tarea Conversacional fue con un actor-profesor desconocido en persona.

Medidas.

Aceptabilidad y presencia (Objetivo 1): ITC-SOPI (44 ítems en subescalas de Presencia Espacial, Compromiso, Validez Ecológica, Efectos Negativos) y un cuestionario de Interacción con Avatares (IWA) elaborado ad hoc.
Ansiedad fisiológica (Objetivos 2 y 3): Actividad electrodérmica (nivel de conductancia de la piel SCL, respuesta de conductancia de la piel SCR) y electrocardiograma (frecuencia cardíaca FC, variabilidad de la FC mediante RMSSD) registrados con un sistema Biopac MP36R y procesados con AcqKnowledge y NeuroKit2. Se utilizó una colocación adaptada de electrodos ECG periféricos (pierna izquierda + antebrazo derecho) en lugar de la colocación estándar clavicular-costal para ser menos intrusiva con los niños.
Ansiedad autoinformada (Objetivos 2 y 3): SUDS modificado de 0-10 administrado tras la línea base, tras la preparación del discurso y retrospectivamente tras la conversación (para el inicio y el final de la conversación por separado).
Autoeficacia (Objetivo 3): un cuestionario a medida de 14 ítems (1 = “Nada seguro” a 5 = “Muy seguro”) adaptado de Bray et al. 2003 / Manning 1994 (marco sociocognitivo de Bandura). Alfa de Cronbach = 0,87.

Análisis estadístico. Dado el tamaño reducido de la muestra, los autores utilizaron remuestreo bootstrap paramétrico (datos fisiológicos continuos) y no paramétrico (datos ordinales de cuestionarios) con 10.000 iteraciones en IBM SPSS Statistics 29 y Python. La significación se infirió a partir de intervalos de confianza del 95% (no solapamiento con la línea base cero o con el intervalo del otro grupo) y valores p bootstrap. Los tamaños del efecto (d de Cohen, r de Pearson) se informaron junto con los resultados. No se aplicaron correcciones por comparaciones múltiples porque el remuestreo bootstrap proporciona estimaciones empíricas de significación sin supuestos paramétricos.

Qué encontraron

Objetivo 1 - aceptabilidad y presencia. Las subescalas del ITC-SOPI indicaron buena presencia: Presencia Espacial M=3,60 (DE=0,70), Compromiso M=3,87 (DE=0,78), Validez Ecológica M=3,27 (DE=1,53; un participante la calificó como 1/5, contribuyendo al mayor DE), Efectos Negativos M=1,58 (DE=0,60). En el IWA, los participantes sintieron que estaban hablando con una persona real (M=8,43/10), NO sintieron que estaban hablando con su propio logopeda (M=2,86/10; las puntuaciones más bajas indican que el enmascaramiento de la encarnación del logopeda fue exitoso), encontraron los escenarios simulados relevantes (M=9,29/10) y querían firmemente tener acceso a la herramienta para practicar situaciones estresantes (M=9,57/10). Los dos participantes de mayor edad (16 y 18 años) dieron las puntuaciones más altas de “sentí que estaba hablando con mi logopeda” (10 y 8 respectivamente), reconociendo la prosodia y la entonación de su logopeda más que la voz modulada.

Objetivo 2 - respuestas de ansiedad fisiológica y subjetiva. El SCL del grupo experimental de RV fue significativamente más elevado respecto a la línea base durante la preparación del discurso (Sesión 1: IC 95% [0,404, 2,578], p=,006; Sesión 2: IC 95% [0,215, 0,935], p<,001) y la conversación (Sesión 1: IC 95% [0,351, 2,142], p=,009; Sesión 2: IC 95% [0,859, 4,471], p=,008). El grupo de control de juego de roles con logopeda NO mostró elevación significativa de SCL respecto a la línea base en ninguna fase de ninguna sesión (todos p>,05).

Las tasas de detección de SCR mostraron un patrón inesperado en la Sesión 1: el grupo de control mostró significativamente MÁS SCR que el grupo experimental, especialmente para el fruncimiento del ceño (t=-3,79, p<,05) y para todos los estímulos combinados (t=-3,76, p<,05). Los autores interpretan esto como que el fruncimiento del ceño es una señal no verbal sutil que puede ser más difícil de percibir con precisión desde un avatar fotorrealista que desde una persona real. Dentro del grupo experimental, las tasas de detección de SCR fueron comparables entre las condiciones in virtuo (Sesión 1) e in vivo (Sesión 2) (t(4)=-1,07, p=,35), lo que sugiere que el avatar provocó respuestas fisiológicas vinculadas a estímulos comparables a las que evocó una persona real para los mismos individuos.

La frecuencia cardíaca y el RMSSD produjeron un patrón inesperado en ambos grupos. En lugar del aumento de FC predicho con el estrés, ambos grupos mostraron DISMINUCIÓN de FC respecto a la línea base en la mayoría de las fases, e INCREMENTO del RMSSD durante la conversación experimental de la Sesión 1. Los autores lo interpretan como adaptación o habituación autonómica durante el estrés social (Kreibig, 2010), señalando que las respuestas de FC no siempre siguen el patrón esperado en contextos de ansiedad social.

El SUDS autoinformado mostró una clara disociación respecto a la activación fisiológica. En la Sesión 1, el SUDS del grupo de RV durante la conversación in virtuo NO difirió significativamente de la línea base. El SUDS del grupo de juego de roles con logopeda fue significativamente más elevado que la línea base tanto al inicio (IC 95% [2,00, 4,33], p<,001) como al final (IC 95% [2,16, 5,16], p<,001). El efecto entre grupos al final de la conversación fue grande (d=1,35, IC 95% [-2,77, -0,67], p=,031).

En la Sesión 2 (in vivo para ambos grupos), ambos grupos mostraron SUDS elevado al inicio de la conversación y volvieron cerca de la línea base al final, con tamaños del efecto entre grupos que se volvieron pequeños.

Objetivo 3 - valor añadido de la RV frente al juego de roles con logopeda. La autoeficacia no mostró diferencias estadísticamente significativas entre grupos en ningún punto temporal (todas p>,58) ni cambios estadísticamente significativos dentro de los grupos desde antes de la conversación de la Sesión 1 hasta después de la conversación de la Sesión 2 (experimental Wilcoxon Z=-1,36, p=,17, r=,60; control Z=-0,94, p=,345, r=,39). Los autores concluyen que una única sesión de entrenamiento en cualquiera de las dos condiciones no produjo mejoras significativas en la autoeficacia ni redujo la ansiedad durante la conversación in vivo posterior.

Por qué importa

Este es el primer estudio en tartamudez que implementa un entorno de RV cara a cara en tiempo real con un avatar fotorrealista cuyo comportamiento verbal y no verbal es controlado en directo por un clínico mediante captura de movimiento facial, y que combina esto con medidas fisiológicas y subjetivas emparejadas. Extiende el trabajo previo del mismo equipo de investigación con aulas virtuales (Moise-Richard et al. 2021) desde escenarios de grupo o audiencia a la conversación individual, y aborda la ausencia de medición fisiológica de ese estudio previo.

La contribución interpretativa más destacada es la disociación entre la activación fisiológica elevada (SCL) y el malestar subjetivo sin cambios (SUDS) en la condición de RV, un patrón consistente con el modelo tripartito de la ansiedad de Lang y con Brundage et al. (2016) en adultos que tartamudean. Si un protocolo futuro de múltiples sesiones confirma esta disociación de forma fiable, los autores proponen que podría apoyar el uso de la RV como punto de entrada inicial para adolescentes con conductas de evitación que de otro modo rechazarían la exposición in vivo: el cuerpo activa el mecanismo de activación relevante para la extinción del miedo mientras que la experiencia consciente de amenaza permanece tolerable. Los autores son explícitos en que esto es una inferencia del patrón de disociación, no un efecto de tratamiento demostrado por este estudio.

Igualmente importante es lo que el estudio NO demostró: una única sesión de entrenamiento con RV no fue superior a una única sesión de juego de roles con logopeda en la reducción de la ansiedad o la mejora de la autoeficacia cuando los participantes se enfrentaron posteriormente a un actor-profesor desconocido. Los autores son claros en que se necesitan protocolos de múltiples sesiones dentro de un marco completo de TCC antes de hacer cualquier recomendación clínica sobre el valor añadido de la RV.

Para Therapy withVR específicamente: este estudio no utilizó, evaluó ni comparó con Therapy withVR. El sistema ensayado es una aplicación personalizada de Unreal Engine 5.03 / MetaHuman controlada por captura de movimiento facial del logopeda en una Meta Quest 2. Therapy withVR es una plataforma diferente con un modelo de control diferente. El artículo de Delangle se incluye en el Evidence Hub porque añade evidencia a la base más amplia sobre RV inmersiva para la ansiedad al hablar en jóvenes que tartamudean, no porque se relacione con Therapy withVR.

Limitaciones

Los autores señalan explícitamente las siguientes limitaciones:

Muestra muy pequeña. N=12, 6 por grupo. Se observó una variación individual sustancial tanto en las respuestas percibidas como en las fisiológicas. Se necesita una muestra más grande para caracterizar la variabilidad e identificar perfiles de respuesta.
Única sesión de entrenamiento. Los autores son explícitos en que una sesión es insuficiente para evaluar efectos de entrenamiento sobre autoeficacia y ansiedad; se necesitan protocolos de múltiples sesiones.
Inconsistencia de los actores-profesores en la Sesión 2. Dos actores distintos desempeñaron el papel de profesor in vivo en toda la muestra (emparejados en rango de edad y constitución física, ambos comprometidos en ambos grupos), pero cada actor tenía naturalmente rasgos prosódicos diferentes y reacciones únicas.
El mismo logopeda desempeñó ambos roles en todos los participantes. El propio logopeda de cada participante a veces controlaba el avatar (grupo experimental) y a veces era el interlocutor del juego de roles presencial (grupo de control).
Reconocimiento del logopeda por los participantes de mayor edad. Los dos participantes de mayor edad (16 y 18 años) reconocieron la prosodia y el estilo de habla de su logopeda a pesar de la modulación de voz.
Medición retrospectiva del SUDS. El SUDS se administró después de la conversación para no interrumpir la tarea. Los participantes que regularon su ansiedad de forma natural durante la conversación pueden haber subestimado retrospectivamente la ansiedad máxima.
Sin medida de tendencias inmersivas. El Cuestionario de Tendencias Inmersivas (Witmer y Singer, 1998) fue excluido para reducir la carga cognitiva sobre los participantes más jóvenes. Las diferencias individuales en la propensión a la inmersión pueden explicar la variabilidad en la presencia subjetiva y las respuestas emocionales.
No se compararon escenarios individuales vs. de grupo. Algunos participantes informaron menor ansiedad de la esperada en situaciones individuales; trabajos futuros podrían comparar la RV con un solo avatar con escenarios de grupo virtual.
Sin seguimiento ocular. Algunos niños parecían evitar el contacto visual con el profesor virtual; el seguimiento ocular ayudaría a cuantificar las conductas de evitación.
Actor desconocido en lugar de profesor real. La Sesión 2 in vivo utilizó un actor desconocido en lugar del propio profesor de cada participante, mejorando el control experimental pero reduciendo las consecuencias personales reales y potencialmente contribuyendo a una menor ansiedad percibida.
No es un marco completo de exposición TCC. El procedimiento es más exactamente una “sesión de entrenamiento” que terapia de exposición formal basada en TCC con jerarquía graduada, encuadre de violación de expectativas y consolidación post-exposición a lo largo de múltiples sesiones.
Conflicto de interés a declarar. El coautor Stephane Bouchard es asesor y accionista de Cliniques et Developpement In Virtuo, empresa de desarrollo de RV. El artículo declara explícitamente que esa empresa no creó los entornos utilizados en este estudio, pero la relación accionarial es un factor de contexto relevante al evaluar el encuadre interpretativo del artículo sobre el potencial terapéutico de la RV.

Implicaciones para la práctica

Para los clínicos que consideran la RV inmersiva para adolescentes que tartamudean, este ensayo piloto apoya la aceptabilidad y factibilidad de un sistema de RV con avatar fotorrealista en tiempo real, pero NO aporta evidencia de que una sesión de RV reduzca la ansiedad o mejore la autoeficacia más que una sesión de juego de roles con logopeda antes de una tarea de habla en el mundo real. La propuesta interpretativa de los autores - que la activación fisiológica elevada combinada con un malestar subjetivo sin cambios podría hacer de la RV un punto de entrada útil para jóvenes con conductas de evitación que rechazarían la exposición in vivo - es una inferencia del patrón de disociación, no un efecto de tratamiento demostrado por este estudio. Los autores son explícitos en que la RV debe usarse dentro de un marco de TCC de múltiples sesiones junto con enfoques tradicionales, no como intervención aislada de una sola sesión.

Implicaciones para la investigación

Se necesita replicación con muestras más grandes y a lo largo de múltiples sesiones de entrenamiento antes de poder hacer cualquier afirmación sobre el valor clínico añadido de la RV frente al juego de roles con logopeda. Los estudios futuros deberían incorporar una medida validada de tendencias inmersivas (por ejemplo, el ITQ de Witmer y Singer), seguimiento ocular para conductas de evitación, comparación entre escenarios individuales y de grupo o audiencia, y un protocolo de exposición completo basado en TCC con encuadre de violación de expectativas y una jerarquía de sesiones graduada. Los autores también señalan que el reconocimiento prosódico por parte de los adolescentes mayores (16-18 años) de su propio logopeda detrás del avatar merece investigación adicional.

Notas editoriales de withVR

Cómo se relaciona esto con Therapy withVR

El estudio anterior es investigación independiente y no respalda ningún producto. Las notas siguientes son comentarios de withVR sobre cómo los temas de esta investigación se relacionan con funcionalidades de Therapy withVR. Los hallazgos de la investigación no constituyen afirmaciones sobre Therapy withVR.

Avatar controlado por el clínico en tiempo real (plataforma distinta)

Este estudio utilizó un sistema personalizado Unreal Engine 5.03 / MetaHuman en una Meta Quest 2, donde el logopeda controlaba las expresiones faciales del profesor virtual en tiempo real mediante Live Link Face en un iPhone 11, con modulación de voz a través de Clownfish Voice Changer. Therapy withVR utiliza un modelo de control diferente: el clínico ajusta los parámetros del entorno, las emociones del avatar y el comportamiento del público desde una aplicación web, en lugar de encarnar facialmente un único avatar mediante captura de movimiento. Paralelismo editorial únicamente: la herramienta estudiada es software de investigación personalizado creado por los autores, no un producto comercial.

Dificultad conversacional ajustable

El estudio Delangle introdujo estímulos graduados inductores de ansiedad (fruncimiento del ceño, bostezos, frases incómodas programadas como 'No es justo para los demás estudiantes') durante la conversación, con el logopeda dosificando cada estímulo en función de las reacciones del participante. Los controles de clínico de Therapy withVR permiten ajustes análogos en tiempo real de las emociones del avatar y la dinámica conversacional dentro de su propio diseño. Paralelismo editorial únicamente.

Flexibilidad de múltiples sesiones

Los autores de Delangle señalan explícitamente que una sesión de entrenamiento fue insuficiente para detectar efectos sobre la autoeficacia o la transferencia de la ansiedad, y recomiendan protocolos de múltiples sesiones dentro de un marco completo de TCC. Los perfiles de sesión y las configuraciones guardadas de Therapy withVR facilitan el tipo de práctica repetida y gradual que la investigación de múltiples sesiones requiere. Paralelismo editorial únicamente.

Cita este estudio

Si haces referencia a este estudio en tu trabajo, estos son los formatos de cita canónicos:

APA 7th

Delangle, M., Moise-Richard, A., Leclercq A-L, Labbe, D., Bouchard, S., Andrews, S., & Menard, L. (2026). Speaking face-to-face with a virtual avatar to reduce anxiety in students who stutter: Tool development and pilot study results. Journal of Fluency Disorders. https://doi.org/10.1016/j.jfludis.2026.106194.

AMA 11th

Delangle M, Moise-Richard A, Leclercq A-L, Labbe D, Bouchard S, Andrews S, Menard L. Speaking face-to-face with a virtual avatar to reduce anxiety in students who stutter: Tool development and pilot study results. Journal of Fluency Disorders. 2026. doi:10.1016/j.jfludis.2026.106194.

BibTeX

@article{delangle2026,
  author = {Delangle, M. and Moise-Richard, A. and Leclercq A-L and Labbe, D. and Bouchard, S. and Andrews, S. and Menard, L.},
  title = {Speaking face-to-face with a virtual avatar to reduce anxiety in students who stutter: Tool development and pilot study results},
  journal = {Journal of Fluency Disorders},
  year = {2026},
  doi = {10.1016/j.jfludis.2026.106194},
  url = {https://withvr.app/es/evidence/studies/delangle-2026}
}

RIS

TY  - JOUR
AU  - Delangle, M.
AU  - Moise-Richard, A.
AU  - Leclercq A-L
AU  - Labbe, D.
AU  - Bouchard, S.
AU  - Andrews, S.
AU  - Menard, L.
TI  - Speaking face-to-face with a virtual avatar to reduce anxiety in students who stutter: Tool development and pilot study results
JO  - Journal of Fluency Disorders
PY  - 2026
DO  - 10.1016/j.jfludis.2026.106194
UR  - https://withvr.app/es/evidence/studies/delangle-2026
ER  -

¿Conoce alguna investigación que debería estar en esta base? Si un estudio relevante revisado por pares no figura aquí, envíe la referencia a hello@withvr.app. La base se mantiene actualizada a medida que crece la literatura.

Financiación e independencia

Según la Declaración de Conflictos de Interés del propio artículo: 'Stephane Bouchard es asesor y accionista de Cliniques et Developpement In Virtuo, que desarrolla entornos virtuales; sin embargo, Cliniques et Developpement In Virtuo no creó los entornos virtuales utilizados en este estudio. Ninguno de los demás autores tiene conflictos de interés que declarar.' La participación accionarial de Bouchard en una empresa comercial de desarrollo de RV es una relación de contexto relevante que cualquier lector debe tener en cuenta al evaluar el encuadre interpretativo del artículo sobre el potencial terapéutico de la RV, aunque la empresa no sea explícitamente la desarrolladora de la herramienta ensayada. Según los Agradecimientos del artículo: 'Este trabajo fue financiado por los Fonds de recherche du Quebec (FRQ) a través del programa AUDACE (número de subvención 2022-AUDC-300126).' La herramienta de RV fue desarrollada a medida por el equipo de investigación utilizando Unreal Engine 5.03 (Epic Games) con recursos de Quixel Bridge y un avatar MetaHuman en una Meta Quest 2; no es un producto comercial ni es Therapy withVR. Sin participación de withVR BV en la financiación, el diseño del estudio ni la autoría. Resumen elaborado de forma independiente por withVR a partir del artículo publicado.

Última revisión: 2026-05-12 Próxima revisión prevista: 2027-05-12 Revisado por: Gareth Walkom

ECA piloto en jóvenes que tartamudean: la RV con avatar fotorrealista en directo fue bien aceptada, pero no superó al juego de roles

Hallazgos principales

Contexto

Qué hicieron los investigadores

Qué encontraron

Por qué importa

Limitaciones

Implicaciones para la práctica

Implicaciones para la investigación

Cómo se relaciona esto con Therapy withVR

Avatar controlado por el clínico en tiempo real (plataforma distinta)

Dificultad conversacional ajustable

Flexibilidad de múltiples sesiones

Estudios relacionados

Las respuestas de tartamudez y ansiedad en audiencias virtuales corresponden de cerca a las de audiencias reales

Las audiencias en RV elevan el malestar subjetivo pero no la activación ni la frecuencia de tartamudez en hombres adultos que tartamudean

ECA piloto de exposición en RV autoguiada por smartphone para la ansiedad social en personas que tartamudean (resultado primario nulo)

En 10 niños y adolescentes que tartamudean, las aulas virtuales produjeron ansiedad y severidad comparables a una audiencia real

Cita este estudio

Financiación e independencia