Esta página fue traducida del inglés. Si algo suena extraño, cambia a la versión en inglés. Ver en inglés.

ECA con estudiantes de magisterio: añadir RV 360° al entrenamiento de voz resultó atractivo, pero a corto plazo no superó a imaginar el aula

Bostyn L et al. · 2026 · Journal of Voice · ECA · n = 63 · Estudiantes de magisterio en un programa flamenco (de habla neerlandesa) de formación docente... · DOI
Grado de certeza: Certeza baja
Cómo se ha evaluado

Ensayo controlado aleatorizado con asignación enmascarada y evaluadores enmascarados - puntos fuertes genuinos del diseño - pero varios factores limitan la certeza. La muestra (n=63) dejó varios resultados con potencia insuficiente, y los autores reconocen con franqueza que los intervalos de confianza de los tamaños del efecto para las medidas no significativas abarcan desde casi cero hasta valores grandes. Los principales resultados perceptuales evaluados por los investigadores (postura, tensión, proyección y el CAPE-V) tuvieron una fiabilidad interevaluador limitada (ICC tan bajos como 0,339), y los evaluadores no se calibraron juntos de antemano. El CAPE-V se administró bajo ruido blanco de 65 dB, lo que pudo inducir habla Lombard, por lo que los autores tratan esas puntuaciones perceptuales como valores relativos dentro del estudio más que como evaluaciones clínicas válidas. No se aplicó ninguna corrección para las numerosas comparaciones, y los autores encuadran explícitamente sus hallazgos como generadores de hipótesis y no como confirmatorios. Una diferencia preexistente en la línea base de tensión entre los grupos complica la única interacción límite. La conclusión más robusta - ningún beneficio adicional a corto plazo de la RV frente al control de imaginación, con ambos grupos mejorando en esfuerzo vocal y rango de intensidad - está razonablemente respaldada; las afirmaciones sobre la ventaja de la RV en cuanto al compromiso se apoyan en gran medida en cuestionarios de autoinforme.

Las valoraciones utilizan un esquema simplificado de cuatro niveles (Alta, Moderada, Baja, Muy baja), basado en el GRADE working group. Más información sobre cómo se evalúan los estudios.

En un ensayo controlado aleatorizado con 63 estudiantes de magisterio, añadir escenas escolares inmersivas en RV 360° a un programa preventivo de entrenamiento de voz de tres sesiones no produjo a corto plazo una mejora mayor en las medidas vocales que el mismo entrenamiento realizado mientras se imaginaba el aula. Ambos grupos redujeron su esfuerzo vocal autopercibido y ampliaron su rango de intensidad; el grupo de control mejoró ligeramente más en postura y tensión muscular, posiblemente un artefacto de llevar puesto el visor. La verdadera ventaja de la RV fue el compromiso: la mayoría de los participantes encontraron el aula y la cafetería virtuales realistas y agradables, mientras que aproximadamente 4 de cada 10 del grupo de control tuvieron dificultades para imaginar siquiera los entornos escolares.

Mensaje clínico clave

Un ECA exploratorio pero bien controlado (n=63) que muestra que añadir escenas escolares inmersivas en RV 360° a un programa preventivo breve de entrenamiento de voz de tres sesiones, dirigido a estudiantes de magisterio vocalmente sanos, no produjo a corto plazo una mejora mayor que el mismo entrenamiento impartido mientras se imaginaba el aula. Ambos enfoques redujeron el esfuerzo vocal autopercibido y ampliaron el rango de intensidad; las ganancias ligeramente mayores del grupo de control en postura y tensión se ven confundidas por un desequilibrio en la línea base, un plausible efecto del visor sobre la postura y una fiabilidad limitada de los evaluadores. La verdadera aportación del estudio es que la RV se calificó como realista y agradable, y que resultó más fácil que pedir a los participantes que imaginaran un aula en la que muchos nunca habían enseñado - lo que los autores proponen que podría favorecer la motivación y la adherencia. Eso es una hipótesis para ensayos más largos centrados en la transferencia, no una ventaja clínica demostrada. Se interpreta mejor como una señal de viabilidad y compromiso, no como evidencia de que la RV mejore los resultados de voz.

Hallazgos principales

  • El esfuerzo vocal autopercibido (Borg CR10) descendió significativamente en ambos grupos, sin ventaja de grupo: RV -1,05 puntos (d=-0,80, IC 95% [-1,25, -0,35]); control -0,83 puntos (d=-0,63, IC 95% [-1,06, -0,20]). Sin diferencia significativa entre grupos (p=0,320) y sin interacción tiempo*grupo (p=0,600).
  • Ambos grupos ampliaron significativamente su rango de intensidad (sonoridad) (p=0,002): RV +3,99 dB (d=0,60, IC 95% [0,12, 1,08]); control +3,35 dB (d=0,50, IC 95% [0,04, 0,96]); sin diferencia significativa entre grupos. La frecuencia fundamental y el rango de frecuencia no cambiaron significativamente, con intervalos de confianza amplios que sugieren que el estudio tenía potencia insuficiente para esas medidas.
  • En las medidas de escala analógica visual evaluadas por los investigadores, el grupo de control mejoró en postura (media -5,30, p=0,008, d=-0,64) y tensión muscular (-5,00, p<0,001, d=-0,81), mientras que el grupo de RV no lo hizo (postura -3,17, p=0,123; tensión -0,83, p=0,575). La única interacción tiempo*grupo límite para la tensión (p=0,046) se ve confundida por la mayor tensión en la línea base del grupo de control (16,36% frente a 12,83% de RV); tras el entrenamiento los dos grupos fueron similares (control 11,36%, RV 12,00%).
  • Calificaciones perceptuales CAPE-V: solo el esfuerzo (strain) mejoró en el conjunto de la muestra (p=0,017), pero ninguno de los grupos alcanzó la significación por sí solo (RV -2,50, p=0,100; control -2,58, p=0,076). La severidad global, el soplo (breathiness), la aspereza (roughness), el tono y la intensidad no mostraron cambios significativos, y la proyección de la voz no cambió en ninguno de los grupos.
  • La experiencia de usuario favoreció a la RV en cuanto a realismo: el 76,7% encontró realista el aula virtual y el 80% la cafetería, pero solo el 53,3% el patio de recreo (se atribuyó a los alumnos virtuales del vídeo 360°, escasos y de reacción lenta). El 70% encontró los entornos de RV escenarios agradables para practicar ejercicios de voz.
  • En contraste, el 42,4% del grupo de control tuvo dificultades para imaginar un aula, el 45,5% una cafetería y el 42,4% un patio de recreo; los participantes sin experiencia docente previa fueron los que más dificultades tuvieron, mientras que a quienes ya habían enseñado les resultó más fácil imaginar el entorno.
  • Los 63 participantes calificaron el entrenamiento como útil, y dos tercios no encontraron difíciles los ejercicios (RV 63,3%, control 66,7%; p=0,798). La práctica en casa autoinformada no difirió por grupo (RV 33,3%, control 45,5%; p=0,440), lo que sugiere que la RV en sí no impulsó práctica independiente adicional.
  • La fiabilidad de los evaluadores fue una limitación real: los ICC interevaluador oscilaron entre pobres (evaluadores 2-3 en 0,339) y aceptables/buenos (0,532-0,623), por lo que los autores aconsejan interpretar con cautela todos los resultados perceptuales evaluados por los investigadores (postura, tensión, proyección, CAPE-V).

Contexto

Los trastornos de la voz son frecuentes en el profesorado, con estimaciones de prevalencia que oscilan aproximadamente entre el 20% y el 80%, y las señales de alerta aparecen pronto: una parte considerable de los estudiantes de magisterio ya refiere síntomas vocales recurrentes antes de comenzar su carrera. La docencia impone exigencias sostenidas y de alta intensidad a la voz en salas acústicamente difíciles, y las consecuencias de las dificultades vocales van mucho más allá de la propia voz, afectando al absentismo, la identidad profesional, el bienestar e incluso la capacidad del alumnado para seguir lo que se dice.

Tanto los programas de entrenamiento de voz indirectos (centrados en la educación) como los directos (centrados en los ejercicios) pueden mejorar los síntomas y la conciencia vocales, pero persisten dos problemas: los efectos suelen ser modestos en participantes sanos y - lo más importante para este estudio - resulta difícil llevar las técnicas vocales recién aprendidas fuera de la sala de entrenamiento y al aula real. Se ha propuesto la realidad virtual inmersiva como una forma de cerrar esa brecha, permitiendo que las personas practiquen dentro de simulaciones realistas y controlables de los entornos donde realmente necesitan usarse las habilidades.

Este estudio se basa directamente en el trabajo previo de Remacle y colegas, quienes crearon un aula virtual generada por ordenador para el entrenamiento de voz de estudiantes de magisterio. Aquel trabajo anterior comparaba un programa indirecto con un programa directo apoyado en RV, lo que hacía imposible aislar el efecto de la RV en sí del efecto del contenido del entrenamiento. Bostyn y colegas se propusieron corregir esa confusión: mantuvieron constante el contenido del entrenamiento en ambos grupos y variaron únicamente si los ejercicios se realizaban dentro de un entorno escolar inmersivo en 360° o mientras simplemente se imaginaba uno.

Lo que hicieron los investigadores

Se trató de un ensayo controlado aleatorizado con un diseño de grupo de control pretest-postest, llevado a cabo por un equipo de la Universidad de Gante / KU Leuven en Bélgica. Participaron sesenta y tres estudiantes de magisterio inscritos en un programa flamenco de docencia de primaria o secundaria (todos neerlandófonos; 49 mujeres cisgénero y 14 hombres cisgénero; edad media de 28,9 años, DE 10,8). Los participantes eran vocalmente sanos: se excluyó a cualquiera con problemas auditivos autoinformados, una patología vocal orgánica diagnosticada, tabaquismo regular reciente o entrenamiento de voz intensivo previo. Se organizaron en pequeños grupos de entrenamiento de cuatro personas y se asignaron mediante aleatorización por conglomerados con bloques (con el sexo al nacer como factor de bloqueo) al grupo de RV (n=30) o al grupo de control (n=33), y se les mantuvo enmascarados respecto a la existencia de la otra condición.

Ambos grupos recibieron las mismas tres sesiones grupales de entrenamiento de voz de 90 minutos a lo largo de tres semanas consecutivas, impartidas por estudiantes de máster de logopedia con formación que ellos mismos estaban enmascarados respecto a la asignación. Las sesiones abarcaron higiene vocal más ejercicios de postura, respiración, resonancia (incluidos ejercicios de tracto vocal semiocluido), calentamiento vocal y proyección de la voz con articulación. La única diferencia experimental fue la forma de impartir los ejercicios:

El ruido de fondo (por ejemplo, alrededor de 75 dB en el patio de recreo y 40 dB en un aula tranquila) se equiparó entre los dos grupos, de modo que lo único que realmente difería era la inmersión visual proporcionada por la RV.

Antes de la primera sesión y después de la tercera, cada participante fue evaluado individualmente en:

  1. Esfuerzo vocal autopercibido en la escala Borg CR10, tras leer un pasaje largo bajo 65 dB de ruido blanco.
  2. Postura, tensión muscular y proyección de la voz evaluadas por los investigadores en una escala analógica visual de 0-100, más los seis parámetros perceptuales del CAPE-V (severidad, aspereza, soplo, esfuerzo, tono, intensidad), puntuados a partir del audio y el vídeo de una tarea espontánea de un minuto de “explicar un tema al aula” bajo ruido blanco.
  3. Medidas acústicas - frecuencia fundamental, rango de frecuencia fundamental y rango de intensidad (sonoridad) - analizadas en Praat a partir de vocales sostenidas y un pasaje leído.
  4. Un cuestionario sobre la experiencia de entrenamiento (preguntas generales para todos, más preguntas de realismo de la RV para el grupo de RV y preguntas de dificultad de imaginación para el grupo de control).

Los datos se analizaron con modelos lineales de efectos mixtos con tamaños del efecto d de Cohen. Los autores no aplicaron deliberadamente ninguna corrección para comparaciones múltiples y encuadran el ensayo como exploratorio; la fiabilidad de los evaluadores se comprobó con coeficientes de correlación intraclase.

Lo que encontraron

Ambos grupos mejoraron en los dos resultados más sensibles al entrenamiento a corto plazo, sin ventaja de la RV. El esfuerzo vocal autopercibido descendió significativamente en ambos grupos (RV -1,05, control -0,83 puntos Borg; efectos de medianos a grandes), y ambos ampliaron significativamente su rango de intensidad (RV +3,99 dB, control +3,35 dB; efectos moderados). No hubo diferencias significativas entre grupos ni interacciones en ninguna de las dos medidas - los dos métodos de impartición funcionaron aproximadamente igual de bien.

Donde los grupos difirieron, el grupo de control lo hizo ligeramente mejor - pero con salvedades. El grupo de control mostró mejoras significativas en la postura y la tensión muscular evaluadas por los investigadores, mientras que el grupo de RV no. Los autores son cautos aquí: el grupo de control partió con más tensión visible que el grupo de RV, los dos grupos acabaron siendo similares tras el entrenamiento, y varios participantes de RV refirieron sentirse abrumados o distraídos por el entorno inmersivo y señalaron que el visor dificultaba mantener una buena postura. Por tanto, el patrón de que “el control lo hizo mejor” es plausiblemente una mezcla de desequilibrio en la línea base, un artefacto del visor sobre la postura y la fiabilidad limitada de estas calificaciones perceptuales, más que una verdadera desventaja de la RV para la técnica vocal.

La mayoría de las demás medidas no se movieron. La proyección de la voz no cambió en ninguno de los grupos (las puntuaciones ya eran buenas en la línea base), y los parámetros perceptuales del CAPE-V se mantuvieron en gran medida planos, mejorando solo débilmente el “esfuerzo” (strain) en el conjunto de la muestra. La frecuencia fundamental y el rango de frecuencia no variaron - algo nada sorprendente, dado que los ejercicios se dirigían al apoyo respiratorio y la proyección más que al tono, y que los participantes eran vocalmente sanos, con poco margen de mejora. En casi todos los resultados no significativos, los intervalos de confianza eran lo bastante amplios como para que el estudio simplemente no pudiera descartar un efecto real; tenía potencia insuficiente.

El triunfo más claro de la RV fue experiencial. La mayoría de los participantes de RV calificaron el aula (76,7%) y la cafetería (80%) como realistas y los entornos como agradables para practicar (70%); el patio de recreo salió peor parado (53,3%), lo que se atribuyó a los alumnos virtuales del vídeo 360°, escasos y de reacción lenta. En contraste, una amplia minoría del grupo de control no pudo imaginar con viveza los entornos escolares en absoluto (alrededor del 42-45% en cada caso), y quienes nunca habían enseñado fueron los que más dificultades tuvieron. Todos los participantes calificaron el entrenamiento como útil, dos tercios encontraron fáciles los ejercicios, y la práctica en casa autoinformada no difirió entre los grupos.

Por qué es importante

Este es uno de los primeros ensayos que aísla el efecto de la inmersión visual de la RV en el entrenamiento de voz manteniendo idéntico el contenido del entrenamiento entre los grupos - la confusión que limitó los trabajos anteriores de RV con estudiantes de magisterio. Su titular honesto es un resultado nulo: a lo largo de tres sesiones, la RV inmersiva 360° no mejoró los resultados de voz a corto plazo más allá de los mismos ejercicios realizados mientras se imaginaba el aula, e incluso pudo desplazar la postura y la tensión en la dirección equivocada por la interferencia del visor.

La señal más interesante tiene que ver con el compromiso y el acceso. Pedir a un participante que nunca se ha puesto frente a una clase que “imagine el aula” fracasó con frecuencia, mientras que las escenas de RV se calificaron como realistas y agradables. Si un contexto vívido y con sensación de presencia ayuda a los participantes a mantenerse motivados y a practicar de forma constante - el mecanismo que proponen los autores - eso podría importar en un programa preventivo cuyo objetivo central es construir hábitos duraderos antes de que comiencen los problemas de voz. Pero los autores son explícitos en que esto es una hipótesis: aquí la motivación no fue un resultado controlado, el programa fue breve, los participantes eran vocalmente sanos, y cualquier beneficio de transferencia requeriría ensayos más largos con seguimiento en un aula real para demostrarse.

Para Therapy withVR en concreto: este estudio no utilizó, evaluó ni comparó con Therapy withVR. El sistema ensayado fue vídeo 360° personalizado grabado por el equipo de investigación y reproducido en una Meta Quest 3, utilizado para entrenar la técnica vocal de cara a la prevención de trastornos de la voz - un ámbito distinto del enfoque de Therapy withVR en ensayar situaciones de habla y gestionar la ansiedad relacionada con el habla. El artículo de Bostyn se incluye en el Evidence Hub porque añade evidencia a la base más amplia sobre RV inmersiva en logopedia, no porque se relacione con Therapy withVR.

Limitaciones

Los autores señalan lo siguiente en su discusión:

Implicaciones para la práctica

Para los clínicos y los programas de formación docente que sopesan la RV inmersiva como complemento del trabajo de voz preventivo, este ensayo no ofrece evidencia de que la RV 360° mejore los resultados de voz a corto plazo más allá del entrenamiento convencional, y un indicio de que llevar puesto un visor podría incluso interferir con la postura y la relajación durante el trabajo básico de técnica. Su señal práctica tiene que ver con el compromiso y el acceso: la mayoría de los participantes encontraron el aula y la cafetería virtuales realistas y agradables, mientras que una amplia minoría del grupo de control - especialmente quienes aún no habían enseñado - simplemente no podían visualizar con viveza el entorno escolar al que se supone que deben transferirse los ejercicios. Los autores son explícitos en que cualquier beneficio motivacional o de transferencia no está demostrado y requeriría programas más largos, de múltiples sesiones, con seguimiento en un aula real para demostrarse. Aquí la RV se considera mejor como una posible ayuda de motivación y contexto dentro de un programa preventivo para participantes vocalmente sanos, no como un motor de cambio vocal medible por sí misma.

Implicaciones para la investigación

Se necesitan estudios más grandes y más largos antes de poder afirmar que la RV aporta valor al entrenamiento de voz. Los autores piden evaluaciones de seguimiento y observaciones en aulas reales para comprobar si las cualidades inmersivas de la RV mejoran realmente la transferencia de las técnicas vocales a la docencia. Recomiendan aislar el paquete completo de RV (inmersión visual más elementos interactivos y una acústica de sala congruente) frente al entrenamiento tradicional con apoyo auditivo, ya que el vídeo 360° carece de la interactividad y la reverberación de una sala real. Las prioridades metodológicas incluyen evaluadores calibrados y entrenados conjuntamente con criterios de puntuación explícitos para elevar la fiabilidad interevaluador, medidas de resultado lo bastante sensibles para detectar cambios sutiles en poblaciones vocalmente sanas, y un diseño que pueda comprobar si la RV aumenta la inscripción voluntaria y la adherencia en los programas preventivos - una cuestión motivacional que este ensayo enmascarado no pudo abordar.

Notas editoriales de withVR

Cómo se relaciona esto con Therapy withVR

El estudio anterior es investigación independiente y no respalda ningún producto. Las notas siguientes son comentarios de withVR sobre cómo los temas de esta investigación se relacionan con funcionalidades de Therapy withVR. Los hallazgos de la investigación no constituyen afirmaciones sobre Therapy withVR.

Contexto de práctica inmersivo (con un propósito distinto)

Bostyn y colegas utilizaron vídeo 360° de escenas escolares reales - un aula, una cafetería y un patio de recreo grabados en una escuela primaria flamenca y reproducidos en una Meta Quest 3 - para dar a los ejercicios de voz un trasfondo ecológicamente válido. Therapy withVR comparte la idea general de practicar en entornos realistas y controlables, pero con un propósito distinto: ensayar situaciones de habla y gestionar la ansiedad relacionada con el habla, no entrenar la técnica vocal para la prevención de trastornos de la voz. El sistema estudiado es material de investigación personalizado creado por los autores, no un producto comercial, y no es Therapy withVR. Paralelismo editorial únicamente.

Compromiso y motivación

Un hallazgo central aquí fue que las escenas inmersivas se calificaron como realistas y agradables, y que una gran parte del grupo de control de solo imaginación no podía visualizar un entorno escolar en el que aún no había enseñado - lo que apunta al potencial de la RV para hacer que la práctica resulte más concreta y atractiva. Therapy withVR se construye en torno a la misma intuición de que un entorno vívido y con sensación de presencia favorece el compromiso y la práctica repetida. El estudio de Bostyn no evaluó Therapy withVR ni midió la motivación como resultado controlado. Paralelismo editorial únicamente.

Transferencia a entornos del mundo real

La motivación explícita del estudio fue lo difícil que resulta llevar las técnicas vocales del entrenamiento al aula real, y los autores piden trabajos futuros que utilicen la observación en el aula para comprobar esa transferencia. Therapy withVR está orientado de forma similar a la transferencia al mundo real de las habilidades practicadas, en su propio ámbito de las situaciones de habla y no del entrenamiento de voz. Esto es un paralelismo editorial de objetivos, no un método compartido ni un resultado sobre Therapy withVR. Paralelismo editorial únicamente.

Cita este estudio

Si haces referencia a este estudio en tu trabajo, estos son los formatos de cita canónicos:

APA 7th
Bostyn, L., Leyns, C., Saka, E., Vanhee, L., D'haeseleer, E., & Rombouts, E. (2026). Contextual Voice Training for Student Teachers: Exploring the Role of Virtual Reality. Journal of Voice. https://doi.org/10.1016/j.jvoice.2026.04.037.
AMA 11th
Bostyn L, Leyns C, Saka E, Vanhee L, D'haeseleer E, Rombouts E. Contextual Voice Training for Student Teachers: Exploring the Role of Virtual Reality. Journal of Voice. 2026. doi:10.1016/j.jvoice.2026.04.037.
BibTeX
@article{bostyn2026,
  author = {Bostyn, L. and Leyns, C. and Saka, E. and Vanhee, L. and D'haeseleer, E. and Rombouts, E.},
  title = {Contextual Voice Training for Student Teachers: Exploring the Role of Virtual Reality},
  journal = {Journal of Voice},
  year = {2026},
  doi = {10.1016/j.jvoice.2026.04.037},
  url = {https://withvr.app/es/evidence/studies/bostyn-2026}
}
RIS
TY  - JOUR
AU  - Bostyn, L.
AU  - Leyns, C.
AU  - Saka, E.
AU  - Vanhee, L.
AU  - D'haeseleer, E.
AU  - Rombouts, E.
TI  - Contextual Voice Training for Student Teachers: Exploring the Role of Virtual Reality
JO  - Journal of Voice
PY  - 2026
DO  - 10.1016/j.jvoice.2026.04.037
UR  - https://withvr.app/es/evidence/studies/bostyn-2026
ER  - 

¿Conoce alguna investigación que debería estar en esta base? Si un estudio relevante revisado por pares no figura aquí, envíe la referencia a hello@withvr.app. La base se mantiene actualizada a medida que crece la literatura.

Financiación e independencia

De la Declaración de Conflicto de Intereses del artículo: 'No existe conflicto de intereses.' El estudio fue aprobado por los Comités de Ética de UZ/KU Leuven (S 69469) y UZ/UGent (ONZ-2024-0241). Los autores declaran haber utilizado ChatGPT para mejorar el lenguaje y la legibilidad del manuscrito y afirman que revisaron y editaron el contenido y asumen plena responsabilidad sobre él. El artículo no informa de ninguna subvención ni fuente de financiación externa. La RV consistió en vídeos 360° que los autores grabaron en una escuela primaria flamenca, presentados en una Meta Quest 3 - es material de investigación personalizado, no un producto comercial, y no es Therapy withVR. Para plena transparencia: dos coautoras de este artículo (Clara Leyns y Evelien D'haeseleer) coautoraron por separado un estudio diferente (Leyns et al. 2025) que sí utilizó Therapy withVR y fue coautorado por el fundador de withVR, Gareth Walkom; el presente estudio Bostyn 2026 no utilizó Therapy withVR, no involucró a withVR BV en su financiación, diseño, ejecución ni autoría, y no declara ningún conflicto de intereses. Este resumen fue preparado de forma independiente por withVR a partir del artículo publicado, y la calificación de certeza refleja el diseño y las limitaciones del estudio, no la relación independiente de sus autores con la plataforma.

Última revisión: 2026-06-08 Próxima revisión prevista: 2027-06-08 Revisado por: Gareth Walkom