Esta página fue traducida del inglés. Si algo suena extraño, cambia a la versión en inglés. Ver en inglés.

Breve terapia vocal en RV con feedback clínico provocó prosodia docente en futuros docentes, pero aumentó el malestar vocal autoinformado

Nudelman CJ, Bottalico P · 2026 · Journal of Voice · Cuasiexperimental · n = 10 · Mujeres estudiantes de educación con voz sana (edad 18-19) · DOI
Grado de certeza: Certeza muy baja
Cómo se ha evaluado

Estudio piloto intra-sujetos de sesión única con n=10 matriculadas (9 analizadas por un fallo de grabación), todas estudiantes universitarias de educación femeninas de 18-19 años de una sola universidad (UIUC), todas con voz sana en la línea base. **Orden fijo de condiciones** (control → estilo docente → intervención de RV) sin contrabalanceo; los autores señalan esto explícitamente como un posible confundidor de orden/práctica/calentamiento, y reconocen diferencias en la duración de la tarea entre condiciones (el control fue mucho más corto). Las 10 participantes fueron 'respondedoras'. Los autores declaran explícitamente: 'la significación estadística en este estudio piloto no equivale a significación clínica'. Se realizaron múltiples LME (13 en total) sin corrección por comparaciones múltiples; los autores lo justifican en bases exploratorias en fase temprana. Relación de contexto relevante: el autor correspondiente Charles J. Nudelman es también el primer autor de la revisión de alcance de Nudelman, Niu, Hutz y Edwards (2026) de RV inmersiva en logopedia ya en este Evidence Hub.

Las valoraciones utilizan un esquema simplificado de cuatro niveles (Alta, Moderada, Baja, Muy baja), basado en el GRADE working group. Más información sobre cómo se evalúan los estudios.

Piloto intra-sujetos de sesión única con 10 futuras docentes (9 analizadas). Tanto una lección simulada de estilo docente como una intervención de enseñanza en RV dirigida por el clínico provocaron prosodia de estilo docente frente a un control conversacional. La retroalimentación del clínico al estilo TEC dentro de la RV produjo modulaciones a corto plazo en SPL, fo y Dt%. Aspecto crítico: la condición de RV también aumentó significativamente el malestar vocal autoinformado frente al control (+20,5 EVA, p=,023): una advertencia que debe acompañar cualquier cita clínica.

Mensaje clínico clave

Un pequeño estudio piloto de sesión única (n=10 matriculadas, 9 analizadas, todas estudiantes universitarias de educación femeninas) que evalúa una breve intervención de RV para la enseñanza y la voz con retroalimentación de clínico al estilo de la Terapia de Entrenamiento Conversacional. Tanto la condición de estilo docente como la condición de intervención de enseñanza en RV produjeron cambios prosódicos consistentes con el habla de estilo docente frente a un control conversacional. La retroalimentación del avatar clínico dentro de la RV produjo modulaciones a corto plazo de los parámetros vocales (menor SPL, fo, Dt%; mayor SPL_dt). PERO la propia condición de RV AUMENTÓ significativamente el malestar vocal autoinformado frente a la condición de control, un hallazgo que debe acompañar cualquier interpretación clínica. Los autores son explícitos: 'la significación estadística en este estudio piloto no equivale a significación clínica' y 'Estos hallazgos son preliminares'. Se interpreta mejor como evidencia de factibilidad del modelo de aplicación RV + TEC e hipótesis generadora de señal para la modulación fonatoria a corto plazo, NO como evidencia de que la logopedia de voz en RV reduzca la discapacidad vocal o mejore los resultados a largo plazo.

Hallazgos principales

  • 10 participantes matriculadas, 9 analizadas (un fallo de grabación); todas estudiantes universitarias de educación femeninas de 18-19 años (M=18,5 DE=0,7), todas con voz sana en la línea base (superaron las pruebas de cribado con VHI-10, V-RQOL, VFI, estroboscopia y audiometría de tonos puros), de la Facultad de Educación de la University of Illinois Urbana-Champaign
  • Orden fijo de condiciones (sin contrabalanceo): control (5 min de habla conversacional) → estilo docente (20 min de lección simulada individual con un miembro del equipo de investigación) → intervención de enseñanza en RV (20 min en RV con retroalimentación de avatar clínico al estilo TEC)
  • Hallazgos entre condiciones frente al control: el SPL NO difirió significativamente. SPL_dt fue mayor en RV (+0,6 dB, p=,045). fo fue mayor en la condición de estilo docente (+9,7 Hz, p=,020) pero NO en RV (p=,120). fo_dt fue mayor TANTO en estilo docente (+8,4 Hz, p=,014) COMO en RV (+5,6 Hz, p=,007). Dt% fue MENOR en RV (-5,5%, p<,001)
  • Dentro de RV, la retroalimentación del avatar clínico (mano levantada activada cuando el SPL superó el percentil 85 de la línea base de la participante derivado de la condición de estilo docente; mínimo 1 min entre indicaciones) produjo modulaciones a corto plazo significativas: SPL -1,5 dB (p<,001), fo -5,6 Hz (p=,011), Dt% -4,7% (p=,001), SPL_dt +0,4 dB (p=,007). fo_dt no mostró efecto de retroalimentación
  • Estado vocal autoinformado (EVA 0-100) - condición de estilo docente frente a control: esfuerzo vocal +18 (p=,013), fatiga vocal +15 (p=,022), malestar vocal +27,9 (p=,003). Condición de RV frente a control: esfuerzo vocal +11,5 (NS, p=,095), fatiga vocal +4,2 (NS, p=,503), MALESTAR vocal +20,5 (p=,023)
  • Advertencia crítica: la condición de RV AUMENTÓ significativamente el malestar vocal autoinformado frente al control. Los autores lo interpretan dentro del contexto más amplio de los cambios inducidos por TEC, pero debe señalarse en cualquier cita clínica
  • Cuestionario de Presencia de Gatineau Modificado (0-100): Presencia M=75,0 (DE=24,6), Realista M=65,5 (DE=29,1), Artificial M=46,0 (DE=31,3), Conciencia de RV M=51,5 (DE=30,8), Voz Afectada M=50,5 (DE=22,9). Comparable con las medidas paralelas de Remacle et al. 2023 con estudiantes de magisterio
  • Hardware/software: casco de RV Meta Quest 2 ejecutando el software Ovation; auriculares abiertos Sennheiser HD600; auralización en el software Reaper simulando un aula capturada previamente con un simulador de cabeza y torso; medidor de nivel sonoro NTi XL2 monitorizando el SPL del participante en tiempo real; cámara web Logi C270 HD retransmitiendo la pantalla del SLM al equipo de investigación fuera de la cámara anecoica; micrófono calibrado NTi Audio M2211 para la grabación de voz a 30 cm del participante; mezclador Tascam UH-7000; Audacity 3.1.3 + Reaper para grabación; MATLAB R2023b + Praat 6.0.13 + R 4.2.0 para análisis; LME ajustados por REML con interceptos aleatorios de participante
  • Advertencias interpretativas explícitas de los autores: 'La significación estadística en este estudio piloto no equivale a significación clínica. Dado el tamaño reducido de la muestra y la breve intervención de sesión única, no debe asumirse que la magnitud de los cambios acústicos observados en los presentes resultados se traduzca en resultados vocales clínicamente significativos. Más bien, estos datos preliminares proporcionan una señal inicial que justifica un examen más detallado en estudios con potencia adecuada diseñados para evaluar el impacto clínico.'

Contexto

Los docentes se encuentran entre los usuarios vocales ocupacionales que con mayor frecuencia desarrollan trastornos de la voz: aproximadamente el 57% de los docentes estadounidenses informan de problemas de voz, y entre el 20% y el 35% de los docentes en formación ya muestran síntomas de trastornos vocales antes de incorporarse al trabajo. La mayoría de los programas de bienestar vocal se aplican en entornos clínicos que no reproducen las señales auditivas y visuales de un aula real, lo que contribuye a un persistente desafío de transferencia en la logopedia de voz. Nudelman y Bottalico se propusieron evaluar en fase piloto una breve intervención preventiva de logopedia de voz en RV con docentes en formación, combinando elementos de la Terapia de Entrenamiento Conversacional (TEC) con retroalimentación clínica en tiempo real aplicada dentro de un aula de RV inmersiva.

La intervención se sitúa en la intersección de tres líneas previas: las demostraciones de Remacle y colegas de que las aulas de RV pueden provocar las características vocales de estilo docente de los docentes (2021, 2023); el desarrollo por parte del grupo Gartner-Schmidt/Gillespie de la TEC como logopedia de voz centrada en la generalización (2016, 2019, 2021); y la literatura más amplia de aprendizaje motor que enfatiza la relevancia contextual para la transferencia de habilidades.

Qué hicieron los investigadores

Diez estudiantes universitarias de educación de la Facultad de Educación de la UIUC fueron reclutadas mediante folleto y palabra de boca. Todas superaron las pruebas de cribado de voz (VHI-10, V-RQOL, VFI, estroboscopia) y una prueba de audición (audiometría de tonos puros 250-8000 Hz). Las diez eran femeninas, de 18-19 años (M=18,5, DE=0,7). El experimento tuvo lugar en un solo día en una cámara anecoica de doble pared Whisper Room (226 × 287 × 203 cm) en la UIUC.

Tres condiciones en orden fijo (sin contrabalanceo; los autores señalan esto como una limitación):

  1. Condición de control (5 minutos): Participante sentada a un metro de un miembro del equipo de investigación en la Whisper Room. Habló sobre sí misma y describió un día típico. Diseñada para provocar habla conversacional.

  2. Condición de estilo docente (20 minutos): Mismo disposición individual. La participante impartió una lección al miembro del equipo de investigación como si estuviera en un aula real. El SPL vocal de la participante fue monitorizado mediante un medidor de nivel sonoro calibrado NTi XL2 (muestreo de 1 segundo). Esta fue una provocación clínica del habla de enseñanza, NO una simulación completa de aula.

  3. Condición de intervención de enseñanza en RV (20 minutos): Participante con el casco Meta Quest 2 ejecutando el software Ovation, con auriculares abiertos Sennheiser HD600 ejecutando el software de auralización Reaper (auralización capturada de un aula real mediante un simulador de cabeza y torso). La vista de la participante: un aula virtual con múltiples avatares de estudiantes virtuales. El clínico (Nudelman) controlaba un avatar virtual en la escena; un medidor de nivel sonoro NTi XL2 (retransmitido en vivo mediante una cámara web Logi C270 HD a un miembro del equipo de investigación fuera de la Whisper Room) monitorizaba el SPL vocal de la participante. Cuando el SPL superaba el percentil 85 de la línea base de la participante derivado de la condición de estilo docente, el investigador monitor indicaba al avatar clínico que levantara la mano dentro de la pantalla de RV, señalando a la participante que prestara atención a su producción vocal mediante indicaciones de habla clara al estilo TEC. Mínimo 1 minuto entre indicaciones. Pre-intervención: ensayo de estimulabilidad para indicaciones de habla clara TEC.

Medidas de resultado (tras cada condición):

Análisis. Modelos lineales de efectos mixtos (LME) ajustados por REML en R 4.2.0, con el ID de participante como intercepto aleatorio. Dentro de la condición de RV, la presencia de retroalimentación se examinó como segundo factor fijo en LME separados. Ventana de 30 segundos tras cada evento de retroalimentación utilizada como segmento de análisis. 13 LME en total. Los autores explícitamente NO aplicaron correcciones por comparaciones múltiples, justificándolo en base al carácter exploratorio en fase temprana.

Qué encontraron

Aceptabilidad y presencia. Valoraciones del CPG modificado (0-100): Presencia M=75,0 (DE=24,6), Realista M=65,5 (DE=29,1), Artificial M=46,0 (DE=31,3), Conciencia de RV M=51,5 (DE=30,8), Voz Afectada M=50,5 (DE=22,9). Son descriptivamente comparables a las medidas paralelas de Remacle et al. (2023) con estudiantes de magisterio, lo que indica niveles ampliamente similares de inmersión y realismo.

Resultados acústicos vocales entre condiciones (frente al control como referencia). El SPL NO difirió significativamente entre ninguna de las tres condiciones. SPL_dt fue mayor en RV (+0,6 dB, p=,045); los autores interpretan esto como un estilo más animado, perceptualmente consistente con patrones de voz más saludables en usuarios vocales ocupacionales. fo fue mayor en la condición de estilo docente (+9,7 Hz, p=,020) pero NO en la condición de RV (p=,120). fo_dt fue mayor TANTO en la condición de estilo docente (+8,4 Hz, p=,014) COMO en la condición de RV (+5,6 Hz, p=,007), ambas provocaron prosodia de estilo docente. Dt% fue MENOR en RV (-5,5%, p<,001) que en la condición de control; el estilo docente no difirió del control en Dt%.

Resultados acústicos vocales dentro de RV: retroalimentación presente vs. ausente. Tras cada episodio de retroalimentación del avatar clínico (dentro de la ventana de análisis de 30 segundos):

Los autores interpretan estos como modulaciones a corto plazo consistentes con la reducción de la carga vocal, y advierten explícitamente que las magnitudes son modestas y pueden no generalizarse.

Estado vocal autoinformado (EVA 0-100). La condición de estilo docente aumentó el esfuerzo vocal (+18,0, p=,013), la fatiga vocal (+15,4, p=,022) y el malestar vocal (+27,9, p=,003) frente al control. La condición de RV aumentó el malestar vocal (+20,5, p=,023) frente al control, pero no difirió significativamente del control en esfuerzo vocal (+11,5, p=,095) ni en fatiga vocal (+4,2, p=,503). El aumento del malestar vocal en la condición de RV es un hallazgo que debe acompañar cualquier interpretación clínica: la RV no fue ‘más fácil’ para los participantes que la línea base conversacional.

Por qué importa

Este estudio piloto es uno de los primeros en integrar retroalimentación clínica al estilo de la Terapia de Entrenamiento Conversacional con un aula de RV inmersiva para el trabajo preventivo de voz con docentes en formación. Los hallazgos acústicos - en particular el mayor fo_dt tanto en la condición de estilo docente como en la condición de RV (que indica prosodia de estilo docente) y las modulaciones a corto plazo en SPL, fo y Dt% tras la retroalimentación del avatar clínico - apoyan la factibilidad del modelo de aplicación y proporcionan una señal inicial de que la RV + TEC puede producir ajustes fonatorios mensurables.

Pero tres advertencias son fundamentales para la interpretación clínica:

  1. La condición de RV AUMENTÓ significativamente el malestar vocal autoinformado frente al control. Este aspecto no aparece en el encuadre actual del Evidence Hub, que se centra en los hallazgos acústicos positivos. Cualquier cita clínica debe acompañar los cambios acústicos con el hallazgo de malestar: los participantes no experimentaron la RV como más fácil que la línea base conversacional.

  2. Los autores son explícitos en que la significación estadística ≠ significación clínica. Escriben: ‘La significación estadística en este estudio piloto no equivale a significación clínica. Dado el tamaño reducido de la muestra y la breve intervención de sesión única, no debe asumirse que la magnitud de los cambios acústicos observados en los presentes resultados se traduzca en resultados vocales clínicamente significativos.’ Esta advertencia debe trasladarse cuando se cite el estudio.

  3. Orden fijo de condiciones, muestra exclusivamente femenina, única universidad de origen, solo participantes con voz sana. El 20-35% de las docentes en formación que ya tienen síntomas de trastornos de la voz no están representadas; el diseño no puede descartar efectos de orden/práctica/calentamiento.

Para Therapy withVR específicamente: este estudio NO utilizó, probó ni evaluó Therapy withVR. El sistema fue una Meta Quest 2 ejecutando el software Ovation con auralización personalizada y un avatar controlado por el clínico: plataforma diferente, modelo de control diferente, enfoque poblacional diferente. El artículo se incluye en el Evidence Hub porque añade evidencia a la base de RV inmersiva para la voz y representa un modelo de aplicación metodológicamente interesante de RV + TEC, no porque se relacione con Therapy withVR.

Limitaciones

Los autores señalan explícitamente las siguientes limitaciones:

Implicaciones para la práctica

Para los logopedas y clínicos de cuidado vocal que consideran la aplicación basada en RV del trabajo preventivo de voz con docentes en formación: este estudio piloto aporta evidencia de factibilidad de que un protocolo al estilo de la Terapia de Entrenamiento Conversacional puede aplicarse dentro de un aula de RV inmersiva y de que la retroalimentación del avatar clínico dentro de la RV puede producir modulaciones a corto plazo en SPL, fo y Dt%. El estudio piloto NO apoya afirmaciones de efectividad clínica, durabilidad del efecto o generalización a la enseñanza real en el aula. El aumento del malestar vocal autoinformado en la condición de RV (frente al control) es una advertencia importante: la RV no fue 'más fácil' para los participantes que la línea base conversacional, y los clínicos que consideran la aplicación en RV deberían cribar la tolerancia y escalonar las dosis en consecuencia. Los autores recomiendan ensayos futuros con diseños contrabalanceados, seguimiento más prolongado, muestras más representativas (incluyendo docentes masculinos y quienes ya tienen trastornos de la voz), y avatares de estudiantes interactivos.

Implicaciones para la investigación

Los estudios futuros deberían contrabalancear/aleatorizar el orden de condiciones, igualar la duración de la tarea entre condiciones, incluir seguimiento a largo plazo para evaluar la persistencia de las modulaciones vocales, reclutar una muestra más representativa de la población más amplia de docentes en formación (incluyendo participantes masculinos y la proporción sustancial con trastornos vocales existentes), e incorporar avatares de estudiantes interactivos para aproximar mejor las demandas vocales de un aula real. La intervención combina indicación al estilo TEC + RV inmersiva; desmenuzar la contribución de cada componente se beneficiaría de un diseño de desmantelamiento (TEC sin RV vs RV sin TEC vs ambas). El aumento inesperado del malestar vocal autoinformado en la condición de RV - que los datos piloto actuales no pueden explicar completamente - merece seguimiento para determinar si refleja efectos de novedad/carga cognitiva (que pueden disminuir con la práctica) o una característica más duradera del trabajo de voz en RV inmersiva.

Notas editoriales de withVR

Cómo se relaciona esto con Therapy withVR

El estudio anterior es investigación independiente y no respalda ningún producto. Las notas siguientes son comentarios de withVR sobre cómo los temas de esta investigación se relacionan con funcionalidades de Therapy withVR. Los hallazgos de la investigación no constituyen afirmaciones sobre Therapy withVR.

VR classroom environment for teacher voice work (editorial parallel only)

Este estudio utilizó una configuración personalizada de Meta Quest 2 + software Ovation con auralización capturada de un aula real mediante un simulador de cabeza y torso. Therapy withVR proporciona entornos de aula en RV bajo control del clínico dentro de su propio espacio de diseño; el concepto general (aula de RV para trabajo preventivo de voz) es compartido, pero las plataformas específicas difieren. Paralelismo editorial únicamente: la herramienta estudiada es software de investigación, no Therapy withVR.

Clinician avatar feedback during VR voice work (editorial parallel only)

El estudio de Nudelman y Bottalico utilizó un avatar clínico que levantaba la mano para indicar a los participantes que prestaran atención a su producción vocal mediante indicaciones de habla clara al estilo TEC cuando el SPL superaba el percentil 85 de la línea base de la participante. Las funciones de avatar controlado por el clínico de Therapy withVR apoyan intervenciones clínicas análogas en tiempo real dentro de su propio diseño. Paralelismo editorial únicamente.

Auralization of real classroom acoustics

La auralización del estudio capturó la firma acústica de un aula real mediante un simulador de cabeza y torso y la reprodujo mediante auriculares abiertos Sennheiser HD600 ejecutando el software Reaper durante la condición de RV, un nivel de realismo acústico (reverberación de sala, nivel de ruido de fondo) que no es estándar en la mayoría de los estudios de voz en RV. Therapy withVR utiliza sonidos ambientales dentro de su diseño; el enfoque de realismo acústico de Nudelman y Bottalico es referencia editorial para la importancia de la fidelidad acústica de sala en el trabajo de voz en RV.

Cita este estudio

Si haces referencia a este estudio en tu trabajo, estos son los formatos de cita canónicos:

APA 7th
Nudelman, C. J., & Bottalico, P. (2026). Effects of a Virtual Reality Teaching Intervention on Voice Production in Pre Professional Teachers: A Pilot Study. Journal of Voice. https://doi.org/10.1016/j.jvoice.2026.03.007.
AMA 11th
Nudelman CJ, Bottalico P. Effects of a Virtual Reality Teaching Intervention on Voice Production in Pre Professional Teachers: A Pilot Study. Journal of Voice. 2026. doi:10.1016/j.jvoice.2026.03.007.
BibTeX
@article{nudelman2026,
  author = {Nudelman, C. J. and Bottalico, P.},
  title = {Effects of a Virtual Reality Teaching Intervention on Voice Production in Pre Professional Teachers: A Pilot Study},
  journal = {Journal of Voice},
  year = {2026},
  doi = {10.1016/j.jvoice.2026.03.007},
  url = {https://withvr.app/es/evidence/studies/nudelman-2026}
}
RIS
TY  - JOUR
AU  - Nudelman, C. J.
AU  - Bottalico, P.
TI  - Effects of a Virtual Reality Teaching Intervention on Voice Production in Pre Professional Teachers: A Pilot Study
JO  - Journal of Voice
PY  - 2026
DO  - 10.1016/j.jvoice.2026.03.007
UR  - https://withvr.app/es/evidence/studies/nudelman-2026
ER  - 

¿Conoce alguna investigación que debería estar en esta base? Si un estudio relevante revisado por pares no figura aquí, envíe la referencia a hello@withvr.app. La base se mantiene actualizada a medida que crece la literatura.

Financiación e independencia

Según la Declaración de Conflictos de Interés del artículo: 'Charles J. Nudelman declara que fue apoyado económicamente por el Council of Academic Programs in Communication Sciences and Disorders. Charles J. Nudelman declara que fue apoyado económicamente por la Acoustical Society of America. Si hay otros autores, declaran que no tienen intereses económicos en competencia ni relaciones personales conocidas que pudieran haber influido en el trabajo reportado en este artículo.' Concretamente: 'Beca de doctorado 2024 del The Council of Academic Programs in Communication Sciences and Disorders (CAPCSD)' otorgada a CJN, y 'Beca Raymond H. Stetson en Fonética y Ciencia del Habla 2024 de la Acoustical Society of America (ASA)' otorgada a CJN. Los Agradecimientos dan las gracias al 'Dr. Edward Hashimoto por su generosa donación que apoyó la recopilación de datos' y a los Drs. Daniel Fogerty, Brian Monson, Mary Flaherty y Eric Hunter por sus comentarios, además de seis asistentes de investigación (Asritha Tunuguntla, Naomi Ha, Isabella Rogala, Kaliyah House-Henry, Bella Lopez, Ricardo Perez-Gurrero). **Relación de contexto relevante:** el autor correspondiente Charles J. Nudelman es también el primer autor de la revisión de alcance de Nudelman, Niu, Hutz y Edwards (2026) en AJSLP de RV inmersiva en logopedia ya en este Evidence Hub. Afiliaciones de los autores: Charles J. Nudelman (Departamento de Ciencias de la Comunicación y los Trastornos, Syracuse University, Syracuse, NY); Pasquale Bottalico (Departamento de Ciencia del Habla y la Audición, University of Illinois Urbana-Champaign, Urbana, IL). Estudio aprobado por el IRB de la UIUC (n.º 23336). Datos disponibles en https://osf.io/98rqy/. El sistema de RV utilizado fue una Meta Quest 2 ejecutando el software Ovation + auriculares Sennheiser HD600 + software de auralización Reaper; **esto NO es Therapy withVR.** Sin participación de withVR BV en la financiación, el diseño del estudio ni la autoría. Resumen elaborado de forma independiente por withVR a partir del artículo publicado (estado de artículo en prensa en el momento de la auditoría, aceptado el 10 de marzo de 2026).

Última revisión: 2026-05-12 Próxima revisión prevista: 2027-05-12 Revisado por: Gareth Walkom