Esta página fue traducida del inglés. Si algo suena extraño, cambia a la versión en inglés. Ver en inglés.
ECA (n=47) - tres sesiones de RV ayudaron a adolescentes y adultos autistas a responder mejor en encuentros reales con la policía, vs vídeo
Cómo se ha evaluado
ECA de grupos paralelos preregistrado (NCT03605368, registrado el 30 de julio de 2018), codificadores de vídeo enmascarados, post-test ecológicamente válido (interacciones en directo con agentes de policía uniformados reales y personal de seguridad) y un comparador de control activo (modelado en vídeo) en lugar de lista de espera. Efecto de interacción significativo para el resultado primario de movimientos de inquietud (p = 0,005). El análisis de potencia (G*Power) indicó que N=47 detecta F crítico = 4,06 con tamaños del efecto de Cohen's f = 0,27 (d = 0,54) o mayores. Limitaciones que restringen la certeza: N pequeño (47), muestra predominantemente blanca (limita la generalización a poblaciones con mayor riesgo real durante interacciones policiales), exclusión de participantes autistas con CI por debajo de 75, interacciones de pre-test realizadas por el personal del estudio con insignias en lugar de agentes uniformados (ruido añadido según la propia discusión de los autores), tamaños del efecto modestos para algunos resultados, codificación por un solo codificador para la mayoría de las sesiones (solo 20 sesiones fueron codificadas por dos codificadores para la evaluación de fiabilidad; el kappa de orientación fue 0,53, el más bajo de los cuatro resultados primarios), y un conflicto de intereses sustancial - tres autores son empleados de Floreo Inc. y uno actuó como consultor remunerado, y el personal de Floreo participó en la conceptualización, la metodología y la adquisición de financiación. La certeza moderada refleja un diseño sólido + preregistro + enmascaramiento, contrapesados por una muestra pequeña, una demografía estrecha y el conflicto de intereses.
Las valoraciones utilizan un esquema simplificado de cuatro niveles (Alta, Moderada, Baja, Muy baja), basado en el GRADE working group. Más información sobre cómo se evalúan los estudios.
Un ECA aleatorizó a 47 participantes autistas verbalmente fluentes (12-60 años) al Police Safety Module en RV de Floreo o al modelado en vídeo BeSAFE The Movie: tres sesiones de 45 minutos por intervención, con aproximadamente 12 minutos de práctica activa en RV por sesión. El grupo de RV dio respuestas significativamente más apropiadas y mostró un lenguaje corporal más tranquilo durante interacciones en directo con agentes de policía reales después; el grupo de modelado en vídeo no. Ambos grupos reportaron mayor conocimiento y comodidad ante interacciones con la policía después del entrenamiento.
Primer ECA que compara directamente la práctica inmersiva en RV de interacciones con la policía con un control activo (modelado en vídeo) en adolescentes y adultos autistas, con codificación enmascarada del comportamiento durante encuentros en directo con agentes reales. Tres breves sesiones de RV supervisadas por un clínico redujeron los movimientos de inquietud (un marcador probable de ansiedad, aunque no se midió fisiología) durante encuentros reales con la policía; el grupo de vídeo no mostró un cambio equivalente. La muestra es pequeña (N=47), predominantemente blanca y excluyó a personas autistas con cociente intelectual inferior a 75 (lo que excluyó efectivamente a quienes tenían discapacidad intelectual concurrente). Replicar antes de generalizar. Tres autores son empleados de Floreo Inc. (el producto de RV evaluado) y un cuarto actuó como consultor remunerado de Floreo; los mismos autores participaron en la conceptualización, la metodología y la adquisición de financiación de este ensayo.
Hallazgos principales
- 47 participantes autistas con fluidez verbal de entre 12 y 60 años (Floreo PSM media 21,87, BeSAFE media 21,50) asignados al azar 23 (Floreo) vs. 24 (BeSAFE) mediante aleatorización estratificada por edad, sexo, CI y puntuación SCQ; tres sesiones de 45 minutos con una separación media de 9,25 días (DT 6,2 días)
- Cada sesión de RV Floreo implicó aproximadamente 12 minutos de práctica activa en RV (seis ensayos de interacción policial de 2 minutos con descansos entre ellos)
- Interacción condición × tiempo significativa en movimientos de inquietud durante interacciones reales con la policía: el grupo VR redujo los movimientos de inquietud del pre al post (estimación -0,44, DT 0,11, t = -3,86, p = 0,002); el grupo de modelado en vídeo no cambió (estimación 0,03, p = 0,99). Término de interacción: estimación 0,47, DT 0,16, t = 2,95, p = 0,005
- Respuesta adecuada: interacción no significativa en general (estimación 0,17, DT 0,09, t = 1,82, p = 0,07), pero el grupo VR Floreo mejoró significativamente (estimación -0,21, DT 0,07, t = -3,14, p = 0,02) mientras que BeSAFE no (p = 0,93)
- Comportamiento general: interacción no significativa (estimación 0,16, DT 0,13, t = 1,22, p = 0,23), pero el grupo VR Floreo mejoró significativamente (estimación -0,29, DT 0,10, t = -3,04, p = 0,02) mientras que BeSAFE no (estimación 0,03, p = 0,99)
- El comportamiento de orientación (ojos/cuerpo hacia el agente) no cambió en ningún grupo; los autores atribuyen esto en parte a las limitaciones de la codificación con una sola cámara; y la Orientación también tuvo la fiabilidad interjuez más baja de los cuatro resultados primarios (kappa de Cohen = 0,53; los demás oscilaron entre 0,60 y 0,68)
- El conocimiento y la comodidad autoinformados con las interacciones policiales mejoraron en ambos grupos (Floreo z = -5,248, BeSAFE z = -4,645, ambos p < 0,0001); sin interacción condición × tiempo significativa. Aprender sobre las interacciones con la policía en cualquier formato ayudó a los participantes a sentirse más informados y cómodos
- Valoraciones de los agentes de policía en el posttratamiento: el grupo Floreo fue valorado como con mejor contacto visual (estimación 0,27, DT 0,13, z = 1,99, p = .05); sin otras diferencias significativas valoradas por los agentes (todos los demás p > .10)
- Las interacciones en directo previas a la intervención fueron con personal del estudio con insignias; las posteriores a la intervención fueron con agentes de policía uniformados reales o personal de seguridad - lo que significa que las mejoras observadas se transfirieron a encuentros del mundo real con agentes reales, no solo a escenarios dentro de la RV o con confederados del personal. Los autores describen esto como 'la primera prueba directa' de la hipótesis VR-versus-modelado-en-vídeo
Antecedentes
Los adolescentes y adultos autistas afrontan un riesgo desproporcionado durante las interacciones con la policía. Una tasa de contacto policial del 20 % hacia los veinte años, un 5 % arrestados, tasas elevadas de lesiones y muertes, y un sistema lento en actualizar su formación - todo ello documentado en la literatura que citan los autores. Si bien la solución a largo plazo es una mejor formación policial, también tiene valor apoyar a las personas autistas para que practiquen estos encuentros de alta exigencia antes de tenerlos.
Dos enfoques existentes: el modelado en vídeo (BeSAFE The Movie, ampliamente utilizado) y la RV inmersiva. El modelado en vídeo enseña las reglas, pero no puede replicar la presión visual, sensorial y emocional de un agente frente a uno. La RV inmersiva sí puede hacerlo - y es altamente personalizable según el contexto (día/noche, interior/exterior, tranquilo/ruidoso), las características del agente y el número de agentes.
Este ECA es la primera confrontación directa entre ambos enfoques.
Qué hicieron los investigadores
Cuarenta y siete participantes autistas con fluidez verbal (edades de 12 a 60 años, CI ≥ 75 en la WASI-II) fueron asignados al azar a una de dos intervenciones, estratificadas por edad (dentro de 10 años), sexo, puntuación SCQ (dentro de 5 puntos) y CI (dentro de 10 puntos):
-
Floreo Police Safety Module (PSM) - una aplicación de RV inmersiva basada en smartphone: un iPhone llevado en un casco ligero conectado mediante Wi-Fi a un iPad sostenido por un monitor de intervención. El iPad muestra la escena visual que ve el participante, una ventana de instrucciones en texto y botones de control para ajustar el comportamiento del agente virtual en tiempo real. En este estudio, los monitores de intervención eran personal del estudio con licenciatura en psicología o neurociencia. Tres sesiones de 45 minutos, con aproximadamente 12 minutos de RV activa por sesión (seis ensayos de interacción policial de 2 minutos con descansos entre ellos), con retroalimentación del profesional en tiempo real enmarcada en un modelo cognitivo-conductual: establecimiento colaborativo de objetivos, retroalimentación posterior al ensayo basada en datos, sesión informativa al final. Los diálogos oscilaban entre fáciles (percibidos como cotidianos: «¿Cómo va el día? ¿Cuál es su nombre? ¿Tiene algún documento de identidad?») y difíciles (percibidos como de infracción menor: «Necesito ver sus manos. ¿Cuál es su fecha de nacimiento? ¿Dónde estuvo anoche?»). Las sesiones se separaron una media de 9,25 días (DT 6,2; rango 1-37).
-
BeSAFE The Movie - una intervención de modelado en vídeo establecida con vídeos educativos más juego de roles con un adulto conocido (padre/madre, docente, logopeda). El estudio actual utilizó las cuatro primeras lecciones de BeSAFE: Las leyes nos ayudan a mantenernos SEGUROS; Los agentes del orden nos ayudan a mantenernos SEGUROS; Uniformes y herramientas de seguridad; Mantener la calma al encontrarse con la policía. Tres sesiones de 45 minutos igualadas a la RV en dosis.
Pre-test (Visita 1): Una interacción policial simulada en directo de 3 a 5 minutos con un confederado del personal del estudio que llevaba una insignia. Grabada en audio/vídeo para codificación enmascarada. Post-test (Visita 3): Una interacción en directo de 3 a 5 minutos con un agente de policía o guardia de seguridad uniformado real. Los autores señalan explícitamente las diferencias pre/post como fuente de ruido, pero argumentan que no puede explicar los efectos entre condiciones observados.
Los vídeos se codificaron en intervalos de 15 segundos usando ELAN, por personal del estudio cegado a la condición. Procedimiento de fiabilidad: dos codificadores visionaron y debatieron 5 sesiones grabadas para alcanzar consenso en las definiciones de código, y luego codificaron por separado 20 sesiones para evaluar la fiabilidad interjuez. Kappa de Cohen: Comportamiento general 0,67, Respuesta adecuada 0,60, Orientación 0,53, Movimientos de inquietud 0,68. Todas las sesiones restantes fueron codificadas por un único codificador fiable. Los cuatro comportamientos codificados en vídeo como resultados primarios fueron:
- Movimientos de inquietud - frecuencia y amplitud de acciones repetitivas
- Respuesta adecuada - escuchar, responder verbalmente, seguir instrucciones
- Orientación - ojos y cuerpo orientados hacia el agente
- Comportamiento general - gestalt de lo anterior durante cada intervalo de 15 segundos
Los modelos lineales de efectos mixtos evaluaron las interacciones condición × tiempo, controlando la edad (centrada), el sexo y el CI escalar completo (centrado), con efecto aleatorio del identificador del participante. El análisis de potencia indicó que N = 47 detecta tamaños del efecto de Cohen’s d = 0,54 o mayores. Participación comunitaria: los familiares de personas autistas participaron en la conceptualización, el diseño y la implementación del estudio; las personas autistas y sus familiares participaron en el desarrollo de la propia intervención de RV; y los familiares de personas autistas contribuyeron a la interpretación de los hallazgos.
Qué encontraron
Resultado primario - movimientos de inquietud: Interacción condición × tiempo significativa (estimación 0,47, p = 0,005). Los movimientos de inquietud del grupo VR disminuyeron significativamente (estimación -0,44, p = 0,002); el grupo BeSAFE no cambió (p = 0,99).
Respuesta adecuada: Término de interacción no significativo (p = 0,07), pero las comparaciones planificadas mostraron una mejora significativa de pre a post solo en el grupo VR (p = 0,02).
Comportamiento general: El mismo patrón - interacción no significativa en general (p = 0,23), pero el grupo VR mejoró significativamente (p = 0,02) y BeSAFE no.
Orientación: Sin efecto en ningún grupo. Los autores atribuyen esto en parte a las limitaciones del registro en vídeo con una sola cámara, que dificultó la puntuación de la dirección de la mirada de los participantes.
Conocimiento y comodidad autoinformados: Mejoró significativamente en ambos grupos (sin diferencia de grupo). Conocer las interacciones con la policía ayudó a los participantes a sentirse más seguros independientemente del formato.
Valoraciones de los agentes de policía: El grupo VR fue valorado como con mejor contacto visual en el posttratamiento (p = .05). Sin otras diferencias significativas valoradas por los agentes.
Los autores interpretan la reducción de los movimientos de inquietud como un marcador probable de reducción de la ansiedad/activación durante el encuentro en directo - conclusión que matizan apropiadamente, dado que no midieron directamente la fisiología.
Por qué es importante
Para el Evidence Hub, esta es una adición importante porque examina algo que la mayoría de la investigación sobre RV en diferencias de comunicación no hace:
- Una comparación directa con un control activo basado en evidencia en lugar de lista de espera o sin tratamiento. Los efectos específicos de la RV sobrevivieron a esta comparación.
- Un post-test ecológicamente válido. La mayoría de los estudios de RV miden dentro de la RV o con los mismos examinadores en el pre y el post. Aquí el post-test fue con agentes de policía reales, en persona. Esta es una de las demostraciones de transferencia directa más sólidas en la literatura de RV inmersiva y diferencias de comunicación.
- Preregistro y codificación enmascarada - el diseño cierra las críticas metodológicas más comunes.
- Un protocolo cognitivo-conductual supervisado por un logopeda. La RV no se utilizó como herramienta autónoma; el profesional estaba dando forma activamente a la práctica. Esto coincide con el encuadre del modelo social ya utilizado en el trabajo clínico de Therapy withVR.
Para Therapy withVR en concreto: este estudio refuerza una tesis que hemos argumentado en otros lugares basándonos en evidencia más limitada - que la práctica en RV inmersiva con un logopeda al lado puede trasladarse a encuentros del mundo real que implican presión emocional. No examina Therapy withVR (el producto es el PSM de Floreo), pero añade a la base de evidencia más amplia para el enfoque.
Limitaciones
Los autores son explícitos sobre lo que este ensayo establece y lo que no:
- El tamaño muestral es pequeño (N = 47). Varios resultados tuvieron términos de interacción no significativos a pesar de las mejoras intragrupo; la replicación con muestras más grandes ayudará.
- La muestra fue predominantemente blanca (n = 34 de 47). Los autores reconocen que esta es exactamente la demografía donde las interacciones con la policía conllevan menos riesgo diferencial que para las personas autistas residentes en zonas urbanas y las personas autistas de color, a quienes identifican como la población más urgente para la investigación futura. La raza/etnia no difirió según la condición.
- Se excluyó la discapacidad intelectual concurrente mediante el criterio de inclusión de CI ≥ 75. Los autores señalan que esto es «una condición concurrente común en individuos autistas» y limita la generalización en consecuencia.
- Los agentes pre/post difirieron - el pre-test fue con personal del estudio con insignias, el post-test fue con agentes/personal de seguridad reales. Esto añade ruido pero, señalan los autores, no puede explicar las diferencias entre condiciones que emergieron.
- Los tamaños del efecto son modestos. Incluso el resultado primario es un cambio absoluto relativamente pequeño en los movimientos de inquietud; los autores argumentan que incluso pequeñas reducciones en el comportamiento que evoca sospechas durante encuentros de alta exigencia pueden tener un impacto real significativo.
- La codificación fue en gran medida de un solo codificador. Solo 20 sesiones fueron codificadas por dos codificadores para la evaluación de fiabilidad; el resto fue codificado por un único codificador fiable. El kappa de Cohen para la orientación (0,53) fue el más bajo de los cuatro resultados, lo que los autores atribuyen a la configuración de vídeo con una sola cámara que dificultó la puntuación de la dirección de la mirada del participante. Los trabajos futuros deben usar configuraciones de múltiples cámaras o rastreadores de ojos montados en la cabeza.
- Conflicto de intereses significativo. Tres autores son empleados de Floreo Inc. (Solorzano, Turnacioglu, Ravindran) y un cuarto (McCleery) ha actuado como consultor remunerado de Floreo. Las Contribuciones de los Autores muestran que estos mismos autores participaron en la Conceptualización, la Metodología, la Adquisición de Financiación y la Supervisión - no solo como coautores pasivos. El ensayo estaba preregistrado (NCT03605368, 30 de julio de 2018), los codificadores estaban enmascarados y el comparador era una intervención de modelado en vídeo establecida, todo lo cual mitiga pero no elimina el riesgo del conflicto de intereses. Debe señalarse cuando se cite el estudio.
- Sin medición directa de la ansiedad (conductancia de la piel, frecuencia cardíaca). La interpretación de que la reducción de los movimientos de inquietud refleja una reducción de la activación es plausible, pero no se ha comprobado directamente. Los autores plantean explícitamente una interpretación alternativa: «La práctica basada en RV de algún modo permitió a los participantes autistas enmascarar temporalmente su ansiedad para superar las interacciones con los agentes de policía con menos movimientos de inquietud a pesar de niveles elevados de activación fisiológica». Señalan que, dado que el protocolo cognitivo-conductual permitió a cada participante elegir sus propios objetivos de habilidades, cualquier enmascaramiento sería «una decisión consciente de su propia voluntad»; pero argumentan que el beneficio real (reducción del comportamiento que evoca sospechas durante las interacciones con la policía) se produce de todas formas.
Relación con el Evidence Hub
Este ECA es la demostración metodológicamente más sólida hasta la fecha de que la práctica en RV inmersiva se transfiere a interacciones sociales del mundo real en autismo. Complementa:
- Revisión de alcance de Nudelman et al. 2026 - confirma que las respuestas ecológicamente válidas en RV son un hallazgo consistente en todas las poblaciones; este ECA lo extiende a un diseño de ensayo comparativo.
- Brundage et al. 2007/2015/2016 - establecieron la afirmación fundacional de que el comportamiento del habla en audiencias de RV correlaciona fuertemente con el habla en audiencias reales. Este ECA muestra la correspondiente transferencia al mundo real para el comportamiento no verbal (movimientos de inquietud, respuesta) en encuentros autistas con la policía.
- Moïse-Richard 2021, Brassel 2023, Hansa 2025 - otros estudios de RV en poblaciones adyacentes.
- Al-Nafjan et al. 2021 - trabajo de viabilidad de autismo + RV.
Donde la base de evidencia del campo descansaba anteriormente principalmente en diseños intra-sujeto y estudios de caso (según Nudelman 2026), este ECA aporta uno de los puntos de datos genuinamente comparativos, preregistrados y codificados de forma enmascarada.
Implicaciones para la práctica
Para los logopedas, orientadores escolares, terapeutas ocupacionales y otros profesionales que apoyan a adolescentes y adultos autistas, este ensayo ofrece evidencia de que la práctica inmersiva en RV de corta duración, supervisada por un clínico, puede reducir el comportamiento motor vinculado a la ansiedad durante encuentros sociales de alta exigencia - y de que la reducción es observable cuando la persona interactúa posteriormente con un agente uniformado real, no solo dentro de la escena de RV. El protocolo del ensayo fue explícitamente cognitivo-conductual: establecimiento colaborativo de objetivos antes de cada ensayo de RV, retroalimentación centrada en el comportamiento durante el ensayo, sesión informativa posterior. Ese encuadre guiado por el profesional es lo que hace que la práctica sea efectiva. El ensayo no establece que la RV reduzca el comportamiento de orientación/contacto visual tal como fue codificado con una sola cámara, y los tamaños del efecto generales son modestos. En la práctica, esto se entiende mejor como evidencia adicional del enfoque del modelo social ya utilizado en el trabajo clínico de Therapy withVR: ensayar la situación, en contexto, con un logopeda al lado, antes de enfrentarla de verdad.
Implicaciones para la investigación
Se necesita replicación en: (a) poblaciones autistas de comunidades BIPOC que afrontan un riesgo real significativamente mayor durante las interacciones con la policía, (b) adultos autistas con discapacidad intelectual concurrente, y (c) muestras más grandes para detectar resultados de menor efecto como el comportamiento de orientación. Las medidas fisiológicas directas de ansiedad - conductancia de la piel, frecuencia cardíaca - ayudarían a dilucidar si la reducción de los movimientos de inquietud refleja una reducción de la activación o un enmascaramiento aprendido bajo activación. Los registros con múltiples cámaras permitirían a los evaluadores puntuar la orientación y la mirada con mayor fiabilidad. El encuadre cognitivo-conductual del protocolo del profesional (establecimiento de objetivos, retroalimentación informada por datos en tiempo real, reflexión posterior a la sesión) es en sí mismo probablemente un ingrediente activo y merece estudios de desmantelamiento. Por último, el trabajo paralelo sobre el entrenamiento de los agentes de policía - en particular para interactuar eficazmente con ciudadanos autistas de color - debe combinarse con intervenciones de empoderamiento como esta.
Cita este estudio
Si haces referencia a este estudio en tu trabajo, estos son los formatos de cita canónicos:
@article{mccleery2026,
author = {McCleery, J. P. and Zitter, A. and Cordero, L. and Russell, A. and Cola, M. and Udhnani, M. and Tena, K. G. and Yates Flanagan, A. and Turnacioglu, S. and Solórzano, R. and Miller, J. S. and Ravindran, V. and Parish-Morris, J.},
title = {Virtual Reality Intervention to Empower Autistic People to Interact With Police: A Randomized Controlled Clinical Trial for Autistic Teens and Adults},
journal = {Journal of Autism and Developmental Disorders},
year = {2026},
doi = {10.1007/s10803-026-07339-8},
url = {https://withvr.app/es/evidence/studies/mccleery-2026}
} TY - JOUR
AU - McCleery, J. P.
AU - Zitter, A.
AU - Cordero, L.
AU - Russell, A.
AU - Cola, M.
AU - Udhnani, M.
AU - Tena, K. G.
AU - Yates Flanagan, A.
AU - Turnacioglu, S.
AU - Solórzano, R.
AU - Miller, J. S.
AU - Ravindran, V.
AU - Parish-Morris, J.
TI - Virtual Reality Intervention to Empower Autistic People to Interact With Police: A Randomized Controlled Clinical Trial for Autistic Teens and Adults
JO - Journal of Autism and Developmental Disorders
PY - 2026
DO - 10.1007/s10803-026-07339-8
UR - https://withvr.app/es/evidence/studies/mccleery-2026
ER - ¿Conoce alguna investigación que debería estar en esta base? Si un estudio relevante revisado por pares no figura aquí, envíe la referencia a hello@withvr.app. La base se mantiene actualizada a medida que crece la literatura.
Financiación e independencia
De la declaración de conflicto de intereses propia del artículo: 'Rita Solorzano, Sinan Turnacioglu y Vijay Ravindran son empleados de Floreo Inc., y Joseph McCleery ha actuado como consultor remunerado. No hay otros conflictos de interés que declarar.' La sección de Contribuciones de los Autores hace más específica la relación académico-industrial que el mero 'empleo': **Turnacioglu, Solorzano y Ravindran participaron en la Conceptualización, la Metodología, la Adquisición de Financiación y la Supervisión** de este ensayo junto a McCleery, Parish-Morris y Miller. Financiado por NIH STTR R42MH115539-S1 (co-IPs: Ravindran y Parish-Morris). Ensayo preregistrado en ClinicalTrials.gov (NCT03605368) el 30 de julio de 2018. Publicado bajo Creative Commons CC BY-NC-ND 4.0. El Police Safety Module de Floreo es independiente de withVR BV; este estudio se incluye en el Evidence Hub porque añade a la base de evidencia de RV inmersiva y diferencias de comunicación, no porque se relacione con Therapy withVR.