Cette page a été traduite de l'anglais. Si une phrase semble étrange, passez à la version anglaise. Voir en anglais.
ECR (n=47) - trois séances de RV ont aidé adolescents et adultes autistes à mieux réagir lors de rencontres réelles avec la police, vs vidéo
Comment cela a été évalué
ECR à groupes parallèles pré-enregistré (NCT03605368, enregistré le 30 juillet 2018), codeurs vidéo en aveugle, post-test écologiquement valide (interactions réelles avec de vrais policiers en uniforme et personnel de sécurité) et un comparateur actif (modélisation vidéo) plutôt qu'une liste d'attente. Effet d'interaction significatif pour le critère principal d'agitation (p = 0,005). L'analyse de puissance (G*Power) indiquait que N=47 détecte le F critique = 4,06 avec des tailles d'effet de Cohen f = 0,27 (d = 0,54) ou plus. Limites qui restreignent la certitude : N petit (47), échantillon majoritairement blanc (limite la généralisation aux populations à plus haut risque réel lors d'interactions avec la police), exclusion des participants autistes avec un QI inférieur à 75, interactions de pré-test conduites par le personnel de l'étude avec des badges plutôt que par des agents en uniforme (bruit ajouté selon la discussion des auteurs), tailles d'effet modestes pour certains critères, codage par un seul codeur pour la plupart des séances (seules 20 séances ont été doublement codées pour l'évaluation de la fiabilité ; le kappa d'orientation était de 0,53, le plus faible des quatre critères principaux), et un conflit d'intérêts substantiel. La certitude modérée reflète un design solide + pré-enregistrement + mise en aveugle, à mettre en balance avec un petit échantillon, une démographie étroite et le COI.
Les évaluations suivent un schéma simplifié à quatre niveaux (Élevée, Modérée, Faible, Très faible), inspiré du GRADE working group. En savoir plus sur la méthode d'évaluation des études.
Un ECR a randomisé 47 personnes autistes verbalement fluentes (12-60 ans) vers le Police Safety Module en RV de Floreo ou la modélisation vidéo BeSAFE The Movie : trois séances de 45 minutes par intervention, avec environ 12 minutes de pratique active en RV par séance. Le groupe RV a donné des réponses nettement plus appropriées et a montré un langage corporel plus calme lors d'interactions en direct avec de vrais policiers après l'intervention ; le groupe modélisation vidéo non. Les deux groupes ont rapporté davantage de connaissances et de confort face aux interactions policières après la formation.
Premier ECR à comparer directement la pratique immersive en RV d'interactions avec la police à un comparateur actif (modélisation vidéo) chez des adolescents et adultes autistes, avec codage à l'aveugle du comportement lors d'interactions réelles avec de vrais agents. Trois courtes séances de RV supervisées par un clinicien ont réduit l'agitation - un marqueur probable d'anxiété, bien que la physiologie n'ait pas été mesurée - lors d'interactions réelles avec la police ; le groupe vidéo n'a montré aucun changement équivalent. L'échantillon est petit (N=47), majoritairement blanc, et excluait les personnes autistes dont le QI était inférieur à 75 (excluant ainsi celles présentant une déficience intellectuelle associée). À répliquer avant toute généralisation. Trois auteurs sont employés par Floreo Inc. (le produit VR testé) et un quatrième a exercé comme consultant rémunéré pour Floreo ; ces mêmes auteurs étaient impliqués dans la conceptualisation, la méthodologie et l'acquisition de financements pour cet essai.
Principaux résultats
- 47 participants autistes verbalement fluents âgés de 12 à 60 ans (Floreo PSM moyenne 21,87, BeSAFE moyenne 21,50) randomisés 23 (Floreo) vs 24 (BeSAFE) à l'aide d'une randomisation stratifiée sur l'âge, le sexe, le QI et le score SCQ ; trois séances de 45 minutes espacées en moyenne de 9,25 jours (ET 6,2 jours)
- Chaque séance de RV Floreo comportait environ 12 minutes de pratique active en RV (six essais d'interaction avec la police de 2 minutes avec des pauses entre les essais)
- Interaction condition × temps significative sur l'agitation lors d'interactions réelles avec la police : le groupe RV a réduit son agitation du pré au post (estimation -0,44, ET 0,11, t = -3,86, p = 0,002) ; le groupe modélisation vidéo n'a pas changé (estimation 0,03, p = 0,99). Terme d'interaction : estimation 0,47, ET 0,16, t = 2,95, p = 0,005
- Réponse appropriée : interaction non significative globalement (estimation 0,17, ET 0,09, t = 1,82, p = 0,07), mais le groupe RV Floreo s'est amélioré significativement (estimation -0,21, ET 0,07, t = -3,14, p = 0,02) tandis que BeSAFE ne l'a pas fait (p = 0,93)
- Comportement global : interaction non significative (estimation 0,16, ET 0,13, t = 1,22, p = 0,23), mais le groupe RV Floreo s'est amélioré significativement (estimation -0,29, ET 0,10, t = -3,04, p = 0,02) tandis que BeSAFE ne l'a pas fait (estimation 0,03, p = 0,99)
- Le comportement d'orientation (yeux/corps vers l'agent) n'a pas changé dans aucun groupe ; les auteurs attribuent cela en partie aux limitations du codage avec une seule caméra - et l'Orientation avait également la plus faible fiabilité inter-juges des quatre critères principaux (kappa de Cohen = 0,53 ; les autres allaient de 0,60 à 0,68)
- Les connaissances autoévaluées et le confort avec les interactions policières se sont améliorés dans les deux groupes (Floreo z = -5,248, BeSAFE z = -4,645, tous deux p < 0,0001) ; pas d'interaction condition × temps significative. En apprendre sur les interactions avec la police dans n'importe quel format a aidé les participants à se sentir plus informés et plus à l'aise
- Évaluations des agents de police post-test : le groupe Floreo a été évalué comme ayant un meilleur contact visuel (estimation 0,27, ET 0,13, z = 1,99, p = .05) ; pas d'autres différences significatives évaluées par les agents (tous les autres p > .10)
- Les interactions réelles avant l'intervention impliquaient le personnel de l'étude portant des badges ; après l'intervention, de vrais policiers en uniforme ou du personnel de sécurité - ce qui signifie que les améliorations observées se sont transférées à de vraies rencontres avec de vrais agents, et non uniquement à des scénarios intra-VR ou avec des confédérés du personnel. Les auteurs décrivent cela comme « le premier test direct » de l'hypothèse RV vs modélisation vidéo
Contexte
Les adolescents et adultes autistes font face à un risque disproportionné lors d’interactions avec les forces de l’ordre. Un taux de contact avec la police de 20 % avant la vingtaine, 5 % arrêtés, des taux de blessures et de décès élevés, et un système lent à se réformer - tous documentés dans la littérature citée par les auteurs. Si la solution à long terme passe par une meilleure formation des policiers, soutenir les personnes autistes pour qu’elles puissent s’exercer à ces échanges à forts enjeux avant de les vivre représente également une valeur ajoutée.
Deux approches existantes : la modélisation vidéo (BeSAFE The Movie, largement utilisée) et la RV immersive. La modélisation vidéo enseigne les règles mais ne peut pas reproduire la pression visuelle, sensorielle ou émotionnelle d’un agent en face de vous. La RV immersive le peut - et est hautement personnalisable en termes de contexte (jour/nuit, intérieur/extérieur, calme/bruyant), de caractéristiques des agents et de nombre d’agents.
Cet ECR est le premier test direct de confrontation des deux approches.
Ce que les chercheurs ont fait
Quarante-sept participants autistes verbalement fluents (âgés de 12 à 60 ans, QI ≥ 75 sur le WASI-II) ont été assignés aléatoirement à l’une des deux interventions, avec stratification par âge (à 10 ans près), sexe, score SCQ (à 5 points près) et QI (à 10 points près) :
-
Floreo Police Safety Module (PSM) - une application de RV immersive sur smartphone : un iPhone porté dans un casque léger et relié via Wi-Fi à un iPad tenu par un moniteur d’intervention. L’iPad affiche la scène visuelle que voit le participant, une fenêtre d’instructions textuelle et des boutons de contrôle pour ajuster le comportement de l’agent virtuel en temps réel. Dans cette étude, les moniteurs d’intervention étaient des membres du personnel de l’étude titulaires d’un bachelor en psychologie ou en neurosciences. Trois séances de 45 minutes, ~12 minutes de RV active par séance (six essais d’interaction avec la police de 2 minutes avec des pauses entre les essais), avec un retour d’information en temps réel de l’intervenant dans un cadre cognitivo-comportemental : définition collaborative d’objectifs, retour d’information fondé sur des données post-essai, débriefing en fin de session. Les dialogues allaient du facile (perçu comme adulte : « Comment se passe votre journée ? Quel est votre prénom ? Avez-vous une pièce d’identité sur vous ? ») au difficile (perçu comme mineur : « J’ai besoin de voir vos mains. Quelle est votre date de naissance ? Où étiez-vous hier soir ? »). Les séances étaient espacées en moyenne de 9,25 jours (ET 6,2 ; étendue 1-37).
-
BeSAFE The Movie - une intervention de modélisation vidéo établie avec des vidéos éducatives et des jeux de rôle avec un adulte familier (parent, enseignant, clinicien). La présente étude a utilisé les quatre premières leçons BeSAFE : Les lois nous aident à être en sécurité ; Les forces de l’ordre nous aident à être en sécurité ; Uniformes et outils de sécurité ; Restez calme quand vous rencontrez la police. Trois séances de 45 minutes, doses équivalentes à la RV.
Pré-test (Visite 1) : Une interaction simulée en direct de 3 à 5 minutes avec un membre du personnel de l’étude portant un badge. Enregistrement audio/vidéo pour un codage à l’aveugle. Post-test (Visite 3) : Une interaction en direct de 3 à 5 minutes avec un vrai policier en uniforme ou un agent de sécurité. Les auteurs signalent explicitement les différences pré/post comme ajoutant du bruit, mais arguent qu’elles ne pouvaient pas rendre compte des effets inter-conditions observés.
Les vidéos ont été codées par intervalles de 15 secondes à l’aide d’ELAN, par des membres du personnel de l’étude en aveugle quant à la condition. Procédure de fiabilité : deux codeurs ont visionné et discuté de 5 sessions enregistrées pour atteindre un consensus sur les définitions des codes, puis ont codé séparément 20 sessions pour la fiabilité inter-juges. Kappa de Cohen : Comportement global 0,67, Réponse appropriée 0,60, Orientation 0,53, Agitation 0,68. Toutes les sessions restantes ont été codées par un seul codeur fiable. Les quatre comportements codés sur vidéo principaux étaient :
- Agitation - fréquence et amplitude des actions répétitives
- Réponse appropriée - écouter, répondre verbalement, suivre les instructions
- Orientation - yeux et corps orientés vers l’agent
- Comportement global - vision d’ensemble des éléments ci-dessus pendant chaque intervalle de 15 secondes
Des modèles mixtes linéaires ont testé les interactions condition × temps, en contrôlant l’âge (centré), le sexe et le QI global (centré), avec l’identifiant du participant en effet aléatoire. L’analyse de puissance indiquait que N = 47 détecte des tailles d’effet de Cohen d = 0,54 ou plus. Implication de la communauté : des membres de la famille de personnes autistes ont participé à la conceptualisation, la conception et la mise en œuvre de l’étude ; des personnes autistes et des membres de la famille de personnes autistes ont participé au développement de l’intervention VR elle-même ; et des membres de la famille de personnes autistes ont contribué à l’interprétation des résultats.
Ce qu’ils ont trouvé
Critère principal - agitation : Interaction condition × temps significative (estimation 0,47, p = 0,005). L’agitation du groupe RV a diminué significativement (estimation -0,44, p = 0,002) ; le groupe BeSAFE n’a pas changé (p = 0,99).
Réponse appropriée : Terme d’interaction non significatif (p = 0,07), mais les comparaisons planifiées ont montré une amélioration significative pré-post uniquement dans le groupe RV (p = 0,02).
Comportement global : Même schéma - interaction non significative globalement (p = 0,23), mais le groupe RV s’est amélioré significativement (p = 0,02) et BeSAFE ne l’a pas fait.
Orientation : Pas d’effet dans aucun groupe. Les auteurs attribuent cela en partie aux limitations du codage vidéo avec une seule caméra, qui rendait difficile de noter où les participants regardaient.
Connaissances et confort autoévalués : Amélioration significative dans les deux groupes (pas de différence entre les groupes). En apprendre sur les interactions avec la police a aidé la façon dont les participants se sentaient, quel que soit le format.
Évaluations des agents de police : Le groupe RV a été évalué comme montrant un meilleur contact visuel après l’intervention (p = .05). Pas d’autres différences significatives évaluées par les agents.
Les auteurs interprètent la réduction de l’agitation comme un marqueur probable de l’anxiété/activation réduite lors de l’interaction réelle - une conclusion qu’ils formulent de manière appropriée avec précaution, puisqu’ils n’ont pas directement mesuré la physiologie.
Pourquoi c’est important
Pour l’Evidence Hub, il s’agit d’un ajout important car il teste quelque chose que la plupart des recherches sur la RV dans les différences de communication ne fait pas :
- Une comparaison directe avec un comparateur actif et fondé sur des preuves plutôt qu’une liste d’attente ou une condition sans traitement. Les effets spécifiques à la RV ont survécu à cette comparaison.
- Un post-test écologiquement valide. La plupart des études de RV mesurent les résultats intra-VR ou avec les mêmes examinateurs en pré/post. Ici, le post-test impliquait de vrais policiers, en personne. Il s’agit de l’une des démonstrations de transfert direct les plus solides dans la littérature sur la RV immersive et les sciences de la communication.
- Pré-enregistrement et codage à l’aveugle - le dispositif ferme la porte aux critiques méthodologiques les plus courantes.
- Un protocole cognitivo-comportemental supervisé par un clinicien. La RV n’était pas utilisée comme outil autonome ; l’intervenant façonnait activement la pratique. Cela correspond au cadrage du modèle social déjà utilisé dans les travaux cliniques avec Therapy withVR.
Pour Therapy withVR spécifiquement : cette étude renforce une thèse défendue ailleurs sur la base de preuves plus limitées - que la pratique immersive en RV avec un clinicien à ses côtés peut se transférer à des situations réelles impliquant une pression émotionnelle. Elle ne teste pas Therapy withVR (le produit est le PSM de Floreo), mais elle enrichit la base de données probantes plus large pour cette approche.
Limites
Les auteurs indiquent explicitement ce que cet essai établit et ce qu’il n’établit pas :
- La taille d’échantillon est petite (N = 47). Plusieurs critères présentaient des termes d’interaction non significatifs malgré des améliorations intra-groupe ; la réplication avec de plus grands échantillons aidera.
- L’échantillon était majoritairement blanc (n = 34 sur 47). Les auteurs reconnaissent que c’est exactement la démographie où les interactions avec la police comportent moins de risque différentiel que pour les personnes autistes vivant en milieu urbain et les personnes autistes de couleur, qu’ils identifient comme la population la plus urgente pour les recherches futures. La race/ethnicité ne différait pas entre les conditions.
- La déficience intellectuelle associée était exclue via le critère d’inclusion QI ≥ 75. Les auteurs notent qu’il s’agit d’une « condition fréquemment associée chez les personnes autistes » et que cela limite la généralisabilité en conséquence.
- Les agents pré/post différaient - le pré-test impliquait le personnel de l’étude avec des badges, le post-test de vrais agents/personnel de sécurité. Cela ajoute du bruit mais, notent les auteurs, ne peut pas rendre compte des différences inter-conditions qui ont émergé.
- Les tailles d’effet sont modestes. Même le critère principal correspond à un changement absolu relativement faible de l’agitation ; les auteurs arguent que même de petites réductions de comportements évoquant la suspicion lors d’échanges à forts enjeux peuvent avoir un impact réel significatif.
- Le codage était majoritairement réalisé par un seul codeur. Seules 20 sessions ont été doublement codées pour l’évaluation de la fiabilité ; les autres ont été codées par un seul codeur fiable. Le kappa de Cohen pour l’orientation (0,53) était le plus faible des quatre critères, ce que les auteurs attribuent au dispositif vidéo avec une seule caméra rendant difficile de noter où regardait le participant. Les travaux futurs devraient utiliser des configurations à plusieurs caméras ou des trackers oculaires montés sur la tête.
- Conflit d’intérêts significatif. Trois auteurs sont employés de Floreo Inc. (Solorzano, Turnacioglu, Ravindran) et un quatrième (McCleery) a exercé comme consultant rémunéré pour Floreo. Les Contributions des auteurs montrent que ces mêmes auteurs étaient impliqués dans la Conceptualisation, la Méthodologie, l’Acquisition de financements et la Supervision - et non pas uniquement une co-paternité passive. L’essai était pré-enregistré (NCT03605368, 30 juillet 2018), les codeurs étaient en aveugle et le comparateur était une intervention de modélisation vidéo établie, ce qui atténue mais n’élimine pas le risque lié au COI. Il convient de le signaler lorsque l’étude est citée.
- Absence de mesure directe de l’anxiété (conductance cutanée, fréquence cardiaque). L’interprétation que la réduction de l’agitation reflète une activation réduite est plausible mais non directement testée. Les auteurs soulèvent explicitement une interprétation alternative : « la pratique en RV a d’une certaine façon permis aux participants autistes de masquer temporairement leur anxiété afin de traverser les interactions avec les agents de police avec moins d’agitation malgré des niveaux élevés d’activation physiologique. » Ils notent que, le protocole cognitivo-comportemental laissant à chaque participant le choix de ses propres objectifs de compétences, tout masquage serait « une décision consciente de leur propre volonté » - mais arguent que le bénéfice réel (réduction des comportements évoquant la suspicion lors d’interactions avec la police) s’accumule dans tous les cas.
Lien avec l’Evidence Hub
Cet ECR est la démonstration directe la plus rigoureuse sur le plan méthodologique à ce jour du transfert de la pratique en RV immersive vers des interactions sociales en monde réel dans l’autisme. Il complète :
- La revue de portée Nudelman et al. 2026 - confirme que les réponses écologiquement valides en RV sont un résultat cohérent à travers les populations ; cet ECR étend cela à un dispositif d’essai comparatif.
- Brundage et al. 2007/2015/2016 - ont établi la thèse fondamentale selon laquelle le comportement de parole dans des publics en RV est fortement corrélé au comportement de parole avec des publics réels. Cet ECR montre le transfert correspondant en monde réel pour des comportements non verbaux (agitation, réponse) lors d’échanges entre personnes autistes et policiers.
- Moïse-Richard 2021, Brassel 2023, Hansa 2025 - autres études en RV dans des populations adjacentes.
- Al-Nafjan et al. 2021 - travaux de faisabilité sur l’autisme et la RV.
Là où la base de données probantes du domaine reposait précédemment principalement sur des dispositifs intra-sujets et des études de cas (selon Nudelman 2026), cet ECR contribue à l’un des véritables points de données comparatifs, pré-enregistrés et codés à l’aveugle.
Implications pour la pratique
Pour les orthophonistes, les conseillers scolaires, les ergothérapeutes et autres cliniciens soutenant des adolescents et adultes autistes, cet essai offre des preuves que la pratique immersive en RV de courte durée, supervisée par un clinicien, peut réduire les comportements moteurs liés à l'anxiété lors d'échanges sociaux à forts enjeux - et que cette réduction est observable lorsque la personne interagit ensuite avec un vrai agent en uniforme, et non uniquement au sein de la scène VR. Le protocole de l'essai était explicitement cognitivo-comportemental : définition collaborative d'objectifs avant chaque essai en RV, retour d'information axé sur le comportement pendant, débriefing post-session. Ce cadre piloté par le praticien est ce qui fait que la pratique porte ses fruits. L'essai n'établit pas que la RV réduit les comportements d'orientation/contact visuel tels que codés depuis une seule caméra, et les tailles d'effet globales sont modestes. Concrètement, cela doit être compris comme une preuve supplémentaire du cadrage du modèle social déjà utilisé dans les travaux cliniques avec Therapy withVR : répéter la situation, en contexte, avec un clinicien à ses côtés, avant d'y faire face pour de vrai.
Implications pour la recherche
La réplication est nécessaire dans : (a) des populations autistes BIPOC qui font face à des risques réels significativement plus élevés lors d'interactions avec la police, (b) des adultes autistes présentant une déficience intellectuelle associée, et (c) de plus grands échantillons pour détecter les résultats à plus faible effet tels que le comportement d'orientation. Des mesures physiologiques directes de l'anxiété - conductance cutanée, fréquence cardiaque - aideraient à démêler si la réduction de l'agitation reflète une activation réduite ou un masquage appris sous activation. Des configurations à plusieurs caméras permettraient aux évaluateurs de noter l'orientation et le regard avec une meilleure fiabilité. Le cadrage cognitivo-comportemental du protocole d'intervention (définition d'objectifs, retour d'information fondé sur des données en temps réel, réflexion post-session) est lui-même un ingrédient actif probable et mérite des études de démantèlement. Enfin, des travaux parallèles sur la formation des policiers - en particulier pour interagir efficacement avec les citoyens autistes de couleur - devraient accompagner les interventions axées sur l'autonomisation comme celle-ci.
Citer cette étude
Si vous référencez cette étude dans votre travail, voici les formats de citation canoniques :
@article{mccleery2026,
author = {McCleery, J. P. and Zitter, A. and Cordero, L. and Russell, A. and Cola, M. and Udhnani, M. and Tena, K. G. and Yates Flanagan, A. and Turnacioglu, S. and Solórzano, R. and Miller, J. S. and Ravindran, V. and Parish-Morris, J.},
title = {Virtual Reality Intervention to Empower Autistic People to Interact With Police: A Randomized Controlled Clinical Trial for Autistic Teens and Adults},
journal = {Journal of Autism and Developmental Disorders},
year = {2026},
doi = {10.1007/s10803-026-07339-8},
url = {https://withvr.app/fr/evidence/studies/mccleery-2026}
} TY - JOUR
AU - McCleery, J. P.
AU - Zitter, A.
AU - Cordero, L.
AU - Russell, A.
AU - Cola, M.
AU - Udhnani, M.
AU - Tena, K. G.
AU - Yates Flanagan, A.
AU - Turnacioglu, S.
AU - Solórzano, R.
AU - Miller, J. S.
AU - Ravindran, V.
AU - Parish-Morris, J.
TI - Virtual Reality Intervention to Empower Autistic People to Interact With Police: A Randomized Controlled Clinical Trial for Autistic Teens and Adults
JO - Journal of Autism and Developmental Disorders
PY - 2026
DO - 10.1007/s10803-026-07339-8
UR - https://withvr.app/fr/evidence/studies/mccleery-2026
ER - Vous connaissez des travaux qui auraient leur place dans cette base ? Si une étude pertinente évaluée par les pairs n'y figure pas, envoyez la référence à hello@withvr.app. La base est tenue à jour au fil de la littérature.
Financement et indépendance
D'après la déclaration de COI de l'article : « Rita Solorzano, Sinan Turnacioglu et Vijay Ravindran sont employés par Floreo Inc., et Joseph McCleery a exercé comme consultant rémunéré. Il n'y a pas d'autres conflits d'intérêts à déclarer. » La section Contributions des auteurs rend la relation académico-industrielle plus précise que la simple mention de l'emploi : **Turnacioglu, Solorzano et Ravindran étaient impliqués dans la Conceptualisation, la Méthodologie, l'Acquisition de financements et la Supervision** de cet essai aux côtés de McCleery, Parish-Morris et Miller. Financé par NIH STTR R42MH115539-S1 (IPs : Ravindran et Parish-Morris). Essai pré-enregistré sur ClinicalTrials.gov (NCT03605368) le 30 juillet 2018. Publié sous Creative Commons CC BY-NC-ND 4.0. Le Police Safety Module de Floreo est indépendant de withVR BV - cette étude est incluse dans l'Evidence Hub car elle enrichit la base de données probantes sur la RV immersive et les différences de communication, et non parce qu'elle se rapporte à Therapy withVR.