Un article arrive dans votre boîte mail. Quelqu’un de votre équipe dit « regarde cette étude VR, ça a l’air utile ». Vous voulez savoir quoi en penser avant votre prochaine séance ou votre prochaine réunion de financement. Par où commencer ?
Voici un court guide pour lire une étude d’orthophonie en VR avec un œil critique. Pas un cours de méthodologie de recherche. Pas un manuel de statistiques. Juste un ensemble pratique de questions qu’un professionnel de l’orthophonie peut garder en tête pour distinguer une étude qui soutient une décision clinique d’une étude qui est intéressante mais pas prête à changer ce que vous faites.
Commencez par qui, pas par quoi
Avant tout autre chose, lisez la section Participants. Qui était dans cette étude ?
- Combien de participants ? Cinq, c’est un pilote. Quinze, c’est une petite étude. Cinquante commence à être une étude dont les conclusions se généralisent. Pas une règle absolue, mais un guide approximatif utile.
- Quelle population ? Étudiants universitaires non cliniques ? Adultes qui bégaient recrutés dans une clinique ? Enfants ayant des différences de langage ? La population façonne ce que les conclusions peuvent vous dire.
- Les participants ont-ils été payés, recrutés ou bénévoles ? Comment ont-ils été sélectionnés ?
Si la population dans l’étude est très différente des personnes que vous voyez en clinique, les conclusions ne se transfèrent pas nécessairement. Ce n’est pas une critique de l’étude. C’est un rappel qu’aucune étude unique ne répond à toutes les questions, et que les preuves doivent être adaptées à la population qui vous intéresse.
Comprenez ce qu’ils ont réellement comparé
La section suivante qui mérite d’être lue est le Design. Qu’est-ce que les chercheurs ont comparé ?
- Intra-sujets : chaque participant a fait chaque condition. Bon pour contrôler les différences individuelles. Peut être épuisant pour les participants.
- Inter-sujets : différents participants ont fait différentes conditions. Nécessite de plus grands échantillons. L’assignation aléatoire est importante.
- Pré-post : participants mesurés avant et après une intervention. Utile mais vulnérable aux effets de pratique, aux effets d’attente et à la régression vers la moyenne en l’absence de groupe contrôle.
- Essai contrôlé randomisé : participants assignés aléatoirement à l’intervention ou au contrôle. Le design le plus solide pour les revendications causales, mais plus rare en travaux préliminaires.
Demandez-vous : si l’intervention n’avait eu aucun effet, y a-t-il une autre raison pour laquelle les résultats auraient pu changer entre les conditions ? Si la réponse est « oui, plusieurs raisons », alors le design est faible pour une revendication causale. Un bon design d’étude exclut la plupart des alternatives.
Regardez ce qu’ils ont mesuré
La section Mesures de résultats vous indique ce que les chercheurs ont décidé de considérer comme preuve. Cela importe car différentes mesures racontent différentes histoires.
- L’auto-déclaration (questionnaires, évaluations SUDS, évaluations de confiance) capture l’expérience du participant. Sens écologique élevé, mais sensible aux attentes et aux caractéristiques de la demande.
- Le comportement observé (tours de parole, temps de parole) est plus proche de l’objectif mais nécessite encore une interprétation et repose souvent sur des évaluateurs humains.
- La physiologie (rythme cardiaque, conductance cutanée) est plus difficile à fausser mais ne correspond pas toujours nettement à l’expérience ressentie.
- L’acoustique (fréquence fondamentale, intensité, variabilité) mesure directement les propriétés du signal vocal, indépendamment de l’auto-déclaration.
Les études de validation VR les plus convaincantes combinent les mesures. Si l’anxiété augmente sur le SUDS et que le rythme cardiaque et les mesures vocales évoluent de manière cohérente, c’est une preuve plus forte que toute mesure isolée. Méfiez-vous des études qui ne rapportent qu’un seul type de mesure - elles racontent une histoire partielle.
Vérifiez si l’effet est réellement grand
Une conclusion peut être statistiquement significative et pratiquement insignifiante. C’est une leçon difficile. Cela arrive parce que la signification statistique dépend de la taille de l’échantillon : une infime différence sera statistiquement significative si l’échantillon est suffisamment grand.
Ce que vous voulez, c’est une taille d’effet. Les courantes dans cette littérature :
- d de Cohen : grossièrement, 0,2 est petit, 0,5 est moyen, 0,8 est grand. Des valeurs de d minuscules (< 0,1) signifient que l’effet est à peine présent même s’il est « significatif ».
- Corrélation r : 0,1 petit, 0,3 moyen, 0,5 grand. Les valeurs supérieures à 0,7 sont frappantes.
- Eta carré partiel (η²ₚ) : 0,01 petit, 0,06 moyen, 0,14 grand.
Si un article ne rapporte que des valeurs p sans tailles d’effet, c’est une faiblesse. S’il rapporte des tailles d’effet, vérifiez-les. Une grande valeur p avec une petite taille d’effet peut rester cliniquement inintéressante même si les statistiques sont légitimes.
Lisez la section des limites (sérieusement)
Les auteurs connaissent les limites de leurs propres études mieux que vous. Lisez ce qu’ils disent. Une bonne section de limites vous dira :
- Ce que la taille de l’échantillon limite
- Ce que la population limite (à qui les conclusions peuvent ne pas s’appliquer)
- Ce que le design ne peut pas exclure
- Ce que la période de suivi vous dit ou ne vous dit pas sur les effets à long terme
Si la section des limites d’un article est un seul paragraphe jeté à la légère, traitez les conclusions avec prudence. Si les auteurs ont réfléchi attentivement à ce que leur étude peut et ne peut pas nous dire, accordez plus de poids à l’article.
Distinguez la faisabilité de l’effet
Une grande partie de la recherche VR précoce porte sur la faisabilité plutôt que sur l’effet. Une étude de faisabilité demande : « cela peut-il être fait du tout ? Les participants le tolèrent-ils ? L’équipement fonctionne-t-il comme prévu ? » Ce sont des questions de recherche légitimes, et les conclusions peuvent être informatives - mais elles ne sont pas une preuve que l’intervention fonctionne.
Une étude de faisabilité avec cinq participants montrant une diminution de l’anxiété sur une semaine vous dit qu’une semaine de pratique est faisable. Elle ne vous dit pas que la VR a causé le changement. D’autres choses auraient pu le faire - effets de pratique, attente, attention du chercheur, régression vers la moyenne.
Lorsque vous voyez une étude pré-post à petit échantillon avec des résultats favorables, demandez : « est-ce un pilote me disant que l’idée mérite une étude plus grande, ou est-ce présenté comme une preuve d’effet ? » Le premier est utile. Le second relèverait de la sur-revendication.
Posez la question de la généralisation honnêtement
La plupart des études VR mesurent les réponses à l’intérieur de l’environnement virtuel. Moins mesurent si les gains se transfèrent aux situations réelles. Et pourtant, ce que les clients veulent généralement, c’est un changement dans la vie réelle, pas dans une pièce virtuelle.
Questions à garder :
- L’étude a-t-elle mesuré quoi que ce soit en dehors du cadre VR ?
- Y a-t-il eu des mesures de suivi après la fin des séances VR ?
- Les participants ont-ils rapporté des changements dans leurs expériences de parole quotidiennes ?
Si aucune de ces présences n’est constatée, l’étude ne peut pas vous en dire beaucoup sur le transfert dans le monde réel. Ce n’est pas un défaut - c’est une limite de portée. Mais cela compte lorsque vous décidez ce qu’une étude soutient.
Vérifiez qui a financé l’étude
Les déclarations de Financement et de Conflits d’intérêts valent la peine d’être lues. Un financement indépendant provenant de conseils de recherche, d’universités ou d’organismes gouvernementaux est différent d’un financement industriel ou d’une étude menée par une entreprise sur son propre produit.
Aucun type de financement n’invalide automatiquement une étude. Mais savoir qui l’a payée et qui a un intérêt financier dans ses résultats vous aide à peser les conclusions. Une étude sur les publics virtuels financée par un conseil de recherche n’a pas le même poids qu’une étude sur un produit VR spécifique menée par l’entreprise de ce produit.
Une courte liste de vérification
Si une étude d’orthophonie en VR arrive sur votre bureau, ces six questions vous mèneront la plupart du temps à destination :
La liste de vérification en 6 questions
Lire une étude d'orthophonie en VR avec un œil critique
- Qui a été étudié ? Taille d'échantillon et population. 5 = pilote, 15 = petite, 50+ = généralisable.
- Quel était le design ? Intra / inter / pré-post / ECR. Quelles alternatives exclut-il ?
- Qu'a-t-on mesuré ? Auto-déclaration, comportement, physiologie, acoustique. Plusieurs mesures = plus fort.
- Quelle est la taille de l'effet ? d de Cohen, r ou eta carré - pas seulement la valeur p.
- Qu'ont signalé les auteurs ? Lisez la section des limites sérieusement. Une section maigre est en soi un signal.
- A-t-elle testé le transfert ? A-t-on mesuré quoi que ce soit en dehors du cadre VR ? Le transfert vers le monde réel est la question clinique.
Imprimez ou enregistrez cette carte. Aucune de ces questions ne nécessite une formation en statistiques - elles posent ce que l'article lui-même répond habituellement en langage clair.
Rien de tout cela ne nécessite une formation en statistiques. Cela demande de ralentir et de poser les questions auxquelles les auteurs répondent habituellement en langage clair quelque part dans l’article.
Pour aller plus loin
- Evidence Hub - recherche évaluée par les pairs sur la VR en orthophonie, avec résumés en langage clair
- Comment les études sont notées - le schéma de certitude utilisé dans l’Evidence Hub
- Glossaire de l’Evidence Hub - définitions des termes de recherche utilisés dans ces études
- Pour aller plus loin - ouvrages et communautés qui façonnent la pratique actuelle
- Liste de vérification technologique pour orthophonistes - cadre plus large pour évaluer une nouvelle technologie