Il existe deux technologies très différentes que l’on appelle toutes deux « réalité virtuelle », et la différence compte bien plus que presque personne ne le dit à voix haute. La première est la vidéo à 360 degrés : des images du monde réel, filmées avec une caméra spéciale, que l’on regarde à travers un casque et à l’intérieur desquelles on peut tourner le regard. La seconde est la VR interactive générée par ordinateur : un monde construit et réactif que l’on peut parcourir et dans lequel on peut agir, où l’environnement réagit à ce que l’on fait.
Cet article est un résumé objectif de ce que dit la recherche publiée sur les deux. Ce n’est pas un billet d’opinion. Je l’ai tiré de l’Evidence Hub de ce site et de la littérature plus large couvrant l’éducation, la médecine, la psychologie, la formation et la rééducation. Là où les preuves sont mitigées ou ténues, je le dis. Là où la vidéo à 360 degrés l’emporte clairement, je le dis aussi.
Je conçois de la VR interactive pour l’orthophonie et l’entraînement à la communication, j’ai donc un intérêt en jeu. C’est précisément pour cela que j’ai essayé de laisser les citations porter l’argument plutôt que mes préférences. Le schéma qui se dégage de la littérature est cohérent, et ce n’est pas celui que la plupart des gens supposent.
Deux types de VR, et pourquoi on les confond
La confusion est compréhensible, car tous deux posent un casque sur votre visage et vous entourent d’une scène. Mais sous le capot, ce sont des contraires.
La vidéo à 360 degrés (aussi appelée VR cinématique, ciné-VR ou vidéo immersive) est capturée. Une caméra à 360 degrés filme un lieu réel - une salle de classe, un café, une foule - et les images sont enroulées autour de vous dans le casque. Vous pouvez tourner la tête et regarder n’importe où, mais vous regardez un enregistrement. Vous ne pouvez pas vous approcher de quelqu’un, saisir quoi que ce soit, ni changer ce qui se passe. La scène se déroule de la même manière à chaque fois. Dans la littérature sur la formation, cela est décrit, sans détour, comme « en lecture seule » (Kittel et al., 2020).
La VR interactive générée par ordinateur est construite, pas filmée. Chaque objet, personnage et son est créé dans un moteur de jeu, ce qui rend le monde réactif. L’environnement peut réagir à ce que vous faites en temps réel, la difficulté peut être ajustée, les personnages peuvent répondre, et vous pouvez vous déplacer dans l’espace. C’est le type de VR qu’utilise Therapy withVR, et c’est ce que la plupart des gens imaginent lorsqu’ils pensent à une « expérience » VR.
Une brève note sur les termes, car le domaine n’est pas rangé : beaucoup de discours marketing appellent la vidéo à 360 degrés « VR », et certains chercheurs contestent qu’elle en relève réellement, puisque la véritable VR implique généralement une interaction en temps réel et un suivi des mouvements. Pour cet article, la distinction utile n’est pas comment on les nomme, mais ce qu’elles permettent de faire.
3DoF et 6DoF : toute la différence en une seule idée
Si vous ne retenez qu’un seul terme de jargon, retenez celui-ci, car il résume tout le clivage.
- 3DoF (trois degrés de liberté) signifie que vous pouvez faire pivoter votre tête - regarder de haut en bas, de gauche à droite, et l’incliner. C’est tout. La vidéo à 360 degrés est un médium en 3DoF. Vous pouvez regarder, mais vous ne pouvez pas déplacer votre corps dans la scène ni vous pencher pour voir derrière quelque chose.
- 6DoF (six degrés de liberté) ajoute les trois mouvements de votre corps dans l’espace - en avant et en arrière, d’un côté à l’autre, de haut en bas. La VR interactive est un médium en 6DoF. Vous pouvez vous avancer vers une personne, vous accroupir, contourner un objet, tendre la main et toucher des choses.
Cet écart n’est pas un problème de qualité que de meilleures caméras viendront résoudre. Il est structurel. Un film préenregistré est filmé depuis un point fixe unique, il ne pourra donc jamais vous donner la liberté de vous déplacer et d’agir. C’est pourquoi l’industrie de la VR grand public a tourné la page de la 3DoF il y a des années : les premiers casques 3DoF conçus autour du contenu à 360 degrés, comme le Google Daydream et l’Oculus Go, ont tous deux été abandonnés, et la plateforme s’est standardisée sur la 6DoF.
La vraie ligne de fracture : la capacité d’agir, pas le réalisme
Voici le constat qui traverse tous les domaines que j’ai examinés. Ce qui sépare les deux technologies, dans la recherche, c’est la capacité d’agir - la possibilité d’agir et d’être l’objet d’une action - et non le degré de réalisme de l’image.
Le cadre le plus clair vient du scientifique de la VR Mel Slater, qui scinde le sentiment d’« être là » en deux composantes (Slater, 2009). La première est l’illusion de lieu : le sentiment d’être dans un endroit. La vidéo à 360 degrés comme la VR interactive peuvent la produire. La seconde est l’illusion de plausibilité : le sentiment que ce qui arrive vous arrive réellement. Celle-ci dépend du fait que le monde vous répond, tient compte de vous, se comporte comme vous vous y attendriez. Un enregistrement ne peut pas faire cela, car il ne sait pas que vous êtes là.
Les sciences de l’apprentissage disent la même chose en d’autres mots. Un modèle bien connu de l’engagement, ICAP, classe les modes d’apprentissage selon leur degré d’activité, le visionnage passif tout en bas et l’engagement interactif tout en haut (Chi et Wylie, 2014). Regarder est le mode le plus faible ; faire et répondre sont les plus forts.
Et la littérature sur la thérapie d’exposition aboutit exactement au même point. Une revue de cadrage sur la VR pour l’anxiété sociale - qui, notamment, examine aussi comment l’adapter au bégaiement - le dit clairement : avec la vidéo à 360 degrés, « les utilisateurs sont limités à une navigation passive autour de l’environnement », tandis que « contrôler l’environnement en fonction du comportement de l’utilisateur est possible dans les environnements générés par ordinateur, ce qui engendre une plus grande capacité d’agir ». Sa conclusion est que « les environnements générés par ordinateur peuvent être mieux adaptés pour cibler l’interaction sociale » (Chard et van Zalk, 2022).
C’est là le cœur du sujet. La vidéo à 360 degrés fait de vous un témoin. La VR interactive fait de vous un participant.
L’interactivité compte-t-elle vraiment ? Ce que montrent les preuves
Oui, et la façon la plus parlante de le voir est contre-intuitive : dans l’ensemble de la recherche, « interactif » l’emporte sur « immersif ». Le réalisme et la présence ne sont pas ce qui produit les résultats mesurables. C’est l’interaction. Quelques-uns des résultats les plus solides :
- L’immersion à elle seule n’a qu’un faible effet. Une méta-analyse de la VR immersive dans l’éducation a trouvé un bénéfice global d’apprentissage de g = 0,38 - réel, mais modeste - et fortement dépendant de la matière et de la conception (Coban et al., 2022). Le casque n’est pas le levier.
- Plus d’immersion peut signifier moins d’apprentissage. Dans une étude contrôlée, ajouter un visiocasque à une simulation scientifique a produit plus de présence mais moins d’apprentissage et une charge mentale plus élevée qu’une version sur ordinateur de bureau. Le titre dit tout : « plus de présence mais moins d’apprentissage » (Makransky et al., 2019).
- Les gains de compétences suivent l’interactivité, pas le casque. Une vaste méta-analyse de la VR dans la formation des professions de santé a trouvé que la VR à plus forte interactivité était plus efficace pour les connaissances et les compétences, les gains de compétences atteignant une taille d’effet importante par rapport à l’enseignement traditionnel (Kyaw et al., 2019).
- Ajouter de l’interaction a un bénéfice fonctionnel. Dans un essai multicentrique mené auprès d’adultes plus âgés, ajouter une couche interactive et réactive à un entraînement sur tapis roulant a réduit les chutes d’environ 42 pour cent par rapport au même entraînement sur tapis roulant seul (Mirelman et al., 2016).
- Même pour du contenu « réel », l’interactif peut battre le filmé. Lorsque des chercheurs ont comparé différentes façons de présenter une nature virtuelle, la VR interactive générée par ordinateur a produit une présence significativement plus grande et une meilleure humeur que la vidéo à 360 degrés d’une nature réelle (Yeo et al., 2020). La scène construite et réactive a surpassé les images réelles.
Mis bout à bout, ces éléments pointent dans une seule direction : l’ingrédient actif de la VR est la capacité de l’utilisateur à agir et à recevoir une réponse. C’est précisément l’ingrédient auquel renonce la vidéo à 360 degrés.
Là où la vidéo à 360 degrés l’emporte vraiment
Ce n’est pas un réquisitoire contre la vidéo à 360 degrés. Elle a de réelles forces, étayées par les preuves, et être honnête à leur sujet est ce qui rend le reste crédible. Elle l’emporte lorsque l’objectif est de ressentir ou d’observer plutôt que de faire.
- Le photoréalisme des lieux et des visages réels. C’est une véritable capture du monde réel, personne n’a donc à modéliser une foule ou un visage. Pour « à quoi ressemble réellement cet endroit », rien ne la surpasse.
- Le coût et la rapidité. Filmer une scène à 360 degrés est bien moins cher et bien plus rapide que de construire un environnement 3D interactif. Le compromis est qu’une fois filmée, la scène est figée - vous ne pouvez pas la modifier sans refaire le tournage.
- Les expériences passives comme la distraction de la douleur. C’est le seul domaine où la passivité l’emporte réellement. Une vaste méta-analyse de la VR pour la douleur (122 essais randomisés, plus de 9 000 patients) a trouvé que le contenu passif était au moins aussi efficace que le contenu interactif pour le soulagement de la douleur fondé sur la distraction (Lier et al., 2023).
- L’impact émotionnel et le sentiment d’« être là ». La vidéo à 360 degrés peut produire une forte réponse émotionnelle dans l’instant, ce qui explique sa popularité pour les projets d’empathie et de journalisme. La mise en garde de la recherche est que l’effet tend à être de courte durée et ne se traduit pas de manière fiable par un changement de comportement (Martingano et al., 2022).
- L’observation et la prise de conscience. Pour regarder un scénario se dérouler, remarquer ce qui se passe et en discuter ensuite, un point de vue fixe convient et est souvent idéal.
Si votre tâche consiste à placer quelqu’un à l’intérieur d’un lieu réel et à le lui faire découvrir, la vidéo à 360 degrés est un bon outil. La question est de savoir si votre tâche relève de l’observation - ou de l’interaction.
Un tableau de bord : laquelle l’emporte, et pour quoi
Aucune technologie ne l’emporte sur tout. La réponse honnête est que le vainqueur dépend de la tâche, ce qui est précisément tout l’enjeu. Voici comment les preuves s’alignent.
| Ce que vous attendez de la VR | Laquelle l’emporte | Pourquoi |
|---|---|---|
| Permettre à l’utilisateur d’agir, d’interagir et de prendre la parole à tour de rôle | Interactive | La vidéo à 360 degrés est « en lecture seule », limitée à une navigation passive |
| Adapter et graduer la difficulté à l’individu | Interactive | La vidéo à 360 degrés est uniforme pour tous ; une scène construite peut être ajustée en direct |
| Bâtir une compétence transférable à la vie réelle | Interactive | Les gains de compétences suivent l’interactivité, pas l’immersion |
| Se déplacer dans l’espace et l’explorer | Interactive | 6DoF contre 3DoF - le point de vue enregistré est figé |
| Produire un sentiment de présence | Souvent l’interactive | La VR interactive a égalé ou dépassé les images réelles sur la présence |
| Montrer des lieux et des visages réels et photoréalistes | Vidéo à 360 degrés | C’est une véritable capture du monde réel |
| Produire quelque chose vite et à moindre coût | Vidéo à 360 degrés | Filmer l’emporte sur la construction d’un monde 3D |
| Distraire de la douleur ou de la détresse (passif) | Vidéo à 360 degrés | Le contenu passif est au moins aussi efficace pour la distraction |
| Créer une réponse émotionnelle dans l’instant | Vidéo à 360 degrés | Forte mais généralement de courte durée |
| Produire un changement durable de comportement ou de compétence | Interactive | Agir et répondre l’emporte sur regarder |
Les données
Études sur la VR immersive en orthophonie et communication, par méthode
Parmi les études sur la VR immersive (avec casque) en orthophonie et communication, 56 utilisaient une VR interactive générée par ordinateur et seulement 4 la vidéo à 360 degrés.
Les chiffres à retenir
- 56 contre 4. Dans l’Evidence Hub de ce site, parmi les études de VR sur casque immersif en parole et communication, 56 utilisaient la VR interactive et 4 utilisaient la vidéo à 360 degrés.
- g = 0,38. L’immersion à elle seule n’a qu’un faible effet d’apprentissage. L’interactivité est le levier.
- 3 contre 6. Les degrés de liberté. La vidéo à 360 degrés ne peut pas quitter la 3DoF.
- Environ 42 pour cent. La réduction des chutes lorsqu’une couche interactive a été ajoutée à un entraînement identique.
- 122 essais, plus de 9 000 patients. L’ampleur du seul domaine clair où le contenu passif à 360 degrés tient son rang : la distraction de la douleur.
- 2018 et avant. La vidéo à 360 degrés était déjà qualifiée d’« en lecture seule » dans la littérature sur la formation. La limite n’est pas nouvelle.
Ce que cela signifie pour l’orthophonie et l’entraînement à la communication
La communication est interactive par définition. Une conversation est une série de réponses : quelqu’un parle, vous réagissez, il réagit à votre réaction, et la difficulté évolue en temps réel. La pratiquer utilement, c’est pratiquer cette boucle - à un niveau adapté à la personne, avec une scène qui répond. Ce sont exactement les choses qu’un enregistrement figé ne peut pas faire.
Ce n’est donc pas un hasard si la recherche sur la parole et la communication s’est rassemblée, de manière écrasante, autour de la VR interactive. La répartition de 56 contre 4 dans l’Evidence Hub n’est pas une bizarrerie tenant aux études que j’ai choisi d’inclure ; elle reflète l’endroit où réside réellement le mécanisme du changement. La poignée d’études de vidéo à 360 degrés dans ce domaine offre un tableau contrasté - un résultat positif pour l’anxiété liée à la prise de parole en public (Reeves 2021), un résultat non significatif pour la voix (Bostyn 2026), et quelques petites études de faisabilité (Chard 2023, deLeyer-Tiarks 2020) - ce qui correspond à peu près à ce que l’on attendrait d’un médium conçu pour l’observation appliqué à une tâche fondée sur l’interaction.
C’est pourquoi Therapy withVR est interactif plutôt que filmé. L’argument n’est pas « l’interactif est toujours meilleur ». Il est plus étroit et, je crois, plus solide : l’entraînement à la communication a besoin que la scène réponde à la personne et puisse être réglée pour elle, et seule la VR interactive peut le faire. Si vous voulez la version plus longue de ce raisonnement, elle se trouve sur la page Pourquoi Therapy withVR.
Une note pour les chercheurs
Il y a un point pratique enfoui dans tout cela, et je veux le formuler avec soin, comme une observation plutôt qu’un verdict.
La limite centrale de la vidéo à 360 degrés - pas d’interaction, pas d’individualisation, un point de vue fixe - est structurelle. Elle ne peut pas être contournée par l’ingénierie au sein de ce médium, et elle est documentée depuis des années. Lorsque la vidéo à 360 degrés est appliquée à des tâches qui dépendent de l’interaction, les études tendent à se heurter de nouveau au même plafond. Ce n’est pas une critique d’une étude particulière ; c’est une propriété de l’outil.
La lecture constructive porte sur l’endroit où l’énergie de recherche va le plus loin. Les questions qui restent réellement ouvertes ne sont pas « un médium non interactif soutient-il une pratique interactive » - la littérature pointe déjà vers la réponse. Ce sont des questions comme : où exactement la vidéo à 360 degrés s’insère-t-elle le mieux, comment se comparent les conceptions hybrides, et qu’est-ce qui fait que les compétences apprises en VR se généralisent à la vie réelle. Celles-là méritent d’être financées. Re-tester un plafond structurel connu est un argument plus difficile à défendre.
Vers où va la VR
La trajectoire de tout le domaine renforce la même direction. Les technologies qui attirent aujourd’hui le plus d’attention sont celles qui rendent le contenu capturé interactif : la vidéo volumétrique, qui permet de marcher autour d’une personne réelle et filmée, et des techniques en temps réel comme le 3D Gaussian splatting, qui restitue des scènes capturées photoréalistes que l’on peut parcourir à pleine fréquence d’images (Kerbl et al., 2023). À cela s’ajoutent des moteurs de jeu qui se dotent de personnages pilotés par une IA conversationnelle capable de répondre en temps réel.
Le fil conducteur est que le domaine converge vers « photoréaliste et interactif ». L’avantage de réalisme qui rendait autrefois la vidéo à 360 degrés attrayante se réduit, tandis que l’interactivité qui lui manque devient la norme. Miser sur l’interaction n’est pas seulement défendable aujourd’hui ; c’est la direction que prend la technologie.
En résumé
- Il existe deux choses différentes appelées VR. La vidéo à 360 degrés est un enregistrement à l’intérieur duquel vous regardez autour de vous. La VR interactive est un monde réactif au sein duquel vous agissez.
- La recherche les distingue sur la capacité d’agir, pas sur le réalisme. À travers les domaines, l’interactivité est ce qui produit le bénéfice mesurable - « interactif » l’emporte sur « immersif ».
- La vidéo à 360 degrés a de réelles forces : photoréalisme, faible coût, usages passifs comme la distraction de la douleur, et forte émotion dans l’instant. Utilisez-la pour observer et pour ressentir.
- La VR interactive l’emporte là où il faut agir, prendre la parole à tour de rôle, individualiser, bâtir une compétence transférable et se déplacer dans l’espace.
- La communication est une interaction ; aussi, l’orthophonie et l’entraînement à la communication s’accordent avec la VR interactive. La base de preuves, le mécanisme et la direction de la technologie convergent tous.
Si vous voulez voir comment se déroule réellement une séance de VR interactive contrôlée par la clinicienne, prenez contact.
Foire aux questions
La vidéo à 360 degrés est-elle la même chose que la réalité virtuelle ? Pas exactement. La vidéo à 360 degrés est une captation préenregistrée du monde réel à l’intérieur de laquelle vous regardez autour de vous dans un casque. On l’appelle parfois VR cinématique, mais il lui manque l’interaction en temps réel et le mouvement qui définissent habituellement la réalité virtuelle. Beaucoup de personnes et de produits emploient « VR » de façon large pour couvrir les deux, mais elles sont techniquement différentes.
Quelle est la différence entre la vidéo à 360 degrés et la VR interactive ? La vidéo à 360 degrés est capturée avec une caméra et figée : vous pouvez regarder autour de vous, mais vous ne pouvez pas entrer dans la scène, interagir avec des objets, ni changer ce qui se passe. La VR interactive est construite dans un moteur de jeu et réactive : le monde réagit à vous, la difficulté peut être ajustée, et vous pouvez vous déplacer dans l’espace et agir dessus.
Peut-on interagir avec la vidéo à 360 degrés ? Seulement de façon très limitée. Vous pouvez regarder dans n’importe quelle direction, et certaines versions ajoutent des points cliquables, mais vous ne pouvez pas vous déplacer, ramasser des choses, ni faire répondre des personnages en temps réel. C’est pourquoi la littérature sur la formation décrit la vidéo à 360 degrés comme « en lecture seule ».
Qu’est-ce que la 3DoF et la 6DoF ? Les degrés de liberté décrivent comment vous pouvez bouger. La 3DoF (trois degrés de liberté) vous permet uniquement de faire pivoter votre tête - la norme pour la vidéo à 360 degrés. La 6DoF (six degrés de liberté) ajoute le mouvement de votre corps dans l’espace, de sorte que vous pouvez avancer, vous pencher et tendre la main. La VR interactive est en 6DoF.
Laquelle est la meilleure, la vidéo à 360 degrés ou la VR interactive ? Cela dépend de la tâche. La vidéo à 360 degrés est meilleure pour montrer des lieux réels à moindre coût, pour les expériences passives comme la distraction de la douleur, et pour une forte émotion dans l’instant. La VR interactive est meilleure pour tout ce qui exige d’agir, de prendre la parole à tour de rôle, d’individualiser la difficulté ou de bâtir une compétence transférable à la vie réelle.
La vidéo à 360 degrés est-elle adaptée à l’orthophonie ? Pour l’observation et la discussion, elle peut aider. Mais l’entraînement à la communication dépend du fait de répondre aux gens en temps réel et d’ajuster la difficulté à l’individu, ce que la vidéo à 360 degrés ne peut pas faire. Dans la recherche, la VR pour la parole et la communication s’est rassemblée de manière écrasante autour de la VR interactive plutôt que de la vidéo à 360 degrés.
Qu’est-ce que la VR cinématique (ciné-VR) ? La VR cinématique, ou ciné-VR, est un autre nom de la vidéo à 360 degrés narrative visionnée dans un casque - des images réelles avec un son spatialisé, structurées comme un film. Elle partage les forces et les limites de la vidéo à 360 degrés : un grand réalisme, mais pas d’interaction en temps réel.
Pour aller plus loin
- Evidence Hub - La bibliothèque complète des études de VR sur la parole et la communication derrière les décomptes de cet article
- Validité écologique de l’orthophonie en VR - Pourquoi une scène d’entraînement doit se comporter comme le monde réel
- Cybermalaise en VR clinique : ce qu’il faut anticiper - L’autre grande question pratique sur la VR en clinique
- Pourquoi Therapy withVR existe - Les choix de conception derrière une plateforme interactive et contrôlée par la clinicienne
- Pourquoi Therapy withVR - Comment la plateforme met en pratique les principes de cet article
