Il existe deux technologies très différentes que l’on appelle toutes deux « réalité virtuelle », et la différence compte bien plus que presque personne ne le dit à voix haute. La première est la vidéo à 360 degrés : des images du monde réel, filmées avec une caméra spéciale, que l’on regarde à travers un casque et à l’intérieur desquelles on peut tourner le regard. La seconde est la VR interactive générée par ordinateur : un monde construit et réactif que l’on peut parcourir et dans lequel on peut agir, où l’environnement réagit à ce que l’on fait.

Cet article est un résumé objectif de ce que dit la recherche publiée sur les deux. Ce n’est pas un billet d’opinion. Je l’ai tiré de l’Evidence Hub de ce site et de la littérature plus large couvrant l’éducation, la médecine, la psychologie, la formation et la rééducation. Là où les preuves sont mitigées ou ténues, je le dis. Là où la vidéo à 360 degrés l’emporte clairement, je le dis aussi.

Je conçois de la VR interactive pour l’orthophonie et l’entraînement à la communication, j’ai donc un intérêt en jeu. C’est précisément pour cela que j’ai essayé de laisser les citations porter l’argument plutôt que mes préférences. Le schéma qui se dégage de la littérature est cohérent, et ce n’est pas celui que la plupart des gens supposent.

Deux types de VR, et pourquoi on les confond

La confusion est compréhensible, car tous deux posent un casque sur votre visage et vous entourent d’une scène. Mais sous le capot, ce sont des contraires.

La vidéo à 360 degrés (aussi appelée VR cinématique, ciné-VR ou vidéo immersive) est capturée. Une caméra à 360 degrés filme un lieu réel - une salle de classe, un café, une foule - et les images sont enroulées autour de vous dans le casque. Vous pouvez tourner la tête et regarder n’importe où, mais vous regardez un enregistrement. Vous ne pouvez pas vous approcher de quelqu’un, saisir quoi que ce soit, ni changer ce qui se passe. La scène se déroule de la même manière à chaque fois. Dans la littérature sur la formation, cela est décrit, sans détour, comme « en lecture seule » (Kittel et al., 2020).

La VR interactive générée par ordinateur est construite, pas filmée. Chaque objet, personnage et son est créé dans un moteur de jeu, ce qui rend le monde réactif. L’environnement peut réagir à ce que vous faites en temps réel, la difficulté peut être ajustée, les personnages peuvent répondre, et vous pouvez vous déplacer dans l’espace. C’est le type de VR qu’utilise Therapy withVR, et c’est ce que la plupart des gens imaginent lorsqu’ils pensent à une « expérience » VR.

Une brève note sur les termes, car le domaine n’est pas rangé : beaucoup de discours marketing appellent la vidéo à 360 degrés « VR », et certains chercheurs contestent qu’elle en relève réellement, puisque la véritable VR implique généralement une interaction en temps réel et un suivi des mouvements. Pour cet article, la distinction utile n’est pas comment on les nomme, mais ce qu’elles permettent de faire.

3DoF et 6DoF : toute la différence en une seule idée

Si vous ne retenez qu’un seul terme de jargon, retenez celui-ci, car il résume tout le clivage.

Cet écart n’est pas un problème de qualité que de meilleures caméras viendront résoudre. Il est structurel. Un film préenregistré est filmé depuis un point fixe unique, il ne pourra donc jamais vous donner la liberté de vous déplacer et d’agir. C’est pourquoi l’industrie de la VR grand public a tourné la page de la 3DoF il y a des années : les premiers casques 3DoF conçus autour du contenu à 360 degrés, comme le Google Daydream et l’Oculus Go, ont tous deux été abandonnés, et la plateforme s’est standardisée sur la 6DoF.

La vraie ligne de fracture : la capacité d’agir, pas le réalisme

Voici le constat qui traverse tous les domaines que j’ai examinés. Ce qui sépare les deux technologies, dans la recherche, c’est la capacité d’agir - la possibilité d’agir et d’être l’objet d’une action - et non le degré de réalisme de l’image.

Le cadre le plus clair vient du scientifique de la VR Mel Slater, qui scinde le sentiment d’« être là » en deux composantes (Slater, 2009). La première est l’illusion de lieu : le sentiment d’être dans un endroit. La vidéo à 360 degrés comme la VR interactive peuvent la produire. La seconde est l’illusion de plausibilité : le sentiment que ce qui arrive vous arrive réellement. Celle-ci dépend du fait que le monde vous répond, tient compte de vous, se comporte comme vous vous y attendriez. Un enregistrement ne peut pas faire cela, car il ne sait pas que vous êtes là.

Les sciences de l’apprentissage disent la même chose en d’autres mots. Un modèle bien connu de l’engagement, ICAP, classe les modes d’apprentissage selon leur degré d’activité, le visionnage passif tout en bas et l’engagement interactif tout en haut (Chi et Wylie, 2014). Regarder est le mode le plus faible ; faire et répondre sont les plus forts.

Et la littérature sur la thérapie d’exposition aboutit exactement au même point. Une revue de cadrage sur la VR pour l’anxiété sociale - qui, notamment, examine aussi comment l’adapter au bégaiement - le dit clairement : avec la vidéo à 360 degrés, « les utilisateurs sont limités à une navigation passive autour de l’environnement », tandis que « contrôler l’environnement en fonction du comportement de l’utilisateur est possible dans les environnements générés par ordinateur, ce qui engendre une plus grande capacité d’agir ». Sa conclusion est que « les environnements générés par ordinateur peuvent être mieux adaptés pour cibler l’interaction sociale » (Chard et van Zalk, 2022).

C’est là le cœur du sujet. La vidéo à 360 degrés fait de vous un témoin. La VR interactive fait de vous un participant.

L’interactivité compte-t-elle vraiment ? Ce que montrent les preuves

Oui, et la façon la plus parlante de le voir est contre-intuitive : dans l’ensemble de la recherche, « interactif » l’emporte sur « immersif ». Le réalisme et la présence ne sont pas ce qui produit les résultats mesurables. C’est l’interaction. Quelques-uns des résultats les plus solides :

Mis bout à bout, ces éléments pointent dans une seule direction : l’ingrédient actif de la VR est la capacité de l’utilisateur à agir et à recevoir une réponse. C’est précisément l’ingrédient auquel renonce la vidéo à 360 degrés.

Là où la vidéo à 360 degrés l’emporte vraiment

Ce n’est pas un réquisitoire contre la vidéo à 360 degrés. Elle a de réelles forces, étayées par les preuves, et être honnête à leur sujet est ce qui rend le reste crédible. Elle l’emporte lorsque l’objectif est de ressentir ou d’observer plutôt que de faire.

Si votre tâche consiste à placer quelqu’un à l’intérieur d’un lieu réel et à le lui faire découvrir, la vidéo à 360 degrés est un bon outil. La question est de savoir si votre tâche relève de l’observation - ou de l’interaction.

Un tableau de bord : laquelle l’emporte, et pour quoi

Aucune technologie ne l’emporte sur tout. La réponse honnête est que le vainqueur dépend de la tâche, ce qui est précisément tout l’enjeu. Voici comment les preuves s’alignent.

Ce que vous attendez de la VRLaquelle l’emportePourquoi
Permettre à l’utilisateur d’agir, d’interagir et de prendre la parole à tour de rôleInteractiveLa vidéo à 360 degrés est « en lecture seule », limitée à une navigation passive
Adapter et graduer la difficulté à l’individuInteractiveLa vidéo à 360 degrés est uniforme pour tous ; une scène construite peut être ajustée en direct
Bâtir une compétence transférable à la vie réelleInteractiveLes gains de compétences suivent l’interactivité, pas l’immersion
Se déplacer dans l’espace et l’explorerInteractive6DoF contre 3DoF - le point de vue enregistré est figé
Produire un sentiment de présenceSouvent l’interactiveLa VR interactive a égalé ou dépassé les images réelles sur la présence
Montrer des lieux et des visages réels et photoréalistesVidéo à 360 degrésC’est une véritable capture du monde réel
Produire quelque chose vite et à moindre coûtVidéo à 360 degrésFilmer l’emporte sur la construction d’un monde 3D
Distraire de la douleur ou de la détresse (passif)Vidéo à 360 degrésLe contenu passif est au moins aussi efficace pour la distraction
Créer une réponse émotionnelle dans l’instantVidéo à 360 degrésForte mais généralement de courte durée
Produire un changement durable de comportement ou de compétenceInteractiveAgir et répondre l’emporte sur regarder

Les données

Études sur la VR immersive en orthophonie et communication, par méthode

VR interactive56
Vidéo à 360°4

Parmi les études sur la VR immersive (avec casque) en orthophonie et communication, 56 utilisaient une VR interactive générée par ordinateur et seulement 4 la vidéo à 360 degrés.

Les chiffres à retenir

Ce que cela signifie pour l’orthophonie et l’entraînement à la communication

La communication est interactive par définition. Une conversation est une série de réponses : quelqu’un parle, vous réagissez, il réagit à votre réaction, et la difficulté évolue en temps réel. La pratiquer utilement, c’est pratiquer cette boucle - à un niveau adapté à la personne, avec une scène qui répond. Ce sont exactement les choses qu’un enregistrement figé ne peut pas faire.

Ce n’est donc pas un hasard si la recherche sur la parole et la communication s’est rassemblée, de manière écrasante, autour de la VR interactive. La répartition de 56 contre 4 dans l’Evidence Hub n’est pas une bizarrerie tenant aux études que j’ai choisi d’inclure ; elle reflète l’endroit où réside réellement le mécanisme du changement. La poignée d’études de vidéo à 360 degrés dans ce domaine offre un tableau contrasté - un résultat positif pour l’anxiété liée à la prise de parole en public (Reeves 2021), un résultat non significatif pour la voix (Bostyn 2026), et quelques petites études de faisabilité (Chard 2023, deLeyer-Tiarks 2020) - ce qui correspond à peu près à ce que l’on attendrait d’un médium conçu pour l’observation appliqué à une tâche fondée sur l’interaction.

C’est pourquoi Therapy withVR est interactif plutôt que filmé. L’argument n’est pas « l’interactif est toujours meilleur ». Il est plus étroit et, je crois, plus solide : l’entraînement à la communication a besoin que la scène réponde à la personne et puisse être réglée pour elle, et seule la VR interactive peut le faire. Si vous voulez la version plus longue de ce raisonnement, elle se trouve sur la page Pourquoi Therapy withVR.

Une note pour les chercheurs

Il y a un point pratique enfoui dans tout cela, et je veux le formuler avec soin, comme une observation plutôt qu’un verdict.

La limite centrale de la vidéo à 360 degrés - pas d’interaction, pas d’individualisation, un point de vue fixe - est structurelle. Elle ne peut pas être contournée par l’ingénierie au sein de ce médium, et elle est documentée depuis des années. Lorsque la vidéo à 360 degrés est appliquée à des tâches qui dépendent de l’interaction, les études tendent à se heurter de nouveau au même plafond. Ce n’est pas une critique d’une étude particulière ; c’est une propriété de l’outil.

La lecture constructive porte sur l’endroit où l’énergie de recherche va le plus loin. Les questions qui restent réellement ouvertes ne sont pas « un médium non interactif soutient-il une pratique interactive » - la littérature pointe déjà vers la réponse. Ce sont des questions comme : où exactement la vidéo à 360 degrés s’insère-t-elle le mieux, comment se comparent les conceptions hybrides, et qu’est-ce qui fait que les compétences apprises en VR se généralisent à la vie réelle. Celles-là méritent d’être financées. Re-tester un plafond structurel connu est un argument plus difficile à défendre.

Vers où va la VR

La trajectoire de tout le domaine renforce la même direction. Les technologies qui attirent aujourd’hui le plus d’attention sont celles qui rendent le contenu capturé interactif : la vidéo volumétrique, qui permet de marcher autour d’une personne réelle et filmée, et des techniques en temps réel comme le 3D Gaussian splatting, qui restitue des scènes capturées photoréalistes que l’on peut parcourir à pleine fréquence d’images (Kerbl et al., 2023). À cela s’ajoutent des moteurs de jeu qui se dotent de personnages pilotés par une IA conversationnelle capable de répondre en temps réel.

Le fil conducteur est que le domaine converge vers « photoréaliste et interactif ». L’avantage de réalisme qui rendait autrefois la vidéo à 360 degrés attrayante se réduit, tandis que l’interactivité qui lui manque devient la norme. Miser sur l’interaction n’est pas seulement défendable aujourd’hui ; c’est la direction que prend la technologie.

En résumé

Si vous voulez voir comment se déroule réellement une séance de VR interactive contrôlée par la clinicienne, prenez contact.

Foire aux questions

La vidéo à 360 degrés est-elle la même chose que la réalité virtuelle ? Pas exactement. La vidéo à 360 degrés est une captation préenregistrée du monde réel à l’intérieur de laquelle vous regardez autour de vous dans un casque. On l’appelle parfois VR cinématique, mais il lui manque l’interaction en temps réel et le mouvement qui définissent habituellement la réalité virtuelle. Beaucoup de personnes et de produits emploient « VR » de façon large pour couvrir les deux, mais elles sont techniquement différentes.

Quelle est la différence entre la vidéo à 360 degrés et la VR interactive ? La vidéo à 360 degrés est capturée avec une caméra et figée : vous pouvez regarder autour de vous, mais vous ne pouvez pas entrer dans la scène, interagir avec des objets, ni changer ce qui se passe. La VR interactive est construite dans un moteur de jeu et réactive : le monde réagit à vous, la difficulté peut être ajustée, et vous pouvez vous déplacer dans l’espace et agir dessus.

Peut-on interagir avec la vidéo à 360 degrés ? Seulement de façon très limitée. Vous pouvez regarder dans n’importe quelle direction, et certaines versions ajoutent des points cliquables, mais vous ne pouvez pas vous déplacer, ramasser des choses, ni faire répondre des personnages en temps réel. C’est pourquoi la littérature sur la formation décrit la vidéo à 360 degrés comme « en lecture seule ».

Qu’est-ce que la 3DoF et la 6DoF ? Les degrés de liberté décrivent comment vous pouvez bouger. La 3DoF (trois degrés de liberté) vous permet uniquement de faire pivoter votre tête - la norme pour la vidéo à 360 degrés. La 6DoF (six degrés de liberté) ajoute le mouvement de votre corps dans l’espace, de sorte que vous pouvez avancer, vous pencher et tendre la main. La VR interactive est en 6DoF.

Laquelle est la meilleure, la vidéo à 360 degrés ou la VR interactive ? Cela dépend de la tâche. La vidéo à 360 degrés est meilleure pour montrer des lieux réels à moindre coût, pour les expériences passives comme la distraction de la douleur, et pour une forte émotion dans l’instant. La VR interactive est meilleure pour tout ce qui exige d’agir, de prendre la parole à tour de rôle, d’individualiser la difficulté ou de bâtir une compétence transférable à la vie réelle.

La vidéo à 360 degrés est-elle adaptée à l’orthophonie ? Pour l’observation et la discussion, elle peut aider. Mais l’entraînement à la communication dépend du fait de répondre aux gens en temps réel et d’ajuster la difficulté à l’individu, ce que la vidéo à 360 degrés ne peut pas faire. Dans la recherche, la VR pour la parole et la communication s’est rassemblée de manière écrasante autour de la VR interactive plutôt que de la vidéo à 360 degrés.

Qu’est-ce que la VR cinématique (ciné-VR) ? La VR cinématique, ou ciné-VR, est un autre nom de la vidéo à 360 degrés narrative visionnée dans un casque - des images réelles avec un son spatialisé, structurées comme un film. Elle partage les forces et les limites de la vidéo à 360 degrés : un grand réalisme, mais pas d’interaction en temps réel.

Pour aller plus loin