Há duas tecnologias muito diferentes que são ambas chamadas «realidade virtual», e a diferença importa muito mais do que quase toda a gente diz em voz alta. Uma é o vídeo a 360 graus: imagens do mundo real, filmadas com uma câmara especial, que se veem através de um capacete e em cujo interior se pode olhar em redor. A outra é a RV interativa, gerada por computador: um mundo construído e reativo pelo qual se pode mover e no qual se pode agir, onde o ambiente reage àquilo que se faz.

Este artigo é um resumo objetivo do que a investigação publicada diz sobre as duas. Não é um artigo de opinião. Retirei-o do Evidence Hub deste site e da literatura mais ampla na educação, na medicina, na psicologia, na formação e na reabilitação. Onde a evidência é mista ou escassa, digo-o. Onde o vídeo a 360 graus claramente vence, digo isso também.

Eu construo RV interativa para a terapia da fala e da comunicação, por isso tenho um interesse em jogo. É precisamente por essa razão que tentei deixar que fossem as citações a sustentar o argumento, e não as minhas preferências. O padrão que emerge da literatura é consistente, e não é aquele que a maioria das pessoas presume.

Dois tipos de RV, e porque se confundem

A confusão é compreensível, porque ambos colocam um capacete no rosto e nos rodeiam de uma cena. Mas, por dentro, são opostos.

O vídeo a 360 graus (também chamado RV cinematográfica, cine-RV ou vídeo imersivo) é captado. Uma câmara a 360 graus filma um local real - uma sala de aula, um café, uma multidão - e as imagens são envolvidas à nossa volta no capacete. Pode-se virar a cabeça e olhar para qualquer lado, mas estamos a ver uma gravação. Não se pode caminhar até alguém, pegar em nada nem mudar o que acontece. A cena decorre da mesma forma todas as vezes. Na literatura da formação, isto é descrito, sem rodeios, como «só de leitura» (Kittel et al., 2020).

A RV interativa, gerada por computador é construída, não filmada. Cada objeto, personagem e som é criado num motor de jogo, que é o que torna o mundo reativo. O ambiente pode reagir-nos em tempo real, a dificuldade pode ser ajustada, as personagens podem responder, e podemos mover-nos pelo espaço. Este é o tipo de RV que Therapy withVR usa, e é o que a maioria das pessoas imagina quando pensa numa «experiência» de RV.

Uma nota rápida sobre os termos, porque o campo não é arrumado: muito do marketing chama «RV» ao vídeo a 360 graus, e alguns académicos questionam se este sequer se qualifica como tal, uma vez que a verdadeira RV implica habitualmente interação em tempo real e seguimento de movimento. Para este artigo, a distinção útil não é como lhes chamamos, mas sim o que cada um nos permite fazer.

3DoF vs 6DoF: toda a diferença numa só ideia

Se houver um único pedaço de jargão que valha a pena reter, que seja este, porque resume toda a divisão.

Essa diferença não é um problema de qualidade que câmaras melhores venham a resolver. É estrutural. Um filme pré-gravado é filmado a partir de um ponto fixo, por isso nunca pode dar-nos a liberdade de nos movermos e de agirmos. É por isto que a indústria da RV de consumo abandonou o 3DoF há anos: os primeiros capacetes 3DoF construídos em torno de conteúdos a 360 graus, como o Google Daydream e o Oculus Go, foram ambos descontinuados, e a plataforma padronizou-se no 6DoF.

A verdadeira linha de fratura: a ação, não o realismo

Eis a conclusão que atravessa todos os campos que analisei. Aquilo que separa as duas tecnologias, na investigação, é a capacidade de agir - poder agir e ser objeto de ação - e não o quão realista é a imagem.

O quadro mais claro vem do cientista de RV Mel Slater, que divide a sensação de «estar lá» em duas partes (Slater, 2009). A primeira é a ilusão de lugar: a sensação de estar num local. Tanto o vídeo a 360 graus como a RV interativa a podem produzir. A segunda é a ilusão de plausibilidade: a sensação de que aquilo que está a acontecer está realmente a acontecer connosco. Esta depende de o mundo nos responder, de se referir a nós, de se comportar como esperaríamos. Uma gravação não consegue fazer isso, porque não sabe que ali estamos.

A ciência da aprendizagem diz o mesmo por outras palavras. Um modelo bem conhecido de envolvimento, o ICAP, ordena os modos de aprendizagem pelo seu grau de atividade, com o visionamento passivo no fundo e o envolvimento interativo no topo (Chi e Wylie, 2014). Ver é o modo mais fraco; fazer e responder são os mais fortes.

E a literatura da terapia de exposição chega exatamente ao mesmo ponto. Uma revisão de âmbito sobre a RV para a ansiedade social - que, de forma notável, também analisa como adaptá-la à gaguez - di-lo de forma clara: com o vídeo a 360 graus, «os utilizadores estão limitados a uma navegação passiva pelo ambiente», ao passo que «controlar o ambiente com base no comportamento do utilizador é possível em ambientes gerados por computador, gerando uma maior capacidade de agir». A sua conclusão é que «os ambientes gerados por computador podem ser mais adequados para visar a interação social» (Chard e van Zalk, 2022).

É esse o cerne da questão. O vídeo a 360 graus faz de nós uma testemunha. A RV interativa faz de nós um participante.

A interatividade importa mesmo? O que a evidência mostra

Importa, e a forma mais útil de o ver é contraintuitiva: em toda a investigação, «interativo» vence «imersivo». O realismo e a presença não são o que gera os resultados mensuráveis. A interação é. Alguns dos resultados mais robustos:

Em conjunto, todos apontam no mesmo sentido: o ingrediente ativo da RV é a capacidade do utilizador para agir e para que lhe respondam. É precisamente o ingrediente a que o vídeo a 360 graus renuncia.

Onde o vídeo a 360 graus vence genuinamente

Isto não é um argumento contra o vídeo a 360 graus. Ele tem pontos fortes reais, sustentados em evidência, e ser honesto quanto a eles é o que torna o resto credível. Vence quando o objetivo é sentir ou observar em vez de fazer.

Se a sua tarefa é colocar alguém dentro de um local real e deixá-lo absorvê-lo, o vídeo a 360 graus é uma boa ferramenta. A questão é saber se a sua tarefa é a observação - ou a interação.

Um boletim de avaliação: qual vence, e para quê

Nenhuma tecnologia vence em tudo. A resposta honesta é que o vencedor depende da tarefa, o que é precisamente o ponto central. Eis como a evidência se alinha.

O que precisa que a RV façaQual vencePorquê
Deixar o utilizador agir, interagir e tomar a sua vezInterativaO vídeo a 360 graus é «só de leitura», limitado à navegação passiva
Personalizar e graduar a dificuldade à medida do indivíduoInterativaO vídeo a 360 graus é igual para todos; uma cena construída pode ser ajustada ao vivo
Construir uma competência que se transfere para a vida realInterativaOs ganhos de competência acompanham a interatividade, não a imersão
Mover-se pelo espaço e explorá-loInterativa6DoF vs 3DoF - o ponto de vista gravado é fixo
Produzir uma sensação de presençaFrequentemente a interativaA RV interativa igualou ou superou as imagens reais na presença
Mostrar locais e rostos reais fotorrealistasVídeo a 360 grausÉ captação genuína do mundo real
Produzir algo de forma rápida e barataVídeo a 360 grausFilmar vence construir um mundo 3D
Distrair da dor ou do mal-estar (passivo)Vídeo a 360 grausO conteúdo passivo é pelo menos tão eficaz na distração
Criar uma resposta emocional no momentoVídeo a 360 grausForte, mas habitualmente de curta duração
Promover uma mudança duradoura no comportamento ou na competênciaInterativaAgir e responder supera ver

A evidência

Estudos de RV imersiva na fala e comunicação, por método

RV interativa56
Vídeo a 360°4

Dos estudos de RV imersiva (com capacete) na fala e comunicação, 56 usaram RV interativa gerada por computador e apenas 4 usaram vídeo a 360 graus.

Os números que vale a pena reter

O que isto significa para a terapia da fala e da comunicação

A comunicação é interativa por definição. Uma conversa é uma série de respostas: alguém fala, nós reagimos, essa pessoa reage à nossa reação, e a dificuldade desloca-se em tempo real. Praticá-la de forma útil significa praticar esse ciclo - a um nível ajustado à pessoa, com uma cena que responde. São exatamente as coisas que uma gravação fixa não consegue fazer.

Por isso não é por acaso que a investigação sobre fala e comunicação se reuniu, de forma esmagadora, em torno da RV interativa. A divisão de 56 para 4 no Evidence Hub não é uma idiossincrasia de quais estudos calhou eu incluir; reflete onde o mecanismo de mudança realmente reside. A mão-cheia de estudos de vídeo a 360 graus no campo dá um quadro misto - um resultado positivo para a ansiedade de falar em público (Reeves 2021), um resultado nulo para a voz (Bostyn 2026), e um par de pequenos estudos de viabilidade (Chard 2023, deLeyer-Tiarks 2020) - que é mais ou menos o que se esperaria de um meio construído para a observação a ser aplicado a uma tarefa construída sobre a interação.

É por isto que Therapy withVR é interativo e não filmado. O argumento a seu favor não é «o interativo é sempre melhor». É mais restrito e, creio, mais sólido: a prática da comunicação precisa de que a cena responda à pessoa e de que seja ajustável a ela, e só a RV interativa consegue fazê-lo. Se quiser a versão mais longa deste raciocínio, está na página Porquê Therapy withVR.

Uma nota para investigadores

Há um ponto prático escondido em tudo isto, e quero formulá-lo com cuidado, como uma observação e não como um veredicto.

A limitação central do vídeo a 360 graus - sem interação, sem individualização, um ponto de vista fixo - é estrutural. Não pode ser contornada por engenharia dentro do próprio meio, e está documentada há anos. Quando o vídeo a 360 graus é aplicado a tarefas que dependem da interação, os estudos tendem a reencontrar o mesmo limite. Isto não é uma crítica a nenhum estudo em particular; é uma propriedade da ferramenta.

A leitura construtiva é sobre onde a energia da investigação rende mais. As questões que continuam genuinamente em aberto não são «será que um meio não interativo sustenta a prática interativa» - a literatura já aponta a resposta. São questões como: onde é que o vídeo a 360 graus se encaixa melhor, como é que os desenhos híbridos se comparam, e o que faz com que as competências aprendidas em RV se generalizem para a vida real. Essas valem o financiamento. Voltar a testar um limite estrutural já conhecido é um caso mais difícil de defender.

Para onde caminha a RV

A trajetória de todo o campo reforça o mesmo sentido. As tecnologias que atraem mais atenção agora são as que tornam interativo o conteúdo captado: o vídeo volumétrico, que permite andar à volta de uma pessoa real e filmada, e técnicas em tempo real como o 3D Gaussian splatting, que renderizam cenas captadas fotorrealistas pelas quais se pode mover a taxa de fotogramas plena (Kerbl et al., 2023). Para além disso, os motores de jogo estão a ganhar personagens guiadas por IA conversacional capazes de responder em tempo real.

O fio comum é que o campo está a convergir para «fotorrealista e interativo». A vantagem de realismo que outrora tornava o vídeo a 360 graus apelativo está a esbater-se, ao passo que a interatividade que lhe falta se está a tornar o padrão de base. Apostar na interação não é apenas defensável hoje; é para onde a tecnologia caminha.

Em resumo

Se quiser ver como decorre realmente uma sessão de RV interativa e controlada pelo clínico, entre em contacto.

Perguntas frequentes

O vídeo a 360 graus é o mesmo que realidade virtual? Não exatamente. O vídeo a 360 graus é uma gravação pré-gravada do mundo real em cujo interior se olha em redor dentro de um capacete. Por vezes é chamado RV cinematográfica, mas falta-lhe a interação e o movimento em tempo real que habitualmente definem a realidade virtual. Muitas pessoas e produtos usam «RV» de forma vaga para abranger ambos, mas os dois são tecnicamente diferentes.

Qual é a diferença entre o vídeo a 360 graus e a RV interativa? O vídeo a 360 graus é captado com uma câmara e é fixo: pode-se olhar em redor, mas não se pode entrar na cena, interagir com objetos nem mudar o que acontece. A RV interativa é construída num motor de jogo e é reativa: o mundo reage-nos, a dificuldade pode ser ajustada, e podemos mover-nos pelo espaço e agir sobre ele.

Pode-se interagir com o vídeo a 360 graus? Apenas de formas muito limitadas. Pode-se olhar em qualquer direção, e algumas versões acrescentam pontos clicáveis, mas não se pode andar à volta, pegar nas coisas nem fazer com que as personagens nos respondam em tempo real. É por isso que a literatura da formação descreve o vídeo a 360 graus como «só de leitura».

O que é 3DoF vs 6DoF? Os graus de liberdade descrevem como nos podemos mover. O 3DoF (três graus de liberdade) deixa-nos apenas rodar a cabeça - o padrão para o vídeo a 360 graus. O 6DoF (seis graus de liberdade) acrescenta o movimento do corpo pelo espaço, por isso pode-se dar passos, inclinar-se e estender a mão. A RV interativa é 6DoF.

Qual é melhor, o vídeo a 360 graus ou a RV interativa? Depende da tarefa. O vídeo a 360 graus é melhor para mostrar locais reais de forma barata, para experiências passivas como a distração da dor e para uma forte emoção no momento. A RV interativa é melhor para tudo o que exige agir, tomar a sua vez, individualizar a dificuldade ou construir uma competência que se transfere para a vida real.

O vídeo a 360 graus é bom para a terapia da fala? Para observação e discussão, pode ajudar. Mas a prática da comunicação depende de responder às pessoas em tempo real e de ajustar a dificuldade ao indivíduo, coisas que o vídeo a 360 graus não consegue fazer. Na investigação, a RV para a fala e a comunicação reuniu-se de forma esmagadora em torno da RV interativa e não do vídeo a 360 graus.

O que é a RV cinematográfica (cine-RV)? A RV cinematográfica, ou cine-RV, é outro nome para o vídeo a 360 graus narrativo visto num capacete - imagens reais com áudio espacial, estruturadas como um filme. Partilha os pontos fortes e os limites do vídeo a 360 graus: realismo elevado, mas sem interação em tempo real.

Leitura adicional