Há duas tecnologias muito diferentes que são ambas chamadas «realidade virtual», e a diferença importa muito mais do que quase toda a gente diz em voz alta. Uma é o vídeo a 360 graus: imagens do mundo real, filmadas com uma câmara especial, que se veem através de um capacete e em cujo interior se pode olhar em redor. A outra é a RV interativa, gerada por computador: um mundo construído e reativo pelo qual se pode mover e no qual se pode agir, onde o ambiente reage àquilo que se faz.
Este artigo é um resumo objetivo do que a investigação publicada diz sobre as duas. Não é um artigo de opinião. Retirei-o do Evidence Hub deste site e da literatura mais ampla na educação, na medicina, na psicologia, na formação e na reabilitação. Onde a evidência é mista ou escassa, digo-o. Onde o vídeo a 360 graus claramente vence, digo isso também.
Eu construo RV interativa para a terapia da fala e da comunicação, por isso tenho um interesse em jogo. É precisamente por essa razão que tentei deixar que fossem as citações a sustentar o argumento, e não as minhas preferências. O padrão que emerge da literatura é consistente, e não é aquele que a maioria das pessoas presume.
Dois tipos de RV, e porque se confundem
A confusão é compreensível, porque ambos colocam um capacete no rosto e nos rodeiam de uma cena. Mas, por dentro, são opostos.
O vídeo a 360 graus (também chamado RV cinematográfica, cine-RV ou vídeo imersivo) é captado. Uma câmara a 360 graus filma um local real - uma sala de aula, um café, uma multidão - e as imagens são envolvidas à nossa volta no capacete. Pode-se virar a cabeça e olhar para qualquer lado, mas estamos a ver uma gravação. Não se pode caminhar até alguém, pegar em nada nem mudar o que acontece. A cena decorre da mesma forma todas as vezes. Na literatura da formação, isto é descrito, sem rodeios, como «só de leitura» (Kittel et al., 2020).
A RV interativa, gerada por computador é construída, não filmada. Cada objeto, personagem e som é criado num motor de jogo, que é o que torna o mundo reativo. O ambiente pode reagir-nos em tempo real, a dificuldade pode ser ajustada, as personagens podem responder, e podemos mover-nos pelo espaço. Este é o tipo de RV que Therapy withVR usa, e é o que a maioria das pessoas imagina quando pensa numa «experiência» de RV.
Uma nota rápida sobre os termos, porque o campo não é arrumado: muito do marketing chama «RV» ao vídeo a 360 graus, e alguns académicos questionam se este sequer se qualifica como tal, uma vez que a verdadeira RV implica habitualmente interação em tempo real e seguimento de movimento. Para este artigo, a distinção útil não é como lhes chamamos, mas sim o que cada um nos permite fazer.
3DoF vs 6DoF: toda a diferença numa só ideia
Se houver um único pedaço de jargão que valha a pena reter, que seja este, porque resume toda a divisão.
- 3DoF (três graus de liberdade) significa que se pode rodar a cabeça - olhar para cima e para baixo, para a esquerda e para a direita, e inclinar. É só isso. O vídeo a 360 graus é um meio 3DoF. Pode-se olhar, mas não se pode mover o corpo para dentro da cena nem inclinar-se para ver para lá de algo.
- 6DoF (seis graus de liberdade) acrescenta os três movimentos do corpo pelo espaço - para a frente e para trás, de um lado para o outro, para cima e para baixo. A RV interativa é um meio 6DoF. Pode-se dar um passo em direção a uma pessoa, agachar-se, andar à volta de um objeto e estender a mão para tocar nas coisas.
Essa diferença não é um problema de qualidade que câmaras melhores venham a resolver. É estrutural. Um filme pré-gravado é filmado a partir de um ponto fixo, por isso nunca pode dar-nos a liberdade de nos movermos e de agirmos. É por isto que a indústria da RV de consumo abandonou o 3DoF há anos: os primeiros capacetes 3DoF construídos em torno de conteúdos a 360 graus, como o Google Daydream e o Oculus Go, foram ambos descontinuados, e a plataforma padronizou-se no 6DoF.
A verdadeira linha de fratura: a ação, não o realismo
Eis a conclusão que atravessa todos os campos que analisei. Aquilo que separa as duas tecnologias, na investigação, é a capacidade de agir - poder agir e ser objeto de ação - e não o quão realista é a imagem.
O quadro mais claro vem do cientista de RV Mel Slater, que divide a sensação de «estar lá» em duas partes (Slater, 2009). A primeira é a ilusão de lugar: a sensação de estar num local. Tanto o vídeo a 360 graus como a RV interativa a podem produzir. A segunda é a ilusão de plausibilidade: a sensação de que aquilo que está a acontecer está realmente a acontecer connosco. Esta depende de o mundo nos responder, de se referir a nós, de se comportar como esperaríamos. Uma gravação não consegue fazer isso, porque não sabe que ali estamos.
A ciência da aprendizagem diz o mesmo por outras palavras. Um modelo bem conhecido de envolvimento, o ICAP, ordena os modos de aprendizagem pelo seu grau de atividade, com o visionamento passivo no fundo e o envolvimento interativo no topo (Chi e Wylie, 2014). Ver é o modo mais fraco; fazer e responder são os mais fortes.
E a literatura da terapia de exposição chega exatamente ao mesmo ponto. Uma revisão de âmbito sobre a RV para a ansiedade social - que, de forma notável, também analisa como adaptá-la à gaguez - di-lo de forma clara: com o vídeo a 360 graus, «os utilizadores estão limitados a uma navegação passiva pelo ambiente», ao passo que «controlar o ambiente com base no comportamento do utilizador é possível em ambientes gerados por computador, gerando uma maior capacidade de agir». A sua conclusão é que «os ambientes gerados por computador podem ser mais adequados para visar a interação social» (Chard e van Zalk, 2022).
É esse o cerne da questão. O vídeo a 360 graus faz de nós uma testemunha. A RV interativa faz de nós um participante.
A interatividade importa mesmo? O que a evidência mostra
Importa, e a forma mais útil de o ver é contraintuitiva: em toda a investigação, «interativo» vence «imersivo». O realismo e a presença não são o que gera os resultados mensuráveis. A interação é. Alguns dos resultados mais robustos:
- A imersão por si só é apenas um efeito pequeno. Uma meta-análise da RV imersiva na educação encontrou um benefício global de aprendizagem de g = 0,38 - real, mas modesto - e altamente dependente da disciplina e do desenho do estudo (Coban et al., 2022). O capacete não é a alavanca.
- Mais imersão pode significar menos aprendizagem. Num estudo controlado, acrescentar um ecrã montado na cabeça a uma simulação de ciências produziu mais presença, mas menos aprendizagem e maior carga mental do que uma versão de secretária. O título diz tudo: «mais presença, mas menos aprendizagem» (Makransky et al., 2019).
- Os ganhos de competência acompanham a interatividade, não o capacete. Uma grande meta-análise da RV na formação de profissionais de saúde concluiu que a RV de maior interatividade era mais eficaz para o conhecimento e as competências, com os ganhos de competência a atingir um tamanho de efeito grande face ao ensino tradicional (Kyaw et al., 2019).
- Acrescentar interação tem um retorno funcional. Num ensaio multicêntrico com adultos mais velhos, acrescentar uma camada interativa e reativa ao treino em passadeira reduziu as quedas em cerca de 42 por cento em comparação com o mesmo treino em passadeira isolado (Mirelman et al., 2016).
- Mesmo para conteúdos «reais», o interativo pode vencer o filmado. Quando os investigadores compararam formas de entregar natureza virtual, a RV interativa gerada por computador produziu uma presença significativamente maior e um melhor estado de humor do que o vídeo a 360 graus de natureza real (Yeo et al., 2020). A cena construída e reativa superou as imagens reais.
Em conjunto, todos apontam no mesmo sentido: o ingrediente ativo da RV é a capacidade do utilizador para agir e para que lhe respondam. É precisamente o ingrediente a que o vídeo a 360 graus renuncia.
Onde o vídeo a 360 graus vence genuinamente
Isto não é um argumento contra o vídeo a 360 graus. Ele tem pontos fortes reais, sustentados em evidência, e ser honesto quanto a eles é o que torna o resto credível. Vence quando o objetivo é sentir ou observar em vez de fazer.
- Fotorrealismo de locais e rostos reais. É captação genuína do mundo real, por isso ninguém tem de modelar uma multidão ou um rosto. Para «como é que este local concreto se parece», nada o supera.
- Custo e rapidez. Filmar uma cena a 360 graus é muito mais barato e rápido do que construir um ambiente 3D interativo. A contrapartida é que, uma vez filmada, a cena fica fixa - não se pode mudá-la sem voltar a filmar.
- Experiências passivas como a distração da dor. Esta é a única área em que a passividade vence de facto. Uma grande meta-análise da RV para a dor (122 ensaios aleatorizados, mais de 9000 doentes) concluiu que o conteúdo passivo era pelo menos tão eficaz como o conteúdo interativo no alívio da dor baseado em distração (Lier et al., 2023).
- Impacto emocional e a sensação de «estar lá». O vídeo a 360 graus pode produzir uma forte resposta emocional no momento, razão pela qual se tornou popular em projetos de empatia e de jornalismo. A ressalva que vem da investigação é que o efeito tende a ser de curta duração e não se traduz de forma fiável numa mudança de comportamento (Martingano et al., 2022).
- Observação e tomada de consciência. Para ver um cenário desenrolar-se, reparar no que está a acontecer e discuti-lo depois, um ponto de vista fixo serve bem e é muitas vezes ideal.
Se a sua tarefa é colocar alguém dentro de um local real e deixá-lo absorvê-lo, o vídeo a 360 graus é uma boa ferramenta. A questão é saber se a sua tarefa é a observação - ou a interação.
Um boletim de avaliação: qual vence, e para quê
Nenhuma tecnologia vence em tudo. A resposta honesta é que o vencedor depende da tarefa, o que é precisamente o ponto central. Eis como a evidência se alinha.
| O que precisa que a RV faça | Qual vence | Porquê |
|---|---|---|
| Deixar o utilizador agir, interagir e tomar a sua vez | Interativa | O vídeo a 360 graus é «só de leitura», limitado à navegação passiva |
| Personalizar e graduar a dificuldade à medida do indivíduo | Interativa | O vídeo a 360 graus é igual para todos; uma cena construída pode ser ajustada ao vivo |
| Construir uma competência que se transfere para a vida real | Interativa | Os ganhos de competência acompanham a interatividade, não a imersão |
| Mover-se pelo espaço e explorá-lo | Interativa | 6DoF vs 3DoF - o ponto de vista gravado é fixo |
| Produzir uma sensação de presença | Frequentemente a interativa | A RV interativa igualou ou superou as imagens reais na presença |
| Mostrar locais e rostos reais fotorrealistas | Vídeo a 360 graus | É captação genuína do mundo real |
| Produzir algo de forma rápida e barata | Vídeo a 360 graus | Filmar vence construir um mundo 3D |
| Distrair da dor ou do mal-estar (passivo) | Vídeo a 360 graus | O conteúdo passivo é pelo menos tão eficaz na distração |
| Criar uma resposta emocional no momento | Vídeo a 360 graus | Forte, mas habitualmente de curta duração |
| Promover uma mudança duradoura no comportamento ou na competência | Interativa | Agir e responder supera ver |
A evidência
Estudos de RV imersiva na fala e comunicação, por método
Dos estudos de RV imersiva (com capacete) na fala e comunicação, 56 usaram RV interativa gerada por computador e apenas 4 usaram vídeo a 360 graus.
Os números que vale a pena reter
- 56 para 4. No Evidence Hub deste site, dos estudos de RV com capacete imersivo na fala e na comunicação, 56 usaram RV interativa e 4 usaram vídeo a 360 graus.
- g = 0,38. A imersão por si só é apenas um efeito pequeno de aprendizagem. A interatividade é a alavanca.
- 3 vs 6. Graus de liberdade. O vídeo a 360 graus não consegue sair do 3DoF.
- Cerca de 42 por cento. A redução de quedas quando se acrescentou uma camada interativa a um treino idêntico.
- 122 ensaios, mais de 9000 doentes. A dimensão do único domínio claro em que o conteúdo passivo a 360 graus se aguenta: a distração da dor.
- 2018 e antes. O vídeo a 360 graus já era rotulado de «só de leitura» na literatura da formação. A limitação não é nova.
O que isto significa para a terapia da fala e da comunicação
A comunicação é interativa por definição. Uma conversa é uma série de respostas: alguém fala, nós reagimos, essa pessoa reage à nossa reação, e a dificuldade desloca-se em tempo real. Praticá-la de forma útil significa praticar esse ciclo - a um nível ajustado à pessoa, com uma cena que responde. São exatamente as coisas que uma gravação fixa não consegue fazer.
Por isso não é por acaso que a investigação sobre fala e comunicação se reuniu, de forma esmagadora, em torno da RV interativa. A divisão de 56 para 4 no Evidence Hub não é uma idiossincrasia de quais estudos calhou eu incluir; reflete onde o mecanismo de mudança realmente reside. A mão-cheia de estudos de vídeo a 360 graus no campo dá um quadro misto - um resultado positivo para a ansiedade de falar em público (Reeves 2021), um resultado nulo para a voz (Bostyn 2026), e um par de pequenos estudos de viabilidade (Chard 2023, deLeyer-Tiarks 2020) - que é mais ou menos o que se esperaria de um meio construído para a observação a ser aplicado a uma tarefa construída sobre a interação.
É por isto que Therapy withVR é interativo e não filmado. O argumento a seu favor não é «o interativo é sempre melhor». É mais restrito e, creio, mais sólido: a prática da comunicação precisa de que a cena responda à pessoa e de que seja ajustável a ela, e só a RV interativa consegue fazê-lo. Se quiser a versão mais longa deste raciocínio, está na página Porquê Therapy withVR.
Uma nota para investigadores
Há um ponto prático escondido em tudo isto, e quero formulá-lo com cuidado, como uma observação e não como um veredicto.
A limitação central do vídeo a 360 graus - sem interação, sem individualização, um ponto de vista fixo - é estrutural. Não pode ser contornada por engenharia dentro do próprio meio, e está documentada há anos. Quando o vídeo a 360 graus é aplicado a tarefas que dependem da interação, os estudos tendem a reencontrar o mesmo limite. Isto não é uma crítica a nenhum estudo em particular; é uma propriedade da ferramenta.
A leitura construtiva é sobre onde a energia da investigação rende mais. As questões que continuam genuinamente em aberto não são «será que um meio não interativo sustenta a prática interativa» - a literatura já aponta a resposta. São questões como: onde é que o vídeo a 360 graus se encaixa melhor, como é que os desenhos híbridos se comparam, e o que faz com que as competências aprendidas em RV se generalizem para a vida real. Essas valem o financiamento. Voltar a testar um limite estrutural já conhecido é um caso mais difícil de defender.
Para onde caminha a RV
A trajetória de todo o campo reforça o mesmo sentido. As tecnologias que atraem mais atenção agora são as que tornam interativo o conteúdo captado: o vídeo volumétrico, que permite andar à volta de uma pessoa real e filmada, e técnicas em tempo real como o 3D Gaussian splatting, que renderizam cenas captadas fotorrealistas pelas quais se pode mover a taxa de fotogramas plena (Kerbl et al., 2023). Para além disso, os motores de jogo estão a ganhar personagens guiadas por IA conversacional capazes de responder em tempo real.
O fio comum é que o campo está a convergir para «fotorrealista e interativo». A vantagem de realismo que outrora tornava o vídeo a 360 graus apelativo está a esbater-se, ao passo que a interatividade que lhe falta se está a tornar o padrão de base. Apostar na interação não é apenas defensável hoje; é para onde a tecnologia caminha.
Em resumo
- Há duas coisas diferentes chamadas RV. O vídeo a 360 graus é uma gravação em cujo interior se olha em redor. A RV interativa é um mundo reativo dentro do qual se age.
- A investigação divide-as pela capacidade de agir, não pelo realismo. Em todos os campos, é a interatividade que gera o benefício mensurável - «interativo» vence «imersivo».
- O vídeo a 360 graus tem pontos fortes reais: fotorrealismo, baixo custo, usos passivos como a distração da dor e uma forte emoção no momento. Use-o para observar e para sentir.
- A RV interativa vence onde é preciso agir, tomar a sua vez, individualizar, construir competências transferíveis e mover-se pelo espaço.
- A comunicação é interação, por isso a prática da fala e da comunicação encaixa na RV interativa. A base de evidência, o mecanismo e o rumo da tecnologia concordam todos.
Se quiser ver como decorre realmente uma sessão de RV interativa e controlada pelo clínico, entre em contacto.
Perguntas frequentes
O vídeo a 360 graus é o mesmo que realidade virtual? Não exatamente. O vídeo a 360 graus é uma gravação pré-gravada do mundo real em cujo interior se olha em redor dentro de um capacete. Por vezes é chamado RV cinematográfica, mas falta-lhe a interação e o movimento em tempo real que habitualmente definem a realidade virtual. Muitas pessoas e produtos usam «RV» de forma vaga para abranger ambos, mas os dois são tecnicamente diferentes.
Qual é a diferença entre o vídeo a 360 graus e a RV interativa? O vídeo a 360 graus é captado com uma câmara e é fixo: pode-se olhar em redor, mas não se pode entrar na cena, interagir com objetos nem mudar o que acontece. A RV interativa é construída num motor de jogo e é reativa: o mundo reage-nos, a dificuldade pode ser ajustada, e podemos mover-nos pelo espaço e agir sobre ele.
Pode-se interagir com o vídeo a 360 graus? Apenas de formas muito limitadas. Pode-se olhar em qualquer direção, e algumas versões acrescentam pontos clicáveis, mas não se pode andar à volta, pegar nas coisas nem fazer com que as personagens nos respondam em tempo real. É por isso que a literatura da formação descreve o vídeo a 360 graus como «só de leitura».
O que é 3DoF vs 6DoF? Os graus de liberdade descrevem como nos podemos mover. O 3DoF (três graus de liberdade) deixa-nos apenas rodar a cabeça - o padrão para o vídeo a 360 graus. O 6DoF (seis graus de liberdade) acrescenta o movimento do corpo pelo espaço, por isso pode-se dar passos, inclinar-se e estender a mão. A RV interativa é 6DoF.
Qual é melhor, o vídeo a 360 graus ou a RV interativa? Depende da tarefa. O vídeo a 360 graus é melhor para mostrar locais reais de forma barata, para experiências passivas como a distração da dor e para uma forte emoção no momento. A RV interativa é melhor para tudo o que exige agir, tomar a sua vez, individualizar a dificuldade ou construir uma competência que se transfere para a vida real.
O vídeo a 360 graus é bom para a terapia da fala? Para observação e discussão, pode ajudar. Mas a prática da comunicação depende de responder às pessoas em tempo real e de ajustar a dificuldade ao indivíduo, coisas que o vídeo a 360 graus não consegue fazer. Na investigação, a RV para a fala e a comunicação reuniu-se de forma esmagadora em torno da RV interativa e não do vídeo a 360 graus.
O que é a RV cinematográfica (cine-RV)? A RV cinematográfica, ou cine-RV, é outro nome para o vídeo a 360 graus narrativo visto num capacete - imagens reais com áudio espacial, estruturadas como um filme. Partilha os pontos fortes e os limites do vídeo a 360 graus: realismo elevado, mas sem interação em tempo real.
Leitura adicional
- Evidence Hub - A biblioteca completa de estudos de RV em fala e comunicação por detrás das contagens deste artigo
- Validade ecológica da terapia da fala em RV - Porque é que uma cena de prática precisa de se comportar como o mundo real
- Cibercinético em RV clínica: o que planear - A outra grande questão prática sobre a RV na clínica
- Porque existe Therapy withVR - As escolhas de design por detrás de uma plataforma interativa e controlada pelo clínico
- Porquê Therapy withVR - Como a plataforma põe em prática os princípios deste artigo
