Todos os profissionais da fala e da linguagem já enfrentaram a mesma frustração. Passa uma sessão a trabalhar com uma pessoa, corre bem na sala de terapia, e depois o mundo real parece completamente diferente. O café é demasiado barulhento. A sala de aula é demasiado imprevisível. A sala de reuniões tem demasiada coisa em jogo. A encenação ajuda, mas tanto o clínico como a pessoa sabem que não é real. O fosso entre a clínica e a vida quotidiana (a razão pela qual Therapy withVR existe) sempre foi um dos problemas mais difíceis na terapia da fala.
A realidade virtual está a fechar esse fosso. E a investigação está a começar a mostrar com que eficácia.
A evidência está a crescer
A evidência sobre RV em contextos de fala e comunicação estende-se por duas décadas. Mais recentemente, três artigos revistos por pares foram publicados usando a plataforma withVR, cada um a examinar um aspeto diferente de como as pessoas falam e usam a voz em ambientes virtuais.
Algumas das evidências fundacionais mais fortes vêm de Brundage e colegas na George Washington University. Num estudo de 2015 publicado no American Journal of Speech-Language Pathology, a medida primária da fala durante uma fala perante público virtual desafiante correlacionou-se a r = 0,99 com a mesma medida durante uma fala perante público ao vivo (Brundage & Hancock, 2015). Essa correlação quase perfeita demonstra que situações de fala virtuais bem desenhadas podem suscitar comportamento de fala essencialmente equivalente ao da vida real.
Brundage & Hancock 2015 · 10 adultos que gaguejam
Comportamento de fala em públicos virtuais vs. ao vivo
Correlação
r = 0,99
Concordância quase perfeita entre condições ao vivo e virtuais emparelhadas, dentro dos mesmos participantes individuais.
Fonte: Brundage SB & Hancock AB (2015). Real Enough: Using Virtual Public Speaking Environments to Evoke Feelings and Behaviors Targeted in Stuttering Assessment and Treatment. American Journal of Speech-Language Pathology, 24(2), 139-149. DOI: 10.1044/2014_AJSLP-14-0087.
Sobre esta base de evidência mais ampla, Bauerly e Jackson publicaram um estudo de 2024 no Journal of Speech, Language, and Hearing Research usando Research withVR para examinar como o foco atencional afeta a variabilidade articulatória em adultos que gaguejam e em adultos que não gaguejam. Os achados mostraram que o ambiente virtual criou com sucesso as condições controladas necessárias para detetar diferenças significativas na produção da fala.
Em 2025, Leyns e colegas publicaram «Virtual Reality as a Tool in Gender-Affirming Voice Training» no Journal of Voice. Este estudo explorou se a RV poderia servir como um ambiente de prática significativo para pessoas a trabalhar em objetivos de voz, uma área em que espaços de prática seguros e realistas são difíceis de encontrar fora da clínica.
Mais recentemente, Dasdogen e Hitchcock publicaram «The Effects of Visual Input in Virtual Reality on Voice Production: Comparing Trained Singers and Untrained Speakers» no Journal of Voice em 2026, investigando como o realismo visual de um ambiente virtual influencia o comportamento vocal. Em conjunto, estes estudos apontam para a mesma conclusão: quando as pessoas entram numa situação de fala virtual bem desenhada, os seus corpos respondem como se fosse real.
Para além destes artigos publicados, 19 projetos de investigação ativos estavam a decorrer em 2025 em universidades e clínicas em todo o mundo. A base de evidência está a crescer rapidamente.
Porque é que a RV funciona onde a encenação fica aquém
A ideia de usar RV em terapia da fala não é nova. Os primeiros estudos exploraram ambientes virtuais para a terapia de exposição, baseando-se no princípio de que, se uma situação parecer suficientemente real, o sistema nervoso responde em conformidade. O que mudou foi a tecnologia e, criticamente, o nível de controlo que oferece aos clínicos.
A intuição central é simples. Na prática clínica, há duas opções para praticar situações de fala fora da sala de terapia. A encenação não parece suficientemente real: tanto o clínico como a pessoa sabem que é faz-de-conta, e essa consciência limita a resposta emocional e fisiológica. O mundo real, por outro lado, parece totalmente real, mas oferece quase nenhum controlo. Não se pode pausar uma sala de aula. Não se pode ajustar o número de pessoas num café. Não se pode reproduzir uma entrevista de emprego.
A RV situa-se diretamente entre estes dois extremos. É realista o suficiente para desencadear respostas genuínas, mas controlada o suficiente para ser terapêutica. Esse terreno intermédio é onde acontece o trabalho mais produtivo.
O que faz com que um ambiente virtual pareça real
O realismo em RV não tem que ver apenas com gráficos de alta resolução. Tem que ver com os detalhes que o cérebro usa para avaliar se uma situação social é real, e esses detalhes são esmagadoramente sobre as pessoas.
Therapy withVR inclui mais de 12 ambientes de fala (um café, uma sala de aula, uma padaria, uma sala de reuniões, um auditório e mais), cada um desenhado em torno do tipo de situações que as pessoas tipicamente encontram e consideram desafiantes. Mas os ambientes são apenas parte da equação. As pessoas virtuais nesses ambientes importam tanto, ou mais.
Os avatares são desenhados para se comportarem como pessoas reais se comportam em conversa. Mostram um leque de emoções (interesse, encorajamento, impaciência, distração) através de expressões faciais subtis e movimento natural da boca durante a fala. Não são figuras estáticas paradas numa sala. Mexem-se nos lugares. Olham para nós quando falamos. Olham para o lado quando perdem o interesse. Esse ciclo de retorno social, a sensação de que alguém está, de facto, a ouvir ou a não ouvir, é o que torna uma situação de fala real.
O terapeuta mantém o controlo
Um dos aspetos mais importantes de Therapy withVR, e um que o distingue das aplicações de RV de consumo, é que o terapeuta controla tudo em tempo real a partir de um portátil. Enquanto a pessoa está imersa no ambiente virtual a usar um capacete, o clínico está a escolher a cena, a ajustar o tamanho do público, a alterar as emoções dos avatares e a responder ao que está a acontecer na sessão momento a momento.
Isto significa que o terapeuta pode aumentar a dificuldade gradualmente. Começar com um único ouvinte numa sala silenciosa. Adicionar mais pessoas. Introduzir ruído de fundo. Fazer com que um avatar pareça cético. Cada ajuste pode ser feito sem quebrar a imersão, e cada um dá ao clínico controlo preciso sobre o desafio terapêutico.
Esse controlo em tempo real também significa que o terapeuta pode descalar. Se uma pessoa fica sobrecarregada, o clínico pode simplificar a cena instantaneamente: menos pessoas, expressões mais amigáveis, um cenário mais calmo. Este tipo de exposição responsiva e graduada é difícil de alcançar na prática no mundo real e impossível na encenação tradicional.
O que isto significa para a prática clínica
Os achados de investigação importam porque validam o que muitos clínicos já suspeitam quando veem as pessoas a responder à RV: estes ambientes produzem comportamento comunicativo real, não comportamento simulado. Quando o comportamento de fala em RV se correlaciona a r = 0,99 com a fala perante público ao vivo, quando a produção vocal muda com base no público virtual, e quando as pessoas reportam ansiedade genuína e confiança genuína em situações de fala virtuais, os clínicos podem confiar que o trabalho feito em RV se transfere.
O teste mais direto desta reivindicação de transferência até à data vem de um ensaio clínico aleatorizado de 2026. McCleery e colegas, a publicar no Journal of Autism and Developmental Disorders, aleatorizaram 47 adolescentes e adultos autistas para três sessões curtas de prática em RV de interações com a polícia ou para uma intervenção de modelagem em vídeo de dose equivalente. O pós-teste foi uma interação ao vivo com um agente da polícia uniformizado real, pontuada por avaliadores cegos. O grupo de RV deu respostas significativamente mais adequadas e mostrou linguagem corporal mais calma durante o encontro ao vivo; o controlo de modelagem em vídeo não. Esta é uma das demonstrações mais limpas até à data de que a prática baseada em RV se generaliza a interações sociais reais com estranhos - precisamente o fosso entre a clínica e a vida que a RV se propõe fechar.
A RV não vai substituir a prática no mundo real. O objetivo nunca foi manter as pessoas num capacete permanentemente. O objetivo é fazer a ponte entre a sala de terapia e o mundo lá fora, dar aos clínicos uma ferramenta que lhes permita criar situações de fala realistas, repetíveis e ajustáveis a pedido.
A investigação sugere que essa ponte é sólida. E à medida que a base de evidência continua a crescer, o caso a favor da RV como parte regular do kit de terapia da fala só fica mais forte.
Uma nota sobre privacidade: nenhum áudio ou vídeo é alguma vez gravado durante uma sessão, e nenhum dado identificável do cliente precisa de entrar no sistema. Se está a avaliar qualquer nova tecnologia para a sua prática, preparei uma checklist gratuita que cobre privacidade de dados, consentimento informado e mais.
Leitura adicional
- Validade ecológica na terapia da fala em RV: o que diz a evidência - O quadro completo da investigação de validação resumida acima
- Como ler um estudo de terapia da fala em RV - Para avaliar criticamente estudos de RV antes de os trazer para a prática
- Brundage e Hancock (2015) - O estudo fundacional de validade ecológica citado acima
- McCleery et al. (2026) - O teste direto mais recente da transferência para o mundo real (autismo + encontros ao vivo com a polícia)
- Evidence Hub - Todos os estudos revistos por pares sobre RV em terapia da fala, com resumos em linguagem clara
- Documentação de Therapy withVR - As funcionalidades que tornam este tipo de prática possível
Se está a explorar como a RV pode encaixar na sua prática, entre em contacto. Terei todo o gosto em mostrar-lhe o software e conversar sobre se pode funcionar no seu contexto.