Todos os profissionais de fala e linguagem já enfrentaram a mesma frustração. Passa-se uma sessão a trabalhar com uma pessoa, corre bem na sala de terapia e, depois, o mundo real parece completamente diferente. O café é demasiado barulhento. A sala de aula é demasiado imprevisível. A sala de reuniões envolve demasiado em jogo. O role-play ajuda, mas tanto o profissional como a pessoa sabem que não é real. A distância entre a clínica e o dia a dia (a razão pela qual a Therapy withVR existe) foi sempre um dos problemas mais difíceis da terapia da fala.

A realidade virtual está a encurtar essa distância. E a investigação está a começar a mostrar com que eficácia o faz.

As evidências estão a crescer

As evidências sobre a RV em contextos de fala e comunicação remontam a duas décadas. Mais recentemente, foram publicados três artigos com revisão por pares utilizando a plataforma withVR, cada um a analisar um aspeto diferente da forma como as pessoas falam e usam a voz em ambientes virtuais.

Algumas das evidências fundadoras mais sólidas vêm de Brundage e colegas, na George Washington University. Num estudo de 2015 publicado no American Journal of Speech-Language Pathology, a principal medida de fala durante um discurso perante uma audiência virtual exigente correlacionou-se a rho = 0,99 com a mesma medida durante um discurso perante uma audiência ao vivo (Brundage & Hancock, 2015). Essa correlação quase perfeita demonstra que situações de fala virtuais bem concebidas conseguem evocar um comportamento de fala essencialmente equivalente ao da vida real.

Brundage & Hancock 2015 · 10 adultos que gaguejam

Frequência de gaguez perante audiência virtual exigente vs. ao vivo

referência y = x 0 2 4 6 8 % de sílabas gaguejadas · audiência virtual exigente 0 2 4 6 8 % de sílabas gaguejadas · audiência ao vivo RHO DE SPEARMAN 0,99 p < ,001 · n = 10

Cada ponto representa um dos dez adultos que gaguejam do estudo de Brundage & Hancock 2015. A linha tracejada é a referência y = x (concordância perfeita). A condição de audiência virtual neutra (não apresentada) também se correlacionou de forma significativa com a condição ao vivo, embora de modo menos forte, a ρ = 0,82.

Fonte: Brundage SB & Hancock AB (2015). Real Enough: Using Virtual Public Speaking Environments to Evoke Feelings and Behaviors Targeted in Stuttering Assessment and Treatment. American Journal of Speech-Language Pathology, 24(2), 139-149. DOI: 10.1044/2014_AJSLP-14-0087. Pontos de dados reconstruídos a partir da Figura 4b publicada para ilustrar o padrão de correlação.

A partir desta base de evidências mais ampla, Bauerly e Jackson publicaram um estudo de 2024 no Journal of Speech, Language, and Hearing Research utilizando a Research withVR para examinar de que forma o foco atencional afeta a variabilidade articulatória em adultos que gaguejam e que não gaguejam. Os resultados mostraram que o ambiente virtual criou com sucesso as condições controladas necessárias para detetar diferenças relevantes na produção da fala.

Em 2025, Leyns e colegas publicaram “Virtual Reality as a Tool in Gender-Affirming Voice Training” no Journal of Voice. Este estudo explorou se a RV poderia servir como um ambiente de prática significativo para pessoas que trabalham objetivos de voz, uma área em que espaços de prática seguros e realistas são difíceis de encontrar fora da clínica.

Mais recentemente, Dasdogen e Hitchcock publicaram “The Effects of Visual Input in Virtual Reality on Voice Production: Comparing Trained Singers and Untrained Speakers” no Journal of Voice, em 2026, investigando de que forma o realismo visual de um ambiente virtual influencia o comportamento vocal. Em conjunto, estes estudos apontam para a mesma conclusão: quando as pessoas entram numa situação de fala virtual bem concebida, o seu corpo responde como se fosse real.

Para além destes artigos publicados, em 2025 estavam em curso 19 projetos de investigação ativos em universidades e clínicas de todo o mundo. A base de evidências está a crescer rapidamente.

Por que razão a RV funciona onde o role-play fica aquém

A ideia de usar RV na terapia da fala não é nova. Estudos pioneiros exploraram ambientes virtuais para a terapia de exposição, partindo do princípio de que, se uma situação parecer suficientemente real, o sistema nervoso responde em conformidade. O que mudou foi a tecnologia e, sobretudo, o nível de controlo que oferece aos profissionais.

A ideia central é simples. Na prática clínica, existem duas opções para praticar situações de fala fora da sala de terapia. O role-play não parece suficientemente real: tanto o profissional como a pessoa sabem que é fingido, e essa consciência limita a resposta emocional e fisiológica. O mundo real, por outro lado, parece totalmente real, mas oferece quase nenhum controlo. Não é possível pausar uma sala de aula. Não é possível ajustar o número de pessoas num café. Não é possível repetir uma entrevista de emprego.

A RV situa-se exatamente entre estes dois extremos. É suficientemente realista para desencadear respostas genuínas, mas suficientemente controlada para ser terapêutica. É nesse meio-termo que acontece o trabalho mais produtivo.

O que faz um ambiente virtual parecer real

O realismo na RV não tem que ver apenas com gráficos de alta resolução. Tem que ver com os pormenores que o cérebro usa para avaliar se uma situação social é real, e esses pormenores dizem respeito, em larga medida, às pessoas.

A Therapy withVR inclui mais de 12 ambientes de fala (um café, uma sala de aula, uma padaria, uma sala de reuniões, um auditório, entre outros), cada um concebido em torno do tipo de situações que as pessoas costumam encontrar e que consideram desafiantes. Mas os ambientes são apenas parte da equação. As pessoas virtuais nesses ambientes importam tanto, ou mais.

Os avatares são concebidos para se comportarem como as pessoas reais numa conversa. Manifestam uma variedade de emoções (interesse, encorajamento, impaciência, distração) através de expressões faciais subtis e de movimento natural da boca durante a fala. Não são figuras estáticas paradas numa sala. Mexem-se na cadeira. Olham para a pessoa quando esta fala. Desviam o olhar quando perdem o interesse. É esse ciclo de feedback social, a sensação de que alguém está realmente a ouvir, ou a não ouvir, que faz uma situação de fala parecer real.

O terapeuta mantém o controlo

Um dos aspetos mais importantes da Therapy withVR, e um dos que a distingue das aplicações de RV de consumo, é que o terapeuta controla tudo em tempo real a partir de um portátil. Enquanto a pessoa está imersa no ambiente virtual com o capacete colocado, o profissional escolhe a cena, ajusta a dimensão da audiência, altera as emoções dos avatares e responde ao que está a acontecer na sessão, momento a momento.

Isto significa que o terapeuta pode aumentar a dificuldade de forma gradual. Começar com um único ouvinte numa sala silenciosa. Acrescentar mais pessoas. Introduzir ruído de fundo. Fazer com que um avatar pareça cético. Cada ajuste pode ser feito sem quebrar a imersão, e cada um dá ao profissional um controlo preciso sobre o desafio terapêutico.

Esse controlo em tempo real significa também que o terapeuta pode reduzir a intensidade. Se uma pessoa ficar sobrecarregada, o profissional pode simplificar a cena de imediato: menos pessoas, expressões mais amigáveis, um cenário mais calmo. Este tipo de exposição graduada e responsiva é difícil de conseguir na prática no mundo real e impossível no role-play tradicional.

O que isto significa para a prática clínica

Os resultados da investigação são importantes porque validam o que muitos profissionais já suspeitam quando veem as pessoas a reagir à RV: estes ambientes produzem comportamento comunicativo real, não comportamento simulado. Quando o comportamento de fala em RV se correlaciona a rho = 0,99 com a fala perante uma audiência ao vivo, quando a produção da voz muda em função da audiência virtual e quando as pessoas relatam ansiedade genuína e confiança genuína em situações de fala virtuais, os profissionais podem confiar que o trabalho feito em RV se transfere.

O teste mais direto dessa afirmação de transferência até à data vem de um ensaio controlado e aleatorizado de 2026. McCleery e colegas, publicando no Journal of Autism and Developmental Disorders, distribuíram aleatoriamente 47 adolescentes e adultos autistas por três sessões breves de prática de interação policial em RV ou por uma intervenção de modelação por vídeo com dose equivalente. O pós-teste consistiu numa interação ao vivo com um agente da polícia fardado real, avaliada por codificadores cegos. O grupo de RV deu respostas significativamente mais adequadas e mostrou uma linguagem corporal mais calma durante o encontro ao vivo; o grupo de controlo com modelação por vídeo não. Esta é uma das demonstrações mais claras até à data de que a prática baseada em RV se generaliza a interações sociais reais com desconhecidos, precisamente a distância entre a clínica e a vida que a RV se propõe encurtar.

A RV não vai substituir a prática no mundo real. O objetivo nunca foi manter as pessoas permanentemente com um capacete. O objetivo é encurtar a distância entre a sala de terapia e o mundo lá fora, dando aos profissionais uma ferramenta que lhes permite criar situações de fala realistas, repetíveis e ajustáveis, a pedido.

A investigação sugere que essa ponte é sólida. E, à medida que a base de evidências continua a crescer, os argumentos a favor da RV como parte integrante das ferramentas da terapia da fala só ficam mais fortes.

Uma nota sobre privacidade: nenhum áudio ou vídeo é alguma vez gravado durante uma sessão, e não é necessário introduzir no sistema qualquer dado identificável da pessoa. Se está a avaliar alguma nova tecnologia para a sua prática, reuni uma checklist gratuita que abrange a privacidade dos dados, o consentimento informado, entre outros aspetos.

Leitura adicional


Se está a explorar de que forma a RV pode encaixar na sua prática, entre em contacto. Terei todo o gosto em mostrar-lhe o software e analisar consigo se poderá funcionar no seu contexto.