«Parece suficientemente real para importar?» é uma pergunta razoável a fazer a qualquer ambiente virtual usado na prática da comunicação. Se um café virtual não evocar as reações que um café real evoca, então a prática no virtual dificilmente se transferirá. Se evocar, abre um tipo de espaço de prática que de outra forma é difícil de organizar.

Na última década, um corpo de investigação revista por pares pequeno mas crescente tentou responder a esta pergunta. Não no abstrato - mas com medições de ansiedade, frequência cardíaca, acústica da voz e outros comportamentos de fala em condições reais e virtuais emparelhadas. Este artigo reúne o que cinco desses estudos nos dizem e o que a evidência sugere para a prática diária.

A pergunta

Validade ecológica é a medida em que uma situação de investigação produz os comportamentos e as respostas que aconteceriam na situação do mundo real que pretende representar. Um café virtual que pareça plausível mas não desencadeie qualquer ansiedade tem baixa validade ecológica para estudar a ansiedade ao falar. Um café virtual que desencadeia o mesmo tipo de reações que um café real desencadeia tem alta validade ecológica.

A validade não é uma propriedade única de um ambiente de RV. Depende do que se quer estudar ou praticar. Uma configuração de RV pode ser ecologicamente válida para falar em público para adultos e não ser válida para a participação em sala de aula de crianças, ou válida para a ansiedade ao falar e não para a produção vocal, ou válida para algumas pessoas e não para outras.

O que mostram cinco estudos

Os cinco estudos num relance

Evidência de validade ecológica para ambientes virtuais de fala

  1. 2015n = 10 · intra-sujeitos

    Brundage & Hancock - públicos virtuais e ao vivo produzem fala quase idêntica

    A medida primária da fala correlacionou-se a r = 0,99 entre as condições virtual e ao vivo. Apreensão na comunicação e classificações de confiança correspondiam estreitamente.

  2. 2026n = 60 · 3 condições

    Bettahi et al. - públicos virtuais desencadeiam ansiedade real e mudanças reais na voz

    A ansiedade antecipatória (SUDS), a frequência cardíaca e as medidas vocais (F0, variabilidade de F0) foram comparáveis entre condições reais e virtuais de público. Maior presença reportada = respostas mais próximas.

  3. 2026n = 8 · intra-sujeitos

    Dasdogen & Hitchcock - a distância virtual por si só altera o comportamento vocal

    Pistas visuais de distância afetaram significativamente a intensidade e o tom vocais mesmo com a acústica mantida constante. Cantores treinados ajustaram-se de forma mais sistemática do que falantes não treinados.

  4. 2016n = 6 · piloto

    Walkom - protótipo inicial, piloto honesto

    A ansiedade autorrelatada diminuiu ao longo das sessões; a ativação fisiológica apareceu durante a exposição; observadores reportaram alterações nos padrões de fala na sessão 2. Viabilidade, não efeito.

  5. 2024n = 5 · viabilidade

    Kumar, Cecil & Tetnowski - viabilidade da prática de RV em casa

    A frequência da gaguez baixou de 18,67% para 9,71% das sílabas ao longo de uma semana; a frequência cardíaca também baixou. Sem condição de comparação - evidência de viabilidade, não efeito causal.

Cada estudo é resumido em baixo. As amostras são pequenas; a convergência entre vários tipos de medidas importa mais do que qualquer achado isolado.

Brundage e Hancock, 2015: públicos virtuais e reais produzem respostas de gaguez quase idênticas

Brundage e Hancock (2015) tiveram dez adultos que gaguejam a falar tanto numa condição de público ao vivo como num público virtual. A medida primária da fala mostrou uma correlação quase perfeita entre as condições virtual e ao vivo (r = 0,99). As classificações de apreensão na comunicação e de confiança do orador também correspondiam estreitamente entre condições.

Este estudo é frequentemente citado como a demonstração fundacional de que os públicos virtuais são ecologicamente válidos para estudar a gaguez sob pressão de público. A amostra é pequena, mas a correlação é forte e o desenho emparelhou participantes individuais nas duas condições.

Bettahi e colegas, 2026: públicos virtuais desencadeiam ansiedade real e mudanças reais na voz

Bettahi et al. (2026) alargaram a questão da validação à voz e à fisiologia. Sessenta estudantes universitários apresentaram-se a um público real, a um público virtual e a uma sala virtual vazia. O público virtual produziu ansiedade antecipatória (medida com SUDS) e aumentos de frequência cardíaca comparáveis aos do público real. As medidas vocais (frequência fundamental e a sua variabilidade) foram em grande medida equivalentes entre as condições de público real e virtual.

Um achado notável: os participantes que reportaram sensações mais fortes de presença em RV mostraram respostas mais próximas das do público real. A presença parece ser uma das variáveis que determinam se um dado ambiente é ecologicamente válido para uma dada pessoa.

Dasdogen e Hitchcock, 2026: a distância virtual por si só muda a forma como as pessoas usam a voz

Dasdogen e Hitchcock (2026) olharam para uma questão diferente: se as propriedades visuais do ambiente virtual (tamanho da sala, distância orador-ouvinte) mudariam o comportamento vocal mesmo quando o ambiente acústico era mantido constante. Usando a situação Salas de Therapy withVR, descobriram que as pistas de distância afetaram significativamente a intensidade e o tom vocais. Cantores treinados ajustaram a sua voz de forma mais sistemática do que falantes não treinados.

Este é um estudo mais pequeno (oito mulheres adultas), mas conceptualmente importante. Mostra que o ambiente virtual visual pode conduzir o comportamento vocal por si só - a voz responde ao contexto de fala percebido, não apenas à acústica física.

Walkom, 2016: protótipo inicial, piloto honesto

O piloto mais antigo deste grupo testou uma ferramenta personalizada de fala em público em RV com seis adultos que gaguejam. A ansiedade autorrelatada diminuiu ao longo das sessões, a ativação fisiológica apareceu durante a exposição, e os observadores reportaram alterações visíveis nos padrões de fala na Sessão 2. Seis participantes não constituem evidência de efeito - mas o piloto apoiou a viabilidade e levantou questões úteis para trabalho posterior.

Kumar e colegas, 2024: viabilidade da prática de RV em casa

Kumar, Cecil e Tetnowski (2024) deram o passo seguinte de tirar a RV do laboratório. Cinco adolescentes e jovens adultos que gaguejam usaram capacetes de RV comerciais em casa durante uma semana com cenários de fala graduados. A frequência da gaguez baixou de 18,67% para 9,71% das sílabas, e a frequência cardíaca também baixou. Mais uma vez, cinco participantes sem condição de comparação não constituem evidência de efeito, mas o estudo demonstra que programas de RV em casa são viáveis e merecem ser testados em escala.

Uma vista tipo forest plot da convergência

Forest plot das estatísticas de convergência dos três estudos de comparação direta

Quão de perto as respostas em RV acompanharam os equivalentes do mundo real, por correlação e efeito reportados

Brundage & Hancock 2015 (n = 10 PWS)Correlação entre as condições de público em RV e ao vivo, por medida00.250.50.751.0Coeficiente de correlação (Spearman ρ ou Pearson r)Comportamento de fala - PV desafiadorρ = 0.99Comportamento de fala - PV neutroρ = 0.82PRCS - confiançar = 0.88PRCA-24 - apreensãor = 0.82Bettahi et al. 2026 (n = 60)Efeito da condição (ANOVA de 3 vias: público real / virtual / virtual vazio), η² parcial00.050.100.150.20η² parcial (menor = mais semelhante entre condições)Disfluências totaisη²ₓ = 0,05 (ns)Pausas preenchidasη²ₓ = 0,11, p=,001F0 médio (tom)η²ₓ = 0,12, p=,002Daşdöğen & Hitchcock 2026 (n = 8)Estatística F para o efeito da distância ao ouvinte (acústica constante)0510152025Valor FSPL (intensidade)F=21,74, p<,001F0 (tom)F=7,86, p<,001

Os três estudos de comparação direta convergem: Brundage mostra uma correspondência de ordem de classificação quase perfeita entre públicos em RV e ao vivo na gaguez e na apreensão. Bettahi mostra efeitos pequenos a moderados da condição (ou seja, real vs RV são semelhantes) na maioria das medidas vocais. Daşdöğen mostra que só as pistas visuais deslocam significativamente a produção vocal mesmo com a acústica mantida constante. Walkom 2016 (n=6 piloto misto) e Kumar 2024 (n=5 viabilidade em casa) não estão representados aqui porque não testam diretamente a correspondência entre público virtual e real.

Fontes: Brundage & Hancock 2015 (American Journal of Speech-Language Pathology, DOI); Bettahi et al. 2026 (Frontiers in Virtual Reality); Daşdöğen & Hitchcock 2026 (Journal of Voice). Um η² parcial mais baixo em Bettahi significa que as condições de RV e real produziram respostas mais semelhantes; para a medida de disfluências, o efeito da condição foi não significativo após correção de Bonferroni (ou seja, desempenho comparável entre condições). Os valores F significativos de Daşdöğen para a distância ao ouvinte mostram que só as pistas visuais de distância deslocam de forma fiável a intensidade e o tom vocais. Nota: as contagens de frequência tipo %SS são reportadas aqui tal como os estudos originais as mediram; o campo move-se cada vez mais para medidas de confiança autoavaliada, disposição para comunicar e orientadas à participação.

O que sugere a evidência

Cruzando estes cinco estudos, e o Evidence Hub mais alargado em que se inserem, emergem vários padrões.

Públicos virtuais bem desenhados produzem respostas que se assemelham às respostas a públicos reais. Foi o que Brundage e Hancock e Bettahi e colegas mostraram, usando diferentes medidas de resultado (frequência cardíaca, voz, ansiedade e observação comportamental). A convergência entre medidas é mais convincente do que qualquer achado isolado.

A presença importa, e varia entre pessoas. A presença é a sensação subjetiva de se estar lá dentro de um ambiente virtual. Maior presença está associada a respostas mais próximas dos equivalentes do mundo real. Isto sugere que a validade ecológica é em parte uma propriedade da pessoa que usa o ambiente, não apenas do próprio ambiente.

O contexto visual por si só pode moldar o comportamento vocal e comunicativo. O estudo de Dasdogen e Hitchcock mostra que as pessoas ajustam a voz com base no contexto virtual percebido, mesmo quando a acústica é mantida constante. Isto importa para o trabalho de voz e para qualquer questão sobre como os falantes calibram o seu output em função do público.

A base de evidência ainda é pequena. As amostras estão maioritariamente abaixo dos vinte. As populações são frequentemente não clínicas ou estreitas. A transferência a longo prazo para situações do quotidiano permanece largamente por testar. São limitações reais que devem moldar a confiança com que qualquer achado é aplicado.

O que isto significa para a prática diária

Algumas conclusões tentativas para profissionais da fala e da linguagem que considerem a prática em RV como parte do seu trabalho:

Notas editoriais da withVR

Os temas desta investigação moldaram o desenho de Therapy withVR. A situação Auditório existe por causa de trabalho como o de Brundage e Hancock e Bettahi. A situação Sala existe por causa de estudos como o de Dasdogen e Hitchcock. A funcionalidade Objetivo existe para apoiar a questão da generalização - permitindo às pessoas classificarem a sua própria confiança antes e depois de uma sessão, em vez de depender de metas de produção.

Nada disto significa que os achados de investigação de estudos sobre outros sistemas de RV se transfiram diretamente para Therapy withVR. Não se transferem. O que Therapy withVR tenta fazer é oferecer um ambiente de prática consistente com os temas que a evidência levanta: situações graduadas, controlo do clínico em tempo real, confiança autorrelatada ao longo do tempo e ambientes em que as pessoas relatam sentir-se presentes.

Leitura adicional