Esta página foi traduzida do inglês. Se algo parecer estranho, mude para a versão em inglês. Ver em inglês.

Estudo de engenharia + receção dos utilizadores (Computers & Graphics 2025) de um sistema de RV controlado por voz para treino vocal e de discurso público: extrai altura tonal / timbre / velocidade de fala de 529 enunciados de 15 estudantes para reação em tempo real de personagens virtuais

Bartyzel P et al. · 2025 · Computers & Graphics · Experimental · n = 15 · Estudantes não clínicos para corpus de fala de apresentação · DOI
Grau de certeza: Certeza baixa
Como foi avaliado

Estudo de engenharia / receção dos utilizadores com um corpus de fala de 15 participantes e 6 anotadores especialistas. Revisto por pares na Computers & Graphics (Elsevier, secção especial XRIOS 2024). O contributo do artigo está no desenho do sistema e na avaliação da receção dos utilizadores, não na eficácia clínica. Limitações: não é um ensaio clínico; o corpus de fala é pequeno para a generalização a populações clínicas; os parâmetros vocais extraídos são características técnico-engenheiriais (altura tonal, timbre, velocidade) em vez de medidas clinicamente validadas de incapacidade vocal.

As avaliações utilizam um esquema simplificado de quatro níveis (Elevada, Moderada, Baixa, Muito baixa), inspirado no GRADE working group. Saiba mais sobre como os estudos são avaliados.

Um estudo de engenharia e de receção dos utilizadores publicado na secção especial XRIOS 2024 da revista Computers & Graphics. Colaboração polaco-britânica (AGH Cracóvia, SWPS Varsóvia, Academia Polaca das Ciências, Universidade de Tecnologia de Kielce, Universidade de Cambridge). O sistema baseia-se num corpus de gravações de fala com 529 enunciados produzidos durante apresentações por 15 estudantes. Parâmetros vocais extraídos: altura tonal, timbre, velocidade de fala. Seis anotadores especialistas avaliaram os níveis de stress em cada apresentação. A análise multiparamétrica seleciona características para a animação em tempo real de personagens virtuais que respondem dinamicamente às alterações da fala. O contributo é de desenho e avaliação da receção dos utilizadores, e não de eficácia clínica.

Mensagem clínica essencial

Um estudo de engenharia / receção dos utilizadores de um sistema de RV controlado por voz para treino vocal e de discurso público. O contributo é de metodologia de desenho (corpus de fala, extração de parâmetros, controlo de animação em tempo real) e não de evidência clínica. Para clínicos da voz e investigadores, este artigo ilustra uma funcionalidade emergente na RV: personagens virtuais que respondem DINAMICAMENTE aos parâmetros vocais do orador em tempo real. Não é uma referência apropriada como citação de eficácia clínica; é útil como referência metodológica e de desenho para sistemas de RV de nova geração orientados ao treino vocal.

Principais conclusões

  • Estudo de engenharia + receção dos utilizadores publicado na secção especial XRIOS 2024 da Computers & Graphics
  • Sistema de RV controlado por voz: personagens virtuais respondem DINAMICAMENTE aos parâmetros vocais do orador (altura tonal, timbre, velocidade de fala) em tempo real
  • Corpus de gravações de fala: 529 enunciados produzidos durante apresentações por 15 estudantes
  • Parâmetros vocais extraídos através de métodos de processamento de fala: altura tonal, timbre e velocidade de fala — depois mapeados para o controlo de animação em tempo real de personagens virtuais
  • Seis anotadores especialistas avaliaram os níveis de stress presentes em cada apresentação — característica de métodos mistos para uma resposta das personagens modulada pelo stress
  • Colaboração internacional polaco-britânica: AGH University of Science and Technology (Cracóvia), SWPS University (Varsóvia), Academia Polaca das Ciências (Cracóvia), Universidade de Tecnologia de Kielce e Universidade de Cambridge
  • Ilustração de uma funcionalidade emergente da RV: personagens virtuais que respondem DINAMICAMENTE ao comportamento do orador — indo além das animações de audiência pré-gravadas, no sentido de verdadeiros sistemas sociais em RV com personagens responsivas

Contexto

A maior parte dos sistemas de RV para treino vocal e de discurso público recorre a animações de audiência pré-gravadas — a audiência virtual não responde ao que o orador efetivamente diz nem à forma como o diz. Personagens virtuais controladas por voz em tempo real, que respondem aos parâmetros vocais e aos níveis de stress do orador, são uma direção de desenho de nova geração. Em 2024-2025, o pipeline de engenharia para o conseguir estava a amadurecer.

O que fizeram e o que encontraram

Foi construído um sistema de RV controlado por voz com base num corpus de 529 enunciados de apresentação produzidos por 15 estudantes. Os parâmetros vocais (altura tonal, timbre, velocidade de fala) foram extraídos através de métodos de processamento de fala. Seis anotadores especialistas avaliaram os níveis de stress. A análise multiparamétrica selecionou as características para o controlo de animação em tempo real de personagens virtuais que respondem dinamicamente às alterações da fala. Seguiu-se uma avaliação da receção dos utilizadores.

Por que razão isto é importante

Para clínicos da voz e investigadores da terapia da fala, este artigo ilustra a trajetória de engenharia rumo a personagens virtuais responsivas em contextos de RV para treino vocal. Constitui uma referência metodológica e de desenho para sistemas clínicos de RV de nova geração.

Limitações

Não é um ensaio clínico. Corpus de fala reduzido. Parâmetros vocais de cariz engenheirial em vez de medidas clinicamente validadas de incapacidade vocal.

Implicações para a prática

Para clínicos da voz e investigadores da terapia da fala, este artigo ilustra a trajetória de engenharia rumo a sistemas de RV com personagens virtuais que respondem DINAMICAMENTE aos parâmetros vocais e de stress do orador. Trata-se de uma direção de desenho relevante para sistemas de RV de nova geração para treino vocal e de discurso público — superando audiências virtuais estáticas ou pré-gravadas a favor de contextos sociais responsivos em RV. Não é adequado como evidência de eficácia clínica; deve ser usado como referência metodológica para a colaboração entre clínica e engenharia. Para o desenho do Therapy withVR, o pipeline parâmetros de fala → animação da personagem é uma funcionalidade emergente relevante.

Cite este estudo

Se referenciar este estudo no seu trabalho, estes são os formatos de citação canónicos:

APA 7th
Bartyzel, P., Igras-Cybulska, M., Hekiert, D., Majdak, M., Łukawski, G., Bohné, T., & Tadeja, S. (2025). Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. https://doi.org/10.1016/j.cag.2024.104104.
AMA 11th
Bartyzel P, Igras-Cybulska M, Hekiert D, Majdak M, Łukawski G, Bohné T, Tadeja S. Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. 2025. doi:10.1016/j.cag.2024.104104.
BibTeX
@article{bartyzel2025,
  author = {Bartyzel, P. and Igras-Cybulska, M. and Hekiert, D. and Majdak, M. and Łukawski, G. and Bohné, T. and Tadeja, S.},
  title = {Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training},
  journal = {Computers & Graphics},
  year = {2025},
  doi = {10.1016/j.cag.2024.104104},
  url = {https://withvr.app/pt/evidence/studies/bartyzel-2025}
}
RIS
TY  - JOUR
AU  - Bartyzel, P.
AU  - Igras-Cybulska, M.
AU  - Hekiert, D.
AU  - Majdak, M.
AU  - Łukawski, G.
AU  - Bohné, T.
AU  - Tadeja, S.
TI  - Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training
JO  - Computers & Graphics
PY  - 2025
DO  - 10.1016/j.cag.2024.104104
UR  - https://withvr.app/pt/evidence/studies/bartyzel-2025
ER  - 

Conhece investigação que devesse constar nesta base? Se um estudo relevante revisto por pares não estiver aqui listado, envie a referência para hello@withvr.app. A base é mantida atualizada à medida que a literatura cresce.

Financiamento e independência

Afiliações: AGH University Cracóvia, SWPS University Varsóvia, Academia Polaca das Ciências, Universidade de Tecnologia de Kielce, Universidade de Cambridge. Fontes de financiamento reportadas no artigo publicado. Revisto por pares na Computers & Graphics (Elsevier). Sem envolvimento da withVR BV.

Última avaliação: 2026-05-17 Próxima avaliação prevista: 2027-05-17 Avaliado por: Gareth Walkom