Questa pagina è stata tradotta dall'inglese. Se qualcosa sembra strano, passa alla versione inglese. Visualizza in inglese.

Studio di ingegneria + ricezione utente (Computers & Graphics 2025) di un sistema VR controllato dalla voce per l'allenamento vocale e del parlato in pubblico: estrae pitch / timbro / velocità del parlato da 529 enunciati di 15 studenti per la risposta in tempo reale di un personaggio virtuale

Bartyzel P et al. · 2025 · Computers & Graphics · Sperimentale · n = 15 · Studenti non clinici per corpus vocale di presentazione · DOI
Livello di certezza: Certezza bassa
Come è stato valutato

Studio di ingegneria / ricezione utente con un corpus vocale di 15 partecipanti e 6 annotatori esperti. Sottoposto a peer review su Computers & Graphics (Elsevier, sezione speciale su XRIOS 2024). Il contributo dell'articolo è il design di sistema e la valutazione della ricezione utente, non l'efficacia clinica. Limiti: non è uno studio clinico; il corpus vocale è piccolo per la generalizzabilità a popolazioni cliniche; i parametri vocali estratti sono caratteristiche tecnico-ingegneristiche (pitch, timbro, velocità) piuttosto che misure clinicamente validate dell'handicap vocale.

Le valutazioni utilizzano uno schema semplificato a quattro livelli (Alta, Moderata, Bassa, Molto bassa), basato sul GRADE working group. Scopri di più su come vengono valutati gli studi.

Uno studio di ingegneria e ricezione utente pubblicato su Computers & Graphics, sezione speciale su XRIOS 2024. Collaborazione polacco-britannica (AGH Cracovia, SWPS Varsavia, Accademia Polacca delle Scienze, Università di Tecnologia di Kielce, Università di Cambridge). Il sistema è costruito su un corpus di registrazioni vocali di 529 enunciati durante presentazioni di 15 studenti. Parametri vocali estratti: pitch, timbro, velocità del parlato. Sei annotatori esperti hanno valutato i livelli di stress per ciascuna presentazione. L'analisi multi-parametrica seleziona le caratteristiche per l'animazione in tempo reale di personaggi virtuali che rispondono dinamicamente ai cambiamenti del parlato. Il contributo è la valutazione del design e della ricezione utente piuttosto che l'efficacia clinica.

Messaggio clinico chiave

Uno studio di ingegneria / ricezione utente di un sistema VR controllato dalla voce per l'allenamento vocale e del parlato in pubblico. Il contributo è la metodologia di design (corpus vocale, estrazione di parametri, controllo dell'animazione in tempo reale) piuttosto che le evidenze cliniche. Per clinici della voce e ricercatori, questo articolo illustra un'affordance emergente nella VR: personaggi virtuali che rispondono DINAMICAMENTE ai parametri vocali del parlante in tempo reale. Non appropriato come citazione di efficacia clinica; utile come riferimento metodologico e di design per sistemi VR di prossima generazione per l'allenamento vocale.

Risultati principali

  • Studio di ingegneria + ricezione utente pubblicato su Computers & Graphics, sezione speciale su XRIOS 2024
  • Sistema VR controllato dalla voce: i personaggi virtuali rispondono DINAMICAMENTE ai parametri vocali del parlante (pitch, timbro, velocità del parlato) in tempo reale
  • Corpus di registrazioni vocali: 529 enunciati pronunciati durante presentazioni di 15 studenti
  • Parametri vocali estratti utilizzando metodi di elaborazione del parlato: pitch, timbro, velocità del parlato - poi mappati al controllo dell'animazione in tempo reale di personaggi virtuali
  • Sei annotatori esperti hanno valutato i livelli di stress presenti in ciascuna presentazione - caratteristica mixed-methods per la risposta dei personaggi modulata dallo stress
  • Collaborazione internazionale polacco-britannica: AGH Università di Scienza e Tecnologia (Cracovia), Università SWPS (Varsavia), Accademia Polacca delle Scienze (Cracovia), Università di Tecnologia di Kielce, Università di Cambridge
  • Affordance VR emergente illustrata: personaggi virtuali che rispondono DINAMICAMENTE al comportamento del parlante - andando oltre le animazioni del pubblico pre-registrate verso veri sistemi VR sociali reattivi

Contesto

La maggior parte dei sistemi VR per l’allenamento vocale e del parlato in pubblico utilizza animazioni del pubblico pre-registrate - il pubblico virtuale non risponde a ciò che il parlante effettivamente dice o a come lo dice. Personaggi virtuali in tempo reale, controllati dalla voce, che rispondono ai parametri vocali e ai livelli di stress del parlante sono una direzione di design di prossima generazione. Nel 2024-2025, la pipeline ingegneristica per questo stava maturando.

Cosa hanno fatto e trovato

Un sistema VR controllato dalla voce è stato costruito su un corpus di 529 enunciati di presentazione di 15 studenti. I parametri vocali (pitch, timbro, velocità del parlato) sono stati estratti utilizzando metodi di elaborazione del parlato. Sei annotatori esperti hanno valutato i livelli di stress. L’analisi multi-parametrica ha selezionato le caratteristiche per il controllo dell’animazione in tempo reale di personaggi virtuali che rispondono dinamicamente ai cambiamenti del parlato. È seguita la valutazione della ricezione utente.

Perché è importante

Per clinici della voce e ricercatori SLP, questo articolo illustra la traiettoria ingegneristica verso personaggi virtuali reattivi nei contesti VR per l’allenamento vocale. Riferimento metodologico e di design per sistemi VR clinici di prossima generazione.

Limitazioni

Non è uno studio clinico. Piccolo corpus vocale. Parametri vocali a caratteristica ingegneristica piuttosto che misure clinicamente validate dell’handicap vocale.

Implicazioni per la pratica

Per clinici della voce e ricercatori SLP, questo articolo illustra la traiettoria ingegneristica verso sistemi VR con personaggi virtuali che rispondono DINAMICAMENTE ai parametri vocali e di stress del parlante. Questa è una direzione di design significativa per i sistemi VR di prossima generazione per l'allenamento vocale e del parlato in pubblico - andando oltre i pubblici virtuali statici o pre-registrati verso contesti VR sociali reattivi. Non appropriato come evidenza di efficacia clinica; usare come riferimento metodologico per la collaborazione clinico-ingegneristica. Per la progettazione del prodotto Therapy withVR, la pipeline parametri-vocali-verso-animazione-personaggio è un'affordance emergente rilevante.

Cita questo studio

Se citi questo studio nel tuo lavoro, questi sono i formati di citazione canonici:

APA 7th
Bartyzel, P., Igras-Cybulska, M., Hekiert, D., Majdak, M., Łukawski, G., Bohné, T., & Tadeja, S. (2025). Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. https://doi.org/10.1016/j.cag.2024.104104.
AMA 11th
Bartyzel P, Igras-Cybulska M, Hekiert D, Majdak M, Łukawski G, Bohné T, Tadeja S. Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. 2025. doi:10.1016/j.cag.2024.104104.
BibTeX
@article{bartyzel2025,
  author = {Bartyzel, P. and Igras-Cybulska, M. and Hekiert, D. and Majdak, M. and Łukawski, G. and Bohné, T. and Tadeja, S.},
  title = {Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training},
  journal = {Computers & Graphics},
  year = {2025},
  doi = {10.1016/j.cag.2024.104104},
  url = {https://withvr.app/it/evidence/studies/bartyzel-2025}
}
RIS
TY  - JOUR
AU  - Bartyzel, P.
AU  - Igras-Cybulska, M.
AU  - Hekiert, D.
AU  - Majdak, M.
AU  - Łukawski, G.
AU  - Bohné, T.
AU  - Tadeja, S.
TI  - Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training
JO  - Computers & Graphics
PY  - 2025
DO  - 10.1016/j.cag.2024.104104
UR  - https://withvr.app/it/evidence/studies/bartyzel-2025
ER  - 

Conosci ricerche che dovrebbero essere in questa base? Se uno studio peer-reviewed rilevante non è elencato qui, invia il riferimento a hello@withvr.app. La base è mantenuta aggiornata man mano che la letteratura cresce.

Finanziamento e indipendenza

Affiliazioni: AGH Università Cracovia, Università SWPS Varsavia, Accademia Polacca delle Scienze, Università di Tecnologia di Kielce, Università di Cambridge. Fonti di finanziamento riportate nell'articolo pubblicato. Sottoposto a peer review su Computers & Graphics (Elsevier). Nessun coinvolgimento di withVR BV.

Ultima revisione: 2026-05-17 Prossima revisione prevista: 2027-05-17 Revisionato da: Gareth Walkom