Questa pagina è stata tradotta dall'inglese. Se qualcosa sembra strano, passa alla versione inglese. Visualizza in inglese.
Studio di ingegneria + ricezione utente (Computers & Graphics 2025) di un sistema VR controllato dalla voce per l'allenamento vocale e del parlato in pubblico: estrae pitch / timbro / velocità del parlato da 529 enunciati di 15 studenti per la risposta in tempo reale di un personaggio virtuale
Come è stato valutato
Studio di ingegneria / ricezione utente con un corpus vocale di 15 partecipanti e 6 annotatori esperti. Sottoposto a peer review su Computers & Graphics (Elsevier, sezione speciale su XRIOS 2024). Il contributo dell'articolo è il design di sistema e la valutazione della ricezione utente, non l'efficacia clinica. Limiti: non è uno studio clinico; il corpus vocale è piccolo per la generalizzabilità a popolazioni cliniche; i parametri vocali estratti sono caratteristiche tecnico-ingegneristiche (pitch, timbro, velocità) piuttosto che misure clinicamente validate dell'handicap vocale.
Le valutazioni utilizzano uno schema semplificato a quattro livelli (Alta, Moderata, Bassa, Molto bassa), basato sul GRADE working group. Scopri di più su come vengono valutati gli studi.
Uno studio di ingegneria e ricezione utente pubblicato su Computers & Graphics, sezione speciale su XRIOS 2024. Collaborazione polacco-britannica (AGH Cracovia, SWPS Varsavia, Accademia Polacca delle Scienze, Università di Tecnologia di Kielce, Università di Cambridge). Il sistema è costruito su un corpus di registrazioni vocali di 529 enunciati durante presentazioni di 15 studenti. Parametri vocali estratti: pitch, timbro, velocità del parlato. Sei annotatori esperti hanno valutato i livelli di stress per ciascuna presentazione. L'analisi multi-parametrica seleziona le caratteristiche per l'animazione in tempo reale di personaggi virtuali che rispondono dinamicamente ai cambiamenti del parlato. Il contributo è la valutazione del design e della ricezione utente piuttosto che l'efficacia clinica.
Uno studio di ingegneria / ricezione utente di un sistema VR controllato dalla voce per l'allenamento vocale e del parlato in pubblico. Il contributo è la metodologia di design (corpus vocale, estrazione di parametri, controllo dell'animazione in tempo reale) piuttosto che le evidenze cliniche. Per clinici della voce e ricercatori, questo articolo illustra un'affordance emergente nella VR: personaggi virtuali che rispondono DINAMICAMENTE ai parametri vocali del parlante in tempo reale. Non appropriato come citazione di efficacia clinica; utile come riferimento metodologico e di design per sistemi VR di prossima generazione per l'allenamento vocale.
Risultati principali
- Studio di ingegneria + ricezione utente pubblicato su Computers & Graphics, sezione speciale su XRIOS 2024
- Sistema VR controllato dalla voce: i personaggi virtuali rispondono DINAMICAMENTE ai parametri vocali del parlante (pitch, timbro, velocità del parlato) in tempo reale
- Corpus di registrazioni vocali: 529 enunciati pronunciati durante presentazioni di 15 studenti
- Parametri vocali estratti utilizzando metodi di elaborazione del parlato: pitch, timbro, velocità del parlato - poi mappati al controllo dell'animazione in tempo reale di personaggi virtuali
- Sei annotatori esperti hanno valutato i livelli di stress presenti in ciascuna presentazione - caratteristica mixed-methods per la risposta dei personaggi modulata dallo stress
- Collaborazione internazionale polacco-britannica: AGH Università di Scienza e Tecnologia (Cracovia), Università SWPS (Varsavia), Accademia Polacca delle Scienze (Cracovia), Università di Tecnologia di Kielce, Università di Cambridge
- Affordance VR emergente illustrata: personaggi virtuali che rispondono DINAMICAMENTE al comportamento del parlante - andando oltre le animazioni del pubblico pre-registrate verso veri sistemi VR sociali reattivi
Contesto
La maggior parte dei sistemi VR per l’allenamento vocale e del parlato in pubblico utilizza animazioni del pubblico pre-registrate - il pubblico virtuale non risponde a ciò che il parlante effettivamente dice o a come lo dice. Personaggi virtuali in tempo reale, controllati dalla voce, che rispondono ai parametri vocali e ai livelli di stress del parlante sono una direzione di design di prossima generazione. Nel 2024-2025, la pipeline ingegneristica per questo stava maturando.
Cosa hanno fatto e trovato
Un sistema VR controllato dalla voce è stato costruito su un corpus di 529 enunciati di presentazione di 15 studenti. I parametri vocali (pitch, timbro, velocità del parlato) sono stati estratti utilizzando metodi di elaborazione del parlato. Sei annotatori esperti hanno valutato i livelli di stress. L’analisi multi-parametrica ha selezionato le caratteristiche per il controllo dell’animazione in tempo reale di personaggi virtuali che rispondono dinamicamente ai cambiamenti del parlato. È seguita la valutazione della ricezione utente.
Perché è importante
Per clinici della voce e ricercatori SLP, questo articolo illustra la traiettoria ingegneristica verso personaggi virtuali reattivi nei contesti VR per l’allenamento vocale. Riferimento metodologico e di design per sistemi VR clinici di prossima generazione.
Limitazioni
Non è uno studio clinico. Piccolo corpus vocale. Parametri vocali a caratteristica ingegneristica piuttosto che misure clinicamente validate dell’handicap vocale.
Implicazioni per la pratica
Per clinici della voce e ricercatori SLP, questo articolo illustra la traiettoria ingegneristica verso sistemi VR con personaggi virtuali che rispondono DINAMICAMENTE ai parametri vocali e di stress del parlante. Questa è una direzione di design significativa per i sistemi VR di prossima generazione per l'allenamento vocale e del parlato in pubblico - andando oltre i pubblici virtuali statici o pre-registrati verso contesti VR sociali reattivi. Non appropriato come evidenza di efficacia clinica; usare come riferimento metodologico per la collaborazione clinico-ingegneristica. Per la progettazione del prodotto Therapy withVR, la pipeline parametri-vocali-verso-animazione-personaggio è un'affordance emergente rilevante.
Cita questo studio
Se citi questo studio nel tuo lavoro, questi sono i formati di citazione canonici:
@article{bartyzel2025,
author = {Bartyzel, P. and Igras-Cybulska, M. and Hekiert, D. and Majdak, M. and Łukawski, G. and Bohné, T. and Tadeja, S.},
title = {Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training},
journal = {Computers & Graphics},
year = {2025},
doi = {10.1016/j.cag.2024.104104},
url = {https://withvr.app/it/evidence/studies/bartyzel-2025}
}TY - JOUR
AU - Bartyzel, P.
AU - Igras-Cybulska, M.
AU - Hekiert, D.
AU - Majdak, M.
AU - Łukawski, G.
AU - Bohné, T.
AU - Tadeja, S.
TI - Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training
JO - Computers & Graphics
PY - 2025
DO - 10.1016/j.cag.2024.104104
UR - https://withvr.app/it/evidence/studies/bartyzel-2025
ER - Conosci ricerche che dovrebbero essere in questa base? Se uno studio peer-reviewed rilevante non è elencato qui, invia il riferimento a hello@withvr.app. La base è mantenuta aggiornata man mano che la letteratura cresce.
Finanziamento e indipendenza
Affiliazioni: AGH Università Cracovia, Università SWPS Varsavia, Accademia Polacca delle Scienze, Università di Tecnologia di Kielce, Università di Cambridge. Fonti di finanziamento riportate nell'articolo pubblicato. Sottoposto a peer review su Computers & Graphics (Elsevier). Nessun coinvolgimento di withVR BV.