Tato stránka byla přeložena z angličtiny. Pokud něco zní zvláštně, přepněte na anglickou verzi. Zobrazit v angličtině.

Inženýrská studie + studie uživatelského přijetí (Computers & Graphics 2025) řečově ovládaného VR systému pro trénink hlasu a veřejné mluvy: extrahuje výšku tónu / barvu / rychlost řeči z 529 promluv 15 studentů pro reakci virtuální postavy v reálném čase

Bartyzel P et al. · 2025 · Computers & Graphics · Experimentální · n = 15 · Neklinický korpus prezentačních promluv vysokoškolských studentů · DOI
Míra jistoty důkazů: Nízká míra jistoty
Jak bylo toto hodnocení provedeno

Inženýrská studie / studie uživatelského přijetí s 15účastnickým řečovým korpusem a 6 expertními anotátory. Recenzováno v Computers & Graphics (Elsevier, speciální sekce XRIOS 2024). Příspěvkem článku je návrh systému a hodnocení uživatelského přijetí, nikoli klinická účinnost. Omezení: nejde o klinickou studii; řečový korpus je malý pro generalizaci na klinické populace; extrahované hlasové parametry jsou technicko-inženýrské funkce (výška tónu, barva, rychlost) namísto klinicky validovaných měření hlasového postižení.

Hodnocení používají zjednodušené čtyřúrovňové schéma (Vysoká, Střední, Nízká, Velmi nízká), které vychází z metodiky GRADE working group. Přečtěte si více o tom, jak jsou studie hodnoceny.

Inženýrská studie a studie uživatelského přijetí publikovaná v Computers & Graphics ve speciální sekci XRIOS 2024. Polsko-britská spolupráce (AGH Krakov, SWPS Varšava, Polská akademie věd, Kielecká technologická univerzita, Univerzita v Cambridge). Systém je postaven na korpusu řečových nahrávek 529 promluv při prezentacích 15 studentů. Extrahované hlasové parametry: výška tónu, barva, rychlost řeči. Šest expertních anotátorů hodnotilo úrovně stresu u každé prezentace. Vícenárodní analýza vybírá funkce pro animaci virtuálních postav v reálném čase, které dynamicky reagují na změny v řeči. Příspěvkem je návrh a hodnocení uživatelského přijetí, nikoli klinická účinnost.

Klinické sdělení v kostce

Inženýrská studie / studie uživatelského přijetí řečově ovládaného VR systému pro trénink hlasu a veřejné mluvy. Příspěvkem je metodologie návrhu (řečový korpus, extrakce parametrů, řízení animace v reálném čase), nikoli klinická evidence. Pro hlasové klinické pracovníky a výzkumníky tento článek ilustruje vznikající možnost ve VR: virtuální postavy, které DYNAMICKY reagují na hlasové parametry mluvčího v reálném čase. Není vhodné jako citace klinické účinnosti; užitečné jako metodologická a návrhová reference pro VR systémy hlasového tréninku další generace.

Klíčová zjištění

  • Inženýrská studie + studie uživatelského přijetí publikovaná v Computers & Graphics ve speciální sekci XRIOS 2024
  • Řečově ovládaný VR systém: virtuální postavy DYNAMICKY reagují na hlasové parametry mluvčího (výška tónu, barva, rychlost řeči) v reálném čase
  • Korpus řečových nahrávek: 529 promluv při prezentacích 15 studentů
  • Hlasové parametry extrahovány metodami zpracování řeči: výška tónu, barva, rychlost řeči - poté mapovány na řízení animace virtuálních postav v reálném čase
  • Šest expertních anotátorů hodnotilo úrovně stresu přítomné v každé prezentaci - smíšeně-metodická funkce pro stresem modulovanou reakci postavy
  • Polsko-britská mezinárodní spolupráce: AGH Vědeckotechnická univerzita (Krakov), Univerzita SWPS (Varšava), Polská akademie věd (Krakov), Kielecká technologická univerzita, Univerzita v Cambridge
  • Ilustrovaná vznikající možnost VR: virtuální postavy, které DYNAMICKY reagují na chování mluvčího - posun od předem nahraných animací publika k opravdu reaktivním systémům sociální VR

Pozadí

Většina VR systémů pro trénink hlasu a veřejné mluvy používá předem nahrané animace publika - virtuální publikum nereaguje na to, co mluvčí skutečně říká nebo jak to říká. Řečově ovládané virtuální postavy v reálném čase, které reagují na hlasové parametry a úrovně stresu mluvčího, jsou návrhovým směrem další generace. Do roku 2024-2025 dozrávala inženýrská pipeline pro toto.

Co dělali a co zjistili

Řečově ovládaný VR systém byl postaven na korpusu 529 prezentačních promluv 15 studentů. Hlasové parametry (výška tónu, barva, rychlost řeči) byly extrahovány metodami zpracování řeči. Šest expertních anotátorů hodnotilo úrovně stresu. Vícenárodní analýza vybrala funkce pro řízení animace virtuálních postav v reálném čase, které dynamicky reagují na změny v řeči. Následovalo hodnocení uživatelského přijetí.

Proč je to důležité

Pro hlasové klinické pracovníky a logopedické výzkumníky tento článek ilustruje inženýrskou trajektorii směrem k reaktivním virtuálním postavám v kontextech tréninku hlasu ve VR. Metodologická a návrhová reference pro klinické VR systémy další generace.

Omezení

Nejde o klinickou studii. Malý řečový korpus. Inženýrské hlasové parametry namísto klinicky validovaných měření hlasového postižení.

Implikace pro praxi

Pro hlasové klinické pracovníky a logopedické výzkumníky tento článek ilustruje inženýrskou trajektorii směrem k VR systémům s virtuálními postavami, které DYNAMICKY reagují na hlasové a stresové parametry mluvčího. Jde o významný směr návrhu pro VR systémy tréninku hlasu a veřejné mluvy další generace - posun od statického nebo předem nahraného virtuálního publika k reaktivním kontextům sociální VR. Není vhodné jako důkaz klinické účinnosti; použijte jako metodologickou referenci pro klinicko-inženýrskou spolupráci. Pro návrh produktu Therapy withVR je pipeline od řečových parametrů k animaci postavy relevantní vznikající možnost.

Citujte tuto studii

Pokud na tuto studii odkazujete ve své práci, kanonické citační formáty jsou:

APA 7th
Bartyzel, P., Igras-Cybulska, M., Hekiert, D., Majdak, M., Łukawski, G., Bohné, T., & Tadeja, S. (2025). Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. https://doi.org/10.1016/j.cag.2024.104104.
AMA 11th
Bartyzel P, Igras-Cybulska M, Hekiert D, Majdak M, Łukawski G, Bohné T, Tadeja S. Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training. Computers & Graphics. 2025. doi:10.1016/j.cag.2024.104104.
BibTeX
@article{bartyzel2025,
  author = {Bartyzel, P. and Igras-Cybulska, M. and Hekiert, D. and Majdak, M. and Łukawski, G. and Bohné, T. and Tadeja, S.},
  title = {Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training},
  journal = {Computers & Graphics},
  year = {2025},
  doi = {10.1016/j.cag.2024.104104},
  url = {https://withvr.app/cs/evidence/studies/bartyzel-2025}
}
RIS
TY  - JOUR
AU  - Bartyzel, P.
AU  - Igras-Cybulska, M.
AU  - Hekiert, D.
AU  - Majdak, M.
AU  - Łukawski, G.
AU  - Bohné, T.
AU  - Tadeja, S.
TI  - Exploring user reception of speech-controlled virtual reality environment for voice and public speaking training
JO  - Computers & Graphics
PY  - 2025
DO  - 10.1016/j.cag.2024.104104
UR  - https://withvr.app/cs/evidence/studies/bartyzel-2025
ER  - 

Víte o výzkumu, který by měl být v této databázi? Pokud zde není uvedena relevantní recenzovaná studie, zašlete referenci na hello@withvr.app. Databáze je průběžně aktualizována, jak literatura roste.

Financování a nezávislost

Afiliace: AGH Univerzita Krakov, Univerzita SWPS Varšava, Polská akademie věd, Kielecká technologická univerzita, Univerzita v Cambridge. Zdroje financování uvedeny v publikovaném článku. Recenzováno v Computers & Graphics (Elsevier). Žádné zapojení withVR BV.

Naposledy přezkoumáno: 2026-05-17 Plánované další přezkoumání: 2027-05-17 Přezkoumal: Gareth Walkom