Αυτή η σελίδα έχει μεταφραστεί από τα αγγλικά. Αν κάτι ακούγεται παράξενο, μεταβείτε στην αγγλική έκδοση. Προβολή στα αγγλικά.

Πιλοτική μελέτη του Immersive VoiceSpace VR (N=17, φωνητικά υγιείς και άτομα με δυσφωνία) - οι συμμετέχοντες κλιμάκωσαν ένταση και τονικό ύψος σε διαβαθμισμένες συνθήκες εικονικού εστιατορίου

Daşdöğen Ü · 2026 · Journal of Voice · Πειραματική · n = 17 · Δεκαεπτά ενήλικες που στρατολογήθηκαν στο Mount Sinai... · DOI
Βαθμός βεβαιότητας: Χαμηλή βεβαιότητα
Πώς προέκυψε αυτή η αξιολόγηση

Αξιολογήθηκε από ομοτίμους στο Journal of Voice (Elsevier), εγκρίθηκε από IRB (Mount Sinai STUDY-25-01418), γραμμική ανάλυση μικτών επιδράσεων με τυχαία τομή ανά υποκείμενο και βαθμούς ελευθερίας Kenward-Roger - ένα υπερασπίσιμο αναλυτικό πλαίσιο για πιλοτική μελέτη. Πλεονεκτήματα: περιλαμβάνει κλινικό πληθυσμό (δυσφωνία) και όχι μόνο φωνητικά υγιείς ενήλικες· τα ανά συμμετέχοντα κατώφλια σε dB σχετικά με τη baseline αφαιρούν τη σύγχυση με την απόλυτη SPL· το συμπεριφορικό πρότυπο ήταν συνεπές και στις δύο ομάδες για την SPL. Περιορισμοί που κρατούν τη βεβαιότητα χαμηλά: μικρό συνολικό N (17) με μόνο 7 στην άτυπη ομάδα· μία συνεδρία και ένα μοναδικό πλαίσιο (ένα ελαφρά πληθυσμένο εικονικό εστιατόριο)· καμία ομάδα ελέγχου ή συνθήκη σύγκρισης· η baseline συλλέχθηκε εκτός του headset, γεγονός που συγχέει την έκθεση σε VR με τα αποτελέσματα των απαιτήσεων της εργασίας· ο ήχος περιβάλλοντος του εστιατορίου σιγάστηκε εσκεμμένα, γεγονός που περιορίζει τον οικολογικό ρεαλισμό και την εξωτερική εγκυρότητα· το πρωτεύον εργαλείο σκοπιμότητας αναπτύχθηκε από τον συγγραφέα και δεν έχει ακόμη επικυρωθεί· μελέτη μοναδικού συγγραφέα χωρίς αναφερόμενη αξιοπιστία μεταξύ αξιολογητών· σημαντική σύγκρουση συμφερόντων - ο συγγραφέας εφηύρε το IVS και κατέχει αμερικανική αίτηση διπλώματος ευρεσιτεχνίας για την τεχνολογία (μοναδικός αναφερόμενος εφευρέτης). Η εργασία τεκμηριώνει σκοπιμότητα και σήμα, όχι αποτελεσματικότητα. Απαιτείται αναπαραγωγή σε μεγαλύτερα πολυκεντρικά δείγματα με ομάδες σύγκρισης ελέγχου πριν από τη χρήση σε κλινική απόφαση.

Οι αξιολογήσεις χρησιμοποιούν ένα απλοποιημένο σχήμα τεσσάρων επιπέδων (Υψηλή, Μέτρια, Χαμηλή, Πολύ χαμηλή), βασισμένο στην GRADE working group. Διαβάστε περισσότερα για τον τρόπο αξιολόγησης των μελετών.

Μια within-subjects πιλοτική του Immersive VoiceSpace (IVS), μιας προσαρμοσμένης πλατφόρμας VR για φωνητική εκπαίδευση που αναπτύχθηκε από τον μοναδικό συγγραφέα. Δεκαεπτά ενήλικες (10 φωνητικά υγιείς ομιλητές και 7 άτομα με δυσφωνία) ολοκλήρωσαν μια εργασία παραγγελίας από μενού σε ένα εικονικό εστιατόριο υπό τέσσερις συνθήκες - μια baseline συν τρία διαβαθμισμένα επίπεδα IVS που χειρίζονταν την απόσταση του avatar, τα κατώφλια φωνητικής ενεργοποίησης και τους χρόνους αναμονής για αποχώρηση. Η στάθμη ηχητικής πίεσης και η μέση f0 ομιλίας αυξήθηκαν σημαντικά στα επίπεδα IVS και στις δύο ομάδες· η ευελιξία του τονικού ύψους ήταν πιο περιορισμένη στην ομάδα με δυσφωνία. Οι βαθμολογίες σκοπιμότητας ήταν συνολικά καλές (4,0/5), με την άνεση και την ασφάλεια εξαιρετικές (4,5/5) και χωρίς αναφερόμενη cybersickness.

Κλινικό συμπέρασμα

Πρώτη δημοσιευμένη ένδειξη σκοπιμότητας και proof-of-concept για το Immersive VoiceSpace (IVS), μια προσαρμοσμένη φωνητικά αποκρινόμενη πλατφόρμα VR που εφευρέθηκε και κατοχυρώθηκε με δίπλωμα ευρεσιτεχνίας από τον μοναδικό συγγραφέα στο Mount Sinai. Σε μια within-subjects πιλοτική μίας συνεδρίας με 17 ενήλικες (10 φωνητικά υγιείς και 7 άτομα με δυσφωνία, συμπεριλαμβανομένων 2 τρανς γυναικών σε φωνητική φροντίδα επιβεβαίωσης φύλου), οι διαβαθμισμένες συνθήκες εικονικού εστιατορίου παρήγαγαν συστηματικές, προοδευτικές αυξήσεις της στάθμης ηχητικής πίεσης (SPL) και της μέσης f0 ομιλίας. Και οι δύο ομάδες ακολούθησαν το ίδιο πρότυπο SPL· η ομάδα με δυσφωνία επέδειξε πιο επίπεδη κλιμάκωση τονικού ύψους καθώς οι απαιτήσεις της εργασίας αυξάνονταν. Οι συμμετέχοντες αξιολόγησαν την άνεση και την ασφάλεια ως εξαιρετικές· καμία cybersickness, κανένα ανεπιθύμητο συμβάν. Η μελέτη περιορίζεται από το μικρό δείγμα (N=17, άτυποι n=7), ένα μοναδικό πλαίσιο (εστιατόριο), μία μοναδική συνεδρία, έναν μοναδικό συγγραφέα με σημαντική σύγκρουση συμφερόντων ως εφευρέτη και κάτοχο διπλώματος ευρεσιτεχνίας, και μια εσκεμμένα σιωπηλή ηχητική σκηνή που περιορίζει την οικολογική εγκυρότητα. Τα ευρήματα υποστηρίζουν τη σκοπιμότητα και την προκαταρκτική εγκυρότητα κατασκευής για τη φωνητικά αποκρινόμενη VR ως εργαλείο πλαισιωμένης εξάσκησης, αλλά δεν τεκμηριώνουν ακόμη θεραπευτική αποτελεσματικότητα ή γενίκευση στην πραγματική χρήση της φωνής - και τα δύο απαιτούν επόμενες πολυσυνεδριακές μελέτες σε κλινικούς πληθυσμούς με ομάδες σύγκρισης ελέγχου.

Βασικά ευρήματα

  • 17 ενήλικες (10 φωνητικά υγιείς, 7 με δυσφωνία: πρεσβυφωνία, πολύποδας φωνητικής χορδής, πάρεση φωνητικής χορδής, δυσφωνία μυϊκής έντασης και 2 τρανς γυναίκες σε φωνητική φροντίδα επιβεβαίωσης φύλου) ολοκλήρωσαν ένα within-subjects πρωτόκολλο μίας συνεδρίας
  • Εξοπλισμός: head-mounted display Oculus Quest 3 που εκτελεί την εφαρμογή IVS· πυκνωτικό μικρόφωνο AKG C520 σε απόσταση 7 cm από το στόμα (βαθμονομημένο σε αναφορά 30 cm)· εγγραφές μέσω Computerized Speech Lab (CSL) στα 44,1 kHz / 16 bit
  • Τέσσερις συνθήκες σε τυχαιοποιημένη σειρά: Baseline (μέλος της ερευνητικής ομάδας ως ακροατής στα ~2 m στην κλινική αίθουσα) και τρία επίπεδα IVS σε εικονικό εστιατόριο - Normal (σερβιτόρος στα 5 m, +3 dB πάνω από τη baseline κάθε συμμετέχοντα, χρόνος αναμονής 5 s), Effortful (10 m, +5 dB, 10 s), Calling (15 m, +10 dB, 20 s). Ο ήχος περιβάλλοντος του εστιατορίου σιγάστηκε για να απομονωθούν τα οπτικο-χωρικά αποτελέσματα
  • Η κύρια επίδραση του Επιπέδου IVS στην SPL ήταν σημαντική: F(3, 48) = 33,94, p < 0,001. Σε σχέση με τη Baseline, η SPL αυξήθηκε κατά 3,83 dB (Normal), 7,41 dB (Effortful) και 9,04 dB (Calling), όλα p < 0,001
  • Η κύρια επίδραση του Επιπέδου IVS στη μέση f0 ομιλίας ήταν σημαντική: F(3, 45) = 17,63, p < 0,001. Σταδιακές αυξήσεις από τη Baseline περίπου 36 Hz (Normal, p = 0,008), 66,6 Hz (Effortful, p < 0,001) και 103,9 Hz (Calling, p < 0,001)
  • Κύριες επιδράσεις ομάδας: τα άτομα με δυσφωνία παρήγαγαν συνολικά χαμηλότερη SPL (εκτίμηση -6,88 dB, p = 0,001) και χαμηλότερη μέση f0 (p = 0,002) από τους φωνητικά υγιείς ομιλητές
  • Σημαντική αλληλεπίδραση Επίπεδο IVS x Ομάδα μόνο για τη μέση f0: F(3, 45) = 3,94, p = 0,014. Η κλιμάκωση τονικού ύψους απέκλινε στις πιο απαιτητικές συνθήκες - η διαφορά μεταξύ των ομάδων δεν ήταν σημαντική στη Baseline (p = 0,102), πλησίαζε στη σημαντικότητα στο Normal (p = 0,055) και ήταν σημαντική στο Effortful (p = 0,003) και στο Calling (p < 0,001). Η αλληλεπίδραση στην SPL δεν ήταν σημαντική και αφαιρέθηκε από το τελικό μοντέλο - και οι δύο ομάδες αύξησαν την ένταση παράλληλα
  • Σκοπιμότητα (Likert 1-5): Χρηστικότητα & Αλληλεπίδραση 3,9 (μέτρια-καλή), Εμβύθιση & Ρεαλισμός 3,4 (μέτρια, χαμηλότερος τομέας), Εμπλοκή & Αντιληπτό Όφελος 4,0 (καλή), Άνεση & Ασφάλεια 4,5 (εξαιρετική). Συνολική 4,0 (καλή)
  • Κανένα ανεπιθύμητο συμβάν. Καμία αναφερόμενη cybersickness. Καμία τεχνική διακοπή κατά τη διάρκεια του πρωτοκόλλου. Κατά μέσο όρο ~2 λεπτά για επαναδιαμόρφωση των παραμέτρων δυσκολίας μεταξύ των δοκιμών. Πλήρης συνεδρία συμπεριλαμβανομένων των οδηγιών και των ερωτηματολογίων διήρκεσε ~20 λεπτά ανά συμμετέχοντα
  • Η ανοικτή τεκμηριωμένη ανατροφοδότηση επεσήμανε την περιορισμένη απόκριση του avatar ως βασικό περιορισμό - οι συμμετέχοντες ζήτησαν λεκτικές αποκρίσεις, εκφράσεις προσώπου και συνομιλιακές χειρονομίες για να εμβαθύνουν τον ρεαλισμό της αλληλεπίδρασης

Υπόβαθρο

Η αλλαγή της φωνής είναι ζήτημα κινητικής μάθησης, όχι απλώς γνωστικό ζήτημα. Η συμπεριφορική φωνητική θεραπεία είναι αποτελεσματική για πολλές φωνητικές καταστάσεις, αλλά τα οφέλη στην κλινική συχνά δεν μεταφέρονται στην καθημερινή επικοινωνία. Η βιβλιογραφία της κινητικής μάθησης είναι σαφής γιατί: η ανθεκτική αλλαγή εξαρτάται από την εξάσκηση σε συνθήκες που μοιάζουν με το πλαίσιο-στόχο, και όχι μόνο από την εκτέλεση της συμπεριφοράς σε μια δομημένη συνεδρία. Το Specificity of Learning Principle, το Transfer-Appropriate Processing και το Encoding Specificity συγκλίνουν στο ίδιο σημείο - όταν οι αισθητηριακές και πλαισιακές απαιτήσεις της εξάσκησης ταιριάζουν με τις απαιτήσεις της πραγματικής χρήσης, η μεταφορά είναι ισχυρότερη.

Η πραγματική χρήση της φωνής συμβαίνει υπό πολυεπίπεδες απαιτήσεις: επικοινωνιακή πρόθεση, απόσταση από τον ακροατή, κοινωνικο-συναισθηματική πίεση, μέγεθος χώρου, ακουστική φόντου και οπτικο-χωρικές ενδείξεις που σηματοδοτούν πόση φωνή απαιτείται πριν ακόμη μιλήσει το άτομο. Οι συμβατικές κλινικές αίθουσες ελαχιστοποιούν εσκεμμένα αυτές τις μεταβλητές, κάτι που εξυπηρετεί την αρχική απόκτηση αλλά υποαντιπροσωπεύει ακριβώς τις ενδείξεις από τις οποίες η θεωρία της μάθησης λέει ότι εξαρτάται η γενίκευση.

Η εμβυθιστική εικονική πραγματικότητα προσφέρει έναν ελεγχόμενο τρόπο να επανεισαχθούν αυτές οι ενδείξεις. Η πολυαισθητηριακή μελέτη του Daşdöğen του 2023 (σε αυτό το Hub) τεκμηρίωσε ότι οι οπτικές και οπτικοακουστικές ενδείξεις VR οδηγούν σε μετρήσιμες φωνητικές προσαρμογές σε φωνητικά υγιείς ενήλικες, πέρα από όσα παράγει η ακουστική προσομοίωση μόνη της. Η μελέτη του 2026 για εκπαιδευμένους τραγουδιστές (επίσης σε αυτό το Hub) επέκτεινε αυτό συγκρίνοντας ειδικούς και μη εκπαιδευμένους ομιλητές. Η παρούσα μελέτη κάνει το επόμενο βήμα: διατηρείται το ίδιο αποτέλεσμα σε έναν κλινικό φωνητικό πληθυσμό και είναι εφικτή η χρήση μιας προσαρμοσμένης φωνητικά αποκρινόμενης πλατφόρμας VR σε αυτόν τον πληθυσμό.

Τι έκαναν οι ερευνητές

Μια within-subjects πιλοτική στο Mount Sinai με 17 ενήλικες: 10 φωνητικά υγιείς ομιλητές που στρατολογήθηκαν από την κλινική ωτορινολαρυγγολογίας και το νοσοκομειακό προσωπικό και 7 άτομα με δυσφωνία που στρατολογήθηκαν κατά τη διάρκεια επισκέψεων φωνητικής αξιολόγησης ρουτίνας (οι διαγνώσεις περιλάμβαναν πρεσβυφωνία, πολύποδα φωνητικής χορδής, πάρεση φωνητικής χορδής, δυσφωνία μυϊκής έντασης και φωνητική φροντίδα επιβεβαίωσης φύλου).

Η παρέμβαση ήταν το Immersive VoiceSpace (IVS) - μια προσαρμοσμένη πλατφόρμα VR που αναπτύχθηκε από τον μοναδικό συγγραφέα. Το IVS απεικόνιζε ένα ελαφρά πληθυσμένο εικονικό εστιατόριο σε ένα headset Oculus Quest 3. Ένας χαρακτήρας NPC σερβιτόρου λειτουργούσε ως στόχος ακροατή. Ο σερβιτόρος αποκρινόταν σε πραγματικό χρόνο στη φωνή του συμμετέχοντος: αν η ένταση της φωνής έφθανε ένα προκαθορισμένο κατώφλι, ο σερβιτόρος πλησίαζε και παρέμενε σε στάση ακρόασης· αν έπεφτε κάτω από το κατώφλι περισσότερο από έναν καθορισμένο χρόνο αναμονής, ο σερβιτόρος απομακρυνόταν.

Τρεις παράμετροι διαβαθμίστηκαν στις συνθήκες:

Η εργασία ομιλίας ήταν η ίδια και στις τέσσερις συνθήκες: “Παράγγειλε ένα ποτό, ένα ορεκτικό, ένα κυρίως πιάτο και ένα επιδόρπιο.” Η συνθήκη Baseline εκτελέστηκε με μέλος της ερευνητικής ομάδας να λειτουργεί ως ακροατής στην κλινική αίθουσα στα ~2 m. Οι τρεις συνθήκες IVS εκτελέστηκαν στο εικονικό εστιατόριο σε τυχαιοποιημένη σειρά.

Για να απομονωθούν τα οπτικο-χωρικά αποτελέσματα, ο ήχος περιβάλλοντος του εστιατορίου (συζητήσεις φόντου και ήχοι μαχαιροπίρουνων, που το IVS μπορεί να αναπαράγει) σιγάστηκε σε όλες τις πειραματικές συνθήκες. Η ακουστική εγγραφή έγινε μέσω ενός πυκνωτικού μικροφώνου AKG C520 τοποθετημένου στο κεφάλι, σε απόσταση 7 cm από το στόμα, βαθμονομημένου σε αναφορά 30 cm, λήφθηκε στα 44,1 kHz / 16 bit μέσω Computerized Speech Lab (CSL).

Εκβάσεις: στάθμη ηχητικής πίεσης (SPL, dB) και μέση θεμελιώδης συχνότητα ομιλίας (μέση f0, Hz), η καθεμία εξήχθη από το CSL και αναλύθηκε σε ξεχωριστά γραμμικά μοντέλα μικτών επιδράσεων με τυχαία τομή ανά υποκείμενο. Οι σταθερές επιδράσεις ήταν Ομάδα (Τυπική, Άτυπη) και Συνθήκη Εργασίας (Baseline, Normal, Effortful, Calling). Η αλληλεπίδραση Ομάδα x Συνθήκη Εργασίας διατηρήθηκε για τη μέση f0 (σημαντική) και αφαιρέθηκε από το τελικό μοντέλο SPL (μη σημαντική). Οι σταθερές επιδράσεις αξιολογήθηκαν με αθροίσματα τετραγώνων Τύπου III και προσεγγιστικούς βαθμούς ελευθερίας Kenward-Roger· οι ανά ζεύγη αντιπαραθέσεις χρησιμοποίησαν εκτιμώμενες περιθώριες μέσες τιμές με διόρθωση Tukey.

Ένα ερωτηματολόγιο Likert 5 σημείων (αναπτυγμένο από τον συγγραφέα, μη επικυρωμένο ακόμη) κατέγραψε τέσσερις τομείς μετά τη συνεδρία: Χρηστικότητα και Αλληλεπίδραση, Εμβύθιση και Ρεαλισμός, Εμπλοκή και Αντιληπτό Όφελος, Άνεση και Ασφάλεια. Οι βαθμολογίες τομέα προσεγγίστηκαν με μέσο όρο· ένας συνολικός δείκτης σκοπιμότητας ήταν ο μέσος όρος των τεσσάρων τομέων. Η ανοικτή ανατροφοδότηση εξετάστηκε περιγραφικά.

Τι βρήκαν

Στάθμη ηχητικής πίεσης. Μια σημαντική κύρια επίδραση του Επιπέδου IVS: F(3, 48) = 33,94, p < 0,001. Σε σχέση με τη Baseline, η SPL αυξήθηκε κατά 3,83 dB στο Normal, 7,41 dB στο Effortful και 9,04 dB στο Calling (όλα p < 0,001). Οι ανά ζεύγη αντιπαραθέσεις Normal-προς-Effortful και Normal-προς-Calling ήταν σημαντικές· το βήμα 1,63 dB από Effortful σε Calling δεν ήταν (p = 0,450), γεγονός που υποδηλώνει ένα πρότυπο τύπου ταβανιού στο υψηλότερο επίπεδο απαίτησης. Η κύρια επίδραση Ομάδας ήταν επίσης σημαντική: τα άτομα με δυσφωνία παρήγαγαν κατά μέσο όρο περίπου 6,88 dB χαμηλότερη SPL από τους φωνητικά υγιείς ομιλητές. Η αλληλεπίδραση Ομάδα x Επίπεδο δεν ήταν σημαντική και ως εκ τούτου αφαιρέθηκε από το τελικό μοντέλο SPL - και οι δύο ομάδες αύξησαν την ένταση παράλληλα καθώς οι απαιτήσεις της εργασίας κλιμακώνονταν.

Μέση f0 ομιλίας. Μια σημαντική κύρια επίδραση του Επιπέδου IVS: F(3, 45) = 17,63, p < 0,001. Σταδιακές αυξήσεις σε σχέση με τη Baseline (τομή ≈ 201,8 Hz για την τυπική ομάδα) περίπου 36 Hz στο Normal (p = 0,008), 66,6 Hz στο Effortful (p < 0,001) και 103,9 Hz στο Calling (p < 0,001). Η κύρια επίδραση Ομάδας ήταν σημαντική, αλλά σημαντική ήταν επίσης και η αλληλεπίδραση Επίπεδο x Ομάδα: F(3, 45) = 3,94, p = 0,014. Αποσύνθεση της αλληλεπίδρασης: στη Baseline οι ομάδες δεν διέφεραν στη μέση f0 (p = 0,102)· στο Normal η διαφορά πλησίαζε χωρίς να φτάνει τη σημαντικότητα (p = 0,055)· στο Effortful (p = 0,003) και στο Calling (p < 0,001) το χάσμα ήταν σημαντικό και αυξανόταν με τις απαιτήσεις. Η ομάδα με δυσφωνία αύξησε το τονικό ύψος με τις απαιτήσεις, αλλά σε μικρότερο βαθμό από τη φωνητικά υγιή ομάδα.

Σκοπιμότητα. Βαθμολογίες τομέα (από 5): Χρηστικότητα και Αλληλεπίδραση 3,9 (μέτρια-καλή), Εμβύθιση και Ρεαλισμός 3,4 (μέτρια, ο χαμηλότερος τομέας), Εμπλοκή και Αντιληπτό Όφελος 4,0 (καλή), Άνεση και Ασφάλεια 4,5 (εξαιρετική). Συνολικός δείκτης σκοπιμότητας 4,0 (καλή). Κανένα ανεπιθύμητο συμβάν, καμία cybersickness, καμία τεχνική διακοπή κατά το πρωτόκολλο. Ο μέσος χρόνος αναδιαμόρφωσης παραμέτρων μεταξύ δοκιμών ήταν περίπου 2 λεπτά. Η συνολική διάρκεια συνεδρίας ήταν περίπου 20 λεπτά ανά συμμετέχοντα.

Ποιοτική ανατροφοδότηση. Οι συμμετέχοντες περιέγραψαν την εμπειρία ως “διασκεδαστική,” “σαν βιντεοπαιχνίδι” και “ρεαλιστικό τρόπο εξάσκησης της φωνητικής χρήσης.” Επεσήμαναν τη ζωντανή, αποκρινόμενη συμπεριφορά του σερβιτόρου ως το πιο ελκυστικό στοιχείο. Η πιο σταθερή αρνητική ανατροφοδότηση αφορούσε την περιορισμένη αλληλεπιδραστική συμπεριφορά του σερβιτόρου - οι συμμετέχοντες επιθυμούσαν λεκτικές αποκρίσεις, εκφράσεις προσώπου και χειρονομίες κατά τους κύκλους ακρόασης ώστε η αλληλεπίδραση να φαίνεται πιο φυσική.

Γιατί έχει σημασία

Για το Evidence Hub, τρία πράγματα είναι σημαντικά σε αυτό το άρθρο:

Συγκεκριμένα για το Therapy withVR: αυτή η εργασία δοκίμασε το IVS, όχι το Therapy withVR. Η ευρύτερη αρχή που υποστηρίζει (διαβαθμισμένες οπτικο-χωρικές απαιτήσεις προκαλούν λειτουργική φωνητική προσαρμογή) είναι συμβατή με τη λογική που οι κλινικοί ήδη χρησιμοποιούν όταν επιλέγουν σκηνές στο Therapy withVR για φωνητική εργασία. Η άμεση ισοδυναμία του μηχανισμού πυροδότησης avatar-κατωφλίου μεταξύ πλατφορμών δεν έχει μελετηθεί.

Περιορισμοί

Το άρθρο είναι σαφές για το τι αυτή η δοκιμή τεκμηριώνει και τι όχι:

Πώς εντάσσεται στο ευρύτερο Evidence Hub

Αυτή η μελέτη είναι μέρος μιας αυξανόμενης γραμμής εμβυθιστικής VR φωνητικής εργασίας με επίκεντρο το Mount Sinai / Daşdöğen και γειτονικά φωνητικά εργαστήρια:

Το ευρύτερο τοπίο: η φωνητική VR κινείται από το “η προσομοίωση φαίνεται αρκετά πραγματική για να αλλάξει τη συμπεριφορά” (σε μεγάλο βαθμό απαντημένο: ναι) προς το “η εξάσκηση στην προσομοίωση μεταφέρεται στην πραγματική χρήση φωνής” (σε μεγάλο βαθμό αναπάντητο, εν αναμονή διαχρονικής πολυσυνεδριακής εργασίας). Αυτή η μελέτη βρίσκεται στα όρια - η σκοπιμότητα και το άμεσο συμπεριφορικό σήμα έχουν τεκμηριωθεί για μια προσαρμοσμένη φωνητικά αποκρινόμενη πλατφόρμα· η μεταφορά είναι η επόμενη δοκιμή.

Σημείωση σχετικά με την πλατφόρμα Immersive VoiceSpace. Το IVS είναι διακριτό από το Therapy withVR. Είναι ένα σύστημα μίας σκηνής, αποκρινόμενο σε φωνητικό κατώφλι, που εφευρέθηκε και κατοχυρώθηκε με δίπλωμα ευρεσιτεχνίας από τον συγγραφέα της μελέτης. Η θεσμική αναφορά του Mount Sinai (Μάιος 2026, “Hypophonia”) περιγράφει συνεχιζόμενη εργασία που επεκτείνει το IVS σε άτομα με υποφωνία Parkinson, με προγραμματισμένα modules για φωνητική θηλυκοποίηση και επιπρόσθετα πλαίσια. Η κατάσταση IP του IVS δεν κατέστη δυνατό να επαληθευτεί ανεξάρτητα τη στιγμή αυτής της αναθεώρησης (βλέπε πεδίο funding/COI).

Επιπτώσεις για την κλινική πράξη

Για τους κλινικούς της φωνής που χρησιμοποιούν ή αξιολογούν την εμβυθιστική VR για φωνητική εργασία: αυτή η μελέτη επεκτείνει προηγούμενα εργαστηριακά ευρήματα VR φωνής (Daşdöğen 2023, Daşdöğen 2026 για εκπαιδευμένους τραγουδιστές) δείχνοντας ότι τα ίδια αποτελέσματα ρεαλισμού και εγκυρότητας ισχύουν και σε κλινικό πληθυσμό (άτομα με δυσφωνία), όχι μόνο σε φωνητικά υγιείς ενήλικες. Και οι δύο ομάδες αύξησαν την ένταση σύμφωνα με τις διαβαθμισμένες ενδείξεις απόστασης και κατωφλίου· η κλιμάκωση τονικού ύψους ήταν πιο περιορισμένη για τα άτομα με δυσφωνία, σε συμφωνία με τη μειωμένη φωνητική ευελιξία που τεκμηριώνεται στην ευρύτερη βιβλιογραφία της φωνής. Πρακτικά: η πλαισιωμένη εξάσκηση σε εικονικά περιβάλλοντα μπορεί να προκαλέσει λειτουργική φωνητική παραγωγή χωρίς ρητή καθοδήγηση του κλινικού, γεγονός που αντιμετωπίζει το πρόβλημα γενίκευσης και μεταφοράς που για μεγάλο διάστημα περιόρισε τη μεταφορά από την κλινική στην καθημερινή επικοινωνία. Αυτή η μελέτη δοκίμασε ειδικά το Immersive VoiceSpace, όχι το Therapy withVR - οι κλινικοί που χρησιμοποιούν το Therapy withVR μπορούν να αντλήσουν από αυτή την εργασία την ίδια ευρύτερη αρχή (διαβαθμισμένες οπτικο-χωρικές απαιτήσεις προκαλούν φωνητική κλιμάκωση), αλλά δεν θα πρέπει να θεωρούν δεδομένη την άμεση ισοδυναμία του μηχανισμού πυροδότησης avatar-κατωφλίου χωρίς ξεχωριστή επικύρωση. Τα ευρήματα είναι συμβατά με το κοινωνικό μοντέλο επικοινωνίας: τα εμπόδια στη λειτουργική χρήση της φωνής βρίσκονται στα πλαίσια όπου χρειάζεται η φωνή, και τα δεδομένα υποστηρίζουν την εξάσκηση σε αυτά τα πλαίσια (αντί σε απογυμνωμένες κλινικές αίθουσες).

Επιπτώσεις για την έρευνα

Απαιτείται αναπαραγωγή και επέκταση σε: (α) μεγαλύτερα δείγματα με επαρκή ισχύ για αναλύσεις υποομάδων ανά φωνητική διάγνωση· (β) πολυσυνεδριακά πρωτόκολλα που εξετάζουν τη μάθηση, τη διατήρηση και τη γενίκευση στον πραγματικό κόσμο (ο κεντρικός ισχυρισμός του θεωρητικού πλαισίου του IVS είναι το transfer-appropriate processing, που απαιτεί διαχρονικά δεδομένα για να ελεγχθεί)· (γ) ελεγχόμενες συνθήκες σύγκρισης συμπεριλαμβανομένων εργασιών ελέγχου βασισμένων σε φαντασία για την απομόνωση της μοναδικής συμβολής των εμβυθιστικών οπτικο-χωρικών ενδείξεων από επιδράσεις νεωτερισμού και έκθεσης σε VR· (δ) υποφωνία Parkinson, που αποτελεί την κύρια κλινική εφαρμογή του IVS σύμφωνα με τη θεσμική αναφορά του Mount Sinai· (ε) φωνητική φροντίδα επιβεβαίωσης φύλου, όπου σύμφωνα με αναφορές αναπτύσσονται modules θηλυκοποίησης του IVS· (στ) τον περιορισμό αλληλεπίδρασης avatar που επεσήμαναν οι συμμετέχοντες - αν πλουσιότερες λεκτικές/μη λεκτικές αποκρίσεις avatar (πιθανώς οδηγούμενες από τεχνητή νοημοσύνη) βελτιώνουν ουσιαστικά τα αποτελέσματα. Ανεξάρτητη αναπαραγωγή εκτός του ιδρύματος εφεύρεσης θα ενίσχυε ουσιαστικά τη βάση τεκμηρίωσης.

Παραπομπή αυτής της μελέτης

Εάν αναφέρετε αυτή τη μελέτη στην εργασία σας, αυτές είναι οι κανονικές μορφές παραπομπής:

APA 7th
Daşdöğen Ü (2026). Immersive VoiceSpace: Development and Pilot Testing of a Virtual Reality System for Contextualized Vocal Training. Journal of Voice. https://doi.org/10.1016/j.jvoice.2026.04.047.
AMA 11th
Daşdöğen Ü. Immersive VoiceSpace: Development and Pilot Testing of a Virtual Reality System for Contextualized Vocal Training. Journal of Voice. 2026. doi:10.1016/j.jvoice.2026.04.047.
BibTeX
@article{daden2026,
  author = {Daşdöğen Ü},
  title = {Immersive VoiceSpace: Development and Pilot Testing of a Virtual Reality System for Contextualized Vocal Training},
  journal = {Journal of Voice},
  year = {2026},
  doi = {10.1016/j.jvoice.2026.04.047},
  url = {https://withvr.app/el/evidence/studies/dasdogen-2026-ivs}
}
RIS
TY  - JOUR
AU  - Daşdöğen Ü
TI  - Immersive VoiceSpace: Development and Pilot Testing of a Virtual Reality System for Contextualized Vocal Training
JO  - Journal of Voice
PY  - 2026
DO  - 10.1016/j.jvoice.2026.04.047
UR  - https://withvr.app/el/evidence/studies/dasdogen-2026-ivs
ER  - 

Γνωρίζετε έρευνα που θα έπρεπε να συμπεριληφθεί σε αυτή τη Βάση Τεκμηρίωσης? Εάν μια σχετική, αξιολογημένη από ομοτίμους μελέτη δεν αναφέρεται εδώ, στείλτε την παραπομπή στο hello@withvr.app. Η Βάση Τεκμηρίωσης διατηρείται επίκαιρη καθώς η βιβλιογραφία εμπλουτίζεται.

Χρηματοδότηση & ανεξαρτησία

Μελέτη μοναδικού συγγραφέα από τον Ümit Daşdöğen (Research Director, Speech and Language Pathology, The Grabscheid Voice and Swallowing Center· Assistant Professor of Otolaryngology, Icahn School of Medicine at Mount Sinai). Καμία εξωτερική χρηματοδότηση, επιχορηγήσεις ή χορηγοί δεν αναφέρονται στο χειρόγραφο. Έγκριση IRB: Mount Sinai STUDY-25-01418. Σημαντική σύγκρουση συμφερόντων: ο συγγραφέας εφηύρε την πλατφόρμα Immersive VoiceSpace (IVS) και αναγνωρίζεται στο δημοσιευμένο χειρόγραφο ως κάτοχος αμερικανικής αίτησης διπλώματος ευρεσιτεχνίας για την τεχνολογία (USPTO Application No. 63/987 σύμφωνα με το χειρόγραφο - φαίνεται να πρόκειται για κολοβωμένο αριθμό provisional application· ο πλήρης αριθμός δεν δόθηκε στο δημοσιευμένο άρθρο και δεν κατέστη δυνατός ο ανεξάρτητος εντοπισμός του τη στιγμή αυτής της αναθεώρησης μέσω USPTO Patent Public Search ή Google Patents, σε συμφωνία με την εμπιστευτικότητα των provisional applications). Το σήμα Immersive VoiceSpace® εμφανίζεται με το σύμβολο ομοσπονδιακής καταχώρισης στη θεσμική αναφορά του Mount Sinai· η αναζήτηση εμπορικού σήματος στο USPTO TESS δεν επέστρεψε αντίστοιχη ενεργή καταχώριση τη στιγμή της αναθεώρησης. Αυτές οι αξιώσεις IP αναφέρονται ως οι δηλώσεις του ίδιου του συγγραφέα και δεν κατέστη δυνατή η ανεξάρτητη επαλήθευσή τους. Αυτοί οι αλληλοεπικαλυπτόμενοι ρόλοι (ερευνητής, συγγραφέας, εφευρέτης, κάτοχος IP, σχεδιαστής ερωτηματολογίου) είναι κοινοί στην ακαδημαϊκή ανάπτυξη πλατφορμών σε πρώιμο στάδιο και επισημαίνονται εδώ για λόγους διαφάνειας· οι αναγνώστες θα πρέπει να σταθμίσουν τα αποτελέσματα σκοπιμότητας και αποδοχής ειδικά σε αυτό το πλαίσιο. Η Therapy withVR (withVR BV, Βέλγιο) δεν είχε κανέναν ρόλο στη χρηματοδότηση, τον σχεδιασμό, τη διεξαγωγή, την ανάλυση ή την αναφορά αυτής της μελέτης· αυτή η καταχώριση Evidence Hub ετοιμάστηκε ανεξάρτητα από το δημοσιευμένο peer-reviewed άρθρο και τη δημοσίως διαθέσιμη θεσμική αναφορά του Mount Sinai. Ο Daşdöğen έχει δημοσιεύσει χωριστά ένα άρθρο του 2026 στο Journal of Voice που χρησιμοποιεί το module Rooms του Therapy withVR (βλέπε dasdogen-2026 σε αυτό το Hub) και χρησιμοποιεί το Therapy withVR σε άλλες ερευνητικές εργασίες.

Τελευταία αξιολόγηση: 2026-05-23 Επόμενη προγραμματισμένη αξιολόγηση: 2027-05-23 Αξιολογήθηκε από: Gareth Walkom