Bu sayfa İngilizceden çevrilmiştir. Bir şey tuhaf geliyorsa, orijinali için İngilizceye geçin. İngilizce görüntüle.
Üç katılımcılı uygulanabilirlik vaka çalışması: Arapça VR aleni konuşma sistemi ve otomatik kekemelik olay dedektörü
Bu nasıl değerlendirildi
Tek deneysel seansta üç katılımcıyla vaka çalışması. Çalışma, klinik etki iddiası değil; Arapça VR + otomatik konuşma analizi hakkında fizibilite/kavram kanıtı iddiasında bulunmaktadır. Konuşma analizörünün uzama tespit eşiği yalnızca üç akıcı KADIN Suudi konuşmacıdan (74 Arapça sözcük 44.7±2.4 saniyede) hesaplanmış olup cinsiyetler veya lehçeler genelinde genellenemeyebilir. Kontrol koşulu yok; klinisyen derecelendirmeli kekemelik şiddetiyle karşılaştırma yok; boylamsal takip yok. Makalede açık finansman bildirimi veya ÇÇB beyanı yer almamaktadır.
Değerlendirmeler, GRADE working group tarafından bilgilendirilen sadeleştirilmiş dört düzeyli bir sistem (Yüksek, Orta, Düşük, Çok düşük) kullanır. Çalışmaların nasıl değerlendirildiği hakkında daha fazla bilgi edinin.
Otomatik kekemelik olay dedektörüyle eşleştirilmiş, Samsung Gear VR + S6 telefon üzerinde çalışan Arapça VR aleni konuşma sisteminin üç katılımcılı (iki kadın, bir erkek; 30-34 yaş) uygulanabilirlik vaka çalışması. Her katılımcı, sanal bir kürsüden sanal bir kitle karşısında tek bir seans tamamladı. Kurulum süresi 2-3 dakika; aynı ses üzerinde otomatik dedektör, manuel klinisyen sayımlarıyla R=0,95 korelasyon gösterdi.
Uzamalar, blokajlar ve tekrarları Google Cloud Speech-to-Text API aracılığıyla tespit eden otomatik konuşma analizörü modülü içeren Arapça VR aleni konuşma ortamına ilişkin 3 katılımcılı tek seanslı fizibilite vaka çalışması. VR'nin desteksiz bir dil bağlamında (Arapça) kullanımı ve otomatik konuşma analizinin VR ile entegrasyonu için kavram kanıtı olarak faydalıdır; örneklem (n=3, tek seans, tek ortam) klinik etkiyi kanıtlayamaz. Hafif kekemeliği olan katılımcının en yüksek tespit oranını göstermesi, yazarların gelecekteki çalışmalar için belirttiği konuşma analizörünün klinisyen derecelendirmeli şiddetle kalibrasyonuna ilişkin soru işaretleri doğurmaktadır.
Temel bulgular
- Üç katılımcı (iki kadın, bir erkek; 30-34 yaş, O=32 SS=1.6) her biri TEK bir seans tamamladı; ÇOKLU seans değil; sistem üç dinleyici kitlesi büyüklüğü düzeyini (5, 8, 11 avatar) desteklemiş, ancak deney katılımcı başına tek konfigürasyon kullandı
- Seans süresi ile otomatik olarak tespit edilen kekemelik olayları arasında güçlü pozitif korelasyon (R=0.95)
- Katılımcılar gerçek dünya aleni konuşmayla karşılaştırılabilir kaygı ve varlık hissi bildirdi; ayrıca avatar karakterlerle 'hafif tekinsiz vadi etkisi' yaşandı
- Kurulum ve hazırlık katılımcı başına 2-3 dakika sürdü; seans süresi 1:40-2:25 dakika arasında değişti (katılımcılar 44.7±2.4 saniyelik ortalama akıcı okuma süresini yaklaşık 1:15 dakika aştı)
- Yazarların belirttiği beklenmedik bulgu: denetleyen DKT tarafından HAFİF kekemelik şiddeti olarak derecelendirilen katılımcı EN YÜKSEK tespit oranını (%20.8) gösterirken, AĞIR şiddette olan katılımcı en düşük oranı (%4.8) gösterdi; orta şiddette olan %8.6 gösterdi. Yazarlar şunu belirtiyor: 'Bu gözlem, VR'nin yalnızca yüksek kekemelik şiddetine sahip bireyler için uygun olabileceğini düşündürmektedir. Bu teoriyi doğrulamak için ek veri gerekmektedir'
- Konuşma analizörü üç akıcısızlık türü tespit etti: uzamalar (sözcük süresi üç akıcı kadın referans konuşmacıdan hesaplanan eşiği aştığında), blokajlar (konuşma API'si bir söylem için null döndürdüğünde), tekrarlar (API beklenen komut dosyasından fazla sözcük transcription yaptığında)
- Donanım/yazılım: Samsung S6 telefon üzerinde Samsung Gear VR başlık; Blender 3D modelleme; karakter animasyonu için Mixamo; sahne düzeni için Unity 3D; akıcısızlık tespiti için Python istemci kütüphanesiyle Google Cloud Speech-to-Text; ses kaydı için Audacity; lavalier mikrofonlu Sony ICD-AX412F dijital kaydedici
Arka plan
Konuşma akıcılığının değerlendirilmesi, genellikle bir klinisyenin bir konuşma veya okuma görevi sırasında her kekemelik anını manuel olarak saymasını ve sınıflandırmasını gerektirir. Bu süreç zaman alıcı, öznel olup gözlemciler arasında farklılık gösterebilir. Kekemeliği olan bireyler için, yakından izlendiklerinin farkında olmaları da konuşmalarını değiştirebilir. İkinci bir zorluk erişimdir: kekemelik-VR araştırmalarının büyük bölümü İngilizce konuşan popülasyonlarla yürütülmüş; Arapça’da eşdeğer çalışma oldukça sınırlı kalmıştır. Üç Suudi üniversitesinde çalışan Al-Nafjan, Alghamdi ve Almudhi, entegre otomatik konuşma analizörlü Arapça VR aleni konuşma ortamı geliştirerek her iki zorluğu da ele almayı hedefledi.
Araştırmacıların yaptıkları
Ekip iki bileşenli bir sistem inşa etti: (1) katılımcıyı sanal bir kürsüye yerleştiren ve üç dinleyici kitlesi büyüklüğü konfigürasyonunu (1, 2 ve 3. düzeylerde sırasıyla 5, 8 ve 11 avatar) destekleyen VR bileşeni - karakter modellemesi için Blender, animasyon için Mixamo ve sahne düzeni için Unity 3D ile oluşturulmuş; Samsung S6 Android telefon üzerinde çalışan Samsung Gear VR başlıkta işlenmiş; ve (2) katılımcının okumasını lavalier mikrofonlu Olympus WS-500M dijital kayıt cihazıyla kaydeden ve Google Cloud Speech-to-Text Python istemci kütüphanesini kullanarak her segmenti transkripsiyona aktaran konuşma analizörü bileşeni. Konuşma analizörü üç akıcısızlık türünü işaretledi:
- Uzama: Katılımcının sözcük süresinin, 74 Arapça sözcüğü 44.7±2.4 saniyede okuyan üç akıcı kadın referans konuşmacıdan hesaplanan sözcük başına eşiği aştığı durumlar.
- Blokaj: Konuşma API’si bir söylem için null transkripsiyonu döndürdüğünde; kekeleyen blok sırasında üretilen sözel olmayan ses olarak yorumlandı.
- Tekrar: API sözcüğü referans komut dosyasından beklenen sayıdan fazla transkripsiyona aktardığında.
Kekemelik Tarama (KT) puanı bu üç sayımın toplamıdır.
Katılımcılar. Denetleyen DKU’nun (ortak yazar Almudhi) klinik pratiğinden işe alınan üç Arapça konuşan kekeleyen yetişkin. Demografik bilgiler: iki kadın, bir erkek; 30, 32 ve 34 yaş (ortalama 32, SS 1.6). Kekemelik şiddeti DKU tarafından derecelendirildi: P1 orta (32 yaş), P2 hafif (34 yaş), P3 ağır (30 yaş). Tümü sağlıklı, normal görmeye sahipti ve önceki VR deneyimleri yoktu.
Prosedür. Deney, denetçinin gözetiminde izole bir odada tek seans olarak gerçekleştirildi. Katılımcılar lavalier mikrofonlu Sony IC-Recorder (ICD-AX412F) ve Samsung Gear VR başlığını taktı; sanal kürsüdeki metin okunabilir hale gelene kadar konumlarını ayarladı ve sanal kalabalık karşısında 74 sözcüklük Arapça metni yüksek sesle okudu. Kurulum/hazırlık katılımcı başına 2-3 dakika; gerçek okuma seansı 1:40-2:25 dakika sürdü. Kaydın ardından ses segmentlere ayrıldı, transkripsiyona aktarıldı ve analiz edildi; ardından katılımcılarla öznel geri bildirim için görüşüldü.
Bulgular
Kabul edilebilirlik ve varlık hissi (nitel). Katılımcılar VR deneyimlerini estetik tasarım, karakter tasarımı ve sürükleyicilik açısından olumlu değerlendirdi. VR sahnesinin gerçek bir konferans odasıyla kabul edilebilir benzerliğini, avatar karakterlerde “hafif tekinsiz vadi etkisi”ni (karakter tasarımının belirlenmiş bir sınırlılığı) ve gerçek dünya aleni konuşma etkinliklerinde yaşadıklarına benzer duygusal tepkileri (korku, kaygı) bildirdi.
Konuşma analizörü performansı. Seans süresi ile otomatik olarak tespit edilen kekemelik olayları arasında güçlü pozitif korelasyon bulundu (R=0.95). Yazarlar bunu “özellikle uzama örneklerini tespit etmede konuşma analizörünün kabul edilebilir performansının kanıtı” olarak yorumlamaktadır.
Beklenmedik şiddet-tespit sonucu. Makaledeki Tablo 2, katılımcı bazlı tespit yüzdelerini göstermektedir: P1 (orta, 32y) %8.6, P2 (hafif, 34y) %20.8, P3 (ağır, 30y) %4.8. Yani klinisyen tarafından HAFİF olarak derecelendirilen katılımcı en yüksek tespit oranını, AĞIR şiddette olan ise en düşük oranı gösterdi. Yazarlar bunu doğrudan belirtmektedir: “İlginç bir gözlem, hafif kekemelik şiddetine sahip katılımcının daha yüksek kekemelik olayı yüzdesi sergilemesidir. Bu gözlem, VR’nin yalnızca yüksek kekemelik şiddetine sahip bireyler için uygun olabileceğini düşündürmektedir. Bu teoriyi doğrulamak için ek veri gerekmektedir.” Bir okuyucu bunu eşit ölçüde otomatik dedektörün klinisyen derecelendirmesiyle örtüşmemesi sorusu olarak yorumlayabilir; ancak yazarlar bunu popülasyon uygunluğu sorusu olarak ele almaktadır.
Kurulum fizibilitesi. Katılımcı başına 2-3 dakikalık kurulum süresi, sistemin klinik kullanım için uygulanabilirliğinin kanıtı olarak sunulmaktadır.
Bu neden önemli
Bu, Arapça’da yürütülen nadir VR-kekemelik çalışmalarından biridir; alandaki önemli bir eksik temsili gidermektedir. Ayrıca VR ortamıyla kekemelik olaylarını otomatik olarak tespit etmek üzere hazır bir bulut konuşma tanıma API’sini açıkça entegre eden göreceli az sayıdaki çalışmadan biridir. Kekemelik değerlendirmesi sırasındaki manuel sayım yükünü azaltma hedefi gerçek bir klinik ihtiyaçtır; ancak uygulamanın sağlam çalışıp çalışmadığı bu küçük vaka çalışmasının yalnızca sinyalini verip (seans süresiyle R=0.95 korelasyon) kanıtlayamayacağı bir konudur.
Şiddet-tespit gözlemi, yalnızca 3 katılımcıyla hipotez üretici niteliktedir; kesin değil. Şunları yansıtabilir: (a) VR tabanlı okumada kekemeliğin tezahür ettiği gerçek popülasyon farklılıkları; (b) üç akıcı kadın konuşmacıdan türetilen uzama eşiğinin kalibrasyonu; (c) tek seansın sayısallaştıramadığı test-tekrar değişkenliği; (d) n=3’ten kaynaklanan istatistiksel gürültü.
Sınırlılıklar
Makale bunların bir kısmını doğrudan kabul etmekte; diğerleri tasarıma özgüdür:
- Örneklem büyüklüğü n=3, tek seans, katılımcı başına tek dinleyici kitlesi konfigürasyonu. Sistem üç dinleyici kitlesi büyüklüğü düzeyini desteklemiş, ancak deney konfigürasyonu değiştirmemiştir.
- Karşılaştırma koşulu yok. VR dışı taban, manuel klinisyen olay sayımıyla karşılaştırma, test-tekrar güvenilirliği yok.
- Boylamsal takip yok. Yalnızca tek seans.
- Uzama eşiği yalnızca üç akıcı KADIN konuşmacıdan türetildi. Cinsiyetler, lehçeler veya konuşma tempoları genelinde genellenemeyebilir.
- Beklenmedik şiddet-tespit bulgusu (hafif katılımcı: en yüksek tespit oranı; ağır: en düşük) otomatik dedektörün klinisyen yargısıyla örtüşüp örtüşmediği sorusunu gündeme getiriyor.
- Hafif tekinsiz vadi etkisi nitel değerlendirmede katılımcılar tarafından bildirildi.
- Makalede açık finansman bildirimi veya ÇÇB beyanı yer almıyor.
- VR donanımı orijinal Samsung Gear VR’dir (2015 dönem mobil VR). Modern Quest sınıfı donanım, materyal açıdan daha iyi görsel kalite ve izleme sunmaktadır.
Uygulama için çıkarımlar
Teknoloji destekli kekemelik değerlendirmesini değerlendiren Arapça konuşan klinisyenler için bu makale, bir VR aleni konuşma ortamıyla hazır bir bulut konuşma tanıma API'sinin (Google Cloud Speech-to-Text) Arapça dil kekemelik değerlendirmesinde uzamaları, blokajları ve tekrarları tespit etmek üzere birleştirilebileceğine dair fizibilite kanıtı sunmaktadır. Klinisyen derecelendirmeli şiddeti en düşük olan katılımcının en yüksek otomatik tespit oranını göstermesi, daha ileri kalibrasyon olmaksızın bu tür sistemlerin şiddet derecelendirmesi için kullanılmaması gerektiği konusunda uyarı niteliğindedir. Klinisyenler çalışmayı teknik işlem hattı (Arapça VR + otomatik konuşma analizi) için kavram kanıtı olarak ele almalı; VR'nin kekemeliği azalttığının ya da otomatik tespitinin klinisyen yargısıyla örtüştüğünün kanıtı olarak değil.
Bunun Therapy withVR ile bağlantısı
Yukarıdaki çalışma bağımsız bir araştırmadır ve herhangi bir ürünü desteklemez. Aşağıdaki notlar, bu araştırmadaki temaların Therapy withVR'nin özellikleriyle nasıl ilişkilendiğine dair withVR'nin yorumlarıdır. Araştırma bulguları, Therapy withVR hakkında iddialar değildir.
Speech analysis integration (editorial parallel only)
Al-Nafjan çalışması, VR ortamıyla Arapça'da uzamaları, blokajları ve tekrarları tespit etmek üzere hazır bir otomatik konuşma tanıyıcıyı (Google Cloud Speech-to-Text) entegre etti. Kavramsal hedef - seanslarda manuel kekemelik olay sayımının yükünü azaltmak - Therapy withVR'nin seans kaydının kendi tasarımı içinde farklı biçimde destekleyebileceği bir hedeftir. Yalnızca editoryal paralellik; incelenen sistem özel araştırma yazılımıdır; Therapy withVR değil.
Adjustable audience size (editorial parallel only)
Al-Nafjan VR sistemi üç dinleyici kitlesi büyüklüğü konfigürasyonunu (5, 8, 11 avatar) desteklemektedir. Deney katılımcı başına tek konfigürasyon kullandı; ancak sistemin hiyerarşi kavramı, Therapy withVR'nin kendi tasarımındaki klinisyen ayarlı dinleyici kitlesi kontrolleriyle örtüşmektedir. Yalnızca editoryal paralellik.
Bu çalışmayı kaynak gösterin
Bu çalışmayı çalışmanızda kaynak gösteriyorsanız, kanonik kaynak gösterme biçimleri şunlardır:
@article{alnafjan2021,
author = {Al-Nafjan, A. and Alghamdi, N. and Almudhi, A.},
title = {Virtual Reality Technology and Speech Analysis for People Who Stutter},
journal = {EMITTER International Journal of Engineering Technology},
year = {2021},
doi = {10.24003/emitter.v9i2.649},
url = {https://withvr.app/tr/evidence/studies/al-nafjan-2021}
}TY - JOUR
AU - Al-Nafjan, A.
AU - Alghamdi, N.
AU - Almudhi, A.
TI - Virtual Reality Technology and Speech Analysis for People Who Stutter
JO - EMITTER International Journal of Engineering Technology
PY - 2021
DO - 10.24003/emitter.v9i2.649
UR - https://withvr.app/tr/evidence/studies/al-nafjan-2021
ER - Bu merkezde yer alması gereken bir araştırma biliyor musunuz? İlgili hakemli bir çalışma burada listelenmemişse, kaynağı hello@withvr.app adresine gönderin. Merkez, literatür büyüdükçe güncel tutulmaktadır.
Finansman ve bağımsızlık
Makale herhangi bir dış finansman kaynağı açıklamamaktadır - makalede 'Finansman' bölümü yer almamaktadır. Teşekkür bölümü, üç isimsiz proje ekibi üyesine (Asmaa Albasha, Maryam Alghalban, Ola Semsemiah) 'sıkı çalışmaları ve özveri'leri nedeniyle ve katılımcılara teşekkür etmektedir. Makalede ÇÇB beyanı yer almamaktadır. Yazar bağlantıları: Abeer Al-Nafjan (Imam Muhammad bin Saud İslam Üniversitesi Bilgisayar Bilimleri Bölümü, Riyad, Suudi Arabistan); Najwa Alghamdi (King Saud Üniversitesi Bilgi Teknolojisi Bölümü, Riyad, Suudi Arabistan); Abdulaziz Almudhi (King Khalid Üniversitesi Tıbbi Rehabilitasyon Bilimleri Bölümü ve Dil ve Konuşma Patolojisi Birimi, Abha, Suudi Arabistan). VR sistemi yazarlar tarafından Samsung Gear VR başlık (Oculus uyumlu) ve Samsung S6 telefon üzerinde Blender, Unity 3D ve Mixamo kullanılarak özel olarak geliştirilmiştir; bu Therapy withVR değildir. Konuşma analizörü Google Cloud Speech-to-Text Python istemci kütüphanesini kullandı. withVR BV'nin finansman, çalışma tasarımı veya yazarlık sürecinde herhangi bir katılımı yoktur. Özet, yayınlanmış makale kullanılarak withVR tarafından bağımsız olarak hazırlanmıştır.