Slik vurderes studiene
Vurderingene bruker et forenklet firetrinns-system (Høy, Moderat, Lav, Svært lav) inspirert av GRADE working group. Vurderingen gjenspeiler hvor trygt studiens funn kan anvendes, ikke kvaliteten på studiens forfattere eller deres arbeid. En Svært lav-vurdering betyr ikke at studien er dårlig; det betyr ofte at studien er en pilot eller kasusserie, som er nettopp det man ønsker tidlig i et felt.
Nåværende fordeling
Hva hver vurdering betyr
Høy tillit
Svært trygg på at den sanne effekten ligger nær estimatet. Forventes for funn der flere randomiserte kontrollerte studier av høy kvalitet konvergerer, på tvers av ulike steder og forskergrupper, med minimal risiko for skjevhet, inkonsistens eller indirekthet. En enkelt studie kvalifiserer aldri til Høy alene. Høy er en egenskap ved en samlet evidensmengde, ikke ved én artikkel.
Moderat tillit
Rimelig trygg på den estimerte effekten; den sanne effekten ligger sannsynligvis nær, men kan plausibelt avvike. Typisk for godt utformede enkelt-RCT-er med tilstrekkelig utvalg, og for systematiske oversikter over heterogene primærstudier.
Lav tillit
Begrenset tillit. Den sanne effekten kan være vesentlig forskjellig fra estimatet. Vanlig for RCT-er med små utvalg, kvasi-eksperimentelle design og kvalitative studier. Alle disse bidrar med reell kunnskap, men kan ikke alene støtte faste konklusjoner.
Svært lav tillit
Svært liten tillit til noe estimat av effekt. Kasusstudier, små piloter og narrative eller konseptuelle artikler hører hjemme her. Disse studiene er fortsatt verdifulle. De viser gjennomførbarhet, reiser spørsmål og legger grunnlag for senere kontrollert arbeid, men de er ikke evidens for effekt.
Hvorfor ingen studier er vurdert Høy
Dette er det ærlige svaret: VR i logopedi er et ungt forskningsfelt. For at en påstand skal nå Høy tillit, trenger litteraturen vanligvis flere RCT-er av høy kvalitet, ideelt sett forhåndsregistrerte og fra flere sentre, som konvergerer til samme funn. For de fleste spørsmålene Evidence Hub tar opp, eksisterer ikke denne mengden evidens ennå.
De sterkeste kandidatene i hub-en for øyeblikket er enkelt-RCT-er på beslektede områder: sosial angst (Anderson 2013), autisme (Ip 2018), stamming (Cream 2010), tinnitus (Malinvaud 2016). Alle ligger på Moderat. Hver er en god studie; ingen av dem alene har nok vekt til å heve en påstand til Høy uten replikasjon.
Fraværet av Høy-vurderinger i denne hub-en er ikke en svakhet ved hub-en. Det gjenspeiler hvor feltet står. En vurderingsfordeling som leser "0 % Høy / ~20 % Moderat / ~35 % Lav / ~45 % Svært lav" er hva man ville forvente for et grundig vurdert ungt forskningsområde. Inflaterte vurderinger ville vært lettere på øyet og mye mindre ærlige.
Hva som kan forsvare en Høy-vurdering
Fremtidige tillegg til hub-en som kan nå Høy inkluderer:
- En Cochrane-oversikt eller tilsvarende systematisk oversikt over flere RCT-er av høy kvalitet på et område innenfor omfanget (VR for stamming, stemmearbeid, afasi, svelging, sosial kommunikasjon) med konsistente effekter på tvers av studier.
- Meta-analyser som syntetiserer 5+ forhåndsregistrerte RCT-er med tilstrekkelige utvalgsstørrelser, minimal heterogenitet og funn som konvergerer i retning og størrelse.
- Flere store RCT-er fra flere sentre (n > 200 per arm) som replikerer en spesifikk effekt av VR-basert øving på et kommunikasjonsutfall som betyr noe for klientene.
Realistisk sett ligger dette evidensnivået flere år frem i tid for de fleste påstander innen VR i logopedi. En plausibel kandidat for tidlig oppgradering til Høy er validiteten av virtuelle publikum for å produsere kommunikative reaksjoner sammenlignbare med ekte publikum. Evidensen her konvergerer jevnt etter hvert som nytt arbeid replikerer tidligere funn. En formell systematisk oversikt over dette spesifikke spørsmålet ville være velkommen.
Hvordan vurderingene fastsettes
Hver studies vurdering tildeles redaksjonelt av withVR, basert på artikkelens design (RCT / kvasi-eksperimentell / kasus / oversikt), utvalgsstørrelse, populasjon og artikkelens egne uttalte begrensninger. En kort begrunnelse følger hver vurdering, synlig på studiesiden ved å utvide "Hvordan dette ble vurdert".
Vurderingene gjenspeiler redaksjonelt skjønn, ikke en formell GRADE-vurderingsprosess av den typen som brukes i Cochrane-oversikter. Systemet er bevisst forenklet: fire trinn er nok til å signalisere hvor trygt klinikere og forskere bør anvende et funn, uten å antyde en presisjon den redaksjonelle prosessen ikke har.
Korreksjoner og forslag er velkomne
Hvis du mener en studie er vurdert feil, eller en studie som fortjener inkludering er oversett, send en melding til hello@withvr.app. Systemet er ment å være transparent og korrigerbart.
Videre lesning
- GRADE working group - det internasjonale samarbeidet som utviklet metodikken dette systemet er inspirert av.
- GRADE: an emerging consensus on rating quality of evidence (Guyatt et al., BMJ 2008) - den grunnleggende artikkelen.
- Evidence Hub-ordliste - definisjoner av beslektede termer (evidensnivåer, risiko for skjevhet, PEDro, PICO).
Kjenner du til forskning som burde være her? Hvis en fagfellevurdert studie om VR i tale-, stemme-, hørsels- eller kommunikasjonsarbeid ikke er listet, send referansen til hello@withvr.app.