Hoe studies worden beoordeeld

Elke studie in de Evidence Hub draagt een zekerheidsbeoordeling. Deze pagina legt uit wat de beoordelingen betekenen, hoe ze worden bepaald en wat de eerlijke stand van zaken is van het bewijs voor VR in spraak-, stem- en communicatiewerk.

Beoordelingen gebruiken een vereenvoudigd schema met vier niveaus (Hoog, Matig, Laag, Zeer laag) dat is gebaseerd op de GRADE working group. De beoordeling weerspiegelt hoe stellig de bevindingen van een studie kunnen worden toegepast, niet de kwaliteit van de auteurs of hun werk. Een score Zeer laag betekent niet dat de studie slecht is; het betekent vaak dat de studie een pilot of case series is, wat precies is wat je vroeg in een vakgebied wilt zien.

Huidige verdeling

Hoog 9 studies

Matig 40 studies

Laag 39 studies

Zeer laag 23 studies

Wat elke beoordeling betekent

Hoge zekerheid

Zeer veel vertrouwen dat het werkelijke effect dicht bij de schatting ligt. Verwacht voor bevindingen waar meerdere hoogwaardige gerandomiseerde gecontroleerde trials op verschillende locaties en uit verschillende onderzoeksgroepen samenkomen, met minimaal risico op bias, inconsistentie of indirectheid. Een enkele studie haalt op zichzelf zelden Hoog; de uitzondering is een grote multicenter trial met een laag risico op bias, op verschillende locaties uitgevoerd - anders weerspiegelt Hoog een bewijsverzameling, niet een afzonderlijk paper.

Matige zekerheid

Redelijk veel vertrouwen in het geschatte effect; het werkelijke effect ligt waarschijnlijk dichtbij maar kan plausibel afwijken. Typisch voor goed opgezette afzonderlijke RCT's met voldoende steekproef, en voor systematische reviews van heterogene primaire studies.

Lage zekerheid

Beperkt vertrouwen. Het werkelijke effect kan substantieel afwijken van de schatting. Gebruikelijk voor RCT's met kleine steekproeven, quasi-experimentele opzetten en kwalitatieve studies; deze leveren reële kennis op, maar kunnen op zichzelf geen stevige conclusies dragen.

Zeer lage zekerheid

Zeer weinig vertrouwen in welke effectschatting dan ook. Casussen, kleine pilots en narratieve of conceptuele papers vallen hieronder. Deze studies zijn nog steeds waardevol; ze tonen haalbaarheid aan, brengen vragen naar boven en vormen de basis voor later gecontroleerd werk, maar ze zijn geen bewijs van effect.

Waar Hoog-beoordelingen vandaan komen

Van de 111 studies die momenteel in de hub staan, zijn er 9 (8%) beoordeeld als Hoog. Hoge zekerheid weerspiegelt vrijwel altijd een samenkomende bewijsverzameling en niet een afzonderlijk paper, dus de meeste hiervan zijn systematische reviews en meta-analyses die bevindingen uit vele studies samenvoegen. Een enkele primaire studie haalt alleen bij hoge uitzondering Hoog; een grote trial op meerdere locaties met een laag risico op bias, anders is het hoogste dat een op zichzelf staande studie hier verdient, Matig.

Daarom ligt de verdeling waar ze ligt: 8% Hoog, 36% Matig, 35% Laag en 21% Zeer laag. VR voor spraak-, stem- en communicatiewerk is nog een jong onderzoeksveld, dus het meeste bewijs bestaat uit kleine, vroege studies op een enkele locatie; precies wat je zou verwachten, en precies waarop latere gecontroleerde trials en reviews voortbouwen. Een eerlijke verdeling als deze is nuttiger, en betrouwbaarder, dan opgeklopte beoordelingen die het oog meer zouden strelen.

Wat er nodig is om Hoog te bereiken

Voor een specifieke klinische vraag vereist een Hoog-beoordeling een samenkomende verzameling hoogwaardig bewijs; doorgaans:

Een Cochrane-review of een vergelijkbare systematische review van meerdere hoogwaardige RCT's in een passend gebied (VR voor stotteren, stemwerk, afasie, slikken, sociale communicatie) met consistente effecten over studies heen.
Meta-analyses die meerdere pre-registered RCT's synthetiseren met voldoende steekproefomvang, minimale heterogeniteit en bevindingen die in richting en omvang samenvallen.
Meerdere grote multi-site RCT's (n > 200 per arm) die een specifiek effect repliceren van VR-gebaseerde oefening op een communicatie-uitkomst die voor cliënten van belang is.

Voor de meeste specifieke klinische claims in VR-logopedie is deze diepgang van bewijs nog in opbouw. Een vraag die gestaag samenkomt, is of virtuele publieken communicatieve reacties opwekken die vergelijkbaar zijn met die van echte publieken, naarmate nieuw werk eerdere bevindingen repliceert; een formele systematische review van die vraag zou welkom zijn.

Hoe beoordelingen worden bepaald

De beoordeling van elke studie wordt redactioneel toegekend door withVR, op basis van het ontwerp van het paper (RCT, quasi-experimenteel, casus, review), de steekproefomvang, de populatie en de in het paper zelf vermelde beperkingen. Elke beoordeling gaat vergezeld van een korte motivering, zichtbaar op de studiepagina via "Hoe is dit beoordeeld."

Beoordelingen weerspiegelen redactioneel oordeel, niet een formele GRADE-beoordelingsprocedure zoals in Cochrane-reviews. Het schema is bewust vereenvoudigd: vier niveaus zijn voldoende om aan te geven hoe stellig clinici en onderzoekers een bevinding moeten toepassen, zonder een precisie te suggereren die het redactionele proces niet heeft.

Correcties en suggesties welkom

Als u meent dat een studie onjuist is beoordeeld, of een studie ontbreekt die zou moeten worden opgenomen, stuur dan een bericht naar hello@withvr.app. Het schema is bedoeld om transparant en corrigeerbaar te zijn.

Verder lezen

GRADE working group: de internationale samenwerking die de methodologie heeft ontwikkeld waarop dit schema is gebaseerd.
GRADE: an emerging consensus on rating quality of evidence (Guyatt et al., BMJ 2008): het funderende paper.
Begrippenlijst van de Evidence Hub: definities van verwante termen (niveaus van bewijs, risk of bias, PEDro, PICO).

Bekend met onderzoek dat hier thuishoort? Als een peer-reviewed studie over VR in spraak, stem, gehoor of communicatiewerk hier ontbreekt, stuur dan de referentie naar hello@withvr.app.