Hoe studies worden beoordeeld
Beoordelingen gebruiken een vereenvoudigd schema met vier niveaus (Hoog, Matig, Laag, Zeer laag) dat is gebaseerd op de GRADE working group. De beoordeling weerspiegelt hoe stellig de bevindingen van een studie kunnen worden toegepast, niet de kwaliteit van de auteurs of hun werk. Een score Zeer laag betekent niet dat de studie slecht is; het betekent vaak dat de studie een pilot of case series is, wat precies is wat je vroeg in een vakgebied wilt zien.
Huidige verdeling
Wat elke beoordeling betekent
Hoge zekerheid
Zeer veel vertrouwen dat het werkelijke effect dicht bij de schatting ligt. Verwacht voor bevindingen waar meerdere hoogwaardige gerandomiseerde gecontroleerde trials op verschillende locaties en uit verschillende onderzoeksgroepen samenkomen, met minimaal risico op bias, inconsistentie of indirectheid. Een enkele studie haalt op zichzelf nooit Hoog; Hoog is een eigenschap van een bewijsverzameling, niet van een afzonderlijk paper.
Matige zekerheid
Redelijk veel vertrouwen in het geschatte effect; het werkelijke effect ligt waarschijnlijk dichtbij maar kan plausibel afwijken. Typisch voor goed opgezette afzonderlijke RCT\'s met voldoende steekproef, en voor systematische reviews van heterogene primaire studies.
Lage zekerheid
Beperkt vertrouwen. Het werkelijke effect kan substantieel afwijken van de schatting. Gebruikelijk voor RCT\'s met kleine steekproeven, quasi-experimentele opzetten en kwalitatieve studies; deze leveren reele kennis op, maar kunnen op zichzelf geen stevige conclusies dragen.
Zeer lage zekerheid
Zeer weinig vertrouwen in welke effectschatting dan ook. Casussen, kleine pilots en narratieve of conceptuele papers vallen hieronder. Deze studies zijn nog steeds waardevol; ze tonen haalbaarheid aan, brengen vragen naar boven en vormen de basis voor later gecontroleerd werk, maar ze zijn geen bewijs van effect.
Waarom op dit moment geen studies als Hoog worden beoordeeld
Dit is het eerlijke antwoord: VR in logopedie is een jong onderzoeksveld. Voordat een claim Hoge zekerheid bereikt, vereist de literatuur doorgaans meerdere hoogwaardige RCT\'s, idealiter pre-registered en multi-site, die op dezelfde bevinding uitkomen. Voor de meeste vragen die de Evidence Hub behandelt, bestaat deze bewijsverzameling nog niet.
De sterkste kandidaten in de hub op dit moment zijn afzonderlijke RCT\'s in aangrenzende gebieden: sociale angst (Anderson 2013), autisme (Ip 2018), stotteren (Cream 2010), tinnitus (Malinvaud 2016). Allemaal staan ze op Matig. Elk is een goede studie; geen enkele weegt op zichzelf zwaar genoeg om een claim zonder replicatie naar Hoog te tillen.
De afwezigheid van Hoog-beoordelingen in deze hub is geen lacune van de hub. Het weerspiegelt waar het veld staat. Een verdeling die "0% Hoog / ~20% Matig / ~35% Laag / ~45% Zeer laag" leest, is wat je zou verwachten voor een streng beoordeeld jong onderzoeksgebied. Opgeklopte beoordelingen zouden prettiger ogen en veel minder eerlijk zijn.
Wat een Hoog-beoordeling zou rechtvaardigen
Toekomstige toevoegingen aan de hub die mogelijk Hoog kunnen halen:
- Een Cochrane-review of een vergelijkbare systematische review van meerdere hoogwaardige RCT\'s in een passend gebied (VR voor stotteren, stemwerk, afasie, slikken, sociale communicatie) met consistente effecten over studies heen.
- Meta-analyses die 5 of meer pre-registered RCT\'s synthetiseren met voldoende steekproefomvang, minimale heterogeniteit en bevindingen die in richting en omvang samenvallen.
- Meerdere grote multi-site RCT\'s (n > 200 per arm) die een specifiek effect repliceren van VR-gebaseerde oefening op een communicatie-uitkomst die voor clienten van belang is.
Realistisch gezien is dit niveau van bewijs voor de meeste claims in VR-logopedie nog jaren weg. Een plausibele kandidaat voor vroege opwaardering naar Hoog is de validiteit van virtuele publieken voor het opwekken van vergelijkbare communicatieve reacties als bij echte publieken; het bewijs hier komt gestaag samen naarmate nieuw werk eerdere bevindingen repliceert. Een formele systematische review van deze specifieke vraag zou welkom zijn.
Hoe beoordelingen worden bepaald
De beoordeling van elke studie wordt redactioneel toegekend door withVR, op basis van het ontwerp van het paper (RCT, quasi-experimenteel, casus, review), de steekproefomvang, de populatie en de in het paper zelf vermelde beperkingen. Elke beoordeling gaat vergezeld van een korte motivering, zichtbaar op de studiepagina via "Hoe is dit beoordeeld."
Beoordelingen weerspiegelen redactioneel oordeel, niet een formele GRADE-beoordelingsprocedure zoals in Cochrane-reviews. Het schema is bewust vereenvoudigd: vier niveaus zijn voldoende om aan te geven hoe stellig clinici en onderzoekers een bevinding moeten toepassen, zonder een precisie te suggereren die het redactionele proces niet heeft.
Correcties en suggesties welkom
Als u meent dat een studie onjuist is beoordeeld, of een studie ontbreekt die zou moeten worden opgenomen, stuur dan een bericht naar hello@withvr.app. Het schema is bedoeld om transparant en corrigeerbaar te zijn.
Verder lezen
- GRADE working group: de internationale samenwerking die de methodologie heeft ontwikkeld waarop dit schema is gebaseerd.
- GRADE: an emerging consensus on rating quality of evidence (Guyatt et al., BMJ 2008): het funderende paper.
- Begrippenlijst van de Evidence Hub: definities van verwante termen (niveaus van bewijs, risk of bias, PEDro, PICO).
Bekend met onderzoek dat hier thuishoort? Als een peer-reviewed studie over VR in spraak, stem, gehoor of communicatiewerk hier ontbreekt, stuur dan de referentie naar hello@withvr.app.