Como os estudos são classificados
As classificações usam um esquema simplificado de quatro níveis (Alta, Moderada, Baixa, Muito Baixa) informado pelo GRADE working group. A classificação reflete a confiança com que os resultados do estudo podem ser aplicados, e não a qualidade dos autores ou do seu trabalho. Uma classificação de Muito Baixa não significa que o estudo seja mau; significa, frequentemente, que se trata de um estudo piloto ou de uma série de casos, exatamente aquilo que se quer ter numa fase inicial de uma área.
Distribuição atual
O que significa cada classificação
Certeza alta
Confiança elevada de que o efeito real está próximo da estimativa. Esperada para resultados em que vários ensaios clínicos aleatorizados de elevada qualidade convergem, em diferentes locais e grupos de investigação, com risco mínimo de enviesamento, inconsistência ou indireção. Um único estudo raramente atinge isoladamente a classificação de Alta; a exceção é um ensaio de grande dimensão, multicêntrico e com baixo risco de enviesamento; de outro modo, Alta reflete um corpo de evidência, e não um só artigo.
Certeza moderada
Confiança razoável no efeito estimado; o efeito real está provavelmente próximo, mas pode plausivelmente diferir. Típica de RCTs únicos bem desenhados com amostras adequadas e de revisões sistemáticas de estudos primários heterogéneos.
Certeza baixa
Confiança limitada. O efeito real pode ser substancialmente diferente da estimativa. Comum em RCTs de pequena dimensão amostral, desenhos quase-experimentais e estudos qualitativos, todos os quais contribuem com conhecimento real, mas que, isoladamente, não permitem conclusões firmes.
Certeza muito baixa
Muito pouca confiança em qualquer estimativa de efeito. Estudos de caso, pequenos pilotos e artigos narrativos ou conceptuais situam-se aqui. Estes estudos continuam a ser valiosos: estabelecem viabilidade, levantam questões e sustentam trabalho controlado posterior, mas não são evidência de efeito.
De onde vêm as classificações Alta
Dos 111 estudos atualmente no hub, 9 (8%) estão classificados como Alta. A certeza Alta reflete quase sempre um corpo de evidência convergente, e não um único artigo, pelo que a maioria destes são revisões sistemáticas e meta-análises que agregam resultados de muitos estudos. Um único estudo primário só atinge a classificação de Alta como exceção rara; um ensaio de grande dimensão, multicêntrico e com baixo risco de enviesamento; de outro modo, o máximo que um estudo autónomo alcança aqui é Moderada.
É por isso que a distribuição se situa onde se situa: 8% Alta, 36% Moderada, 35% Baixa e 21% Muito Baixa. A RV no trabalho com fala, voz e comunicação é ainda uma área de investigação jovem, pelo que a maior parte da evidência é composta por estudos pequenos, iniciais e de um único local, exatamente o que seria de esperar e exatamente aquilo sobre o qual se constroem os ensaios controlados e as revisões posteriores. Uma distribuição honesta como esta é mais útil, e mais fiável, do que classificações inflacionadas que seriam mais agradáveis aos olhos.
O que é preciso para atingir Alta
Para uma questão clínica específica, uma classificação Alta exige um corpo de evidência convergente e de elevada qualidade, normalmente:
- Uma revisão Cochrane ou revisão sistemática equivalente de vários RCTs de elevada qualidade numa área no âmbito do hub (RV para gaguez, voz, afasia, deglutição, comunicação social) com efeitos consistentes entre estudos.
- Meta-análises que sintetizem vários RCTs pré-registados, com tamanhos de amostra adequados, heterogeneidade mínima e resultados que convirjam em direção e magnitude.
- Vários RCTs multicêntricos de grande dimensão (n > 200 por braço) que repliquem um efeito específico da prática baseada em RV sobre um resultado de comunicação que importe aos clientes.
Para a maioria das alegações clínicas específicas na terapia da fala com RV, esta profundidade de evidência ainda está em construção. Uma questão que está a convergir de forma constante é a de saber se as audiências virtuais produzem respostas comunicativas comparáveis às reais, à medida que novos trabalhos replicam resultados anteriores; uma revisão sistemática formal dessa questão seria bem-vinda.
Como as classificações são decididas
A classificação de cada estudo é atribuída editorialmente pela withVR, tendo em conta o desenho do estudo (RCT / quase-experimental / caso / revisão), o tamanho da amostra, a população e as próprias limitações declaradas pelo artigo. Cada classificação é acompanhada de uma justificação curta, visível na página do estudo ao expandir «Como esta classificação foi decidida».
As classificações refletem juízo editorial, e não um processo formal de avaliação GRADE como o utilizado nas revisões Cochrane. O esquema é deliberadamente simplificado: quatro níveis bastam para sinalizar a confiança com que clínicos e investigadores devem aplicar um resultado, sem implicar uma precisão que o processo editorial não tem.
Correções e sugestões são bem-vindas
Se considera que um estudo foi mal classificado, ou que ficou em falta um estudo que justifique inclusão, envie uma mensagem para hello@withvr.app. O esquema é pensado para ser transparente e corrigível.
Leituras adicionais
- GRADE working group - a colaboração internacional que desenvolveu a metodologia em que este esquema se baseia.
- GRADE: an emerging consensus on rating quality of evidence (Guyatt et al., BMJ 2008) - o artigo fundador.
- Glossário do Evidence Hub - definições de termos relacionados (níveis de evidência, risco de enviesamento, PEDro, PICO).
Conhece investigação que devesse estar aqui? Se um estudo revisto por pares sobre RV no trabalho com fala, voz, audição ou comunicação não estiver listado, envie a referência para hello@withvr.app.