Como os estudos são classificados
As classificações usam um esquema simplificado de quatro níveis (Alta, Moderada, Baixa, Muito Baixa) informado pelo GRADE working group. A classificação reflete a confiança com que os resultados do estudo podem ser aplicados, e não a qualidade dos autores ou do seu trabalho. Uma classificação de Muito Baixa não significa que o estudo seja mau; significa, frequentemente, que se trata de um estudo piloto ou de uma série de casos, exatamente aquilo que se quer ter numa fase inicial de uma área.
Distribuição atual
O que significa cada classificação
Certeza alta
Confiança elevada de que o efeito real está próximo da estimativa. Esperada para resultados em que vários ensaios clínicos aleatorizados de elevada qualidade convergem, em diferentes locais e grupos de investigação, com risco mínimo de enviesamento, inconsistência ou indireção. Um único estudo nunca atinge isoladamente a classificação de Alta; Alta é uma propriedade de um corpo de evidência, e não de um só artigo.
Certeza moderada
Confiança razoável no efeito estimado; o efeito real está provavelmente próximo, mas pode plausivelmente diferir. Típica de RCTs únicos bem desenhados com amostras adequadas e de revisões sistemáticas de estudos primários heterogéneos.
Certeza baixa
Confiança limitada. O efeito real pode ser substancialmente diferente da estimativa. Comum em RCTs de pequena dimensão amostral, desenhos quase-experimentais e estudos qualitativos, todos os quais contribuem com conhecimento real, mas que, isoladamente, não permitem conclusões firmes.
Certeza muito baixa
Muito pouca confiança em qualquer estimativa de efeito. Estudos de caso, pequenos pilotos e artigos narrativos ou conceptuais situam-se aqui. Estes estudos continuam a ser valiosos: estabelecem viabilidade, levantam questões e sustentam trabalho controlado posterior, mas não são evidência de efeito.
Por que motivo nenhum estudo está atualmente classificado como Alta
Esta é a resposta honesta: a RV em terapia da fala é uma área de investigação ainda jovem. Para que uma alegação atinja a certeza Alta, a literatura tem normalmente de incluir vários RCTs de elevada qualidade, idealmente pré-registados e multicêntricos, a convergir no mesmo resultado. Na maioria das questões abordadas pelo Evidence Hub, este corpo de evidência ainda não existe.
Os candidatos mais fortes atualmente no hub são RCTs únicos em áreas adjacentes: ansiedade social (Anderson 2013), autismo (Ip 2018), gaguez (Cream 2010), zumbidos (Malinvaud 2016). Todos se situam em Moderada. Cada um é um bom estudo; nenhum, isoladamente, tem peso suficiente para elevar uma alegação a Alta sem replicação.
A ausência de classificações Alta neste hub não é uma falha do hub. Reflete o estado da área. Uma distribuição de classificações que leia "0% Alta / ~20% Moderada / ~35% Baixa / ~45% Muito Baixa" é o que se esperaria de uma área de investigação jovem avaliada com rigor. Classificações inflacionadas seriam mais agradáveis aos olhos e muito menos honestas.
O que poderia justificar uma classificação Alta
Futuras adições ao hub que poderiam atingir o nível Alta incluem:
- Uma revisão Cochrane ou revisão sistemática equivalente de vários RCTs de elevada qualidade numa área no âmbito do hub (RV para gaguez, voz, afasia, deglutição, comunicação social) com efeitos consistentes entre estudos.
- Meta-análises que sintetizem 5 ou mais RCTs pré-registados, com tamanhos de amostra adequados, heterogeneidade mínima e resultados que convirjam em direção e magnitude.
- Vários RCTs multicêntricos de grande dimensão (n > 200 por braço) que repliquem um efeito específico da prática baseada em RV sobre um resultado de comunicação que importe aos clientes.
Realisticamente, este nível de evidência está a vários anos de distância para a maioria das alegações em RV na terapia da fala. Um candidato plausível a uma promoção precoce a Alta é a validade das audiências virtuais para produzir respostas comunicativas comparáveis às de audiências reais; a evidência aqui está a convergir de forma constante à medida que novos trabalhos replicam resultados anteriores. Uma revisão sistemática formal desta questão específica seria bem-vinda.
Como as classificações são decididas
A classificação de cada estudo é atribuída editorialmente pela withVR, tendo em conta o desenho do estudo (RCT / quase-experimental / caso / revisão), o tamanho da amostra, a população e as próprias limitações declaradas pelo artigo. Cada classificação é acompanhada de uma justificação curta, visível na página do estudo ao expandir "Como esta classificação foi decidida".
As classificações refletem juízo editorial, e não um processo formal de avaliação GRADE como o utilizado nas revisões Cochrane. O esquema é deliberadamente simplificado: quatro níveis bastam para sinalizar a confiança com que clínicos e investigadores devem aplicar um resultado, sem implicar uma precisão que o processo editorial não tem.
Correções e sugestões são bem-vindas
Se considera que um estudo foi mal classificado, ou que ficou em falta um estudo que justifique inclusão, envie uma mensagem para hello@withvr.app. O esquema é pensado para ser transparente e corrigível.
Leituras adicionais
- GRADE working group - a colaboração internacional que desenvolveu a metodologia em que este esquema se baseia.
- GRADE: an emerging consensus on rating quality of evidence (Guyatt et al., BMJ 2008) - o artigo fundador.
- Glossário do Evidence Hub - definições de termos relacionados (níveis de evidência, risco de enviesamento, PEDro, PICO).
Conhece investigação que devesse estar aqui? Se um estudo revisto por pares sobre RV no trabalho com fala, voz, audição ou comunicação não estiver listado, envie a referência para hello@withvr.app.