Cómo se valoran los estudios

Cada estudio del Evidence Hub lleva una valoración de certeza. Esta página explica qué significan las valoraciones, cómo se deciden y el estado honesto de la evidencia sobre RV en habla, voz y comunicación.

Las valoraciones utilizan un esquema simplificado de cuatro niveles (Alta, Moderada, Baja, Muy baja) inspirado en el grupo de trabajo GRADE. La valoración refleja con cuánta confianza pueden aplicarse los hallazgos del estudio, no la calidad de las personas autoras ni de su trabajo. Una valoración Muy baja no significa que el estudio sea malo; a menudo significa que el estudio es un piloto o una serie de casos, que es justo lo que se quiere en las primeras etapas de un campo.

Distribución actual

Alta 9 estudios

Moderada 40 estudios

Baja 39 estudios

Muy baja 23 estudios

Qué significa cada valoración

Certeza alta

Mucha confianza en que el efecto verdadero se sitúa cerca de la estimación. Esperable cuando múltiples ensayos controlados aleatorizados de alta calidad convergen, en distintos centros y grupos de investigación, con un riesgo mínimo de sesgo, inconsistencia o evidencia indirecta. Un solo estudio rara vez alcanza por sí mismo el nivel Alto; la excepción es un ensayo amplio, multicéntrico y con bajo riesgo de sesgo; de lo contrario, Alta refleja un cuerpo de evidencia, no un único artículo.

Certeza moderada

Confianza razonable en el efecto estimado; el efecto verdadero probablemente se sitúa cerca, aunque podría diferir de forma plausible. Habitual en RCT únicos bien diseñados con muestras adecuadas, y en revisiones sistemáticas de estudios primarios heterogéneos.

Certeza baja

Confianza limitada. El efecto verdadero puede ser sustancialmente distinto de la estimación. Habitual en RCT con muestras pequeñas, diseños cuasi-experimentales y estudios cualitativos: todos aportan conocimiento real, pero por sí solos no pueden sostener conclusiones firmes.

Certeza muy baja

Muy poca confianza en cualquier estimación del efecto. Aquí se sitúan los estudios de caso, los pilotos pequeños y los artículos narrativos o conceptuales. Estos estudios siguen teniendo valor: establecen viabilidad, plantean preguntas y sientan las bases del trabajo controlado posterior, pero no constituyen evidencia de efecto.

De dónde provienen las valoraciones Altas

De los 111 estudios que hay actualmente en el hub, 9 (8%) reciben una valoración Alta. La certeza Alta casi siempre refleja un cuerpo de evidencia convergente, más que un único artículo, por lo que la mayoría de estos son revisiones sistemáticas y metaanálisis que agrupan hallazgos de muchos estudios. Un solo estudio primario alcanza el nivel Alta solo como excepción poco frecuente: un ensayo amplio, multicéntrico y con bajo riesgo de sesgo; de lo contrario, lo máximo que obtiene aquí un estudio aislado es Moderada.

Por eso la distribución se sitúa donde se sitúa: 8% Alta, 36% Moderada, 35% Baja y 21% Muy baja. La RV en habla, voz y comunicación es todavía un campo de investigación joven, por lo que la mayor parte de la evidencia se compone de estudios pequeños, tempranos y de un solo centro: justo lo que cabría esperar, y justo aquello sobre lo que se construyen los ensayos controlados y las revisiones posteriores. Una distribución honesta como esta es más útil, y más fiable, que unas valoraciones infladas que resultarían más agradables a la vista.

Qué hace falta para alcanzar el nivel Alta

Para una pregunta clínica concreta, una valoración Alta necesita un cuerpo convergente de evidencia de alta calidad, por lo general:

Una revisión Cochrane o una revisión sistemática equivalente de varios RCT de alta calidad en un área dentro del alcance (RV para tartamudez, voz, afasia, deglución, comunicación social) con efectos consistentes entre estudios.
Metaanálisis que sinteticen varios RCT preregistrados con tamaños muestrales adecuados, heterogeneidad mínima y hallazgos que converjan en dirección y magnitud.
Múltiples RCT multicéntricos de gran tamaño (n > 200 por brazo) que repliquen un efecto específico de la práctica basada en RV sobre un resultado de comunicación que importe a las personas usuarias.

Para la mayoría de las afirmaciones clínicas concretas en RV en logopedia, esta profundidad de evidencia aún se está construyendo. Una pregunta que converge de forma sostenida es si las audiencias virtuales producen respuestas comunicativas comparables a las reales, a medida que nuevos trabajos replican hallazgos previos: una revisión sistemática formal de esa pregunta sería bienvenida.

Cómo se deciden las valoraciones

La valoración de cada estudio la asigna editorialmente withVR, basándose en el diseño del artículo (RCT / cuasi-experimental / caso / revisión), el tamaño muestral, la población y las propias limitaciones declaradas en el artículo. Cada valoración va acompañada de una breve justificación, visible en la página del estudio al desplegar "Cómo se valoró este estudio".

Las valoraciones reflejan un juicio editorial, no un proceso formal de evaluación GRADE como el que se utiliza en las revisiones Cochrane. El esquema se simplifica a propósito: cuatro niveles bastan para señalar con cuánta confianza el personal clínico e investigador debería aplicar un hallazgo, sin sugerir una precisión que el proceso editorial no tiene.

Correcciones y sugerencias bienvenidas

Si crees que un estudio se ha valorado de forma incorrecta, o que falta un estudio que merecería estar incluido, escribe a hello@withvr.app. El esquema pretende ser transparente y corregible.

Lecturas recomendadas

Grupo de trabajo GRADE: la colaboración internacional que desarrolló la metodología en la que se inspira este esquema.
GRADE: an emerging consensus on rating quality of evidence (Guyatt et al., BMJ 2008): el artículo fundacional.
Glosario del Evidence Hub: definiciones de términos relacionados (niveles de evidencia, riesgo de sesgo, PEDro, PICO).

¿Conoces investigación que debería estar aquí? Si un estudio revisado por pares sobre RV en habla, voz, audición o comunicación no figura en la lista, envía la referencia a hello@withvr.app.