|
1. Concepto
La revisión
sistemática de la literatura científica (RSEC)
es una metodología que permite conocer de la forma más
objetiva posible, por una parte, que un procedimiento determinado -ya
sea preventivo, diagnóstico, terapéutico o de rehabilitación-
ha demostrado científicamente tener un efecto positivo sobre
el curso de la enfermedad a la que se aplica -es decir, su eficacia-
y, por otra, el riesgo para la persona -o para la población-
que puede tener ese procedimiento -es decir, su perfil de seguridad-.
Además de la eficacia y de la seguridad, también se puede
conocer su efectividad, es decir el efecto de un determinado procedimiento
en la práctica médica habitual y no solamente en las
condiciones ideales determinadas por los estudios controlados y aleatorizados.
Asimismo, otros aspectos tan o más importantes que los relacionados
con el efecto del procedimiento, como su eficiencia o su equidad, también
pueden ser estudiados mediante la RSEC. El objetivo último de
la RSEC es pues informar los procesos de decisión en sanidad
con el propósito de contribuir a la mejora de la calidad de
la atención sanitaria.
Lo que se quiere revisar sistemáticamente es todo aquel conjunto
de conocimientos científicos que han aparecido, que se han hecho
públicos, que se han manifestado a la comunidad, en relación
con el procedimiento o técnica objeto de estudio.
Sin subterfugios lingüísticos, el propósito de la
RSEC es revisar sistemáticamente toda la evidencia científica
con relación a un determinado tema de salud, ya sea condición
clínica, tecnología o binomio tecnología-condición
clínica. Además, según lo que se va a detallar
a continuación, este método tiene la propiedad de ser
explícito, puesto que se detalla el proceso metodológico
de cómo se ha llegado a las conclusiones de la RSEC, precisamente
para que pueda ser replicado, o bien, criticado.
2. Métodos
La RSEC consta de seis fases o etapas (Tabla 1):
1) búsqueda de la evidencia científica.
2) clasificación de esta evidencia científica.
3) presentación de la misma.
4) síntesis.
5) integración.
6) elaboración de conclusiones y recomendaciones.
En un
séptimo paso es preciso incluir la diseminación
de las conclusiones y recomendaciones para que la RSEC
pueda cumplir el objetivo para el cual se llevó a
cabo: es decir, mejorar la calidad del proceso de atención
sanitaria. Además, la diseminación de las
conclusiones y recomendaciones debe servir también
para que éstas puedan ser reproducidas (como corresponde
a todo proceso científico) y, por lo tanto, confirmar
la validez de los resultados; o bien, para que puedan ser
cuestionadas corrigiendo errores o aportando conocimiento
nuevo. En este sentido, hay que decir que una vez se han
emitido unas recomendaciones, a través de una RSEC,
estas no perduran estables en el tiempo. Por lo tanto,
la caducidad de los resultados, por el avance constante
del conocimiento, es una de las limitaciones de la RSEC
y que encuentran su solución en la actualización
periódica. La ventaja es que para actualizar la
revisión solamente hay que hacerlo a partir del
año en que unas conclusiones de la RSEC se hacen
públicas y no repitiendo todo el proceso de revisión
desde el inicio.
Empecemos no obstante, por el principio. La primera fase
de la RSEC es la búsqueda de la evidencia científica, que puede
ser directa o indirecta. La evidencia científica directa se
refiere a los resultados de los estudios científicos específicos
que han sido diseñados con el mismo objetivo que el específico
de la RSEC que se quiere realizar -por ejemplo, el estudio de la eficacia
de un determinado fármaco-. El término evidencia científica
indirecta hace referencia a la información que proviene de los
registros de las bases de datos clínicos, administrativos, epidemiológicos
o económicos y que han sido recogidos con un propósito
diferente a la RSEC que se quiere llevar a cabo. Para la búsqueda
de la evidencia directa se acude a las diversas bases de datos bibliográficos
y a la literatura gris con tal de localizar todos los estudios científicos
referidos a un procedimiento en concreto o a un problema sanitario.
Una vez identificados los estudios científicos hay que proceder
a su cribado según la calidad científica, es decir, la
clasificación de los niveles
de evidencia científica. Los criterios que determinan
esta calidad provienen del campo de la epidemiología y tienen
en cuenta, sobre todo, el diseño del estudio. En este sentido,
las escalas de la clasificación de la evidencia científica
(Tabla 2) son instrumentos genéricos que constituyen una herramienta
para ayudar a esta clasificación según la calidad y que
tienen por objetivo garantizar la validez interna del estudio. Existen
varias tablas que proponen niveles de evidencia científica,
publicadas en la literatura internacional, Fundación Ostomía,
se inclina a utilizar una de las más sofisticadas, elaborada
por Jovell y cols., además en el contexto hispano.
TABLA
1
Etapas de una revisión sistemática de la evidencia científica
(RSEC)
 |
| Fases
de una RSEC enumeradas cronológicamente |
 |
 |
| 1.Búsqueda
de la evidencia científica |
| |
directa:
estrategia de búsqueda bibliográfica |
| |
indirecta:
estrategia de búsqueda de datos locales |
| 2.Clasificación
de la evidencia científica |
| |
Instrumento
genérico: escalas de evaluación de la evidencia
científica |
| |
Instrumento
especifico: calidad de los estudios individuales |
| 3.Presentación
de la evidencia científica: tablas o matrices
de evidencia |
| 4.Síntesis
de la evidencia científica: metaanálisis |
| 5.Integración
de la evidencia científica directa e indirecta |
| |
Análisis
de idoneidad |
| |
Análisis
de decisiones |
| |
Análisis
económica |
| |
Análisis
de políticas sanitarias
Análisis
del impacto social |
| 6.Elaboración
de recomendaciones basadas en la evidencia científica |
| |
Práctica
profesional |
| |
Políticas
de salud pública |
| |
Guías
de práctica clínica |
| |
Protocolos clínicos |
 |
| Jovell
AJ. La evaluación de tecnologías sanitarias
en la Atención Primaria. MEDIFAM 1999- 9:102-109 |
TABLA
2
Escala de evaluación de la evidencia científica de la Agencia
d'Avaluació de Tecnología Medica (AATM)
 |
| Niveles |
Calidad
EC |
Tipo
de diseño del estudio |
Condiciones
de rigor científico* |
 |
| I |
Buena |
Metaanálisis
de estudios controlados y aleatorizados |
Análisis
de datos de pacientes individuales Metaregresión
Diferentes técnicas de análisis Ausencia
de heterogeneidad Calidad de los estudios |
| II |
|
Estudios
controlados y aelatorizados de muestra grande |
Evaluación
del poder estadístico Multicéntrico Calidad
del estudio |
| III* |
Buena |
Estudios
controlados y aleatorizados de muestra pequeña |
Avaluació del
poder estadístic Calidad del estudio Multicéntrico |
| IV |
Regular |
Estudis
prospectius controlats no aleatoritzats |
Evaluación
del poder estadístico Multicéntrico Calidad
del estudio |
| V |
Regular |
Estudios
prospectivos controlados no aleatorizados |
Controles
históricos |
| VI* |
Regular |
Estudios
de cohorte Estudios caso-control |
Calidad
del estudio Multicéntrico |
| VII* |
|
|
Apareamiento |
| VIII |
Baja |
Series
clínicas no controladas: Estudios descriptivos:
seguimiento de la enfermedad, |
|
| IX |
|
vigilancia
epídemiológica, registros, bases de datosComités
de expertos, conferencias de consenso Anécdotas
o casos |
|
 |
| Abreviaturas:
EC evidencia científica. |
| * Calidad
del estudio evaluado mediante protocolos especies
y condiciones de rigor científico |
| Jovell
AJ, Navarro-Rubio MD. Evaluación de la evidencia
científica. Med Clin (Barc) 1995;105:740-3. |
Lo que determina principalmente la validez de un estudio y,
por lo tanto, que los resultados sean relevantes para poderlos
considerar en la
mejora de la atención sanitaria, es su diseño. Es por
esta razón que las escalas existentes permiten hacer juicios
de valor según la validez interna del diseño. Complementando
estos instrumentos genéricos, existen los instrumentos específicos
que analizan las condiciones de rigor metodológico en función
de las características de los estudios de un mismo diseño.
En el caso de los estudios controlados y aleatorizados, la escala
de Jadad constituye un ejemplo; en el caso de los estudios para la
evaluación de la pruebas diagnósticas, los criterios
de Irwig son otro ejemplo. Sin embargo, en algunas ocasiones hay
quien considera fundamental el tipo de diseño sin entrar mucho
en otros aspectos de rigor metodológico, ya sean relacionados
con el propio diseño, o bien con el análisis de los
datos. Por eso, de las escalas de evaluación de la evidencia
científica publicadas, se presenta en este capítulo
la que se ha considerado más completa, ya que utiliza para
la clasificación no sólo el tipo de diseño,
sino también otros criterios de rigor metodológico.
No obstante, esta disciplina -como otras-, está en continuo
avance y esta clasificación, una vez que todo el mundo se
haya familiarizado, y los estudios sean cada vez más rigurosos
en su metodología, podrá mejorarse en su nivel de precisión.
Hay que considerar también, que en estas escalas se tiene en cuenta
sobre todo la validez interna del estudio, es decir la homogeneidad de
las condiciones de diseño y población de estudio, pero
también se ha de valorar la validez externa o capacidad de generalizar
los resulta dos fuera de la población de estudio. A pesar de todo,
debe decirse que es condición necesaria, aunque no suficiente,
valorar la validez interna de un estudio científico y, como tal,
esta es la primera que debe examinarse para la evaluación
de la calidad de un estudio.
Una vez seleccionados los estudios en función de su validez interna,
deben presentarse de una forma clara y concisa aquellos que son de igual
diseño, por ejemplo mediante tablas o matrices de evidencia, resaltando
aquellos aspectos más relevantes de la metodología y de
los resultados de los diferentes estudios. El objetivo es identificar
si la posible variabilidad en los resultados entre estudios individuales
es debida a la naturaleza del procedimiento sanitario estudiado, a las
características de la población de estudio, o bien a las
diferencias en las características del diseño. A veces,
lo que se puede observar en estas tablas de evidencia es que estudios
de la misma calidad produzcan resultados en diferentes direcciones -positivas
versus negativas-. En estos casos, pero no sólo en éstos,
resulta útil combinarlos para obtener una medida global cuantitativa
que resuma los diferentes resultados del efecto de la intervención
sobre una determinada condición clínica. Éste es,
precisamente, el propósito de la cuarta fase de la RSEC, la síntesis,
que aplica una técnica diseñada para la obtención
de estas medidas globales que combina resultados de diferentes
estudios; es el denominado metaanálisis.
Una vez el efecto de un determinado procedimiento o intervención
ha sido valorado en condiciones de estudios científicos sobre
determinadas poblaciones diana (fases 1 a 4), otros aspectos tan o más
importantes que la eficacia y la efectividad tienen que ser tomados en
consideración. Así, en la quinta fase de la RSEC habrá que
integrar toda la evidencia científica revisada y sintetizada en
las anteriores mediante diseños propios de las ciencias sociales.
Es en este punto donde entran en juego técnicas como el análisis
coste-efectividad, el análisis de decisiones, el análisis ético,
o el análisis de las aplicaciones legales o del impacto social.
Estas técnicas permiten contextualizar los resultados obtenidos
en la sociedad o contexto sanitario donde se van a formular las recomendaciones.
Dependiendo del tema que se esté estudiando, interesar integrar
los resultados para que puedan ser aplicados a una situación clínica
específica o a una región concreta, de España o
Iberoamérica, por ejemplo, otras veces se tratará de adaptar
la intervención o programa a un nivel de atención sanitaria
concreto, como podría ser la atención primaria.
Finalmente, las cinco fases descritas son las que guían la decisión
y permiten elaborar las conclusiones y recomendaciones -fase 6 de la
RSEC- sobre si es necesario o no aplicar el tratamiento, la estrategia
preventiva o cubrir o no una determinada prestación en la población
de referencia. Estas recomendaciones estarán expresadas en función
del grado de evidencia científica que se ha identificado y analizado
en la RSEC (Tabla 3). Así, cuando la calidad de la evidencia científica
es buena, se concluirá que existe adecuada evidencia científica
para recomendar (o desaconsejar) la adopción de una determinada
intervención, fármaco o estrategia de prevención.
Y, en el otro extremo, si la calidad de la evidencia científica
es baja, los resultados no podrán ser concluyentes y, por lo tanto,
se afirmará que existe insuficiente evidencia científica
para recomendar (o desaconsejar) la adopción de lo que haya sido
objeto de análisis mediante la RSEC. Estas recomendaciones, que
siempre deberán explicar en qué grado de evidencia científica
se basan, pueden ser válidas para la práctica profesional,
constituir guías de práctica clínica o recomendaciones
para las políticas de salud pública, dependiendo
del tema que haya sido objeto de la RSEC.
TABLA
3
Elaboración de recomendaciones basadas en la evidencia científica
 |
| Calidad
de la EC |
Diseños |
Magnitud
de las recomendaciones |
 |
| Buena |
Metaanálisis
de estudios controlados y aleatorizados Estudio
controlado y aleatorizado de muestra grande
Estudio
controlado y aleatorizado de muestra pequeña
(enfermedad poco prevalente) |
Existe
adecuada evidencia científica para recomendar (desaconsejar)
la adopción |
| Regular |
Estudio
controlado y aleatorizado de muestra pequeña (enfermedad
prevalente)
Estudios de cohortes
Estudios caso-control Ensayo clínico no aleatorizado |
Existe
cierta evidencia científica para recomendar (desaconsejar)
su adopción |
| Mala |
Series
clínicas
Estudios transversales
Conferencias de consenso
Comités de expertos
Anécdotas (a propósito de un caso) |
Existe
insuficiente evidencia científica para recomendar (o
desaconsejar) su adopción |
 |
Existe
insuficiente evidencia científica para recomendar
(o desaconsejar) su adopción |
| Abreviaturas:EC
= evidencia científica |
Jovell
AJ. La evaluación de tecnologías sanitarias
en la Atención Primaria. MEDIFAM 1999; 9:102-109 |
|
Para
concluir este apartado de metodología sólo
añadir que el concepto de RSEC da lugar a dos tipos
de interpretaciones complementarias. Por una parte, algunos
autores restringen el concepto de RSEC a los resultados de
los estudios controlados y aleatorizados y a su síntesis
cuantitativa mediante metaanálisis, mientras que,
por otra parte, tiene cabida una interpretación más
amplia. Esta última es la definida en este capítulo
e incluye, como se ha podido ver, otro tipo de diseños
epidemiológicos, junto con la utilización de
técnicas que proceden de las ciencias sociales, como
el análisis económico o el análisis
de políticas sanitarias.
3. Aplicaciones
Después de haber detallado la metodología de las RSEC,
el objetivo de lo que se describe a continuación es el de describir
todas aquellas fases de la revisión sistemática ya mencionadas
mediante ejemplos de proyectos de evaluación específicos.
Cabe decir que la metodología presentada debe adaptarse a situaciones
concretas de evaluación según el tipo de problema o incertidumbre
que se pretenda analizar.
En primer lugar hemos descrito la fase de búsqueda de evidencia
científica. Para poder conseguir una parte considerable de los
objetivos de cualquier proyecto de evaluación, la consulta de
la evidencia directa -ya sean investigaciones primarias o las revisiones
de éstas- es imprescindible. Sin entrar en detalles en la estrategia
de búsqueda es preciso destacar que para responder a preguntas
de investigación muy concretas o específicas como las planteadas
sobre la eficacia y seguridad, por ejemplo, del tratamiento con agentes
trombolíticos en el tromboembolismo pulmonar establecido o en
el accidente vascular cerebral isquémico agudo o sobre la eficacia
y seguridad del desfibrilador automático implantable versus otras
alternativas terapéuticas, se diseñaron estrategias de
búsqueda que, a diferencia de las anteriores, se orientaron a
seleccionar evidencia directa pero exclusivamente dirigida a identificar
estudios del nivel II - III de la escala de evidencia descrita en este
capítulo (Tabla 2), es decir, ensayos clínicos controlados
y aleatorizados con un tamaño de muestra grande y pequeño
respectivamente.
A veces, los objetivos planteados, requieren la complementariedad
de evidencia científica indirecta procedente de otras fuentes de
información de menor calidad o validez. Por ejemplo, la escasa
literatura médica publicada o disponible sobre la aplicación
del láser transmiocárdico, puede plantear la necesidad
de complementarla con los datos transmitidos por registros de actividad
hospitalarios sobre los resultados de los enfermos sometidos a revascularización
con este procedimiento. Otros ejemplos de esta complementariedad son
las consultas al Conjunto Mínimo Básico de Datos (CMBD).
El CMBD, disponible en todas las comunidades españolas y en algunos
países iberoamericanos, incluye datos administrativos y clínicos
de todas las altas hospitalarias.
Cuando en la búsqueda de información no se ha podido identificar
suficiente evidencia científica, tanto en relación a la
cantidad como a su calidad, existe la opción de diseñar
investigaciones específicas, complementarias a las anteriores. La siguiente fase es la presentación de la evidencia científica.
La exhaustividad en esta presentación dependerá de los
objetivos definidos en los estudios. En la Tabla 4 se puede apreciar
un ejemplo de tabla de evidencia de algunos de los estudios observacionales
de tipo caso-control publicados en la literatura médica sobre
la inactividad física como factor de riesgo de futuras fracturas
de cadera en adultos, medidas mediante la disminución de la masa ósea.
Los resultados de esta tabla de evidencia indican la presencia de diferencias
en las características del diseño que podría explicar
las diferencias observadas en los resultados de los estudios. El tipo
de comparación usada al analizar el factor de riesgo, la mayor
proporción de mujeres, una mayor edad media y los factores de
ajuste utilizados podrían explicar las variaciones observadas
en el efecto de la inactividad física sobre la fractura
de la cadera.
Después de la presentación de los resultados, la siguiente
fase es la clasificación de la evidencia científica según
la calidad del diseño.
En ocasiones , el hecho de que el procedimiento o intervención
evaluada se encuentre en las primeras etapas de aplicación clínica
reduce las posibilidades de esta clasificación a un solo nivel
ya que sólo existen series clínicas (nivel VIII,
baja calidad).
TABLA
4
Tabla de evidencia de estudios caso-control sobre la inactividad física
como posible factor de riesgo de fractura de cadera en adultos
 |
| Estudio y año |
Tamaño muestra (casos) |
Edad
|
Sexo
|
Tipo
de comparación
|
RR/OR
(95% IC) factores de ajuste
|
 |
| Cooper
C, et al.,1988 |
240
|
>50
|
Hombres
y mujeres |
Actividades
productivas como trabajos de la casa o el jardin (1-2
vs. 5) |
3,3
(1,9-5,7) BMI, tabaco, alcohol, AVC y corticoides |
| Michel
BA, et al, 1993 |
227
|
54±0,4
|
879
mujeres y 231 hombres |
Actividad
(por disminución de 1 hora/dia) |
1,05(1,00-1,10)
diagnóstico de osteoporosis, duración tratamiento corticoide,
incapacidad, sexo y duración de la enfermedad |
| Coupland
C, et al.,1993 |
197
|
>50
|
85,3%
mujeres |
Tareas
productivas/ trabajos de casa (1 -4 horas vs.>4 horas
7semana) |
2,0
(0,6-6,6) edad, sexo, IMC, tabaco, alcohol, dependencia
para las actividades diarias |
| Cumning
RG, et al, 1994 |
209
|
>65
|
Hombres
y mujeres |
Actividad
física deportiva (a los 20 años, ninguna vs. actividad
mediana) |
0,83
(0,5-1,43) edad y sexo |
| Jaglal
S, 1995 |
331
|
55-80
|
Mujeres |
Actividad
en el tiempo libre (inactiva vs. muy activa) |
2,44(1,43
4,17) |
| Johnell O,
et al, 1995 |
2.086
|
78,1±9,4
|
Mujeres |
Actividad
física y recreativa a cualquier edad (no vs. sí) |
1,32
(1,44 1,52) centro, edad y IMC |
 |
Por otra parte, al tratarse de clasificar estudios que analicen
pruebas diagnósticas, se pone de manifiesto una limitación de esta
escala. En aplicaciones de este tipo, donde los resultados de las pruebas
diagnosticas, normalmente se comparan con estándares de referencia,
los estudios observacionales como el de cohortes o el de caso-control
representan los mejores diseños a considerar. Así pues,
se deberá considerar que, en determinadas ocasiones, sólo
se pueden encontrar estudios situados en un determinado nivel de la escala
de la evidencia científica. Sin embargo, el nivel máximo
de la calidad lograda no depende de la evidencia científica existente
sino del objetivo de la RSEC. Es decir, que en ocasiones la calidad de
la evidencia científica disponible sea de bajo nivel no permitirá obtener
conclusiones sobre su adopción basadas en un adecuado nivel de
evidencia científica. 0 lo que es lo mismo, se requerirán
estudios de buena calidad según criterios de validez interna para
poder emitir recomendaciones basadas en la evidencia científica.
Por contra, en el caso de las pruebas diagnósticas, dado que el
objetivo de éstas no permite el diseño de un estudio controlado
y aleatorio (niveles I - II), los estudios del nivel siguiente (III)
ya permitirán concluir que existe adecuada evidencia científica
para recomendarlas si los valores de sensibilidad y especificidad
son aceptables y, sobre todo, si los valores predictivos son los
adecuados.
No obstante, ya se ha comentado que, en determinadas evaluaciones,
como en las que se estudian pruebas diagnósticas o factores de riesgo,
los estudios controlados y aleatorizados no son el diseño estándar
de elección y, sin embargo, también es necesaria la obtención
de una medida global cuantitativa que sintetice los resultados de los
estudios existentes. En este sentido y teniendo en cuenta sus limitaciones,
también se han realizado metaanálisis de estudios
observacionales que han permitido llegar a medidas globales de
sensibilidad y especificidad.
Este
informe ha sido mínimamente adaptado a partir de :
Aymerich M., Estrada MD, Jovell AJ. Revisión Sistemática
de la Evidencia Científica. En Evidencia Científica
y Toma de Decisiones en Sanidad. Monografías Médiques
de lÁcademia de Ciéncies Médiques de
Catalunya i de Balears. Ed: Jovell y Aymerich. Barceloma
1999, 93-105.
|