Effectiveness of computer-aided diagnosis applied to breast cancer screening. Systematic review. Short report.

2013
MEDICINA PREVENTIVA Y SALUD PÚBLICA, OBSTETRICIA Y GINECOLOGÍA, RADIODIAGNÓSTICO
TEC. SANITARIA. EXCLU. MED.
INFORMES DE EVALUACIÓN
+ Año
2013
+ Áreas de Conocimiento
MEDICINA PREVENTIVA Y SALUD PÚBLICA, OBSTETRICIA Y GINECOLOGÍA, RADIODIAGNÓSTICO
+ Tipo Tecnología
TEC. SANITARIA. EXCLU. MED.
+ Línea de Producción
INFORMES DE EVALUACIÓN
Con el objetivo de conocer la eficacia en términos de validez y precisión diagnóstica del Diagnóstico Asistido por Ordenador (DAO) como herramienta de apoyo en el cribado de cáncer de mama en comparación con la lectura convencional, se realizó una revisión sistemática. Los trabajos fueron divididos en función del tipo de intervención (DAO aislado o DAO más lectura simple). El DAO más lectura mostró elevada sensibilidad y especificad. El DAO aislado mostró una mayor sensibilidad pero una especificidad heterogénea. No se analizó la precisión en ningún estudio y la valoración económica resultó ser incierta.
Antecedentes
El programa de cribado de cáncer de mama se puso en marcha en España en 1990 y la mamografía es la prueba de elección. La lectura e interpretación de estas imágenes difiere según las Comunidades Autónomas ya que en algunas se hace mediante lectura simple y en otras se aplica una doble lectura. El diagnóstico asistido por ordenador (DAO) aplicado al cribado de cáncer de mama como herramienta de apoyo al radiólogo está siendo explorado como futura metodología como sustitución de uno de los radiólogos.

Objetivos
Conocer la eficacia en términos de validez y precisión diagnóstica del DAO como herramienta de apoyo en el cribado de cáncer de mama en comparación con la lectura convencional.

Fuentes de información
Se consultaron las bases de datos referenciales MedLine, EMBASE y Web of Science. También se consultaron fuentes de información a texto completo: Red Internacional de Agencias de Evaluación de Tecnologías (INAHTA) a través de la base de datos del Center for Reviews and Dissemination (CRD), The Cochrane Library, y en la plataforma de Agencias y Unidades de Evaluación de Tecnologías Sanitarias españolas (AUnETS). También se contempló The Emergency Care Research Institute (ECRI).

Criterios de selección
Se seleccionaron revisiones sistemáticas y estudios primarios de pruebas diagnósticas que incluyeran mujeres pertenecientes a un programa de cribado en el que se hubiera aplicado el DAO como prueba de estudio. Sólo se consideraron aquellos trabajos en los que se recogieran resultados sobre validez diagnóstica y precisión. El límite temporal (desde noviembre de 2011 hasta abril de 2013) se estableció teniendo en cuenta la fecha de cierre de búsqueda de la revisión sistemática seleccionada como de mayor calidad y que fue tomada de referencia para su actualización (Azevedo et al 201229).

Extracción y recogida de los datos
La extracción de la información procedente de los trabajos seleccionados fue realizada por un solo revisor y la evaluación de la calidad por pares. El análisis crítico y el nivel de evidencia se establecieron en base a lo descrito por el Scottish Intercollegiate Guidelines Network (SIGN). Se realizó una síntesis cualitativa de los resultados.

Resultados
Se recuperaron 963 referencias tras eliminar duplicados, de las que se seleccionaron 4 revisiones sistemáticas, 1 informe de tecnologías sanitarias y 4 estudios originales. Todos los autores mostraron la validez diagnóstica del DAO en términos de sensibilidad. No fue así con la especificidad. La precisión no fue contemplada en ningún trabajo. Los trabajos fueron divididos en función del tipo de intervención (DAO aislado o DAO más lectura simple). De las cuatro revisiones sistemáticas recuperadas, sólo dos fueron de alta calidad, mostrando sensibilidades del DAO más la lectura simple entre 86 % y 87 %, con especificidades entre 88 % y 96 %. Los estudios originales recuperados con el mismo tipo de intervención mostraron un amplio rango en la sensibilidad, con valores entre 79 % y 97 %. Noble et al. 200931 obtuvieron un aumento en la tasa de rellamada del 4,1 % (IC 95 %: 2,7-6,3), con una proporción de falsos positivos de 80 de cada 100.000 mujeres cribadas al emplear el DAO como herramienta de apoyo a la lectura mamográfica simple.
En cuanto al DAO utilizado de forma aislada, la sensibilidad osciló entre el 48,7 y el 100, mientras la especificidad fue del 95 %.

Limitaciones
Estos resultados deben ser valorados con cautela puesto que la calidad de los trabajos fue entre moderada y baja, a excepción de las dos revisiones sistemáticas que registraron una alta calidad a pesar de que los originales que las compusieron fueron de calidad moderada y baja.

Conclusiones
Las revisiones sistemáticas de mejor calidad (nivel de evidencia 1++) obtuvieron resultados de validez diagnóstica para el DAO más lectura simple entre 86 % y 87 % para la sensibilidad y 93 % para la especificidad. DAO aislado mostró una sensibilidad entre 94 % y 100 % y especificidad entre 42 % y 95 % en la mayoría de los trabajos. La evaluación económica resultó ser incierta. Ningún trabajo contempló la eficacia de la prueba en términos de precisión.
Background
The screening program for breast cancer was launched in Spain in 1990 and mammography is the test of choice. The reading and interpretation of these images differs by regions where it can be done by single or double reading. The computer-aided diagnosis (CAD) applied to breast cancer screening as a tool to support the radiologist is being explored as a future one radiologist replacement methodology.

Objectives
Knowing the efficiency in terms of validity and diagnostic accuracy of CAD as a support tool in screening for breast cancer compared to conventional reading.

Sources of information
Were consulted reference databases Medline, EMBASE and Web of Science. It was also consulted some full text information sources: International Network of Agencies for Health Technology Assessment (INAHTA), Centre for Reviews and Dissemination (CRD), The Cochrane Library, and the platform of Agencies and Units of Spanish Health Technology Assessment (AUnETS). It has been also contemplated The Emergency Care Research Institute (ECRI).

Selection criteria
Systematic reviews and primary studies of diagnostic tests that included women from a breast screening program with CAD were selected. We only considered those papers which had results on diagnostic validity and accuracy. The deadline (from November 2011 to April 2013) was established taking into account the higher quality systematic review (Azevedo et al. 201229).

Extraction and data collection
The extraction of information was performed by a single reviewer. Quality assessment was done by peers. The critical analysis and the level of evidence were established on the basis described by the Scottish Intercollegiate Guidelines Network (SIGN). It was performed a qualitative synthesis of the results.

Results
963 references were retrieved after eliminating all the duplicates. Finally, there were selected four systematic reviews, one health technology report and four original studies. All authors showed the diagnostic validity of CAD in terms of sensitivity. Not so with specificity. The accuracy was not referred in any paper. All papers were divided according to the type of intervention (the use of CAD isolated or the use of CAD with simple reading). Only two of four systematic reviews were of high quality, showing sensitivities CAD with simple reading between 86 % and 87 %, and specificities between 88 % and 96 %. The original studies retrieved with the same type of intervention showed a wide range in sensitivity, with values between 79 % and 97 %. Noble et al. 200931 obtained an increase in recall rate of 4.1 % (95 % CI 2.7 to 6.3), with a false positive rate of 80 per 100,000 women screened by using the CAD as a tool to support mammographic reading simple.
Regarding the isolated CAD, sensitivity ranged was from 48,7 % to 100 %, while the specificity was 95 %.

Limitations
These results should be interpreted with caution because the quality of the work was moderate to low, with the exception of two systematic reviews that reported a high quality even though the original papers which composed them were of moderate and low quality.

Conclusions
Systematic reviews of best quality (evidence level 1++) obtained a CAD diagnostic accuracy between 86% and 87% for sensitivity and 93% for specificity. Isolated CAD showed a sensitivity of 94% and 100%, and specificity between 42% and 95%. Economic evaluation was uncertain. None studies looked at the effectiveness of the test in terms of accuracy.
AETSA 2013 4 Diag Asist (758.1 KiB, 91 downloads)