Diagnostic performance of digital mammography in breast cancer screening

2009
MEDICINA PREVENTIVA Y SALUD PÚBLICA, OBSTETRICIA Y GINECOLOGÍA, ONCOLOGÍA MÉDICA, RADIODIAGNÓSTICO
TEC. SANITARIA. EXCLU. MED.
INFORMES DE EVALUACIÓN
+ Año
2009
+ Áreas de Conocimiento
MEDICINA PREVENTIVA Y SALUD PÚBLICA, OBSTETRICIA Y GINECOLOGÍA, ONCOLOGÍA MÉDICA, RADIODIAGNÓSTICO
+ Tipo Tecnología
TEC. SANITARIA. EXCLU. MED.
+ Línea de Producción
INFORMES DE EVALUACIÓN
Con el objetivo de revisar la evidencia científica disponible acerca del rendimiento diagnóstico de la mamografía digital (MD) comparada con la mamografía analógica o convencional (MC) en el cribado de cáncer de mama, se realizó una revisión sistemática de la literatura. Los autores concluyeron que no se han encontrado diferencias importantes entre la MD y la MC en términos de sensibilidad, tasa de detección de cáncer y valor predictivo positivo. Los resultados sobre la especificidad, porcentaje de carcinomas in situ, tasa de rellamadas y porcentaje de biopsias no puede concluirse que haya una clara ventaja de un tipo de mamografía sobre otro. Por último, no se han encontrado datos sobre posibles diferencias en términos de mortalidad y otros resultados de salud.
ANTECEDENTES
El cáncer de mama constituye uno de los problemas de salud más importantes para las mujeres de los países industrializados, debido a su alta incidencia, a su mortalidad y a la repercusión personal y social que comporta. Hasta el momento, no se dispone de estrategias eficaces para la prevención primaria del cáncer de mama, siendo la prevención secundaria, mediante la detección precoz del cáncer de mama y el tratamiento adecuado, el instrumento fundamental para el control de la enfermedad hoy día. Durante más de tres décadas, la prueba utilizada en el cribado del cáncer de mama ha sido la mamografía analógica o convencional, pero en los últimos años ha surgido como alternativa la mamografía digital de campo completo. Este informe se plantea por el interés que tiene revisar el conocimiento sobre las ventajas y limitaciones de las nuevas alternativas de pruebas de cribado del cáncer de mama.

OBJETIVOS
El objetivo principal es revisar la evidencia científica disponible acerca del rendimiento diagnóstico de la mamografía digital (MD) comparada con la mamografía analógica o convencional (MC) en el cribado de cáncer de mama.
A partir de la bibliografía hallada en la revisión para dar respuesta al objetivo principal, se planteó el objetivo secundario de revisar la evidencia sobre la comparación de MD y MC en términos de resultados en salud.

METODOLOGÍA
Se ha realizado una revisión sistemática de la literatura. Se partió de una revisión sistemática previa que cubría la literatura publicada hasta 2005 y se recuperaron los artículos originales incluidos en ella. Posteriormente se realizó una búsqueda que cubrió el periodo 2005-2007 en las bases referenciales MEDLINE, PRE-MEDLINE y EMBASE. Se han explorado también otras fuentes como Cochrane Library Plus, Centre for Reviews and Dissemination, International Network of Agencies for Health Technolo gy Assessment, National Guidelines Clearinghouse, ECRI Institute, Sumsearch y Tripdatabase.
Los principales criterios de inclusión de artículos fueron: población (mujeres adultas asintomáticas), intervención y comparación (cribado de cáncer de mama con MD versus con MC) y medidas de resultados (cualquier parámetro relacionado con el rendimiento diagnóstico, resultados intermedios – como la tasa de rellamadas- o resultados finales –como mortalidad-).
Tanto la evaluación crítica de los artículos originales seleccionados como la extracción de resultados se realizó por dos evaluadoras de manera independiente, resolviéndose las discrepancias por consenso. Para evaluar la calidad se utilizó la herramienta QUADAS y se clasificaron los estudios según la validez del diseño y la existencia de seguimiento.
La síntesis de resultados se realizó de forma cualitativa.
A partir de la revisión se consideró la oportunidad de explorar los aspectos económicos relacionados con las dos alternativas. Para no distorsionar los objetivos del informe, todo lo relativo a esta aproximación econó- mica se encuentra detallado en el Anexo I.

RESULTADOS
A partir de la revisión sistemática hallada en la búsqueda preliminar se incluyeron 6 artículos originales. En la búsqueda definitiva (período 2005- 2007) se obtuvieron 271 referencias, quedando por tanto un cómputo final de 277 documentos. Tras eliminar duplicados y hacer una selección por lectura de título y resumen, quedaron 24 artículos. Una vez leídos a texto completo, se desecharon 13 por no cumplir los criterios de inclusión y quedaron finalmente 11 artículos originales (que procedían de 6 estudios).
Todos los estudios encontrados se centraron en la valoración del rendimiento diagnóstico de las mamografías y resultados intermedios del cribado. Para graduar la importancia de los resultados finales según la calidad de los estudios, éstos se han clasificado en tres grupos según la validez del diseño (comparabilidad de los grupos y existencia de seguimiento tras el cribado), ya que la herramienta QUADAS no discriminó mucho en este caso (todos los estudios estaban en un rango entre 7 y 9 respuestas afirmativas de las 14 preguntas de QUADAS).
Comparación del rendimiento diagnóstico de MD y MC en los estudios con mayor validez (cohortes comparables y seguimiento):
En este grupo se incluyeron resultados de 3 estudios: un ensayo clínico con asignación aleatoria (Oslo II, con 23.929 mujeres) y dos estudios de cohorte única (a cada mujer se le hacía una MC y una MD: Estudios Oslo I – 3.683 mujeres- y DMIST -49.258 mujeres-). La sensibilidad de la MD fue superior a la de la MC en el único ensayo clínico, no hallándose diferencias estadísticamente significativas en los dos estudios de cohorte única con seguimiento. Asimismo, no se encontraron diferencias entre MD y MC en la tasa de detección de cánceres de intervalo, en la tasa de falsos negativos ni en el valor predictivo negativo.
En dos de los estudios, la especificidad de la MD fue menor que la de la MC y la tasa de falsos positivos fue mayor con la MD que con la MC, no hallándose diferencias en el tercer estudio (a pesar de ser el de mayor muestra). Los distintos resultados sobre especificidad podrían relacionarse con la distinta forma de interpretar las mamografías y con el contexto de los estudios (programas poblacionales en los dos con menor especificidad de la MD y cribado oportunista en el estudio que no halló diferencias).
Sólo el estudio de cribado oportunista dio resultados de rendimiento diagnóstico tras el seguimiento desagregados por edad y otras variables. En las mujeres menores de 50 años, perimenopaúsicas y con mamas densas, la MD tuvo mayor área bajo la curva ROC y sensibilidad que la MC; y no hubo diferencias en especificidad y valor predictivo positivo.
Comparación del rendimiento diagnóstico de MD y MC en las publicaciones que no incluyen datos de seguimiento tras el cribado:
Los dos estudios Oslo (I y II) aportaron también resultados del cribado sin tener en cuenta el seguimiento. Además, hay un estudio de cohorte única (con 4.489 mujeres) y dos estudios con cohortes elegidas de forma separada – una cribada con MD y otra con MC- (con 343.002 y 28.770 mujeres) que aportaron datos de rendimiento diagnóstico de tipo transversal. Todos estos estudios coinciden en que la tasa de detección de cáncer de mama en una ronda de cribado no es significativamente diferente cuando se usa MD o MC.
Sólo dos de los estudios aportaron datos sobre el porcentaje de carcinomas in situ, presentando resultados discordantes: uno no halló diferencias entre MD y MC y otro encontró un mayor porcentaje con MD.
De los cinco estudios que aportaron datos sobre el valor predictivo positivo, los tres con un diseño de mayor validez (grupos comparables) y uno de los estudios con cohortes separadas concluyeron que no había diferencias entre MD y MC. Sólo un estudio con cohortes separadas encontró mayor valor predictivo positivo con la MD.
Comparación de la MD y MC en términos de otros resultados:
No se han encontrado estudios que aporten datos de comparación entre la MD y la MC en términos de mortalidad u otros resultados en salud.
Los resultados sobre la tasa de rellamadas tras una mamografía de cribado fueron divergentes entre los distintos estudios. Los estudios más estrictos en la lectura de las mamografías no encontraron diferencias entre MD y MC, excepto en el subgrupo de mujeres de 50-69 años del único ensayo clínico, donde la tasa de rellamadas fue mayor con la MD. En el resto de estudios los resultados fueron opuestos: mayor tasa de rellamadas con MD (1 estudio) y con MC (1 estudio).
El porcentaje de biopsias se estudió en dos trabajos de cohorte única, siendo diferentes los resultados entre ellos: el estudio de mayor puntuación en la escala de validez no encontró diferencias entre MD y MC, mientras que el de menor validez encontró mayor tasa de biopsias con MC.

CONCLUSIONES
No se han encontrado diferencias importantes entre la MD y la MC en términos de sensibilidad, tasa de detección de cáncer y valor predictivo positivo, independientemente de la validez del diseño. Los resultados sobre la especificidad, porcentaje de carcinomas in situ, tasa de rellamadas y porcentaje de biopsias presentan mayores discrepancias entre los estudios, por lo que no puede concluirse que haya una clara ventaja de un tipo de mamografía sobre otro. Por último, no se han encontrado datos sobre posibles diferencias de la MD y la MC en términos de mortalidad y otros resultados de salud.
BACKGROUND
Breast cancer is one of the main health problems for Western countries’ women due to its high incidence and mortality, and to the personal and social impact that it entails. Up to the moment, there are no effective strategies available for the primary prevention of breast cancer. For this reason, secondary prevention by early detecting breast cancer and delivering appropriate treatment is the main tool to control the disease nowadays. For more than three decades, the test employed to screen breast cancer has been analogical mammography. However, full field digital mammography has emerged as an alternative in the last few years. The present report has been drawn up due to the increasing interest in assessing the evidence on the advantages and limitations of new technologies for breast cancer screening.

OBJECTIVES
The main objective of the present report is to review the scientific evidence available on the diagnostic performance of digital mammography (DM) as compared to analogical or traditional mammography (TM) in breast cancer screening.
From the bibliography found in the review to approach the main objective, it was posed a secondary objective: to assess the scientific evidence on the comparison between screening with DM and TM in terms of health outcomes.

METHODS
A systematic review of the scientific literature was carried out. It was started from a previous systematic review covering the literature published up to 2005; and the original papers included in it were retrieved. Afterwards a search was run on the reference bases MEDLINE, PRE-MEDLINE and EMBASE. Other sources that have been explored are the following: Cochrane Library Plus, Centre for Reviews and Dissemination, INAHTA, National Guidelines Clearinghouse, ECRI Institute, Sumsearch and Tripdatabase.
The main inclusion criteria of the papers were: population (asymptomatic adult women), intervention and comparison (breast cancer screening with DM vs. with TM) and outcome measures (any parameter related to the diagnostic performance, intermediate results -like recall rate-, or final outcome –as mortality).
Critical assessment of the selected original papers and data extraction were conducted by two assessors separately; and the disagreements were solved by consensus. To evaluate the quality, QUADAS tool was used. The studies were classified depending on the validity of the design and the existence of follow-up.
The data were summarised qualitatively.

RESULTS
Six original papers were obtained from the systematic review found in the preliminary search. In the definite search (period 2005-2007), 271 additional references were retrieved. After duplicates had been discarded and inclusion criteria were applied to all papers by means of reading the titles and abstracts, 24 documents remained. Once they were fully read, 13 were discarded as they did not meet the inclusion criteria, remaining 11 original papers. These 11 papers reported results from 6 studies.
All the studies found were focused on assessing the diagnostic performance of the mammographies and intermediate outcomes of screening. The studies were clasified according to the design’s validity (comparability of the groups and existence of follow-up after screening), since QUADAS tool did not discriminate much in this case (all the studies were in a range between 7 and 9 positive answers of the 14 questions of QUADAS). Results are reported separately for each group of studies.
Comparison of DM and TM in terms of diagnostic performance, based on the most valid studies (with comparable cohorts and follow-up after screening):
In this group, there were included results from 3 studies: a randomised clinical trial (Oslo II, with 23.929 women) and two single-cohort studies (each woman received a TM and a DM: Oslo I – 3.683 women- and DMIST -49.258 women). The sensitivity of DM was higher to that of TM in the randomised clinical trial, but no statistically significant differences were found in the two single-cohort studies with follow-up. Likewise no differences between DM and TM were found in terms of interval cancer detection rate, false-negative rate or negative predictive value.
In two of the studies the specificity of DM was lower than that of TM and the false-positive rate was higher with DM. However, no differences between both types of mammographies were found in the third study (despite it was the one with the highest sample size). These differences between the studies in terms of the results on specificity could be related to different forms of interpreting the mammographies and to the studies’ context (population programmes in the two studies which showed lower specificity of DM and opportunistic screening in the study that did not find any difference between mammographies).
Only one of the studies with follow-up data (DMIST, based on opportunistic screening of breast cancer) reported results segmented by age and other variables. In women aged less than 50, who were perimenopausal or had dense breasts, DM showed a bigger area under the ROC curve and a higher sensitivity than TM; and there were no differences in specificity and positive predictive value.
Comparison of DM and TM in terms of diagnostic performance, based on the papers that do not include follow-up data after screening:
The two Oslo studies (I and II) also provided results from the screening without taking into account the follow-up. Moreover there were a singlecohort study (with 4.489 women) and two double-cohort studies – cohorts selected separately: one of them was screened with DM and the other with TM - (with 343.002 and 28.770 women) that provided data on diagnostic performance without follow-up after screening. All these studies show that the rate of breast cancer in a screening round is not significantly different when either DM or TM is used.
Only two of the studies provided data on the percentage of carcinomas in situ, but results were different between them: one did not find differences between DM and TM, and the other one reported higher percentage with DM.
Of the five studies that provided data on positive predictive value, the three considered to have high validity (with comparable groups) and another one (with two separate cohorts) concluded that there were no differences between DM and TM. Just one study with separate cohorts reported higher positive predictive value with DM.
Comparison between DM and TM in terms of other outcomes:
No studies were found that provided comparison data between DM and TM in terms of either mortality or any other health outcomes.
The results on the comparison of DM and TM in terms of recall rate after a screening mammography were divergent among the studies. The strictest studies in the reading of the mammographies did not find differences between DM and TM, except for the subgroup of women aged 50-69 in the only one clinical trial (higher recall rate after DM). In the rest of studies, the results were different: the highest recall rate was after DM in one study and after TM in another one.
The percentage of biopsies was reported in two single-cohort studies. The results were different among them: the study that obtained a higher score in the validity scale (QUADAS) did not find differences between DM and TM while the one with lower validity found a higher biopsy rate after TM.

CONCLUSIONS
No important differences were found between DM and TM in terms of sensitivity, cancer detection rate and positive predictive value, regardless of the design’s validity. The results on specificity, percentage of carcinomas in situ, recall rate and percentage of biopsies showed greater discrepancies among the studies. Therefore, it cannot be concluded that there is a clear advantage of a type of mammography over the other one. Finally, there was not found data about the comparison of screening with DM and TM in terms of mortality and other health outcomes.
AETSA 2007-09 MamografiaDigital (943.2 KiB, 28 downloads)