Scolaris Content Display Scolaris Content Display

Estrategias de seguimiento para pacientes que reciben tratamiento para el cáncer colorrectal no metastásico

Contraer todo Desplegar todo

Antecedentes

Ésta es la cuarta actualización de una revisión Cochrane publicada por primera vez en 2002 y actualizada por última vez en 2016.
El seguimiento de los pacientes con cáncer colorrectal durante varios años después de la cirugía radical o el tratamiento adyuvante, o ambos, constituye una práctica clínica común. A pesar de esta práctica extendida, existen considerables controversias acerca de cuál es la frecuencia con la que deben verse los pacientes, qué pruebas deben realizarse y si estas diferentes estrategias conllevan algún impacto importante sobre los resultados de los pacientes.

Objetivos

Evaluar el efecto de los programas de seguimiento (seguimiento versus ningún seguimiento, estrategias de seguimiento de intensidad variable y seguimiento en diferentes contextos de asistencia sanitaria) sobre la supervivencia general en los pacientes con cáncer colorrectal tratado con intención curativa. Las variables de evaluación secundarias incluyen la supervivencia libre de recidiva, la cirugía de rescate, las recidivas de intervalo, la calidad de vida y los efectos perjudiciales y los costes de la vigilancia y las investigaciones.

Métodos de búsqueda

Para esta actualización, el 5 de abril de 2019 se hicieron búsquedas en CENTRAL, MEDLINE, Embase, CINAHL y el Science Citation Index. También se hicieron búsquedas en listas de referencias de artículos, y se realizaron búsquedas manuales en Proceedings of the American Society for Radiation Oncology. Además, se realizaron búsquedas en los siguientes registros de ensayos: ClinicalTrials.gov y la World Health Organization International Clinical Trials Registry Platform. Se contactó con los autores de los estudios. No se aplicaron restricciones de idioma ni de publicación a las estrategias de búsqueda.

Criterios de selección

Solo se incluyeron los ensayos controlados aleatorios que comparaban diferentes estrategias de seguimiento para los pacientes con cáncer colorrectal no metastásico tratados con intención curativa.

Obtención y análisis de los datos

Se utilizaron los procedimientos metodológicos estándar previstos por Cochrane. Dos autores de la revisión, de forma independiente, determinaron la elegibilidad de los estudios, realizaron la extracción de datos y evaluaron el riesgo de sesgo y la calidad metodológica. Se utilizaron los criterios GRADE para evaluar la calidad de la evidencia.

Resultados principales

Se identificaron 19 estudios, que incorporaron a 13 216 participantes (se incluyeron cuatro estudios nuevos en esta segunda actualización). Dieciséis de los 19 estudios fueron elegibles para la síntesis cuantitativa. Aunque los estudios variaron en cuanto al contexto (seguimiento realizado por el médico general [MG], por el personal de enfermería o por el cirujano) y la "intensidad" del seguimiento, hubo muy poca inconsistencia entre los resultados.

Supervivencia general: se encontró que el seguimiento intensivo dio lugar a poca o ninguna diferencia (cociente de riesgos instantáneos [CRI] 0,91; intervalo de confianza [IC] del 95%: 0,80 a 1,04): I² = 18%; evidencia de calidad alta). Hubo 1453 muertes entre 12 528 participantes en 15 estudios. En términos absolutos, el efecto promedio del seguimiento intensivo sobre la supervivencia general fue de 24 muertes menos por cada 1000 pacientes, aunque el verdadero efecto podría estar entre 60 menos y 9 más por cada 1000 pacientes.

Supervivencia específica del cáncer colorrectal: se encontró que el seguimiento intensivo probablemente dio lugar a poca o ninguna diferencia (CRI 0,93; IC del 95%: 0,81 a 1,07): I² = 0%; evidencia de calidad moderada). Hubo 925 muertes debido al cáncer colorrectal en 11 771 participantes incorporados en 11 estudios. En términos absolutos, el efecto promedio del seguimiento intensivo sobre la supervivencia específica del cáncer colorrectal fue de 15 muertes menos causadas por el cáncer colorrectal por cada 1000 pacientes, aunque el verdadero efecto podría estar entre 47 menos y 12 más por cada 1000 pacientes.

Supervivencia sin recidiva: se encontró que el seguimiento intensivo dio lugar a poca o ninguna diferencia (CRI 1,05; IC del 95%: 0,92 a 1,21; I² = 41%; evidencia de calidad alta). Hubo 2254 casos de recidiva entre 8047 participantes incorporados en 16 estudios. El efecto promedio del seguimiento intensivo sobre la supervivencia sin recidiva fue de 17 recidivas más por cada 1000 pacientes, aunque el verdadero efecto podría estar entre 30 menos y 66 más por cada 1000 pacientes.

Cirugía de rescate con intención curativa: la misma fue más frecuente con el seguimiento intensivo (cociente de riesgos [CR] 1,98; IC del 95%: 1,53 a 2,56; I² = 31%; evidencia de calidad alta). Hubo 457 episodios de cirugía de rescate en 5157 participantes reclutados en 13 estudios. En términos absolutos, el efecto del seguimiento intensivo sobre la cirugía de rescate fue de 60 episodios más de cirugía de rescate por cada 1000 pacientes, aunque el verdadero efecto podría estar entre 33 y 96 episodios más por cada 1000 pacientes.

Recidivas de intervalos (sintomáticas): fueron menos frecuentes con el seguimiento intensivo (CR 0,59; IC del 95%: 0,41 a 0,86; I² = 66%; evidencia de calidad moderada). Se informaron 376 recidivas de intervalo en 3933 participantes incorporados en siete estudios. El seguimiento intensivo se asoció con menos recidivas de intervalo (52 menos por 1000 pacientes); el efecto verdadero está entre 18 y 75 menos por 1000 pacientes.

El seguimiento intensivo probablemente logra poca o ninguna diferencia en la calidad de vida, la ansiedad o la depresión (informado en 7 estudios; evidencia de calidad moderada). Los datos no estaban disponibles en una forma que permitiera el análisis.

El seguimiento intensivo puede aumentar las complicaciones (perforación o hemorragia) de las colonoscopias (OR 7,30; IC del 95%: 0,75 a 70,69; un estudio, 326 participantes; evidencia de calidad muy baja). Dos estudios informaron siete complicaciones colonoscópicas en 2292 colonoscopias, tres perforaciones y cuatro hemorragias gastrointestinales que requirieron transfusión. No fue posible combinar los datos, debido a que no fueron informados por el brazo del estudio en un estudio.

Los datos limitados sobre los costes sugieren que el coste del seguimiento más intensivo puede aumentar en comparación con un seguimiento menos intensivo (evidencia de calidad baja). Los datos no estaban disponibles en una forma que permitiera el análisis.

Conclusiones de los autores

Los resultados de esta revisión indican que no existe un beneficio en la supervivencia general al intensificar el seguimiento de los pacientes después de la cirugía curativa para el cáncer colorrectal. Aunque más participantes fueron tratados con cirugía de rescate con intención curativa en los grupos de seguimiento intensivo, este hecho no se asoció con una mejoría en la supervivencia. Los efectos perjudiciales relacionados con el seguimiento intensivo y el tratamiento de rescate no se informaron de manera adecuada.

PICO

Population
Intervention
Comparison
Outcome

El uso y la enseñanza del modelo PICO están muy extendidos en el ámbito de la atención sanitaria basada en la evidencia para formular preguntas y estrategias de búsqueda y para caracterizar estudios o metanálisis clínicos. PICO son las siglas en inglés de cuatro posibles componentes de una pregunta de investigación: paciente, población o problema; intervención; comparación; desenlace (outcome).

Para saber más sobre el uso del modelo PICO, puede consultar el Manual Cochrane.

Estrategias de seguimiento para pacientes que reciben tratamiento para el cáncer colorrectal no metastásico

¿Cuál es el problema?

El cáncer colorrectal afecta a una de cada 20 personas en países de ingresos altos. La mayoría de los pacientes (cerca de dos tercios) tienen una enfermedad curable. El seguimiento después de la resección quirúrgica +/‐ quimioterapia por lo general conlleva visitas al médico, así como la realización de algunos exámenes. Muchos pacientes creen que el seguimiento salva vidas, pero no existe certeza acerca de con qué frecuencia el paciente debe ver al médico y qué pruebas se debe realizar ni cuándo.

¿Por qué es esto importante?

El seguimiento es costoso, puede hacer que los pacientes se pongan ansiosos alrededor del momento de la visita y puede ser molesto. Las pruebas son costosas y pueden tener efectos secundarios. Si las pruebas encuentran que el cáncer ha reaparecido en un paciente que siente bien, pero el tratamiento no lo puede curar, es posible que el hallazgo del cáncer recurrente no ayude a ese paciente ni a su familia.

La pregunta fue la siguiente.

Si el seguimiento (es decir, las pruebas y las visitas al médico) después de que el cáncer colorrectal ha sido tratado de manera curativa es útil. Se examinaron los diferentes tipos de seguimiento: algunos versus ninguno; más exámenes versus menos exámenes; y el seguimiento realizado por cirujanos, médicos generales (MG) o profesionales de enfermería.

Los hallazgos fueron los siguientes.

Se encontraron 19 estudios con 13 216 participantes. Los resultados se presentan junto con un juicio de calidad que representa la certeza acerca de los resultados. Se encontró que el seguimiento no mejoró la supervivencia general (evidencia de calidad alta), la supervivencia específica del cáncer colorrectal (evidencia de calidad moderada) ni la supervivencia libre de recidiva (evidencia de calidad alta). Si a los pacientes se les realiza seguimiento, tienen muchas más probabilidades de ser sometidos a cirugía si el cáncer se detecta nuevamente (evidencia de calidad alta). Con el seguimiento, es probable que se encuentren las recidivas más asintomáticas y "silenciosas" del cáncer en las visitas planificadas (evidencia de calidad moderada). Los efectos secundarios perjudiciales (daños) de los exámenes no fueron frecuentes, aunque el seguimiento más intensivo puede aumentar los daños (informado en dos estudios; evidencia de calidad muy baja). Los costes pueden aumentar con un seguimiento más intensivo (evidencia de calidad baja). El seguimiento más intensivo probablemente logra poca o ninguna diferencia en la calidad de vida (evidencia de calidad moderada).

Lo que significan los hallazgos.

La información con que se cuenta actualmente indica que hay pocos efectos beneficiosos con la intensificación del seguimiento, pero también hay pocas pruebas acerca de la calidad de vida, los efectos perjudiciales y los costos. No se sabe cuál es la mejor forma de seguimiento de los pacientes que reciben tratamiento para el cáncer colorrectal no metastásico (sin neoplasias secundarias), ni si se debe realizar dicho seguimiento. Se sabe poco acerca de los costos del seguimiento en este contexto. Las necesidades y preocupaciones del consumidor con respecto al valor del seguimiento requieren investigación adicional.

Conclusiones de los autores

disponible en

Implicaciones para la práctica

Los resultados de esta revisión indican que la intensificación del seguimiento clínico de los participantes con cáncer colorrectal después del tratamiento curativo no mejora los resultados de supervivencia. Aún es necesario aclarar los detalles exactos del régimen de seguimiento óptimo, pero la limitación de la intensidad del seguimiento no parece ser una desventaja.

Implicaciones para la investigación

Se estimula a los médicos a reclutar a los participantes en cualquier ensayo en curso en esta área. Dichos ensayos pueden reflejar adelantos en la imagenología y las técnicas quirúrgicas y la administración de tratamientos adyuvantes. Se exhorta a todos los investigadores que documenten explícitamente cualquier daño relacionado al seguimiento y sus intervenciones.

Los programas de investigación por separado deben explorar las necesidades de los pacientes y las inquietudes relacionadas con el valor del seguimiento y la incorporación de otros diseños de estudios que utilicen métodos cualitativos y cuantitativos.

Summary of findings

Open in table viewer
Summary of findings for the main comparison. Intensive follow‐up compared to less intensive follow‐up for patients treated for colorectal cancer with curative intent

Intensive follow‐up compared to less intensive follow‐up for patients treated for colorectal cancer with curative intent

Participants: people with non‐metastatic colorectal cancer treated with curative intent

Setting: primary and secondary care

Interventions: more intensive follow‐up (clinic visits and investigations aimed at detecting recurrence)

Comparison: less intensive follow‐up

Outcomes

№ of participants
(studies)

Quality of the evidence
(GRADE)

Relative effect
(95% CI)

Anticipated absolute effects* (95% CI)

Risk with less intensive follow‐up

Risk difference with intensive follow‐up

Overall survival
Follow‐up: range 8 months to 134 months

12,528
(15 RCTs)

⊕⊕⊕⊕
Higha,b

HR 0.91
(0.80 to 1.04)

Study population

107 per 1000

22 fewer per 1000
(60 fewer to 9 more)c

Colorectal cancer‐specific survival
Follow‐up: range 8 months to 134 months

11,771
(11 RCTs)

⊕⊕⊕⊝
Moderatea,b,d

HR 0.93
(0.81 to 1.07)

Study population

73 per 1000

15 fewer per 1000
(47 fewer to 12 more)

Relapse‐free survival
Follow‐up: range 48 months to 120 months

8047
(16 RCTs)

⊕⊕⊕⊕
Higha,b

HR 1.05
(0.92 to 1.21)

Study population

283 per 1000

17 more per 1000
(30 fewer to 66 more)

Salvage surgery (surgery at relapse with curative intent)
Follow‐up: range 2 months to 134 months

5157
(13 RCTs)

⊕⊕⊕⊕
Highe

RR 1.98
(1.53 to 2.56)

Study population

62 per 1000

60 more per 1000
(33 more to 96 more)

Interval recurrences (recurrence CRC diagnosed between scheduled follow‐up visits)
Follow‐up: range 2 months to 134 months

3933
(7 RCTs)

⊕⊕⊕⊝
Moderatee,f

RR 0.59
(0.41 to 0.86)

Study population

127 per 1000

52 fewer per 1000
(75 fewer to 18 fewer)

Harms

Colonoscopy complications ‐ bowel perforation

326

(1 RCT)

⊕⊝⊝⊝
Very Lowg

RR 6.83

(0.36 to 131.21)

Study population

0 per 1000

0 fewer per 1000
(0 fewer to 0 fewer)

*The risk in the intervention group (and its 95% confidence interval) is based on the assumed risk in the comparison group and the relative effect of the intervention (and its 95% CI).

CI: confidence interval; CRC: colorectal cancer; HR: hazard ratio; RCT: randomised controlled trial; RR: risk ratio; OR: Peto odds ratio

GRADE Working Group grades of evidence
High quality: further research is very unlikely to change our confidence in the estimate of effect.
Moderate quality: further research is likely to have an important impact on our confidence in the estimate of effect and may change the estimate.
Low quality: further research is very likely to have an important impact on our confidence in the estimate of effect and is likely to change the estimate.
Very low quality: we are very uncertain about the estimate.

aNot downgraded for imprecision because there were more than 300 events.
bConfidence intervals include 1 and exclude clinically meaningful benefit or harm.
cWe used the number of events in the control arms of the included studies to derive absolute values.
dDowngraded because we deemed 192/468 (41%) events from studies at high risk of bias because of incomplete follow‐up.
eNot downgraded because prespecified sensitivity analysis explained heterogeneity on basis of study age.
fDowngraded because we deemed 95/178 (58%) events from studies at high risk of bias because of incomplete follow‐up.
gDowngraded for risk of bias related to lack of blinding and imprecision.

Antecedentes

disponible en

Descripción de la afección

El cáncer colorrectal es un tumor maligno diagnosticado con frecuencia que afecta a alrededor de una persona cada 20 en la mayoría de los países occidentales (DevCan 2005). Cerca de dos tercios de los pacientes presentarán una enfermedad potencialmente curable (por cirugía con o sin tratamientos adyuvantes). De los mismos, del 50% al 60% presentará la recidiva con enfermedad metastásica (Lee 2007; Van Cutsem 2006; Yoo 2006). Los cirujanos, los oncólogos y otros profesionales de la salud que atienden a pacientes con cáncer colorrectal han adoptado una serie de estrategias para tratar de mejorar los resultados clínicos. Incluyen los cribados poblacionales, mejores pruebas diagnósticas, técnicas quirúrgicas y anestésicas perfeccionadas y la utilización más amplia de tratamientos adyuvantes efectivos.

Después de completar el tratamiento definitivo, la atención del médico se centra en las estrategias de seguimiento dirigidas a detectar una recidiva del tumor en un estadio en el cual se puedan utilizar procedimientos curativos adicionales. También se han desarrollado estrategias de seguimiento para detectar nuevos tumores primarios metácronos (es decir, que aparecen en momentos diferentes) curables. Existe una superposición entre estas dos estrategias; esta revisión actual se centra en el primer tema, es decir, las estrategias diseñadas para detectar las recidivas curables del cáncer original. Estas recidivas incluyen las que se localizan en pulmón, hígado, abdomen o pelvis y que se pueden extirpar completamente con intención curativa.

Seguir a los pacientes después del tratamiento definitivo para el cáncer se ha transformado en un componente tradicional de la atención médica (Edelman 1997). Es probable que los médicos realicen el seguimiento de los pacientes después del tratamiento curativo para el cáncer colorrectal, por lo menos en parte, para proporcionar información positiva a su tratamiento, aunque también para evaluar los efectos tóxicos de los tratamientos y proporcionar datos de resultado más exactos (Audisio 1996). Los pacientes y sus médicos entablan relaciones durante el tratamiento y seguimiento que pueden hacer difícil dar de alta a los pacientes y devolver la responsabilidad de la atención a su médico primario en la comunidad (Audisio 2000). Como resultado, un médico practicante puede acumular un número grande de pacientes para seguimiento y la vigilancia de esta cohorte consume recursos importantes.

El coste de los recursos involucrados es considerable, lo que limita la atención que el médico puede proporcionar a otros individuos. Son pocos los médicos que limitan las visitas de seguimiento del cáncer colorrectal solo al examen clínico, y la tentación de solicitar evaluaciones de rutina se incrementa a menudo a causa de los pacientes, que desean exámenes que "demuestren" que su enfermedad está bajo control (Audisio 2000; Kievit 2000). Los médicos justifican este enfoque, argumentando que las recidivas están detectándose antes de lo que ocurriría de otra manera y que por ende los resultados del paciente mejoran (Kievit 2000).

Descripción de la intervención

Los programas de seguimiento del cáncer colorrectal deben basarse en los patrones anatómicos y temporales de la recidiva (Audisio 2000, Edelman 1997). La fase más importante del seguimiento son los primeros dos o tres años después de la primera resección, debido a que durante ese tiempo se manifestará la mayoría de las recidivas (Böhm 1993; Ovaska 1989). El hígado es la localización más frecuente de las metástasis del cáncer colorectal. Una pequeña proporción de estos pacientes (del 10% al 20%) presentarán metástasis hepáticas distribuidas en el hígado de una manera que los hace candidatos para la resección o la ablación quirúrgica (Alberts 2005; Muratore 2007). Las series publicadas de pacientes sometidos a dichas intervenciones quirúrgicas (con un número significativo de supervivientes a largo plazo) alientan este enfoque (Choti 2002; Kanas 2012; Pawlik 2005). Se han propuesto varias estrategias para detectar las metástasis hepáticas en un estadio temprano e identificar este tipo de pacientes; las mismas incluyen controles con análisis de sangre (función hepática, nivel de antígeno carcinoembrionario [ACE] en suero) y obtención sistemática de imágenes del hígado y los pulmones (Fleischer 1989; Sugarbaker 1987).

Los resultados psicológicos de los programas de seguimiento de los pacientes con cáncer pueden ser positivos o negativos. Los resultados positivos incluyen la sensación de seguridad y apoyo. Los resultados negativos incluyen: una falsa sensación de seguridad, aumento de la ansiedad, miedo asociado con la detección temprana de una recidiva incurable, la morbilidad y mortalidad asociadas con los procedimientos realizados como consecuencia de resultados anormales y la angustia causada por los resultados falsos positivos. Las mediciones apropiadas de la calidad de vida podrían aportar información acerca de estos resultados.

El seguimiento puede incluir visitas al consultorio, exámenes y pruebas (análisis de sangre y exámenes endoscópicos y radiológicos). El seguimiento más intensivo puede consistir en una mayor frecuencia de las visitas al consultorio, de las pruebas y de los exámenes en comparación con la ausencia o una menor cantidad de visitas al consultorio, pruebas y exámenes.

De qué manera podría funcionar la intervención

Se considera que los programas de seguimiento en el cáncer colorrectal aumentan la detección temprana de la recidiva en un estadio en que es posible utilizar procedimientos curativos adicionales, así como de nuevos tumores primarios metácronicos curables, por lo que mejoran los resultados de supervivencia (GILDA 1998).

Por qué es importante realizar esta revisión

Aún se discute si el seguimiento sistemático puede alterar los resultados clínicos a largo plazo para el cáncer colorrectal (Pfister 2004). Aunque algunos comentaristas han establecido la conclusión de que el seguimiento es valioso (Gerdes 1990), otros han cuestionado su efectividad (Kievit 2000, McArdle 2000). Hay una considerable variación entre los programas de seguimiento en cuanto al momento adecuado y la frecuencia de las visitas al médico y las investigaciones realizadas por los médicos (Collopy 1992; Connor 2001; Vernava 1994; Virgo 1995). El seguimiento de rutina puede provocar daño psicológico a los pacientes y cualquier perjuicio de este tipo debe ser superado por una mejoría en los resultados clínicos (como la supervivencia general) que son importantes para los pacientes. Los datos de los estudios de seguimiento de otros tipos de cáncer (p.ej. cáncer de mama y supervivencia general) no son alentadores en este sentido (Rojas 2005).

Por lo tanto, se realizó una revisión sistemática de los ensayos controlados aleatorios que examinaban cuestiones relacionadas con la efectividad de las estrategias de seguimiento en pacientes con cáncer colorrectal tratados con intención curativa.

Objetivos

disponible en

Evaluar el efecto de los programas de seguimiento (seguimiento versus ningún seguimiento, estrategias de seguimiento de intensidad variable y seguimiento en diferentes contextos de asistencia sanitaria) sobre la supervivencia general en los pacientes con cáncer colorrectal tratado con intención curativa. Las variables de evaluación secundarias incluyen la supervivencia libre de recidiva, la cirugía de rescate, las recidivas de intervalo, la calidad de vida y los efectos perjudiciales y los costes de la vigilancia y las investigaciones.

Métodos

disponible en

Criterios de inclusión de estudios para esta revisión

Tipos de estudios

Ensayos controlados aleatorios (ECA) que compararan diferentes estrategias de seguimiento para los participantes con cáncer colorrectal. Estos ensayos incluyeron comparaciones de seguimiento versus ningún seguimiento, estrategias de seguimiento de intensidad variable (diferente frecuencia o cantidad de pruebas, o ambas) y seguimiento en diferentes contextos de atención sanitaria (p.ej. atención primaria versus hospital). Fueron elegibles los ensayos grupales.

Tipos de participantes

Hombres y mujeres de cualquier edad con adenocarcinoma del colon o del recto histológicamente comprobado, clasificado como T1‐4N0‐2M0 (Edge 2010), tratado de forma quirúrgica con intención curativa (más o menos tratamiento adyuvante).

Tipos de intervenciones

Visitas de seguimiento a cualquier profesional sanitario en cualquier contexto, que incluyen preguntas sobre los síntomas, examen clínico y procedimientos e investigaciones (incluidos, pero no limitados a, los análisis de sangre, análisis fecales, exámenes radiológicos y la colonoscopia).

Tipos de medida de resultado

Resultados primarios

  1. Supervivencia general (medida desde el momento de la asignación al azar al estudio)

Resultados secundarios

  1. Supervivencia específica del cáncer colorrectal (medida desde el momento de la asignación al azar al estudio)

  2. Supervivencia libre de recidiva (medida desde el momento de la asignación al azar al estudio)

  3. Cirugía de rescate (cirugía realizada con intención curativa para la recidiva del cáncer colorrectal)

  4. Intervalos de recidiva (recurrencia del cáncer colorrectal detectada entre visitas de seguimiento)

  5. Calidad de vida (mediante instrumentos específicos de los estudios que incluyen aunque no están limitados a FACT (Functional Assessment of Cancer Therapy), EORTC QLQ‐C30 (European Organization for Research and Treatment of Cancer Quality of Life), y EORTC‐CRC (Cella 1993; Sprangers 1993; Whistance 2009)

  6. Efectos perjudiciales, que incluyen, pero no están limitados a, efectos perjudiciales psicológicos, complicaciones relacionadas con la investigación y la pérdida de recursos

  7. Costes de la vigilancia (incluidas las investigaciones)

Métodos de búsqueda para la identificación de los estudios

Búsquedas electrónicas

We searched the following electronic databases with no language restriction:

  1. the Cochrane Central Register of Controlled Trials (CENTRAL; 2019, Issue 4) in the Cochrane Library using the strategy in Appendix 1;

  2. MEDLINE Ovid (from 1950 to 5 April 2019) using the strategy in Appendix 2;

  3. Embase Ovid (from 1974 to 5 April 2019) using the strategy in Appendix 3;

  4. CINAHL EBSCO (Cumulative Index to Nursing and Allied Health Literature; from 1981 to April 2019) using the strategy in Appendix 4; and

  5. Science Citation Index (from 1900 to April 2019) using the strategy in Appendix 5.

For the Review first published in the Cochrane Library 2002 issue 1, we also searched the electronic database CANCERLIT, which stopped existing in 2003.

Búsqueda de otros recursos

Trials registries

We searched the following trials registries:

  1. US National Institutes of Health Ongoing Trials Register ClinicalTrials.gov; www.clinicaltrials.gov; (searched April 2019); and

  2. World Health Organization International Clinical Trials Registry Platform; apps.who.int/trialsearch; (searched April 2019).

Handsearching

We searched the following journals and conference proceedings:

  1. American Society for Clinical Oncology (ASCO) (1995 to 2010, 2012‐2018);

  2. European Society for Therapeutic and Radiation Oncology (1990, 1993, 2000 to 2010, 2012 to 2018); and

  3. International Journal of Radiation Oncology Biology Physics: proceedings of the American Society for Radiation Oncology (ASTRO) (2011 to 2018).

We searched reference lists of published articles and previous systematic reviews and made personal contact with experts. We identified non‐English and unpublished studies.

Grey literature

We searched OpenGrey (www.opengrey.eu; 8 April 2019).

Obtención y análisis de los datos

Selección de los estudios

Two review authors (BEH and GMJ) checked the titles and abstracts identified from the databases. The review authors obtained the full text of all studies of possible relevance for independent assessment, decided which studies met the inclusion criteria, and graded their methodological quality. Discussion between the review authors resolved any disagreement. We contacted authors of primary studies for clarification where necessary: we contacted the authors for Barillari 1996 on 10 November 2018 but have had no response. We did not use the reported outcomes as criteria for including studies. We included studies irrespective of their publication status. We documented the selection process using Covidence and presented the details of the search in a PRISMA diagram (Moher 2009). Reasons for exclusion are presented in the 'Characteristics of excluded studies' table. We collated multiple reports of the same study so that each study, rather than the report, was the unit of interest in the review, and we identified the primary source.

Extracción y manejo de los datos

Two review authors (BEH and GMJ) independently performed data extraction; we contacted the authors of studies to provide missing data where possible. We entered data into a previously piloted data form then into Covidence. One review author (BEH) entered data into Review Manager 5 (RevMan 5), which a second author (AS) checked (Review Manager 2014). We resolved any disagreements by discussion. We extracted the following data when available:

  1. number of participants;

  2. the age and status of the participants;

  3. inclusion and exclusion criteria;

  4. setting;

  5. treatment regimen;

  6. follow‐up details; and

  7. survival, adverse events, and quality‐of‐life indices.

We collected data that were sufficient to populate a table of characteristics of included studies. For studies where only a subset of the participants recruited were eligible for inclusion, we included them if they reported data for that subgroup separately. Where a study had more than one study arm, such as FACS 2014, we combined those intervention study arms that met the inclusion criteria and compared them with the control arm; this ensured we did not double‐count data. When we performed subgroup analysis for FACS 2014, we combined the two arms with measured carcinoembryonic antigen (CEA) and the two arms that used computerised tomography (CT). We compared the magnitude and direction of effects reported by studies with how they were presented in the review.

In order to report time‐to‐event data, we used the RevMan 5 calculator (Review Manager 2014), and a spreadsheet developed by Matthew Sydes (Tierney 2007), to derive observed (O) and log‐rank expected events (E) (O‐E) and variance. Tierney 2007 presents 11 methods for calculating a hazard ratio (HR) or associated statistics, or both, from published time‐to‐event‐analyses into a practical, less statistical guide. The methods we used to do so were dependent on the available information in the texts, and we report them as follows.

Reports presenting HRs and 95% confidence intervals allowed application of method 3 in Tierney 2007 and were available for analysis as follows:

  1. overall survival (FACS 2014; ONCOLINK; Strand 2011; Treasure 2014; Wang 2009 (please note that for Wang 2009, we used the RevMan 5 calculator to derive the HR, because this agreed with the P value given in the text));

  2. colorectal cancer‐specific survival (FACS 2014; ONCOLINK; Rodríguez‐Moranta 2006); and

  3. relapse‐free survival (FACS 2014; Mäkelä 1995; Ohlsson 1995; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Secco 2002; Strand 2011; Treasure 2014).

In reports with a P value, events in each arm, and where the randomisation ratio was 1:1, we used method 7 in Tierney 2007 to derive O‐E and variance. Such studies contributed to the following analyses:

  1. overall survival (GILDA 1998; Kjeldsen 1997; Ohlsson 1995; Rodríguez‐Moranta 2006; Schoemaker 1998 (for Rodríguez‐Moranta 2006, we used the RevMan 5 calculator to derive the HR, because the statistic presented in the text was adjusted for confounding; this was also the approach that the systematic review Pita‐Fernández 2014 used for this study));

  2. colorectal cancer‐specific survival (Kjeldsen 1997; Ohlsson 1995); and

  3. relapse‐free survival (GILDA 1998; Kjeldsen 1997; Rodríguez‐Moranta 2006).

In reports where we extracted data from the survival curve, assuming constant censoring, we used method 10 in Tierney 2007 for two studies contributing to the outcome of overall survival (Mäkelä 1995; Pietra 1998).

For relapse‐free survival, we extracted curve data with numbers at risk (method 11) for Sobhani 2018.

Evaluación del riesgo de sesgo de los estudios incluidos

Two study authors (BEH and GMJ) constructed and presented 'Risk of bias' tables using the Cochrane 'Risk of bias' tool, resolving any disagreements by discussion (Higgins 2017). We evaluated the following domains:

  1. random sequence generation;

  2. allocation concealment;

  3. blinding of participants and personnel;

  4. blinding of outcome assessment;

  5. incomplete follow‐up (exclusions, attrition);

  6. selective reporting; and

  7. other bias, including but not limited to early stopping, inadequate duration of follow‐up, or baseline imbalances.

We graded domains as at low risk of bias, high risk of bias, or unclear risk of bias (using the criteria in the Cochrane Handbook for Systematic Reviews of Interventions, Table 8.5d) (see Appendix 6), with our reasons and supporting evidence detailed in the tables (Higgins 2017). We summarised the risk of bias for each of the key study outcomes (overall survival, disease‐specific survival, relapse‐free survival, salvage surgery, interval recurrences, and complications of colonoscopy).

Medidas del efecto del tratamiento

Where possible, we conducted time‐to‐event analyses for overall survival, colorectal cancer‐specific survival, and relapse‐free survival. We expressed the results as hazard ratios (HR) with 95% confidence intervals (CI) when the relevant information was available in the text or could be derived. Where necessary, we derived the HR using the RevMan 5 calculator (Review Manager 2014), and calculated associated statistics using an Excel spreadsheet developed by Matthew Sydes (Cancer Division of the Medical Research Council (MRC) Clinical Trials Unit) in collaboration with the Meta‐analysis Group of the MRC Clinical Trials Unit, London (Tierney 2007). We reported risk ratios (RR) and 95% CIs for dichotomous outcomes and would use the mean difference and 95% CI to report continuous outcomes. In the case of rare events (Analysis 1.6) we used the Peto odds ratio (OR; Deeks 2017). We interpreted a statistically non‐significant result (P value larger than 0.05) as a finding of uncertainty unless the confidence intervals were sufficiently narrow to rule out a potentially important magnitude of effect. We defined confidence intervals between 0.75 and 1.25 as excluding clinically meaningful benefits or harms.

Cuestiones relativas a la unidad de análisis

All of the RCTs were parallel in design, with participants being the unit of randomisation; therefore, we had no unit of analysis issues.

Manejo de los datos faltantes

We contacted the authors of Secco 2002 to request the raw data. We were informed on 20 April 2015 that because of personnel changes, the authors were unable to retrieve the data, which meant we were not able to report overall survival data for this study. Because they plotted two curves for each study arm, it was not possible to extract data for use in time‐to‐event analysis. We were in contact with the study authors for GILDA 1998 on 18 February 2016, who kindly provided us with unpublished data, which we were able to include for the outcomes 'Interval recurrences' and 'Salvage surgery' (Fossati 2015). Therefore, all analyses were by intention‐to‐treat.

Evaluación de la heterogeneidad

We assessed heterogeneity both visually and statistically using the Chi² test of heterogeneity (Altman 1992; Walker 1988), and I² statistic (Deeks 2017; Higgins 2002). The criterion for identification of heterogeneity is a P value less than 0.10 for the Chi² test (acknowledging the limitations of this process) and an I² statistic value of greater than 50%. Where we identified significant heterogeneity, we first checked the data to ensure it was not due to error, explored the potential causes of it, and made a cautious attempt to explain the heterogeneity.

Evaluación de los sesgos de notificación

We assessed the potential impact of reporting biases by the use of a funnel plot for the four outcomes that included data from 10 or more studies (overall survival, cancer‐specific survival, relapse‐free survival, and salvage surgery). Including 15 studies allowed us to visually assess whether small‐study effects were present or not.

Síntesis de los datos

We calculated a weighted treatment effect (using a random‐effects model) across studies using the Cochrane statistical package in RevMan 5 (Review Manager 2014). Where O‐E and variance were available, we used a log‐rank approach and a fixed‐effect model to synthesise data. We summated data where we judged the participants, interventions, and outcomes to be sufficiently similar to ensure a clinically meaningful answer.

Análisis de subgrupos e investigación de la heterogeneidad

We used subgroup analyses to investigate possible differences in participant outcomes according to study variables that we believed could be effect modifiers. These included the use of CEA, CT, and PET‐CT (positron emission tomography–computed tomography) in the intensive follow‐up strategy when compared with no use or less frequent use (twice at most) in the control arm, and setting for follow‐up (general practitioner (GP)‐ or nurse‐led follow‐up compared with hospital follow‐up and 'dose' of follow‐up, that is, studies that compared the use of more visits and tests with fewer visits and tests). These subgroup analyses may help identify which investigations are useful in follow‐up for colorectal cancer and allow us to give specific guidance to clinicians. We used a formal statistical test to compare subgroups.

Análisis de sensibilidad

We performed prespecified sensitivity analyses to test the strength of our conclusions by excluding studies judged to be at high risk of bias for the particular outcome concerned (Kjeldsen 1997; Mäkelä 1995; Pietra 1998; Schoemaker 1998; Wang 2009), and by study age (excluding those studies that completed accrual by 1996) (Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; Pietra 1998; Schoemaker 1998; Treasure 2014).

We performed post hoc sensitivity analysis in response to reviewer suggestion by excluding one study (Ohlsson 1995), where the intensity of follow‐up in the intensive arm was comparable with the intensity of follow‐up in the control arm of other studies.

'Summary of findings' tables

We evaluated the quality of evidence using the GRADE approach for the following outcomes (Schünemann 2013):

  1. overall survival;

  2. colorectal cancer‐specific survival;

  3. relapse‐free survival;

  4. salvage surgery;

  5. interval recurrences; and

  6. harms associated with surveillance.

We used GRADEpro GDT to present the quality of evidence for the aforementioned outcomes in 'Summary of findings' tables. We could downgrade the quality of the evidence by one (serious concern) or two levels (very serious concern) for the following reasons: risk of bias, inconsistency (unexplained heterogeneity, inconsistency of results), indirectness (indirect population, intervention, control, outcomes), imprecision (wide confidence intervals, single study), and publication bias. We could also downgrade the quality by one level due to a large summary effect.

Results

Description of studies

Results of the search

For this update, we screened 7571 references, of which we assessed 33 references in full. We identified four new studies for inclusion (CEAwatch 2015; COLOFOL 2018; Sobhani 2018; SurvivorCare 2013), and we identified 9 additional references for four previously included studies (FACS 2014; ONCOLINK; Rodríguez‐Moranta 2006; Treasure 2014). In this update, we moved nine references referring to three studies that were previously either ongoing or awaiting assessment to included studies. We identified four new ongoing studies (COLOPEC; FURCA; ProphyloCHIP; SCORE).

In summary, this updated version of the review now includes a total of 82 references:

  1. 63 references refer to 19 included studies (CEAwatch 2015; COLOFOL 2018; FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Secco 2002; Sobhani 2008; Sobhani 2018; Strand 2011; SurvivorCare 2013; Treasure 2014; Wang 2009; Wattchow 2006);

  2. five references refer to four excluded studies (Kronborg 1981; NCT00182234; Sano 2004; Serrano 2018);

  3. three references refer to three studies awaiting assessment (Barillari 1996; NCT00199654; UMN000001318); and

  4. 11 references refer to six ongoing studies (COLOPEC; FURCA; HIPEC; ProphyloCHIP; SCORE; SURVEILLANCE).

There was considerable variation in the follow‐up strategies employed by the 19 studies; both the frequency of, the setting for, and the investigations that were performed during follow‐up visits were different in each study (see the 'Characteristics of included studies' tables and Figure 1).


Study flow diagram

Study flow diagram

Included studies

Similarities and differences between the included studies

Thirteen of the 19 studies were multicentred (CEAwatch 2015; COLOFOL 2018; FACS 2014; GILDA 1998; Kjeldsen 1997; Ohlsson 1995; ONCOLINK; Pietra 1998; Schoemaker 1998; Sobhani 2018; SurvivorCare 2013; Treasure 2014; Wattchow 2006). We identified one cluster‐RCT (CEAwatch 2015).

Participants

Eleven of the 19 studies included Dukes' stage A, B, and C colon and rectal cancer (CEAwatch 2015; FACS 2014; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Schoemaker 1998; SurvivorCare 2013; Treasure 2014; Wang 2009; Wattchow 2006). Six studies excluded Dukes' A participants (COLOFOL 2018; GILDA 1998; Pietra 1998; Rodríguez‐Moranta 2006; Secco 2002; Sobhani 2018), two studies excluded participants with rectal cancer (Pietra 1998; Wattchow 2006), and one study included only rectal cancer participants (Strand 2011). Sobhani 2018 included some participants with completely resected Stage IV disease.

Interventions

The studies can be grouped into the following areas of assessment:

  1. 'dose' of follow‐up: more visits and tests versus fewer visits and tests (CEAwatch 2015; COLOFOL 2018; Kjeldsen 1997; Mäkelä 1995; Pietra 1998; Rodríguez‐Moranta 2006; Secco 2002; Sobhani 2018; Treasure 2014; Wang 2009);

  2. formal follow‐up versus minimal/no follow‐up (COLOFOL 2018; FACS 2014; Ohlsson 1995; Schoemaker 1998; Secco 2002);

  3. more liver imaging versus less liver imaging (COLOFOL 2018; FACS 2014; GILDA 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Sobhani 2018);

  4. CEA versus no CEA (CEAwatch 2015; COLOFOL 2018; FACS 2014; Kjeldsen 1997; Ohlsson 1995; Sobhani 2018; Treasure 2014);

  5. setting for follow‐up (where frequency of visits and tests were identical in both arms): GP‐led follow‐up (ONCOLINK; Wattchow 2006), or nurse‐led follow‐up (Strand 2011), compared with surgeon‐led follow‐up;

  6. usual follow‐up care was supplemented by provision of survivorship educational materials, a survivorship care plan, end of treatment consultation and subsequent phone calls (SurvivorCare 2013).

The included studies did not assess the quality of histopathology.

Outcomes

  1. Fifteen RCTs reported overall survival (COLOFOL 2018; CEAwatch 2015; FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Sobhani 2018; Strand 2011; Treasure 2014; Wang 2009).

  2. Eleven RCTs reported colorectal cancer‐specific survival, measured from the time of randomisation in the study ((CEAwatch 2015; COLOFOL 2018; FACS 2014; GILDA 1998; Kjeldsen 1997; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Sobhani 2018; Wang 2009).

  3. Sixteen RCTs reported relapse‐free survival, measured from the time of randomisation in the study (COLOFOL 2018; FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Secco 2002; Sobhani 2008; Sobhani 2018; Strand 2011; Treasure 2014; Wang 2009).

  4. Thirteen RCTs reported salvage surgery, that is, surgery performed with curative intent for relapse of colorectal cancer (FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Secco 2002; Sobhani 2008; Treasure 2014; Wang 2009).

  5. Seven RCTs reported interval recurrences, relapse of colorectal cancer detected between follow‐up visits or symptomatic recurrences (FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Secco 2002; Sobhani 2008; Wang 2009).

  6. Seven RCTs assessed quality of life (CEAwatch 2015; COLOFOL 2018; GILDA 1998; Kjeldsen 1997; ONCOLINK; SurvivorCare 2013; Wattchow 2006).

    1. CEAwatch 2015 used a Dutch version of the Cancer Worry Scale (Custers 2014), measured participant attitudes to follow‐up using a validated tool (Stiggelbout 1997), and reported using the Hospital Anxiety Depression Scale (HADS; Zigmond 1983).

    2. COLOFOL 2018 used SF‐36 and validated scales (EORTC QLQ C‐30 (European Organization for Research and Treatment of Cancer quality of life questionnaire; Aaronson 1993)) and reported using the HADS (Zigmond 1983).

    3. GILDA 1998 used the 12‐item short version (SF‐12) of SF‐36 (Apolone 1998; Gandek 1998), which was validated in the Italian population, and the Psychological General Well‐Being (PGWB) Index (Dupuy 1984).

    4. Kjeldsen 1997 used the Nottingham Health Profile (Anderson 1996; Hunt 1980).

    5. ONCOLINK used validated scales EORTC QLQ C‐30 (European Organization for Research and Treatment of Cancer quality of life questionnaire; Aaronson 1993) and EQ‐5D (EuroQol five dimensions questionnaire; Dolan 1997);

    6. SurvivorCare 2013 assessed psychological distress using the Brief Symptom Inventory 18 (BSI‐18; Zabora 2001), survivors' unmet needs using Cancer Survivors' Unmet Need measure (CaSUN; Hodgkinson 2007), health‐related quality of life using EORTC QLQ C‐30 (Aaronson 1993), and the EORTC QLQ CR‐29 (Whistance 2009).

    7. Wattchow 2006 reported the short form (SF)‐12 Physical and Mental Health component (Ware 1995), and reported using the HADS (Zigmond 1983).

  7. Schoemaker 1998 and Wang 2009 reported harms.

  8. Six studies evaluated costs of surveillance including investigations (CEAwatch 2015; ONCOLINK; Rodríguez‐Moranta 2006; Secco 2002; Sobhani 2018; Strand 2011). ONCOLINK and Rodríguez‐Moranta 2006 performed cost‐minimisation analyses.

See Characteristics of included studies.

Study accrual dates spanned over three decades. Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; Pietra 1998; Schoemaker 1998; Secco 2002; and Treasure 2014 accrued in the 1980s and 1990s. GILDA 1998; Rodríguez‐Moranta 2006; Sobhani 2008; and Wang 2009 accrued participants in the 1990s and early 2000s. CEAwatch 2015; COLOFOL 2018; FACS 2014; ONCOLINK; and Sobhani 2018 accrued participants from 2003 to 2012.

The variety of investigations used across the studies may affect the applicability of results. For example, Kjeldsen 1997; ONCOLINK; and Treasure 2014 did not use CT scanning, while Sobhani 2018 used PET/CT.

Excluded studies

For this update, we applied the current recommendations from the Cochrane Handbook for Systematic Reviews of Interventions with respect to excluded studies and only classified studies as excluded if they were those that one might reasonably expect could have been eligible for inclusion.

We excluded four studies (see the 'Characteristics of excluded studies' tables). Sano 2004 was not eligible because participants did not have colorectal cancer. NCT00182234 included participants with both breast and colorectal cancer and did not analyse them separately. Participants in Serrano 2018 had liver metastases, so were not eligible for inclusion in this review.

Risk of bias in included studies

There was complete concordance between review authors regarding the evaluation of study methodology (Figure 2).


'Risk of bias' summary: review authors' judgements about each 'Risk of bias' item for each included study

'Risk of bias' summary: review authors' judgements about each 'Risk of bias' item for each included study

Allocation

Although all of the studies were reported to be randomised, only two explicitly reported that they concealed the allocation of participants to study groups (Mäkelä 1995; Wattchow 2006). We found that none of the studies were at high risk of bias with respect to allocation; we judged them all to be at low (COLOFOL 2018; CEAwatch 2015; FACS 2014; ONCOLINK; Rodríguez‐Moranta 2006; Schoemaker 1998; Treasure 2014) or unclear risk of bias (GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; Pietra 1998; Secco 2002; Sobhani 2008; Sobhani 2018; Strand 2011; SurvivorCare 2013; Wang 2009; Wattchow 2006).

Blinding

Participant or clinician blinding was not possible. We judged one study to be at high risk of bias for blinding of participants ( Wang 2009). One study used independent radiologists who were blinded to study group allocation to assess CT scans (Schoemaker 1998). We judged three studies to be at high risk of bias for blinding of outcome assessors (Kjeldsen 1997; Sobhani 2018; Wang 2009). Most studies were at low risk of bias for blinding Mäkelä 1995; Ohlsson 1995; ONCOLINK; Pietra 1998; Schoemaker 1998;Secco 2002; Sobhani 2008; Strand 2011; Treasure 2014; Wattchow 2006 and five were at unclear risk of bias (CEAwatch 2015; COLOFOL 2018; GILDA 1998; Rodríguez‐Moranta 2006; SurvivorCare 2013).

Incomplete outcome data

Eight studies ensured that they obtained outcome data from more than 80% of the participants. Wattchow 2006 obtained outcome data for 77% of the participants. All studies conducted intention‐to‐treat analyses. We judged one study to be at high risk of bias for incomplete outcome data (Pietra 1998). Two studies examined compliance with the follow‐up regimen (Rodríguez‐Moranta 2006; Schoemaker 1998), but no study fully assessed contamination. Most studies (CEAwatch 2015; COLOFOL 2018; FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Rodríguez‐Moranta 2006; Schoemaker 1998; Sobhani 2008; Sobhani 2018; SurvivorCare 2013; Wattchow 2006) were at low risk of attrition bias, four studies were unclear risk of attrition bias (Secco 2002; Strand 2011; Treasure 2014; Wang 2009).

Selective reporting

We did not have access to the protocols for most studies (CEAwatch 2015; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Secco 2002; Sobhani 2008; Strand 2011; Wang 2009; Wattchow 2006), so we judged them to be at unclear risk of bias. With more information available we judged COLOFOL 2018; FACS 2014; SurvivorCare 2013 and Treasure 2014 to be at low risk of bias for this domain (see Characteristics of included studies). We judged one study at high risk of bias for selective reporting (Sobhani 2018).

Other potential sources of bias

We did not find other sources of bias (including inadequate follow‐up duration and baseline imbalances on study populations). One study was stopped early (Treasure 2014), but we did not feel this was likely to introduce bias.

Overall survival

We judged four studies contributing data to this outcome to be at high risk of bias because they did not mention blinding (Kjeldsen 1997; Mäkelä 1995; Secco 2002; Wang 2009). We did not feel this represented any risk of bias for this objective outcome. We deemed three studies at high risk of bias for allocation concealment, Mäkelä 1995; Schoemaker 1998, and attrition bias, Pietra 1998, but because they contributed in total 17.2% of study weight, we did not feel that we needed to downgrade for risk of bias.

Colorectal cancer‐specific survival

We judged Pietra 1998 to be at high risk of attrition bias because the study authors potentially excluded 15% of the participants randomised without explaining to which study arm they belonged. Sobhani 2018 was at high risk of bias for lack of blinding of outcome assessors. These two studies contributed in total 11.9% of study weight for this outcome. Kjeldsen 1997 and Pietra 1998 did not mention blinding and probably did not ensure it (this represented 41% of the events contributing to this outcome). Because this could cause ascertainment bias for cause of death, we downgraded evidence quality for colorectal cancer‐specific survival for risk of bias.

Relapse‐free survival

For this outcome, Kjeldsen 1997; Mäkelä 1995 and Secco 2002 (which contributed 383/1340 (28%) of the events) did not mention blinding. We judged both Sobhani 2018 and Schoemaker 1998 at high risk of bias for lack of blinding, but we did not downgrade, because fewer than 30% of events were contributed from studies deemed at high risk of bias.

Salvage surgery

We judged Schoemaker 1998 to be at high risk of bias for allocation concealment. We also deemed three other studies contributing to this outcome to be at high risk of bias: Kjeldsen 1997 and Wang 2009 for lack of blinding of outcome assessment, Pietra 1998 for incomplete outcome reporting, and Wang 2009 further did not blind participants and personnel. We did not downgrade for risk of bias despite these limitations, because Schoemaker 1998 contributed only 11/526 (0.05%) of the events for this outcome, lack of blinding was unlikely to have affected the outcome reporting of salvage surgery, and the incomplete outcome reporting in Pietra 1998 was related to other outcomes.

Interval recurrences

We did not downgrade this outcome for risk of bias. We judged FACS 2014 to be at low risk of bias for all domains. We judged both Secco 2002 and Wang 2009 to be at high risk of bias for the domain of blinding, but this was because blinding was not mentioned in Wang 2009, and in Secco 2002, there were prespecified follow‐up schedules. We did not downgrade this outcome for risk of bias (Risk of bias in included studies and summary of findings Table for the main comparison).

Effects of interventions

See: Summary of findings for the main comparison Intensive follow‐up compared to less intensive follow‐up for patients treated for colorectal cancer with curative intent

1. Primary outcome

1.1 Overall survival

We report on 1453 deaths in 12,528 participants in 15 studies. Intensive follow‐up versus less intense follow‐up for participants treated with curative intent for colorectal cancer makes little or no difference to overall survival (HR 0.91, 95% CI 0.80 to 1.04; 15 studies, 12,528 participants). We found no evidence of heterogeneity: I² = 18%, P = 0.25. In absolute terms, the average effect of intensive follow‐up on overall survival was 24 fewer deaths per 1000 participants, but the true effect could lie between 60 fewer to 9 more per 1000 participants. The GRADE assessment of evidence quality for this outcome was high. The funnel plot did not show evidence of small study effect (COLOFOL 2018; CEAwatch 2015; FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Sobhani 2018; Strand 2011; Treasure 2014; Wang 2009; Figure 3).


Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.1 overall survival

Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.1 overall survival

Subgroup analyses

  1. We compared studies comparing follow‐up provided by different health professionals. Formal testing for subgroup differences was negative (Chi² = 0.40; P = 0.53; I² = 0%) when we compared those studies that used different settings with GP‐ or nurse‐led follow‐up (ONCOLINK; Strand 2011), with those set in hospitals (CEAwatch 2015; COLOFOL 2018; FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Sobhani 2018; Treasure 2014; Wang 2009; Analysis 1.7).

  2. In studies that compared more visits and tests with fewer visits and tests (Kjeldsen 1997; Mäkelä 1995; Pietra 1998; Rodríguez‐Moranta 2006; Sobhani 2018; Treasure 2014; Wang 2009), versus studies that compared follow‐up with minimal or no follow‐up (COLOFOL 2018; FACS 2014; Ohlsson 1995; Schoemaker 1998), formal testing for subgroup differences was negative (Chi² = 0.34; P = 0.56 ; I² = 0 %; Analysis 1.8).

  3. In studies using CEA in the intensive follow‐up regimen (CEAwatch 2015; COLOFOL 2018; FACS 2014; Ohlsson 1995; Sobhani 2018; Treasure 2014) versus those studies that did not use CEA (Kjeldsen 1997), formal testing revealed no evidence of differences between the subgroups (Chi² = 0.15 ; P = 0.7, I² = 0% (Analysis 1.9).

  4. We compared studies using CT in the intensive follow‐up regimen (COLOFOL 2018; FACS 2014; Mäkelä 1995; Ohlsson 1995; Rodríguez‐Moranta 2006; Schoemaker 1998; Sobhani 2018) versus those that did not use CT (Kjeldsen 1997; ONCOLINK; Treasure 2014). Formal statistical testing revealed no evidence of differences between the subgroups (Chi² = 0.31; P = 0.58; I² = 0% (Analysis 1.10)

  5. We compared studies using frequent CT scans in the intervention arm (FACS 2014; Mäkelä 1995; Ohlsson 1995; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998) versus the use of two or fewer CT scans in the control arm (Kjeldsen 1997; ONCOLINK; Treasure 2014) (Analysis 1.11). Formal statistical testing revealed no evidence of differences between the subgroups (Chi² = 0.99; P = 0.32: I² = 0%).

Sensitivity analyses

Our findings for the outcome of overall survival were robust to sensitivity analyses.

  1. Excluding studies at high risk of bias for this outcome (Schoemaker 1998; Pietra 1998), we found no statistical evidence of a survival advantage for the comparison of intensive versus less intensive follow‐up (HR 0.97, 95% CI 0.86 to 1.08). We found no heterogeneity: I² = 0%; P = 0.68, The GRADE assessment of evidence quality for this outcome was high.

  2. Excluding six studies on the basis of study age (Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; Pietra 1998; Schoemaker 1998; Treasure 2014), we found no statistical evidence of a survival advantage for the comparison of intensive versus less intensive follow‐up (HR 0.98, 95% CI 0.84 to 1.15; Analysis 1.1). We found little evidence of heterogeneity: I² = 18%; P = 0.28. The GRADE assessment of evidence quality for this outcome was high.

  3. Excluding one study where the intensity of the follow‐up in the 'intensive' arm was similar to that in the control arm of other studies (Ohlsson 1995), we found no evidence of a clinically meaningful effect on overall survival (HR 0.92, 95% CI 0.81 to 1.05). We found no evidence of heterogeneity: I² = 20%; P = 0.24. The GRADE assessment of evidence quality for this outcome was high.

2. Secondary outcomes

2.1 Colorectal cancer‐specific survival

We were able to report on 925 colorectal cancer deaths in 11,771 participants enrolled in 11 studies; 99.6% had a median follow‐up of greater than 48 months. We found that intensive versus less intensive follow‐up probably makes little or no difference to colorectal cancer‐specific survival (HR 0.93, 95% CI 0.81 to 1.07). We found no evidence of heterogeneity: I² = 0%, P = 0.57 (CEAwatch 2015; COLOFOL 2018; FACS 2014; GILDA 1998; Kjeldsen 1997; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Sobhani 2018; Wang 2009; Analysis 1.2).

In absolute terms, the average effect of intensive follow‐up on colorectal cancer‐specific survival was five fewer colorectal cancer‐specific deaths per 1000 participants, but the true effect could lie between 14 fewer to five more per 1000 participants. The GRADE assessment of evidence quality for this outcome was moderate, we downgraded once for risk of bias. The funnel plot did not show evidence of small study effect (Figure 4).


Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.2 colorectal cancer‐specific survival

Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.2 colorectal cancer‐specific survival

Sensitivity analyses

Our findings for the outcome of colorectal cancer‐specific survival were robust to the following sensitivity analyses.

  1. Excluding studies at high risk of bias for this outcome (Kjeldsen 1997; Sobhani 2018; Wang 2009), we found no statistical evidence of an effect on colorectal cancer‐specific survival (HR 0.90, 95% CI 0.76 to 1.06) and no evidence of heterogeneity: I² = 0%; P = 0.43.

  2. We found no statistical evidence of study age having an effect (HR 0.91, 95% CI 0.67 to 1.23) and no evidence of heterogeneity: I² = 30%; P = 0.22 (excluding GILDA 1998; Kjeldsen 1997; Ohlsson 1995).

2.2 Relapse‐free survival

We were able to report on 2254 relapses in 8047 participants enrolled in 16 studies, with a median follow‐up of greater than 48 months for 97.9% of participants studied (COLOFOL 2018; FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Secco 2002; Sobhani 2008; Sobhani 2018; Strand 2011; Treasure 2014; Wang 2009; Analysis 1.3).

We found intensive follow‐up versus less intense follow‐up makes little or no difference to relapse‐free survival (HR 1.05, 95% CI 0.92 to 1.21). The CIs excluded both clinically meaningful benefits and harms. We found no evidence of heterogeneity: I² = 41%, P = 0.05.

The funnel plot did not show evidence of small‐study effect (Figure 5).


Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.3 relapse‐free survival

Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.3 relapse‐free survival

The average effect of intensive follow‐up on relapse‐free survival was 12 more relapses per 1000 participants, but the true effect could lie between 19 fewer and 48 more per 1000 participants. The GRADE assessment of evidence quality for this outcome was high.

Sensitivity analyses

Our findings for the outcome of relapse‐free survival were robust to the following sensitivity analyses.

  1. Excluding studies at high risk of bias for this outcome (Kjeldsen 1997; Pietra 1998; Schoemaker 1998; Sobhani 2018; Wang 2009), we found no statistical evidence of an effect (HR 1.13, 95% CI 0.96 to 1.33) and no clear evidence of heterogeneity: I² = 40%; P = 0.08.

  2. With regard to study age (excluding GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; Pietra 1998; Schoemaker 1998; Treasure 2014), we found no statistical evidence of an effect (HR 1.05, 95% CI 0.79 to 1.40) and little evidence of heterogeneity: I² = 30%; P = 0.21.

2.3 Salvage surgery

We were able to report on 457 episodes of salvage surgery in 5157 participants enrolled in 13 studies, with a follow‐up duration of greater than 48 months in 90.6% of participants studied (FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; ONCOLINK; Pietra 1998; Rodríguez‐Moranta 2006; Schoemaker 1998; Secco 2002; Sobhani 2008; Treasure 2014; Wang 2009; Analysis 1.4).

We found the use of salvage surgery increased with intensive follow‐up for colorectal cancer (RR 1.98, 95% CI 1.53 to 2.56). The CIs included a range of clinically significant increases in salvage surgery. We found some non‐significant evidence of heterogeneity: I² = 31%; P = 0.14.

The funnel plot did not show evidence of small‐study effect (see Figure 5).

In absolute terms, the effect of intensive follow‐up on salvage surgery was 60 more episodes of salvage surgery per 1000 participants, but the true effect could lie between 33 to 96 more episodes per 1000 participants. The GRADE assessment of evidence quality for this outcome was high.

Sensitivity analyses

Our findings for the outcome of salvage surgery were robust to the following sensitivity analyses.

  1. Excluding studies at high risk of bias for this outcome (Pietra 1998; Schoemaker 1998; Wang 2009), we found some non‐significant heterogeneity (RR 2.03, 95% CI 1.53 to 2.69; I² = 33%; P = 0.15).

  2. With regard to study age we found that when we excluded the older studies (GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Ohlsson 1995; Pietra 1998; Schoemaker 1998; Treasure 2014), there was less heterogeneity (RR 2.04, 95% CI 1.35 to 3.09; I² = 25%; P = 0.25).

2.4 Interval (symptomatic) recurrences

We found 376 interval recurrences reported in 3933 participants enrolled in seven studies, with a median follow‐up duration of greater than 48 months for 100% of participants studied (FACS 2014; GILDA 1998; Kjeldsen 1997; Mäkelä 1995; Secco 2002; Sobhani 2008; Wang 2009; Analysis 1.5). There was an appreciable decrease in the number of interval recurrences (RR 0.59, 95% CI 0.41 to 0.86). The CIs included a range of clinically significant decreases in interval recurrences (Analysis 1.5). We detected heterogeneity: I² = 66%; P = 0.007.

Intensive follow‐up was associated with fewer interval recurrences: 52 fewer per 1000 participants; the true effect is between 18 and 75 fewer per 1000 participants. The GRADE assessment of quality of evidence was moderate, we downgraded once for risk of bias.

Sensitivity analyses

Our findings were robust to the following sensitivity analyses.

  1. Excluding studies at high risk of bias for this outcome (Kjeldsen 1997; Wang 2009), we found evidence of heterogeneity (RR 0.61, 95% CI 0.37 to 1.02; I²= 75%; P = 0.003).

  2. With regard to study age (excluding GILDA 1998; Kjeldsen 1997; Mäkelä 1995), we found no evidence of heterogeneity (RR 0.42, 95% CI 0.32 to 0.56; I² = 0%; P = 0.81).

2.5 Quality of life

CEAwatch 2015 found no significant differences between the two groups in terms of attitude to follow‐up, fear of recurrence, HADS score and Cancer Worry score, and there was no detectable burden or improvement in psychological burden associated with intensification of follow‐up.

GILDA 1998 found no clinically significant differences among the three main quality‐of‐life scales (SF‐12 mental component, SF‐12 physical component, and PGWB Index) between the two study arms.

Kjeldsen 1997 reported the influence of different follow‐up strategies on quality of life for 350 out of 597 Danish participants. They reported a small increase in quality of life (P < 0.05), as measured by the Nottingham Health Profile, associated with more frequent follow‐up visits compared with virtually no follow‐up.

ONCOLINK reported no significant effect on quality of life for the main outcome measures. They reported significant effects in favour of GP‐led follow‐up for EORTC QLQ‐C30 for role functioning (P = 0.02), emotional functioning (P = 0.01), and pain (P = 0.01). They did not report any significant differences in global health status.

SurvivorCare 2013 reported that psychological distress was similar between the two groups (difference 0.2, 95% CI −2.5 to 2.9) with the prespecified clinically meaningful difference of 0.42 (figures from the text). DIfferences between unmet needs, information needs and health‐related quality of life were not clinically significant. The intervention group were more satisfied with their care, but the median scores were similar (see Characteristics of included studies).

Wattchow 2006 assessed depression and anxiety, quality of life, and participant satisfaction in a cohort of participants randomised to follow‐up of their colon cancer in different settings (see Included studies). They found that the study participants remained in the normal range for depression and anxiety with no difference between the two groups at either 12 months or 24 months. Study participants (in each arm) had reduced physical quality of life at baseline, which improved as the study progressed, but there were no significant differences between the two groups. There were no differences between the two groups on the participant satisfaction scale, and both groups reported high levels of satisfaction with their care.

More intensive follow‐up probably makes little or no difference to quality of life (moderate‐quality evidence). The data were not available in a form that allowed analysis.

2.6 Harms (colonoscopy complications)

Two studies reported adverse events associated with follow‐up (Schoemaker 1998; Wang 2009). Three perforations and four gastrointestinal haemorrhages (requiring transfusion) were reported from a total of 2292 (0.3%) colonoscopies. Data from Schoemaker 1998 were not available in a form that allowed analysis. Intensive follow‐up may increase the complications (perforation or haemorrhage) from colonoscopies (RR 7.30, 95% CI 0.75 to 70.69); one study, 326 participants) (Wang 2009) Analysis 1.6; summary of findings Table for the main comparison). GRADE evidence quality was very low, downgraded for risk of bias related to lack of blinding, reporting bias and imprecision.

2.7 Costs of surveillance

ONCOLINK found the cost per participant for 24 months' follow‐up was GPB 9889 for surgeon‐led follow‐up and GBP 8233 for GP‐led follow‐up (P < 0.001 (figures from text)).

Rodríguez‐Moranta 2006 demonstrated that although the cost of intensive follow‐up was higher, when resectability of recurrences was considered, the cost per resectable recurrence was lower in the intensively followed group.

Secco 2002 provided risk‐adapted follow‐up based on prognostic factors prospectively identified, and the study authors commented that risk‐adapted follow‐up reduced costs for those with a better prognosis.

In Sobhani 2018 the intensive arm cost significantly more than the control arm (P < 0.0033 (figure from text)).

Strand 2011 found no difference in costs.

Costs were assessed in CEAwatch 2015, but have not yet been reported.

In summary, limited data suggests that the cost of more intensive follow‐up may be increased in comparison with less intense follow‐up, but the cost of surgery for resectable recurrence may be reduced. GRADE evidence quality was low, being downgraded for imprecision. The data were not available in a form that allowed analysis.

Discusión

disponible en

Los resultados de esta revisión indican que no hay un beneficio en la supervivencia general al intensificar el seguimiento de los pacientes después de la cirugía curativa para el cáncer colorrectal. Los análisis no mostraron una diferencia significativa en la incidencia de recidivas entre los pacientes de los grupos con seguimiento intensivo y los de los grupos control. Sin embargo, se realizaron significativamente más procedimientos quirúrgicos para las recidivas en los brazos experimentales de los estudios. Las recidivas en los grupos con un seguimiento más intensivo pueden haberse detectado antes, lo que permite tratamientos de rescate efectivos, pero no dio lugar a una mejor supervivencia general.

La estrategia de seguimiento de cada estudio combinó varios componentes distintos, incluida la frecuencia de las visitas, el tipo de evaluación clínica, el tipo y frecuencia de las pruebas y el contexto en el que se realizó el seguimiento (ver Tabla 1). Ningún ensayo comparó el agregado de una intervención específica, y la viabilidad de la comparación de estrategias con una variedad de componentes y de complejidad variable se vuelve problemática. El uso de la imagenología hepática no parece asociarse con una mejoría en la supervivencia. Una variación específica en todos los estudios fue la intensidad de seguimiento. Por ejemplo, la intensidad del seguimiento en el grupo de seguimiento intensivo en Ohlsson 1995 fue similar a la intensidad del seguimiento en los grupos de control de otros estudios en la revisión (Mäkelä 1995; Pietra 1998; Schoemaker 1998). Por lo tanto, no fue posible extraer de estos datos una indicación precisa de las combinaciones óptimas de frecuencia, tipo y contexto de las investigaciones de seguimiento para estos participantes. Los hallazgos fueron consistentes al análisis de sensibilidad en el que se excluyó a Ohlsson 1995.

La mayoría de las recidivas (cerca del 90%) ocurren dentro de los 36 meses después del tratamiento inicial para el cáncer colorrectal (Ryuk 2014), de manera que para detectar las recidivas, la duración del seguimiento para el cáncer colorrectal debe ser de al menos 36 meses. Los pacientes con cáncer rectal deben tener un seguimiento mayor porque puede haber un retraso en las recidivas hepáticas y pulmonares. La administración de quimioterapia adyuvante puede retardar aún más la recidiva (Sadahiro 2003). Para los resultados incluidos en este estudio, la mediana de la duración del seguimiento fue mayor de 48 meses en más del 90% de los participantes estudiados.

Se presentaron conclusiones sustancialmente alteradas en la actualización de la revisión de 2016 (Jeffery 2016). Anteriormente se informó que "había evidencia de que existe un beneficio en la supervivencia general a los cinco años en los pacientes que reciben un seguimiento más intensivo", aunque Jeffery 2016 no confirma dichos hallazgos. Los cuatro estudios nuevos incluidos en esta versión actualizada de la revisión (CEAwatch 2015; COLOFOL 2018; Sobhani 2018; SurvivorCare 2013), con 6238 participantes adicionales, reforzaron los hallazgos de Jeffery 2016 de que no existe un beneficio de supervivencia general para la intensificación del seguimiento de los pacientes después de la cirugía curativa para el cáncer colorrectal.

Resumen de los resultados principales

  1. Supervivencia general: el uso de seguimiento intensivo versus menos intensivo logra poca o ninguna diferencia después del tratamiento curativo (CRI 0,91; IC del 95%: 0,80 a 1,04; Análisis 1.1).

  2. Supervivencia específica del cáncer colorrectal: el uso de seguimiento intensivo versus menos intensivo logra poca o ninguna diferencia después del tratamiento curativo (CRI 0,93; IC del 95%: 0,81 a 1,07; Análisis 1.2).

  3. Supervivencia sin recidiva: el seguimiento intensivo versus menos intensivo logra poca o ninguna diferencia después del tratamiento curativo (CRI 1,05; IC del 95%: 0,92 a 1,21; Análisis 1.3).

  4. El uso de cirugía de rescate aumentó con el seguimiento intensivo después del tratamiento curativo en el cáncer colorrectal (CR 1,98; IC del 95%: 1,53 a 2,56; Análisis 1.4).

  5. Las recidivas de intervalo (sintomáticas) probablemente se redujeron ligeramente con el seguimiento intensivo después del tratamiento curativo para el cáncer colorrectal (CR 0,59; IC del 95%: 0,41 a 0,86; Análisis 1.5).

Calidad de vida

CEAwatch 2015 no encontró diferencias significativas entre los dos grupos en cuanto a la actitud de seguimiento, el miedo a la recidiva, la puntuación HADS y la puntuación Cancer Worry, y no hubo una carga detectable ni una mejoría en la carga psicológica asociada con la intensificación del seguimiento. GILDA 1998 no encontró diferencias clínicamente significativas entre las tres escalas principales de la calidad de vida (componente mental de la SF‐12, componente físico de la SF‐12 y PGWB Index) entre los dos brazos del estudio. En Kjeldsen 1997 se informó un aumento pequeño de la calidad de vida asociado con las visitas de seguimiento más frecuentes en comparación con prácticamente ningún seguimiento. ONCOLINK no informó ningún efecto significativo sobre las principales medidas de resultado de la calidad de vida: para EORTC QLQ‐C30 informaron efectos significativos a favor del seguimiento dirigido por el médico general para el dolor, el desempeño en la función y el funcionamiento emocional; no informaron diferencias en el estado de salud global, con un seguimiento intensivo comparado con un seguimiento menos intensivo. SurvivorCare 2013 no encontró diferencias clínicamente significativas en la angustia psicológica, las necesidades insatisfechas, las necesidades de información y la calidad de vida relacionada con la salud. Wattchow 2006 encontró que los pacientes del estudio se encontraban dentro del rango normal de depresión y ansiedad, sin diferencias entre los dos grupos a los 12 o 24 meses.

Efectos perjudiciales y costos de la vigilancia (incluidas las investigaciones)

Los ensayos informaron tres perforaciones intestinales y cuatro hemorragias gastrointestinales (que requirieron transfusión) de un total de 2292 colonoscopias (0,3%) (Schoemaker 1998; Wang 2009).

ONCOLINK encontró que el coste por participante durante el seguimiento de 24 meses fue de GBP 9889 para el seguimiento realizado por el cirujano y de GBP 8233 para el seguimiento realizado por el MG (p < 0,001) [cifras obtenidas del texto]). Rodríguez‐Moranta 2006 demostró que, aunque el coste del seguimiento intensivo fue mayor, cuando se consideró la resecabilidad de las recidivas el coste por recidiva resecable fue inferior en el grupo de seguimiento intensivo. Secco 2002 informó que el seguimiento adaptado según el riesgo redujo los costes en los pacientes con un mejor pronóstico. Strand 2011 no mostró ninguna diferencia en los costes.

Compleción y aplicabilidad general de las pruebas

Las pruebas que se informan son directamente relevantes para la pregunta de estudio.

Los estudios se han realizado durante un período prolongado, durante el cual se han producido cambios significativos en los procedimientos de estadiaje del cáncer, las técnicas quirúrgicas (metastasectomía quirúrgica o ablación de las metástasis hepáticas), la atención posoperatoria, los tratamientos adyuvantes y las investigaciones disponibles para detectar las recidivas. Los tratamientos adyuvantes sistémicos y los fármacos efectivos para la quimioterapia paliativa se utilizan ampliamente, con una prolongación significativa de las tasas de supervivencia. Todos estos factores cuestionan la validez de aplicar los resultados de los primeros estudios al contexto quirúrgico y oncológico moderno. Sin embargo, un análisis de sensibilidad que excluyó los estudios que comenzaron el reclutamiento antes de 1996 no mostró un efecto de la antigüedad del estudio sobre el resultado supervivencia general (CRI 0,97; IC del 95%: 0,74 a 1,28). La ausencia de un efecto beneficioso del seguimiento intensivo persistió a pesar de la inclusión de estudios modernos que utilizaron técnicas quirúrgicas modernas para la resección de las metástasis hepáticas (FACS 2014), e investigaciones más sensibles para detectar la recidiva, como la exploración con TEP (Sobhani 2008).

Hasta el momento el argumento en apoyo al seguimiento intensivo se ha basado en datos observacionales que informan una mejoría en la supervivencia después de la metastasectomía hepática. No se encontró mejoría en la supervivencia general con el uso de la imagenología hepática (CRI 0,92; IC del 95%: 0,81 a 1,21).

Los estudios identificados son suficientes para considerar los objetivos; es probable que las actualizaciones futuras de esta revisión tengan en cuenta los resultados que todavía no se pueden considerar en detalle, cuando los estudios en curso detallen la calidad de vida (SURVEILLANCE), los costes (SURVEILLANCE; NCT00199654) y los efectos del agregado de la exploración con TEP al seguimiento para estos participantes (NCT00199654).

No fue posible obtener datos de la supervivencia general del estudio Secco 2002 (a pesar de establecer contacto con los autores) debido a los cambios de personal en la institución.

Los estudios incluyeron la población participante relevante. Las intervenciones evaluadas fueron muy incluyentes y analizaron diversas "dosis" o intensidades del seguimiento, que variaron de ningún seguimiento a un seguimiento intensivo y evaluaron múltiples investigaciones que incluyeron el uso de la exploración con TC y TEP (ver Tabla 1). Se reconoce que hay una variación considerable en la intensidad de los brazos de intervención y de control en los estudios incluidos. Se cree que la decisión de agrupar los estudios está justificada por la falta de heterogeneidad importante para la supervivencia general (I² = 18%, p = 0,25) y la falta de efecto de subgrupos sobre la supervivencia general cuando se exploró la "dosis" y la composición del seguimiento.

Ningún estudio analizó ningún posible daño psicológico, la ansiedad ni la angustia que se puede asociar con el seguimiento después del tratamiento para el cáncer colorrectal.

Los estudios incluidos en esta revisión no informaron de manera adecuada los posibles efectos perjudiciales (físicos, psicológicos) ni los costes de las estrategias de seguimiento. Dos estudios informaron efectos perjudiciales relacionados con la colonoscopia (Schoemaker 1998; Wang 2009). La tasa de perforación (4/2292) del 0,17% y de hemorragia (3/2292) del 0,13 fue consistente con otras series publicadas (Araghizadeh 2001; Bowles 2004; Rabenek 2008). Ninguno de los informes de los estudios incluyó detalles específicos de ningún daño (mortalidad o morbilidad) resultante de la investigación o tratamiento de las recidivas. Estos resultados deben estar disponibles para poder evaluar adecuadamente cualquier efecto beneficioso o perjudicial neto del seguimiento.

Algunos investigadores han examinado los efectos psicológicos del seguimiento (Kjeldsen 1997; ONCOLINK; Stiggelbout 1997; Wattchow 2006). Estos estudios informaron efectos contradictorios sobre las medidas de la calidad de vida, aunque ningún estudio encontró un deterioro en la calidad de vida. Algunas formas de seguimiento parecieron ser superiores a prácticamente ningún seguimiento en cuanto a la calidad de vida (Kjeldsen 1997). Los diferentes contextos para el seguimiento (llevado a cabo por el MG versus por el cirujano) no parecieron afectar la ansiedad o la depresión; ambos grupos tuvieron un nivel alto y similar de satisfacción de los participantes (Wattchow 2006). Los estudios en curso analizarán los efectos de la intensificación del seguimiento sobre la calidad de vida en esta población (SURVEILLANCE).

Se necesitan más estudios de investigación del valor que los pacientes le asignan al seguimiento después de la cirugía curativa. Cualquier efecto beneficioso (o falta de efecto beneficioso) del seguimiento sobre la supervivencia se debe considerar junto con los puntos de vista de los pacientes, para que los programas de seguimiento sean accesibles, aceptables y satisfagan todas las necesidades y preocupaciones de los pacientes.

En esta revisión hay pocos datos útiles disponibles de los estudios sobre la coste‐efectividad del seguimiento en este grupo de pacientes tratados para el cáncer colorrectal no metastásico. Parece que el seguimiento realizado por un MG es más económico que el seguimiento realizado por un cirujano (ONCOLINK); el seguimiento adaptado al riesgo es más económico para los que presentan un mejor pronóstico de la enfermedad (Secco 2002), y aunque el coste del seguimiento intensivo es mayor, da lugar a que el coste por recidiva resecable sea menor (Rodríguez‐Moranta 2006). Sin una mejor comprensión de cuáles son las intervenciones específicas del seguimiento responsables de la mejoría en los resultados, no es posible siquiera especular acerca de la posible coste‐efectividad de cualquiera de los enfoques. Algunos investigadores han intentado previamente proyectar los costes de una única intervención, como la pruebas de ACE en suero (Moertel 1996, Audisio 1993) y los costes informados parecen extremadamente grandes. Por otro lado, un análisis de la coste‐efectividad gradual basado en cinco ensayos controlados aleatorios ha informado los costes del seguimiento intensivo, que parecen aceptables en el contexto del National Health Service en el Reino Unido (Renehan 2004), aunque los autores del estudio reconocen varias limitaciones de su estudio. El estudio en curso PRODIGE examina el problema de los costes, por lo que es posible analizar la coste‐efectividad relativa del seguimiento desde una perspectiva económica, además de clínica (SURVEILLANCE).

Es probable que se investiguen nuevos biomarcadores como el ADN tumoral circulante en los estudios futuros del seguimiento para detectar la diseminación y la recidiva metastásica temprana del cáncer colorrectal (Oellerich 2017).

Calidad de la evidencia

Los resultados de esta revisión permiten establecer conclusiones consistentes, con heterogeneidad mínima y bajo riesgo de sesgo de publicación (según los resultados de los gráficos en embudo).

Supervivencia general

Para el resultado de la supervivencia general, se estudiaron 12 528 participantes en 15 estudios. La calidad no se disminuyó por riesgo de sesgo. La evaluación de resultados fue estándar en los estudios incluidos. No se disminuyó la calidad debido a la inconsistencia (I² = 18%; p = 0,25) ni a la falta de direccionalidad: 9054/12 528 (72%) participantes que contribuyeron a este resultado se reclutaron después de 2003 (por lo que se utilizaron investigaciones y técnicas de cirugía de rescate modernas). La calidad no se disminuyó debido a la imprecisión (hubo más de 300 eventos [1453] y los intervalos de confianza excluyeron efectos beneficiosos o perjudiciales clínicamente significativos). La calidad no se disminuyó por sesgo de publicación u otro sesgo. La evaluación con criterios GRADE de la calidad de la evidencia para este resultado fue alta.

Supervivencia específica del cáncer colorrectal

Para el resultado de la supervivencia específica del cáncer colorrectal, se estudiaron 11 771 participantes en 11 estudios. La calidad se disminuyó debido a que el 40% de los eventos provinieron de estudios considerados en alto riesgo de sesgo a causa del informe incompleto de los resultados o a la falta de cegamiento. No se disminuyó la calidad debido a la inconsistencia (I² = 0%; p = 0,57). No se disminuyó la calidad debido a la falta de direccionalidad, a pesar del largo período de tiempo durante el cual los estudios reclutaron a los participantes; el 34% de los participantes incluidos en esta medida de resultado se incluyeron en estudios que reclutaron a los participantes en la década del 2000. La calidad no se disminuyó debido a la imprecisión (hubo más de 300 eventos [925] y los intervalos de confianza excluyeron efectos beneficiosos o perjudiciales clínicamente significativos). La calidad no se disminuyó por sesgo de publicación u otro sesgo. La evaluación GRADE de la calidad de la evidencia para este resultado fue moderada.

Supervivencia libre de recidiva

Para el resultado de la supervivencia sin recidiva, se estudiaron 8047 participantes en 16 estudios. No se disminuyó la calidad debido al riesgo de sesgo, ya que menos del 30% de los eventos procedieron de estudios considerados en alto riesgo de sesgo debido a la falta de cegamiento. No se redujo la calidad debido a la inconsistencia (I² = 41%; p = 0,05); se consideró que era poco probable que hubiera heterogeneidad significativa: el análisis mediante el modelo de efectos fijos proporcionó una magnitud del efecto, una dirección y un IC del 95% similares (CRI 1,15; IC del 95%: 1,05 a 1,25). No hubo asimetría en el gráfico de embudo, lo que también ayudó a excluir la heterogeneidad. La calidad no se disminuyó debido a la imprecisión (hubo más de 300 eventos [2254] y los intervalos de confianza excluyeron efectos beneficiosos o perjudiciales clínicamente significativos). La calidad no se disminuyó por sesgo de publicación u otro sesgo. La evaluación GRADE de la calidad de la evidencia para este resultado fue alta.

Cirugía de rescate

Para el resultado de la cirugía de rescate, se estudiaron 5157 participantes en 13 estudios. La calidad no se disminuyó por riesgo de sesgo. La calidad no se disminuyó por falta de direccionalidad, ya que 1988 de 5854 (33%) participantes que contribuyeron a este resultado se reclutaron en estudios realizados en la década del 2000. Hubo evidencia de precisión (con más de 300 eventos [457] y un tamaño óptimo de información). Aunque hubo alguna evidencia de inconsistencia no significativa (I² = 31%; p = 0,14), se cree que la variación en la intensidad del seguimiento a través de los estudios y el período de tiempo prolongado para el reclutamiento (que permitió técnicas quirúrgicas variadas y diversos grados de agresividad quirúrgica) explicaron esta situación debido a la heterogeneidad clínica entre los estudios, por lo cual lo anterior no se consideró como un motivo para disminuir la calidad. El análisis de sensibilidad predeterminado basado en la antigüedad del estudio apoyó lo anterior (I² = 25%; p = 0,25). La calidad no se disminuyó por sesgo de publicación. La evaluación de GRADE de la calidad de pruebas para este resultado fue alta.

Recidivas de intervalo (sintomáticas)

Para el resultado de las recidivas de intervalo, se estudiaron 3933 participantes en siete estudios. La calidad se disminuyó por riesgo de sesgo porque el 58% de los eventos provinieron de estudios con alto riesgo de sesgo debido a la falta de cegamiento. No se redujo la calificación debido a la inconsistencia (I² = 66%; p = 0,007), ya que el análisis de sensibilidad predeterminado basado en la antigüedad del estudio explicó esta heterogeneidad (I² = 0%; p = 0,81). La calidad no se disminuyó por falta de direccionalidad ni imprecisión (hubo más de 300 eventos [376]) ni debido al sesgo de publicación. La evaluación GRADE de la calidad de las pruebas fue moderada.

Calidad de vida

Los datos de la calidad de vida no estaban disponibles en una forma que permitiera el análisis, por lo que estos datos no se agruparon. Los estudios que compararon el seguimiento intensivo con el seguimiento menos intensivo utilizaron una variedad de escalas para evaluar resultados múltiples. La calidad de la evidencia según GRADE fue moderada, disminuida debido al riesgo de sesgo.

Efectos perjudiciales

Para el resultado de los efectos perjudiciales, se estudiaron 651 participantes en dos estudios. Hubo eventos poco frecuentes (siete eventos informados en 2292 colonoscopias en dos estudios). Se disminuyó la calidad debido a la falta de cegamiento, el sesgo de informe y la imprecisión, por lo que la evaluación GRADE de la calidad de la evidencia fue muy baja.

Costes

Los datos limitados indican que el coste de un seguimiento más intensivo aumenta en comparación con un seguimiento menos intensivo, aunque puede reducirse el coste de la cirugía para la recidiva resecable. La calidad de la evidencia según GRADE fue baja, y se disminuyó debido a la imprecisión (hubo menos de 300 eventos, no se cumplió con el OIS y no se pudo calcular el IC del 95%).

Sesgos potenciales en el proceso de revisión

Los estudios incluidos en esta revisión no informaron los efectos perjudiciales potenciales de las investigaciones ni de los tratamientos de rescate. Es posible que los investigadores hayan excluido de la inscripción en el estudio a los participantes que consideraban que estaban en alto riesgo de recidiva; si esto ocurrió, podría haber diluido el efecto de las estrategias de seguimiento sobre la supervivencia.

Acuerdos y desacuerdos con otros estudios o revisiones

Se identificaron seis revisiones sistemáticas publicadas relevantes a la pregunta. Los hallazgos difieren de los informados enMokhles 2016; Pita‐Fernández 2014; Renehan 2002; y Tjandra 2007: encontraron que el seguimiento intensivo de los participantes tratados con intención curativa para el cáncer colorrectal mejoró la supervivencia. Las otras dos revisiones sistemáticas no informaron de un metanálisis cuantitativo (Augestad 2014; Baca 2011). Ver Tabla 2.

Augestad 2014 buscó en PubMed y en listas de referencias de estudios publicados (sin fecha de búsqueda). No informaron un metanálisis cuantitativo de los cinco estudios que incluyeron. Formularon observaciones de que los datos recientes no informaron una ventaja en la supervivencia (FACS 2014), e indicaron que los posibles efectos beneficiosos sobre la supervivencia se deberían sopesar contra los posibles efectos negativos.

Baca 2011 buscó en PubMed y en listas de referencias (fecha de la búsqueda: junio 2000 a junio 2010). Incluyeron GILDA 1998 (datos de Grossman), Secco 2002 y Wang 2009, aunque no presentaron un metanálisis cuantitativo. Incluyeron estudios aleatorios (n = 5) y no aleatorios (n = 11). Concluyeron que la bibliografía reciente no es concluyente con respecto al efecto beneficioso de la vigilancia para el cáncer colorrectal después del tratamiento curativo. Es probable que la diferencia con los hallazgos de la presente revisión se relacione con la búsqueda más reciente y la inclusión de diez ECA adicionales.

Mokhles 2016 incluyó siete estudios y 3325 participantes. La búsqueda fue sistemática (no se informó la fecha de la búsqueda). Excluyeron los estudios en idioma diferente al inglés. No informaron mejorías en la supervivencia con el seguimiento intensivo (CRI 0,98; IC del 95%: 0,87 a 1,11). Se excluyó Schoemaker 1998 y la revisión se publicó antes de que estuvieran disponibles los resultados de CEAwatch 2015 y COLOFOL 2018. Sus hallazgos respaldan los presentados en esta actualización.

Pita‐Fernández 2014 incluyó 11 ECA con 4055 participantes. Su búsqueda se limitó a cuatro bases de datos bibliográficas (fecha de búsqueda: junio 2014). Informaron que la supervivencia general aumentó con el seguimiento intensivo (CRI 0,75; IC del 95%: 0,66 a 0,86; ver Tabla 2). Incluyeron datos relacionados con el estudio GILDA 1998 de un artículo anterior con una mediana de seguimiento de 14 meses, publicado mientras el ensayo aún reclutaba participantes (Grossman 2004). Además, incluían datos de Secco 2002 y Wattchow 2006, que no se pudieron extraer. Al parecer los datos de la supervivencia general informados en Secco 2002 se pueden haber obtenido de la supervivencia actuarial a los cinco años (informada como porcentajes). Se estableció contacto con los autores del estudio Secco 2002 (detallado en la sección "Métodos"), que informaron que no era posible brindar ninguna información adicional a la presentada en el texto debido a los cambios de personal. Como se señaló anteriormente, al parecer los autores de la revisión obtuvieron de forma incorrecta los datos de la supervivencia general a partir de los porcentajes de supervivencia actuariales informados.

Renehan 2002 incluyó cinco ECA y 1342 participantes. Su búsqueda fue sistemática (fecha de la búsqueda: April 2001). Informaron una mejor supervivencia con el seguimiento intensivo en este contexto. Nuevamente, es probable que la diferencia con los hallazgos de la presente revisión se relacione con la búsqueda más reciente y la inclusión de diez ECA adicionales.

Tjandra 2007 incluyó ocho ECA y 2923 participantes. Su búsqueda fue sistemática (fecha de la búsqueda: junio 2007). Informaron una mejor supervivencia con el seguimiento intensivo. Nuevamente, es probable que la diferencia con los hallazgos de la presente revisión se relacione con la búsqueda más reciente y la inclusión de diez ECA adicionales.

La versión anterior de esta revisión Cochrane también encontró una mejoría en la supervivencia en este contexto (Jeffery 2007). La versión actualizada de 2016 de la revisión (Jeffery 2016) contradijo los efectos informados previamente de la vigilancia sobre la supervivencia de los participantes tratados con intención curativa para el cáncer colorrectal. Esta versión actualizada de la revisión, que ahora incluye datos de 19 estudios con 13 216 participantes, consolida estas conclusiones.

Study flow diagram
Figuras y tablas -
Figure 1

Study flow diagram

'Risk of bias' summary: review authors' judgements about each 'Risk of bias' item for each included study
Figuras y tablas -
Figure 2

'Risk of bias' summary: review authors' judgements about each 'Risk of bias' item for each included study

Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.1 overall survival
Figuras y tablas -
Figure 3

Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.1 overall survival

Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.2 colorectal cancer‐specific survival
Figuras y tablas -
Figure 4

Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.2 colorectal cancer‐specific survival

Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.3 relapse‐free survival
Figuras y tablas -
Figure 5

Funnel plot of comparison 1. Intensive follow‐up versus minimalist follow‐up, outcome: 1.3 relapse‐free survival

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 1 Overall survival.
Figuras y tablas -
Analysis 1.1

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 1 Overall survival.

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 2 Colorectal cancer‐specific survival.
Figuras y tablas -
Analysis 1.2

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 2 Colorectal cancer‐specific survival.

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 3 Relapse‐free survival.
Figuras y tablas -
Analysis 1.3

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 3 Relapse‐free survival.

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 4 Salvage surgery.
Figuras y tablas -
Analysis 1.4

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 4 Salvage surgery.

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 5 Interval recurrences.
Figuras y tablas -
Analysis 1.5

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 5 Interval recurrences.

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 6 Harms (colonoscopic complications).
Figuras y tablas -
Analysis 1.6

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 6 Harms (colonoscopic complications).

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 7 Overall survival SG Healthcare professional.
Figuras y tablas -
Analysis 1.7

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 7 Overall survival SG Healthcare professional.

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 8 Overall survival SGA "dose" of follow‐up.
Figuras y tablas -
Analysis 1.8

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 8 Overall survival SGA "dose" of follow‐up.

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 9 OS SGA CEA versus NO CEA.
Figuras y tablas -
Analysis 1.9

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 9 OS SGA CEA versus NO CEA.

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 10 OS CT versus no CT.
Figuras y tablas -
Analysis 1.10

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 10 OS CT versus no CT.

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 11 OS CT versus < 2 or no CT.
Figuras y tablas -
Analysis 1.11

Comparison 1 Intensive follow‐up versus minimalist follow‐up, Outcome 11 OS CT versus < 2 or no CT.

Summary of findings for the main comparison. Intensive follow‐up compared to less intensive follow‐up for patients treated for colorectal cancer with curative intent

Intensive follow‐up compared to less intensive follow‐up for patients treated for colorectal cancer with curative intent

Participants: people with non‐metastatic colorectal cancer treated with curative intent

Setting: primary and secondary care

Interventions: more intensive follow‐up (clinic visits and investigations aimed at detecting recurrence)

Comparison: less intensive follow‐up

Outcomes

№ of participants
(studies)

Quality of the evidence
(GRADE)

Relative effect
(95% CI)

Anticipated absolute effects* (95% CI)

Risk with less intensive follow‐up

Risk difference with intensive follow‐up

Overall survival
Follow‐up: range 8 months to 134 months

12,528
(15 RCTs)

⊕⊕⊕⊕
Higha,b

HR 0.91
(0.80 to 1.04)

Study population

107 per 1000

22 fewer per 1000
(60 fewer to 9 more)c

Colorectal cancer‐specific survival
Follow‐up: range 8 months to 134 months

11,771
(11 RCTs)

⊕⊕⊕⊝
Moderatea,b,d

HR 0.93
(0.81 to 1.07)

Study population

73 per 1000

15 fewer per 1000
(47 fewer to 12 more)

Relapse‐free survival
Follow‐up: range 48 months to 120 months

8047
(16 RCTs)

⊕⊕⊕⊕
Higha,b

HR 1.05
(0.92 to 1.21)

Study population

283 per 1000

17 more per 1000
(30 fewer to 66 more)

Salvage surgery (surgery at relapse with curative intent)
Follow‐up: range 2 months to 134 months

5157
(13 RCTs)

⊕⊕⊕⊕
Highe

RR 1.98
(1.53 to 2.56)

Study population

62 per 1000

60 more per 1000
(33 more to 96 more)

Interval recurrences (recurrence CRC diagnosed between scheduled follow‐up visits)
Follow‐up: range 2 months to 134 months

3933
(7 RCTs)

⊕⊕⊕⊝
Moderatee,f

RR 0.59
(0.41 to 0.86)

Study population

127 per 1000

52 fewer per 1000
(75 fewer to 18 fewer)

Harms

Colonoscopy complications ‐ bowel perforation

326

(1 RCT)

⊕⊝⊝⊝
Very Lowg

RR 6.83

(0.36 to 131.21)

Study population

0 per 1000

0 fewer per 1000
(0 fewer to 0 fewer)

*The risk in the intervention group (and its 95% confidence interval) is based on the assumed risk in the comparison group and the relative effect of the intervention (and its 95% CI).

CI: confidence interval; CRC: colorectal cancer; HR: hazard ratio; RCT: randomised controlled trial; RR: risk ratio; OR: Peto odds ratio

GRADE Working Group grades of evidence
High quality: further research is very unlikely to change our confidence in the estimate of effect.
Moderate quality: further research is likely to have an important impact on our confidence in the estimate of effect and may change the estimate.
Low quality: further research is very likely to have an important impact on our confidence in the estimate of effect and is likely to change the estimate.
Very low quality: we are very uncertain about the estimate.

aNot downgraded for imprecision because there were more than 300 events.
bConfidence intervals include 1 and exclude clinically meaningful benefit or harm.
cWe used the number of events in the control arms of the included studies to derive absolute values.
dDowngraded because we deemed 192/468 (41%) events from studies at high risk of bias because of incomplete follow‐up.
eNot downgraded because prespecified sensitivity analysis explained heterogeneity on basis of study age.
fDowngraded because we deemed 95/178 (58%) events from studies at high risk of bias because of incomplete follow‐up.
gDowngraded for risk of bias related to lack of blinding and imprecision.

Figuras y tablas -
Summary of findings for the main comparison. Intensive follow‐up compared to less intensive follow‐up for patients treated for colorectal cancer with curative intent
Table 1. Interventions in included studies

Study

More intensive follow‐up

Less intensive follow‐up

Studies comparing more visits and tests versus fewer visits and tests

CEAwatch 2015

CEA 2‐monthly year 1‐3, then 3‐monthly year 4‐5

Clinic visits 12‐monthly year 1‐3

CT CAP 12 monthly for 3 years

CXR and liver US annually year 1‐3

CEA 3‐6‐monthly year 1‐3, 12 monthly year 4‐5

Clinic visits 6‐monthly year 1‐3, 12 monthly year 4‐5

CXR and liver US 6‐monthly year 1‐3, 12‐monthly year 4‐5

GILDA 1998

Office visits at 4, 8, 12, 16, 20, 24, 30, 36, 42, 48, and 60 months and history and clinical examination, FBC, CEA, and CA 19‐9

Colonoscopy and CXR at 12, 24, 36, 48, and 60 months

Liver US at 4, 8, 12, 16, 24, 36, 48, and 60 months

For rectal participants, pelvic CT at 4, 12, 24, and 48 months

Office visits at 4, 8, 12, 16, 20, 24, 30, 42, 48, and 60 months, including history, examination, and CEA

Colonoscopy at 12 and 48 months

Liver US at 4 and 16 months

Rectal cancer participants in addition had rectoscopy at 4 months, CXR at 12 months, and liver US at 8 and 16 months. A single pelvic CT was allowed if a radiation oncologist required it as baseline following adjuvant treatment

Kjeldsen 1997

Clinic visits at 6, 12, 18, 30, 36, 48, 60, 120, 150, and 180 months after radical surgery
Examinations included medical history, clinical examination, DRE, gynaecological examination, Haemoccult‐II test, colonoscopy, CXR, haemoglobin level, erythrocyte sedimentation rate, and liver enzymes

Clinic visits at 60, 120, and 180 months

Examinations included medical history, clinical examination, DRE, gynaecological examination, Haemoccult‐II test, colonoscopy, CXR, haemoglobin level, erythrocyte sedimentation rate, and liver enzymes

Mäkelä 1995

Participants with rectal or sigmoid cancers had flexible sigmoidoscopy with video imaging every 3 months, colonoscopy at 3 months (if it had not been done preoperation), then annually. Liver US and primary site at 6 months, then annually

Participants who had rectal and sigmoid cancers had rigid sigmoidoscopy and barium enema annually

Pietra 1998

Clinic visits at 3, 6, 9, 12, 15, 18, 21, 24, 30, 36, 42, 48, 54, and 60 months, then annually thereafter.

At each visit: clinical examination, US, CEA, and CXR. Annual CT liver and colonoscopy were performed

Seen at 6 and 12 months, then annually.

At each visit, clinical examination, CEA, and US were performed. They had annual CXR, yearly colonoscopy, and CT scan.

Rodríguez‐Moranta 2006

History, examination, and bloods (including CEA), US/CT, CXR, and colonoscopy

history, examination, and bloods (including CEA)

Sobhani 2008

PET performed at 9 and 15 months and conventional follow‐up

Conventional follow‐up

Sobhani 2018

FDG PET/CT at 6, 12, 18, 24, 30 and 36 months pus conventional follow‐up

Conventional follow‐up: physical examination and laboratory tests (FBC, tumour markers) at 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36 months, liver US and CXR at 3, 9, 15, 21, 27, 33 months, CT CAP at 6, 12, 18, 24, 30 and 36 months, colonoscopy at 12 and 36 months

SurvivorCare 2013

Nurse‐led survivorship care package:

  1. educational materials

  2. needs assessment

  3. survivorship care plan

  4. end‐of‐treatment session

  5. 3 follow‐up phone calls plus usual care

Usual care defined as: "care according to the treating cancer centre or practitioner's usual practice"

Treasure 2014

CEA rise triggered 'second‐look' surgery, with intention to remove any recurrence discovered

CEA rise did not trigger 'second‐look' surgery

Wang 2009

Colonoscopy at each visit

Colonoscopy at 6 months, 30 months, and 60 months from randomisation

Studies comparing tests and visits with minimal or no follow‐up

COLOFOL 2018

CEA 1 month postoperatively then CEA, CT chest and abdomen 6, 12, 18, 24, and 36 months

CEA 1 month postoperatively then CEA, CT chest and abdomen 12 and 36 months after surgery

FACS 2014

  1. CEA testing every 3 months for 2 years, then every 6 months for 3 years with a single CT scan of the CAP if requested at study entry by clinician

  2. CT scan of the CAP every 6 months for 2 years, then annually for 3 years, plus colonoscopy at 2 years

  3. CEA and CT follow‐up: both blood and imaging as above, plus colonoscopy at 2 years

No scheduled follow‐up except a single CT scan of the CAP if requested at study entry by a clinician

Ohlsson 1995

3‐, 6‐, 9‐, 12‐, 15‐, 18‐, 21‐, 24‐, 30‐, 36‐, 42‐, 48‐, and 60‐month clinic visits. Performed at each visit were clinical exam, rigid proctosigmoidoscopy, CEA, alkaline phosphatase, gamma‐glutaryl transferase, faecal haemoglobin, and CXR. Examination of anastomosis (flexible sigmoidoscopy or colonoscopy, as dictated by the lesion) was performed at 9, 21, and 42 months. Colonoscopy was performed at 3, 15, 30, and 60 months. CT of the pelvis was performed at 3, 6, 12, 18, and 24 months.

No planned follow‐up visits. Participants received written instructions recommending that they leave faecal samples with the district nurse for examination every third month during the first 2 years after surgery then once a year. They were instructed to contact the surgical department if they had any symptoms.

Schoemaker 1998

Yearly CXR, CT of the liver, and colonoscopy

These investigations were only performed in the control group if indicated on clinical grounds or after screening test abnormality, and at 5 years of follow‐up, to exclude a reservoir of undetected recurrences

Secco 2002

Clinic visits and serum CEA, abdomen/pelvic US scans, and CXR. Participants with rectal carcinoma had rigid sigmoidoscopy and CXR.

"minimal follow‐up programme performed by physicians"

Studies that assessed effect of setting for follow‐up

ONCOLINK

Surgeon‐led follow‐up

Frequency of follow‐up equal

GP‐led follow‐up

Frequency of follow‐up equal

Strand 2011

Surgeon‐led follow‐up

Nurse‐led follow‐up

Wattchow 2006

Primary care setting and environment for follow‐up
Follow‐up guidance was based on current clinical practice, and guidance was provided that suggested follow‐up visits every 3 months for the first 2 years postoperatively, then every 6 months for the next 3 years.
Each visit incorporated asking a list of set questions about symptoms, physical examination, annual faecal occult blood testing, and colonoscopy every 3 years

Secondary care setting for follow‐up

CA 19‐9: cancer antigen 19‐9; CEA: carcinoembryonic antigen; CAP: chest, abdomen, pelvis; CT: computed tomography; CXR: chest X‐ray; DRE: digital rectal examination; FBC: full blood count; FDG: fluorodeoxyglucose; PET: positron emission tomography; US: ultrasound

Figuras y tablas -
Table 1. Interventions in included studies
Table 2. Systematic reviews on topic

Study

Number of studies included

Search date

Outcomes for overall survival for comparison intensive versus less intensive follow‐up for participants treated with curative intent for colorectal cancer

Augestad 2014

Unclear

No search date given

Did not present quantitative meta‐analysis

Baca 2011

15

January 2000 to 2001

Did not present quantitative meta‐analysis

Pita‐Fernández 2014

11

June 2014

HR 0.75 (95% CI 0.66 to 0.86)

Renehan 2002

5

April 2001

RR 0.81 (95% CI 0.70 to 0.94)

Tjandra 2007

8

June 2007

OR 0.74 (95% CI 0.59 to 0.93)

CI: confidence interval; HR: hazard ratio; OR: odds ratio; RR: risk ratio

Figuras y tablas -
Table 2. Systematic reviews on topic
Comparison 1. Intensive follow‐up versus minimalist follow‐up

Outcome or subgroup title

No. of studies

No. of participants

Statistical method

Effect size

1 Overall survival Show forest plot

15

12528

Hazard Ratio (Random, 95% CI)

0.91 [0.80, 1.04]

2 Colorectal cancer‐specific survival Show forest plot

11

11771

Hazard Ratio (Random, 95% CI)

0.93 [0.81, 1.07]

3 Relapse‐free survival Show forest plot

16

8047

Hazard Ratio (Random, 95% CI)

1.05 [0.92, 1.21]

4 Salvage surgery Show forest plot

13

5157

Risk Ratio (M‐H, Random, 95% CI)

1.98 [1.53, 2.56]

5 Interval recurrences Show forest plot

7

3933

Risk Ratio (M‐H, Random, 95% CI)

0.59 [0.41, 0.86]

6 Harms (colonoscopic complications) Show forest plot

1

326

Peto Odds Ratio (Peto, Fixed, 95% CI)

7.30 [0.75, 70.69]

7 Overall survival SG Healthcare professional Show forest plot

15

Odds Ratio (Random, 95% CI)

Subtotals only

7.1 Community

2

Odds Ratio (Random, 95% CI)

1.39 [0.38, 5.12]

7.2 Hospital

13

Odds Ratio (Random, 95% CI)

0.91 [0.80, 1.03]

8 Overall survival SGA "dose" of follow‐up Show forest plot

11

Hazard Ratio (Random, 95% CI)

0.89 [0.77, 1.02]

8.1 More visits and tests versus fewer visits and tests

7

Hazard Ratio (Random, 95% CI)

0.85 [0.69, 1.05]

8.2 VIsits and tests versus minimal or no follow‐up

4

Hazard Ratio (Random, 95% CI)

0.93 [0.76, 1.12]

9 OS SGA CEA versus NO CEA Show forest plot

7

Hazard Ratio (Random, 95% CI)

0.95 [0.82, 1.11]

9.1 CEA

6

Hazard Ratio (Random, 95% CI)

0.97 [0.79, 1.19]

9.2 No CEA

1

Hazard Ratio (Random, 95% CI)

0.90 [0.67, 1.21]

10 OS CT versus no CT Show forest plot

10

Hazard Ratio (Random, 95% CI)

0.93 [0.81, 1.08]

10.1 CT

7

Hazard Ratio (Random, 95% CI)

0.93 [0.79, 1.10]

10.2 No CT

3

Hazard Ratio (Random, 95% CI)

1.31 [0.40, 4.23]

11 OS CT versus < 2 or no CT Show forest plot

9

Hazard Ratio (Random, 95% CI)

0.87 [0.73, 1.05]

11.1 CT

6

Hazard Ratio (Random, 95% CI)

0.82 [0.65, 1.04]

11.2 < 2 or no CT

3

Hazard Ratio (Random, 95% CI)

1.04 [0.70, 1.54]

Figuras y tablas -
Comparison 1. Intensive follow‐up versus minimalist follow‐up