Scolaris Content Display Scolaris Content Display

Intervenciones quirúrgicas versus conservadoras para el tratamiento de las fracturas del tercio medio de la clavícula

Contraer todo Desplegar todo

Antecedentes

La fractura de clavícula es frecuente y representa entre el 2,6% y 4% de todas las fracturas. El 80% de las fracturas de clavícula se localizan en su tercio medio. Aunque el tratamiento de dichas fracturas por lo general es no quirúrgico, las fracturas de clavícula desplazadas pueden considerarse para el tratamiento quirúrgico debido al mayor riesgo de fracaso de la consolidación. Ésta es una actualización de una revisión Cochrane publicada por primera vez en 2013.

Objetivos

Evaluar los efectos (beneficiosos y perjudiciales) de las intervenciones quirúrgicas versus conservadoras para el tratamiento de las fracturas del tercio medio de la clavícula.

Métodos de búsqueda

Se hicieron búsquedas en el registro especializado del Grupo Cochrane de Lesiones Óseas, Articulares y Musculares (Cochrane Bone, Joint and Muscle Trauma Specialised Register), CENTRAL, MEDLINE, Embase, LILACS, en registros de ensayos y en listas de referencias actualizadas hasta diciembre 2017. No se aplicó ninguna restricción de idioma ni de publicación.

Criterios de selección

Se consideraron los ensayos controlados aleatorios y cuasialeatorios que evaluaron las intervenciones quirúrgicas versus conservadoras para el tratamiento de las fracturas del tercio medio de la clavícula. Los resultados primarios fueron la funcionalidad del hombro o la discapacidad, el dolor y el fracaso del tratamiento (definido como el número de participantes que recibieron una intervención quirúrgica secundaria diferente a la habitual [con la exclusión de la extracción del implante] debido al fracaso de la consolidación sintomática, la consolidación viciosa u otras complicaciones.

Obtención y análisis de los datos

Al menos dos autores de la revisión, de manera independiente, seleccionaron los ensayos elegibles, evaluaron el riesgo de sesgo y realizaron la verificación cruzada de los datos. Cuando fue apropiado se agruparon los resultados de los estudios comparables.

Resultados principales

Se incluyeron 14 estudios con 1469 participantes que presentaban fracturas del tercio medio de la clavícula. Todos los estudios incluyeron adultos, con un rango general de 17 a 70 años. En los estudios que informaron el género, los hombres estuvieron sobrerrepresentados. Diez estudios compararon la fijación con placas con un cabestrillo o venda en ocho, o ambas, y cuatro estudios compararon la fijación intramedular con un cabestrillo o venda en ocho. Casi todos los ensayos tuvieron características de diseño con un alto riesgo de sesgo, lo que limita la solidez de los hallazgos.

La evidencia de calidad baja de diez estudios (838 participantes) indicó que, en comparación con el tratamiento conservador, el tratamiento quirúrgico de las fracturas agudas del tercio medio de la clavícula puede no mejorar la funcionalidad del antebrazo al seguimiento al año o más: diferencia de medias estandarizada [DME] 0,33; intervalo de confianza [IC] del 95% ‐0,02 a 0,67. La calidad de la evidencia se disminuyó debido al riesgo de sesgo y a la heterogeneidad estadística alta (I2 = 83%). Estos datos corresponden a una mejoría media de 2,3 puntos a favor de la cirugía (0,14 puntos peor a 4,69 puntos de mejoría) en la puntuación de Constant de 100 puntos; lo que no representa una diferencia clínicamente importante. Puede no haber diferencias en el dolor medido mediante una escala analógica visual (0 a 100 mm; puntuaciones mayores significan peor dolor) entre los tratamientos (diferencia de medias [DM] ‐0,60 mm; IC del 95%: ‐3,51 a 2,31; 277 participantes, tres estudios; evidencia de calidad baja que representa el riesgo de sesgo y la imprecisión). La cirugía puede reducir el riesgo de fracaso del tratamiento, o sea, el número de participantes que recibieron una cirugía secundaria no rutinaria (con la exclusión de la extracción del implante), debido al fracaso de la consolidación sintomática, la consolidación viciosa u otra complicación (cociente de riesgos [CR] 0,32; IC del 95%: 0,20 a 0,50; 1197 participantes, 12 estudios; evidencia de calidad baja, disminuida por el riesgo de sesgo y la imprecisión). La fuente principal de fracaso del tratamiento fue el fracaso mecánico (3,4%) en el grupo de cirugía y el fracaso de la consolidación sintomática (11,6%) en el grupo de tratamiento conservador.

No se sabe si la cirugía da lugar a que menos pacientes presenten uno o más problemas cosméticos como las deformidades, que fueron más frecuentes después del tratamiento conservador, o la prominencia del implante o la cicatrización, que solo ocurrió en el grupo de cirugía (CR 0,55; IC del 95%: 0,31 a 0,98; 1130 participantes, 11 estudios; I2 = 63%; evidencia de calidad muy baja, disminuida por el riesgo de sesgo, la imprecisión y la inconsistencia). No se sabe si hay diferencias entre la cirugía y el tratamiento conservador en cuanto al riesgo de incurrir en un resultado adverso como infección local, dehiscencia, consolidación viciosa sintomática, molestias que provocan la extracción del implante, problemas cutáneos y nerviosos: CR 1,34; IC del 95%: 0,68 a 2,64; 1317 participantes, 14 estudios; I2 = 72%; evidencia de calidad muy baja, disminuida por el riesgo de sesgo, la imprecisión y la inconsistencia). La extracción del implante debido a molestias fue un resultado adverso frecuente en el grupo de cirugía (10,2%), mientras que la consolidación viciosa sintomática fue más frecuente en el grupo de tratamiento conservador (11,3% versus 1,2% en el grupo de cirugía). La infección solo ocurrió en el grupo de cirugía (3,2%). Podría no haber diferencias entre los grupos en cuanto a la calidad de vida al año (puntuaciones del componente físico del SF‐12 o el SF‐36: escala 0 a 100, donde 100 es la mejor puntuación): DM 0,30 (IC del 95%: ‐1,95 a 2,56; 321 participantes, dos estudios; la calificación de esta evidencia se disminuyó a baja por el riesgo de sesgo y la imprecisión).

Conclusiones de los autores

Hay evidencia de calidad baja de que el tratamiento quirúrgico no tiene efectos beneficiosos adicionales en cuanto a la funcionalidad, el dolor ni la calidad de vida en comparación con el tratamiento conservador, pero podría dar lugar a menos fracasos del tratamiento en general. La evidencia de muy baja calidad significa que no se sabe si los hallazgos de un resultado cosmético son ligeramente mejores después de la cirugía, ni si hay diferencias entre el tratamiento quirúrgico y conservador en cuanto al riesgo de eventos adversos. En ambos resultados compuestos es necesario considerar el equilibrio de los riesgos entre los resultados individuales; por ejemplo, los eventos adversos quirúrgicos, que incluyen la infección o la dehiscencia de la herida y la irritación del implante, contra el riesgo de los eventos adversos que se pueden asociar con más frecuencia con el tratamiento conservador como la consolidación viciosa sintomática y la rigidez del hombro.

Las opciones de tratamiento deben elegirse sobre la base del paciente individual, después de la consideración cuidadosa de los efectos beneficiosos y perjudiciales relativos de cada intervención y de las preferencias del paciente.

PICO

Population
Intervention
Comparison
Outcome

El uso y la enseñanza del modelo PICO están muy extendidos en el ámbito de la atención sanitaria basada en la evidencia para formular preguntas y estrategias de búsqueda y para caracterizar estudios o metanálisis clínicos. PICO son las siglas en inglés de cuatro posibles componentes de una pregunta de investigación: paciente, población o problema; intervención; comparación; desenlace (outcome).

Para saber más sobre el uso del modelo PICO, puede consultar el Manual Cochrane.

Intervenciones quirúrgicas versus conservadoras para el tratamiento de las fracturas de clavícula en adolescentes y adultos

Este resumen presenta lo que se conoce a partir de la investigación acerca de los efectos de la cirugía en comparación con los tratamientos no quirúrgicos (conservadores) como el uso de un cabestrillo o de un vendaje con nudo en ocho durante dos a seis semanas para tratar las fracturas de clavícula.

Antecedentes

La clavícula actúa como un puente a través del frente del tórax que conecta el brazo y la caja torácica. Ayuda a estabilizar el hombro mientras permite que el brazo se mueva libremente, proporciona un área en la que se adhieren los músculos, y también funciona como parte del aparato musculoesquelético utilizado en la respiración. La clavícula también protege los nervios y los vasos sanguíneos, y desempeña una función estética importante en la apariencia física de la persona. El sitio más común de la fractura de clavícula es el tercio medio de la clavícula. La lesión ocurre con frecuencia en jóvenes y adultos mayores. Por lo general, es ocasionada por una caída directamente sobre el lado exterior del hombro. La mayoría de las fracturas del tercio medio de la clavícula se tratan de forma conservadora (tratamiento no quirúrgico). Sin embargo, el resultado puede ser insatisfactorio para las fracturas más graves. El tratamiento quirúrgico incluye la colocación del hueso en su lugar y, generalmente, la realización de la fijación interna mediante el uso de una placa y tornillos o de una varilla metálica, que se inserta en la cavidad interna (médula) de la clavícula.

Resultados de la búsqueda

Se efectuaron búsquedas en las bases de datos médicas hasta diciembre de 2017 y se incluyeron 14 estudios con 1469 participantes con fracturas desplazadas o en ángulo del tercio medio de la clavícula. Todos los participantes eran adultos, con edades comprendidas entre los 17 y los 70 años, y había más hombres que mujeres. Diez estudios compararon la fijación con placas con una intervención conservadora (un cabestrillo o venda en ocho), y cuatro estudios compararon la fijación intramedular con un cabestrillo o venda en ocho.

Resultados clave

La revisión indicó que la cirugía, en comparación con el tratamiento conservador, puede no mejorar la funcionalidad del antebrazo, el dolor ni la calidad de vida al año. Sin embargo, la cirugía puede reducir el riesgo de fracaso del tratamiento cuando se requiere cirugía secundaria para las fracturas no consolidadas o consolidadas de forma incorrecta. No se sabe si la cirugía proporciona un mejor resultado cosmético en general. Aunque la cirugía reduce la deformidad del hombro, puede dar lugar a cicatrices antiestéticas y a que el implante sobresalga. No se sabe si hay una diferencia entre la cirugía y el tratamiento conservador en cuanto al riesgo de que tener una complicación. Sin embargo, la naturaleza de dichas complicaciones a menudo difiere según el tratamiento. Las complicaciones de la cirugía, como la infección y la abertura de la herida, o la irritación del implante que requiere cirugía adicional, se deben sopesar contra las complicaciones que son más probables que ocurran con un cabestrillo, como la rigidez del hombro y el fracaso en la consolidación adecuada de la fractura.

Calidad de la evidencia

Los 14 estudios presentaron deficiencias que podrían afectar la fiabilidad de los resultados. Se consideró que la evidencia para todos los resultados fue de calidad baja o muy baja.

Conclusión

Evidencia de calidad baja indica que la cirugía puede no dar lugar a efectos beneficiosos sobre el tratamiento conservador, ni a más complicaciones. Sin embargo no hay seguridad acerca de estos efectos y los estudios adicionales pueden cambiar estas conclusiones.

Conclusiones de los autores

disponible en

Implicaciones para la práctica

En general, se dispone de evidencia de baja calidad a partir de los ensayos controlados aleatorios sobre la efectividad relativa del tratamiento quirúrgico versus conservador para las fracturas agudas del tercio medio de la clavícula. Sobre la base de la evidencia de calidad baja proveniente de 14 estudios, la cirugía podría no tener efectos beneficiosos adicionales en cuanto a la funcionalidad, el dolor ni la calidad de vida en comparación con los tratamientos conservadores, pero podría dar lugar a menos fracasos generales del tratamiento (participantes sometidos o que se consideran para una cirugía secundaria no rutinaria debido al fracaso de la consolidación sintomática, consolidación viciosa, fracaso mecánico u otras complicaciones). Aunque no se sabe si el riesgo general de eventos adversos difiere entre el tratamiento quirúrgico y conservador, es necesario tener en cuenta la naturaleza de los eventos. Por lo tanto, el riesgo de eventos quirúrgicos adversos, incluida la infección o la dehiscencia de la herida y la irritación del implante, se debe sopesar contra el riesgo de eventos adversos que se puede asociar con más frecuencia con el tratamiento conservador, como la consolidación viciosa sintomática y la rigidez del hombro. Tampoco se sabe si el resultado cosmético estuvo ligeramente a favor del grupo quirúrgico. Nuevamente, existe la necesidad de considerar la naturaleza de los resultados cosméticos individuales, algunos de los cuales son específicos de la cirugía, como la cicatrización antiestética y la prominencia del implante y otros de los cuales son más frecuentes con el tratamiento conservador, como la deformidad del hombro.

Hasta que se disponga de evidencia definitiva, las opciones de tratamiento se deben elegir según cada caso individual y considerar con cautela los efectos beneficiosos y perjudiciales relativos de cada intervención, así como las preferencias de los pacientes.

Implicaciones para la investigación

En parte como preparación para los estudios futuros de intervenciones de tratamientos para estas fracturas, se necesitan estudios de investigación para identificar o desarrollar, y luego validar, las medidas de resultado de funcionalidad y satisfacción con el resultado específicas de la afección e informadas por los pacientes. Además de centrarse en las medidas de funcionalidad y satisfacción informadas por los pacientes, todos los estudios futuros deben obtener como mínimo los resultados relacionados con el dolor, los eventos adversos y los costos. Es importante la recopilación sistemática de los datos para evaluar los resultados a corto, medios y largo plazo después del tratamiento (p.ej., durante el primer mes, a los seis meses y al año). También se recomienda que los ECA futuros se adhieran a las normas de informe siguiendo la declaración CONSORT (Schulz 2010) y proporcionar todos los datos de los resultados continuos y los totales de los participantes con eventos adversos. Los estudios de investigación adicionales también podrían ser útiles para identificar esos subgrupos de la población con una tasa mayor de fracaso de la consolidación; esto podría informar el diseño del estudio, como estimular a los pacientes a que no fumen como parte del plan de tratamiento, el subagrupamiento dentro de los estudios clínicos o proporcionar una justificación para centrarse en el subgrupo de pacientes con mayores probabilidades de beneficiarse de la cirugía.

Summary of findings

Open in table viewer
Summary of findings for the main comparison. Surgical versus conservative interventions for treating fractures of the middle third of the clavicle

Surgical versus conservative interventions for treating fractures of the middle third of the clavicle

Patient or population: adults with acute fracture of the middle third of the clavicle
Settings: hospital (tertiary care)
Intervention: surgery (e.g. plate fixation or intramedullary fixation)

Comparison: conservative intervention (e.g. arm sling or figure‐of‐eight bandage)

Outcomes

Illustrative comparative risks* (95% CI)

Relative effect
(95% CI)

No of participants
(studies)

Quality of the evidence
(GRADE)

Comments

Assumed risk

Corresponding risk

Conservative treatment

Surgical treatment

Function (overall)
Various toolsa; higher values mean better function (0 to 100 scale, 100 is best function)
Follow‐up: 12 months

Mean (SD) population Constant score 89 (7)b

The standardised mean difference in function (overall) in the surgery groups was 0.33 standard deviations higher (0.02 lower to 0.67 higher)

838

(10 studies)

⊕⊕⊝⊝
lowc,d

The SMD resultb equates to a mean improvement of 2.3 points (0.14 points worse to 4.69 points better) in favour of surgery on the Constant scale (0 to 100 scale; higher scores mean better function). This does not represent a clinically important difference. The MCID of Constant scale ranges from 5.7 to 10.4 points.

Pain

VAS: 0 to 100 mm (0 is no pain and 100 mm is the worst score)

Follow‐up: 12 months

The mean pain in the control groups was 7 mm

The mean pain in the surgery groups was reduced by 0.6 mm (‐3.51 lower to 2.31 higher)

277

(3 studies)

⊕⊕⊝⊝
lowc,e

This is not a clinically important effect.

The MCID of VAS for shoulder injury is 14 mm.

Treatment failuref Indication for non‐routine secondary surgery
Follow‐up: 12 months

132 per 1000g

43 per 1000
(27 to 66)

RR 0.32
(0.20 to 0.50)

1197
(12 studies)

⊕⊕⊝⊝
lowc,e

The main source of treatment failure in the conservative treatment group was symptomatic non‐union (61 cases/527 (11.6%); 10 studies) and in the surgical group it was mechanical failure (16/468 (3.4%); 7 studies). Overall treatment failure in the conservative group is dominated by the results of 2 studiesh (289 participants): 33/77 = 43%.

2 studies (118 participants) reported that they had no treatment failures in either group.

Cosmetic problemi
Follow‐up: 12 months

218 per 1000g

120 per 1000
(68 to 214)

RR 0.55

(0.31 to 0.98)

1130
(11 studies)

⊕⊝⊝⊝
very lowc,e,j

The derivation of this outcome (number of people with ≥ 1 cosmetic problems) varied across the studies. Cosmetic deformity and/or asymmetry was greater in the conservative group and hardware prominence not requiring implant removal and scarring occurred only in the surgical group.k

Total of participants with adverse event outcomel
Follow‐up: 12 months

107 per 1000g

144 per 1000

(73 to 282)

RR 1.34 (0.68 to 2.64)

1317
(14 studies)

⊕⊝⊝⊝
very lowc,e,m

The derivation of this outcome (number of people with ≥ 1 adverse events) varied across the studies. Hardware, removed likely due to discomfort, was most frequent in the surgical group (52/508 (10.2%); 9 studies), and symptomatic malunion (45/397 (11.3%); 9 studies), in the conservative group. Infection and/or dehiscence occurred only in the surgical group (22/686 (3.2%); 11 studies).n

Health‐related quality of life: SF‐36 or SF‐12 physical component score at 1 year (0 to 100 points, 100 is best)

The mean health‐related quality of life: SF‐36 or SF‐12 physical component score at 1 year was 54.7

MD 0.30 higher (1.95 lower to 2.56 higher)

321

(2 studies)

⊕⊕⊝⊝
lowc,e

This does not represent a clinically important difference. The MCID of SF‐36 ranges from 2.0 to 7.8 points (scale 0 to 100).

*The basis for the assumed risk for dichotomous outcomes is provided in footnotes. The corresponding risk (and its 95% confidence interval) is based on the assumed risk in the comparison group and the relative effect of the intervention (and its 95% CI).
CI: confidence interval; MCID: minimal clinical important difference; MD: mean difference; RR: risk ratio; SD: standard deviation; SMD: standardised mean difference; VAS: visual analogue scale

GRADE Working Group grades of evidence:
High quality: we are very confident that the true effect lies close to that of the estimate of the effect.
Moderate quality: we are moderately confident in the effect estimate: the true effect is likely to be close to the estimate of the effect, but there is a possibility that it is substantially different.
Low quality: our confidence in the effect estimate is limited: the true effect may be substantially different from the estimate of the effect.
Very low quality: we have very little confidence in the effect estimate: the true effect is likely to be substantially different from the estimate of effect.

aPatient‐reported functional scores were Constant score (7 studies), the Disability of the Arm, Shoulder, and Hand questionnaire (DASH; 1 study), the UCLA score (1 study) and Single Assessment Numeric Evaluation (SANE) score (1 study).
bThis is based on the mean (SD) Constant score in a healthy population as reported in Yian 2005; mean improvement in Constant score back‐translated from SMD using the SD from the healthy population.
cAll studies had methodological flaws; only two adequately concealed treatment allocation, and all were susceptible to detection bias in the measurement of self‐reported outcomes due to lack of blinding of the participant. All outcomes were downgraded one level for serious risk of bias.
dThere was considerable heterogeneity (I2 = 83%), and thus we downgraded the quality of the evidence by one level for serious inconsistency.
eTotal number of events and/or number of participants were small, and thus we downgraded the quality of the evidence by one level for serious imprecision.
fTreatment failure, measured by the number of participants who had undergone or were being considered for a non‐routine secondary surgical intervention for symptomatic non‐union, malunion or other complications (e.g. mechanical failure defined as a condition in which an implant loses its capacity to carry a load). This does not include plate removal for hardware irritation.
gThe assumed risk was the mean risk in the control group.
hThese two studies had 13 of the 16 symptomatic malunions: 9 were from one study. This is an unusually high number: most malunions are asymptomatic or with mild symptoms with no need for other types of treatment.
iThe number of people with one or more cosmetic problems, primarily deformity, asymmetry and/or shoulder droop, hardware prominence not requiring removal, unsightly scar and bump at fracture site. These data were often provided for individual outcomes and we applied a rule to avoid potential unit of analysis issues.
jThere was considerable heterogeneity (I2 = 63%) with results from different studies spread on both sides of the line of no effect; thus we downgraded the evidence by one level for serious inconsistency.
kCosmetic deformity and/or asymmetry was greater in the conservative group (21/398 versus 93/361; RR 0.16, 95% CI 0.05 to 0.46). Hardware irritation not requiring implant removal (28/308), and unsightly but otherwise not problematic scars (14/273) occurred only in the surgical group.
lTotal of participants with adverse event outcome: one or more of local infection, dehiscence, discomfort leading to implant removal, skin and nerve problems, stiffness, refracture, symptomatic malunion and other adverse events (e.g. thrombosis, shoulder impingement, cardiovascular event and transient plexus irritation).
mThere was considerable heterogeneity (I2 = 72%) with results from different studies spread on both sides of the line of no effect; thus the evidence was downgraded one level for serious inconsistency.
nSkin and nerve problems were also more common after surgical treatment (75/338 versus 17/310; RR 4.86, 95% CI 1.85 to 12.76; 6 studies).
oHealth‐rerelated quality‐of‐life score was the physical component of SF‐36 and SF‐12; the two studies did not report the full score.

Antecedentes

disponible en

La clavícula tiene varias funciones importantes. Sirve de medio de unión entre el miembro superior y la caja torácica, ayuda a estabilizar la cintura escapular y permite que el brazo tenga amplitud total de movimiento. Además, permite la inserción de los músculos, brinda protección a las estructuras neurovasculares vitales, sirve de sostén de la función respiratoria y cumple una función estética importante en el aspecto físico de las personas. Estas funciones importantes se pueden ver afectadas por la fractura de la clavícula (Kotelnicki 2006; Lazarus 2001).

Descripción de la afección

Las fracturas de clavícula son frecuentes y representan del 2,6% al 4% de todas las fracturas, con una incidencia general de 36,5 a 64 por 100 000 personas por año (Nordqvist 1994; Postacchini 2002). El sitio más común de la fractura es el tercio medio de la clavícula, que representa el 80% de todas las fracturas de clavícula (Neer 1984). La incidencia es bimodal, con una incidencia máxima en los jóvenes y en las etapas posteriores de la vida, con más hombres en el grupo etario más joven, y más mujeres en las etapas posteriores de la vida (Court‐Brown 2006). Un estudio en Uppsala, Suecia, informó que la incidencia de las fracturas de clavícula fue 50 por 100 000 habitantes, con una incidencia mayor en los hombres (71 por 100 000) en comparación con las mujeres (30 por 100 000) (Nowak 2000).

Habitualmente la fractura de clavícula es el resultado de dos mecanismos de lesión. El más frecuente se produce después de una caída directamente sobre la parte externa del hombro y representa alrededor del 90% de los casos. El otro mecanismo es el traumatismo indirecto, que se produce después de una caída sobre el brazo extendido. La fuerza de la caída es transmitida a través del miembro superior a la clavícula, lo que produce la fractura. Aunque ésta se consideraba la causa más frecuente de lesión, representa sólo el 2% al 5% de las fracturas de clavícula. (Jeray 2007; Kotelnicki 2006). Las caídas como resultado de las actividades deportivas como el ciclismo y el esquí son las causas comunes de la fractura de clavícula (Nowak 2000).

El diagnóstico de fractura de clavícula es fácil de hacer clínicamente sobre la base de un interrogatorio típico y la presencia de equimosis y deformidad, que a menudo se observan en el examen. Una simple radiografía anteroposterior podría confirmar el diagnóstico, y una segunda radiografía anteroposterior con una inclinación cefálica de 45° podría revelar características de la fractura como el grado de desplazamiento (Jeray 2007).

Allman 1967 propuso una clasificación para las fracturas de clavícula que las divide en tres grupos según su ubicación en el hueso: El grupo I son fracturas del tercio medio del hueso; el grupo II son fracturas del tercio externo o lateral del hueso; y el grupo III son fracturas del tercio interno o medial. En un gran ensayo epidemiológico, Nordqvist 1994 clasificó el 76% de todas las fracturas como fracturas grupo I y encontró una mediana de edad de 13 años en los participantes de este grupo. Recientemente, debido a la ausencia de un sistema único con valor pronóstico y terapéutico, Robinson 1998 propuso una modificación de las categorías de Allman que incluye variables importantes desde el punto de vista pronóstico, como el grado de desplazamiento y la conminución (fragmentación del hueso).

Descripción de la intervención

Las intervenciones conservadoras o no quirúrgicas se utilizan ampliamente y se recomiendan para tratar las fracturas del tercio medio de la clavícula (Robinson 2004), debido a la incidencia por lo general baja de fracaso de la consolidación después del tratamiento conservador, con tasas que varían del 3,1% al 5,9% (Nordqvist 1998; Robinson 2004; Zlowodzki 2005). Se dispone de muchas opciones de tratamiento conservador; las más frecuentes son el uso de un cabestrillo o venda en ocho (también conocida como férula en ocho o venda tipo mochila) o una combinación de estos dos métodos (Andersen 1987; Eiff 1997; Hill 1997). No se ha alcanzado consenso sobre la duración óptima de la inmovilización; algunos han recomendado dos a seis semanas (Eiff 1997; Jeray 2007; Lazarus 2001).

Aunque las indicaciones absolutas para el tratamiento quirúrgico son polémicas, las indicaciones más frecuentes para la cirugía incluyen fractura abierta (una lesión donde el hueso roto atraviesa la piel), desplazamiento grave causado por la conminución, alto riesgo de que la fractura se convierta en abierta y lesiones neurovasculares. Se pueden realizar varias técnicas quirúrgicas de fijación que incluyen la fijación interna con tornillos, clavijas, asas de alambre o placas; y fijación externa con fijadores externos (Bradbury 1996; Ebraheim 1997; Jupiter 1987; Mullaji 1994). También puede usarse injerto óseo.

En la actualidad se consideran otras indicaciones para la cirugía, que incluyen las fracturas de alta energía, el desplazamiento completo y la conminución grave. Para estos casos existen pocas técnicas de reducción abierta y fijación interna que utilicen la fijación con placa y tornillos o la fijación intramedular. Las ventajas del tratamiento quirúrgico son proporcionar la reducción anatómica de la fractura con un período más corto de inmovilización, así como el retorno más rápido a las actividades (Donnelly 2013; Khan 2009; King 2015). Actualmente se utilizan muchos modelos de sistemas de recubrimiento anatómico preconfigurados muy bien adaptados y exactos y que provocan escasas molestias relacionadas con el implante. Sin embargo, estos tipos de implantes pueden no ser superiores a otros tipos de placas (Bauer 2018).

De qué manera podría funcionar la intervención

Aunque las fracturas no desplazadas tienen tasas relativamente bajas de fracaso de la consolidación (Nordqvist 1998; Robinson 2004; Zlowodzki 2005), se han informado tasas altas de fracaso de la consolidación de las fracturas desplazadas de hasta el 15% (Canadian 2007; Hill 1997; McKee 2006). Los factores de riesgo de fracaso de la consolidación relacionados con la fractura incluyen las fracturas abiertas, las lesiones politraumáticas asociadas, la nueva fractura, el desplazamiento inicial de la fractura, la conminución y el acortamiento (Jupiter 1987; Marti 2003). Robinson 2004 observó que la edad avanzada y el sexo femenino también predisponen al fracaso de la consolidación. Estos resultados han dado lugar a un aumento reciente en la preferencia por el tratamiento quirúrgico, a través de las técnicas habituales de reducción abierta y fijación interna, con el uso de una placa y tornillo, o de la fijación intramedular, mediante una varilla metálica que se inserta en la cavidad interna (médula) del hueso de la clavícula, y que aborda o no el foco de la fractura (Canadian 2007; Meier 2006).

Por qué es importante realizar esta revisión

Ésta es una actualización de una revisión Cochrane publicada por primera vez en 2013 (Lenza 2013). Sobre la base de la evidencia de ocho estudios con alto riesgo de sesgo, Lenza 2013 concluyó que hay evidencia de calidad baja de que las intervenciones quirúrgicas pueden no dar lugar a una mejoría significativa en la funcionalidad del antebrazo.

La fractura del tercio medio de la clavícula es una de las fracturas más frecuentes del cuerpo. Este trastorno provoca con frecuencia dolor y discapacidad a corto plazo, y puede provocar deformidad y discapacidad a largo plazo.

Un estudio transversal reciente que utilizó un cuestionario descriptivo respondido por cirujanos brasileños y de otros países de América Latina demostró que las indicaciones principales para la cirugía fueron el acortamiento y la exposición inminente de la piel; y que el tratamiento conservador se indicó si había contacto cortical entre los fragmentos de la fractura (Oliveira 2017). Para la inmovilización, la preferencia de los cirujanos fue para el uso de un cabestrillo sencillo durante hasta seis semanas. La placa bloqueada fue la opción puntera para la cirugía (Oliveira 2017). Una encuesta basada en las preferencias de los cirujanos en todos los hospitales en Suecia, Dinamarca y Finlandia encontró que los pacientes con fracturas desplazadas del tercio medio de la clavícula son tratados principalmente de forma quirúrgica con una placa bloqueada; además, más del 80% de los cirujanos prefirieron este enfoque (Ban 2016). La bibliografía actual indica que el tratamiento de la fractura de clavícula todavía es polémico. Por ejemplo, la mayoría de los cirujanos de los EE.UU. prefieren utilizar un cabestrillo sencillo para tratar a los pacientes de forma conservadora (el 94% prefiere el cabestrillo sencillo versus el 6% que prefiere la venda en ocho; Heuer 2014). Por el contrario, una encuesta alemana sobre el tratamiento conservador de las fracturas de clavícula concluyó que las fracturas simples de clavícula son tratadas de una manera no quirúrgica, y que los cirujanos ortopédicos prefieren el uso de la venda en ocho en el 88% de los casos (Pieske 2008).

Antes de esta actualización de la revisión, los autores Cochrane actualizaron dos revisiones Cochrane que consideraron por separado diferentes intervenciones conservadoras o diferentes intervenciones quirúrgicas (Lenza 2016; Lenza 2015). Lenza 2016 concluyó que la evidencia de tres estudios, con 296 participantes, no fue suficiente para establecer los efectos relativos sobre el resultado funcional final de una venda en ocho en comparación con un cabestrillo, aunque la venda se puede asociar con un aumento del dolor inicial. Un cuarto estudio no aportó evidencia de que el ultrasonido terapéutico acelerara la recuperación, incluida la curación clínica de la fractura. Lenza 2015 concluyó que hay evidencia muy limitada y de baja calidad con respecto a la efectividad de diferentes métodos de cirugía para el tratamiento de la fractura aguda y el fracaso de la consolidación de la clavícula. La mayoría de las fracturas agudas se suelen tratar de forma conservadora; sin embargo, el tratamiento actual de algunos tipos de fractura de clavícula es más intervencionista, por lo que incluye la cirugía (Judd 2009). Este cambio merece investigación. Solo se puede proponer una decisión fundamentada acerca del mejor tratamiento después que la evidencia disponible se examine nuevamente de forma sistemática para determinar si se prefieren las intervenciones quirúrgicas o conservadoras para tratar algunas o todas las fracturas del tercio medio de la clavícula.

Objetivos

disponible en

Evaluar los efectos (beneficiosos y perjudiciales) de las intervenciones quirúrgicas versus conservadoras para el tratamiento de las fracturas del tercio medio de la clavícula.

Métodos

disponible en

Criterios de inclusión de estudios para esta revisión

Tipos de estudios

Se incluyeron los ensayos controlados aleatorios (ECA) o cuasialeatorios (método de asignar a los participantes a un tratamiento que no es estrictamente aleatorio, p.ej., por fecha de nacimiento, número de historia clínica o alternancia), que compararon intervenciones quirúrgicas versus conservadoras para tratar las fracturas del tercio medio de la clavícula.

Tipos de participantes

Se incluyeron todos los estudios de adolescentes (más de diez años) y adultos que habían recibido un diagnóstico de fractura del tercio medio de la clavícula. Se incluyeron los estudios con niños menores de diez años de edad si la proporción de niños de esta edad fue menor del 10% o si estaban disponibles los datos por separado.

También se incluyeron los estudios que incluyeron pacientes con antecedentes de otras lesiones de hombro, siempre que se presentaran los datos por separado para esta población o los números incluidos fueran pequeños y estuvieran equilibrados entre los dos grupos. El mismo enfoque se aplicó a los estudios que incluyeron pacientes con otras lesiones concurrentes de hombro.

Tipos de intervenciones

Se consideró que todas las intervenciones quirúrgicas y conservadoras utilizadas trataban las fracturas del tercio medio de la clavícula.

Se excluyeron los estudios que compararon diferentes técnicas de intervenciones quirúrgicas solas o diferentes técnicas de intervenciones conservadoras solas. Las intervenciones quirúrgicas pueden incluir fijación interna mediante una placa y tornillo, alambres de Kirschner, uña de titanio y clavija de Knowles y la fijación externa mediante un fijador externo. Las intervenciones conservadoras pueden incluir cabestrillos, inmovilización con vendajes, vendas en ocho y cabestrillos, u otros tratamientos físicos así como terapias coadyuvantes, como el ultrasonido terapéutico. También se consideró para inclusión cualquier estudio que comparara la cirugía con ningún tratamiento.

La reducción cerrada (realineación de los fragmentos de la fractura), por lo general no se realiza en las fracturas de clavícula porque es prácticamente imposible mantener la posición reducida. Sin embargo, se incluyeron todos los estudios, independientemente de si se intentó la reducción o no.

Tipos de medida de resultado

Resultados primarios

  • La funcionalidad o la discapacidad (medio o cambio medio), se midieron a través de medidas de resultado funcionales del miembro superior. En condiciones ideales, estas deberían ser medidas de funcionalidad informadas por los participantes, validadas para los pacientes con fracturas de clavícula (sin embargo, no se conoce la existencia de medidas de resultado en esta categoría). Las medidas validadas informadas por los pacientes incluyen el cuestionario Disability of the Arm, Shoulder, and Hand (DASH; Hudak 1996) y la puntuación de Constant (Constant 1987), que es una puntuación compuesta para la funcionalidad del hombro que incluye la calificación subjetiva del dolor y de las actividades cotidianas, así como la calificación objetiva de la amplitud de movimiento y la fuerza.

  • Dolor: se dio preferencia a los informes de dolor medidos mediante escalas de dolor validadas (escala analógica visual [EAV] o escala de calificación numérica [ECN]), e informados como un resultado dicotómico, por ejemplo, número con un cambio clínicamente importante en la puntuación de dolor a corto plazo (p.ej., proporción con una mejoría de al menos el 30% en el dolor), o el dolor a largo plazo informado por el participante (p.ej., proporción por encima de 30/100‐mm en una EVA, es decir, peor que dolor leve). Los ejemplos se extraen de las recomendaciones en Eccleston 2010 y Moore 2010. Cuando los datos no se informaron como una medida dicotómica se utilizó una medida continua: dolor medio o cambio medio en el dolor.

  • El fracaso del tratamiento medido por la cantidad de participantes sometidos o que se consideran para una cirugía secundaria no rutinaria debido al fracaso de la consolidación sintomática, la consolidación viciosa u otras complicaciones (p.ej., fracaso mecánico, definido como una condición en la que el implante pierde la capacidad de soportar la carga). Lo anterior no incluye la extracción de la placa por la irritación del implante.

Resultados secundarios

  • Resultado cosmético: número de participantes con una deformidad o más, resultado asimétrico, cicatriz antiestética o prominencia del implante que no requirió la extracción del implante.

  • Resultado compuesto de eventos adversos: número de participantes con uno o más eventos que incluyen infección local, dehiscencia, consolidación viciosa sintomática, nueva fractura, molestias que provocan la extracción del implante, problemas cutáneos y nerviosos, rigidez del hombro o restricción de la amplitud del movimiento.

  • Calidad de vida relacionada con la salud: media o cambio medio en el Short Form‐36 (Ware 1992) u otras medidas de calidad de vida.

  • Números de participantes que regresaron a las actividades anteriores (trabajo, deporte, actividades cotidianas, etc.) o tiempo tomado para regresar si el resultado no se informó de manera dicotómica.

  • Fracaso de la consolidación sintomática (es decir, la fractura no ha sanado desde el punto de vista radiográfico y no se trata de forma quirúrgica), definido como unión cortical incompleta entre los fragmentos proximales y distales y consolidación viciosa desde el punto de vista radiográfico.

Momento de medición de los resultados primarios

Se extrajeron datos de resultado en los períodos siguientes: seguimiento a corto plazo (hasta seis semanas después del tratamiento); a plazo intermedio (más de seis semanas y hasta seis meses después de finalizar el tratamiento) y a largo plazo (más de seis meses después de finalizar el tratamiento) para la funcionalidad y el dolor. Los resultados restantes se extrajeron al final del seguimiento.

Métodos de búsqueda para la identificación de los estudios

Búsquedas electrónicas

We searched the Cochrane Bone, Joint and Muscle Trauma Specialised Register (to 22 December 2017), the Cochrane Central Register of Controlled Trials (CENTRAL; 2017, Issue 12) via Central Register of Studies Online, PubMed (1966 to 14 December 2017), Ovid MEDLINE (including Epub Ahead of Print, In‐Process & Other Non‐Indexed Citations, Ovid MEDLINE Daily and Ovid MEDLINE; 1 December 2012 to 22 December 2017), Embase (1980 to 22 December 2017), and Latin American and Caribbean Literature in Health Sciences (LILACS; 1982 to 22 December 2017). We also searched the WHO International Clinical Trials Registry Platform (WHO ICTRP) and the ClinicalTrials.gov registry for ongoing and recently completed studies (to August 2017). For this update, the search results were limited from 2012 onwards. Details of the search strategies used for the previous version of the review are given in Lenza 2013. We didn't apply any restrictions based on language or publication status. The search strategies for all databases are reported in Appendix 1.

Búsqueda de otros recursos

We checked the reference lists of articles and reviews for possible relevant studies.

Obtención y análisis de los datos

The intended methodology for data collection and analysis was described in our published protocol (Lenza 2011), which was based on the Cochrane Handbook for Systematic Reviews of Interventions (Higgins 2017). The main changes from protocol, mainly relating to outcomes measures, are summarised in Differences between protocol and review.

Selección de los estudios

Two authors (ML and FF), independently selected potentially eligible studies for inclusion in the review, using a pre‐piloted form. Any disagreements were resolved by discussion and, when necessary, with adjudication by a third author (BASF). The review authors were not blinded to the journal or to the authors.

Extracción y manejo de los datos

Two review authors (ML and BASF), extracted the following data using a pre‐piloted data extraction form: characteristics of the study methods including study design, duration of the trial, whether the protocol was published before recruitment of participants, funding sources and details of study registration; characteristics of the study participants including place of trial, number of participants assigned, number of participants assessed, inclusion criteria, exclusion criteria, age and classification of injury; characteristics of the study interventions including timing of intervention, type of surgical intervention, type of conservative intervention, rehabilitation and any co‐interventions; characteristics of the study outcomes including length of follow‐up, loss to follow‐up and outcome measures; and the methodological domains as outlined later in Assessment of risk of bias in included studies.

A third review author (RB), resolved any disagreements. Two review authors (ML and BASF), entered data into Review Manager 5 (Review Manager 2014). We sent requests seeking additional information or data to study authors.

Evaluación del riesgo de sesgo de los estudios incluidos

Two review authors (ML and BASF), independently assessed the risk of bias of included studies. As recommended by the Cochrane 'Risk of bias' tool (Higgins 2017), we assessed the following domains:

  • Random sequence generation

  • Allocation concealment

  • Blinding of participants and personnel

  • Blinding of outcome assessment

  • Incomplete outcome data

  • Selective reporting

  • Other bias (e.g. major baseline imbalance; inappropriate influence of funders; risk of bias associated with inexperience of surgeons and other care providers with the interventions, differences in rehabilitation).

We judged each of these criteria explicitly on the basis of low risk of bias, high risk of bias, and unclear (either lack of information or uncertainty over the potential for bias). We resolved disagreements between authors regarding the risk of bias for domains by consensus.

Medidas del efecto del tratamiento

We calculated risk ratios (RRs) together with 95% confidence intervals (CIs) for dichotomous outcomes.

We expressed continuous outcome data as mean differences (MDs) with 95% CIs when continuous outcomes were reported using the same instrument in the studies. We used the standardised mean difference (SMD) with 95% CI when studies measured the same outcome but employed different measurement instruments (e.g. function).

We back‐transformed the pooled SMD for function to the 0 to 100 Constant scale by multiplying the SMD and 95% CIs by a representative pooled standard deviation in normal shoulders (mean (SD) population Constant score 89 (7)) from Yian 2005.

When we observed a statistically significant difference between surgery and conservative‐treatment groups, we planned to report the number needed to treat for an additional beneficial outcome (NNTB) with 95% CIs and the number needed to treat for an additional harmful outcome (NNTH) with 95% CIs. For dichotomous outcomes, in the case of adverse events, we would have calculated the NNTB or the NNTH from the control group event rate and the relative risk using the Visual Rx NNT calculator (Cates 2008).

Cuestiones relativas a la unidad de análisis

The unit of randomisation in the studies included in this review is the individual participant.

There are potential unit of analysis problems with composite outcomes, namely treatment failure, composite adverse events, and overall cosmetic result, where studies have reported on numbers of participants with specific complications instead of numbers of study participants with one or more complications. For these composite outcomes, we have extracted the number of participants with one or more complications, as far as it can be presumed from the study reports. Where the composite event rate is not clearly reported or cannot be deduced, and the number of cases are reported for each individual component event of the composite only, to avoid double‐counting of cases, we have extracted the number of participants with one of the component events as a proxy (we chose the component event with the most cases in each treatment group). We have reported our decisions in Notes of the Characteristics of included studies table; thus, the number of cases with each component event of the composite event, and the number of cases we used in our analyses.

Manejo de los datos faltantes

We attempted to extract outcome data for all participants randomly assigned into each trial. We tried to contact the authors of primary studies to request missing data, such as numbers of participants, details of dropouts, means, measures of variance (standard deviation or standard error), and numbers of events.

For continuous outcomes with no standard deviations reported, we planned to calculate standard deviations from standard errors, P values, or confidence intervals, according to the methods outlined in Higgins 2011. We described missing data and data on dropouts for each included study in the 'Risk of bias' table, and we discussed the degree to which missing data could change the results and conclusions of this review.

The effects of dropouts and exclusions were investigated by conducting worst‐ and best‐case scenario analyses. For dichotomous outcomes, we analysed the worst‐case scenario using the number randomly assigned as denominator, with the assumption that any participants missing at the end of treatment did not have a positive outcome (e.g. for the outcome number of participants experiencing treatment failure, we assumed that any missing participants had an adverse event). We analysed the best‐case scenario using the number randomly assigned in the denominator, and ignoring the dropouts in our analyses of dichotomous outcomes (overall treatment failure).

Evaluación de la heterogeneidad

We assessed the heterogeneity of estimate effects between included studies by visual inspection of the forest plot (analysis), along with consideration of the test for heterogeneity and the I² statistic (Higgins 2003). We quantified the possible magnitude of inconsistency (i.e. heterogeneity), across studies, using the I² statistic with a rough guide for interpretation as follows: 0% to 40% might not be important; 30% to 60% may represent moderate heterogeneity; 50% to 90% may represent substantial heterogeneity; and 75% to 100% considerable heterogeneity (Deeks 2017). In cases of considerable heterogeneity (defined as I2 of 75% or more), we explored the data further by comparing the characteristics of individual studies and conducting subgroup analyses.

Evaluación de los sesgos de notificación

We planned to generate funnel plots of primary outcomes to assess the potential publication bias (small study effects). However, the small number of included studies precluded this form of analysis. We assessed the presence of small study bias in the overall meta‐analysis by checking whether the random‐effects estimate of the intervention effect was more beneficial than the fixed‐effect estimate (Sterne 2008).

We also assessed outcome reporting bias by comparing results extracted from published journal reports with results from other sources (e.g. correspondence) and by checking study registrations (at the WHO International Clinical Trials Registry Platform), or published protocols.

Síntesis de los datos

When appropriate, we pooled results of comparable groups of studies in meta‐analysis using the random‐effects model as a default.

Assessing the quality of the evidence and the 'Summary of findings' table

We used the GRADE approach to assess the quality of evidence related to all outcomes listed in the Types of outcome measures (Schünemann 2011). The four levels of evidence certainty are 'high', 'moderate', 'low' or 'very low'. Quality may be downgraded due to study limitations (risk of bias), imprecision, inconsistency, indirectness or publication bias. We presented the main results of the surgical versus conservative treatment comparison in a 'Summary of findings' table, which provides key information concerning the quality of the evidence, the magnitude of effect of the interventions examined and the sum of available data on the main outcomes. We produced the 'Summary of findings' table via RevMan (Review Manager 2014).

Outcomes for 'Summary of findings' table

We included the following outcomes in our 'Summary of findings' table: function; pain; treatment failure (non‐routine secondary surgical intervention); number with unsatisfactory overall cosmetic result; composite adverse event outcome (one or more of local infection, dehiscence, symptomatic malunion, discomfort leading to implant removal, skin and nerve problems, stiffness); and health‐related quality of life. We converted the SMD result for the upper limb function outcome to a clinically meaningful measure of function (Constant score) by multiplying the SMD by the SD of the Constant score in healthy people as reported in Yian 2005.

For the purpose of pooling data where studies included more than one measure of function, we preferentially included one measure according to the following hierarchy: Constant score (Constant 1987), DASH score (Hudak 1996), University of California Los Angeles (UCLA) score (Amstutz 1981), Single Assessment Numeric Evaluation (SANE) score (Williams 1999) and L'Insalata score (L'Insalata 1997). We restricted follow‐up for function to at least 12 months because the results are more consistent during this period; after 12 months there is typically no modification in function of patients with clavicle fractures.

Análisis de subgrupos e investigación de la heterogeneidad

We planned to perform subgroup analyses for the following:

  • Age (adolescents, adults and people older than 65 years)

  • Type of surgical intervention: intramedullary fixation versus plate fixation

  • Timing of surgery: immediate versus delayed (from one week to four weeks after injury)

  • Two fragments versus more than two fragments

  • Primarily undisplaced versus displaced

Details of the actual subgroup analyses conducted are given in Effects of interventions. We investigated whether the results of subgroups were significantly different by inspecting the overlap of CIs and by performing the test for subgroup differences available in Review Manager 5 (Review Manager 2014).

Análisis de sensibilidad

We planned sensitivity analyses to assess the effects of including studies at risk of selection bias (inadequate or unclear allocation concealment), or detection bias (inadequate or unclear blinding of outcome assessor); and of including participants with a history of shoulder injuries. We also planned to assess the presence of small study bias (i.e. intervention effect is more beneficial in smaller studies), in the meta‐analysis by comparing the fixed‐effect estimate with the random‐effects estimate for primary outcomes.

We conducted sensitivity analyses to investigate the effects of any missing data by conducting worst‐ and best‐case scenario analyses.

Results

Description of studies

See: Characteristics of included studies, Characteristics of excluded studies and Characteristics of ongoing studies.

Results of the search

The searches for this update (run from December 2012 to December 2017), identified a total of 1270 new records from the following databases: Cochrane Bone, Joint and Muscle Trauma Group Specialised Register (10); CENTRAL (126), MEDLINE (272), Embase (639), LILACS (30), ClinicalTrials.gov (35) and the WHO International Clinical Trials Registry Platform (158). We also identified four potentially eligible studies from other from the references of other studies.

The search update resulted in the identification of 28 reports of potentially eligible studies, for which we obtained full reports where possible. Of these, we included six studies, reported in 14 articles published between 2012 and 2017 in the review (Ahrens 2017; Melean 2015; Naveen 2017; Robinson 2013a; Tamaoki 2017; Woltz 2017a), we excluded eight (Dugar 2013; Jones 2014; Khorami 2014; Madhukar 2015; Malkoc 2016; McIntosh 2016; Parry 2017; Shukla 2014), and two await assessment (Dhakad 2016; Shetty 2017). We also found additional reports for two already included studies: COTS 2007 (three abstracts and two separate publications), and Smekal 2009 (one abstract).

Overall, there are 14 included studies, 20 excluded studies, five studies awaiting classification and three ongoing studies.

A flow diagram summarising the study selection process is shown in Figure 1. The results from the previous searches (up to December 2012) are reported in Appendix 2.


Study flow diagram

Study flow diagram

Included studies

Details of the 14 included studies can be found in Characteristics of included studies.

Only two studies published their study protocol before their results: Ahrens 2017, protocol published in 2011 (Longo 2011); and Woltz 2017a, protocol published in 2011 (Stegeman 2011). Five studies registered their protocol before publication in national or international trials registers (Ahrens 2017; Robinson 2013a; Tamaoki 2017; Virtanen 2012a; Woltz 2017a).

COTS 2007 reported its results in four conference abstracts (Hall 2006; Hall 2008; McKee 2010a; Schemitsch 2012), and also presented different results (different time points or outcomes, or both), across five separate full publications (Altamimi 2008; COTS 2007; Neuhaus 2013; Pearson 2010; Schemitsch 2011). Judd 2009 was initially reported in 2005 in an abstract (American Academy of Orthopaedic Surgeons (AAOS)), and then published in full in 2009. Koch 2008 reported the same results in two papers (Koch 2008; Witzel 2007). The results of Melean 2015 were also commented on in a letter. Robinson 2013a also reported different results across three separate publications (Goudie 2017; Robinson 2013a; Robinson 2013b). Smekal 2009 also presented its results in abstract format (Vinzenz 2008). The results of Virtanen 2012a were also reported as a conference proceeding and it was commented on in a letter. Each of the remaining five studies reported results in a single publication (Chen 2011; Figueiredo 2008; Mirzatolooei 2011; Naveen 2017; Tamaoki 2017). We did not use conference abstract data in our analyses.

We sent requests seeking additional information or data to authors of 12 studies (Ahrens 2017; Chen 2011; COTS 2007; Judd 2009, Koch 2008; Melean 2015; Mirzatolooei 2011; Naveen 2017, Robinson 2013a, Smekal 2009; Tamaoki 2017; Woltz 2017a). We obtained standard deviations and means of DASH and Constant scores by personal contact with the authors of two studies (Ahrens 2017; Mirzatolooei 2011), and standard deviations and means of VAS scores by personal contact with the authors of Woltz 2017a. Tamaoki 2017 provided some information regarding the structure of the study. The authors of two studies declined to provide further information or missing data (COTS 2007; Melean 2015). We tried unsuccessfully to contact the authors of six studies to obtain further information and missing data (Chen 2011; Judd 2009; Koch 2008; Naveen 2017; Robinson 2013a; Smekal 2009).

All studies were reported in English, except Koch 2008 (in German), and Figueiredo 2008 (in Portuguese). One review author (ML) translated both into English.

Design

All studies were parallel‐group controlled studies with two intervention groups; 13 were RCTs and one was a quasi‐RCT (Naveen 2017). Ahrens 2017 was conducted in 20 centres in England, COTS 2007 in eight centres in Canada, Robinson 2013a in three centres in the UK, Tamaoki 2017 in two centres in Brazil, and Woltz 2017a in 16 centres in the Netherlands. All other studies were single‐centre studies. Chen 2011 took place in China; Figueiredo 2008 in Brazil; Judd 2009 probably in Hawaii; Koch 2008 in Germany; Melean 2015 in Chile; Mirzatolooei 2011 in Iran; Naveen 2017 in India; Smekal 2009 in Austria; and Virtanen 2012a in Finland.

Sample sizes

The 14 studies enrolled a total of 1469 participants. Outcome data allowing analysis by the study authors were available for a maximum of 1267 participants (86.2% of those enrolled). The number of randomised participants in individual studies ranged from 50 (Figueiredo 2008) to 301 (Ahrens 2017).

Participants
Age and gender

Ahrens 2017, Chen 2011, Mirzatolooei 2011 and Smekal 2009 included adults between 18 and 65 years old; COTS 2007 and Robinson 2013a stipulated an age limit between 16 and 60 years; Figueiredo 2008, Melean 2015 and Tamaoki 2017 excluded participants who were younger than 18 years of age; Judd 2009 excluded participants who were younger than 17 years of age or older than 40 years, Naveen 2017 included participants between 20 and 50 years, Virtanen 2012a included participants between 18 and 70 years, and Woltz 2017a included participants between 18 and 60 years. Koch 2008 did not specify age in the inclusion criteria. Overall, the review population was adults with older people generally excluded. The mean age of participants in individual studies ranged from 26.5 years in Judd 2009 to 38.5 years in Chen 2011.

With the exception of Melean 2015, gender data provided for assigned or assessed participants showed there were more male participants overall (1128/1344; 83.9%), with the proportion of men in individual studies ranging from 53.3% in Chen 2011 to 91.3% in Woltz 2017a.

Types/classification of fractures

All studies included only participants with displaced or angulated middle third clavicle fracture. Ahrens 2017, Melean 2015, Naveen 2017, Robinson 2013a and Woltz 2017a used the Robinson's classification (Robinson 1998), to characterise their populations. Chen 2011, Smekal 2009, Tamaoki 2017 and Virtanen 2012a used the AO (Arbeitsgemeinschaft fur Osteosynthesefragen) classification (Muller 1991). The AO or AO/OTA (Orthopaedic Trauma Association) is an alphanumeric classification used by trauma surgeons and physicians dealing with orthopaedic trauma surgery (Kellam 2018). All studies apart from Mirzatolooei 2011 excluded potential participants with open fractures, in which 20% of study participants had an open clavicle fracture. All studies reported that they treated participants with acute clavicle fracture.

Interventions

Details of the 14 interventions of the included studies can be found in Table 1.

Open in table viewer
Table 1. Treatment interventions of included studies

Study ID

No. centres

No. participants (assessed/assigned)

Surgical fixation

Conservative treatment

Ahrens 2017

20

204/301 (67.8%)

Plate fixation: LCP (precontoured titanium plate)

Simple sling

Chen 2011

11

60/60 (100%)

Intramedullary fixation: TEN

Simple sling

COTS 2007

8

111/132 (84.1%)

Plate fixation: limited DCP/3.5 mm reconstruction plates/pre‐contoured plates/other plates

Simple sling

Figueiredo 2008

1

40/50 (80%)

Plate fixation: 3.5 mm DCP plate fixation

Simple sling

Judd 2009

1

57/57 (100%)

Intramedullary fixation: modified Hagie pin

Simple sling

Koch 2008

1

68/68 (100%)

Intramedullary fixation: 2 mm pin

Figure‐of‐eight bandage

Melean 2015

1

76/76 (100%)

Plate fixation: 3.5 mm LCP/LCP reconstruction plates

Simple sling

Mirzatolooei 2011

1

50/60 (83.3%)

Plate fixation: 3.5 mm reconstruction plates

Simple sling

Naveen 2017

1

60/60 (100%)

Plate fixation: 3.5 mm DCP plate fixation

Figure‐of‐eight bandage

Robinson 2013a

3

178/200 (89%)

Plate fixation: LCP (precontoured titanium plate)

Simple sling

Smekal 2009

1

60/68 (88.2%)

Intramedullary fixation: TEN

Simple sling

Tamaoki 2017

2

98/117 (83.8%)

Plate fixation: 3.5 mm reconstruction plates

Figure‐of‐eight bandage

Virtanen 2012a

1

51/60 (85%)

Plate fixation: 3.5 mm reconstruction plates

Simple sling

Woltz 2017a

16

154/160 (96.2%)

Plate fixation: most operatively treated participants (80%) were treated with a precontoured clavicular plate

Simple sling

DCP: dynamic compression plates; LCP: locking compression plate; TEN: titanium elastic nail

Based on the method of surgical fixation (plate or intramedullary), the included studies could be grouped into two comparisons:

  1. Surgical intervention using plate fixation versus conservative intervention using a sling (Ahrens 2017; COTS 2007; Figueiredo 2008; Melean 2015; Mirzatolooei 2011; Naveen 2017; Robinson 2013a; Tamaoki 2017; Virtanen 2012a; Woltz 2017a). Follow‐up data were available for 1022 participants (534 with surgical and 488 with conservative intervention).

  2. Surgical intervention using intramedullary fixation versus conservative intervention using sling or figure‐of‐eight bandage (Chen 2011; Judd 2009; Koch 2008; Smekal 2009). Follow‐up data were available for 245 participants (124 with surgical and 121 with conservative intervention).

Participants underwent intervention on average within 22 hours in Chen 2011, and within three days in Smekal 2009 to 28 days in COTS 2007 after injury.

Outcome measures

The studies varied in timing of follow‐up. Ahrens 2017 conducted follow‐up up to nine months. Naveen 2017 reported follow‐up data for six months. Eight studies specified follow‐up time points at one or two years: COTS 2007 reported follow‐up data for one year, and a subsequent publication (Schemitsch 2011), presented data for two years; Judd 2009, Melean 2015, Mirzatolooei 2011, Robinson 2013a, Virtanen 2012a, Tamaoki 2017 and Woltz 2017a conducted follow‐up to one year; and Smekal 2009 reported data after two years of follow‐up. Three studies reported mean follow‐up: Chen 2011 presented a mean follow‐up of 15 months, Figueiredo 2008 reported a mean follow‐up of 16 months and Koch 2008 reported a mean follow‐up of 19 months.

Primary outcomes

Function or disability

Ahrens 2017, Chen 2011, COTS 2007, Mirzatolooei 2011, Robinson 2013a, Smekal 2009 and Virtanen 2012a evaluated shoulder function or disability by the DASH questionnaire and the Constant score. Woltz 2017a, Melean 2015 and Naveen 2017 used only the Constant score to assess function or disability. Tamaoki 2017 used only the DASH score. Figueiredo 2008 used the UCLA score and Judd 2009 used both the SANE and L'Insalata shoulder scores to assess shoulder function or disability. Koch 2008 did not evaluate this primary endpoint.

Pain

The four studies that assessed pain used a VAS scale, either ranging from 0 to 10 cm (with 0 indicating no pain and 10 indicating maximum pain), or 0 to 100 mm (maximum pain) (Koch 2008; Tamaoki 2017; Virtanen 2012a; Woltz 2017a). We present data on a 0 to 100 mm scale in our analyses.

Treatment failure

All the studies measured treatment failure as the number of participants who had undergone a non‐routine secondary surgical intervention (excluding hardware removal), for symptomatic non‐union, malunion or other complication.

Secondary outcomes

Cosmetic results

Eleven studies reported cosmetic results, which could usually be categorised as one or a combination of deformity, asymmetry, shoulder droop; hardware irritation or prominence not requiring removal; unsightly scar; and bump at fracture site (Ahrens 2017; Chen 2011; COTS 2007; Figueiredo 2008; Judd 2009; Koch 2008; Mirzatolooei 2011; Naveen 2017; Robinson 2013a; Tamaoki 2017; Woltz 2017a).

Adverse events

All studies reported adverse events. Eight studies reported infection or dehiscence, or both (Chen 2011; COTS 2007; Judd 2009; Mirzatolooei 2011; Naveen 2017; Robinson 2013a; Tamaoki 2017; Woltz 2017a). Tem studies reported hardware irritation requiring removal (Ahrens 2017; COTS 2007; Judd 2009; Melean 2015; Mirzatolooei 2011; Robinson 2013a; Smekal 2009; Tamaoki 2017; Virtanen 2012a; Woltz 2017a). Sevem studies reported skin and nerve problems (Ahrens 2017; COTS 2007; Judd 2009; Mirzatolooei 2011; Robinson 2013a; Tamaoki 2017; Woltz 2017a). Ahrens 2017, Figueiredo 2008, Koch 2008 and Naveen 2017 reported stiffness or restricted of range of shoulder movement. Judd 2009 and Virtanen 2012a reported refracture. Four studies reported other adverse events; Chen 2011 and Smekal 2009 reported participants with transient plexus irritation; Robinson 2013a reported adverse events relating to shoulder injuries (impingement); and Woltz 2017a reported thrombosis of the cephalic vein and a cardiovascular event. Nine studies reported symptomatic malunion (Chen 2011; COTS 2007; Mirzatolooei 2011; Naveen 2017; Robinson 2013a; Smekal 2009; Tamaoki 2017; Virtanen 2012a; Woltz 2017a).

Health‐related quality of life

Robinson 2013a measured health‐related quality of life using the SF‐12 questionnaire (health and function status), and Woltz 2017a using SF‐36 questionnaire (physical and mental component scores).

Health‐related quality of life was also reported to have been measured using the SF‐36 questionnaire (health and function status) in a publication of COTS 2007 (Pearson 2010); however, the study authors did not report their results. No other study reported health‐related quality‐of‐life data.

Return to previous activities

Figueiredo 2008, Melean 2015, Robinson 2013a and Tamaoki 2017 described return to previous activities endpoints (work and activities of daily living) and Koch 2008 reported sport activities.

Asymptomatic non‐union and malunion

Seven studies reported asymptomatic non‐union (Ahrens 2017; Chen 2011; Mirzatolooei 2011; Robinson 2013a; Tamaoki 2017; Virtanen 2012a; Woltz 2017a).

Funding sources

Three studies reported that they had been funded (Ahrens 2017; Virtanen 2012a; Woltz 2017a); none of the sources were commercial or would have influenced the conduct and reporting of the trial. COTS 2007 referred to funding, including from a commercial entity, for individual authors in support of the research; however, it was also made clear that the authors were not obliged to provide benefits to the commercial entity in relation to the research. Absence of external funding was either confirmed or likely in the other 10 studies.

Excluded studies

We excluded 20 studies because they did not meet our inclusion criteria. The full reasons for excluding these studies are provided in Characteristics of excluded studies.

Overall, the main reason for excluding the majority of the 20 studies was irrelevant study design (not a RCT or quasi‐RCT). We excluded three registered studies (ACTRN12610000948099; ISRCTN00825817; NCT01311219). In ACTRN12610000948099, the registration for the study was withdrawn in February 2016 and we were unable to identify any other study registration. NCT00642265 was listed as an ongoing study in the first version of the review. It planned to compare osteosynthesis versus sling, with a start date of April 2008 and end date July 2015. However, the contact author reported that for a variety of reasons the study was ended and no data were available. In NCT01311219, the registration for a multicentre study was withdrawn before enrolment because it was "a duplicate study". The other study registration was not identified.

Studies awaiting classification

There were five studies classified as studies awaiting classification.

Dhakad 2016 stated in the Abstract: "Alternate patients were operated", which implies alternation, thus a quasi‐RCT. However, there is no description of the study design and method of allocation in the main text and no reassurance of balance in baseline characteristics. We were unsuccessful in our attempt to get further details from the study authors on methods, baseline characteristics split by treatment group and loss to follow‐up.

Shetty 2017 reported in the Abstract: "They were divided into two groups randomly" and thus warrants being an included trial. However, this study was likely to be compromised by excess loss to follow‐up. We were unsuccessful in our attempt to get further details from the study authors on methods, on participant flow and baseline characteristics split by treatment group.

One study (Smith 2001), is awaiting classification pending the receipt of further information on study characteristics and data. Given that this study was presented in 2000 and in 2001 at conferences, it seems likely that the full results will remain unpublished. Two other studies, whose details are available only in a study registry, are classified as awaiting classification because of their "completed" status; however, we have not identified any reports of these studies (ISRCTN00825817; ISRCTN57483251). Details of these studies can be found in Characteristics of studies awaiting classification.

Ongoing studies

Our search for ongoing studies found three studies (NCT00590850; NCT01078480; NCT01483482); see the Characteristics of ongoing studies. All ongoing studies are parallel RCTs comparing surgical versus conservative interventions to treat middle third clavicle fractures. They appear to be single‐centre studies, taking place in the USA (NCT00590850) and Denmark (NCT01078480; NCT01483482), and should enrol a total of 740 participants.

Risk of bias in included studies

All studies had methodological flaws, rendering them at high risk of bias (see Figure 2 and Figure 3).


Risk of bias graph: review authors' judgements about each risk of bias item presented as percentages across all included studies

Risk of bias graph: review authors' judgements about each risk of bias item presented as percentages across all included studies


Risk of bias summary: review authors' judgements about each risk of bias item for each included study

Risk of bias summary: review authors' judgements about each risk of bias item for each included study

Allocation

Ahrens 2017, COTS 2007, Robinson 2013a, Tamaoki 2017, Virtanen 2012a and Woltz 2017a reported that they performed random sequence generation using a computer random number generator, and Smekal 2009 by throwing dice; thus we judged them at low risk of selection bias. Naveen 2017 was quasi‐randomised based on alternation and thus at high risk of bias for this item. The six remaining studies (Chen 2011; Figueiredo 2008; Judd 2009; Koch 2008; Melean 2015; Mirzatolooei 2011), did not provide sufficient information about the sequence generation process to permit a judgement about bias; thus we judged them at unclear risk of bias for this item.

Concealment of allocation before assignment was adequate for Ahrens 2017, COTS 2007, Judd 2009, Mirzatolooei 2011, Tamaoki 2017 and Virtanen 2012a (opaque and sealed envelopes); thus we judged them at low risk of selection bias. Chen 2011, Figueiredo 2008, Koch 2008, Robinson 2013a and Woltz 2017a did not describe their methods of allocation concealment. Melean 2015 and Smekal 2009, which used envelopes, provided insufficient information to permit judgement. We judged these seven studies to be at unclear risk of selection bias. There was no concealment of allocation in Naveen 2017, which we assessed at high risk of selection bias.

Blinding

We judged all studies to be at high risk of performance bias. As they all compared surgery with conservative treatment, it was not possible to blind treatment providers. No studies included sham surgery; therefore participants were not blinded.

It may have been possible to blind outcome assessors; however, none of the studies mentioned correctly blinding assessors. Thus, for self‐reported outcomes (function; pain; quality of life; and possibly, cosmetic result), there was a high risk of detection bias. Notably, Lack of blinded outcome assessors of the more objective outcomes (treatment failure as indicated by non‐routine secondary surgery; infection or dehiscence; hardware irritation leading to removal) would be less likely to lead to detection bias.

Incomplete outcome data

We considered studies to be at low risk of bias if more than 80% of participants completed the follow‐up, missing outcomes data were balanced in number across intervention groups, and studies reported an intention‐to‐treat analysis for the primary outcomes. As a result, six studies (Chen 2011; Koch 2008; Naveen 2017; Robinson 2013a; Smekal 2009; Virtanen 2012a), were at low risk of attrition bias, six (Ahrens 2017; COTS 2007; Judd 2009; Mirzatolooei 2011; Tamaoki 2017; Woltz 2017a), were at high risk, and we classified two as unclear (Figueiredo 2008; Melean 2015).

We judged Ahrens 2017, COTS 2007, Judd 2009, Tamaoki 2017 and Woltz 2017a to be at high risk of bias because more participants in the conservatively treated group were lost to follow‐up at the end of the follow‐up period. Mirzatolooei 2011 and Smekal 2009 did not perform an intention‐to‐treat analysis.

We judged Figueiredo 2008 to be at unclear risk because data were available at 15 months post‐intervention for only 40/50 (80%) participants, and they did not provide any information on the numbers missing from each group to allow assessment of whether there was an imbalance. We classified Melean 2015 as unclear because the study authors did not explicitly report if any participants were lost to follow‐up.

Selective reporting

Only two studies (Virtanen 2012a; Woltz 2017a) were considered at low risk of bias because the study protocol was available and all of the study pre‐specified outcomes that are of interest for this review have been reported in the pre‐specified way.

We classified 11 included studies at high risk of bias (Ahrens 2017; Chen 2011; COTS 2007; Figueiredo 2008; Judd 2009; Koch 2008; Melean 2015; Mirzatolooei 2011; Naveen 2017; Smekal 2009; Tamaoki 2017). The reasons for this assessment are as follows. Ahrens 2017; Chen 2011, COTS 2007, Figueiredo 2008, Melean 2015 and Naveen 2017 reported one or more outcomes of interest in the review incompletely. Judd 2009 assessed function or disability using non‐standard validated participant‐reported measures. Koch 2008 did not measure function or disability by validated participant‐reported measures. Neither Mirzatolooei 2011 nor Smekal 2009 presented baseline data for efficacy outcomes and reported only P values. Tamaoki 2017 registered the study protocol, and reported all of their pre‐specified (primary and secondary), outcomes that were of interest for this review in the pre‐specified way. However, the time points differ: the protocol plan was to follow up at 3, 6 and 12 months, but the results paper reports outcomes at six weeks, six months and one year for DASH and VAS, plus three months for VAS only, with no explanation given for these changes.

We judged Robinson 2013a to be at unclear risk because, despite the study protocol being registered, the pre‐specified outcomes were not recorded and were not available.

Other potential sources of bias

Six studies (Ahrens 2017; Judd 2009; Naveen 2017; Robinson 2013a; Tamaoki 2017; Virtanen 2012a), were at low risk of other bias, seven studies (Chen 2011; COTS 2007; Figueiredo 2008; Koch 2008; Mirzatolooei 2011; Smekal 2009; Woltz 2017a), were at high risk of other potential threats to validity, and one study (Melean 2015), was at unclear risk.

Chen 2011 and Figueiredo 2008 did not specify time points of outcomes. Four studies did not provide baseline outcome data, so we were unable to assess whether groups were balanced at baseline (COTS 2007; Koch 2008; Mirzatolooei 2011; Smekal 2009). There were unexplained imbalances in the numbers allocated into the two groups assigned (86 surgical; 74 conservative) in Woltz 2017a. Additionally, there were insufficient data to assess whether or not the two groups were balanced at baseline for this trial. The same insufficiency applied to Melean 2015, which we judged at unclear risk of other bias.

We were not able to analyse performance bias related to differences in rehabilitation and experience of surgeons and other care providers because the included studies did not report information related to these aspects.

No study was judged at risk of bias relating to inappropriate influence of funders.

Effects of interventions

See: Summary of findings for the main comparison Surgical versus conservative interventions for treating fractures of the middle third of the clavicle

The primary comparison in this review was any surgical intervention versus any conservative intervention. We have presented secondary subgroup analyses by types of surgical interventions (plate fixation and intramedullary fixation), for function and primary treatment failure. Further subgroup analyses were precluded by insufficient data.

Comparison: surgical versus conservative interventions for treating middle third clavicle fractures

Function or disability (primary outcome)

The variety of measures used to demonstrate overall function in the included studies is displayed in the analyses. Pooled data from 10 studies (838 participants), favoured the surgical group (standardised mean difference (SMD) 0.33, 95% CI −0.02 to 0.67) at follow‐up of one year or more; however, these results were highly heterogeneous (I² = 83%; Figure 4; Analysis 1.1). Moreover, this result equates to a mean improvement of 2.3 points (0.14 points worse to 4.69 points better), in favour of surgery on the Constant scale (0 to 100 scale; higher scores mean better function), which is not a clinically important difference. Thus there is low‐quality evidence, downgraded one level for serious risk of bias and one level for serious inconsistency, that there may be little or no difference between surgery and conservative treatment in function measured at one year. The minimal clinical important difference (MCID) of Constant scale ranges from 5.7 to 10.4 points (Henseler 2015; Kukkonen 2013; Simovitch 2018; Torren 2016).


Forest plot of comparison 1. Surgical versus conservative interventions, outcome: 1.1 Function (overall at the end of follow‐up ‐ one year or more)

Forest plot of comparison 1. Surgical versus conservative interventions, outcome: 1.1 Function (overall at the end of follow‐up ‐ one year or more)

The results are subgrouped by types of surgical interventions (plate fixation versus intramedullary fixation), for exploratory purposes. The test for subgroup differences does not support a difference between the two surgical interventions (Chi² = 0.05, df = 1, P = 0.82, I² = 0%).

Upper limb functional outcome measures

DASH questionnaire (0 (best function) to 100 (worst function))

Pooled data (8 studies, 896 participants), demonstrated no apparent clinically important difference in disability (mean difference (MD) −3.87 points, 95% CI −7.75 to 0.01 points), at follow‐up of nine months or more, but the results were highly heterogeneous (I² = 90%; Analysis 1.2). The magnitude of the pooled difference and the 95% CI was less than 10 points, which is not considered a clinically relevant difference (Gummesson 2003; Hudak 1996). It is notable, however, that two studies found evidence of clinically important differences (COTS 2007; Mirzatolooei 2011). In particular, Mirzatolooei 2011 strongly favoured surgery (MD −12.70 points, 95% CI −15.22 to −10.18), with unusually high mean DASH scores in the conservative group.

Constant score (0 (worst function) to 100 (best function))

The pooled analysis showed a small, clinically unimportant improvement in function in favour of surgical intervention (MD 3.83 points, 95% CI 1.75 to 5.91; 9 studies, 867 participants), at follow‐up of nine months or more; see Analysis 1.3. As above, there was substantial heterogeneity (I² = 75%); Mirzatolooei 2011 was again an outlier.

UCLA score (2 (worst function) to 35 (best function))

A single study (Figueiredo 2008), found no significant difference between the two intervention groups (MD 2.10 points, 95% CI −0.70 to 4.90; 40 participants; Analysis 1.4).

Other scores

Based on the SANE score (0% to 100% scale with 100% being normal; MCID = 11.8 (Zhou 2018)), and L'Insalata score (0% to 100% scale with 100% being normal; MCID = not reported), Judd 2009 found better functional results at short‐term follow‐up in the surgical group (the result was clinically relevant at 3 weeks in assessing the SANE score: MD 13.4), but not at long‐term follow‐up, where the scores were higher in the conservative group (Analysis 1.5; Analysis 1.6).

Pain (primary outcome)

Four studies reported pain, measured using a visual analogue scale. The pooled analysis from three studies (Tamaoki 2017; Virtanen 2012a; Woltz 2017a), showed a small improvement, of no important clinical significance, in pain (VAS: 0 to 100 mm (worst score)), at six weeks (MD ‐4.27 mm, 95% CI −8.18 to −0.37; MCID = 14 mm). There was no difference between the two groups at three months (MD −0.08 mm, 95% CI −3.64 to 3.48), or at one year (MD −0.60 mm, 95% CI −3.51 to 2.31; low‐quality evidence, downgraded one level for serious risk of bias and one level for serious imprecision; Analysis 1.7). The minimal clinical important difference (MCID) of visual analogue scale for shoulder injury is 14 mm (Simovitch 2018; Tashjian 2009; Tashjian 2017).

We could not include data in the analysis from Koch 2008, which reported significantly better short‐term pain outcomes (VAS: 0 to 10 cm (worst score)), in the surgical group (mean VAS on days 5, 19 and 33 was 3.9, 2.9 and 1.6 cm for the surgery group and 5.1, 4.0 and 2.1 cm for the conservatively treated group; reported P < 0.05).

Virtanen 2012a found no significant differences between the two groups at three weeks (MD ‐6.00 mm, 95% CI −14.34 to 2.34 mm).

Treatment failure (primary outcome)

The difference in overall treatment failure was in favour of the surgical group (24/618 versus 77/579; risk ratio (RR) 0.32, 95% CI 0.20 to 0.50; 1197 participants, 12 studies; Analysis 1.8). We rated this low‐quality evidence, downgraded one level for serious risk of bias and one level for serious imprecision. We could not enter results on failure of treatment from Chen 2011 and for 13 participants from Naveen 2017 into the meta‐analysis because they reported data incompletely.

The most common cause of treatment failure in the conservatively managed group was symptomatic non‐union (8/561 (1.4%) versus 61/527 (11.6%); RR 0.20, 95% CI 0.10 to 0.40; 1088 participants, 10 studies); the percentage of symptomatic non‐union in the conservative‐treatment group ranged from 3.6% (1/28) in Judd 2009 to 15.4% in Ahrens 2017. The most common cause of treatment failure, reported in seven studies, in the surgically managed group was early mechanical failure (16/468 (3.4%)). Nine of the 16 cases of symptomatic malunion were reported in one study (COTS 2007).

When we subgrouped results for overall treatment failure by types of surgical interventions (plate fixation versus intramedullary fixation), for exploratory purposes, the test for subgroup differences did not show a difference between the two surgical interventions (Chi² = 0.48, df = 1, P = 0.49, I² = 0%; Analysis 1.9).

Cosmetic result

Deformity or asymmetry, or both, were more frequent in the conservative group (RR 0.16, 95% CI 0.05 to 0.46; 759 participants; 8 studies; I2 = 70%), and hardware prominence or irritation not requiring removal (RR 7.75, 95% CI 2.33 to 25.78; 592 participants; 6 studies; I2 = 0%), in the surgical group (Analysis 1.10). The pooled results for participants with cosmetic problems (e.g. deformities or imperfections such as scarring or bumps) favoured surgery (RR 0.55, 95% CI 0.31 to 0.98; 1130 participants, 11 studies; I2 = 63%; very low‐quality evidence downgraded one level for risk of bias, one level for imprecision, and one of inconsistency; Analysis 1.11). Full data on cosmetic results, either relating to individual cosmetic outcomes or participants with one or more unfavourable cosmetic outcomes, were not available. A sensitivity analysis, in which we replaced the derived data for two studies with that for participant dissatisfaction with cosmetic result, showed less difference between the two groups (RR 0.68, 95% CI 0.33 to 1.40; I2 = 70%).

Adverse events

Analysis 1.13 presents separate analyses by types of adverse events. These show that infection or dehiscence, or both, occurred only after surgery (22/686 versus 0/641; RR 5.62, 95% CI 1.95 to 16.15; 11 studies). This applied also to hardware irritation requiring removal (52/508 versus 1/483; RR 9.75, 95% CI 3.91 to 24.31; 9 studies), except in Woltz 2017a, which, following the intention‐to‐treat principle, included one participant who was randomised to non‐operative treatment but received plate fixation within a week because of pain. Skin and nerve problems were also more common after surgical treatment (75/338 versus 17/310; RR 4.86, 95% CI 1.85 to 12.76; 6 studies). Conversely, symptomatic malunion was much more common in the conservative‐treatment group (5/425 versus 45/397; RR 0.17, 95% CI 0.09 to 0.35; 9 studies); this analysis was dominated by Mirzatolooei 2011, which reported, without details of the symptoms, nearly half of the malunions (24 of 50). Potentially linked with this was the slightly greater number of the more serious cases of stiffness or restriction of shoulder movement in the conservative group (3/220 versus 8/202; RR 0.41, 95% CI 0.11 to 1.48; 4 studies). There were no obvious between‐group differences in the rarer reported adverse outcomes such as refracture (6 cases); complex regional pain syndrome (1 case); or other adverse events, such as thrombosis, cardiovascular events, impingement symptoms, transient plexus irritation and adhesive capsulitis (Analysis 1.13).

Total of participants with adverse event outcome

This outcome included participants with any complication, such as wound infection and dehiscence, hardware irritation requiring removal of the fixation device typically associated with surgery, and complications such as shoulder stiffness and symptomatic malunion that occur more commonly with conservative treatment. These adverse events did not include non‐union or other treatment failures. Several studies did not report this outcome and so we established a rule to avoid the risk of unit of analysis problems where individual complications could have occurred together in one person. Although slightly favouring non‐surgical treatment, the heterogeneous data pooled from all 14 studies did not confirm a difference between the two treatment groups (109/678 versus 72/639; RR 1.34, 95% CI 0.68 to 2.64; 1317 participants; I2 = 72%; very low‐quality evidence downgraded one level for risk of bias, one level for imprecision, and one for inconsistency; Analysis 1.14). A sensitivity analysis based on reported complications that disregarded the potential unit of analysis problems had a similar finding (Analysis 1.15). When we subgrouped the results by type of surgical intervention (plate fixation versus intramedullary fixation), for exploratory purposes, the test for subgroup differences did not show a difference between the two surgical interventions (Chi² = 0.22, df = 1, P = 0.64, I² = 0%; Analysis 1.16).

Health‐related quality of life

The two studies that reported health‐related quality of life reported separate physical and mental component scores for either the SF‐12 (Robinson 2013a), or the SF‐36 ( Woltz 2017a). Pooled data from the two studies (321 participants), at 12 months indicates that there is no statistical nor clinical difference in quality of life (0 to 100 scale, where 100 is best score), either for physical component (MD 0.30 points, 95% CI −1.95 to 2.56) or mental component (MD 1.31 points, 95% CI −0.34 to 2.97; Analysis 1.17). We consider this to be low‐quality evidence, downgraded one level for serious risk of bias and one level for serious imprecision. Analysis 1.17 also presents the six‐week and three‐month results from Woltz 2017a. The minimal clinical important difference (MCID) of SF‐36 ranges from 2.0 to 7.8 points (scale 0 to 100; Andresen 2018; Angst 2001; Laucis 2015).

Return to previous activities

Pooled data from three studies (Figueiredo 2008; Melean 2015; Tamaoki 2017), found significantly better results in favour of the surgical group with respect to time to return to previous activities in days (MD −24.64 days, 95% CI −36.36 to −12.91 days; low‐quality evidence, downgraded one level for serious risk of bias and one level for serious imprecision; Analysis 1.18). Robinson 2013a reported that there was no difference between the two groups in the time to return to work (mean 22.0 versus 24.2 days; reported P = 0.7).

Data from Koch 2008 showed a greater return in the surgical group to sport activities after two months (28/35 versus 18/33; RR 1.47, 95% CI 1.03 to 2.09; very low‐quality evidence, downgraded one level for serious risk of bias and two levels for very serious imprecision; Analysis 1.19). Robinson 2013a reported that there was no difference between the two groups in the numbers returning to their former sports activities or in the time for them to do this.

Asymptomatic non‐union

Pooled data from seven studies showed higher numbers with asymptomatic non‐union in the conservative group (3/434 versus 43/411; RR 0.12, 95% CI 0.05 to 0.30; Analysis 1.20).

Sensitivity analyses

We found that overall function at the end of follow‐up (one year or more), did not differ between groups in the primary analysis (i.e. including all studies; SMD 0.33, 95% CI −0.02 to 0.67), nor in the sensitivity analysis, where only studies at low risk of selection bias were included (SMD 0.19, 95% CI −0.17 to 0.55; data not shown). We were unable to assess the effect of including studies at high risk of detection bias, as all studies in the meta‐analysis failed to blind the outcome assessor.

We also performed a sensitivity analysis to investigate the effects of missing data on overall treatment failure. In the worst‐case scenario, we found a significant difference in favour of surgical intervention (RR 0.48, 95% CI 0.37 to 0.61; data not shown); for the best‐case scenario, we also found a statistically significant difference in favour of surgery (RR 0.34, 95% CI 0.22 to 0.54; data not shown).

Given that all included studies were of comparable size, with the exception of the slightly larger COTS 2007, we could not test for small sample bias. We also were unable to assess the effect of including studies of participants with a history of shoulder injury, because of inadequate reporting of this information in the studies.

Discusión

disponible en

Resumen de los resultados principales

Se incluyeron 14 estudios que incluyeron a 1469 participantes que evaluaron la efectividad de las intervenciones quirúrgicas en comparación con las intervenciones conservadoras para el tratamiento de los pacientes con fractura del tercio medio de la clavícula. Diez estudios compararon la fijación con placas con un cabestrillo o venda en ocho, o ambas, y cuatro estudios compararon la fijación intramedular con un cabestrillo o venda en ocho.

No todos los estudios incluidos aportaron evidencia de todos los resultados importantes, y la certeza de la evidencia para los resultados importantes fue baja y, a veces, muy baja.

Los resultados principales de la revisión se resumieron en Resumen de los hallazgos, tabla 1. La evidencia de calidad baja indica que, en comparación con el tratamiento conservador, la cirugía para tratar la fractura de clavícula puede no dar lugar a una mejoría significativa en la funcionalidad del antebrazo al año o más. La calidad de la evidencia se disminuyó debido al riesgo de sesgo y a la heterogeneidad estadística alta. La evidencia de calidad baja (disminuida debido al riesgo grave de sesgo y a la imprecisión grave), indica que puede no haber diferencias en el dolor entre los tratamientos al año. La evidencia de calidad baja (disminuida un nivel por riesgo grave de sesgo y un nivel por imprecisión grave), muestra que el riesgo de fracaso del tratamiento (número de participantes sometidos a cirugía secundaria no rutinaria (que excluye la extracción del implante) debido al fracaso de la consolidación sintomática, la consolidación viciosa u otra complicación, puede ser inferior después de la cirugía. La fuente principal de fracaso del tratamiento fue el fracaso mecánico (3,4%), en el grupo de cirugía y el fracaso de la consolidación sintomática (11,6%) en el grupo de tratamiento conservador. No se sabe si la cirugía da lugar a que menos pacientes presenten uno o más problemas cosméticos como deformidades, que fueron más frecuentes después del tratamiento conservador, o la prominencia del implante o la cicatrización, que solo ocurrió en el grupo de cirugía (evidencia de muy baja calidad disminuida un nivel en cada uno por riesgo grave de sesgo, imprecisión grave e inconsistencia grave). La prominencia del implante y la cicatrización antiestética ocurrieron solo en el grupo de cirugía, y la deformidad cosmética fue más común después del tratamiento conservador. No se sabe si hay diferencias entre la cirugía y el tratamiento conservador en cuanto al riesgo de incurrir en un resultado adverso como infección local, dehiscencia, consolidación viciosa sintomática, molestias que provocan la extracción del implante y problemas cutáneos y nerviosos (evidencia de muy baja calidad disminuida un nivel en cada uno por riesgo grave de sesgo, imprecisión grave e inconsistencia grave). Los resultados adversos frecuentes en el grupo de cirugía fueron la extracción del implante por molestias e infección, y en el grupo de tratamiento conservador, fue frecuente la consolidación viciosa sintomática. Hubo evidencia de calidad baja (disminuida debido al riesgo grave de sesgo y la grave imprecisión), de ninguna diferencia entre los grupos en cuanto a la calidad de vida (componente físico o componente mental) al año.

Compleción y aplicabilidad general de las pruebas

Los 13 ECA y un ensayo controlado cuasialeatorio incluidos en esta revisión reclutaron a 1469 participantes, pero con frecuencia hubo una disminución significativa en los datos disponibles para el agrupamiento. Para los resultados primarios, hubo 838 participantes de diez estudios que contribuyeron con datos a la funcionalidad a los 12 meses, 277 participantes de tres estudios que contribuyeron con datos al dolor a los 12 meses y 1197 participantes de 12 estudios que contribuyeron con datos al fracaso del tratamiento.

En general, la población de la revisión fueron participantes adultos predominantemente masculinos, y en general las personas mayores se excluyeron. Además, la comparación principal fue la fijación con placas versus el cabestrillo sencillo. Los 14 estudios incluidos evaluaron solo a adultos con fracturas desplazadas o en ángulo del tercio medio de la clavícula, lo que significa que no fue posible realizar análisis de subgrupos por tipo de fractura. Además, los estudios incluidos no presentaron datos de resultado para permitir el análisis de subgrupos sobre la base del momento de realización de la cirugía, dos fragmentos versus más de dos fragmentos, ni fracturas abiertas versus cerradas. La información con respecto al momento de realización de la cirugía y el tipo de fractura (característica de la fractura), también es importante para la planificación de los centros traumatológicos.

Aunque todos los estudios incluidos son relevantes para la práctica actual, es probable que algunas intervenciones se utilicen actualmente con poca frecuencia, como la clavija de Hagie modificada en Judd 2009 y las placas de reconstrucción en Mirzatolooei 2011, Tamaoki 2017 y Virtanen 2012a. En la actualidad es mucho más frecuente en la práctica habitual el uso de una uña elástica de titanio para la fijación intramedular y una placa clavicular preconfigurada para la fijación con placas. Además, la aplicabilidad de los resultados de las intervenciones está principalmente relacionada con los adultos jóvenes, principalmente masculinos, con fracturas desplazadas o en ángulo del tercio medio de la clavícula. Por lo tanto, la aplicabilidad de la evidencia de esta revisión no está clara con respecto al tratamiento de las fracturas no desplazadas de clavícula o las fracturas en las mujeres de edad avanzada, un subgrupo importante de la población que presenta estas fracturas.

Ninguno de los estudios logró medir todos los resultados de importancia; en particular, solo cuatro estudios midieron el dolor, y solo tres de ellos proporcionaron datos del dolor a largo plazo. Otro problema importante está relacionado con la presentación de los resultados cosméticos y los eventos adversos; se observó que los resultados individuales que contribuyeron a estos resultados "compuestos" se informaron de manera variable y deficiente en los estudios y, por otro lado, habitualmente no estaban disponibles los datos de los números con un resultado cosmético deficiente o un evento adverso.

Calidad de la evidencia

La evidencia fue de calidad baja para la funcionalidad, el dolor, el fracaso del tratamiento y la calidad de vida relacionada con la salud, y de muy baja calidad para los números de participantes con uno o más problemas cosméticos o con eventos adversos; ver "Resumen de los hallazgos", tabla 1. La certeza de la evidencia se disminuyó un nivel para todos los resultados como resultado de las deficiencias metodológicas, incluida la falta de ocultación adecuada de la asignación en la mayoría de los estudios y el fracaso en el cegamiento del evaluador de resultados en todos los estudios. Sólo cuatro estudios incluidos (Ahrens 2017; Robinson 2013a; Tamaoki 2017; Woltz 2017a), se informaron según los estándares de la declaración CONSORT (Schulz 2010). La certeza de la evidencia se disminuyó para varios resultados (funcionalidad, problemas cosméticos, eventos adversos), por inconsistencia, cuando hubo evidencia de heterogeneidad estadística, en particular con respecto a diferencias en la dirección del efecto entre los estudios. La certeza de la evidencia se disminuyó por imprecisión para todos los resultados, excepto la funcionalidad, debido al escaso número de eventos o totales. No se disminuyó por falta de direccionalidad y se considera que la posibilidad de sesgo de publicación es baja.

En consecuencia, los resultados cuantitativos de esta revisión se deben interpretar con cuidado y considerar, en este momento, que se requiere confirmación a partir de la evidencia de estudios más grandes.

Sesgos potenciales en el proceso de revisión

Esta revisión actualizada se planificó y se realizó en conformidad con los criterios y métodos planteados en un protocolo publicado (Lenza 2011) y la revisión anterior (Lenza 2013). Se cree que la estrategia de búsqueda fue integral, no se aplicaron restricciones de idioma y el autor de contacto (ML) la ha mantenida actualizada de forma adecuada y periódica. Se incluyeron búsquedas manuales de actas de congresos y búsquedas de estudios en curso y recientemente completados. Sin embargo, es posible que se hayan omitido algunos estudios potencialmente elegibles. Se intentó establecer contacto con los autores de todos los estudios incluidos, pero con un éxito limitado. Las desviaciones estándar de las puntuaciones DASH y de Constant se obtuvieron a través del contacto personal con los autores de dos estudios (Ahrens 2017; Mirzatolooei 2011). Las desviaciones estándar y las medias de las puntuaciones de la EAV también se obtuvieron mediante el contacto personal con los autores de un estudio (Woltz 2017a).

La fecha de búsqueda fue diciembre 2017. Sin embargo, en noviembre del 2018, durante el procesamiento editorial de esta actualización de la revisión, se publicó NCT01078480, uno de los estudios en curso enumerados, (Qvist 2018). Este ECA paralelo multicéntrico incluyó 146 participantes asignados al azar a fijación con una placa preconfigurada y tornillos o a tratamiento con un cabestrillo. Los autores del estudio informaron que después de seis meses y un año no hubo diferencias estadísticamente significativas entre los grupos en las puntuaciones medianas de DASH o Constant. La tasa de fracaso del tratamiento fue inferior en el grupo quirúrgico. Es de señalar que estos resultados, con respecto a la funcionalidad general y el fracaso del tratamiento a los 12 meses, son consistentes con los resultados de la presente revisión. Por lo tanto, no se considera que la fecha de la última búsqueda o la no inclusión de este estudio sean una fuente importante de sesgo.

En la actualidad es posible utilizar un escaso número de puntuaciones validadas específicas para evaluar la funcionalidad del hombro. Cuando se agrupan los resultados de los estudios que incluyeron más de una medida de funcionalidad, para los objetivos del agrupamiento de los datos para la tabla "Resumen de los hallazgos" se decidió elegir la puntuación de Constant como el valor predeterminado porque es más específica para la funcionalidad del hombro que la puntuación del cuestionario DASH; y, en comparación con las puntuaciones UCLA, SANE y L’Insalata, la puntuación de Constant se utiliza con más frecuencia en la bibliografía.

Fue necesario hacer suposiciones acerca de los datos al calcular los resultados compuestos eventos adversos y resultado cosmético. Los estudios consideraron varios tipos de eventos, lo que dio lugar a posibles problemas con la unidad de análisis, ya que los participantes podían haber tenido más de una complicación o problema cosmético. Para disminuir el riesgo de recuentos dobles de los eventos, se intentó extraer el número de participantes con uno de los eventos individuales como un sustituto; se seleccionó el evento particular con la mayor cantidad de casos en cada grupo de tratamiento. Hay cierta incertidumbre acerca de las estimaciones del efecto para estos resultados. (Se han tomado decisiones transparentes al informar el número de casos con cada evento particular del evento compuesto y el número de casos se utilizó en los análisis en la sección de notas de la tabla Características de los estudios incluidos.)

Acuerdos y desacuerdos con otros estudios o revisiones

Muchas revisiones sistemáticas recientes demuestran un interés continuo en la comparación entre las intervenciones quirúrgicas versus conservadoras para el tratamiento de las fracturas del tercio medio de la clavícula en adultos. En la primera versión de esta revisión, se describieron cuatro revisiones sistemáticas publicadas sobre este tema (Duan 2011; McKee 2012; Virtanen 2012b; Zlowodzki 2005), y se analizaron sus resultados con respecto a esta primera versión de la revisión (Lenza 2013). Se encontró que las conclusiones contrastaron con las de estas cuatro revisiones porque los resultados se limitaron a los datos de ECA, los datos de los estudios incluidos se extrajeron en conformidad con los criterios de valoración predeterminados y se realizaron análisis de sensibilidad de los resultados. Además, el riesgo de sesgo fue menos favorable que el de McKee 2012, ya que los autores utilizaron una escala para evaluar la calidad del estudio. Las escalas no se recomiendan porque proporcionan evaluaciones poco fiables de la validez (Juni 1999).

La actualización de la búsqueda para esta revisión dio lugar a la identificación de 12 revisiones sistemáticas nuevas que evaluaron esta comparación: una revisión se publicó en 2012 (Ban 2012), dos en 2013 (Liu 2013; Xu 2013), tres en 2014 (Kong 2014; Rehn 2014; Xu 2014), cuatro en 2015 (Devji 2015; Walton 2015; Wang 2015a; Wang 2015b), y dos en 2017 (Smeeing 2017; Woltz 2017b).

Ban 2012 evaluó ECA y estudios de cohortes que evaluaron los tratamientos para la fractura de clavícula; los autores incluyeron tres ECA que compararon la cirugía versus tratamiento conservador y todos ellos se incluyeron en la presente revisión (COTS 2007; Mirzatolooei 2011; Smekal 2009). Los resultados informados de los tres ECA fueron similares a los de la presente revisión. Ban 2012 también incluyó un estudio de cohortes prospectivo que se excluyó de la presente revisión (Kulshrestha 2011), y otro ECA que comparó placa versus fijación intramedular (Ferran 2010). Los autores concluyeron que la cirugía con fijación con placas dio lugar a un mejor resultado funcional y a menores tasas de consolidación viciosa y fracaso de la consolidación que el tratamiento conservador.

Liu 2013 incluyó los resultados de ocho estudios con 663 participantes que compararon intervenciones quirúrgicas versus conservadoras, entre ellos cuatro ECA que se evaluaron en la presente revisión (COTS 2007; Judd 2009; Smekal 2009; Virtanen 2012a), un resumen (Smith 2001), que se enumeró como un estudio en espera de clasificación (ver Características de los estudios en espera de clasificación), y tres estudios clínicos controlados (Bohme 2011; Jubel 2005; Kulshrestha 2011), que se excluyeron de la revisión (ver "Características de los estudios excluidos"). Los autores encontraron que hubo menores incidencias, estadísticamente significativas, de fracaso de la consolidación, consolidación viciosa y complicaciones neurológicas después de la cirugía.

Xu 2013 evaluó ECA que compararon intervenciones quirúrgicas versus conservadoras para la fractura de clavícula. Incluyeron tres ECA que se evaluaron en esta revisión (COTS 2007; Mirzatolooei 2011; Smekal 2009), y un resumen (Smith 2001). Sus resultados mostraron los datos de tres ECA y un resumen con un total de 321 participantes y concluyeron que la cirugía fue más efectiva que el tratamiento conservador con respecto a la tasa de fracaso de la consolidación, consolidación viciosa y las complicaciones generales. El metanálisis que realizaron también mostró mejores resultados funcionales en los grupos de tratamiento quirúrgico.

Kong 2014 evaluó seis ECA que compararon intervenciones quirúrgicas versus conservadoras para la fractura de clavícula, todos incluidos en la presente revisión (COTS 2007; Judd 2009; Mirzatolooei 2011; Robinson 2013a; Smekal 2009; Virtanen 2012a). Su interpretación del riesgo de sesgo (análisis cualitativo), fue similar a la de esta revisión. Los metanálisis fueron también similares, y los autores encontraron efectos beneficiosos de la cirugía que incluyeron mejoría de la funcionalidad, una tasa baja de fracaso de la consolidación y de consolidación viciosa; y efectos beneficiosos de las intervenciones conservadoras, como una tasa baja de eventos adversos. Concluyeron que se justifica la realización de estudios adicionales.

Rehn 2014 incluyó los resultados de cinco ECA, con 369 participantes, que se evaluaron en la revisión (COTS 2007; Judd 2009; Smekal 2009; Virtanen 2012a). Los autores señalaron que el tiempo hasta la consolidación fue más corto y las variables de evaluación funcionales fueron mejores con la cirugía, en particular al seguimiento a corto plazo. También informaron una incidencia mayor de complicaciones que requirieron cirugía mayor adicional en el grupo de intervenciones conservadoras, y que las complicaciones leves fueron mayores en los grupos de intervenciones quirúrgicas. Debido al nivel de la evidencia incluida en la revisión, los autores concluyeron que la evidencia no apoya la cirugía ni el tratamiento conservador para las fracturas de clavícula.

Xu 2014 evaluó ECA que compararon intervenciones quirúrgicas versus conservadoras para la fractura de clavícula. Incluyeron seis ECA que se evaluaron en esta revisión (COTS 2007; Judd 2009; Mirzatolooei 2011; Smekal 2009; Virtanen 2012a; Witzel 2007), y un resumen (Smith 2001). Witzel 2007 informó los mismos resultados en dos artículos (Koch 2008; Witzel 2007), y Koch 2008 se informó por defecto en esta revisión. Sus resultados indicaron que la cirugía da lugar a una incidencia significativamente menor de fracaso de la consolidación y a mejores puntuaciones de funcionalidad; sus datos agrupados indicaron que no hubo diferencias estadísticamente significativas con respecto a las complicaciones totales entre las intervenciones quirúrgicas y conservadoras.

Devji 2015 incluyó 15 ECA (nueve estudios que compararon intervenciones quirúrgicas y conservadoras, cinco que compararon implantes para el tratamiento quirúrgico y uno que comparó tratamientos conservadores). En la presente revisión también se evaluaron los nueve ECA que compararon intervenciones quirúrgicas y conservadoras para tratar las fracturas de clavícula (Chen 2011; COTS 2007; Figueiredo 2008; Judd 2009; Koch 2008; Mirzatolooei 2011; Robinson 2013a; Smekal 2009; Virtanen 2012a). Su interpretación del riesgo de sesgo (análisis cualitativo) fue similar al de la presente revisión. Los datos agrupados demostraron que la incidencia de las operaciones y todas las complicaciones secundarias no difirió entre las intervenciones quirúrgicas y conservadoras. Hubo una mejoría funcional al año en el grupo quirúrgico; sin embargo, esta diferencia no fue clínicamente importante. Concluyeron que la evidencia actual no apoya la cirugía para tratar las fracturas de clavícula.

Walton 2015 examinó de forma sistemática la bibliografía para evaluar el análisis de costos de las intervenciones quirúrgicas versus conservadoras para tratar las fracturas de clavícula. Incluyeron cuatro ECA (COTS 2007; Judd 2009; Smekal 2009; Virtanen 2012a), que se evaluaron en la presente revisión. Sobre la base de los cuatro ECA informaron que el tratamiento conservador para las fracturas de clavícula en los adultos es más costo‐efectivo que las intervenciones quirúrgicas. Concluyeron que las intervenciones conservadoras en los adultos son la decisión económica óptima para el contribuyente.

Wang 2015a incluyó 13 estudios que compararon tratamiento quirúrgico versus conservador para las fracturas de clavícula; solo ocho de ellos se incluyeron en la presente revisión (Chen 2011; COTS 2007; Figueiredo 2008; Judd 2009; Mirzatolooei 2011; Robinson 2013a; Smekal 2009; Virtanen 2012a). Los cinco estudios restantes que incluyeron (Bohme 2011; Jubel 2005; Khorami 2014; Kulshrestha 2011; Smith 2001), se excluyeron por las razones señaladas en Características de los estudios excluidos y Estudios en espera de clasificación. Los datos agrupados de la revisión indicaron que la cirugía fue más efectiva para reducir las tasas de fracaso de la consolidación, consolidación viciosa sintomática, síntomas neurológicos y complicaciones generales. Además, las puntuaciones de funcionalidad mejoraron significativamente después de la cirugía al seguimiento al año o más. Los autores concluyeron que la cirugía podría ser mejor que la intervención conservadora; sin embargo, no apoyaron la cirugía como la intervención de rutina en todas las fracturas desplazadas de clavícula.

Wang 2015b informó un metanálisis bayesiano en red que incluyó 13 ECA, compuesto por cuatro estudios que compararon los implantes para el tratamiento quirúrgico y nueve estudios que compararon intervenciones quirúrgicas y conservadoras (COTS 2007; Dugar 2013; Figueiredo 2008; Judd 2009; Koch 2008; Mirzatolooei 2011; Robinson 2013a; Smekal 2009; Virtanen 2012a). En la presente revisión se incluyeron y analizaron todos estos estudios, excepto Dugar 2013, que se excluyó porque incluyó a participantes que también presentaban fracturas en el tercio medio y lateral de la clavícula (16,6%) y no presentaron los resultados por separado. Los autores de Wang 2015b encontraron tasas mayores de fracaso de la consolidación después del tratamiento conservador en comparación con después de la cirugía, pero dicho estudio no evaluó la funcionalidad ni el fracaso del tratamiento.

Smeeing 2017 incluyó ocho ECA y 12 estudios observacionales; se incluyeron los ocho ECA en la revisión (Chen 2011; COTS 2007; Judd 2009; Melean 2015; Mirzatolooei 2011; Robinson 2013a; Virtanen 2012a; Witzel 2007). Los datos agrupados de la revisión mostraron que las tasas de fracaso de la consolidación fueron significativamente mayores después del tratamiento quirúrgico que después del conservador; el riesgo de consolidación viciosa no difirió entre el tratamiento quirúrgico y conservador, y hubo una diferencia significativa en los resultados de funcionalidad que favoreció al tratamiento quirúrgico.

Woltz 2017b revisó de forma sistemática la bibliografía de las intervenciones quirúrgicas versus conservadoras para el tratamiento de las fracturas de clavícula. Incluyeron seis ECA (COTS 2007; Melean 2015; Mirzatolooei 2011; Robinson 2013a; Virtanen 2012a; Woltz 2017a), que se evaluaron en la presente revisión. Los datos agrupados mostraron que la fijación con placas redujo de manera significativa la tasa de fracaso de la consolidación en comparación con el tratamiento conservador; además, la fijación con placas también dio lugar a mejores puntuaciones de funcionalidad; sin embargo, la relevancia clínica de esta diferencia no estuvo clara. Los autores concluyeron que no existe apoyo para la fijación de rutina con placas en todos los pacientes, sino para un tratamiento individualizado basado en la toma de decisiones compartida.

Resumen

En resumen, las 12 revisiones sistemáticas recién enumeradas están ahora anticuadas porque ninguna incluye tres estudios nuevos (Ahrens 2017; Naveen 2017; Tamaoki 2017), uno de los cuales (Ahrens 2017), es un estudio multicéntrico grande. Los resultados de la presente revisión, que no demostraron diferencias clínicas entre las dos intervenciones en cuanto a la funcionalidad del hombro, el dolor ni la calidad de vida, a menudo contrastan con los de las 12 revisiones sistemáticas descritas anteriormente.

Study flow diagram
Figuras y tablas -
Figure 1

Study flow diagram

Risk of bias graph: review authors' judgements about each risk of bias item presented as percentages across all included studies
Figuras y tablas -
Figure 2

Risk of bias graph: review authors' judgements about each risk of bias item presented as percentages across all included studies

Risk of bias summary: review authors' judgements about each risk of bias item for each included study
Figuras y tablas -
Figure 3

Risk of bias summary: review authors' judgements about each risk of bias item for each included study

Forest plot of comparison 1. Surgical versus conservative interventions, outcome: 1.1 Function (overall at the end of follow‐up ‐ one year or more)
Figuras y tablas -
Figure 4

Forest plot of comparison 1. Surgical versus conservative interventions, outcome: 1.1 Function (overall at the end of follow‐up ‐ one year or more)

Comparison 1 Surgical versus conservative interventions, Outcome 1 Function (overall at the end of follow‐up ‐ one year or more).
Figuras y tablas -
Analysis 1.1

Comparison 1 Surgical versus conservative interventions, Outcome 1 Function (overall at the end of follow‐up ‐ one year or more).

Comparison 1 Surgical versus conservative interventions, Outcome 2 DASH questionnaire at the end of follow‐up (0 (best function) to 100 (worst function)).
Figuras y tablas -
Analysis 1.2

Comparison 1 Surgical versus conservative interventions, Outcome 2 DASH questionnaire at the end of follow‐up (0 (best function) to 100 (worst function)).

Comparison 1 Surgical versus conservative interventions, Outcome 3 Constant score at the end of follow‐up (0 (worst function) to 100 (best function)).
Figuras y tablas -
Analysis 1.3

Comparison 1 Surgical versus conservative interventions, Outcome 3 Constant score at the end of follow‐up (0 (worst function) to 100 (best function)).

Comparison 1 Surgical versus conservative interventions, Outcome 4 UCLA score at the end of follow‐up ‐ one year or more (2 (worst function) to 35 (best function)).
Figuras y tablas -
Analysis 1.4

Comparison 1 Surgical versus conservative interventions, Outcome 4 UCLA score at the end of follow‐up ‐ one year or more (2 (worst function) to 35 (best function)).

Comparison 1 Surgical versus conservative interventions, Outcome 5 SANE score (0 (worst function) to 100 (best function)).
Figuras y tablas -
Analysis 1.5

Comparison 1 Surgical versus conservative interventions, Outcome 5 SANE score (0 (worst function) to 100 (best function)).

Comparison 1 Surgical versus conservative interventions, Outcome 6 L'Insalata score (0 (worst function) to 100 (best function)).
Figuras y tablas -
Analysis 1.6

Comparison 1 Surgical versus conservative interventions, Outcome 6 L'Insalata score (0 (worst function) to 100 (best function)).

Comparison 1 Surgical versus conservative interventions, Outcome 7 Pain (measured by VAS: 0 to 100 mm (worst score)).
Figuras y tablas -
Analysis 1.7

Comparison 1 Surgical versus conservative interventions, Outcome 7 Pain (measured by VAS: 0 to 100 mm (worst score)).

Comparison 1 Surgical versus conservative interventions, Outcome 8 Treatment failure (participants who have a non‐routine secondary surgical intervention).
Figuras y tablas -
Analysis 1.8

Comparison 1 Surgical versus conservative interventions, Outcome 8 Treatment failure (participants who have a non‐routine secondary surgical intervention).

Comparison 1 Surgical versus conservative interventions, Outcome 9 Total treatment failure ‐ subgrouped by type of surgery.
Figuras y tablas -
Analysis 1.9

Comparison 1 Surgical versus conservative interventions, Outcome 9 Total treatment failure ‐ subgrouped by type of surgery.

Comparison 1 Surgical versus conservative interventions, Outcome 10 Cosmetic result ‐ individual complications.
Figuras y tablas -
Analysis 1.10

Comparison 1 Surgical versus conservative interventions, Outcome 10 Cosmetic result ‐ individual complications.

Comparison 1 Surgical versus conservative interventions, Outcome 11 Participants with cosmetic problems.
Figuras y tablas -
Analysis 1.11

Comparison 1 Surgical versus conservative interventions, Outcome 11 Participants with cosmetic problems.

Comparison 1 Surgical versus conservative interventions, Outcome 12 Sensitivity analysis: participants with cosmetic problems.
Figuras y tablas -
Analysis 1.12

Comparison 1 Surgical versus conservative interventions, Outcome 12 Sensitivity analysis: participants with cosmetic problems.

Comparison 1 Surgical versus conservative interventions, Outcome 13 Adverse events ‐ individual complications.
Figuras y tablas -
Analysis 1.13

Comparison 1 Surgical versus conservative interventions, Outcome 13 Adverse events ‐ individual complications.

Comparison 1 Surgical versus conservative interventions, Outcome 14 Participants with adverse events.
Figuras y tablas -
Analysis 1.14

Comparison 1 Surgical versus conservative interventions, Outcome 14 Participants with adverse events.

Comparison 1 Surgical versus conservative interventions, Outcome 15 Sensitivity analysis: participants with adverse events.
Figuras y tablas -
Analysis 1.15

Comparison 1 Surgical versus conservative interventions, Outcome 15 Sensitivity analysis: participants with adverse events.

Comparison 1 Surgical versus conservative interventions, Outcome 16 Participants with adverse events ‐ subgrouped by type of surgery.
Figuras y tablas -
Analysis 1.16

Comparison 1 Surgical versus conservative interventions, Outcome 16 Participants with adverse events ‐ subgrouped by type of surgery.

Comparison 1 Surgical versus conservative interventions, Outcome 17 Health‐related quality of life: SF‐36 or SF‐12 (0 (worst quality of life) to 100 (best quality of life).
Figuras y tablas -
Analysis 1.17

Comparison 1 Surgical versus conservative interventions, Outcome 17 Health‐related quality of life: SF‐36 or SF‐12 (0 (worst quality of life) to 100 (best quality of life).

Comparison 1 Surgical versus conservative interventions, Outcome 18 Time to return to previous activities (days).
Figuras y tablas -
Analysis 1.18

Comparison 1 Surgical versus conservative interventions, Outcome 18 Time to return to previous activities (days).

Comparison 1 Surgical versus conservative interventions, Outcome 19 Number of participants returning to sport activities after two months.
Figuras y tablas -
Analysis 1.19

Comparison 1 Surgical versus conservative interventions, Outcome 19 Number of participants returning to sport activities after two months.

Comparison 1 Surgical versus conservative interventions, Outcome 20 Asymptomatic non‐union.
Figuras y tablas -
Analysis 1.20

Comparison 1 Surgical versus conservative interventions, Outcome 20 Asymptomatic non‐union.

Summary of findings for the main comparison. Surgical versus conservative interventions for treating fractures of the middle third of the clavicle

Surgical versus conservative interventions for treating fractures of the middle third of the clavicle

Patient or population: adults with acute fracture of the middle third of the clavicle
Settings: hospital (tertiary care)
Intervention: surgery (e.g. plate fixation or intramedullary fixation)

Comparison: conservative intervention (e.g. arm sling or figure‐of‐eight bandage)

Outcomes

Illustrative comparative risks* (95% CI)

Relative effect
(95% CI)

No of participants
(studies)

Quality of the evidence
(GRADE)

Comments

Assumed risk

Corresponding risk

Conservative treatment

Surgical treatment

Function (overall)
Various toolsa; higher values mean better function (0 to 100 scale, 100 is best function)
Follow‐up: 12 months

Mean (SD) population Constant score 89 (7)b

The standardised mean difference in function (overall) in the surgery groups was 0.33 standard deviations higher (0.02 lower to 0.67 higher)

838

(10 studies)

⊕⊕⊝⊝
lowc,d

The SMD resultb equates to a mean improvement of 2.3 points (0.14 points worse to 4.69 points better) in favour of surgery on the Constant scale (0 to 100 scale; higher scores mean better function). This does not represent a clinically important difference. The MCID of Constant scale ranges from 5.7 to 10.4 points.

Pain

VAS: 0 to 100 mm (0 is no pain and 100 mm is the worst score)

Follow‐up: 12 months

The mean pain in the control groups was 7 mm

The mean pain in the surgery groups was reduced by 0.6 mm (‐3.51 lower to 2.31 higher)

277

(3 studies)

⊕⊕⊝⊝
lowc,e

This is not a clinically important effect.

The MCID of VAS for shoulder injury is 14 mm.

Treatment failuref Indication for non‐routine secondary surgery
Follow‐up: 12 months

132 per 1000g

43 per 1000
(27 to 66)

RR 0.32
(0.20 to 0.50)

1197
(12 studies)

⊕⊕⊝⊝
lowc,e

The main source of treatment failure in the conservative treatment group was symptomatic non‐union (61 cases/527 (11.6%); 10 studies) and in the surgical group it was mechanical failure (16/468 (3.4%); 7 studies). Overall treatment failure in the conservative group is dominated by the results of 2 studiesh (289 participants): 33/77 = 43%.

2 studies (118 participants) reported that they had no treatment failures in either group.

Cosmetic problemi
Follow‐up: 12 months

218 per 1000g

120 per 1000
(68 to 214)

RR 0.55

(0.31 to 0.98)

1130
(11 studies)

⊕⊝⊝⊝
very lowc,e,j

The derivation of this outcome (number of people with ≥ 1 cosmetic problems) varied across the studies. Cosmetic deformity and/or asymmetry was greater in the conservative group and hardware prominence not requiring implant removal and scarring occurred only in the surgical group.k

Total of participants with adverse event outcomel
Follow‐up: 12 months

107 per 1000g

144 per 1000

(73 to 282)

RR 1.34 (0.68 to 2.64)

1317
(14 studies)

⊕⊝⊝⊝
very lowc,e,m

The derivation of this outcome (number of people with ≥ 1 adverse events) varied across the studies. Hardware, removed likely due to discomfort, was most frequent in the surgical group (52/508 (10.2%); 9 studies), and symptomatic malunion (45/397 (11.3%); 9 studies), in the conservative group. Infection and/or dehiscence occurred only in the surgical group (22/686 (3.2%); 11 studies).n

Health‐related quality of life: SF‐36 or SF‐12 physical component score at 1 year (0 to 100 points, 100 is best)

The mean health‐related quality of life: SF‐36 or SF‐12 physical component score at 1 year was 54.7

MD 0.30 higher (1.95 lower to 2.56 higher)

321

(2 studies)

⊕⊕⊝⊝
lowc,e

This does not represent a clinically important difference. The MCID of SF‐36 ranges from 2.0 to 7.8 points (scale 0 to 100).

*The basis for the assumed risk for dichotomous outcomes is provided in footnotes. The corresponding risk (and its 95% confidence interval) is based on the assumed risk in the comparison group and the relative effect of the intervention (and its 95% CI).
CI: confidence interval; MCID: minimal clinical important difference; MD: mean difference; RR: risk ratio; SD: standard deviation; SMD: standardised mean difference; VAS: visual analogue scale

GRADE Working Group grades of evidence:
High quality: we are very confident that the true effect lies close to that of the estimate of the effect.
Moderate quality: we are moderately confident in the effect estimate: the true effect is likely to be close to the estimate of the effect, but there is a possibility that it is substantially different.
Low quality: our confidence in the effect estimate is limited: the true effect may be substantially different from the estimate of the effect.
Very low quality: we have very little confidence in the effect estimate: the true effect is likely to be substantially different from the estimate of effect.

aPatient‐reported functional scores were Constant score (7 studies), the Disability of the Arm, Shoulder, and Hand questionnaire (DASH; 1 study), the UCLA score (1 study) and Single Assessment Numeric Evaluation (SANE) score (1 study).
bThis is based on the mean (SD) Constant score in a healthy population as reported in Yian 2005; mean improvement in Constant score back‐translated from SMD using the SD from the healthy population.
cAll studies had methodological flaws; only two adequately concealed treatment allocation, and all were susceptible to detection bias in the measurement of self‐reported outcomes due to lack of blinding of the participant. All outcomes were downgraded one level for serious risk of bias.
dThere was considerable heterogeneity (I2 = 83%), and thus we downgraded the quality of the evidence by one level for serious inconsistency.
eTotal number of events and/or number of participants were small, and thus we downgraded the quality of the evidence by one level for serious imprecision.
fTreatment failure, measured by the number of participants who had undergone or were being considered for a non‐routine secondary surgical intervention for symptomatic non‐union, malunion or other complications (e.g. mechanical failure defined as a condition in which an implant loses its capacity to carry a load). This does not include plate removal for hardware irritation.
gThe assumed risk was the mean risk in the control group.
hThese two studies had 13 of the 16 symptomatic malunions: 9 were from one study. This is an unusually high number: most malunions are asymptomatic or with mild symptoms with no need for other types of treatment.
iThe number of people with one or more cosmetic problems, primarily deformity, asymmetry and/or shoulder droop, hardware prominence not requiring removal, unsightly scar and bump at fracture site. These data were often provided for individual outcomes and we applied a rule to avoid potential unit of analysis issues.
jThere was considerable heterogeneity (I2 = 63%) with results from different studies spread on both sides of the line of no effect; thus we downgraded the evidence by one level for serious inconsistency.
kCosmetic deformity and/or asymmetry was greater in the conservative group (21/398 versus 93/361; RR 0.16, 95% CI 0.05 to 0.46). Hardware irritation not requiring implant removal (28/308), and unsightly but otherwise not problematic scars (14/273) occurred only in the surgical group.
lTotal of participants with adverse event outcome: one or more of local infection, dehiscence, discomfort leading to implant removal, skin and nerve problems, stiffness, refracture, symptomatic malunion and other adverse events (e.g. thrombosis, shoulder impingement, cardiovascular event and transient plexus irritation).
mThere was considerable heterogeneity (I2 = 72%) with results from different studies spread on both sides of the line of no effect; thus the evidence was downgraded one level for serious inconsistency.
nSkin and nerve problems were also more common after surgical treatment (75/338 versus 17/310; RR 4.86, 95% CI 1.85 to 12.76; 6 studies).
oHealth‐rerelated quality‐of‐life score was the physical component of SF‐36 and SF‐12; the two studies did not report the full score.

Figuras y tablas -
Summary of findings for the main comparison. Surgical versus conservative interventions for treating fractures of the middle third of the clavicle
Table 1. Treatment interventions of included studies

Study ID

No. centres

No. participants (assessed/assigned)

Surgical fixation

Conservative treatment

Ahrens 2017

20

204/301 (67.8%)

Plate fixation: LCP (precontoured titanium plate)

Simple sling

Chen 2011

11

60/60 (100%)

Intramedullary fixation: TEN

Simple sling

COTS 2007

8

111/132 (84.1%)

Plate fixation: limited DCP/3.5 mm reconstruction plates/pre‐contoured plates/other plates

Simple sling

Figueiredo 2008

1

40/50 (80%)

Plate fixation: 3.5 mm DCP plate fixation

Simple sling

Judd 2009

1

57/57 (100%)

Intramedullary fixation: modified Hagie pin

Simple sling

Koch 2008

1

68/68 (100%)

Intramedullary fixation: 2 mm pin

Figure‐of‐eight bandage

Melean 2015

1

76/76 (100%)

Plate fixation: 3.5 mm LCP/LCP reconstruction plates

Simple sling

Mirzatolooei 2011

1

50/60 (83.3%)

Plate fixation: 3.5 mm reconstruction plates

Simple sling

Naveen 2017

1

60/60 (100%)

Plate fixation: 3.5 mm DCP plate fixation

Figure‐of‐eight bandage

Robinson 2013a

3

178/200 (89%)

Plate fixation: LCP (precontoured titanium plate)

Simple sling

Smekal 2009

1

60/68 (88.2%)

Intramedullary fixation: TEN

Simple sling

Tamaoki 2017

2

98/117 (83.8%)

Plate fixation: 3.5 mm reconstruction plates

Figure‐of‐eight bandage

Virtanen 2012a

1

51/60 (85%)

Plate fixation: 3.5 mm reconstruction plates

Simple sling

Woltz 2017a

16

154/160 (96.2%)

Plate fixation: most operatively treated participants (80%) were treated with a precontoured clavicular plate

Simple sling

DCP: dynamic compression plates; LCP: locking compression plate; TEN: titanium elastic nail

Figuras y tablas -
Table 1. Treatment interventions of included studies
Comparison 1. Surgical versus conservative interventions

Outcome or subgroup title

No. of studies

No. of participants

Statistical method

Effect size

1 Function (overall at the end of follow‐up ‐ one year or more) Show forest plot

10

838

Std. Mean Difference (IV, Random, 95% CI)

0.33 [‐0.02, 0.67]

1.1 Plate fixation versus conservative intervention

7

661

Std. Mean Difference (IV, Random, 95% CI)

0.36 [0.01, 0.70]

1.2 Intramedullary fixation versus conservative intervention

3

177

Std. Mean Difference (IV, Random, 95% CI)

0.22 [‐0.86, 1.31]

2 DASH questionnaire at the end of follow‐up (0 (best function) to 100 (worst function)) Show forest plot

8

896

Mean Difference (IV, Random, 95% CI)

‐3.87 [‐7.75, 0.01]

3 Constant score at the end of follow‐up (0 (worst function) to 100 (best function)) Show forest plot

9

867

Mean Difference (IV, Random, 95% CI)

3.83 [1.75, 5.91]

4 UCLA score at the end of follow‐up ‐ one year or more (2 (worst function) to 35 (best function)) Show forest plot

1

Mean Difference (IV, Random, 95% CI)

Totals not selected

5 SANE score (0 (worst function) to 100 (best function)) Show forest plot

1

Mean Difference (IV, Random, 95% CI)

Totals not selected

5.1 At three weeks

1

Mean Difference (IV, Random, 95% CI)

0.0 [0.0, 0.0]

5.2 At six months

1

Mean Difference (IV, Random, 95% CI)

0.0 [0.0, 0.0]

5.3 At one year

1

Mean Difference (IV, Random, 95% CI)

0.0 [0.0, 0.0]

6 L'Insalata score (0 (worst function) to 100 (best function)) Show forest plot

1

Mean Difference (IV, Random, 95% CI)

Totals not selected

6.1 At three weeks

1

Mean Difference (IV, Random, 95% CI)

0.0 [0.0, 0.0]

6.2 At six months

1

Mean Difference (IV, Random, 95% CI)

0.0 [0.0, 0.0]

6.3 At one year

1

Mean Difference (IV, Random, 95% CI)

0.0 [0.0, 0.0]

7 Pain (measured by VAS: 0 to 100 mm (worst score)) Show forest plot

3

Mean Difference (IV, Fixed, 95% CI)

Subtotals only

7.1 At 3 weeks

1

51

Mean Difference (IV, Fixed, 95% CI)

‐6.0 [‐14.34, 2.34]

7.2 At 6 weeks

3

283

Mean Difference (IV, Fixed, 95% CI)

‐4.27 [‐8.18, ‐0.37]

7.3 At 3 months

3

284

Mean Difference (IV, Fixed, 95% CI)

‐0.08 [‐3.64, 3.48]

7.4 At 1 year

3

277

Mean Difference (IV, Fixed, 95% CI)

‐0.60 [‐3.51, 2.31]

8 Treatment failure (participants who have a non‐routine secondary surgical intervention) Show forest plot

13

Risk Ratio (M‐H, Random, 95% CI)

Subtotals only

8.1 Symptomatic non‐union

10

1088

Risk Ratio (M‐H, Random, 95% CI)

0.20 [0.10, 0.40]

8.2 Symptomatic malunion

5

601

Risk Ratio (M‐H, Random, 95% CI)

0.12 [0.03, 0.54]

8.3 Early mechanical failure

7

895

Risk Ratio (M‐H, Random, 95% CI)

5.14 [1.51, 17.50]

8.4 Symptoms of brachial plexus irritation

3

303

Risk Ratio (M‐H, Random, 95% CI)

0.30 [0.03, 2.81]

8.5 Total treatment failure

12

1197

Risk Ratio (M‐H, Random, 95% CI)

0.32 [0.20, 0.50]

9 Total treatment failure ‐ subgrouped by type of surgery Show forest plot

12

1197

Risk Ratio (M‐H, Random, 95% CI)

0.32 [0.20, 0.50]

9.1 Plate fixation versus conservative intervention

9

1012

Risk Ratio (M‐H, Random, 95% CI)

0.30 [0.18, 0.50]

9.2 Intramedullary fixation versus conservative intervention

3

185

Risk Ratio (M‐H, Random, 95% CI)

0.50 [0.13, 1.92]

10 Cosmetic result ‐ individual complications Show forest plot

11

Risk Ratio (M‐H, Random, 95% CI)

Subtotals only

10.1 Deformity and/or asymmetry and/or shoulder droop

8

759

Risk Ratio (M‐H, Random, 95% CI)

0.16 [0.05, 0.46]

10.2 Hardware irritation and/or prominence not requiring removal

6

592

Risk Ratio (M‐H, Random, 95% CI)

7.75 [2.33, 25.78]

10.3 Unsightly scar

5

515

Risk Ratio (M‐H, Random, 95% CI)

5.63 [1.51, 20.96]

10.4 Bump at fracture site

2

276

Risk Ratio (M‐H, Random, 95% CI)

0.14 [0.06, 0.34]

11 Participants with cosmetic problems Show forest plot

11

1130

Risk Ratio (M‐H, Random, 95% CI)

0.55 [0.31, 0.98]

12 Sensitivity analysis: participants with cosmetic problems Show forest plot

11

1130

Risk Ratio (M‐H, Random, 95% CI)

0.68 [0.33, 1.40]

13 Adverse events ‐ individual complications Show forest plot

14

Risk Ratio (M‐H, Random, 95% CI)

Subtotals only

13.1 Infection and/or dehiscence

10

1327

Risk Ratio (M‐H, Random, 95% CI)

5.62 [1.95, 16.15]

13.2 Hardware irritation requiring removal

9

991

Risk Ratio (M‐H, Random, 95% CI)

9.75 [3.91, 24.31]

13.3 Skin and nerve problems (incisional numbness or paresthesia))

6

648

Risk Ratio (M‐H, Random, 95% CI)

4.86 [1.85, 12.76]

13.4 Stiffness/restricted of range of shoulder movement

4

422

Risk Ratio (M‐H, Random, 95% CI)

0.41 [0.11, 1.48]

13.5 Refracture

3

168

Risk Ratio (M‐H, Random, 95% CI)

0.96 [0.18, 5.03]

13.6 Symptomatic malunion

9

822

Risk Ratio (M‐H, Random, 95% CI)

0.17 [0.09, 0.35]

13.7 Complex regional pain syndrome

1

111

Risk Ratio (M‐H, Random, 95% CI)

0.26 [0.01, 6.36]

13.8 Others: various

5

563

Risk Ratio (M‐H, Random, 95% CI)

0.87 [0.30, 2.57]

14 Participants with adverse events Show forest plot

14

1317

Risk Ratio (M‐H, Random, 95% CI)

1.34 [0.68, 2.64]

15 Sensitivity analysis: participants with adverse events Show forest plot

14

1317

Risk Ratio (M‐H, Random, 95% CI)

1.56 [0.77, 3.18]

16 Participants with adverse events ‐ subgrouped by type of surgery Show forest plot

14

1317

Risk Ratio (M‐H, Random, 95% CI)

1.34 [0.68, 2.64]

16.1 Plate fixation versus conservative intervention

10

1072

Risk Ratio (M‐H, Random, 95% CI)

1.48 [0.66, 3.32]

16.2 Intramedullary fixation versus conservative intervention

4

245

Risk Ratio (M‐H, Random, 95% CI)

0.98 [0.21, 4.60]

17 Health‐related quality of life: SF‐36 or SF‐12 (0 (worst quality of life) to 100 (best quality of life) Show forest plot

2

Mean Difference (IV, Random, 95% CI)

Subtotals only

17.1 Physical Component score at 6 weeks

1

148

Mean Difference (IV, Random, 95% CI)

2.60 [0.16, 5.04]

17.2 Physical Component score at 3 months

1

139

Mean Difference (IV, Random, 95% CI)

0.10 [‐2.23, 2.43]

17.3 Physical Component score at 1 year

2

321

Mean Difference (IV, Random, 95% CI)

0.30 [‐1.95, 2.56]

17.4 Mental Component score at 6 weeks

1

148

Mean Difference (IV, Random, 95% CI)

‐1.5 [‐4.03, 1.03]

17.5 Mental Component score at 3 months

1

139

Mean Difference (IV, Random, 95% CI)

‐1.30 [‐3.49, 0.89]

17.6 Mental Component score at 1 year

2

321

Mean Difference (IV, Random, 95% CI)

1.31 [‐0.34, 2.97]

18 Time to return to previous activities (days) Show forest plot

3

214

Mean Difference (IV, Random, 95% CI)

‐24.64 [‐36.36, ‐12.91]

19 Number of participants returning to sport activities after two months Show forest plot

1

Risk Ratio (M‐H, Random, 95% CI)

Totals not selected

20 Asymptomatic non‐union Show forest plot

7

845

Risk Ratio (M‐H, Random, 95% CI)

0.12 [0.05, 0.30]

Figuras y tablas -
Comparison 1. Surgical versus conservative interventions