Scolaris Content Display Scolaris Content Display

Cribado con oximetría de pulso para los defectos cardíacos congénitos graves

Collapse all Expand all

Resumen

Antecedentes

Los resultados de salud mejoran cuando los recién nacidos con defectos cardíacos congénitos graves (DCCG) son detectados antes del colapso cardiovascular agudo. Las principales pruebas de cribado usadas para identificar a estos recién nacidos incluyen la ecografía prenatal y el examen clínico posnatal; sin embargo, aunque ambos métodos están disponibles, todavía se omite una proporción significativa de recién nacidos. La oximetría de pulso habitual se ha informado como un cribado adicional que puede mejorar potencialmente la detección de la DCCG.

Objetivos

• Determinar la exactitud de diagnóstico de la oximetría de pulso como un método de cribado para la detección de los DCCG en recién nacidos asintomáticos

• Evaluar las posibles fuentes de heterogeneidad, incluidas:

○ características de la población: inclusión o exclusión de los defectos cardíacos congénitos detectados de forma prenatal;

○ momento adecuado de la prueba: < 24 horas versus ≥ 24 horas después del parto;

○ sitio de las pruebas: mano y pie derechos (preductal y posductal) versus pie solo (posductal);

○ saturación de oxígeno: funcional versus fraccionado;

○ diseño del estudio: diseño retrospectivo versus prospectivo, serie consecutiva versus no consecutiva; y

○ riesgo de sesgo para el dominio del "flujo y momento adecuado" de QUADAS‐2.

Métodos de búsqueda

Se realizaron búsquedas en el Registro Cochrane Central de Ensayos Controlados (Cochrane Central Register of Controlled Trials) (CENTRAL; 2017, número 2) en la Cochrane Library y en las siguientes bases de datos: MEDLINE, Embase, en el Cumulative Index to Nursing and Allied Health Literature (CINAHL), en Health Services Research Projects in Progress (HSRProj), hasta marzo 2017. Se hicieron búsquedas en las listas de referencias de todos los artículos incluidos y las revisiones sistemáticas pertinentes para identificar estudios adicionales que no se encontraron mediante la búsqueda electrónica. No se aplicaron restricciones de idiomas.

Criterios de selección

Se seleccionaron los estudios que cumplieron con los criterios predefinidos en cuanto al diseño, la población, las pruebas y los resultados. Se incluyeron estudios transversales y de cohortes que evaluaban la exactitud de diagnóstico del cribado con oximetría de pulso para el diagnóstico de los DCCG en recién nacidos asintomáticos prematuros tardíos y a término. Se consideraron todos los protocolos del cribado con oximetría de pulso (p.ej., diferentes umbrales de saturación para definir la anomalía, mediciones posductales solamente o preductales y posductales, momento adecuado de las pruebas antes o que 24 horas). Los estándares de referencia fueron la ecocardiografía de diagnóstico (ecocardiograma) y el seguimiento clínico, incluidos los hallazgos post mortem, la mortalidad y las bases de datos de anomalías congénitas.

Obtención y análisis de los datos

Se extrajeron los datos de la exactitud para el umbral usado en los estudios primarios. Se exploró la variabilidad entre los estudios y la correlación entre los índices visualmente mediante el uso de diagramas de bosque y de las características operativas del receptor (ROC, por sus siglas en inglés). Se evaluó el riesgo de sesgo en los estudios incluidos mediante la herramienta QUADAS‐2. Se utilizó el modelo de dos variables para calcular los valores de la especificidad y la sensibilidad agrupados de efectos aleatorios. Se investigaron las fuentes de heterogeneidad mediante análisis de subgrupos y la metarregresión.

Resultados principales

Veintiún estudios cumplieron con los criterios de inclusión (N = 457 202 participantes). Diecinueve estudios proporcionaron datos para el análisis primario (umbral de saturación de oxígeno < 95% o ≤ 95%; N = 436 758 participants). La sensibilidad general de la oximetría de pulso para la detección de los DCCG fue de 76,3% (intervalo de confianza [IC] del 95% 69,5 a 82,0) (evidencia de baja certeza). La especificidad fue del 99,9% (IC del 95%: 99,7 a 99,9), con una tasa de positivos falsos de 0,14% (IC del 95%: 0,07 a 0,22) (evidencia de certeza alta). Los cocientes de verosimilitudes resumidos positivos y negativos fueron de 535,6 (IC del 95%: 280,3 a 1023,4) y 0,24 (IC del 95%: 0,18 a 0,31), respectivamente. Estos resultados indicaron que de 10 000 recién nacidos prematuros tardíos o a término aparentemente sanos, seis presentarán DCCG (mediana de prevalencia en la revisión). El cribado con oximetría de pulso detectará a cinco de estos neonatos como con DCCG y omitirá un caso. Además, el cribado con oximetría de pulso identificará de forma errónea a otros 14 neonatos de los 10 000 como con DCCG presuntos cuando no los presentan.

La tasa de positivos falsos para la detección de los DCCG fue inferior cuando la oximetría de pulso en los recién nacidos se realizó durante más tiempo que 24 horas después del nacimiento que cuando se realizó dentro de un plazo de 24 horas (0,06%, IC del 95%: 0,03 a 0,13; versus 0,42%, IC del 95%: 0,20 a 0,89; P = 0,027).

Los diagramas de bosque y de ROC mostraron una mayor variabilidad en la sensibilidad calculada en comparación con la especificidad entre los estudios. Se exploró la heterogeneidad al realizar análisis de subgrupos y la metarregresión de la inclusión o la exclusión de los defectos cardíacos congénitos detectados de forma prenatal, el momento adecuado de las pruebas y el riesgo de sesgo para el dominio "flujo y momento adecuado" de QUADAS‐2; y no se encontró una explicación para la heterogeneidad en la sensibilidad.

Conclusiones de los autores

La oximetría de pulso es una prueba sumamente específica y moderadamente sensible para la detección de los DCCG con tasas muy bajas de positivos falsos. La evidencia actual apoya la introducción del cribado sistemático para los DCCG en los recién nacidos asintomáticos antes del alta de la unidad de recién nacidos sanos.

Resumen en términos sencillos

Oximetría de pulso para el diagnóstico de los defectos cardíacos congénitos graves

Pregunta de la revisión

Se examinó la evidencia sobre la exactitud de la oximetría de pulso para la detección de los defectos cardíacos congénitos graves (DCCG) en los recién nacidos asintomáticos.

Antecedentes

Los DCCG se presentan en cerca de dos de cada 1000 recién nacidos y son una causa principal de mortalidad infantil. El diagnóstico oportuno es crucial para lograr mejores resultados para estos recién nacidos, aunque los métodos de cribado actuales pueden omitir hasta a un 50% de los recién nacidos afectados antes del nacimiento, y los enviados al hogar antes del diagnóstico con frecuencia mueren o padecen morbilidad grave. Sin embargo, los recién nacidos con DCCG a menudo tienen niveles de oxígeno sanguíneo bajos, que pueden detectarse rápidamente y de forma no invasiva con la oximetría de pulso, mediante un sensor colocado en la mano o el pie del recién nacido. El oxímetro de pulso es una máquina que puede medir, de forma no invasiva, la cantidad de oxígeno transportado a través del cuerpo por los eritrocitos. El oxígeno de los pulmones está ligado a la hemoglobina en los eritrocitos, y forman la oxihemoglobina. Si el oxígeno no está unido, se forma la desoxihemoglobina. En las personas sanas, casi toda la hemoglobina es oxihemoglobina, y por lo tanto la saturación de oxígeno (es decir, el porcentaje de hemoglobina que se ha unido al oxígeno) es de alrededor del 100%. El oxímetro de pulso mide lo anterior mediante la luz que atraviesa los vasos sanguíneos periféricos (p.ej., la yema del dedo en los adultos, la mano o el pie en los recién nacidos). La oxihemoglobina y la desoxihemoglobina absorben dicha luz de diferentes maneras, y la proporción de la luz absorbida puede ser analizada por el software dentro del oxímetro, que luego calcula el porcentaje de hemoglobina saturada con oxígeno.

Características de los estudios

Se realizaron búsquedas hasta marzo de 2017 de la evidencia sobre el uso de la oximetría de pulso para detectar DCCG en los recién nacidos y se encontraron 21 estudios. Estos estudios usaron diferentes umbrales para definir una oximetría de pulso como positiva. Se combinaron todos los estudios mediante un umbral de cerca del 95% (19 estudios con 436 758 recién nacidos).

Resultados clave

Esta revisión halló que, de cada 10 000 recién nacidos aparentemente sanos sometidos a cribado, cerca de seis de ellos presentarán DCCG. La oximetría de pulso identificará correctamente a cinco de dichos recién nacidos con DCCG (aunque omitirá un caso). Los recién nacidos omitidos podrían morir o presentar morbilidad grave.

De cada 10 000 recién nacidos aparentemente sanos sometidos a cribado, 9994 no presentarán DCCG. La oximetría de pulso identificará correctamente a 9980 de ellos (aunque 14 recién nacidos serán examinados debido a la sospecha de DCCG). Algunos de estos neonatos pueden estar expuestos a estudios adicionales innecesarios y a una estancia hospitalaria prolongada, aunque una proporción padecerá una enfermedad no cardíaca potencialmente grave.

El número de recién nacidos examinados de forma incorrecta para los DCCG disminuye cuando la oximetría de pulso se realiza después de más de 24 horas del nacimiento.

Certeza de la evidencia

Los estudios incluidos se consideraron principalmente en riesgo bajo o poco claro de sesgo para varios de los dominios de certeza evaluados. Algunos estudios usaron métodos menos consistentes para comprobar los resultados negativos. La certeza general de la evidencia se consideró moderada.

Conclusiones de los autores

available in

Implicaciones para la práctica

Esta revisión aporta evidencia irrefutable adicional sobre el uso de la oximetría de pulso como una prueba de detección sistemática para la identificación temprana de los DCCG en los recién nacidos asintomáticos en la unidad de recién nacidos sanos. La prueba tiene una especificidad alta y una sensibilidad moderada y cumple con los criterios para el cribado universal.

La evidencia actual apoya la introducción del cribado sistemático para los DCCG en los recién nacidos asintomáticos antes del alta de la unidad de recién nacidos sanos. La prueba parece factible en diversos países de ingresos medios y muestra una exactitud de la prueba consistente.

Deben considerarse de forma adicional algunos ítems importantes con respecto a algoritmos específicos del cribado. Los datos no muestran ninguna diferencia en la sensibilidad basado en el sitio de la prueba (preductal o preductal y posductal). Sin embargo, sólo dos estudios que utilizaron las saturaciones preductales y posductales informaron los valores de saturación absoluta en lugar de sólo los resultados de la prueba (de‐Wahl Granelli 2009; Ewer 2011). Según se ha informado previamente en Ewer 2016 y Thangaratinam 2012; varios casos de DCCG que fueron detectados mediante la prueba preductal y posductal se habrían omitido con la prueba posductal sola, aunque los números son demasiado pequeños para afectar los resultados del análisis de sensibilidad.

Además, el hallazgo de una tasa inferior de positivos falsos con el cribado después de las 24 horas debe equilibrarse con el hecho de que muchos países dan de alta a los recién nacidos en un plazo de 24 horas y ‐ debe destacarse ‐ la mayoría de los estudios informados no tuvieron en cuenta el riesgo que un recién nacido con DCCG u otra enfermedad grave puede presentar antes de realizar el cribado (de‐Wahl Granelli 2014; Ewer 2011; Ewer 2016; Riede 2010; Thangaratinam 2012).

La prevalencia de DCCG es muy baja, y la mayoría de los neonatos con pruebas positivas no presentan la afección de interés. La tasa de positivos falsos es variable y depende en gran parte del momento adecuado del cribado (el cribado temprano ‐ en las 24 horas de edad ‐ tiene una tasa mayor de positivos falsos que el cribado después de 24 horas). Este hecho plantea inquietudes en cuanto a que una prueba con un resultado positivo falso puede aumentar innecesariamente la ansiedad paterna y puede dar lugar a investigaciones evitables y a un retraso en el alta. Los investigadores del estudio PulseOx del Reino Unido evaluaron la aceptabilidad del cribado con oximetría de pulso e informaron la ansiedad creada por la prueba ‐ particularmente entre las madres de los recién nacidos con resultados positivos falsos (PF) (Ewer 2012a; Powell 2013). Los investigadores cuantificaron la satisfacción y las percepciones en cuanto a la prueba y la ansiedad y la depresión luego del cribado mediante el uso de cuestionarios validados sobre las muestras de las madres cuyos recién nacidos tuvieron resultados positivos ciertos, positivos falsos y negativos ciertos. Todos los participantes estuvieron predominantemente satisfechos con el cribado, y es importante señalar que las madres que recibieron resultados positivos falsos después del cribado no estuvieron más ansiosas que las que recibieron resultados negativos ciertos. Muchos estudios informan la identificación de enfermedades alternativas no cardíacas mediante el cribado con oximetría de pulso. Aunque estos trastornos (como la neumonía congénita y la sepsis de aparición temprana) técnicamente son positivos falsos, su identificación puede considerarse un beneficio positivo adicional del cribado; tienen mayor probabilidad de ser detectados en las primeras 24 horas, lo cual permite el tratamiento temprano de los individuos con estas enfermedades potencialmente graves. Los profesionales de atención sanitaria deben considerar la posibilidad del sobrediagnóstico de estos trastornos después del cribado y deben aplicar criterios rigurosos para clasificar estas enfermedades.

Implicaciones para la investigación

El tamaño de la muestra grande de esta revisión junto con los cálculos precisos de la sensibilidad y la especificidad indican que la investigación adicional sobre la exactitud de este método de cribado es innecesaria. Además, varios países, incluidos los EE.UU., ya han implementado el cribado. Sin embargo, debido a las inquietudes relacionadas con la comprobación diferencial, se propone llevar a cabo la vigilancia de los resultados del cribado (incluida la posible reducción de la mortalidad temprana) y el tratamiento de los positivos falsos de una manera rigurosa.

Se necesita evidencia adicional con respecto al cribado sistemático de los recién nacidos fuera de la unidad de recién nacidos sanos (incluida la estancia en la unidad de cuidados no intensivos [UCNI] y los partos fuera del hospital). Se necesitan datos adicionales brutos de la saturación y el análisis adicional para dilucidar aún más las sensibilidades relativas de la prueba de saturación posductal versus preductal y posductal.

Se ha descrito de forma adecuada la capacidad de la oximetría de pulso para detectar las enfermedades no cardíacas como las afecciones respiratorias e infecciosas, aunque aún se desconoce la exactitud de la prueba.

Summary of findings

Open in table viewer
Summary of findings

Should pulse oximetry be used to diagnose CCHD in asymptomatic newborns?

Patient or population: asymptomatic newborns at the time of pulse oximetry screening

Setting: hospital births

Index test: pulse oximetry

Reference test: Reference standards were both diagnostic echocardiography (echocardiogram) and clinical follow‐up in the first 28 days of life, including postmortem findings and mortality and congenital anomaly databases to identify false‐negative patients.

Studies: We included prospective or retrospective cohorts and cross‐sectional studies. We excluded case reports and studies of case‐control design.

Threshold

Summary accuracy

(95% CI)

Number

of participants (diseased

/non‐diseased)

Number

of

studies

Prevalence median

(range)

Implications

(in a cohort of 10,000 newborns tested [95% CI])

Certainty

of the evidence (GRADE)

Prevalence

0.6 per 1000

Prevalence

0.1 per 1000

Prevalence

3.7 per 1000

95%

(less than or less than or equal to)

Sensitivity

76.3%

(69.5 to 82.0)

Specificity

99.9%

(99.7 to 99.9)

436,758

(345/436,413)

19 studies

0.6 per 1000

(0.1 to 3.7)

True positives

(newborns with CCHD)

5

(4 to 5)

1

(1 to 1)

28

(26 to 30)

LOW*

⊕⊕⊝⊝

False negatives

(newborns incorrectly classified as not having CCHD)

1

(1 to 2)

0

(0 to 0)

9

(7 to 11)

True negatives

(newborns without CCHD)

9980

(9966 to 9987)

9985

(9971 to 9992)

9949

(9935 to 9956)

HIGH

⊕⊕⊕⊕

False positives

(newborns incorrectly classified as having CCHD)

14

(7 to 28)

14

(7 to 28)

14

(7 to 28)

CCHD: critical congenital heart defect; CI: confidence interval.

Sensitivity:

*We have downgraded certainty of the evidence from high to low because the low number of CCHD cases included in the review (serious imprecision) and secondly, there was a serious risk of differential verification bias (ie, diagnosis was established by echocardiography in test positive cases however test negatives were usually confirmed by clinical follow‐up or by accessing congenital malformation registries and mortality databases)."

Certainty of the evidence (Balshem 2011)
High certainty: We are very confident that the true effect lies close to that of the estimate of the effect.
Moderate certainty: We are moderately confident in the effect estimate: The true effect is likely to be close to the estimate of the effect, but there is a possibility that it is substantially different.
Low certainty: Our confidence in the effect estimate is limited: The true effect may be substantially different from the estimate of the effect.
Very low certainty: We have very little confidence in the effect estimate: The true effect is likely to be substantially different from the estimate of effect.

Antecedentes

available in

Los defectos cardíacos congénitos (DCC) constituyen el grupo más común de malformaciones congénitas, con una incidencia de 4 a 10 por 1000 nacidos vivos (Botto 2001; Lloyd‐Jones 2009; Mahle 2009; Wren 2008); representan más muertes que cualquier otra malformación congénita (Heron 2007; Mahle 2009; Office of National Statistics, 2015) y hasta un 10% de todas las muertes de neonatos se atribuyen a los mismos (Abu‐Harb 1994; Boneva 2001; Knowles 2005; Lloyd‐Jones 2009; Wren 2008). Los DCC graves (DCCG) potencialmente mortales representan aproximadamente un 15% a un 25% de todos los DCC (Mahle 2009; Wren 2008). La mayoría de los DCCG son susceptibles al tratamiento, aunque una condición clínica deficiente en el momento de la intervención quirúrgica aumenta la mortalidad y se ha mostrado que da lugar a peores resultados para los trastornos como la hipoplasia del lado izquierdo del corazón (Brown 2001; Brown 2006), la coartación de la aorta (Franklin 2002) y la transposición de las arterias grandes (Tworetzky 2001). La detección temprana de estos trastornos puede reducir el riesgo de colapso cardiovascular agudo y la muerte (Abu‐Harb 1994; Mahle 2009).

La mayoría de los recién nacidos con un DCCG son asintomáticos al nacer (Wren 2008); la detección antes de la aparición de los síntomas incluye generalmente el cribado sistemático mediante una ecografía prenatal, como se describe en Allan 1986 y Bull 1999 y mediante el examen clínico posnatal del sistema cardiovascular, como se ha informado en Hall 1999. Lamentablemente, ambos métodos tienen una tasa de detección variable y a menudo baja (Abu‐Harb 1994a; Carvalho 2002; Chew 2007; Garne 2001; Tegnander 2006; Westin 2006; Wren 1999), y hasta un 30% de los neonatos con DCCG son dados de alta antes de que se haya establecido el diagnóstico (Abu‐Harb 1994; Brown 2006; Mellander 2006; Wren 2008), con tasas de mortalidad informadas que alcanzan un 50% (Chang 2008).

Aunque las tasas de detección prenatal después de la ecografía de cribado están mejorando, la detección promedio de los DCCG aislados sigue siendo menor que un 50% (Abu‐Harb 1994a; Carvalho 2002; Chew 2007; Garne 2001; Tegnander 2006; Westin 2006; Wren 1999). Las anomalías en el examen clínico como el soplo y el pulso débil a menudo están ausentes en la vida posnatal temprana, y el hallazgo más común de la cianosis (decoloración azulada de la piel debido al oxígeno reducido en la sangre) con frecuencia es clínicamente no detectable (Mahle 2008; O'Donnell 2007). El hecho de que la mayoría de los neonatos con DCCG presentará dicha cianosis leve ha dado lugar a la exploración de la evaluación con oximetría de pulso como una posible prueba de detección para identificar a los neonatos afectados (Ewer 2012a; Knowles 2005; Lloyd‐Jones 2009).

Después de la publicación de varios estudios amplios de exactitud de la prueba, varios países adoptaron el cribado con oximetría de pulso como la práctica habitual, y muchos más están considerando su introducción (de‐Wahl Granelli 2014; Ewer 2014; Kuelling 2009; Mahle 2012; Manzoni 2017).

Además de la exactitud de la prueba, los estudios han demostrado que el cribado con oximetría de pulso es efectivo en función de los costos (Knowles 2005; Peterson 2013; Roberts 2012), y que es aceptable tanto para los padres como para el personal clínico (Narayen 2017; Powell 2013).

La gran mayoría de los recién nacidos estudiados han sido sometidos al cribado en un contexto hospitalario – específicamente, la unidad de recién nacidos sanos – de baja altitud. Sin embargo, recientemente se ha informado el cribado en otros contextos incluidas las unidades neonatales (Iyengar 2014; Suresh 2013), así como en los contextos fuera del hospital como los partos domiciliarios ‐ informado por Cawsey 2016; Lhost 2014; y Narayen 2016a ‐ y los partos a una altitud moderada (Han 2013; Wright 2014).

Esta revisión no incluye contextos fuera de la unidad de recién nacidos sanos.

Enfermedad de interés diagnosticada

La definición de DCCG no es consistente, y la bibliografía revela muchas interpretaciones (Ewer 2012a). Una de las dificultades surge debido a que algunos trastornos (como la coartación de la aorta y la estenosis pulmonar) pueden o no predisponer al colapso agudo, según la gravedad relativa. Con objeto de realizar esta revisión, se ha usado una definición descrita previamente de DCCG, o sea, "cualquier lesión del corazón dependiente del conducto potencialmente mortal por la cual los neonatos mueren o requieren procedimientos invasivos (intervención quirúrgica o cateterismo cardíaco) en los primeros 28 días de vida" (Ewer 2012a; Wren 2008). La definición incluye a todos los neonatos con síndrome del corazón izquierdo hipoplásico, atresia pulmonar con septo ventricular intacto, transposición simple de las arterias grandes o interrupción del arco aórtico. Además, todos los neonatos que mueren o necesitan cirugía o un catéter en los primeros 28 días de vida con coartación de la aorta, estenosis de la válvula aórtica, estenosis de la válvula pulmonar, tetralogía de Fallot, atresia pulmonar con defecto septal ventricular, o conexión venosa pulmonar anómala total se clasifican como con defectos cardíacos congénitos graves. Esta definición ofrece las ventajas de que permite un grado de evaluación de la gravedad de determinadas lesiones basado en la muerte o intervención prematura, es relativamente fácil de categorizar, y se ha usado en varios estudios de la exactitud de la prueba y en revisiones sistemáticas anteriores (Ewer 2011; Ewer 2012a; Thangaratinam 2012; Zhao 2014).

Prueba/s índice

La medición con oximetría de pulso de las saturaciones de oxígeno en un recién nacido asintomático puede usarse para identificar los DCCG antes del alta del hospital. La oximetría de pulso es una prueba exacta y bien establecida utilizada para cuantificar la hipoxemia (niveles bajos de oxígeno en la sangre) que es rápida, indolora y fácil de realizar en todos los grupos de pacientes incluidos los recién nacidos (Ewer 2012a; Ewer 2013; Knowles 2005; Lloyd‐Jones 2009; Mahle 2009; Narayen 2016b). Cualquier individuo entrenado puede realizar el cribado con oximetría de pulso, y los resultados pueden obtenerse en aproximadamente cinco minutos. Para los neonatos incluidos en los estudios del cribado con oximetría de pulso, las sondas de oximetría de pulso (para medir las saturaciones de oxígeno) se colocan en el pie solamente (posductal) o en la mano y el pie derechos (preductal y posductal) (Ewer 2012b; Ewer 2013; Ewer 2016). La prueba índice permite el cribado para reducir el número de neonatos que son dados de alta del hospital antes del diagnóstico de los DCCG, y puede realizarse en cualquier punto temporal antes del alta y antes o después del examen clínico.

Vía clínica

El cribado estándar para los DCCG generalmente incluye ecografía del segundo trimestre en las pacientes embarazadas, que incluye evaluación de la anatomía cardíaca fetal. Si se sospecha de un defecto cardíaco cuando se realiza esta revisión, un ecocardiograma fetal detallado puede confirmar el diagnóstico. La mayoría de los recién nacidos también son sometidos a una o más exploraciones clínicas antes del alta del hospital, que incluyen la evaluación del sistema cardiovascular (auscultación de sonidos del corazón, palpación de los pulsos periféricos). Si se sospecha de un defecto cardíaco tras la finalización de cualquiera de estas pruebas de detección, generalmente se obtiene un ecocardiograma de diagnóstico posnatal. Como se describe previamente, estas pruebas de detección tienen tasas de detección variables y a menudo bajas.

La población incluida en esta revisión puede o no haber tenido un cribado prenatal. Todos eran asintomáticos en el momento del cribado con oximetría de pulso.

Prueba/s alternativa/s

Además de las pruebas de detección ya descritas, se han propuesto opciones como la ecocardiografía fetal sistemática de cribado y la ecocardiografía posnatal aunque es poco probable que sean efectivas en función de los costos (Knowles 2005). Esta revisión no evaluó la exactitud de las pruebas de detección existentes (es decir, ecografía prenatal y examen físico).

Fundamento

La hipoxemia, o la saturación de oxígeno arterial subóptima, está presente en la mayoría de los neonatos con DCCG (Ewer 2012a; Lloyd‐Jones 2009; Mahle 2009). Algunos pueden tener cianosis evidente, aunque en muchos, el grado de hipoxemia puede ser difícil de discernir en el examen clínico. La oximetría de pulso es un método rápido, indoloro, no invasivo y fiable utilizado para determinar los niveles de saturación de oxígeno arterial; se ha usado ampliamente en muchas áreas de la medicina clínica por más de 30 años. El concepto del uso de las saturaciones de oxígeno como un método de detección para observar los defectos cardíacos graves se informó por primera vez hace más de 15 años. El cribado con oximetría de pulso puede permitir la detección de los neonatos que han sido omitidos por otros métodos de cribado antes de ser dados de alta del hospital, lo cual permite la intervención cardíaca urgente antes del inicio del colapso cardiorrespiratorio potencialmente mortal. Se han publicado revisiones sistemáticas de los estudios del cribado con oximetría de pulso (Thangaratinam 2007; Thangaratinam 2012), y en verdad esta técnica de cribado ahora es una práctica común en los Estados Unidos y en algunos países europeos. Sin embargo, esta revisión es la única que incluye estudios de exactitud de la prueba recientes y amplios, incluido uno proveniente de un país de ingresos medios ‐ China.

Se realizó una revisión sistemática de los estudios que evalúan la exactitud de diagnóstico del cribado con oximetría de pulso (prueba índice) con relación a la ecocardiografía o el seguimiento clínico (estándar de referencia) para la detección de los DCCG en recién nacidos asintomáticos. Es importante observar que se deseaba determinar la eficacia de la prueba de oximetría de pulso con un resultado negativo para descartar un diagnóstico de DCCG. Varias revisiones anteriores han explorado este tema (Ewer 2012a; Ewer 2013; Knapp 2010; Knowles 2005; Lloyd‐Jones 2009; Narayen 2016b; Thangaratinam 2007).

Objetivos

available in

  • Determinar la exactitud de diagnóstico de la oximetría de pulso como un método de cribado para la detección de los DCCG en recién nacidos asintomáticos

Objetivos secundarios

  • Evaluar las posibles fuentes de heterogeneidad, incluidas:

    • características de la población: inclusión o exclusión de los defectos cardíacos congénitos detectados de forma prenatal;

    • momento adecuado de la prueba: < 24 horas versus ≥ 24 horas después del parto;

    • sitio de las pruebas: mano y pie derechos (preductal y posductal) versus pie solo (posductal);

    • saturación de oxígeno: funcional versus fraccionado;

    • diseño del estudio: diseño retrospectivo versus prospectivo, serie consecutiva versus no consecutiva; y

    • riesgo de sesgo para el dominio del "flujo y momento adecuado" de QUADAS‐2.

Métodos

available in

Criterios de inclusión de estudios para esta revisión

Tipos de estudios

Se consideró la inclusión de los estudios prospectivos o retrospectivos y de cohortes y cruzados que evaluaban la exactitud de diagnóstico de la oximetría de pulso como un método de cribado para la detección de los defectos cardíacos congénitos graves en los recién nacidos asintomáticos. Un estudio de la exactitud de diagnóstico debe proporcionar datos suficientes para la construcción de una tabla de dos por dos que muestre la clasificación cruzada del estado de la enfermedad (DCCG) y el resultado de la prueba (oximetría de pulso). Se excluyeron los estudios cuando no fue posible extraer los valores positivos ciertos (PC), negativos ciertos (NC), positivos falsos (PF) y negativos falsos (NF) después de establecer contacto con los autores correspondientes de los estudios primarios de ser necesario. Se excluyeron los informes de casos y los estudios con un diseño de casos y controles.

Participantes

Se incluyeron estudios que incorporaron a recién nacidos asintomáticos (sin signos de enfermedad respiratoria o cardíaca) a término o casi a término antes del alta hospitalaria.

Pruebas índice

La prueba en evaluación fue el cribado con oximetría de pulso para identificar la saturación baja de oxígeno. Se incluyeron todos los protocolos de cribado (p.ej., posductal [pie] solo versus preductal y posductal [mano y pie derechos], diferentes umbrales de saturación para definir la anomalía, diferentes números de pruebas repetidas). Los criterios para definir un cribado como positivo o negativo en esta revisión fueron los utilizados por los autores de las publicaciones respectivas.

Enfermedades de interés

Los defectos cardíacos congénitos graves según lo definido anteriormente.

Estándares de referencia

Los estándares de referencia fueron la ecocardiografía de diagnóstico (ecocardiograma) y el seguimiento clínico en los primeros 28 días de vida, incluidos los hallazgos post mortem y la información de las bases de datos de la mortalidad y de las anomalías congénitas, para identificar a los pacientes con resultados negativos falsos.

Métodos de búsqueda para la identificación de los estudios

Búsquedas electrónicas

Information Specialists of the Cochrane Neonatal Review Group performed the searches. Using the strategy described in Appendix 1, they searched the following databases.

  • Cochrane Central Register of Controlled Trials (CENTRAL; 2017, Issue 2) in the Cochrane Library.

  • MEDLINE via PubMed (1966 to March 2017).

  • Embase via Ovid (1980 to March 2017).

  • Cumulative Index to Nursing and Allied Health Literature (CINAHL) (1982 to March 2017).

The MEDLINE search strategy included medical subject headings (MeSH) and free text words (see Appendix 1). We adjusted this strategy for use with the other electronic databases. We considered a combination of medical subject headings and text terms to generate three subsets of citations: one subset indexing the index test (pulse oximetry), a second subset indexing the target population (infant‐newborn), and a third subset indexing the clinical condition (congenital heart disease). We combined these subsets to generate a set of citations relevant to our research question. We considered both published and unpublished reports for inclusion and excluded studies published in abstract form only. We applied no language restriction to the electronic searches.

Búsqueda de otros recursos

We used the Science Citation Index, accessed via the Institute for Scientific Information (ISI) Web of Science, to retrieve reports citing the studies included in this review. We searched for similar systematic reviews in the Database of Abstracts of Reviews of Effects (DARE) to March 2017, to cross‐reference results. We also searched the Health Services Research Projects in Progress (HSRProj) database (http://www.nlm.nih.gov/hsrproj/) (searched on March 20, 2017). We handsearched the reference lists of all relevant primary studies on the topic of our interest to identify cited articles not captured by our electronic searches (up to March 15, 2017). We applied no language restrictions.

Obtención y análisis de los datos

Selección de los estudios

Two review authors (MNP and JZ) independently screened titles and abstracts identified through electronic literature searches to identify potentially eligible studies. First, we excluded those records classified by both review authors as "excluded." Second, we independently assessed the full text of reports classified as "unsure" or "potentially eligible" by applying the selection criteria outlined above in the Criteria for considering studies for this review section. We resolved disagreements through discussion. If finally we reached no consensus, we consulted a third review author (AKE).

Extracción y manejo de los datos

We used a standardized data extraction form to aid extraction of relevant information and data from each included study. Three review authors (MNP, LFP, and AKE) separately participated in data extraction. MNP and LFP extracted data corresponding to study design, participant details, method of testing, threshold saturation level, and type of oxygen saturation measured, as well as timing of the test and inclusion or exclusion of infants with suspected congenital heart defects after antenatal ultrasound screening in pregnancy, reference tests, and funding. AKE and MNP extracted the following data to reconstruct the two‐by‐two table: true‐positive, false‐positive, true‐negative, and false‐negative values or, if not available, relevant parameters (sensitivity, specificity, or positive and negative predictive values). Two review authors (MNP and JZ) incorporated data and study characteristics into Review Manager 5.3 (RevMan 2014).

Dealing with duplicate publications

We included only once those studies that have been published in duplicate, ensuring that we extracted all relevant data from all publications.

Inconclusive results

Although we did not anticipate uninterpretable results, when we detected these cases, we excluded them from analysis and adequately reported their frequency in tables.

Evaluación de la calidad metodológica

Two review authors (MNP and LFP) independently appraised the methodological quality of each included study using the QUADAS‐2 tool (Whiting 2011). QUADAS‐2 consists of four domains, each requiring a risk of bias categorization of low, high, or unclear risk. The first three domains are also assessed in terms of concerns about applicability (applicability concerns ratings). Each domain comprises a set of signaling questions that should be marked as "yes," "no," or "unclear." We tailored QUADAS‐2 for our specific review question by modifying signaling questions accordingly and providing guidance on how to assess risk of bias and applicability concerns ratings (Appendix 2). We resolved disagreements between risk of bias and applicability concern ratings through discussion or by consultation with a third review author (AKE). We summarized our results in the text and in tables and corresponding figures. We decided post hoc to assess the certainty of evidence by using the Grading of Recommendations Assessment, Development and Evaluation (GRADE) approach (GRADEpro GDT; Hultcrantz 2017; Schunemann 2008).

Análisis estadístico y síntesis de los datos

We performed analyses using methods described in Chapter 10 of the Cochrane Handbook for Systematic Reviews of Diagnostic Test Accuracy (Macaskill 2010).

We considered pulse oximetry screening as positive if the oxygen saturation level was below the threshold defined in the primary study, and negative if it was above that threshold. Cross‐classification of these test results with those of the reference standard(s) produced the numbers of true positives, false positives, true negatives, and false negatives for each study, based on the ability of pulse oximetry to detect CCHD.

We used data from the two‐by‐two tables to calculate sensitivity and specificity for individual studies. We present individual study results by plotting the estimates of sensitivity and specificity (and their 95% confidence intervals) in both forest plots and receiver operating characteristic (ROC) scatter plots. We extracted accuracy data for the threshold used in primary studies.

We performed meta‐analyses using a bivariate model (Chu 2006; Reitsma 2005). This model accounts for intra‐study accuracy variability and inter‐study variations in test performance with inclusion of random effects. We analyzed studies sharing the same threshold and obtained summary accuracy estimates (when the number of studies was enough). We present these estimates with a 95% confidence ellipse in the ROC space. We used pooled estimates of sensitivity and specificity to derive positive and negative likelihood ratios that can be used to update the prior probability of having CCHD to a post‐test probability of having CCHD after a positive or negative pulse oximetry result. The greater the positive likelihood ratio and the lower the negative likelihood ratio, the more important the effect of the test on changing pretest into post‐test probabilities. We did not calculate positive and negative predictive values because these indices depend on the prevalence of the target condition (ie, CCHD).

For analyses, we used a METADAS SAS macro that estimates parameters for the model with SAS Proc NLMIXED (SAS Institute Inc. 2004; Takwoingi 2010). We entered parameter estimates from the bivariate model into RevMan to produce the summary operating point with a 95% confidence region and a 95% prediction region (Chu 2006; Reitsma 2005; RevMan 2014).

Investigación de la heterogeneidad

We explored between‐study variability and correlation between indices visually through forest and ROC plots. We measured total between‐study variability in sensitivity and in specificity through variances of the random effects for logit(sensitivity), logit(specificity), and their covariance of the bivariate model. We also provided confidence and prediction ellipses. We further investigated heterogeneity by exploring effects of several study‐level factors through subgroup and meta‐regression analyses including covariate terms to the bivariate model (Chu 2006; Reitsma 2005).

When available, we examined the following covariates.

  • Inclusion or exclusion of antenatally detected congenital heart defects.

  • Screening test method (the screening test may be performed at different times after birth, oxygen saturations may be measured at pre‐ductal and post‐ductal sites or at post‐ductal sites only, and, finally, the oxygen saturation measured could be expressed as "functional" [which refers to the proportion of oxygenated hemoglobin that is capable of binding oxygen] or "fractional" [which refers to the percentage of total hemoglobin that is oxygenated]). In most cases, differences between the two values are very small, and most modern pulse oximeters measure functional saturations only.

  • Study design (included studies may be prospective or retrospective, and may enroll consecutive patients or not). We expect that retrospective studies are more prone to information and selection biases. In this review, it is more likely that medical records of infants with a positive index test result include more information as compared with medical records of infants with a negative test result (information bias). In a similar way, infants with any CCHD are more likely than infants without CCHD to be detected and included in the study after a retrospective medical records review (selection bias).

  • Risk of bias of the "flow and timing" domain of the QUADAS‐2 questionnaire (unclear/high vs low risk of bias). It is expected that studies used different reference standards to confirm index test results (echocardiogram, clinical follow‐up, registries in mortality, and congenital anomaly databases).

Análisis de sensibilidad

We examined the robustness of meta‐analyses by conducting sensitivity analyses. We checked the impact of excluding studies from analysis according to domains of the QUADAS‐2 assessment. Additionally, we decided to perform ad hoc sensitivity analyses to explore how sensitivity and specificity vary by including or excluding studies with different thresholds.

Evaluación del sesgo de notificación

We did not investigate reporting bias, given the limited power of available tests and uncertainty about interpreting statistical evidence of funnel plot asymmetry as necessarily implying publication bias (Leeflang 2008).

Results

Results of the search

Figure 1 shows details of the search and selection process. Electronic database searches yielded a total of 3415 references from CENTRAL, MEDLINE, Embase, and CINAHL. Searches for primary studies through other resources did not reveal additional potentially eligible studies.


Flow of studies through the screening process. CCHD: critical congenital heart defect.

Flow of studies through the screening process. CCHD: critical congenital heart defect.

After de‐duplication, two review authors (MNP and JZ) independently assessed 2695 references against the inclusion criteria. During initial screening of titles and abstracts, we identified 56 studies (46 full‐text papers and 10 conference abstracts). We excluded 2639 references because they did not meet the inclusion criteria. We also excluded those published in abstract form only (n = 10). Of 46 full‐text studies, nine studies provided a partial two‐by‐two diagnostic table, and we excluded them. We excluded 17 other studies for the following reasons.

  • Different outcomes (not accuracy) (n = 6).

  • Inability to determine CCHD outcomes (n = 1).

  • Out‐of‐hospital births (n = 2).

  • Preliminary studies (n = 1).

  • Different population (n = 2).

  • Health technology assessment report on already included study (n = 1).

  • Case‐control study (n = 1).

  • Journal club (n = 1).

  • Case report (n = 1).

  • Different index test (n = 1) (see Characteristics of excluded studies).

We obtained one additional study by searching Science Citation Index (Gomez‐Rodriguez 2015). We included 21 studies in a quantitative synthesis (Arlettaz 2006; Bakr 2005; Bhola 2014; de‐Wahl Granelli 2009; Ewer 2011; Gomez‐Rodriguez 2015; Jones 2016; Klausner 2017; Koppel 2003; Meberg 2008; Oakley 2015; Ozalkaya 2016; Richmond 2002; Riede 2010; Rosati 2005; Sendelbach 2008; Singh 2014; Turska 2012; Van Niekerk 2016; Zhao 2014; Zuppa 2015).

Characteristics of studies

We provide in the Characteristics of included studies table details on the design, setting, population, index test, target condition, and reference standard of all included studies. We prepared an additional table (Table 1) to summarize the main characteristics.

Open in table viewer
Table 1. Main studies characteristics

Study

Population

Index test

Reference

standard(s)

Antenatal diagnosis

of CHD

Pulse

oximeter

Limb

Test

timing

Oxygen

saturation

Threshold

Positive

pulse oximetry

Negative

pulse oximetry

Arlettaz 2006

included

Nellcor NPB‐40

post‐ductal

within 24 hours

functional

< 95%

echocardiography

NA

Bakr 2005

excluded

Digioxi PO 920

pre‐ductal and post‐ductal

longer than 24 hours

fractional

≤ 94%

echocardiography

cardiology database

Bhola 2014

included

Masimo Radical 5

post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

cardiology database

De‐Wahl 2009

excluded

Radical SET v4

pre‐ductal and post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

mortality data

Ewer 2011

included

Radical‐7

pre‐ductal and post‐ductal

within 24 hours

functional

< 95%

echocardiography

clinical follow‐up,

cardiology database & congenital registry

Gomez‐Rodriguez 2015

excluded

Radical‐5

post‐ductal

within 24 hours

functional

< 95%

echocardiography

clinical follow‐up

Jones 2016

excluded

NA

pre‐ductal and post‐ductal

within 24 hours

NA

≤ 95%

echocardiography

National Congenital Heart Disease Audit

Klausner 2017

excluded

NA

pre‐ductal and post‐ductal

longer than 24 hours

NA

< 95%

echocardiography

clinical follow‐up

Koppel 2003

excluded

Ohmeda Medical

post‐ductal

longer than 24 hours

functional

≤ 95%

echocardiography

clinical follow‐up & congenital registry

Meberg 2008

excluded

RAD‐5v

post‐ductal

within 24 hours

functional

< 95%

echocardiography

clinical follow‐up

Oakley 2015

excluded

Nellcor NPB 40

post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

cardiology database & mortality data

Ozalkaya 2016

excluded

Nellcor

pre‐ductal and post‐ductal

longer than 24 hours

functional

≤ 95%

echocardiography

echocardiography

Richmond 2002

included

Oxi machine

post‐ductal

within 24 hours

fractional

< 95%

echocardiography

mortality data & congenital registry

Riede 2010

excluded

NA

post‐ductal

longer than 24 hours

functional

≤ 95%

echocardiography

congenital registry

Rosati 2005

excluded

NA

post‐ductal

longer than 24 hours

functional

≤ 95%

echocardiography

clinical follow‐up

Sendelbach 2008

excluded

Nellcor N‐395

post‐ductal

within 24 hours

functional

< 96%

echocardiography

clinical follow‐up

Singh 2014

excluded

NA

pre‐ductal and post‐ductal

within 24 hours

functional

< 95%

echocardiography

mortality data & congenital registry & cardiology database

Turska 2012

excluded

Novametrix,

Nellcor & Masimo

post‐ductal

within 24 hours

functional

< 95%

echocardiography

clinical follow‐up and Public Health registries

Van Niekerk 2016

excluded

Nellcor

pre‐ductal and post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

NA

Zhao 2014

excluded

RAD‐5V

pre‐ductal and post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

clinical follow‐up

Zuppa 2015

excluded

Ohmeda 3900

post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

NA

NA: not available

Of 3415 references, we identified 21 primary studies that were eligible for inclusion and provided data for 457,202 newborn infants (Figure 1). Studies were published between 2002 and 2017. Countries included were United Kingdom (Ewer 2011; Jones 2016; Oakley 2015; Richmond 2002; Singh 2014), Italy (Rosati 2005; Zuppa 2015), USA (Klausner 2017; Koppel 2003; Sendelbach 2008), Australia (Bhola 2014), China (Zhao 2014), Germany (Riede 2010), Mexico (Gomez‐Rodriguez 2015), Norway (Meberg 2008), Poland (Turska 2012), Saudi Arabia (Bakr 2005), South Africa (Van Niekerk 2016), Sweden (de‐Wahl Granelli 2009), Switzerland (Arlettaz 2006), and Turkey (Ozalkaya 2016).

Sixteen studies included prospective cohorts (Arlettaz 2006; Bakr 2005; de‐Wahl Granelli 2009; Ewer 2011; Gomez‐Rodriguez 2015; Koppel 2003; Meberg 2008; Oakley 2015; Richmond 2002; Riede 2010; Rosati 2005; Sendelbach 2008; Turska 2012; Van Niekerk 2016; Zhao 2014; Zuppa 2015), as well as five retrospective cohorts (Bhola 2014; Jones 2016; Klausner 2017; Ozalkaya 2016; Singh 2014). Seventeen studies excluded newborns who were suspected to have congenital heart disease after antenatal ultrasound screening during pregnancy (Bakr 2005; de‐Wahl Granelli 2009; Gomez‐Rodriguez 2015; Jones 2016; Klausner 2017; Koppel 2003; Meberg 2008; Oakley 2015; Ozalkaya 2016; Riede 2010; Rosati 2005; Sendelbach 2008; Singh 2014; Turska 2012; Van Niekerk 2016; Zhao 2014; Zuppa 2015) (Table 1).

Nine studies performed pulse oximetry within 24 hours after birth (Arlettaz 2006; Ewer 2011; Gomez‐Rodriguez 2015; Jones 2016; Meberg 2008; Richmond 2002; Sendelbach 2008; Singh 2014; Turska 2012) (Table 1). Twelve studies used the foot alone (post‐ductal) to measure oxygen saturation, and the remainder used both right hand and foot (pre‐ductal and post‐ductal) (Table 1). Investigators used several different pulse oximeter models (see description in Table 1). Two studies measured fractional saturations (Bakr 2005; Richmond 2002) (Table 1). Eight studies used a post‐ductal saturation threshold of less than 95% (Arlettaz 2006; Bhola 2014; Gomez‐Rodriguez 2015; Meberg 2008; Oakley 2015; Richmond 2002; Turska 2012; Zuppa 2015), three studies used a post‐ductal saturation threshold ≤ 95% (Koppel 2003; Riede 2010; Rosati 2005), and six studies used both pre‐ductal and post‐ductal saturations less than 95% (de‐Wahl Granelli 2009; Ewer 2011; Klausner 2017; Singh 2014; Van Niekerk 2016; Zhao 2014). Two studies reported different positive thresholds (Bakr 2005 reported both pre‐ductal and post‐ductal fractional saturation ≤ 94%, and Sendelbach 2008 reported post‐ductal saturation < 96%) (Table 1). In summary, the most common threshold was less than 95% (n = 14); five studies reported a threshold lower than or equal to 95%, and two studies reported thresholds ≤ 94% and < 96%, respectively. No study reported results for more than one threshold.

Studies used different methods to verify test results: Investigators verified positive test results by echocardiography and negative results by interrogation of congenital anomaly registers, mortality data, or clinical follow‐up (Table 1).

Methodological quality of included studies

We appraised the quality of primary diagnostic accuracy studies using the QUADAS‐2 tool. We present quality assessment results for individual studies in the Characteristics of included studies table and in Figure 2. We have summarized the overall risk of bias and applicability concerns of studies in Figure 3.


Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.

Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.


Risk of bias and applicability concerns graph: review authors' judgements about each domain presented as percentages across included studies.

Risk of bias and applicability concerns graph: review authors' judgements about each domain presented as percentages across included studies.

We judged the risk that patient selection (QUADAS‐2, domain 1) had introduced bias as low in 10 studies (Arlettaz 2006; Bakr 2005; de‐Wahl Granelli 2009; Ewer 2011; Jones 2016; Klausner 2017; Koppel 2003; Ozalkaya 2016; Richmond 2002; Zuppa 2015), high in two because investigators did not avoid inappropriate exclusions (Oakley 2015; Van Niekerk 2016), and unclear in the remaining nine studies (Bhola 2014; Gomez‐Rodriguez 2015; Meberg 2008; Riede 2010; Rosati 2005; Sendelbach 2008; Singh 2014; Turska 2012; Zhao 2014). Applicability was of low concern for all studies in the patient selection domain.

For the index test assessment (QUADAS‐2, domain 2), we considered all studies to be at low risk of bias and low concern regarding applicability.

We judged the risk that conduct or interpretation of reference standard(s) (QUADAS‐2, domain 3) had introduced bias as low in four studies because investigators used echocardiography to confirm both positive and negative pulse oximetry cases (Ozalkaya 2016), or because they used echocardiography to confirm pulse oximetry positives and clinical follow‐up in the first 28 days of life, which included postmortem findings and mortality and congenital anomaly databases to identify false‐negative screening cases (Ewer 2011; Koppel 2003; Turska 2012). This comprehensive combination of clinical follow‐up and review of registries and databases was considered as having low risk of bias. We considered that three studies reporting only echocardiography as the reference standard for positive pulse oximetry results were at high risk of bias (Arlettaz 2006; Van Niekerk 2016; Zuppa 2015). We considered risk for the remaining 14 studies as unclear because they used an incomplete reference standard to identify false‐negative cases (Bakr 2005; Bhola 2014; de‐Wahl Granelli 2009; Gomez‐Rodriguez 2015; Jones 2016; Klausner 2017; Meberg 2008; Oakley 2015; Richmond 2002; Riede 2010; Rosati 2005; Sendelbach 2008; Singh 2014; Zhao 2014); six studies used echocardiography and follow‐up (Gomez‐Rodriguez 2015; Klausner 2017; Meberg 2009; Rosati 2005; Sendelbach 2008; Zhao 2014), and eight studies used echocardiography and different mortality and malformations registries (Bakr 2005; Bhola 2014; de‐Wahl Granelli 2009; Jones 2016; Oakley 2015; Richmond 2002; Riede 2010; Singh 2014). It is noteworthy that only one study used echocardiography for positive and negative pulse oximetry results (Ozalkaya 2016). Applicability was of low concern for all studies in the reference standard(s) domain.

For flow and timing assessment (QUADAS‐2, domain 4), 11 studies were at low risk of bias (de‐Wahl Granelli 2009; Ewer 2011; Gomez‐Rodriguez 2015; Koppel 2003; Meberg 2008; Oakley 2015; Ozalkaya 2016; Richmond 2002; Riede 2010; Singh 2014; Zhao 2014), and the remaining studies were at unclear risk because information reported was insufficient to permit judgment (Arlettaz 2006; Bakr 2005; Bhola 2014; Jones 2016; Klausner 2017; Rosati 2005; Sendelbach 2008; Turska 2012; Van Niekerk 2016; Zuppa 2015).

Findings

Results of meta‐analysis

We considered for primary analysis all studies with thresholds around 95% (< 95% and ≤ 95%). As expected, this was the most common threshold among included studies (n = 19 studies; 436,758 participants) (Arlettaz 2006; Bhola 2014; de‐Wahl Granelli 2009; Ewer 2011; Gomez‐Rodriguez 2015; Jones 2016; Klausner 2017; Koppel 2003; Meberg 2008; Oakley 2015; Ozalkaya 2016; Richmond 2002; Riede 2010; Rosati 2005; Singh 2014; Turska 2012; Van Niekerk 2016; Zhao 2014; Zuppa 2015). The overall sensitivity of pulse oximetry for detection of critical congenital heart defects was 76.3% (95% confidence interval [CI] 69.5 to 82.0). Specificity was 99.9% (95% CI 99.7 to 99.9) with a false‐positive rate of 0.14% (95% CI 0.07 to 0.22) (summary of findings Table). Summary positive and negative likelihood ratios were 535.6 (95% CI 280.3 to 1023.4) and 0.24 (95% CI 0.18 to 0.31), respectively.

Fourteen out of 19 studies used a threshold lower than 95% (Arlettaz 2006; Bhola 2014; de‐Wahl Granelli 2009; Ewer 2011; Gomez‐Rodriguez 2015; Klausner 2017; Meberg 2008; Oakley 2015; Richmond 2002; Singh 2014; Turska 2012; Van Niekerk 2016; Zhao 2014; Zuppa 2015), and five studies used a threshold lower than or equal to 95% (Jones 2016; Koppel 2003; Ozalkaya 2016; Riede 2010; Rosati 2005).

Two additional studies used different thresholds: One used a threshold lower than or equal to 94% with sensitivity and specificity of 100% (95% CI 29 to 100) and 100% (95% CI 100 to 100), respectively (Bakr 2005); the other used a threshold of less than 96% with sensitivity and specificity of 100% (95% CI 3 to 100) and 100% (95% CI 100 to 100), respectively (Sendelbach 2008).

Overall, we have included in this review 349 cases of CCHD. The median prevalence of CCHD was 0.6 per 1000 live births (range 0.1 to 3.7; interquartile range 0.4 to 1.2).

Investigations of heterogeneity

To visualize total variability in sensitivity and specificity, we present the data in forest and ROC scatter plots (Figure 4; Figure 5). Forest plots show studies in increasing order of specificity (Figure 4). Sensitivity of the 21 studies ranged from 0% to 100%, and specificity from 99% to 100%. Forest and ROC plots show greater variability in estimated sensitivity than specificity across studies. Given results from investigations of heterogeneity, we used the bivariate model to estimate summary sensitivity and specificity (summary points) instead of the hierarchical summary ROC model to estimate summary ROC curves.


Forest plot of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% confidence interval (black horizontal line). Studies are ordered by ascending specificity.

Forest plot of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% confidence interval (black horizontal line). Studies are ordered by ascending specificity.


Summary ROC plot for pulse oximetry using a threshold lower than or lower than or equal to 95% (n = 19 studies). The solid circle corresponds to the summary estimate of sensitivity and specificity, and is shown with a 95% prediction region (dashed line).

Summary ROC plot for pulse oximetry using a threshold lower than or lower than or equal to 95% (n = 19 studies). The solid circle corresponds to the summary estimate of sensitivity and specificity, and is shown with a 95% prediction region (dashed line).

For the primary analysis, we measured total between‐study variability in sensitivity and in specificity through variances of the random effects for logit(sensitivity), logit(specificity), and their covariance, which were 0.102, 2.001, and ‐0.340, respectively. We represented the summary operating point with a 95% prediction region (Figure 5) and explored heterogeneity by differentiating studies on the basis of antenatal screening for CHD, timing of testing, type of oxygen saturation, study design, and risk of bias for the "flow and timing" domain of QUADAS‐2. We plotted subgroups of studies in the ROC space.

Subgroup analysis and meta‐regression

Table 2 summarizes results of the subgroup analysis including sensitivity and false‐positive rates.

Open in table viewer
Table 2. Subgroup analysis

N

Sensitivity

(95% CI)

Relative

sensitivity

P value

False‐positive rate (FPR)

(95% CI)

Relative

FPR

P value

Antenatal diagnosis

Included

4

86.3% (71.8 to 94.0)

0.071

0.46% (0.13 to 1.59)

0.231

Excluded

15

74.1% (65.7 to 81.1)

0.10% (0.05 to 0.21)

Test timing

Longer than 24 hours

11

73.6% (62.8 to 82.1)

0.393

0.06% (0.03 to 0.13)

0.027

Within 24 hours

8

79.5% (70.0 to 86.6)

0.42% (0.20 to 0.89)

Limb

Foot only

11

81.2% (70.9 to 88.4)

0.197

0.13% (0.05 to 0.31)

0.718

Foot and right hand

8

71.2% (58.5 to 81.3)

0.17% (0.06 to 0.46)

Risk of bias ("flow and timing")

Unclear risk of bias

9

77.8% (64.1 to 87.3)

0.937

0.05% (0.02 to 0.12)

0.016

Low risk of bias

10

77.3% (68.8 to 84.0)

0.34% (0.17 to 0.66)

Antenatal diagnosis

Four studies included newborn infants with antenatal screening (Arlettaz 2006; Bhola 2014; Ewer 2011; Richmond 2002), and 15 studies did not (de‐Wahl Granelli 2009; Gomez‐Rodriguez 2015; Jones 2016; Klausner 2017; Koppel 2003; Meberg 2008; Oakley 2015; Ozalkaya 2016; Riede 2010; Rosati 2005; Singh 2014; Turska 2012; Van Niekerk 2016; Zhao 2014; Zuppa 2015). Summary estimates of sensitivity were 86.3% (95% CI 71.8 to 94.0) for studies that included antenatal screening, and 74.1% (95% CI 65.7 to 81.1) for studies that did not include antenatal screening. Summary estimates of specificity were 99.5% (95% CI 98.4 to 99.9) with a false‐positive rate of 0.46% (95% CI 0.13 to 1.59) for studies with antenatal screening, and 99.9% (95% CI 99.8 to 100) with a false positive rate of 0.10% (95% CI 0.05 to 0.21) for studies that did not include antenatal screening. Sensitivity (P = 0.071) and specificity (P = 0.231) did not change significantly when newborn infants with antenatal suspicion of congenital heart defects were included compared with when they were excluded.

Test timing

Eleven studies performed pulse oximetry screening after 24 hours from birth (Bhola 2014; de‐Wahl Granelli 2009; Klausner 2017; Koppel 2003; Oakley 2015; Ozalkaya 2016; Riede 2010; Rosati 2005; Van Niekerk 2016; Zhao 2014; Zuppa 2015), and the other eight studies performed pulse oximetry within 24 hours of birth (Arlettaz 2006; Ewer 2011; Gomez‐Rodriguez 2015; Jones 2016; Meberg 2008; Richmond 2002; Singh 2014; Turska 2012). Summary estimates of sensitivity and specificity of studies that performed screening after 24 hours were 73.6% (95% CI 62.8 to 82.1) and 99.9% (95% CI 99.9 to 100). For studies that performed screening within 24 hours, summary estimates of sensitivity and specificity were 79.5% (95% CI 70.0 to 86.6) and 99.6% (95% CI 99.1 to 99.8). Test timing to perform pulse oximetry had no significant effect on sensitivity (P = 0.393), but the false‐positive rate for detection of CCHD was lower when newborn pulse oximetry was done after 24 hours from birth than when it was done within 24 hours (0.06% [95% CI 0.03 to 0.13] vs 0.42% [95% CI 0.20 to 0.89]; P = 0.027).

Limbs

Eleven studies used the foot alone (post‐ductal) to measure oxygen saturation (Arlettaz 2006; Bhola 2014; Gomez‐Rodriguez 2015; Koppel 2003; Meberg 2008; Oakley 2015; Richmond 2002; Riede 2010; Rosati 2005; Turska 2012; Zuppa 2015); summary estimates of sensitivity and specificity were 81.2% (95% CI 70.9 to 88.4) and 99.9% (95% CI 99.7 to 100), respectively, with a false‐positive rate of 0.13% (95% CI 0.05 to 0.31). Eight studies used both right hand and foot (pre‐ductal and post‐ductal) (de‐Wahl Granelli 2009; Ewer 2011; Jones 2016; Klausner 2017; Ozalkaya 2016; Singh 2014; Van Niekerk 2016; Zhao 2014); summary estimates of sensitivity and specificity for this group of studies were 71.2% (95% CI 58.5 to 81.3) and 99.8% (95% CI 99.5 to 99.9), respectively, with a false‐positive rate of 0.17% (95% CI 0.06 to 0.46). We noted no significant differences in sensitivity (P = 0.197) nor in specificity (P = 0.718) for pulse oximetry when measures were obtained in the foot alone rather than in both the foot and the right hand.

Risk of bias

We judged nine studies as having unclear risk of bias for the "flow and timing" domain of QUADAS‐2 (Arlettaz 2006; Bhola 2014; Klausner 2017; Koppel 2003; Riede 2010; Rosati 2005; Turska 2012; Van Niekerk 2016; Zuppa 2015). Summary estimates of sensitivity and specificity were 77.8% (95% CI 64.1 to 87.3) and 100% (95% CI 99.9 to 100), respectively, with a false‐positive rate of 0.05% (95% CI 0.02 to 0.12). We judged the remaining 10 studies as having low risk of bias (de‐Wahl Granelli 2009; Ewer 2011; Gomez‐Rodriguez 2015; Jones 2016; Meberg 2008; Oakley 2015; Ozalkaya 2016; Richmond 2002; Singh 2014; Zhao 2014); summary estimates of sensitivity and specificity were 77.3% (95% CI 68.8 to 84.0) and 99.7% (95% CI 99.3 to 99.8), respectively, with a false‐positive rate of 0.34% (95% CI 0.17 to 0.66). Risk of bias for this domain had no significant effect on sensitivity (P = 0.937), but studies judged as having unclear risk of bias for the "flow and timing" domain had higher specificity (P = 0.016).

Sensitivity analysis

We performed a sensitivity analysis while excluding from the primary analysis studies with a threshold ≤ 95% (Jones 2016; Koppel 2003; Ozalkaya 2016; Riede 2010; Rosati 2005). For this analysis, sensitivity and specificity were 78.1% (95% CI 71.2 to 83.7) and 99.8% (95% CI 99.6 to 99.9) with a false‐positive rate of 0.23% (95% CI 0.12 to 0.44). Exclusion of these studies increased the sensitivity and false‐positive rate of pulse oximetry screening.

We also performed a sensitivity analysis for which we added to the primary analysis studies with a threshold ≤ 94% and < 96% (Bakr 2005; Sendelbach 2008). For this analysis, sensitivity and specificity were 77% (95% CI 70 to 82) and 100% (95% CI 100 to 100), respectively. Inclusion of these studies produced a slight improvement in the sensitivity of the test.

Furthermore, we investigated the effects of potential sources of bias by removing the four studies judged as having high risk of bias in one of the QUADAS‐2 domains (Arlettaz 2006; Oakley 2015; Van Niekerk 2016; Zuppa 2015). For this analysis, sensitivity and specificity were similar to those in the main analysis, at 75.5% (95% CI 68.2 to 81.6) and 99.79% (95% CI 99.7 to 99.9), respectively.

Discusión

available in

Resumen de los resultados principales

Para esta revisión, se han identificado y resumido los resultados de todos los estudios de cohortes disponibles que informan sobre la exactitud de la prueba del cribado con oximetría de pulso para la detección de los defectos cardíacos congénitos graves (DCCG) en neonatos asintomáticos prematuros tardíos y a término que se encuentran en las salas posnatales o las salas de recién nacidos sanos. Se presentaron los principales resultados en la Tabla 1 de Resumen de los hallazgos. Se analizaron los datos de 457 202 participantes de 21 estudios incluidos. Se restringió el análisis primario a los estudios con umbrales de alrededor del 95% (< 95% y ≤ 95%). El análisis, que incluyó a 436 758 participantes de 19 estudios, indicó que el cribado con oximetría de pulso es una prueba de detección sumamente específica con sensibilidad moderada y una tasa baja general de positivos falsos. La sensibilidad general fue del 76,3%, la especificidad fue del 99,9%, y la tasa de positivos falsos fue del 0,14%. Los cocientes de probabilidades positivas y negativas resumidos fueron de 535,6 y 0,24; respectivamente. La inclusión de los estudios que usaron diferentes umbrales de saturación a partir de los del análisis primario mejoró levemente la sensibilidad de la prueba. La exclusión de los estudios en alto riesgo de sesgo no alteró significativamente la sensibilidad o la especificidad generales. La heterogeneidad entre los estudios fue mayor en los cálculos de sensibilidad que en los de especificidad.

La mayoría de los estudios se realizaron en países de altos ingresos (EE. UU., Europa); sin embargo, también se incluyeron estudios de los países de ingresos medios, lo cual aumenta la generalizabilidad de los hallazgos de la revisión. Se observó variación metodológica entre los estudios en lo que se refiere a la inclusión o la exclusión de los recién nacidos con un presunto diagnóstico prenatal, el momento adecuado de las pruebas (antes o después de las 24 horas de edad), el sitio de las pruebas (posductal solamente o preductal y posductal), la medición de la saturación funcional o fraccionada y el diseño del estudio (prospectivo o retrospectivo). El análisis de subgrupos no demostró ningún efecto sobre la sensibilidad o la especificidad entre estas variables, aunque el cribado posterior se asoció con una tasa inferior de positivos falsos que la informada con el cribado anterior.

La definición de DCCG proporcionada en la bibliografía publicada es sumamente variable. Se intentó considerar este tema al aplicar una definición estricta (ver más arriba) para categorizar los DCCG de una manera estandarizada, y así reducir el riesgo de un diagnóstico incorrecto.

Fortalezas y limitaciones de la revisión

Los puntos fuertes de esta revisión incluyen una búsqueda integral de la bibliografía realizada para identificar todos los estudios relevantes, la evaluación rigurosa del riesgo de sesgo de los estudios incluidos mediante la herramienta QUADAS‐2; la extracción de datos por duplicado y la realización de análisis de subgrupos y de sensibilidad para investigar las diferencias en los cálculos de la exactitud de la oximetría de pulso entre los estudios en riesgo alto, bajo, o poco claro de sesgo. Sin embargo, sólo un estudio incluyó más de 100 casos de DCCG, y 12 estudios incluyeron menos de diez casos. El número relativamente bajo de casos de DCCG incluidos en esta revisión indica que la precisión de la sensibilidad todavía es baja.

La revisión ha explorado y cuantificado la heterogeneidad, y los autores de la revisión han tratado de identificar las posibles fuentes de heterogeneidad. La exploración de las fuentes de heterogeneidad ha producido diferentes resultados para la sensibilidad y la especificidad. La sensibilidad no ha sido afectada por ninguna de las fuentes de heterogeneidad seleccionadas a priori. No es posible descartar la presencia de heterogeneidad no explicada en este índice de exactitud, aunque es sumamente probable que parte de la variabilidad observada en las sensibilidades de los estudios individuales pudiese ser explicada por la escasez de casos de DCCG. El uso de diferentes estrategias para confirmar los casos negativos de la oximetría de pulso (es decir, pasivamente con los datos de la mortalidad o del registro en lugar del seguimiento clínico activo) bien podría haber introducido algún grado de heterogeneidad en los resultados de sensibilidad. Sin embargo, no se realizó esta exploración post hoc, debido a la escasez de datos. Este hecho significa que los cálculos de la sensibilidad son algo inestables con intervalos de confianza amplios. Al mismo tiempo, esta escasez dio lugar a que el análisis de la heterogeneidad tuviese poco poder estadístico. Por el contrario, la especificidad fue afectada por el momento adecuado de la prueba y por el riesgo de sesgo debido al dominio del flujo y el momento adecuado de la herramienta QUADAS‐2. La significación estadística lograda por el análisis de la especificidad es una consecuencia directa del número grande de recién nacidos sanos incluidos en la revisión. Por otro lado, la magnitud de las diferencias entre los análisis de subgrupos fue pequeña. Las tasas de positivos falsos fueron del 0,06% y del 0,42% para los recién nacidos sometidos a cribado antes y después de las 24 horas del nacimiento, respectivamente. La diferencia absoluta fue del 0,36% con más positivos falsos en el grupo de cribado temprano en comparación con el grupo de cribado tardío. Este hecho significa, en términos relativos, que se observan siete veces más positivos falsos en el grupo de cribado temprano que en el grupo de cribado tardío. De igual manera, las tasas de positivos falsos variaron entre los estudios juzgados como en riesgo poco claro o bajo de sesgo para el dominio del "flujo y el momento adecuado" de QUADAS‐2 (es decir, 0,05% versus 0,34% para los grupos de estudios en riesgo poco claro y bajo, respectivamente). La diferencia absoluta es una reducción de 0,29% en los positivos falsos en el grupo de riesgo poco claro, que se equipara a casi siete veces menos positivos falsos en términos relativos.

Acuerdos y desacuerdos con otros estudios o revisiones

Esta revisión incluye más estudios y una gran cantidad de datos de un número significativamente mayor de neonatos que los incluidos en las revisiones sistemáticas similares anteriores de la exactitud del cribado con oximetría de pulso para detectar los DCCG (Mahle 2009; Thangaratinam 2007; Thangaratinam 2012), que informaron métodos estadísticos y metanálisis idénticos. En comparación con la revisión previa más grande (Thangaratinam 2012), los autores de esta revisión sometieron a cribado un número significativamente mayor de referencias (2695 versus 552) e incluyeron datos de más de 220 000 recién nacidos, lo cual permitió una mayor precisión de los cálculos de la exactitud de la prueba, y proporcionó el metanálisis más completo disponible hasta el presente.

La sensibilidad general es similar (76,3% versus 76,5%) a la descrita por Thangaratinam 2012 y es similar a la tasa general de positivos falsos (0,14% vs 0,14%). Aún persiste la tasa inferior estadísticamente significativa de positivos falsos entre el cribado temprano y tardío (0,06% vs 0,42% y 0,05% vs 0,5%).

Aplicabilidad de los hallazgos a la pregunta de la revisión

Esta revisión incluye un gran número de estudios relevantes que reunieron los criterios de inclusión, y los autores de la revisión tuvieron pocas inquietudes en cuanto a la relevancia de los hallazgos para las preguntas de la revisión. Se consideró que los estudios incluidos en su mayoría estaban en riesgo bajo o poco claro de sesgo en los dominios de QUADAS‐2. La mayoría de los estudios tuvo un diseño prospectivo con una inclusión consecutiva de los participantes e incluyeron una descripción adecuada de la prueba índice. Algunos estudios informaron los criterios de exclusión de forma deficiente. Los datos estaban completos y estuvieron disponibles para todos los estudios incluidos.

El riesgo de sesgo de comprobación diferencial fue inevitable debido a que el diagnóstico fue establecido por la ecocardiografía en los casos de pruebas positivas; sin embargo, los casos de pruebas negativas se confirmaron generalmente mediante el seguimiento clínico o mediante el examen de los registros de malformaciones congénitas y las bases de datos de la mortalidad; el riesgo de sesgo en la realización o la interpretación del estándar de referencia fue poco claro en la mayoría de los estudios que usaron un estándar de referencia incompleto. Este hecho, desde luego, plantea la posibilidad de que algunos de los negativos falsos puedan haberse clasificado de forma errónea como negativos ciertos. Esta clasificación errónea sobrestima la sensibilidad y la especificidad. La comprobación diferencial puede haber tenido un impacto sobre el cálculo de la sensibilidad. Por este motivo, junto con la posibilidad de imprecisión, debido al número pequeño de casos de DCCG, la certeza GRADE de la evidencia se ha disminuido para la sensibilidad a "baja". En la revisión, los estudios juzgados como en riesgo poco claro de sesgo para el dominio del “flujo y el momento adecuado” revelaron una especificidad mayor.

Flow of studies through the screening process. CCHD: critical congenital heart defect.
Figures and Tables -
Figure 1

Flow of studies through the screening process. CCHD: critical congenital heart defect.

Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.
Figures and Tables -
Figure 2

Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.

Risk of bias and applicability concerns graph: review authors' judgements about each domain presented as percentages across included studies.
Figures and Tables -
Figure 3

Risk of bias and applicability concerns graph: review authors' judgements about each domain presented as percentages across included studies.

Forest plot of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% confidence interval (black horizontal line). Studies are ordered by ascending specificity.
Figures and Tables -
Figure 4

Forest plot of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% confidence interval (black horizontal line). Studies are ordered by ascending specificity.

Summary ROC plot for pulse oximetry using a threshold lower than or lower than or equal to 95% (n = 19 studies). The solid circle corresponds to the summary estimate of sensitivity and specificity, and is shown with a 95% prediction region (dashed line).
Figures and Tables -
Figure 5

Summary ROC plot for pulse oximetry using a threshold lower than or lower than or equal to 95% (n = 19 studies). The solid circle corresponds to the summary estimate of sensitivity and specificity, and is shown with a 95% prediction region (dashed line).

All studies.
Figures and Tables -
Test 1

All studies.

Primary analysis (threshold < 95% or ≤ 95%).
Figures and Tables -
Test 2

Primary analysis (threshold < 95% or ≤ 95%).

Should pulse oximetry be used to diagnose CCHD in asymptomatic newborns?

Patient or population: asymptomatic newborns at the time of pulse oximetry screening

Setting: hospital births

Index test: pulse oximetry

Reference test: Reference standards were both diagnostic echocardiography (echocardiogram) and clinical follow‐up in the first 28 days of life, including postmortem findings and mortality and congenital anomaly databases to identify false‐negative patients.

Studies: We included prospective or retrospective cohorts and cross‐sectional studies. We excluded case reports and studies of case‐control design.

Threshold

Summary accuracy

(95% CI)

Number

of participants (diseased

/non‐diseased)

Number

of

studies

Prevalence median

(range)

Implications

(in a cohort of 10,000 newborns tested [95% CI])

Certainty

of the evidence (GRADE)

Prevalence

0.6 per 1000

Prevalence

0.1 per 1000

Prevalence

3.7 per 1000

95%

(less than or less than or equal to)

Sensitivity

76.3%

(69.5 to 82.0)

Specificity

99.9%

(99.7 to 99.9)

436,758

(345/436,413)

19 studies

0.6 per 1000

(0.1 to 3.7)

True positives

(newborns with CCHD)

5

(4 to 5)

1

(1 to 1)

28

(26 to 30)

LOW*

⊕⊕⊝⊝

False negatives

(newborns incorrectly classified as not having CCHD)

1

(1 to 2)

0

(0 to 0)

9

(7 to 11)

True negatives

(newborns without CCHD)

9980

(9966 to 9987)

9985

(9971 to 9992)

9949

(9935 to 9956)

HIGH

⊕⊕⊕⊕

False positives

(newborns incorrectly classified as having CCHD)

14

(7 to 28)

14

(7 to 28)

14

(7 to 28)

CCHD: critical congenital heart defect; CI: confidence interval.

Sensitivity:

*We have downgraded certainty of the evidence from high to low because the low number of CCHD cases included in the review (serious imprecision) and secondly, there was a serious risk of differential verification bias (ie, diagnosis was established by echocardiography in test positive cases however test negatives were usually confirmed by clinical follow‐up or by accessing congenital malformation registries and mortality databases)."

Certainty of the evidence (Balshem 2011)
High certainty: We are very confident that the true effect lies close to that of the estimate of the effect.
Moderate certainty: We are moderately confident in the effect estimate: The true effect is likely to be close to the estimate of the effect, but there is a possibility that it is substantially different.
Low certainty: Our confidence in the effect estimate is limited: The true effect may be substantially different from the estimate of the effect.
Very low certainty: We have very little confidence in the effect estimate: The true effect is likely to be substantially different from the estimate of effect.

Figures and Tables -
Table 1. Main studies characteristics

Study

Population

Index test

Reference

standard(s)

Antenatal diagnosis

of CHD

Pulse

oximeter

Limb

Test

timing

Oxygen

saturation

Threshold

Positive

pulse oximetry

Negative

pulse oximetry

Arlettaz 2006

included

Nellcor NPB‐40

post‐ductal

within 24 hours

functional

< 95%

echocardiography

NA

Bakr 2005

excluded

Digioxi PO 920

pre‐ductal and post‐ductal

longer than 24 hours

fractional

≤ 94%

echocardiography

cardiology database

Bhola 2014

included

Masimo Radical 5

post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

cardiology database

De‐Wahl 2009

excluded

Radical SET v4

pre‐ductal and post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

mortality data

Ewer 2011

included

Radical‐7

pre‐ductal and post‐ductal

within 24 hours

functional

< 95%

echocardiography

clinical follow‐up,

cardiology database & congenital registry

Gomez‐Rodriguez 2015

excluded

Radical‐5

post‐ductal

within 24 hours

functional

< 95%

echocardiography

clinical follow‐up

Jones 2016

excluded

NA

pre‐ductal and post‐ductal

within 24 hours

NA

≤ 95%

echocardiography

National Congenital Heart Disease Audit

Klausner 2017

excluded

NA

pre‐ductal and post‐ductal

longer than 24 hours

NA

< 95%

echocardiography

clinical follow‐up

Koppel 2003

excluded

Ohmeda Medical

post‐ductal

longer than 24 hours

functional

≤ 95%

echocardiography

clinical follow‐up & congenital registry

Meberg 2008

excluded

RAD‐5v

post‐ductal

within 24 hours

functional

< 95%

echocardiography

clinical follow‐up

Oakley 2015

excluded

Nellcor NPB 40

post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

cardiology database & mortality data

Ozalkaya 2016

excluded

Nellcor

pre‐ductal and post‐ductal

longer than 24 hours

functional

≤ 95%

echocardiography

echocardiography

Richmond 2002

included

Oxi machine

post‐ductal

within 24 hours

fractional

< 95%

echocardiography

mortality data & congenital registry

Riede 2010

excluded

NA

post‐ductal

longer than 24 hours

functional

≤ 95%

echocardiography

congenital registry

Rosati 2005

excluded

NA

post‐ductal

longer than 24 hours

functional

≤ 95%

echocardiography

clinical follow‐up

Sendelbach 2008

excluded

Nellcor N‐395

post‐ductal

within 24 hours

functional

< 96%

echocardiography

clinical follow‐up

Singh 2014

excluded

NA

pre‐ductal and post‐ductal

within 24 hours

functional

< 95%

echocardiography

mortality data & congenital registry & cardiology database

Turska 2012

excluded

Novametrix,

Nellcor & Masimo

post‐ductal

within 24 hours

functional

< 95%

echocardiography

clinical follow‐up and Public Health registries

Van Niekerk 2016

excluded

Nellcor

pre‐ductal and post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

NA

Zhao 2014

excluded

RAD‐5V

pre‐ductal and post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

clinical follow‐up

Zuppa 2015

excluded

Ohmeda 3900

post‐ductal

longer than 24 hours

functional

< 95%

echocardiography

NA

NA: not available

Figures and Tables -
Table 1. Main studies characteristics
Table 2. Subgroup analysis

N

Sensitivity

(95% CI)

Relative

sensitivity

P value

False‐positive rate (FPR)

(95% CI)

Relative

FPR

P value

Antenatal diagnosis

Included

4

86.3% (71.8 to 94.0)

0.071

0.46% (0.13 to 1.59)

0.231

Excluded

15

74.1% (65.7 to 81.1)

0.10% (0.05 to 0.21)

Test timing

Longer than 24 hours

11

73.6% (62.8 to 82.1)

0.393

0.06% (0.03 to 0.13)

0.027

Within 24 hours

8

79.5% (70.0 to 86.6)

0.42% (0.20 to 0.89)

Limb

Foot only

11

81.2% (70.9 to 88.4)

0.197

0.13% (0.05 to 0.31)

0.718

Foot and right hand

8

71.2% (58.5 to 81.3)

0.17% (0.06 to 0.46)

Risk of bias ("flow and timing")

Unclear risk of bias

9

77.8% (64.1 to 87.3)

0.937

0.05% (0.02 to 0.12)

0.016

Low risk of bias

10

77.3% (68.8 to 84.0)

0.34% (0.17 to 0.66)

Figures and Tables -
Table 2. Subgroup analysis
Table Tests. Data tables by test

Test

No. of studies

No. of participants

1 All studies Show forest plot

21

457202

2 Primary analysis (threshold < 95% or ≤ 95%) Show forest plot

19

436758

Figures and Tables -
Table Tests. Data tables by test