Scolaris Content Display Scolaris Content Display

Prueba de lipoarabinomanano en orina de flujo lateral para detectar la tuberculosis activa en pacientes que conviven con el VIH

Collapse all Expand all

Antecedentes

La Organización Mundial de la Salud (OMS) recomienda la prueba de lipoarabinomanano en orina de flujo lateral (LF‐LAM) Alere Determine™ TB LAM Ag para ayudar a detectar la tuberculosis activa en pacientes con pruebas positivas para el VIH y enfermedad grave por VIH. Esta actualización de la revisión plantea la siguiente pregunta: "¿la evidencia nueva justifica el uso de la LF‐LAM en un grupo más amplio de pacientes?", y es parte del proceso de la OMS para actualizar las guías sobre el uso de la LF‐LAM.

Objetivos

Evaluar la exactitud de la LF‐LAM para el diagnóstico de la tuberculosis activa en adultos con pruebas positivas para el VIH y signos y síntomas de tuberculosis (participantes sintomáticos) y en adultos con pruebas positivas para el VIH independientemente de los signos y los síntomas de tuberculosis (participantes no seleccionados no evaluados por los signos y síntomas de tuberculosis).

La función propuesta para la LF‐LAM es como complemento del juicio clínico y con otras pruebas para ayudar en el diagnóstico de la tuberculosis.

Métodos de búsqueda

Se realizaron búsquedas en el Registro Especializado del Grupo Cochrane de Enfermedades Infecciosas (Cochrane Infectious Diseases Group Specialized Register), MEDLINE, Embase, el Science Citation Index, la Web of Science, la Latin American Caribbean Health Sciences Literature, Scopus, la International Clinical Trials Registry Platform de la OMS, el International Standard Randomized Controlled Trial Number Registry y ProQuest, sin restricción de idioma, hasta el 11 de mayo de 2018.

Criterios de selección

Ensayos aleatorizados, estudios transversales y estudios observacionales de cohortes que evaluaron la LF‐LAM para la tuberculosis activa (pulmonar y extrapulmonar) en adultos con pruebas positivas para el VIH. Se incluyeron estudios que utilizaron el umbral recomendado por el fabricante para la positividad de la prueba, ya sea la tarjeta de referencia actualizada con cuatro bandas (grado 1 de 4) o la tarjeta de referencia previa correspondiente con cinco bandas (grado 2 de 5). El estándar de referencia fue el cultivo o la prueba de amplificación del ácido nucleico de cualquier parte del cuerpo (microbiológico). Se consideró que un estándar de referencia de mayor calidad era aquel en el que se evaluaban dos tipos de muestras o más para el diagnóstico de la tuberculosis, y un estándar de referencia de menor calidad era aquel en el que solo se evaluaba un tipo de muestra.

Obtención y análisis de los datos

Dos autores de la revisión extrajeron los datos de forma independiente mediante un formulario estandarizado y las herramientas electrónicas de captura de datos REDCap. La calidad de los estudios se evaluó mediante la herramienta Quality Assessment of Diagnostic Accuracy Studies‐2 (QUADAS‐2) y se realizaron metanálisis para estimar la sensibilidad y la especificidad agrupadas mediante un modelo de efectos aleatorios bivariado y un enfoque bayesiano. Los estudios que reclutaron a participantes estrictamente sintomáticos se analizaron por separado de los que reclutaron a participantes no seleccionados. Se investigaron las fuentes predefinidas de heterogeneidad, incluida la influencia del recuento de CD4 y el contexto clínico en las estimaciones de la exactitud. La certeza de la evidencia se evaluó mediante los criterios GRADE.

Resultados principales

Se incluyeron 15 estudios únicos (nueve estudios nuevos y seis estudios de la revisión original que cumplieron con los criterios de inclusión): ocho estudios en adultos sintomáticos y siete estudios en adultos no seleccionados. Los estudios se realizaron en países de ingresos bajos o medios. El riesgo de sesgo fue alto en los dominios de la selección de pacientes y el estándar de referencia, principalmente debido a que los estudios excluyeron a los participantes que no pudieron producir esputo y utilizaron un estándar de referencia de calidad inferior.

Participantes con síntomas de tuberculosis

La sensibilidad agrupada de la LF‐LAM (intervalo de confianza [IC] del 95%) fue del 42% (31% a 55%) (evidencia de certeza moderada) y la especificidad agrupada fue del 91% (85% a 95%) (evidencia de certeza muy baja) (ocho estudios, 3449 participantes, 37% con tuberculosis).

Para una población de 1000 personas donde 300 tienen tuberculosis confirmada microbiológicamente, la utilización de la LF‐LAM daría lugar a: 189 positivos en la LF‐LAM; de los mismos, 63 (33%) no tendrían tuberculosis (positivos falsos), y 811 negativos en la LF‐LAM: de los mismos, 174 (21%) tendrían tuberculosis (negativos falsos).

Por contexto clínico, la sensibilidad agrupada fue del 52% (40% a 64%) entre los pacientes hospitalizados frente al 29% (17% a 47%) entre los pacientes ambulatorios; y la especificidad agrupada fue del 87% (78% a 93%) entre los pacientes hospitalizados frente al 96% (91% a 99%) entre los pacientes ambulatorios. Estratificada por el recuento de linfocitos CD4, la sensibilidad agrupada aumentó y la especificidad disminuyó con un recuento de linfocitos CD4 inferior.

Participantes no seleccionados no evaluados por los signos y síntomas de tuberculosis

La sensibilidad agrupada de la LF‐LAM fue del 35% (22% a 50%), (evidencia de certeza moderada) y la especificidad agrupada fue del 95% (89% a 96%), (evidencia de certeza baja), (siete estudios, 3365 participantes, 13% con tuberculosis).

Para una población de 1000 personas donde 100 tienen tuberculosis confirmada microbiológicamente, la utilización de la LF‐LAM daría lugar a: 80 positivos en la LF‐LAM: de los mismos, 45 (56%) no tendrían tuberculosis (positivos falsos); y 920 negativos en la LF‐LAM: de los mismos, 65 (7%) tendrían tuberculosis (negativos falsos).

Por contexto clínico, la sensibilidad agrupada fue del 62% (41% a 83%) entre los pacientes hospitalizados frente al 31% (18% a 47%) entre los pacientes ambulatorios; la especificidad agrupada fue del 84% (48% a 96%) entre los pacientes hospitalizados frente al 95% (87% a 99%) entre los pacientes ambulatorios. Estratificada por el recuento de linfocitos CD4, la sensibilidad agrupada aumentó y la especificidad disminuyó con un recuento de linfocitos CD4 inferior.

Conclusiones de los autores

Se encontró que la LF‐LAM tiene una sensibilidad del 42% para diagnosticar la tuberculosis en individuos con pruebas positivas para el VIH y síntomas de tuberculosis y del 35% en individuos con pruebas positivas para el VIH no evaluados por los síntomas de tuberculosis, lo cual es consistente con los hallazgos informados anteriormente. Independientemente de cómo se reclutó a los pacientes, la sensibilidad es mayor en los pacientes hospitalizados y en los que tienen un recuento menos de células CD4, pero con una menor especificidad concomitante. Como una prueba sencilla en el lugar de atención que no depende de la evaluación del esputo, la LF‐LAM puede ayudar con el diagnóstico de la tuberculosis, en particular cuando el paciente no puede producir una muestra de esputo.

Resumen en términos sencillos

Prueba de lipoarabinomanano en orina de flujo lateral para detectar la tuberculosis activa en pacientes que conviven con el VIH

¿Por qué es importante mejorar el diagnóstico de la tuberculosis?

La tuberculosis causa más muertes en los pacientes que conviven con el VIH que cualquier otra enfermedad. La prueba de lipoarabinomanano en orina de flujo lateral (prueba de LF‐LAM, Alere Determine™ TB LAM Ag) es una prueba rápida recomendada por la Organización Mundial de la Salud para ayudar en la detección de la tuberculosis activa en pacientes con pruebas positivas para el VIH y enfermedad grave por VIH. El diagnóstico rápido y precoz de la tuberculosis puede permitir un tratamiento rápido y aliviar la enfermedad grave y la muerte. Un diagnóstico incorrecto de tuberculosis puede dar lugar a ansiedad y a un tratamiento innecesario.

¿Cuál es el objetivo de esta revisión?

Determinar la exactitud de la LF‐LAM para el diagnóstico de la tuberculosis en pacientes con pruebas positivas para el VIH y síntomas de tuberculosis (participantes sintomáticos) y en los que no se evaluaron los síntomas de la tuberculosis (participantes no seleccionados). Esta es una actualización de la revisión Cochrane de 2016.

¿Qué se estudió en esta revisión?

La LF‐LAM es una prueba en el lugar de atención disponible comercialmente que detecta el lipoarabinomanano (LAM), un componente de las paredes de las células bacterianas, presente en algunos pacientes con tuberculosis activa. La prueba es simple y muestra los resultados en 25 minutos. Los resultados de la LF‐LAM se midieron con respecto al cultivo o a pruebas moleculares (prueba de referencia).

¿Cuáles son los principales resultados de esta revisión?

Quince estudios: ocho estudios evaluaron la LF‐LAM para la tuberculosis entre participantes sintomáticos y siete estudios entre participantes no seleccionados. Los estudios se realizaron en países de ingresos bajos o medios.

Diagnóstico de tuberculosis entre los participantes sintomáticos: La LF‐LAM registró resultados positivos en el 42% (sensibilidad) de los pacientes que en realidad tenían tuberculosis, y no registró resultados positivos en el 91% de los pacientes que en realidad presentaban resultados negativos (especificidad).

Diagnóstico de tuberculosis entre participantes no seleccionados: La sensibilidad de la LF‐LAM fue del 35% y la especificidad del 95%.

¿Cuánta confianza existe en los resultados de la revisión?

Varios estudios excluyeron a los participantes que no pudieron producir esputo y la mayoría de los estudios se basaron en una prueba de referencia de calidad inferior. Se incluyeron pocos estudios y participantes en algunos análisis y solo un estudio se realizó fuera de África subsahariana. Los resultados deben interpretarse con cautela.

¿Qué significan estos resultados?

Entre los participantes sintomáticos, en teoría, para una población de 1000 personas donde 300 tienen tuberculosis confirmada microbiológicamente, la utilización de la LF‐LAM daría lugar a: 189 positivos en la LF‐LAM; de los mismos, 63 (33%) no tendrían tuberculosis (positivos falsos), y 811 negativos en la LF‐LAM: de los mismos, 174 (21%) tendrían tuberculosis (negativos falsos).

Entre los participantes no seleccionados, en teoría, para una población de 1000 personas donde 100 tienen tuberculosis confirmada microbiológicamente, la utilización de la LF‐LAM daría lugar a: 80 positivos en la LF‐LAM: de los mismos, 45 (56%) no tendrían tuberculosis (positivos falsos); y 920 negativos en la LF‐LAM: de los mismos, 65 (7%) tendrían tuberculosis (negativos falsos).

¿A quién se aplican los resultados de la revisión?

Pacientes con pruebas positivas para el VIH y síntomas de tuberculosis y los que no han sido evaluados por síntomas de tuberculosis.

¿Cuáles son las implicaciones de esta revisión?

La LF‐LAM tiene una sensibilidad de alrededor del 40% para detectar la tuberculosis. Como la prueba no requiere la recolección de esputo, la LF‐LAM puede ser la única manera de diagnosticar la tuberculosis cuando los pacientes no pueden producir esputo.

¿Cuál es el grado de actualización de esta revisión?

Hasta el 11 de mayo de 2018.

Conclusiones de los autores

available in

Implicaciones para la práctica

Para los pacientes que conviven con el VIH, esta revisión encontró una sensibilidad general más baja de la prueba de lipoarabinomanano en orina de flujo lateral (LF‐LAM) que el objetivo sugerido internacionalmente de un mínimo del 65% en general para las pruebas diagnósticas de la tuberculosis no basadas en esputo (WHO TTP 2014). Lo anterior fue consistente cuando la prueba se utilizó para el diagnóstico de la tuberculosis asociada al VIH (sin considerar los sitios afectados por la enfermedad) en participantes sintomáticos (sensibilidad del 42%) o no seleccionados (es decir, no evaluados en cuanto a los síntomas) (sensibilidad del 35%). La sensibilidad estimada indica que si la LF‐LAM se utilizara sola, se pasarían por alto más de la mitad de todos los casos de tuberculosis. Se desconoce si la exactitud diagnóstica difiere para sitios específicos de tuberculosis (por ejemplo, tuberculosis pulmonar, meningitis tuberculosa o tuberculosis de los ganglios linfáticos). No hubo datos para evaluar la exactitud diagnóstica de la tuberculosis activa en participantes asintomáticos, aunque los estudios en pacientes ambulatorios no seleccionados que incluyeron una combinación de participantes sintomáticos y asintomáticos (es decir, participantes no seleccionados) mostraron una sensibilidad más baja (31%).

A pesar de la sensibilidad calculada, dos ensayos controlados aleatorizados que implementaron la LF‐LAM en contextos de alta prevalencia de África subsahariana han demostrado una reducción de la mortalidad y de la repercusión en otros resultados clínicos cuando se utiliza para guiar el tratamiento de la tuberculosis en adultos hospitalizados con pruebas positivas para el VIH.

La LF‐LAM se considera una prueba diagnóstica que se puede utilizar como complemento del juicio clínico y con otras pruebas para el diagnóstico de la tuberculosis asociada al VIH. La prueba no tiene función como prueba de reemplazo o de triaje. La prueba puede mejorar resultados de salud importantes entre los pacientes hospitalizados con pruebas positivas para el VIH debido a que es factible (es decir, se puede realizar en orina que es fácil de obtener en un paciente hospitalizado) y puede producir un resultado positivo los que tienen más probabilidades de morir a causa de la tuberculosis y más probabilidades de tener una presentación atípica (es decir, pacientes con VIH avanzado). Se desconoce si estos resultados se pueden extrapolar a los pacientes ambulatorios con enfermedad por VIH avanzada, o a los que presentan enfermedades graves.

Los hallazgos indican que la sensibilidad aumenta con los recuentos de células CD4 más bajos y en ámbitos hospitalarios, en comparación con los ámbitos ambulatorios. Para los participantes no seleccionados, independientemente de los síntomas, se encontraron diferencias en el rendimiento de la LF‐LAM según la prevalencia de la tuberculosis en la población de interés (cuando se estratificó en más o menos del 10%), con una sensibilidad mayor cuando la población de estudio tenía una mayor prevalencia de tuberculosis (≥ 10%). La diferencia en la exactitud diagnóstica de la LAM‐LEF por ámbito de estudio y por grado de inmunosupresión fue consistente, independientemente del enfoque de selección de pacientes. Al tomar en cuenta todos los hallazgos, se considera que la LF‐LAM tiene una función junto con otras pruebas en los pacientes con síntomas de tuberculosis o con un recuento bajo de células CD4. Sin embargo, había datos limitados y estos hallazgos deben interpretarse con cautela.

La prueba no requiere de la recolección de esputo y no es específica del sitio. Otras características favorables de la prueba incluyen su bajo coste, su rapidez (< 1 hora), su facilidad de uso (no requiere una preparación exhaustiva de la muestra) y el hecho de que no requiere electricidad ni instrumentos y equipos especiales (WHO TTP 2014). Como una simple prueba en el lugar de atención que no depende de la evaluación del esputo, la prueba LF‐LAM puede ser la única manera posible de confirmar un diagnóstico cuando no es posible obtener una muestra de esputo.

Los médicos deben considerar la necesidad de pruebas adicionales al interpretar los resultados negativos de la LAM‐FL. Las consecuencias de los resultados negativos falsos son el mayor riesgo de morbilidad y mortalidad, el inicio retrasado del tratamiento y el riesgo continuo de transmisión de la tuberculosis. Las consecuencias de los resultados positivos falsos son el retraso en el diagnóstico alternativo, la probabilidad de ansiedad y morbilidad causadas por las pruebas adicionales, el tratamiento innecesario y los posibles eventos adversos, así como el posible estigma asociado con el diagnóstico de la tuberculosis. Debido a que la LF‐LAM no ofrece información sobre la resistencia a los fármacos, se debe intentar un diagnóstico basado en cultivos o en moléculas que permita realizar pruebas de susceptibilidad a los fármacos para evitar que los pacientes con tuberculosis farmacorresistente no identificada puedan recibir un tratamiento inadecuado con un régimen apropiado solo para las enfermedades sensibles a los medicamentos.

En última instancia, el uso de la LF‐LAM en un algoritmo clínico no se basará únicamente en la exactitud, sino también en consideraciones relacionadas con la coste‐efectividad, las perspectivas y preferencias del usuario, y los efectos beneficiosos y perjudiciales generales de la prueba. Esta revisión actualizada contribuyó con datos de la exactitud para la WHO Guideline Development Group Meeting en mayo de 2019. Las guías actualizadas de la OMS sobre el uso de Alere LAM se esperan para finales de 2019.

Implicaciones para la investigación

Los estudios futuros que evalúen la exactitud diagnóstica de las pruebas para la tuberculosis no basadas en esputo, como la LF‐LAM, en pacientes que conviven con el VIH, deben utilizar un estándar de referencia que incluya al menos dos especímenes diferentes (p.ej. esputo y orina) y, además, para la sospecha de tuberculosis extrapulmonar, especímenes apropiados de los sitios que se sospecha que están afectados. Además, los estudios futuros deben incluir en el análisis a los pacientes que no pueden expectorar esputo, debido a que es muy probable que se beneficien con la prueba. Se deben evaluar las características que posiblemente impulsan la realización de la prueba, además del estado de CD4, como la carga de la enfermedad, las comorbilidades renales u otras. Se deben realizar más estudios que evalúen la exactitud de la LF‐LAM en niños con pruebas positivas para el VIH, debido a que actualmente hay muy pocos datos disponibles (Kroidl 2015; LaCourse 2018a; Nicol 2014). Aunque algunos estudios reclutaron a participantes no seleccionados, esta revisión indica que una gran proporción no presentaba síntomas, en particular en el ámbito hospitalario. Todavía se desconoce si es útil el uso de la LF‐LAM para el diagnóstico de la tuberculosis entre los pacientes con pruebas positivas para el VIH que no presentan síntomas de tuberculosis (especialmente en el caso de los pacientes con CD4 < 100). Se necesitan estudios adicionales en individuos asintomáticos para definir mejor el alcance de las recomendaciones sobre el uso de la LF‐LAM. La indicación de una mayor sensibilidad con el uso de orina fresca y también de orina de la mañana requiere investigación adicional, y existe una falta de estudios en ámbitos fuera de África subsahariana. Se necesita investigación adicional sobre la ejecución efectiva de la LAM‐FL en la práctica clínica habitual debido a que la prueba sólo puede influir en la práctica clínica si se cree en los resultados y se actúa de acuerdo a los mismos.

Summary of findings

Open in table viewer
Summary of findings 1. LF‐LAM for symptomatic participants

Review question: what is the diagnostic accuracy of LF‐LAM for the diagnosis of active tuberculosis in HIV‐positive adults with signs and symptoms of tuberculosis?

Studies: cross‐sectional studies and randomized controlled trials

Participants: HIV‐positive adults with tuberculosis signs and symptoms

Setting: all settings (inpatient and outpatient)

Index test: LF‐LAM

Threshold for index tests: manufacturer's recommended threshold for positivity i.e. grade 1 of 4 (revised reference card) or the corresponding grade 2 of 5 (prior reference card)

Reference standard: microbiological (mycobacterial culture and/or nucleic acid amplification test)

Role: an add on to clinical judgement and with other tests to assist in tuberculosis diagnosis

Pooled sensitivity (95%CrI): 42% (31% to 55%); pooled specificity (95% CrI): 91% (85% to 95%)

Test result

Number of results per 1000 participants tested (95% CrI)

Number of participants (studies)

Certainty of the evidence (GRADE)

Prevalence 1%

Typically seen in asymptomatic persons in outpatient settings

Prevalence 10%

Typically seen in symptomatic persons in all settings

Prevalence 30%

Typically seen in seriously ill persons in inpatient settings

True positives

4 (3 to 6)

42 (31 to 55)

126 (93 to 165)

1277 (8)

⊕⊕⊕⊝
MODERATEa,b,c,d

False negatives

6 (4 to 7)

58 (45 to 69)

174 (135 to 207)

True negatives

901 (842 to 941)

819 (765 to 855)

637 (595 to 665)

2172 (8)

⊕⊝⊝⊝
VERY LOWc,e,f

False positives

89 (49 to 148)

81 (45 to 135)

63 (35 to 105)

Abbreviations: Crl: credible interval.

Explanations

aAs assessed by QUADAS‐2, in the patient selection domain, we judged six studies (75%) at high risk of bias because they did not avoid inappropriate exclusions. We downgraded one level for risk of bias.
bFor individual studies, sensitivity estimates ranged from 23% to 68%. We thought that differences in enrolment criteria (different populations targeted) or CD4 count could explain in part the heterogeneity. We did not downgrade for inconsistency.
cThe median tuberculosis prevalence in the studies was 42% and thus the results tend to be more applicable to settings with a higher tuberculosis prevalence. For tuberculosis prevalence of 1% and 10%, whether or not to downgrade remains unclear. It is possible the test will perform differently at lower prevalences. We did not downgrade for indirectness.
dWe thought the 95% CrIs around true positives and false negatives would likely not lead to different decisions depending on which credible limits are assumed. We did not downgrade for imprecision.
eAs assessed by QUADAS‐2, in the reference standard domain, we judged seven studies (88%) at high risk of bias because we thought the reference standard used was unlikely to correctly classify the target condition. We downgraded two levels for risk of bias.
fWe thought the 95% CrIs around true negatives and false positives would likely lead to different decisions depending on which credible limits are assumed. We downgraded one level for imprecision.

GRADE certainty of evidence (GRADEpro 2015; Balshem 2011)
High: we are very confident that the true effect lies close to that of the estimate of the effect.
Moderate: we are moderately confident in the effect estimate: The true effect is likely to be close to the estimate of the effect, but there is a possibility that it is substantially different.
Low: our confidence in the effect estimate is limited: The true effect may be substantially different from the estimate of the effect.
Very low: we have very little confidence in the effect estimate: The true effect is likely to be substantially different from the estimate of effect.

The table displays normalized frequencies within a hypothetical cohort of 1000 patients at three different prevalences of tuberculosis (pre‐test probabilities): 1%, 10% and 30%. Credible limits (Crls) were estimated based on those around the point estimates for pooled sensitivity and specificity.

Note: the results on this table should not be interpreted in isolation from the results of the individual included studies contributing to each summary test accuracy measure. These are reported in the main body of the text of the review.

Open in table viewer
Summary of findings 2. LF‐LAM for unselected participants

Review question: what is the diagnostic accuracy of LF‐LAM for the diagnosis of active tuberculosis in HIV‐positive adults irrespective of signs and symptoms of tuberculosis?

Studies: cross‐sectional studies and randomized controlled trials

Participants: HIV‐positive unselected adults not assessed for signs and symptoms of tuberculosis i.e. irrespective of symptoms

Setting: all settings (inpatient and outpatient)

Index test: LF‐LAM

Threshold for index tests: manufacturer's recommended threshold for positivity i.e. grade 1 of 4 (revised reference card) or the corresponding grade 2 of 5 (prior reference card)

Reference standard: microbiological (mycobacterial culture and/or nucleic acid amplification test)

Role: an add on to clinical judgement and with other tests to assist in tuberculosis diagnosis

Pooled sensitivity (95% CrI): 35% (22% to 50%); pooled specificity (95% CrI): (89% to 98%)

Test result

Number of results per 1000 participants tested (95% CrI)

Number of participants (studies)

Certainty of the evidence (GRADE)

Prevalence 1%

Typically seen in asymptomatic persons in outpatient settings

Prevalence 10%

Typically seen in symptomatic persons in all settings

Prevalence 30%

Typically seen in seriously ill persons in inpatient settings

True positives

3 (2 to 5)

35 (22 to 50)

105 (66 to 150)

432 (7)

⊕⊕⊕⊝
MODERATEa,b,c

False negatives

7 (5 to 8)

65 (50 to 78)

195 (150 to 234)

True negatives

941 (881 to 970)

855 (801 to 882)

665 (623 to 686)

2933 (7)

⊕⊕⊝⊝
LOWd,e,f

False positives

49 (20 to 109)

45 (18 to 99)

35 (14 to 77)

Abbreviations: Crl: Credible interval.

Explanations

aAs assessed by QUADAS‐2, in the patient selection domain, we judged four studies (57%) at high risk of bias because they did not avoid inappropriate exclusions. We downgraded one level for risk of bias.
bFor individual studies, sensitivity ranged from 0% to 67%. We thought that the percentage of patients with tuberculosis symptoms or differences in CD4 count could explain in part the heterogeneity. One study, LaCourse 2016, with sensitivity of 0% differed from the other studies by including a) a population of exclusively pregnant women attending an antenatal care setting, b) a low proportion of symptomatic participants (19%), c) a low tuberculosis prevalence (1%), and d) a high median CD4 cell count (437 cells per µL). One study, Thit 2017, with sensitivity 67% differed from the other studies by being conducted in Myanmar, and was the only study included in this review that evaluated LF‐LAM in a setting outside sub‐Saharan Africa. We did not downgrade for inconsistency.
cWe thought the 95% CrI around true positives and false negatives would likely not lead to different decisions depending on which credible limits are assumed. We did not downgrade for imprecision.
dAs assessed by QUADAS‐2, in the reference standard domain, we judged five studies (71%) at high risk of bias because we thought the reference standard used was unlikely to correctly classify the target condition. We downgraded one level for risk of bias.
eFor individual studies, specificity ranged from 67% to 99%. Eighty‐six per cent (6/7) of the included studies had specificity of 94% or higher. One study, Thit 2017, with specificity 67% differed from the other studies by being conducted in Myanmar, and is the only study included in this review that evaluated LF‐LAM in a setting outside sub‐Saharan Africa. We did not downgrade for inconsistency.
fWe thought the wide 95% Crls around true negatives and false positives would lead to different decisions depending on which credible limits are assumed. We downgraded one level for imprecision.

GRADE certainty of evidence (GRADEpro 2015; Balshem 2011)
High: we are very confident that the true effect lies close to that of the estimate of the effect.
Moderate: we are moderately confident in the effect estimate: The true effect is likely to be close to the estimate of the effect, but there is a possibility that it is substantially different.
Low: our confidence in the effect estimate is limited: The true effect may be substantially different from the estimate of the effect.
Very low: we have very little confidence in the effect estimate: The true effect is likely to be substantially different from the estimate of effect.

The table displays normalized frequencies within a hypothetical cohort of 1000 patients at three different prevalences of tuberculosis (pre‐test probabilities): 1%, 10% and 30%. Credible limits (Crls) were estimated based on those around the point estimates for pooled sensitivity and specificity.

Note: the results on this table should not be interpreted in isolation from the results of the individual included studies contributing to each summary test accuracy measure. These are reported in the main body of the text of the review.

Antecedentes

available in

La tuberculosis es una enfermedad infecciosa transmitida por el aire que es causada por el bacilo Mycobacterium tuberculosis (M tuberculosis). Se estima que en 2017 hubo 10 000 000 de personas que desarrollaron tuberculosis, de las cuales 920 000 (9%) ocurrieron entre pacientes que conviven con el VIH (WHO Global Tuberculosis Report 2018). Aunque el número de muertes por tuberculosis ha disminuido desde el año 2000 la tuberculosis fue responsable de 1 600 000 de muertes en 2017 (WHO Global Tuberculosis Report 2018), y la tuberculosis ha superado al VIH como la principal causa de muerte por enfermedades infecciosas en el mundo. Entre los pacientes que conviven con el VIH la tuberculosis es la principal causa de hospitalización y de muerte dentro del hospital, a pesar del mayor acceso al tratamiento antirretroviral (TAR) (Ford 2016). Una revisión sistemática de la prevalencia de la tuberculosis identificada en la autopsia en entornos de recursos limitados indica que la tuberculosis es responsable de hasta el 40% de todas las muertes relacionadas con el VIH, y que la tuberculosis a menudo es diseminada y no diagnosticada en el momento de la muerte (Gupta 2015). A nivel mundial, en 2017 solo se notificó el 51% de los casos de tuberculosis entre los pacientes que convivían con el VIH (WHO Global Tuberculosis Report 2018). Sin embargo, la mayoría de las muertes por tuberculosis se pueden prevenir si la enfermedad se detecta a tiempo y se trata de manera efectiva. En general se estima que se salvaron 45 000 000 de vidas entre 2000 y 2017 gracias a un diagnóstico y tratamiento efectivos (WHO Global Tuberculosis Report 2018).

A nivel geográfico, el VIH y la tuberculosis suelen concentrarse en áreas de pobreza con recursos limitados para el diagnóstico, el tratamiento y la prevención de la tuberculosis. La mayoría de los 30 países con una carga elevada de tuberculosis/VIH están situados en África subsahariana, donde la infección por el VIH representa un impulsor importante de la epidemia de tuberculosis (WHO Global Tuberculosis Report 2018). Los pacientes con pruebas positivas para el VIH tienen un riesgo de 20 a 37 veces mayor de desarrollar tuberculosis en comparación con los pacientes con pruebas negativas para el VIH (Getahun 2010). El riesgo de tuberculosis aumenta con la disminución del recuento de células CD4 y sigue siendo elevado durante el curso de la enfermedad po VIH (Gupta 2012; Lawn 2009).

La tuberculosis afecta predominantemente los pulmones (tuberculosis pulmonar), aunque puede afectar la mayoría de las partes del cuerpo como los ganglios linfáticos, la pleura, el cerebro o la columna vertebral (tuberculosis extrapulmonar). La tuberculosis extrapulmonar representó el 14% de los casos incidentes de tuberculosis notificados en 2017 (WHO Global Tuberculosis Report 2018). En comparación con los pacientes con pruebas negativas para el VIH, los pacientes con pruebas positivas para el VIH tienen tasas más altas de tuberculosis extrapulmonar o micobacteriemia (infección del torrente sanguíneo por tuberculosis) (Pai 2016; Shivakoti 2017). Los signos y síntomas de la tuberculosis en los pacientes que conviven con el VIH varían según la progresión de la inmunodeficiencia y del sitio o sitios afectados. Las quejas a menudo no son específicas e incluyen fiebre, pérdida de peso y fatiga. La presencia de tos durante más de dos semanas es un rasgo distintivo común de la tuberculosis que provoca la realización de pruebas diagnósticas para detectar la tuberculosis en personas con pruebas negativas para el VIH, aunque se observa en menos de un tercio de los pacientes con tuberculosis con pruebas positivas para el VIH (Cain 2010). De manera similar, las características radiográficas de la tuberculosis en los pacientes que conviven con el VIH pueden ser engañosas o atípicas. Mientras que las lesiones cavitarias del lóbulo superior se observan a menudo en pacientes con pruebas negativas para el VIH que presentan tuberculosis, dichas lesiones son menos comunes en pacientes con pruebas positivas para el VIH y tuberculosis (Cain 2010). Por lo tanto, la identificación de los pacientes en los que se justifica la realización de a más pruebas para la tuberculosis puede ser un reto. El diagnóstico de la tuberculosis depende en gran medida de una estrategia de pruebas basadas en el esputo que pueden tener una exactitud limitada, al igual que su aplicabilidad en una población que puede producir escaso esputo y que con frecuencia presenta tuberculosis extrapulmonar y diseminada. Además, los pacientes que conviven con el VIH a menudo tienen tuberculosis paucibacilar, lo cual da lugar a que el diagnóstico de la tuberculosis por baciloscopía, pruebas de amplificación de ácido nucleico (NAAT, por sus siglas en inglés) y cultivo sea menos sensible.

Las pruebas diagnósticas de la tuberculosis en el lugar de atención que no se basan en el esputo son muy deseables para mejorar la detección de casos de tuberculosis en pacientes que conviven con el VIH y garantizar un tratamiento oportuno (WHO TTP 2014). Las características deseadas de este tipo de prueba incluirían una recolección de muestras mínima o no invasiva, poco tiempo para el resultado (menos de una hora), y la capacidad de implementar la prueba sin necesidad de instrumentos especiales, electricidad o preparación de muestras (WHO TTP 2014).

Con el tiempo, la detección del antígeno micobacteriano en la orina ha atraído gran atención. La prueba de antígenos en orina permitiría un diagnóstico de tuberculosis no específico del sitio. Además, la orina es fácil de recolectar y almacenar, y carece de los riesgos de control de infecciones asociados con la recolección de esputo. Se han desarrollado múltiples plataformas para detectar el lipoarabinomanano (LAM), un componente de las paredes celulares de las micobacterias, inicialmente como ensayos de inmunoabsorción ligado a enzimas (ELISA, por sus siglas en inglés) que se evaluaron en varios contextos clínicos (Minion 2011). Más tarde, la prueba de lipoarabinomanano en orina de flujo lateral (prueba LF‐LAM, Alere Determine TB‐LAM) fue desarrollada como una simple prueba en el lugar de atención para el diagnóstico de la tuberculosis activa en pacientes que conviven con el VIH. La prueba está disponible comercialmente, no requiere acceso a un equipo especial de laboratorio y produce un resultado después de 25 minutos (Alere 2017), por lo que cumple con muchos de los requisitos deseados del perfil del producto de interés (WHO TTP 2014).

La revisión Cochrane original de la LF‐LAM para la tuberculosis incluyó 12 estudios (Shah 2016). En dicha revisión, seis estudios evaluaron la exactitud entre los individuos sintomáticos y encontraron una sensibilidad agrupada baja del 45% (intervalo de confianza [IC]: 29% al 63%) y una especificidad del 92% (IC: 80% al 97%) con respecto a un estándar de referencia microbiológico (Shah 2016). En los participantes con CD4 ≤ 100 células/μl, la sensibilidad agrupada aumentó al 56% (IC: 41% al 70%) y la especificidad disminuyó al 90% (81% al 95%). En la revisión original también se evaluó la exactitud de la LF‐LAM en los participantes no evaluados por los síntomas (es decir, los denominados como "cribado de la tuberculosis" y que ahora se describen como estudios entre "participantes no seleccionados"), con una sensibilidad que varió entre el 0% y el 44% (Shah 2016).

En 2015; sobre la base de la revisión Cochrane original, la OMS hizo una recomendación condicional para el uso de la LF‐LAM como ayuda en el diagnóstico de la tuberculosis en pacientes con pruebas positivas para el VIH y enfermedad avanzada (descrita más adelante), y una fuerte recomendación en contra del uso de la prueba "como prueba de cribado de la tuberculosis" sobre la base de los datos en participantes no seleccionados (WHO Lipoarabinomannan Policy Guidance 2015).

Desde 2015 ha surgido evidencia adicional sobre el uso y el impacto clínico de la LF‐LAM. Esta actualización de la revisión Cochrane incluye estudios publicados que evalúan la exactitud de la prueba LF‐LAM, Alere Determine TB LAM Ag, disponible comercialmente, para el diagnóstico de la tuberculosis activa (tuberculosis pulmonar y extrapulmonar) en pacientes que conviven con el VIH e informó las guías actualizadas de la OMS sobre el uso de la prueba. Debe señalarse que en 2018 se anunciaron las características preliminares de rendimiento de una segunda prueba de flujo lateral desarrollada comercialmente para detectar el LAM para el diagnóstico de la tuberculosis, basado en los datos de muestras congeladas de biobancos (Fujifilm SILVAMP TB LAM, Japón; FujiLAM) (Broger 2019). Se proyecta que la prueba esté disponible comercialmente en 2020; en esta revisión actualizada no se incluyen estudios de exactitud de la FujiLAM.

Enfermedad de interés diagnosticada

La afección de interés es la tuberculosis activa, que incluye la tuberculosis pulmonar y la extrapulmonar.

Prueba/s índice

El ensayo de inmunocaptura con lipoarabinomanano en orina de flujo lateral (LF‐LAM) es una prueba en el lugar de atención disponible comercialmente para la tuberculosis activa (Alere Determine™ TB LAM Ag, Abbott, Palatine, IL, EE.UU., anteriormente Alere Inc., Waltham, MA, EE.UU.). El lipoarabinomanano (LAM) es un lipopolisacárido presente en las paredes celulares de las micobacterias (Brennan 2003), que es liberado por las células bacterianas metabólicamente activas o de degeneración durante la tuberculosis (Briken 2004). El LAM se detecta en la orina de los pacientes con tuberculosis activa y se evalúa para las plataformas de prueba LAM ELISA y la LF‐LAM (Lawn 2012; Minion 2011; Peter 2010; Shah 2016). La revisión Cochrane original de la LF‐LAM (Shah 2016) y un metanálisis de una prueba LAM ELISA de una generación anterior (Minion 2011) demostraron que la exactitud de detección del LAM urinario mejoró entre los pacientes que conviven con el VIH que presentan inmunosupresión avanzada. Varias hipótesis pueden explicar la mayor sensibilidad de la detección del LAM en orina en pacientes que conviven con el VIH, que incluyen una mayor carga bacilar y carga de antígenos (Shah 2010), una mayor probabilidad de afectación del tracto genitourinario por la tuberculosis y una mayor permeabilidad glomerular que permite mayores niveles de antígenos en orina (Lawn 2016; Minion 2011).

La prueba LF‐LAM se realiza manualmente al aplicar 60 µl de orina no procesada a la almohadilla de muestra de la prueba DetermineTB LAM Ag y dejar incubar la tira de la prueba a temperatura ambiente durante 25 minutos (Alere 2017; Apéndice 1). La tira luego es inspeccionada visualmente. La intensidad de cualquier banda visible se califica comparándola con las intensidades de las bandas en la tarjeta provista por el fabricante que posee la escala de referencia. Se debe señalar que la escala de referencia se revisó en enero de 2014. Antes de enero 2014; la tarjeta con la escala de referencia incluía cinco bandas (de grado 1 que representa una banda de intensidad muy baja a grado 5 que representa una banda de intensidad alta/oscura). Después de enero de 2014 el fabricante revisó la tarjeta con la escala de referencia la cual comenzó a tener cuatro bandas de referencia, de manera tal que la intensidad de la banda para el nuevo grado 1 correspondía a la intensidad de la banda para el anterior grado 2 (Apéndice 2). Según las recomendaciones actuales del fabricante (utilizando la tarjeta de referencia de cuatro bandas revisada), solo las bandas que son de grado 1 o superior se consideran positivas (Alere 2017; Apéndice 2).

Vía clínica

Sobre la base de las guías actuales de la OMS (WHO Lipoarabinomannan Policy Guidance 2015), la función propuesta para la prueba LF‐LAM es como «complemento» del juicio clínico y con otras pruebas para ayudar en el diagnóstico de la tuberculosis. La prueba no tiene función como prueba de reemplazo o de triaje. La razón para especificar el "juicio clínico" es que, en la opinión de los autores, el juicio clínico para la tuberculosis asociada al VIH tiene más importancia que en muchos otros casos (es decir, el tratamiento de la tuberculosis se puede proporcionar independientemente de los resultados de la prueba). La razón para especificar el "complemento" es que en los entornos en los que no se dispone de la prueba se utiliza el mismo criterio clínico; por lo tanto, en los entornos en los que sí se dispone de la prueba, se utiliza como "agregado". Es importante destacar que algunos pacientes con pruebas positivas para el VIH pueden tener dificultades para producir una muestra de esputo de buena calidad, o algún esputo.

En la guía de políticas de la OMS sobre el uso de LAM se recomienda que la LF‐LAM "puede ser utilizada para ayudar en el diagnóstico de la tuberculosis en pacientes adultos hospitalizados con pruebas positivas para el VIH que presentan signos y síntomas de tuberculosis (pulmonar o extrapulmonar) y un recuento de células CD4 inferior o igual a 100 células/μl, o en pacientes que conviven con el VIH y que presentan "enfermedades graves", independientemente del recuento de CD4 o de si se desconoce el recuento de CD4" (WHO Lipoarabinomannan Policy Guidance 2015). Las recomendaciones también se aplican a los pacientes ambulatorios con pruebas positivas para el VIH y a los niños con signos y síntomas de tuberculosis (pulmonar y/o extrapulmonar) sobre la base de la generalización de los datos de los pacientes hospitalizados adultos, al tiempo que se reconoce la limitación de los datos disponibles (WHO Lipoarabinomannan Policy Guidance 2015). La OMS recomienda que la LF‐LAM no se utilice para el cribado general de la tuberculosis "debido a la sensibilidad subóptima" (WHO Lipoarabinomannan Policy Guidance 2015).

En 2016 la OMS desarrolló un algoritmo para tratar a los pacientes que conviven con el VIH que se supone que tienen tuberculosis, la cual se publicó como parte de las guías sobre la administración del TAR para el tratamiento y la prevención de la infección por el VIH (WHO ART Guidelines 2016). El algoritmo recomienda la prueba Xpert® MTB/RIF (Cepheid, Sunnyvale, EE.UU.) como prueba diagnóstica inicial en adultos y niños con sospecha de tuberculosis asociada al VIH (WHO Xpert® Policy Update 2013). Se recomienda utilizar Xpert® MTB/RIF en lugar de la microscopía y el cultivo convencionales para analizar el esputo y las muestras extra‐pulmonares específicas como el líquido cefalorraquídeo y los ganglios linfáticos (WHO Xpert® Policy Update 2013). El algoritmo incluye recomendaciones sobre el uso de la LF‐LAM como una prueba que puede ayudar a diagnosticar la tuberculosis activa entre adultos gravemente enfermos y niños que conviven con el VIH, independientemente del recuento de CD4 (WHO ART Guidelines 2016). El uso de la LF‐LAM también se incluye como uno de los componentes del paquete para el diagnóstico de la tuberculosis en las guías de la OMS para el tratamiento de los pacientes que se presentan con VIH avanzado (WHO Managing Advanced HIV Disease 2017).

Cuando se sospecha de tuberculosis extrapulmonar se recomienda obtener "muestras adecuadas de los sitios sospechosos de afectación para microscopía, cultivo y examen histopatológico" (TB CARE I 2014). Una revisión Cochrane recientemente publicada encontró que la Xpert MTB/RIF puede ser útil para confirmar el diagnóstico de tuberculosis extrapulmonar (Kohli 2018). Sin embargo, la evaluación para la tuberculosis extrapulmonar a menudo requiere procedimientos de diagnóstico invasivos que pueden tener un bajo rendimiento incluso en pacientes con enfermedad avanzada.

Para identificar a los pacientes que necesitan ser derivados para las pruebas diagnósticas de la tuberculosis, las guías de la OMS sobre la intensificación de la detección de casos en pacientes que conviven con el VIH recomiendan que, en entornos con recursos limitados, los pacientes que conviven con el VIH y que presentan "cualquiera de los síntomas actuales de tos, fiebre, pérdida de peso o sudores nocturnos se deben evaluar para detectar la tuberculosis y otras enfermedades", lo que se conoce como la regla de cribado de síntomas de la OMS (Getahun 2011; WHO ICF 2011). Sin embargo, los pacientes que conviven con el VIH y la tuberculosis pueden no presentar los síntomas frecuentes de la tuberculosis. Por lo tanto, en algunos entornos con alta prevalencia de tuberculosis, los médicos han considerado la posibilidad de evaluar a todos los pacientes que acuden a los servicios de atención de tuberculosis sin tener en cuenta y sin evaluar los signos o los síntomas específicos de la tuberculosis.

En el contexto de la recomendación de la LF‐LAM en combinación con las pruebas de tuberculosis existentes para aumentar el diagnóstico y el tratamiento tempranos de la tuberculosis, las consecuencias de la prueba LF‐LAM incluyen las siguientes.

  • Positivos verdaderos (PV): los pacientes se beneficiaríaeln de un diagnóstico rápido no específico del sitio y de un comienzo temprano del tratamiento de la tuberculosis.

  • Negativos verdaderos (NV): a los pacientes no se les administraría un tratamiento innecesario y se beneficiarían de la confirmación y de la búsqueda de un diagnóstico alternativo.

  • Positivos falsos (PF): los pacientes probablemente experimentarían ansiedad y morbilidad causadas por las pruebas adicionales, el tratamiento innecesario y los posibles efectos adversos, así como el posible estigma asociado con un diagnóstico de tuberculosis, y un resultado PF podría detener la evaluación diagnóstica adicional. Sin embargo, como los resultados PF aumentan (la especificidad disminuye) a medida que disminuye el recuento de CD4, los resultados PF observados se pueden deber a la incapacidad de los pacientes más enfermos para producir una muestra de esputo y los resultados PF se clasifican erróneamente como PF. Debido a la alta mortalidad de los pacientes que conviven con el VIH, la posibilidad de actuar sobre todos los resultados positivos de la LF‐LAM puede equilibrar los posibles efectos adversos asociados con el diagnóstico y el tratamiento innecesarios.

  • Negativos falsos (NF): los pacientes experimentarían un riesgo mayor de morbilidad y mortalidad y un retraso en el comienzo del tratamiento; habría un riesgo continuo de transmisión de tuberculosis. Sin embargo, estas preocupaciones pueden ser limitadas cuando se utiliza la LF‐LAM en combinación con las pruebas de tuberculosis existentes.

Es importante señalar que la LF‐LAM no proporciona información sobre la resistencia a los fármacos y que algunos pacientes con tuberculosis farmacorresistente no identificada pueden recibir un tratamiento inadecuado con un régimen apropiado para la tuberculosis sensible a los medicamentos.

Prueba/s alternativa/s

En esta sección se describen brevemente algunas pruebas alternativas seleccionadas para la detección de la tuberculosis. Para una revisión integral de estas pruebas el lector a puede consultar varios recursos excelentes (Lewinsohn 2017; Unitaid 2017).

La baciloscopía (microscopía óptica [Ziehl‐Neelsen], microscopía de fluorescencia o microscopía de fluorescencia de diodo emisor de luz [LED]) es el examen de frotis para detectar bacilos acidorresistentes (bacterias de la tuberculosis) bajo un microscopio. Las ventajas de la microscopía con baciloscopía incluyen su sencillez, bajo coste, velocidad y especificidad alta en las áreas con una carga alta de tuberculosis. Además, la baciloscopía identifica a los pacientes con tuberculosis más infecciosa. La baciloscopía se puede realizar en laboratorios básicos. Los inconvenientes de la baciloscopia incluyen la necesidad de entrenamiento especializado y una sensibilidad relativamente baja, 50% a 60% en promedio para una baciloscopia directa. Entre los pacientes que conviven con el VIH, la sensibilidad alcanza sólo el 22% al 43% (Getahun 2007). Deben estar presentes alrededor de 5000 a 10 000 microorganismos por ml en la muestra para que las bacterias de la tuberculosis sean visibles por el microscopio (Lewinsohn 2017). Aunque la sensibilidad de la microscopía puede mejorar en aproximadamente el 10% con la fluorescencia (Steingart 2006), un gran número de casos de tuberculosis aún no se diagnostican si el diagnóstico de la tuberculosis se basa únicamente en la baciloscopía de esputo. La tuberculosis con frotis negativo es desproporcionadamente más frecuente en individuos con pruebas positivas para el VIH que en individuos con pruebas negativas para el VIH, y representa entre el 24% y el 61% de todos los casos pulmonares en pacientes que conviven con el VIH; el rendimiento disminuye con los recuentos más bajos de células CD4 (Getahun 2007; Perkins 2007).

El cultivo micobacteriano es un método utilizado para aumentar el crecimiento bacteriano en los medios ricos en nutrientes. En comparación con la microscopía, un cultivo positivo solo requiere alrededor de 100 microorganismos por ml y, por lo tanto, puede detectar cantidades inferiores de bacterias de la tuberculosis (Lewinsohn 2017). Además, el cultivo es fundamental para la identificación de las especies y las pruebas de susceptibilidad a los fármacos. Sin embargo, el cultivo puede demorar de seis a ocho semanas y requiere de un laboratorio sumamente equipado.

Las pruebas de amplificación del ácido nucleico (NAAT) son sistemas moleculares que pueden detectar cantidades pequeñas de material genético (ADN o ARN) de los microorganismos como M tuberculosis. La ventaja clave de las NAAT es que son pruebas diagnósticas rápidas y pueden proporcionar los resultados en unas pocas horas. Existe una variedad de métodos de amplificación molecular; el más común es la reacción en cadena de la polimerasa (RCP). Las NAAT están disponibles como kits comerciales y pruebas domiciliarias (basadas en protocolos desarrollados en laboratorio) y se utilizan de forma habitual en los países de ingresos altos para la detección de la tuberculosis. La RCP domiciliaria se utiliza ampliamente en los países de ingresos bajos porque estas pruebas son menos costosas que los kits comerciales. Sin embargo, se sabe que la RCP en el domicilio produce resultados muy poco consistentes (Flores 2005).

Xpert MTB/RIF y Xpert Ultra, la última versión (Cepheid, Sunnyvale, EE.UU.), son NAAT completamente automatizadas que detectan simultánea y rápidamente el complejo M tuberculosis y la resistencia a la rifampicina (WHO Xpert® Policy Update 2013; WHO Xpert Ultra 2017). Una revisión Cochrane encontró que la MTB/RIF Xpert fue sensible y específica para la detección de la tuberculosis pulmonar y de la resistencia a la rifampicina (Horne 2019). En comparación con Xpert MTB/RIF, Xpert Ultra tuvo una sensibilidad mayor y una especificidad menor para la tuberculosis, y una sensibilidad y especificidad similares para la resistencia a la rifampicina (un estudio) (Horne 2019). Aunque la prueba de esputo con Xpert MTB/RIF tiene una alta sensibilidad para la tuberculosis pulmonar con frotis positivo (98%), la sensibilidad es menor para la tuberculosis pulmonar con frotis negativo (67%) (Horne 2019). En otra revisión Cochrane que incluyó 66 estudios que evaluaban la Xpert MTB/RIF para la detección de la tuberculosis extrapulmonar, se encontró que la sensibilidad agrupada varió entre los diferentes tipos de muestras, desde el 31% en el tejido pleural hasta el 97% en el hueso o el líquido articular, mientras que la especificidad varió menos, desde el 82% en el hueso o el tejido articular hasta el 99% en el líquido pleural y la orina (Kohli 2018). Estos hallazgos se relacionan con la tuberculosis asociada al VIH, en la que la tuberculosis con frotis negativo y la tuberculosis extrapulmonar son desproporcionadamente más altas. En 2017; basado en un análisis de no inferioridad de la Xpert Ultra en comparación con Xpert MTB/RIF, la OMS declaró que las recomendaciones sobre la utilización de Xpert MTB/RIF también se aplican al uso de la Xpert Ultra como prueba diagnóstica inicial para todos los adultos y niños con signos y síntomas de tuberculosis (WHO Xpert Ultra 2017).

Desde 2016 la OMS ha recomendado la prueba de amplificación isotérmica mediada por bucle, TB‐LAMP (Eiken Chemical Co., Tokio, Japón) para el diagnóstico de la tuberculosis pulmonar en adultos (WHO TB‐LAMP 2016). Es una prueba manual y sencilla que se puede realizar directamente en muestras de esputo y el resultado se obtiene en menos de una hora (Yuan 2014). Es adecuada para su uso en centros de salud periféricos y se promueve como una prueba más sensible que la microscopía, pero inferior a la Xpert MTB/RIF (WHO TB‐LAMP 2016).

La FujiLAM es una prueba nueva de orina de flujo lateral en el lugar de atención para el diagnóstico de la tuberculosis en pacientes que conviven con el VIH en entornos de bajos recursos. Esta prueba se desarrolló para detectar el LAM con resultados disponibles en menos de una hora y se anunció el 26 de septiembre de 2018; el día de la primera reunión de alto nivel de la Asamblea General de las Naciones Unidas sobre tuberculosis (FIND 2018). La Fuji LAM se ha evaluado en muestras de biobancos congelados provenientes de varios estudios de pacientes hospitalizados con pruebas positivas para el VIH, con una sensibilidad estimada del 70% (Broger 2019). Actualmente se realizan estudios para evaluar el rendimiento de la FujiLAM en las biomuestras almacenadas de las cohortes de pacientes ambulatorios con VIH, y en este momento se solicita la realización de estudios prospectivos para evaluar la exactitud diagnóstica de la FujiLAM, como un próximo paso. Estas pruebas reciben el apoyo del fondo Global Health Innovative Technology y el German Federal Ministry of Education and Research. La Foundation for Innovative New Diagnostics (FIND) participó en el desarrollo de la prueba, que contó con el apoyo de los gobiernos de los Países Bajos y Australia, la ayuda del gobierno del Reino Unido y la Bill & Melinda Gates Foundation.

Fundamento

Para considerar la tuberculosis como la causa principal de morbilidad y mortalidad entre los pacientes que conviven con el VIH se necesitan urgentemente nuevas pruebas y estrategias para la detección de la tuberculosis. Entre las prioridades clave identificadas por la OMS, los proveedores de atención sanitaria, los pacientes y los grupos de apoyo se encuentra el desarrollo de pruebas de tuberculosis en el lugar de atención y no específicas del sitio (Batz 2011; Pai 2012; Weyer 2011; WHO TTP 2014). Hasta la fecha, la LF‐LAM es la única prueba de tuberculosis en el lugar de atención disponible en el mercado. La LAM‐FL, si fuese suficientemente exacta, cumpliría con muchas de las especificaciones mínimas establecidas para una prueba en el lugar de atención para la tuberculosis (Apéndice 3; Batz 2011). La prueba LF‐LAM podría proporcionar efectos beneficiosos obvios para los pacientes con pruebas positivas para el VIH a través de la detección temprana de la tuberculosis pulmonar que puede pasar desapercibida con la baciloscopía de esputo y la prueba Xpert MTB/RIF de esputo, y la tuberculosis extrapulmonar que puede pasar desapercibida con la prueba a base de esputo. Ya existen estudios disponibles que evalúan el impacto del uso de la LF‐LAM sobre la mortalidad y otros resultados de los pacientes.

Las guías de la OMS sobre el uso de la LF‐LAM en la orina se publicaron en 2015 (WHO Lipoarabinomannan Policy Guidance 2015). Desde 2015 ha surgido evidencia adicional sobre la exactitud diagnóstica de la LF‐LAM que se resume en esta actualización de la revisión Cochrane. Se utilizó un borrador de esta revisión para informar las guías actualizadas de la OMS de 2019 sobre el uso de la LF‐LAM.

Objetivos

available in

Objetivos primarios

Se señalaron dos objetivos principales:

  1. Evaluar la exactitud de la prueba de lipoarabinomanano en orina de flujo lateral (LF‐LAM) para el diagnóstico de la tuberculosis activa en adultos con pruebas positivas para el VIH y signos y síntomas de tuberculosis.

  2. Evaluar la exactitud de la LF‐LAM para el diagnóstico de la tuberculosis activa en adultos con pruebas positivas para el VIH, independientemente de los signos y síntomas de la tuberculosis (es decir, participantes no seleccionados, sin considerar ni evaluar los signos y síntomas de la tuberculosis).

Para estimar la exactitud en los individuos con pruebas positivas para el VIH y signos y síntomas de tuberculosis (objetivo 1), se combinaron los estudios en los que la presentación con signos y síntomas que sugieren la presencia de tuberculosis fue un criterio de inclusión, los cuales se denominaron "Estudios con participantes sintomáticos". Para estimar la exactitud en adultos con pruebas positivas para el VIH independientemente de los signos y síntomas de la tuberculosis (Objetivo 2), se combinaron los estudios que consideraron a todos los individuos con pruebas positivas para el VIH elegibles para participar, con la inclusión de individuos con síntomas de tuberculosis y de individuos sin síntomas de la misma, a los que se hace referencia como "Estudios con participantes no seleccionados". Estos estudios reclutaron participantes sin evaluar ni considerar los signos o síntomas específicos de la tuberculosis.

Objetivos secundarios

El objetivo secundario fue investigar las posibles fuentes de heterogeneidad en la exactitud de la prueba, incluido el contexto clínico, el recuento de células CD4 y la prevalencia de la tuberculosis en los estudios.

Métodos

available in

Criterios de inclusión de estudios para esta revisión

Tipos de estudios

Se incluyeron los estudios primarios que evaluaban la exactitud diagnóstica de la prueba LF‐LAM en orina para la detección de la tuberculosis activa en pacientes que conviven con el VIH y comparaban los resultados de la prueba índice con un estándar de referencia microbiológico definido. Se incluyeron los estudios de los que era posible extraer los valores positivos verdaderos (PV), positivos falsos (PF), negativos verdaderos (NV) y negativos falsos (NF).

Los estudios de diagnóstico de la tuberculosis son en gran medida de diseño transversal, aunque pueden incluir algún seguimiento clínico como parte de la clasificación de los pacientes. Se incluyeron estudios transversales y estudios observacionales de cohortes. Además, se incluyeron ensayos controlados aleatorizados que evaluaban el uso de la prueba índice en relación con los resultados de salud de los pacientes, pero que también informaban de la sensibilidad y la especificidad. Aunque el diseño del estudio fue un ensayo aleatorizado con el objetivo de determinar la repercusión de la prueba sobre los resultados los participantes, el diseño del estudio fue transversal para determinar la exactitud diagnóstica de la prueba índice en esta revisión. Se excluyeron los estudios de casos y controles y otros diseños de estudio. Se excluyeron los datos informados solo como resúmenes, revisiones, comentarios y notas editoriales. No se incluyeron estudios no publicados.

Participantes

Los pacientes que conviven con el VIH tienen un mayor riesgo de tuberculosis y pueden presentarse a la consulta con síntomas de tuberculosis, aunque también pueden ser asintomáticos o tener síntomas que no se asocian habitualmente con la tuberculosis. Se incluyó a participantes adultos (a los efectos de la vigilancia de la tuberculosis se considera "adulto" a los individuos a partir de 15 años de edad) y con pruebas positivas para el VIH. Se incluyeron los estudios en los que había sospecha de tuberculosis entre los participantes del estudio sobre la base de la presencia de signos y síntomas compatibles con la tuberculosis (estudios con participantes sintomáticos), así como estudios que incluían a participantes que se presentaron a la consulta para recibir atención médica independientemente de los signos y síntomas de tuberculosis (estudios con participantes no seleccionados). Los signos y los síntomas de la tuberculosis incluyen: tos, fiebre, pérdida de peso y sudores nocturnos. Cuando se conocía que los participantes tenían tuberculosis activa y que tomaban fármacos antituberculosos, los mismos no fueron incluidos.

Pruebas índice

Se incluyeron los estudios que evaluaban la prueba de lipoarabinomanano en orina de flujo lateral (LF‐LAM) Alere Determine™ TB LAM Ag (Abbott, Palatine, IL, EE.UU., anteriormente Alere Inc., Waltham, MA, EE.UU.) en muestras de orina. En mayo de 2019 la prueba Alere Determine™ TB LAM Ag era la única prueba LF‐LAM disponible comercialmente que se había evaluado en estudios publicados.

Se incluyeron los estudios que evaluaban la prueba en el umbral de positividad recomendado por el fabricante, es decir, grado 1 y superior, en la tarjeta con la escala de referencia actualizada, con cuatro intensidades de banda calificadas en una escala de 1 a 4. Para los estudios que utilizaron la tarjeta de escala de referencia anterior con intensidades de banda calificadas en una escala de 1 a 5 se incluyeron los que evaluaron la prueba como grado 2 y superior, que corresponde al umbral de positividad recomendado actualmente. Se excluyeron los estudios que no utilizaron un umbral de positividad correspondiente a las recomendaciones del fabricante. Los resultados que resumen la exactitud diagnóstica en umbrales más antiguos (grado 1 en una escala de 1 a 5) se pueden encontrar en la revisión original (Shah 2016).

Enfermedades de interés

La enfermedad de interés fue la tuberculosis activa, que incluye la tuberculosis pulmonar y la tuberculosis extrapulmonar.

Estándares de referencia

Se requirió que los estudios diagnosticaran la tuberculosis mediante el uso del siguiente estándar de referencia microbiológico.

  • La "tuberculosis" se define como un resultado positivo para la M tuberculosis en el cultivo o la NAAT.

  • La "ausencia de tuberculosis" se define como un resultado negativo para la M tuberculosis en el cultivo y la NAAT (si se realizara).

Las pruebas NAAT incluyeron: Enhanced Amplified Mycobacterium Tuberculosis Direct Test (E‐MTD, Gen‐Probe, San Diego, EE.UU.); Amplicor Mycobacterium Tuberculosis Test (Amplicor, Roche Diagnostics, Basel, Switzerland); COBAS® TaqMan® MTB Test (Roche Diagnostics); GenoType MTBDRplus (HAIN Lifesciences, Nehren, Alemania); prueba Xpert® MTB/RIF (Cepheid, Sunnyvale, EE.UU.); y Xpert® MTB/RIF Ultra.

Se consideró un estándar de referencia de mayor calidad aquel en el que se evaluaban dos tipos de muestras o más para el diagnóstico de la tuberculosis en todos los participantes como parte de un algoritmo de estudio estandarizado. Se consideró como estándar de referencia de menor calidad aquel en el que solo se evaluó un tipo de muestra para el diagnóstico de la tuberculosis, o cuando no se definió un algoritmo que garantizara un enfoque estandarizado para la recolección de las muestras y las pruebas.

Un estándar de referencia microbiológico, principalmente el cultivo, se considera el mejor estándar de referencia. Se esperó que todos los estudios obtuvieran especímenes de esputo y que algunos estudios obtuvieran especímenes adicionales para el cultivo. Sin embargo, la principal preocupación en cuanto a la posibilidad de confiar solamente en el cultivo de esputo es que el diagnóstico de la tuberculosis se puede pasar por alto por las siguientes razones: los pacientes que conviven con el VIH pueden no ser capaces de proporcionar muestras de esputo de calidad suficiente; la carga bacilar del esputo es típicamente baja en los pacientes que conviven con el VIH; y una proporción considerable de pacientes con tuberculosis asociada con el VIH no pueden producir esputo en absoluto (Lawn 2013), o padecen de tuberculosis extrapulmonar sin tuberculosis pulmonar. Este hecho significa que los PV de la prueba índice pueden ser clasificados de forma errónea como PF mediante el cultivo de esputo. Por lo tanto, al evaluar la LAM‐FL en lo que se refiere al cultivo de esputo, la cantidad de PF (clasificados como positivos de acuerdo a la prueba índice y como negativos de acuerdo a la prueba de referencia) puede aumentar y puede subestimarse la especificidad de la LAM‐FL (Lawn 2015). Esta clasificación errónea también puede dar lugar a la subestimación de la sensibilidad. El aumento de la sensibilidad del estándar de referencia mediante la evaluación de varias muestras, incluida la evaluación de las muestras de sitios de la enfermedad para la tuberculosis extrapulmonar, puede reducir el número de casos de tuberculosis clasificados incorrectamente como "sin tuberculosis" mediante el cultivo o la NAAT, si se realizaran.

En la revisión Cochrane original, se consideró de forma adicional un "estándar de referencia microbiológico y clínico compuesto" ya que se reconoce que los estándares de referencia microbiológicos por sí solos pueden no detectar la tuberculosis en pacientes con tuberculosis. Sin embargo, la revisión original encontró relativamente pocos datos del uso de un estándar de referencia compuesto, encontró heterogeneidad en la definición y aplicación de los estándares de referencia compuestos, y encontró un impacto relativamente modesto en las estimaciones agrupadas de la sensibilidad y la especificidad al comparar los estándares de referencia microbiológicos y compuestos. Los resultados que evalúan la exactitud diagnóstica frente a un estándar de referencia compuesto se pueden encontrar en la revisión original (Shah 2016).

Debido a las limitaciones del estándar de referencia se podría haber considerado realizar un análisis de clases latentes (Chu 2009; Kohli 2018). Sin embargo, no hay datos disponibles a nivel del paciente sobre el tipo de muestra y el LAM no es específico del sitio, lo que significa que un LAM positivo por sí solo no establece si el paciente tiene tuberculosis pulmonar o extrapulmonar.

Métodos de búsqueda para la identificación de los estudios

We attempted to identify all relevant studies regardless of language or publication status (published, unpublished, in press, and ongoing). As mentioned, we only included published studies in this review.

Búsquedas electrónicas

We performed literature searches up to 11 May 2018 in the following databases using the search terms reported in Appendix 4: the Cochrane Infectious Diseases Group Specialized Register; MEDLINE (PubMed, from 1966); Embase (OVID, from 1947); Science Citation Index Expanded (SCI‐EXPANDED, from 1900), Conference Proceedings Citation Index‐ Science (CPCI‐S, from 1900), and BIOSIS Previews (from 1926), all three using the Web of Science platform; LILACS (BIREME, from 1982); and SCOPUS (from 1995). We also searched Clinicaltrials.gov and the search portal of the WHO International Clinical Trials Registry Platform (WHO ICTRP, www.who.int/trialsearch) to identify ongoing trials, and ProQuest Dissertations & Theses A&l (from 1861) to identify relevant dissertations. We included search results from the original review and re‐evaluated previously included studies to determine if the studies met the refined inclusion criteria.

Búsqueda de otros recursos

We further examined reference lists of relevant reviews and studies and searched the WHO websites.

Obtención y análisis de los datos

Selección de los estudios

We used Covidence systematic review software to manage the selection of studies (Covidence 2017). Two review authors (MS and SB) independently examined all titles and abstracts identified from the electronic search to determine potentially eligible studies. We obtained the full‐text articles of these potentially eligible studies and the same two review authors independently assessed inclusion based on predefined inclusion and exclusion criteria. We resolved disagreements through discussion and, if necessary, consulted a third review author (KRS). We included studies from the original review if still eligible according to the predefined eligibility criteria. We maintained a list of excluded studies and the reasons for exclusion, and recorded these details in the Characteristics of excluded studies table and we prepared a PRISMA diagram.

Extracción y manejo de los datos

We developed a standardized data extraction form and piloted the form on two of the included studies. Based on the pilot, we finalized the form (Appendix 5). Then two review authors (MS and SB) independently extracted data from each included study on the following characteristics.

  • Author, publication year, study design, country/countries, clinical setting (outpatient or inpatient).

  • Participants: age, gender, HIV‐status, CD4 count, tuberculosis history, clinical status (asymptomatic, symptomatic).

  • Quality Assessment of Diagnostic Accuracy Studies‐2 (QUADAS‐2) items.

  • Cut‐off used for determining a positive index test result and the reference card used.

  • Samples collected (sputum and/or extrapulmonary samples).

  • Reference standard(s).

  • The number of tuberculosis cases in the study.

  • Number of TP, FN, FP, and TN values.

  • Missing or unavailable test results.

We assigned country income status (high income, upper‐ and lower‐middle income, and low income) as classified by the World Bank (World Bank 2018). In addition, we classified a country as being high burden or not high burden for tuberculosis/HIV according to the post‐2015 era classification by the WHO (WHO Global Tuberculosis Report 2018). For studies that included both participants with HIV and without HIV infection, we extracted data only for participants with HIV. We contacted study authors for clarifications on the LF‐LAM positivity threshold used if data were missing.

We used REDCap electronic data capture tools (Harris 2009) hosted at OPEN, Odense Patient data Explorative Network, Odense University Hospital, Odense, Denmark (SDU Open) to collect and manage study data. REDCap (Research Electronic Data Capture) is a secure, web‐based application designed to support data capture for research studies, providing: 1) an intuitive interface for validated data entry; 2) audit trails for tracking data manipulation and export procedures; 3) automated export procedures for seamless downloads to common statistical packages; and 4) procedures for importing data from external sources. With regard to the use of REDCap, the content in this review is solely the responsibility of the authors.

Evaluación de la calidad metodológica

We used the QUADAS‐2 tool tailored to this review to assess the quality of the included studies (Whiting 2011; Appendix 6). QUADAS‐2 consists of four domains: patient selection, index test, reference standard, and flow and timing (flow and timing domain includes differential verification of tuberculosis status for study participants). We assessed all domains for risk of bias and the first three domains for concerns regarding applicability. As recommended, we first developed the guidance on how to appraise the questions in each domain. Then, one review author (SB) piloted the tool with two of the included studies and finalized the QUADAS‐2 tool. Two review authors (MS and SB) independently completed the QUADAS‐2 assessment. We resolved disagreements through discussion or consulted a third review author (KRS). We present the results of this quality assessment in the text, tables, and graphs.

Análisis estadístico y síntesis de los datos

We performed descriptive analyses of the characteristics of the included studies using Stata 15 (StataCorp 2017), and presented key study characteristics in the ‘Characteristics of included studies' table. We used the number of TPs, FPs, FNs, and TNs to calculate the individual study estimates of sensitivity and specificity and their 95% confidence intervals (CIs). We presented individual study results graphically by plotting the estimates of sensitivity and specificity (and their 95% CIs) in forest plots using Review Manager 5 (RevMan 5) (Review Manager 2014).

We presented results at the current manufacturer reference scale card for test interpretation, with band intensities graded 1 to 4, and considered all test results at grade 1 and above as positive. The prior reference scale card with five band intensities was used in the original Cochrane Review with grade 2 considered as positivity threshold that corresponds to the current grade 1 band intensity (Appendix 2). The original review also included several analyses at grade 1 which is no longer recommended for determining test positivity. To allow consistent comparisons, we converted results from older studies that used the ‘grade 2’ threshold and treated these as ‘grade 1’ in the updated review. As such, analyses labelled at ‘grade 2’ in the original Cochrane Review are in this review considered according to the new manufacturer reference card as ‘grade 1’. Studies in the original review that used the ‘grade 1’ threshold on the prior reference card were not included as this threshold is no longer recommended for determining test positivity.

We grouped the studies evaluating LF‐LAM for: (I) diagnosis of tuberculosis in HIV‐positive people with signs and symptoms of tuberculosis i.e. ‘Studies with symptomatic participants' and (II) diagnosis of tuberculosis in HIV‐positive people, irrespective of signs and symptoms of tuberculosis i.e. ‘Studies with unselected participants'.

When data were sufficient, we carried out meta‐analyses to estimate LF‐LAM pooled sensitivity and specificity with a bivariate random‐effects model (Chu 2006; Reitsma 2005). This approach allowed us to calculate pooled sensitivity and specificity while dealing with potential sources of variation caused by: (1) imprecision of sensitivity and specificity estimates within individual studies; (2) correlation between sensitivity and specificity across studies; and (3) variation in sensitivity and specificity between studies.

We estimated all models using a Bayesian approach implemented using OpenBUGS (Lunn 2009). Under the Bayesian approach, all unknown parameters must be provided a prior distribution that defines the range of possible values of the parameter and the weight of each of those values, based on information external to the data. Because most meta‐analyses involved few studies (eight or less), which could lead the model to be just identified, we chose to use low‐information prior distributions for most parameters and a more informative prior on the between‐study standard deviations which are particularly sensible in meta‐analyses with few studies (Spiegelhalter 2004).

We defined prior distributions on the log‐odds scale over the pooled sensitivity and specificity parameters, their corresponding between‐study standard deviations (SDs) and the correlation between the sensitivities and specificities across studies. For the pooled log odds of the sensitivity or log odds of the specificity, we used a normal prior distribution with mean 0 and a variance of 4 (or a precision of 0.25). This corresponds to a roughly uniform distribution over the pooled sensitivity and pooled specificity on the probability scale. The 2.5% and 97.5% prior distribution quantiles for the pooled sensitivity or pooled specificity are 2.0% and 98.0%, slightly wider than for a standard normal distribution. For the between‐study precision we used a gamma distribution with a shape parameter of two and rate parameter of 0.5. This corresponds to a 95% prior credible interval (CrI) for the between‐study SD in the log odds of sensitivity or log odds of specificity ranging from roughly 0.29 to 1.44, corresponding to moderate to high values of between‐study heterogeneity. The resulting median 2.5% and 97.5% prior distribution quantiles for the predicted sensitivity or predicted specificity are 0.1% and 99.9%. Covariance terms followed a uniform prior distribution whose upper and lower limits were determined by the sensitivity of the two tests. We have summarized the models we used (including the prior distributions) and the OpenBUGS programs we used to estimate them in Appendix 7.

To study the sensitivity of our results to the choice of prior distributions given above, we considered alternative prior distributions that were less informative, which allowed a wider range of possible values. We increased the variance of the normal distributions over the pooled log odds of the sensitivity or specificity to 100. We used a uniform prior distribution ranging from zero to three over the between‐study SD on the log odds scale. We found that the pooled estimates remained roughly the same with these alternative priors, though the posterior CrIs were wider, as expected. We combined information from the prior distribution with the likelihood of the observed data, in accordance with Bayes’ theorem in the OpenBUGS program, which resulted in a sample from the posterior distribution of each unknown parameter. Using this sample, we calculated various descriptive statistics of interest. We estimated the median pooled sensitivity and specificity and their 95% CrI. The median or the 50% quantile is the value below which 50% of the posterior sample lies. We reported the median because the posterior distributions of some parameters may be skewed, and the median would be considered a better point estimate of the unknown parameter than the mean in such cases. The 95% CrI is the Bayesian equivalent of the classical (frequentist) 95% confidence interval (CI) (we indicated 95% CI for individual study estimates and 95% CrI for pooled study estimates as appropriate). The 95% CrI may be interpreted as an interval that has a 95% probability of capturing the true value of the unknown parameter given the observed data and the prior information.

We also estimated the predicted sensitivity and specificity in a future study together with their 95% CrIs. The predicted estimate is our best guess for the estimate in a future study and is the same as the pooled estimate. The CrIs, however, may be different. These values were derived from the predicted region typically reported in a bivariate meta‐analysis plot. If there is no heterogeneity between the included studies, the CrI around the predicted estimate will be the same as the CrI around the pooled estimate. On the other hand, if there is considerable heterogeneity between studies, the CrI around the predicted estimate will be much wider than the CrI around the pooled estimate. We generated summary plots displaying the individual study estimates for sensitivity and specificity, the pooled estimate for sensitivity and specificity with the 95% credible region and the 95% prediction region using R (R Statistical Computing 2018).

In our original review we evaluated the incremental change in sensitivity and specificity when combining LF‐LAM with smear microscopy or Xpert MTB/RIF (Shah 2016). We did not undertake analysis of incremental benefit in the current review as it was beyond the scope of this review, and data within published manuscripts were limited.

Approach to uninterpretable LF‐LAM results

We excluded uninterpretable test results from the meta‐analyses of sensitivity and specificity, but we reported the number and proportion of uninterpretable test results from each study when such data were available.

Investigación de la heterogeneidad

Initially, we investigated heterogeneity through visual examination of forest plots of sensitivities and specificities and through visual examination of the ROC plot of the raw data. When data were sufficient, we performed subgroup analyses with the following categorical covariates: clinical setting (inpatient versus outpatient); CD4 count (CD4 ≤ 200; CD4 ≤ 100; CD4 101‐200; CD4 > 200 and; CD4 > 100 cells per µL). To further investigate heterogeneity, we performed a subgroup analysis by the prevalence of tuberculosis in the studies and classified prevalence as greater than the median value versus less than or equal to the median value. We investigated heterogeneity separately for studies with symptomatic participants and studies with unselected participants. We generated the plots depicting the pooled results within CD4 count categories using R (R Statistical Computing 2018).

Análisis de sensibilidad

We performed sensitivity analyses by limiting inclusion in the meta‐analysis to the following.

  • Studies that avoided inappropriate exclusions, for example, studies that included participants who could not produce sputum. For this analysis we included studies that we scored as ‘yes' for the QUADAS‐2 question, "Did the study avoid inappropriate exclusions?" (low risk of bias for participant selection).

  • Studies with a higher quality reference standard, for example studies that included two or more specimen types. For this analysis, we included studies that we scored as ‘yes’ for the QUADAS‐2 question, “Is the reference standard likely to correctly classify the target condition?” (low risk of bias for the reference standard).

  • Studies that used only fresh urine specimens for LAM testing.

  • Studies initially categorized as ‘studies among unselected participants’ that included more than 80% of symptomatic participants were re‐categorized as ‘studies with symptomatic participants’. We conducted this analysis to explore the possibility that these studies represented a comparable population to the studies of symptomatic participants even though participants were not explicitly enrolled in the study on the basis of specific tuberculosis symptoms.

Evaluación del sesgo de notificación

We did not carry out a formal assessment of publication bias using methods such as funnel plots or regression tests because such techniques have not been helpful for diagnostic test accuracy studies (Macaskill 2010).

Assessment of the certainty of the evidence

We assessed the certainty of evidence as recommended using the GRADE approach (Balshem 2011; Schünemann 2008; Schünemann 2016). As recommended, we rated the certainty of evidence as either high (not downgraded), moderate (downgraded by one level), low (downgraded by two levels), or very low (downgraded by more than two levels) based on five domains: risk of bias, indirectness, inconsistency, imprecision, and publication bias. For each outcome, the certainty of evidence started as high when there were high‐quality observational studies (cross‐sectional or cohort studies) that enrolled participants with diagnostic uncertainty. If we found a reason for downgrading, we used our judgement to classify the reason as either serious (downgraded by one level) or very serious (downgraded by two levels).

Four review authors (SB, MS, ND, and KRS) discussed judgments and applied GRADE in the following way.

  • Risk of bias: we used QUADAS‐2 to assess risk of bias.

  • Indirectness: we used QUADAS‐2 for concerns of applicability and looked for important differences between the populations studied (for example, in the spectrum of disease), the setting, and index test and asked are differences sufficient to lower certainty in results?

  • Inconsistency: GRADE recommends downgrading for unexplained inconsistency in sensitivity and specificity estimates. We carried out pre‐specified analyses to investigate potential sources of heterogeneity and did not downgrade when we felt we could explain inconsistency in the accuracy estimates.

  • Imprecision: we considered a precise estimate to be one that would allow a clinically meaningful decision. We considered the width of the CrI, and asked ourselves, “Would we make a different decision if the lower or upper boundary of the CrI represented the truth?” In addition, we worked out projected ranges for TP, FN, TN, and FP for a given prevalence of tuberculosis and made judgements on imprecision from these calculations.

  • Publication bias: we rated publication bias as undetected (not serious) for several reasons including the comprehensiveness of the literature search and extensive outreach to tuberculosis researchers to identify studies.

Results

Results of the search

We identified 15 unique studies that met the inclusion criteria of this review. We included data from six published manuscripts from the original WHO Guidelines (WHO Lipoarabinomannan Policy Guidance 2015), and Cochrane Review (Shah 2016) that met the refined inclusion criteria (Bjerrum 2015; Drain 2015a; LaCourse 2016; Nakiyingi 2014; Peter 2012a; Peter 2015), and nine new studies identified in the updated search (Drain 2016; Floridia 2017; Hanifa 2016; Huerga 2017; Juma 2017; Lawn 2017; Pandie 2016; Peter 2016; Thit 2017). Of six previously included studies, three were excluded because they did not use the currently recommended threshold for test positivity (Balcha 2014; Drain 2014a; Lawn 2012a); one previously included abstract (Lawn 2014) was added as an updated published manuscript (Lawn 2017); one abstract remained unpublished (Andrews 2014); and one abstract was published but did not provide diagnostic accuracy data (Drain 2014b). Eight studies evaluated the accuracy of LF‐LAM for tuberculosis diagnosis in participants with signs and symptoms suggestive of tuberculosis. Seven studies evaluated the accuracy of LF‐LAM for diagnosis of unselected participants without assessment of symptoms (i.e. patients may or may not have had tuberculosis signs and symptoms at enrolment).

Figure 1 shows the flow of studies in the review. We listed the excluded studies and the reasons for their exclusion in the ‘Characteristics of excluded studies' section. All studies were written in English.


Study flow diagram

Study flow diagram

Methodological quality of included studies

Risk of bias and applicability concerns for each of the 15 included studies is shown in Figure 2; Figure 3.


Studies with symptomatic participants ‐ Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.

Studies with symptomatic participants ‐ Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.


Studies with unselected participants ‐ Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.

Studies with unselected participants ‐ Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.

Studies with symptomatic participants

Eight studies were included that evaluated LF‐LAM for tuberculosis diagnosis among symptomatic participants suspected of tuberculosis. Risk of bias and applicability concerns for the studies with symptomatic participants are shown in Figure 2.

In the patient selection domain, we considered six studies (75%) to be at high risk of bias because: (1) the study excluded all smear‐positive participants (Drain 2016); (2) the studies excluded participants who could not expectorate or produce sputum despite sputum induction (Drain 2016; Nakiyingi 2014; Peter 2015); (3) the study excluded participants from analysis if, in the absence of a positive reference standard result, there was one sample with no Xpert MTB/RIF result or contaminated result (culture) (Huerga 2017); (4) the study only included patients suspected of extrapulmonary tuberculosis and excluded patients suspected of pulmonary tuberculosis (Juma 2017); (5) the study only included participants with pericardial effusion and suspected tuberculosis and excluded participants suspected of other forms of tuberculosis (Pandie 2016). All studies were cross‐sectional, cohort or randomized controlled studies. Regarding applicability, seven studies (88%) had low concern in the patient selection domain because the studies included the appropriate participants and settings. We judged one study (12%) to have high concern for applicability as the participants did not resemble people with presumed HIV/tuberculosis co‐infection i.e. participants were smear‐negative HIV‐positive and HIV‐negative patients with a Karnofsky Performance score < 50 (Drain 2016).

In the index test domain, we judged one study (12%) at high risk of bias as the study used grade 2 (on the updated reference scale card) as the test positivity threshold, as opposed to the current manufacturer recommendation to use grade 1 to define test positivity (Juma 2017). We also considered this study to have high concern of applicability because the test procedure was inconsistent with the manufacturers' recommendations (Juma 2017). The remaining studies all used the recommended threshold for positivity and interpreted the test without knowledge of the results of the reference standard, and we considered them to have low concern for applicability.

In the reference standard domain, we considered seven studies (88%) to be at high risk of bias because: (1) the studies did not include testing of any extrapulmonary specimens (Drain 2016, Peter 2015); (2) the study did not include testing of any respiratory samples (Juma 2017); (3) the study only tested respiratory samples for some of the participants (Pandie 2016); (4) the study only tested extrapulmonary specimens in addition to respiratory samples for some of the participants (Huerga 2017); (5) health providers selected the sites for testing based on their own clinical suspicion (Peter 2012a; Peter 2016). We deemed three studies at high concern for applicability as they lacked a study or protocol directed testing (Pandie 2016; Peter 2012a; Peter 2016). In these studies, health providers selected the sites for testing based on their own clinical suspicion, and it was unclear if their choice of reference standard would correctly classify tuberculosis.

In the flow and timing domain, we considered four studies (50%) to be at high risk of bias because not all participants received the same reference standard (Huerga 2017; Peter 2012a; Peter 2016), or because not all participants were included in the two‐by‐two tables ( Huerga 2017; Pandie 2016). We judged the remaining studies to be at low risk of bias because all participants received the index test, the same reference standard and no participants were excluded from the two‐by‐two table.

Studies with unselected participants

Seven studies contributed data for the purpose of evaluating LF‐LAM for tuberculosis diagnosis among unselected participants who may or may not have tuberculosis signs or symptoms. Risk of bias and applicability concerns for the studies with symptomatic participants are shown in Figure 3.

In the patient selection domain, we considered four studies (57%) to be at high risk of bias because these studies excluded participants who could not expectorate or produce sputum samples (Bjerrum 2015; Drain 2015a; Floridia 2017; LaCourse 2016). All studies were cross‐sectional or cohort studies. Regarding applicability, we judged that all studies (100%) included the appropriate participants and settings.

In the index test domain, we considered all studies at low risk of bias as all studies used LF‐LAM, pre‐specified the grade used for positivity, and interpreted the test at the recommended positivity threshold without knowledge of the results of the reference standard. We considered the test conduct and interpretation in all studies to be applicable.

In the reference standard domain, we considered five studies (71%) to be at high risk of bias because these studies did not include microbiological testing on extrapulmonary specimens (Bjerrum 2015; Drain 2015a; Floridia 2017; LaCourse 2016; Thit 2017). Thit 2017 also did not report if the reference standard results were interpreted without knowledge of the index test result. One study (Thit 2017) did not report if they speciated mycobacteria isolates and was judged to have unclear concern for applicability. We judged the remaining six studies to be of low concern in terms of applicability.

In the flow and timing domain, we considered two studies (29%) to be at high risk of bias because the studies collected specimens for index and reference standard tests up to six months apart (Hanifa 2016; Thit 2017), and Hanifa 2016 excluded clinical tuberculosis cases from analysis. We considered the remaining five studies (71%) to be at low risk of bias because all participants received the index test and the same reference standard, and no participants enrolled were excluded from the two‐by‐two table.

Findings

The 15 included studies involved 6814 participants, 1761 (26%) with tuberculosis. Eight studies evaluated the accuracy of LF‐LAM for tuberculosis diagnosis in participants with signs and symptoms suggestive of tuberculosis involving 3449 participants, 1277 (37%) with tuberculosis. Seven studies evaluated the accuracy of LF‐LAM for diagnosis of unselected participants that may or may not have had tuberculosis signs and symptoms at enrolment involving 3365 participants, 432 (13%) with tuberculosis.

All studies were performed in countries with a high tuberculosis/HIV burden (WHO Global Tuberculosis Report 2018), and classified as low‐income or middle‐income countries (World Bank 2018). We noted substantial differences in the studies for the following characteristics: type of population (‘studies with symptomatic participants' and ‘studies with unselected participants'); setting (inpatients versus outpatients); median CD4 cell count; tuberculosis prevalence; inclusion and exclusion of participants based on whether or not they could produce sputa; and whether patients were evaluated for pulmonary tuberculosis, extrapulmonary tuberculosis, or both. The key study characteristics are summarized in Table 1 (Summary characteristics of included studies) and in Characteristics of included studies.

Open in table viewer
Table 1. Summary characteristics of included studies

Study

Participants (% symptom)

Setting

Median CD4 cell count per µL (IQR)

TB prevalence % (n/N)

Did the study avoid inappropriate exclusion?

Specimens collected

High‐quality reference standarda

Unique study characteristics

HIV‐positive adults with signs and symptoms of TB

Drain 2016

Symptomatic:
Two of four TB‐related symptoms (cough, fever weight loss, night sweat) for > 2 weeks; smear microscopy negative x 2

Outpatient

168 (89 to 256)

63%
(57/90)

No

Pulmonary samples

No

Adults (> 18 years); HIV positive (93.2%); targeting a relatively well outpatient population; Karnofsky performance score > 50

Huerga 2017

Symptomatic:

Cough > 2 weeks or any cough and one of weight loss, night sweats or fever; severely ill; CD4< 200 or BMI below 17

Outpatients (33%); Inpatients (67%)

109 (43 to 214)

57% (156/275)

No

Pulmonary samples; urine Xpert only for patients without sputum available

No

Adults (> 15 years); LAM‐guided treatment; excluded many participants from analysisb

Juma 2017

Symptomatic:

Suggestive of extrapulmonary TB, not specified

Inpatients

Not stated

33%
(29/67)

No

Extrapulmonary samples only, no sputum samples

No

Adults (> 14 years), HIV‐positive (68%); excluded patients with concomitants active pulmonary TB

Nakiyingi 2014

Symptomatic:

Any of cough, fever weight loss, night sweat

Outpatients (45%); Inpatients (55%)

152 (41 to 337)

37%
(367/997)

No

Pulmonary samples; Blood culture for all

Yes

Adults (> 18 years); multisite; large sample size.

Pandie 2016

Symptomatic:

Presence of a pericardial effusion and suspected of pericardial TB

Inpatients

139
(81 to 249)

95%
(36/38)

No

Extrapulmonary samples (pericardial effusion); pulmonary samples for some

No

Adults (> 18 years); HIV‐positive (74%); excluded participants from analysis affecting specificityc

Peter 2012a

Symptomatic:

Any of cough, fever weight loss, night sweat

Inpatients

90
(47 to 197)

48%
(116/241)

Yes

Clinically relevant pulmonary samples; clinically relevant extrapulmonary samples. No study defined algorithm.

No

Adults (> 18 years); multisite; TB diagnostic work‐up was not standardized but up to clinical judgements

Peter 2015

Symptomatic:

Any of cough, fever weight loss, night sweat

Outpatients

210
(103 to 375)

32%
(181/569)

No

Pulmonary samples

No

Adults (> 18 years); multisite; nested within a randomized, parallel‐arm trial.

Peter 2016

Symptomatic:

Any of cough, fever weight loss, night sweat

Inpatients

81

(26 to 198)

29%
(342/1172)

Yes

Pulmonary samples; clinically relevant extrapulmonary samples. No study defined algorithm.

No

Adults (> 18 years); multisite; LAM arm of a randomized controlled trial.

HIV‐positive adults irrespective of signs and symptoms of TB

Bjerrum 2015

Unselected:

91% symptomatic

Outpatients (85%); Inpatients (15%)

127
(35 to 256)

12%
(55/469)

No

Pulmonary samples

No

Adults (> 18 years); majority symptomatic.

Drain 2015a

Unselected:

proportion symptomatic not stated

Outpatient

248
(107 to 379)

17%
(54/320)

No

Pulmonary samples

No

Adults (> 18 years)

Floridia 2017

Unselected:

34% symptomatic

Outpatient

278
(142 to 395)

9%
(90/972)

No

Pulmonary samples

No

Adults (> 15 years). LAM‐guided treatment.

Hanifa 2016

Unselected:

53% symptomatic

Outpatient

111
(56 to 161)

9%
(40/408)

Yes

Pulmonary samples; blood culture for all

Yes

Adults (> 18 years); CD4 < 200; reference standard included any sample taken within six months from enrolment.

LaCourse 2016

Unselected:

19% symptomatic

Outpatient

437
(342 to 565)

1%
(3/266)

No

Pulmonary samples

No

Pregnant women (> 16 years) attending ANC; healthy population; one person with CD4< 400; Few TB cases (n = 3).

Lawn 2017

Unselected:

91% symptomatic

Inpatients

149
(55‐312)

33%
(139/413)

Yes

Pulmonary samples; Blood culture for all; Clinically relevant extrapulmonary samples

Yes

Adults (> 18 years). Included many samples from different sites

Thit 2017

Unselected:

33% symptomatic

Outpatients (90%); Inpatients (10%)

270
(128 to 443)

10%
(54/517)

Yes

Pulmonary samples

No

Conducted in Myanmar. Adults (median age 34). Reference standard included samples taken within six months from enrolment.

Abbreviations: LF‐LAM: lateral flow urine lipoarabinomannan assay (Alere Determine™ TB lipoarabinomannan assay); ANC: antenatal clinic; BMI: body mass index; IQR: interquartile range; TB: tuberculosis; Xpert: Xpert MTB/RIF
aFor a microbiological reference standard, we considered a higher quality reference standard to be one in which two or more specimen types were evaluated for TB diagnosis in all participants as part of a defined standardized study algorithm.
bHuerga 2017 excluded participants from analysis if missing Xpert results or culture contaminated for any of the samples in the absence of a positive result; overall samples size 474 (156 with TB); 275 included in analysis (156 with TB).
cPandie 2016 excluded a large number of non‐TB participants from analysis; Overall samples size 102 (36 with TB); 38 included for analysis (36 TB cases).

Table 2 presents pooled sensitivity and specificity results for LF‐LAM grouped by the type of population, ‘studies among symptomatic participants' and ‘studies among unselected participants’.

Open in table viewer
Table 2. LF‐LAM pooled sensitivity and specificity for TB diagnosis, by study population

Type of analysis

Symptomatic participants

Unselected participants

Studies (total participants)

Participants with TB (%)

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Studies (total participants)

Participants with TB (%)

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Overall accuracy

8 studies

(3449)

1277

(37%)

42%

(31% to 55%)

91%

(85% to 95%)

7 studies

(3365)

432

(13%)

35%

(22% to 50%)

95%

(89% to 98%)

By setting

Inpatient

6 studies

(2253)

868

(39%)

52%
(40% to 64%)

87%
(78% to 93%)

3 studies

(537)

159

(30%)

62%
(41% to 83%)

84%
(48% to 96%)

Outpatient

4 studies

(1196)

409

(34%)

29%

(17% to 47%)

96%

(91% to 99%)

6 studies

(2828)

273

(10%)

31%

(18% to 47%)

95%

(87% to 99%)

By CD4 cell

CD4 > 200

3 studies

(738)

163

(22%)

16%
(8% to 31%)

94%
(81% to 97%)

1 studya

(156)

11

(7%)

Not applicable

Not applicable

CD4 ≤ 200

4 studies

(1825)

722

(40%)

45%
(31% to 61%)

89%
(77% to 94%)

2 studies

(706)

82

(12%)

26%
(9% to 56%)

96%
(87% to 98%)

CD4 > 100

4 studies

(1519)

425

(28%)

17%
(10% to 27%)

95%
(89% to 98%)

4 studies

(952)

115

(12%)

20%
(10% to 35%)

98%
(95% to 99%)

CD4 ≤ 100

4 studies

(1239)

512

(41%)

54%
(38% to 69%)

88%
(77% to 94%)

3 studies

(417)

130

(31%)

47%
(40% to 64%)

90%
(77% to 96%)

CD4 101‐199

4 studies

(586)

210

(36%)

24%
(14% to 38%)

90%
(77 to 96)

1 study

(103)b

13

(13%)

Not applicable

Not applicable

By CD4 and setting

CD4 ≤ 200

inpatients

2 studies

(1009)

348

(34%)

54%

(34% to 73%)

80%

(58% to 91%)

1 studyc

(54)

14

(26%)

Not applicable

Not applicable

CD4 ≤ 100

inpatients

2 studies

(734)

270

(37%)

61%

(40% to 78%)

81%

(61% to 91%)

2 studies

(200)

84

(42%)

57%

(33% to 79%)

90%

(69% to 97%)

CD4 101‐199

inpatients

2 studies

(275)

78

(28%)

32%

(16% to 57%)

81%

(55% to 92%)

1 studyd

(9)

4

(44%)

Not applicable

Not applicable

CD4 ≤ 200

outpatients

1 studyf

(249)

97

(39%)

Not applicable

Not applicable

2 studies

(652)

68

(10%)

21%

(8% to 48%)

96%

(89% to 99%)

CD4 ≤ 100

outpatients

1 studyg

(121)

48

(40%)

Not applicable

Not applicable

2 studies

(217)

46

(21%)

40%

(20 to 64)

87%

(68 to 94)

CD4 101‐199

outpatients

1 studyh

(128)

51

(40%)

Not applicable

Not applicable

1 studye

(94)

9

(10%)

Not applicable

Not applicable

Abbreviations: LF‐LAM: lateral flow urine lipoarabinomannan assay (Alere Determine™ TB lipoarabinomannan assay); Crl: credible interval; TB: tuberculosis.
aBjerrum 2015, Sensitivity 27% (6% to 61%); Specificity 99% (96% to 100%); bBjerrum 2015, Sensitivity 38% (14% to 68%); Specificity 99% (94% to 100%); cBjerrum 2015, Sensitivity 64% (35% to 87%); Specificity 82% (67% to 93%); dBjerrum 2015, Sensitivity 75% (19% to 99%); Specificity 100% (48% to 100%); eBjerrum 2015, Sensitivity 22% (3% to 60%); Specificity 99% (94% to 100%); fPeter 2015, Sensitivity 24% (16% to 33%); Specificity 94% (89% to 97%); gPeter 2015, Sensitivity 30% (18% to 46%); Specificity 93% (85% to 98%); hPeter 2015, Sensitivity 18% (8% to 31%); Specificity 95% (87% to 99%).

I. Diagnostic accuracy of LF‐LAM for tuberculosis diagnosis in HIV‐positive adults with signs and symptoms of tuberculosis

Of the 15 included studies, eight evaluated the accuracy of LF‐LAM for tuberculosis diagnosis in participants with signs and symptoms suggestive of tuberculosis (Drain 2016; Huerga 2017; Juma 2017; Nakiyingi 2014; Pandie 2016; Peter 2012a; Peter 2015; Peter 2016). The suggestive signs and symptoms of tuberculosis varied from study to study, as described in Table 1 and in Characteristics of included studies, but were often based on any of cough, fever, weight loss, or night sweats as per the WHO symptom screening rule WHO ICF 2011. The tuberculosis prevalence in the study population ranged from 29% to 63%. Two studies were conducted exclusively among patients with presumed extrapulmonary tuberculosis (Juma 2017; Pandie 2016). Four studies were conducted exclusively in an inpatient setting (Juma 2017; Pandie 2016; Peter 2012a; Peter 2016); two studies exclusively in an outpatient setting (Drain 2016; Peter 2015); and two studies in both inpatient and outpatient settings (Huerga 2017; Nakiyingi 2014). The median CD4 cell count ranged from 81 to 210 cells per µL across the eight studies, lower in studies evaluating inpatients (median CD4 between 81 to 139 cells per µL) compared to studies evaluating outpatients (median CD4 was 168 to 210 cells per µL). See Table 1 and Characteristics of included studies.

Primary analysis, LF‐LAM for tuberculosis in HIV‐positive adults with signs and symptoms of tuberculosis

For determining the overall accuracy of LF‐LAM in HIV‐positive adults with signs and symptoms of tuberculosis, eight studies provided data for 3449 participants, including 1277 (37%) with tuberculosis. Sensitivity estimates ranged from 23% to 68%, and specificity estimates from 75% to 100% (Figure 4).


Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among symptomatic participants. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among symptomatic participants. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Juma 2017 evaluated diagnostic accuracy for extrapulmonary tuberculosis (all forms) exclusively and had the highest sensitivity of 68%. Pandie 2016 evaluated accuracy for pericardial tuberculosis and found sensitivity of 33%. Sensitivity was lowest in the studies by Peter 2015 and Drain 2016 that both reported a sensitivity of 23%. Differences between these studies and the other studies in this analysis were the setting (outpatient only), focus on pulmonary tuberculosis (no extrapulmonary samples were taken), and exclusion of participants unable to produce sputum. In particular, Drain 2016 included smear‐negative participants with presumed tuberculosis and a small number of HIV‐negative participants. Drain 2016 further excluded participants with a low Karnofsky score in order to target relatively well outpatients, where smear‐negative tuberculosis is often seen. Specificity was lowest for Peter 2012a a study that included only inpatients and differed from other studies in that both sputum and non‐sputum‐based sampling was performed at the discretion of the attending clinical team and not study directed. Pandie 2016 reported the highest specificity of 100%. This study, as mentioned, differed from others by evaluating accuracy only for pericardial tuberculosis. The authors further excluded a number of participants in the analysis for unknown reasons and reported two true negatives and zero false positives that may have inflated specificity. The pooled sensitivity and specificity (95% credible interval (CrI)) were 42% (31% to 55%) and 91% (85% to 95%) (Table 2). Appendix 8 presents the pooled and predicted sensitivity and specificity estimates together with the credible and prediction regions for LF‐LAM for tuberculosis detection. Prediction intervals were very wide in all meta‐analysis models indicating between‐study heterogeneity (data not shown).

Uninterpretable index test results

Studies reported few uninterpretable test results. Peter 2012a reported that 1% to 2% of 423 tests remained ‘indeterminate' (defined as a broken band in the patient window) after repeat testing. Peter 2016 reported that 0.3% (3/1172) test results remained ‘invalid' after a repeat test (defined as no control band identified in the patient window or a broken/ incomplete band in the patient window). Peter 2015 reported that fewer than 1% of LF‐LAM strip tests failed on the first attempt and required a second strip to produce valid results. Four studies reported that a valid LF‐LAM result was obtained on the first attempt for all tests (Drain 2016; Huerga 2017; Juma 2017; Nakiyingi 2014), and one study did not provide information on uninterpretable tests (Pandie 2016).

Investigations of heterogeneity
LF‐LAM accuracy among symptomatic participants, stratified by setting

LF‐LAM accuracy in inpatient settings

Six studies were conducted among inpatients involving 2253 participants, 868 (39%) with tuberculosis (Huerga 2017; Juma 2017; Nakiyingi 2014; Pandie 2016; Peter 2012a; Peter 2016). Sensitivity estimates ranged from 33% to 69% and specificity estimates ranged from 75% to 100% (Figure 5). The highest sensitivity (69%) was reported by Huerga 2017 with a relatively low specificity (78%). This study enrolled inpatients with tuberculosis symptoms who had at least one of the following features: who were severely ill or who had CD4 < 200 cell per µL (median CD4 109) or who had a low body mass index (BMI). The study did not include microbiological or histological evaluation of extrapulmonary specimens for tuberculosis in their reference standard, which may have led to LAM‐positive participants with extrapulmonary tuberculosis being misclassified as ‘false‐positive’ and lowered specificity. Pandie 2016 reported the lowest sensitivity (33%) and a specificity of 100%. As mentioned, this study evaluated accuracy for pericardial tuberculosis and excluded participants from specificity analysis that may have affected the specificity estimate. The pooled sensitivity and specificity (95% CrI) among inpatients were 52% (40% to 64%) and 87% (78% to 93%) (Table 2).


Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among symptomatic participants, by health care setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. The individual studies are ordered by decreasing sensitivity. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among symptomatic participants, by health care setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. The individual studies are ordered by decreasing sensitivity. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

LF‐LAM accuracy in outpatient settings

Four studies were conducted among outpatients involving 1196 participants, 409 (34%) with tuberculosis (Drain 2016; Huerga 2017; Nakiyingi 2014;Peter 2015). Sensitivity estimates ranged from 18% to 58% and specificity estimates ranged from 93% to 99% (Figure 5). The highest sensitivity (58%) was reported by Huerga 2017 where outpatients included were severely ill, or had a CD4 < 200 cell per µL, or had a low BMI below 17 kg/m2. Among outpatients, pooled sensitivity and specificity were 29% (17% to 47%) and 96% (91% to 99%) (Table 2).

LF‐LAM accuracy among symptomatic participants, stratified by CD4 count

We included five studies in the analyses by CD4 count (Nakiyingi 2014; Peter 2012a; Peter 2015; Peter 2016). See Figure 6 and Figure 7.


Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies with symptomatic participants, stratified by CD4 (CD4 > 200 and CD4 ≤ 200; CD4 > 100 and CD4 ≤ 100). The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies with symptomatic participants, stratified by CD4 (CD4 > 200 and CD4 ≤ 200; CD4 > 100 and CD4 ≤ 100). The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).


Plot by CD4 of diagnostic accuracy in adults with signs and symptoms of tuberculosis.(A) Sensitivity by CD4 strata; (B) Specificity by CD4 strata. The circle represents the pooled estimates (median), with bars representing 95% credible intervals.

Plot by CD4 of diagnostic accuracy in adults with signs and symptoms of tuberculosis.

(A) Sensitivity by CD4 strata; (B) Specificity by CD4 strata. The circle represents the pooled estimates (median), with bars representing 95% credible intervals.

LF‐LAM accuracy stratified by CD4 > 200 cells per µL and ≤ 200 cells per µL

Three studies evaluated LF‐LAM in participants with CD4 > 200 cells per µL (Nakiyingi 2014; Peter 2012a; Peter 2016). Sensitivity estimates ranged from 9% to 27% and specificity estimates ranged from 83% to 99% (Figure 6). In the four studies that evaluated participants with CD4 ≤ 200 cells per µL, sensitivity estimates ranged from 24% to 58% and specificity estimates ranged from 72% to 95% (Nakiyingi 2014; Peter 2012a; Peter 2015; Peter 2016), (Figure 6). The pooled sensitivity (95% CrI) was higher among participants with CD4 ≤ 200 cells per µL at 45% (31% to 61%) (4 studies, 1825 participants, 40% with tuberculosis) versus 16% (8% to 31%) among those with CD4 > 200 cells per µL (3 studies, 738 participants, 22% with tuberculosis) (Table 2); a significant difference in pooled sensitivity (95% CrI) of ‐29% (‐47% to ‐9%). The pooled specificity was 89% (77% to 94%) for participants with CD4 ≤ 200 cells per µL and 94% (81% to 97%) for those with CD4 > 200 cells per µL (Table 2), a difference in pooled specificity of 5% (‐8% to 17%).

When we limited the analysis to studies involving inpatients with CD4 ≤ 200 cells per µL, the pooled sensitivity and specificity were 54% (34% to 73%) and 80% (58% to 91%) (2 studies, 1009 participants, 34% with tuberculosis) (Peter 2012a; Peter 2016). Only one study reported data for outpatients with CD4 ≤ 200 cells per µL (Peter 2015).

LF‐LAM accuracy stratified by CD4 > 100 cells per µL and ≤ 100 cells per µL

Four studies evaluated LF‐LAM in participants with CD4 > 100 cells per µL (Nakiyingi 2014; Pandie 2016; Peter 2015; Peter 2016). Sensitivity estimates ranged from 12% to 19% and specificity estimates ranged from 92% to 100% (Figure 6). In the five studies that evaluated participants with CD4 ≤ 100 cells per µL, sensitivity estimates ranged from 30% to 65% and specificity estimates ranged from 75% to 94% (Nakiyingi 2014; Pandie 2016; Peter 2012a; Peter 2015; Peter 2016). One study had no estimable specificity, as the authors reported zero true negatives (Pandie 2016). The pooled sensitivity (95% CrI) was higher among participants with CD4 ≤ 100 cells per µL at 54% (38% to 69%) (4 studies, 1239 participants, 41% with tuberculosis) versus 17% (10% to 27%), (4 studies, 1519 participants, 28% with tuberculosis) among those with CD4 > 100 cells per µL, a significant difference in pooled sensitivity of ‐37% (‐53% to ‐19%). The pooled specificity was 88% (77% to 94%) for participants with CD4 ≤ 100 cells per µL and 95% (89% to 98%) for those with CD4 > 100 cells per µL (Table 2), a difference in pooled specificity of 7% (‐1% to 18%).

When we limited the analysis to studies involving inpatients with CD4 ≤ 100 cells per µL (Peter 2012a; Peter 2016), the pooled sensitivity and specificity were 61% (40% to 78%) and 81% (61% to 91%). Only one study reported data for outpatients with CD4 ≤ 100 cells per µL (Peter 2015).

LF‐LAM accuracy stratified by CD4 strata

We observed that LF‐LAM pooled sensitivity increased as the degree of immunodeficiency increased, from 16% (8% to 31%) in patients with CD4 cell count >200 cells per μL; to 24% (14% to 38%) in patients with CD4 count between 101 to 199; to 54% (38% to 69%) in patients with CD4 ≤ 100 (Figure 7). Also, we observed that most participants contributing data for the CD4 ≤ 200 cells per µL stratum (1825 participants including 722 (40%) with tuberculosis) were participants with CD4 ≤ 100 cells per µL (1239 participants including 512 (41%) with tuberculosis) (Table 2).

LF‐LAM accuracy among symptomatic participants, stratified by tuberculosis prevalence

The median prevalence of tuberculosis in studies with symptomatic participants was 43% (interquartile range (IQR) 32% to 60%). In an analysis by tuberculosis prevalence, we found that pooled sensitivity and specificity for symptomatic participants in settings with tuberculosis prevalence of greater than 43% were 44% (27% to 62%) and 86% (73% to 94%) and 39% (21% to 63%) and 95% (89% to 97%) in settings with a tuberculosis prevalence less than 43%.

Sensitivity analyses

In evaluation of the accuracy of LF‐LAM for detection of tuberculosis, we undertook sensitivity analyses by limiting inclusion in the meta‐analysis to the following.

  • Studies with low risk of bias for patient selection (two studies)

  • Studies with low risk of bias in the reference standard domain (one study)

  • Studies that used fresh urine samples (four studies) rather than stored urine sample

Two studies with greater than 80% symptomatic participants (Bjerrum 2015; Lawn 2017) were re‐assigned from ‘studies of unselected participants' to ‘studies of symptomatic participants'.

These sensitivity analyses only included few studies and participants and made little difference to any of the findings (Table 3).

Open in table viewer
Table 3. Sensitivity analyses, LF‐LAM

Type of analysis

Symptomatic participants

Unselected participants

Studies participants

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Studies participants

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Including studies at low risk of patient selection bias

2 studies

1413

48%

(29% to 67%)

82%

(61% to 92%)

3 studies

1338

39%

(17% to 66%)

93%

(69% to 98%)

Including studies at low risk of reference standard bias

1 study

997

Insufficient data

Insufficient data

2 studies

821

24%

(8% to 53%)

99%

(95% to 99%)

Including studies that used only fresh specimens

4 studies

2511

52%

(38% to 68%)

91%

(82% to 95%)

5 studies

2544

41%

(26% to 56%)

93%

(82% to 97%)

Re‐classificiation of Bjerrum 2015; Lawn 2017 as studies among symptomatic participant (> 80% participants symptomatic)

10 studies 4331

42%

(33% to 52%)

93%

(88% to 96%)

5 studies

2483

31%

(16% to 50%)

94%

(84% to 98%)

Abbreviations: LF‐LAM: lateral flow urine lipoarabinomannan assay (Alere Determine™ TB lipoarabinomannan assay); Crl: Credible Interval

II. Diagnostic accuracy of LF‐LAM for tuberculosis diagnosis in HIV‐positive unselected adults irrespective of signs and symptoms for tuberculosis

Of the 15 studies included, seven studies evaluated the accuracy of LF‐LAM for diagnosis in participants, irrespective of sign and symptoms (‘unselected participants’) (Bjerrum 2015; Drain 2015a; Floridia 2017; Hanifa 2016; LaCourse 2016; Lawn 2017; Thit 2017). The tuberculosis prevalence in the study population varied from 1% in LaCourse 2016 to 33% in Lawn 2017. Six of the studies reported the proportion of symptomatic participants that were included (e.g. having a positive WHO symptoms screen) which varied from 19% (LaCourse 2016) to more than 90% of participants in two studies (Bjerrum 2015; Lawn 2017). No studies reported results specifically for individuals who were asymptomatic. Four studies were carried out in an outpatient setting (Drain 2015a; Floridia 2017; Hanifa 2016; LaCourse 2016), one study exclusively in an inpatient setting (Lawn 2017), and two studies in both inpatient and outpatient settings (Bjerrum 2015; Thit 2017). The median CD4 cell count across studies of unselected adults ranged from 111 to 437 cells per µL across studies. See Table 1 and Characteristics of included studies.

Primary analysis, LF‐LAM for tuberculosis in HIV‐positive adults irrespective of signs and symptoms of tuberculosis

For determining the overall accuracy of LF‐LAM in HIV‐positive adults irrespective of signs and symptoms of tuberculosis, seven studies provided data for 3365 participants, including 432 (13%) with tuberculosis. Sensitivity estimates ranged from 0% to 67%, and specificity estimates from 64% to 99% (Figure 8).


Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants not assessed for signs and symptoms of tuberculosis. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants not assessed for signs and symptoms of tuberculosis. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Sensitivity was lowest (0%) in LaCourse 2016, that differed from the other studies by including a) a population of exclusively pregnant women attending an antenatal care setting, b) a low proportion of symptomatic participants (19%), c) a low tuberculosis prevalence (1%), and d) a high median CD4 cell count (437 cells per µL). Specificity was lowest (64%) in the study by Thit 2017 that also reported the highest sensitivity (67%). This study reported that more than 90% of the FP results were grade 1 positive results (classified as positive according to current manufacturer recommendations). Participants included had a median CD4 at 270 cells per μL and 33% were symptomatic at enrolment. The study evaluated sputum samples only and allowed a follow‐up for six months from LF‐LAM testing at enrolment to final classification of participants as ‘Tuberculosis' or ‘Not tuberculosis' cases. Thit 2017 further differed from the other studies by being conducted in Myanmar, and is the only study included in this review that evaluated LF‐LAM in a setting outside sub‐Saharan Africa. The pooled sensitivity and specificity (95% CrI) were 35% (22% to 50%) and 95% (89% to 98%) (Table 2). Appendix 9 presents the pooled and predicted sensitivity and specificity estimates together with the credible and prediction regions for LF‐LAM for tuberculosis detection. Prediction intervals were very wide in all meta‐analysis models indicating between‐study heterogeneity (data not shown).

Uninterpretable index test results

The included studies reported no uninterpretable results.

Investigations of heterogeneity
LF‐LAM accuracy among unselected participants, stratified by setting

LF‐LAM accuracy in inpatient settings

We identified three studies that evaluated accuracy among inpatients involving 537 participants, 159 (30%) with tuberculosis (Bjerrum 2015; Lawn 2017; Thit 2017). Sensitivity estimates ranged from 39% to 88% and specificity estimates ranged from 39% to 99% (Figure 9).


Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants, by health care setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. The individual studies are ordered by decreasing sensitivity. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants, by health care setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. The individual studies are ordered by decreasing sensitivity. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Thit 2017 reported a very low specificity (39%) and a high sensitivity (88%), based on a relatively small sample size of 54 inpatients; eight (15%) with tuberculosis. The authors reported that 41 of the inpatients (76%) were symptomatic at enrolment with a median CD4 of 96 (IQR 37 to 277) cells per µL, which is comparable to evaluation of LF‐LAM in a population with advanced HIV disease. The study further differed from the other studies by allowing a follow‐up for six months for classification of participants and by being conducted in Myanmar as mentioned above. Most of the participants (91%) included in the studies by Bjerrum 2015 and Lawn 2017 were symptomatic and thus comparable to studies with symptomatic participants. See Table 1 and Characteristics of included studies. The pooled sensitivity and specificity (95% CrI) among unselected inpatients were 62% (41% to 83%) and 84% (48% to 96%) (Table 2).

LF‐LAM accuracy in outpatient settings

Six studies were conducted among unselected outpatients, involving 2828 participants; 273 (10%) with tuberculosis (Bjerrum 2015; Drain 2015a; Floridia 2017; Hanifa 2016; LaCourse 2016; Thit 2017). Sensitivity estimates ranged from 0% to 63% and specificity estimates ranged from 67% to 99% (Figure 9). Pooled sensitivity and specificity (95% CrI) were 31% (18% to 47%) and 95% (87% to 99%) (Table 2).

LF‐LAM accuracy among unselected participants, stratified by CD4 count

There were limited data to evaluate LF‐LAM by CD4 threshold for unselected participants. Five studies contributed data to the analyses by CD4 count (Bjerrum 2015; Drain 2015a; Hanifa 2016; LaCourse 2016; Lawn 2017). See Appendix 10; Appendix 11 and Table 2.

LF‐LAM accuracy stratified by CD4 ≤ 200 cells per µL and > 200 cells per µL

Two studies evaluated LF‐LAM in unselected participants with CD4 ≤ 200 cells per µL, all settings. Sensitivity and specificity were 45% and 93% for Bjerrum 2015, and 7% and 99% for Hanifa 2016, (Appendix 10). Pooled sensitivity and specificity were 26% (9% to 56%) and 96% (87% to 98%) (706 participants, 12% with tuberculosis) (Table 2).

For unselected outpatients with a CD4≤ 200 cells per µL, two studies contributed data (652 participants; 10% with tuberculosis). Sensitivity and specificity were 36% and 94% for Bjerrum 2015, and 7% and 99% for Hanifa 2016 (Appendix 10). Pooled sensitivity and specificity were 21% (8% to 48%) and 96% (89% to 99%) (Table 2).

When we limited the analysis to unselected inpatients with CD4 ≤ 200 cells per µL, only one study (Bjerrum 2015) contributed data and found a sensitivity of 64% (95% CI: 35% to 87%) and specificity of 82% (67% to 93%) (54 participants, 26% with tuberculosis).

For comparison, we assessed diagnostic accuracy among participants with CD4 > 200 cells per µL, all settings. Only one study reported data for participants with CD4 > 200 cells per µL and reported a sensitivity of 27% (95% CI: 6% to 61%) and specificity of 99% (95% CI; 96% to 100%) (Bjerrum 2015).

LF‐LAM accuracy stratified by CD4 ≤ 100 cells per µL and > 100 cells per µL

Three studies evaluated patients with CD4 ≤ 100 cells per µL, all settings, and sensitivity estimates ranged from 37% to 55% and specificity from 80% to 98% (Appendix 11). The pooled sensitivity and specificity (95% CrI) among participants with CD4 ≤ 100 cells per µL were 47% (30% to 64%) and 90% (77% to 96%) (3 studies, 417 participants, 31% with tuberculosis) (Table 2).

When we limited the analysis to studies involving unselected inpatients with CD4 ≤ 100 cells per µL two studies contributed data, (200 participants; 42% with tuberculosis). Sensitivity and specificity were 60% and 80% for Bjerrum 2015, and 55% and 98% for Lawn 2017 (Appendix 11). The pooled sensitivity and specificity were 57% (33% to 79%) and 90% (69% to 97%) (Table 2).

Two studies contributed data for unselected outpatients with CD4 ≤ 100 cells per µL (Bjerrum 2015; Hanifa 2016) (Appendix 11). The pooled sensitivity and specificity were 40% (20% to 64%) and 87% (68% to 94%) (217 participants, 21% with tuberculosis) (Table 2).

Four studies evaluated LF‐LAM in participants with CD4 > 100 cells per µL (Bjerrum 2015; Drain 2015a; LaCourse 2016; Lawn 2017). Sensitivity estimates ranged from 0% to 33% and specificity estimates ranged from 95% to 99% (Appendix 11). Pooled sensitivity and specificity (95% CrI) were 20% (10% to 35%) and 98% (95% to 99%), (952 participants, 12% with tuberculosis) (Table 2).

LF‐LAM accuracy among unselected participants, stratified by tuberculosis prevalence

The median prevalence of tuberculosis in studies with unselected participants was 10% (IQR 9% to 17%). In the analysis by tuberculosis prevalence, we found that pooled sensitivity and specificity for unselected participants in settings with tuberculosis prevalence of 10% or more were 45% (31% to 61%) and 92% (79% to 97%) (4 studies) compared to 16% (5% to 36%) and 98% (94% to 99%) in settings with tuberculosis prevalence less than 10% (3 studies). In general, tuberculosis prevalence increased in studies with a higher proportion of symptomatic participants.

Sensitivity analyses

As for studies among symptomatic participants, we undertook sensitivity analyses by limiting inclusion in the meta‐analysis to the following.

  • Studies with low risk of bias for patient selection (three studies)

  • Studies with low risk of bias in the reference standard domain (two studies)

  • Studies that used fresh urine samples (five studies) rather than stored urine sample

We further excluded the two studies with more than 80% of participants being symptomatic at inclusion (Bjerrum 2015; Lawn 2017).

These sensitivity analyses made little difference to any of the findings (Table 3).

Discusión

available in

Esta revisión sistemática actualiza la bibliografía existente e incluye 15 estudios únicos sobre la exactitud de la prueba de lipoarabinomanano en orina de flujo lateral (LF‐LAM, Alere Determine™ TB LAM Ag) para la tuberculosis en adultos que conviven con el VIH, e integra nueve estudios nuevos identificados desde las guías originales de la OMS (WHO Lipoarabinomannan Policy Guidance 2015) y la revisión Cochrane (Shah 2016). A priori, se optó por evaluar el rendimiento de la LF‐LAM por separado para los estudios que reclutaron a participantes estrictamente sintomáticos y los estudios que reclutaron a participantes no seleccionados, independientemente de los signos o síntomas de tuberculosis, y se investigó la heterogeneidad sobre la base del recuento de CD4 y el contexto del estudio (pacientes hospitalizados o ambulatorios). Ocho estudios utilizaron la LF‐LAM para el diagnóstico de la tuberculosis en participantes adultos sintomáticos con signos y síntomas que indicaban la presencia de tuberculosis. Estos estudios se centraron principalmente en ámbitos hospitalarios y tuvieron una alta prevalencia de tuberculosis. Siete estudios evaluaron la LF‐LAM para el diagnóstico de la tuberculosis en participantes no seleccionados que pueden o no haber tenido signos o síntomas que indicanran la presencia de tuberculosis cuando fueron reclutados en el estudio. Los estudios con participantes no seleccionados se realizaron predominantemente en ámbitos ambulatorios y, en comparación con los estudios con participantes exclusivamente sintomáticos, tuvieron una menor prevalencia de tuberculosis e incluyeron a pacientes con recuentos de células CD4 más altos; la proporción de participantes sintomáticos en estos estudios varió del 19% al 90%. Todos los estudios se realizaron en países de ingresos bajos y medios con una alta carga de tuberculosis/VIH, y solo un estudio se realizó fuera de África subsahariana.

Resumen de los resultados principales

Los hallazgos principales se resumen en la tabla 1 y la tabla 2 de Resumen de los hallazgos. Los principales hallazgos de esta revisión actualizada incluyen los siguientes.

Para el diagnóstico de la tuberculosis en adultos con pruebas positivas para el VIH que presentan signos y síntomas de tuberculosis, la exactitud diagnóstica de la LAM‐LEF es (intervalo de confianza del 95%):

  • En todos los contextos, sensibilidad 42% (31% a 55%) y especificidad 91% (85% a 95%);

  • En ámbitos hospitalarios, sensibilidad 52% (40% a 64%) y especificidad 87% (78% a 93%);

  • En el ámbito ambulatorio, sensibilidad 29% (17% a 47%) y especificidad 96% (91% a 99%).

Para el diagnóstico de la tuberculosis en adultos con pruebas positivas para el VIH, independientemente de los signos y síntomas de la tuberculosis, la exactitud diagnóstica de la LF‐LAM es:

  • En todos los contextos, sensibilidad 35% (22% a 50%) y especificidad 95% (89% a 98%);

  • En ámbitos hospitalarios, sensibilidad 62% (41% a 83%) y especificidad 84% (48% a 96%);

  • En ámbitos ambulatorios, sensibilidad 31% (18% a 47%) y especificidad 95% (87% a 99%).

Se observó que la intensidad de banda de grado 1 en esta revisión corresponde al umbral de positividad del fabricante actual (equivalente al grado 2 de la tarjeta de referencia del fabricante anterior) y todos los resultados se evaluaron con respecto a un estándar de referencia microbiológico.

LF‐LAM para el diagnóstico de la tuberculosis en estudios con participantes sintomáticos

Resumen de los hallazgos, tabla 1.

En las investigaciones planificadas de la heterogeneidad se encontró una correlación inversa entre la sensibilidad de la LF‐LAM y el recuento de CD; con una sensibilidad cada vez mayor a medida que disminuía el recuento de CD4 de los pacientes (aumento del 16% [IC 8% al 31%] en pacientes con recuento de células CD4 > 200 células por µl, al 24% [IC 14% al 38%] en pacientes con recuento de células CD4 entre 101 y 199 células por µl, al 54% [IC 38% al 69%] en pacientes con CD4 ≤ 100 células por µl). De manera similar, se planificó investigar a priori y se esperaba encontrar una mayor sensibilidad en los pacientes hospitalizados, con una disminución de la especificidad.

Los resultados de estos estudios indican que, en teoría, para una población de 1000 personas en la que 300 tienen tuberculosis confirmada microbiológicamente, la utilización de la LF‐LAM daría como resultado: 189 positivos en la LF‐LAM; de los mismos, 63 (33%) no tendrían tuberculosis (positivos falsos), y 811 negativos en la LF‐LAM: de los mismos, 174 (21%) tendrían tuberculosis (negativos falsos).

LF‐LAM para el diagnóstico de tuberculosis en estudios con participantes no seleccionados (signos y síntomas no evaluados como condición para la inclusión en el estudio)

Resumen de los hallazgos, tabla 2.

En las investigaciones de la heterogeneidad, se esperaba y se encontró una mayor sensibilidad en los pacientes con CD4 ≤ 100 células por µl (47%) y entre los pacientes hospitalizados (62%) en comparación con los pacientes con CD4 > 100 células por µl (20%) entre los pacientes ambulatorios (31%) respectivamente, aunque los datos para informar los análisis de subgrupos fueron limitados. Se observó que los participantes incluidos en los estudios de participantes no seleccionados a menudo se presentaron a la consulta con signos y síntomas que indicaban la presencia de tuberculosis (una prueba positiva de detección de tuberculosis de la OMS), y en los estudios que evaluaron a pacientes hospitalizados, la mayoría de los participantes (> 80%) se presentaron de hecho con signos y síntomas que indicaban la presencia de tuberculosis. Estos estudios se pueden considerar más similares a los estudios con participantes exclusivamente sintomáticos. En un análisis adicional de la heterogeneidad, se examinó la exactitud diagnóstica basado en la prevalencia de la tuberculosis dentro de la cohorte estudiada, como un sustituto alternativo de la presencia de síntomas o del recuento de CD4 como una evaluación de la probabilidad previa a la prueba. Se encontró que la sensibilidad agrupada fue del 45% cuando la prevalencia de tuberculosis dentro de la población del estudio fue ≥ 10%, en comparación con solo el 16% cuando la prevalencia de tuberculosis en la población del estudio fue < 10%.

Los resultados de estos estudios indican que, en teoría, para una población de 1000 personas en la que 100 tienen tuberculosis confirmada microbiológicamente, la utilización de la LF‐LAM tendría como resultado: 80 positivos en la LF‐LAM: de los mismos, 45 (56%) no tendrían tuberculosis (positivos falsos); y 920 negativos en la LF‐LAM: de los mismos, 65 (7%) tendrían tuberculosis (negativos falsos).

LF‐LAM para el diagnóstico de la tuberculosis, en general

Los resultados de esta revisión actualizada son consistentes con los de la revisión original (Shah 2016; WHO Lipoarabinomannan Policy Guidance 2015). La inclusión de los estudios adicionales en esta revisión actualizada proporcionó la base para una estimación más precisa de la sensibilidad y la especificidad generales de la LF‐LAM. Además, permitió considerar cuestiones clave con respecto a la exactitud de la prueba y las fuentes de heterogeneidad, como el contexto clínico y el recuento de células CD4 en los estudios con individuos sintomáticos y en los estudios con participantes no seleccionados.

En general se encuentra una menor sensibilidad para el diagnóstico de la tuberculosis entre los pacientes que conviven con el VIH que el objetivo internacionalmente sugerido de un mínimo del 65% en general para las pruebas rápidas de tuberculosis sin esputo (WHO TTP 2014). Se encontró que la sensibilidad aumentó cuando se consideraron los pacientes hospitalizados y los individuos con recuentos bajos de CD4; ya sea cuando se consideraron los estudios con participantes exclusivamente sintomáticos o con participantes no seleccionados. Las razones de esta heterogeneidad siguen siendo poco claras y se han postulado varias hipótesis, incluidas las diferencias en la carga bacteriana, los sitios de la tuberculosis o el grado de disfunción glomerular, que pueden ser diferentes en diferentes contextos o recuentos de CD4.

Cuando el análisis se limitó a los estudios que incluyeron a participantes que no podían producir una muestra de esputo, las estimaciones de la sensibilidad aumentaron. Los pacientes con escasez de esputo pueden ser la población de interés potencial que más se beneficie con las pruebas basadas en orina, ya que no pueden ser sometidas a otras pruebas diagnósticas basadas en esputo y es probable que tengan un alto rendimiento en cuanto a la positividad de la prueba de lipoarabinomanano (LAM) en orina (Sabur 2017). Sin embargo, solo unos pocos estudios incluyeron a participantes que no pudieron proporcionar muestras de esputo para las pruebas diagnósticas. En la medida en que la incapacidad para producir esputo se correlaciona con la gravedad de la tuberculosis o la positividad del LAM, este enfoque para la selección de los participantes podría haber reducido las estimaciones de la sensibilidad en estos estudios. El análisis de sensibilidad mostró además una sensibilidad más alta entre los estudios que evaluaron la LF‐LAM en muestras de orina frescas no almacenadas, sin que este hecho afectara la especificidad. Sin embargo, ningún estudio ha hecho una comparación directa del rendimiento en muestras de orina frescas frente a congeladas/almacenadas, y su importancia no está clara.

En general, se encontró que la especificidad calculada se acercó a los objetivos recomendados para la prueba no específica del sitio y no basada en esputo (WHO TTP 2014), aunque se encontró una especificidad menor entre los pacientes hospitalizados y los que presentaban inmunosupresión avanzada, en comparación con los pacientes ambulatorios y los que presentaban recuentos de CD4 más altos. Se esperaba que, si el análisis se limitaba a los estudios que utilizaron un estándar de referencia de mayor calidad (por ejemplo, la inclusión de más de un tipo de espécimen), las estimaciones de la especificidad aumentarían, aunque los datos disponibles fueron limitados para realizar un análisis de sensibilidad de este tipo. Cuando se evalúa un ensayo que no es específico de un sitio, los estudios futuros pueden considerar el muestreo sistemático de múltiples sitios para mejorar la calidad del estándar de referencia. Los estudios futuros deben incluir el muestreo sistemático de esputo, sangre y orina para el cultivo de micobacterias o la prueba de amplificación de ácido nucleico (NAAT) de todos los participantes como sitios comunes de la tuberculosis que se pueden identificar mediante la detección del antígeno urinario con LAM; también se deben recolectar muestras adicionales específicas del sitio (p.ej. líquido cefalorraquídeo [LCR], biopsias de tejido) para el cultivo o la NAAT basado en la presentación clínica.

Se decidió evaluar a priori el rendimiento de la LF‐LAM en individuos con pruebas positivas para el VIH y signos y síntomas de tuberculosis (sintomáticos) por separado de los individuos con pruebas positivas para el VIH, independientemente de los signos y síntomas de tuberculosis (participantes no seleccionados). Se consideró la evaluación del rendimiento de la LF‐LAM entre participantes específicamente asintomáticos (es decir, exclusivamente los que no presentaban síntomas) para evaluar el uso de la LF‐LAM para el cribado de la tuberculosis o la detección activa de casos en la comunidad, aunque estos datos no estuvieron disponibles en los estudios incluidos. Se encontró que varios estudios en participantes no seleccionados informaron que una alta proporción de los participantes del estudio tenían signos y síntomas de tuberculosis, lo que indica similitudes relativas con los estudios que reclutaron exclusivamente a participantes sintomáticos. Por lo tanto, aún se desconoce en gran parte el rendimiento general de la LF‐LAM entre los pacientes asintomáticos.

Las diferencias generales en las estimaciones agrupadas de la sensibilidad y la especificidad entre los estudios de los participantes sintomáticos frente a los no seleccionados pueden haber sido atribuibles a las diferencias de contexto de los estudios y el grado relativo de inmunosupresión de los participantes incluidos, en lugar de al tipo de población (es decir, participantes no seleccionados frente a sintomáticos). Cuando se examinaron los pacientes hospitalizados, las estimaciones agrupadas de la sensibilidad fueron del 52% (40% a 64%) y 62% (41% a 83%), al comparar los estudios de los participantes sintomáticos y los que incluyeron a participantes no seleccionados. Entre los pacientes ambulatorios la sensibilidad agrupada fue del 29% (17% a 47%), en comparación con el 31% (18% a 47%) entre los estudios de los participantes sintomáticos y los participantes no seleccionados, respectivamente. Lo anterior indica que otras características distintas de los recuentos de CD4 inferiores pueden explicar la mayor sensibilidad entre los pacientes hospitalizados, como una mayor prevalencia de tuberculosis, una mayor carga micobacteriana, y la tuberculosis renal o del sistema genitourinario con secreción de LAM en la orina.

En general, los hallazgos indican que la exactitud diagnóstica de la LF‐LAM puede variar según el contexto del estudio, el recuento de CD4 y la prevalencia de tuberculosis entre la población de interés. Los autores plantean la hipótesis de que estos atributos (pacientes hospitalizados, recuentos bajos de CD4 o alta prevalencia de tuberculosis) pueden ser, de manera colectiva, indicadores indirectos de participantes con tuberculosis avanzada o carga bacilar más elevada y antigenuria de LAM, en los que la LF‐LAM puede ayudar en el diagnóstico de la tuberculosis, incluida la pulmonar y la extrapulmonar. Aunque las comparaciones de subgrupos en las revisiones de la exactitud diagnóstica son observacionales y presentan las mismas limitaciones que todos los resultados observacionales (p.ej. factores de confusión entre las características), hay una justificación científica de este resultado en cuanto a que los enfermos hospitalizados, los que tienen recuentos bajos de CD4, o las cohortes con una mayor prevalencia de tuberculosis probablemente presenten enfermedades de mayor gravedad o una carga bacilar mayor. Aunque la prueba no identifica todos los casos de tuberculosis, estos hallazgos indican que podría ser de particular valor en el diagnóstico de la tuberculosis en los pacientes con enfermedades de mayor gravedad. Otros factores que se pueden considerar al evaluar la LF‐LAM pueden incluir la capacidad de realizar la prueba en individuos incapaces de producir esputo que no pueden ser diagnosticados con otras pruebas diagnósticas de la tuberculosis, y la capacidad de implementar la prueba en el lugar de atención con la recolección no invasiva de muestras (WHO TTP 2014).

Se identificaron tres estudios publicados de la LF‐LAM en niños como resultado de una búsqueda más amplia de estudios en adultos y niños con los mismos criterios de inclusión (Kroidl 2015; LaCourse 2018a; Nicol 2014). Los tres estudios se realizaron en países de África con una carga alta de tuberculosis/VIH. La prevalencia de tuberculosis confirmada microbiológicamente en los estudios fue del 7% en LaCourse 2018a, del 22% en Nicol 2014 y del 40% en Kroidl 2015. Kroidl 2015 reclutó a niños de seis semanas a 14 años de edad, mediana de edad (rango intercuartil [RIC]) 6,8 años (3,9 a 9,5) para todos los participantes, e incluyó a niños con pruebas positivas para el VIH y con pruebas negativas para el VIH. LaCourse 2018a reclutó a niños de hasta 12 años de edad, mediana de edad (RIC) de 24 meses (13 a 58). Nicol 2014 reclutó a niños de hasta 15 años de edad, mediana de edad (RIC) de 42,5 meses (19,1 a 66,3) para todos los participantes, e incluyó niños con pruebas positivas para el VIH y con pruebas negativas para el VIH. En el Apéndice 12 es posible encontrar una tabla que resume las características de los estudios en niños. Kroidl 2015 y Nicol 2014 reclutaron a niños con pruebas positivas para el VIH y síntomas de tuberculosis. La Course 2018a reclutó a niños con pruebas positivas para el VIH hospitalizados por enfermedades agudas, independientemente de los signos y síntomas de tuberculosis. Kroidl 2015 se realizó en un ámbito ambulatorio, LaCourse 2018a en un ámbito hospitalario y Nicol 2014 en un ámbito hospitalario y en uno ambulatorio (Apéndice 12). Debido a las diferencias en la población y el contexto, no se realizaron metanálisis y se informaron las estimaciones de la sensibilidad y la especificidad para los estudios individuales, medidas en relación con un estándar de referencia microbiológico. La sensibilidad y la especificidad (IC 95%) fueron del 42% (15% a 72%) y del 94% (73% a 100%), (30 participantes) (Kroidl 2015); del 56% (21% a 86%) y del 95% (90% a 98%), (130 participantes) (LaCourse 2018a); y del 43% (23% a 66%) y del 80% (69% a 88%), (106 participantes) (Nicol 2014). Se encontró evidencia limitada sobre la exactitud de la LF‐LAM en niños que conviven con el VIH. Hubo muy pocos estudios y participantes para establecer conclusiones.

Se reconoce que estos resultados de los pacientes son claramente importantes para los pacientes, los encargados de tomar decisiones y para toda la comunidad con tuberculosis. Aunque el objetivo principal de esta actualización de la revisión Cochrane fue evaluar la exactitud diagnóstica de la LF‐LAM, en el proceso de realización de la revisión también se evaluaron los datos disponibles sobre la LF‐LAM y los resultados importantes para el paciente, incluida la mortalidad. Se identificaron dos ensayos controlados aleatorizados (Gupta‐Wright, 2018a; Peter 2016) que incluyeron datos sobre la repercusión de la implementación de la LF‐LAM en la mortalidad y otros resultados de los pacientes. Peter 2016 reclutó a participantes con síntomas de tuberculosis, y Gupta‐Wright 2018a reclutó a participantes no seleccionados, independientemente de los síntomas. Ambos ensayos se realizaron en múltiples países de África subsahariana. Ambos ensayos incluyeron pacientes hospitalizados con VIH, utilizaron los resultados de la LF‐LAM para guiar el tratamiento y evaluaron la mortalidad por todas las causas a las ocho semanas. Peter 2016 encontró que la mortalidad se redujo significativamente en los participantes sometidos a la LF‐LAM en comparación con los que recibieron pruebas diagnósticas de rutina solas (ninguna LF‐LAM); reducción del riesgo relativo ajustado 0,83 (IC del 95%: 0,73 a 0,96, p = 0,012). En Gupta‐Wright 2018a, el uso del cribado rápido de orina con la LF‐LAM y de la Xpert MTB/RIF en orina (grupo de intervención) no se asoció con una reducción estadísticamente significativa de la mortalidad en comparación con las pruebas diagnósticas de rutina solas (grupo de atención estándar, ninguna LF‐LAM); reducción del riesgo ajustado (RRa) ‐2,8% (IC del 95%: ‐5,8 a 0,3; p = 0,074). Sin embargo, es importante señalar que Gupta‐Wright 2018a demostró que la mortalidad fue significativamente menor en el grupo de intervención que en el grupo de atención estándar para tres de los 12 subgrupos predeterminados: recuentos de CD4 inferiores a 100 células por μl (RRa ‐7,1% [IC del 95%: ‐13,7 a ‐0,4], p = 0,036); anemia grave (RRa ‐9,0% [IC del 95%: ‐16,6 a ‐1,3], p = 0,021); y participantes con sospecha clínica de tuberculosis (RRa ‐5,7% [IC del 95%: ‐10,9 a ‐0,5], p = 0,033). La repercusión de las pruebas con la LF‐LAM sobre los resultados de los pacientes se considerará en mayor profundidad en otra revisión Cochrane (se encuentra en curso un Protocolo Cochrane).

En cuanto a las evaluaciones económicas, se conocen seis estudios, todos de entornos del África subsahariana (Boyles 2018; Mukora 2018; Orlando 2018; Reddy 2019; Shah 2013; Sun 2013). Estos métodos de estudio y poblaciones fueron heterogéneos y evaluaron una serie de algoritmos de diagnóstico, y solo cuatro de todos los estudios evaluaron la coste‐efectividad (Orlando 2018; Reddy 2019; Shah 2013; Sun 2013), mientras que Mukora 2018 realizó un estudio de costes detallado que incluyó los costes a nivel clínico y más allá del nivel clínico, y Boyles 2018 evaluó si el agregado de la LF‐LAM a los algoritmos de diagnóstico podría reducir los costes totales del programa. Los estudios utilizaron varios umbrales de disposición para pagar y los cuatro fueron consistentes en cuanto a la conclusión de que la LF‐LAM podría ser coste‐efectiva en una población de adultos africanos que conviven con el VIH (en particular entre los pacientes hospitalizados). Los modelos encontraron que la relación coste‐efectividad de la LF‐LAM es robusta en una variedad de análisis de sensibilidad, y en diferentes escenarios y contextos de los países investigados. Los parámetros clave que probablemente influyen más en la relación coste‐efectividad incluyen: prevalencia de la tuberculosis/población de interés, especificidad de la LF‐LAM, coste del tratamiento de la tuberculosis y el VIH y esperanza de vida después de la supervivencia de la tuberculosis. Los datos empíricos detallados de los costes son limitados para la implementación de la LF‐LAM; sin embargo, un estudio de este tipo publicado en 2018 (Mukora 2018) calcula que los costes unitarios de las pruebas para la implementación de la LF‐LAM son mucho más altos (˜$23‐24) que los de la mayoría de los modelos actuales ($2‐4), en los que no se consideran los costes de la implementación y del tiempo del personal. La subestimación de los costes unitarios de la LF‐LAM podría dar lugar a perfiles demasiado optimistas de la relación coste‐efectividad. Sin embargo, es probable que los costes del diagnóstico de la tuberculosis representen solo una pequeña proporción de los costes totales; de hecho, la inclusión de los costes asociados con el tratamiento antirretroviral (TAR) y la atención del VIH dio lugar a una mayor relación coste‐efectividad gradual. Aunque la evidencia actual es consistente al indicar que la LF‐LAM probablemente es coste‐efectiva entre los pacientes con pruebas positivas para el VIH en África subsahariana, se debe tener precaución al realizar extrapolaciones de un pequeño número de estudios, y se necesitará evidencia adicional de una gama más amplia de poblaciones, ámbitos y enfoques diagnósticos. Actualmente se realiza una revisión sistemática de las evaluaciones económicas.

Diferencias con respecto a la revisión Cochrane original

En comparación con la revisión Cochrane original (Shah 2016), esta revisión actualizada incluye 15 estudios publicados (nueve estudios nuevos desde la revisión original y seis estudios de la revisión original). La revisión original incluyó datos de 12 estudios, de los que se excluyeron seis debido a que no cumplieron con los criterios de elegibilidad para esta revisión actualizada. Tres utilizaron un umbral más antiguo para determinar la positividad de la prueba, que ya no se recomienda, y tres fueron resúmenes, de los cuales uno (Lawn 2014) se agregó a esta revisión como un artículo publicado actualizado. A efectos de la comparación, los principales hallazgos de la revisión original (Shah 2016) se enumeran en la Tabla 4.

En la evaluación de la exactitud diagnóstica entre los participantes sintomáticos, las estimaciones agrupadas de la sensibilidad (42% [IC del 31% a 55%] frente al 45% [IC del 29% a 63%]) y la especificidad (91% [IC del 85% a 95%] frente al 92% [IC del 80% a 97%]) siguieron siendo similares, al comparar la revisión actual con la revisión anterior, respectivamente. Cuando se estratificó por contexto, las estimaciones agrupadas entre los pacientes hospitalizados para la sensibilidad (52% [IC 40% a 64%] frente al 53% [IC 38% a 70%]) y la especificidad (87% [IC 78% a 93%] frente al 90% [IC 73% a 96%]) no cambiaron de forma considerable al comparar la revisión actual y la revisión anterior, respectivamente. Las estimaciones agrupadas entre los pacientes ambulatorios en el umbral de positividad del fabricante actual no estaban disponibles anteriormente.

En Shah 2016 algunos estudios se clasificaron como "cribado de la tuberculosis (TB)" cuando incluían a participantes independientemente de los síntomas (es decir, con o sin síntomas). Se reconoce que estos estudios pueden haber incluido una gran proporción de participantes sintomáticos, por lo que se han denominado más claramente como estudios en "participantes no seleccionados" en la presente revisión. En la revisión anterior no hubo datos suficientes para realizar el metanálisis con los participantes no seleccionados en el umbral actualmente recomendado por el fabricante para la positividad de la prueba. Anteriormente no hubo datos suficientes para investigar la heterogeneidad debido al contexto del estudio o al recuento de CD4. En la revisión actual se informa sobre la exactitud diagnóstica entre los pacientes hospitalizados y ambulatorios y por CD4. En la revisión actual y en la anterior no hubo datos disponibles para evaluar la exactitud diagnóstica entre los participantes asintomáticos (sin signos ni síntomas de tuberculosis).

Esta revisión actualizada no evaluó la exactitud diagnóstica en un umbral más antiguo para determinar la positividad de la prueba (grado 1 de 5; en una tarjeta de referencia más antigua); los datos sobre la exactitud diagnóstica para este umbral se pueden encontrar en la revisión anterior (Shah 2016). Del mismo modo, en esta revisión actualizada no se evaluó la exactitud con respecto a un estándar de referencia compuesto, cuyos resultados se incluyeron en la revisión anterior (Shah 2016). Finalmente, debido a la falta relativa de datos sobre la evaluación del incremento del rendimiento de la LF‐LAM en combinación con la baciloscopía de esputo y la Xpert MTB/RIF, no se incluyeron estos análisis en la revisión actualizada, aunque se encuentra un resumen de los datos disponibles en la revisión anterior (Shah 2016).

Se observó que la intensidad de banda de grado 1 en esta revisión corresponde al umbral de positividad del fabricante actual (equivalente al grado 2 de la tarjeta de referencia del fabricante anterior) y todos los resultados se evaluaron con respecto a un estándar de referencia microbiológico.

Fortalezas y limitaciones de la revisión

Los resultados de esta revisión se basan en una búsqueda exhaustiva, criterios de inclusión estrictos y una extracción de datos estandarizada. El punto fuerte de esta revisión es que permitió evaluar la exactitud de la LF‐LAM en pacientes que viven con el VIH cuando se aplicó a diferentes criterios de reclutamiento: exactitud entre individuos con signos y síntomas de tuberculosis, y exactitud cuando se utilizó sin evaluar los signos y síntomas de la tuberculosis (es decir, los pacientes pueden o no haber tenido síntomas). Esta revisión actualizada incluyó nuevos estudios publicados desde la revisión original. Sin embargo, se encontró heterogeneidad considerable entre los estudios con respecto al contexto clínico, el recuento de CD4 y la prevalencia de tuberculosis. Para algunos análisis, pocos estudios y participantes proporcionaron datos y, por lo tanto, los resultados, deben interpretarse con cautela. La revisión fue limitada aún más por el número de estudios que utilizaron un estándar de referencia de calidad inferior y el riesgo alto de sesgo de selección en varios estudios debido a la exclusión de los pacientes que no podían producir esputo.

Completitud de la evidencia

Este conjunto de datos incluyó una búsqueda exhaustiva y la correspondencia con expertos en el área y el fabricante de la prueba para identificar estudios adicionales, así como la correspondencia con los autores de los estudios para obtener datos adicionales y no publicados sobre las características del estudio. La estrategia de búsqueda incluyó estudios publicados en todos los idiomas. Sin embargo, debido a que los estudios de exactitud de diagnóstico son indizados de manera deficiente, se reconoce que es posible haber omitido algunos estudios a pesar de la búsqueda exhaustiva.

Exactitud de los estándares de referencia utilizados

En una revisión sistemática de la exactitud de la prueba de diagnóstico, el estándar de referencia es la mejor prueba disponible para determinar la presencia o la ausencia de la condición diana. Solo se incluyeron estudios con un estándar de referencia microbiológico, que se considera el mejor estándar de referencia actualmente disponible para la tuberculosis. Se incluyeron estudios que evaluaban la LF‐LAM para el diagnóstico de la tuberculosis pulmonar, la tuberculosis extrapulmonar o la tuberculosis pulmonar y extrapulmonar. Sin embargo, se reconoce que es posible que haya un número considerable de casos de tuberculosis que no se verifican mediante pruebas microbiológicas cuando solo se analiza el esputo, y cuando se evalúa a los pacientes con VIH avanzado. Se reconocen las dificultades en el diagnóstico de la tuberculosis asociada al VIH con formas de enfermedad extrapulmonares y diseminadas, y se consideró que un estándar de referencia estandarizado que utiliza dos tipos de muestras o más de manera consistente para todos los participantes es de mayor calidad que un estándar de referencia que utiliza un tipo de muestra. El estándar de referencia de calidad más alta es mejor para clasificar a los pacientes tienen y que no tienen tuberculosis. Una estándar de referencia de menor calidad puede pasar por alto algunos casos de tuberculosis y clasificar a algunos pacientes con tuberculosis como sin tuberculosis. Este hecho puede hacer que un resultado verdaderamente positivo de la LF‐LAM parezca un resultado positivo falso y dar lugar a una subestimación de la especificidad. En esta revisión, solo un estudio (12%) para el diagnóstico de la tuberculosis en participantes sintomáticos y dos estudios (29%) para el diagnóstico de la tuberculosis en participantes no seleccionados utilizaron un estándar de referencia de mayor calidad para todos los participantes.

No se evaluó el rendimiento con respecto a un estándar de referencia compuesto que utiliza información microbiológica o clínica para clasificar la tuberculosis. Lo anterior se realizó en la guía original de la OMS (WHO Lipoarabinomannan Policy Guidance 2015), y en la Revisión Cochrane (Shah 2016), aunque se encontró poca repercusión en las estimaciones agrupadas de la sensibilidad y la especificidad en relación con el rendimiento medido en comparación con un estándar de referencia microbiológico.

No fue posible determinar si la heterogeneidad en las estimaciones de la especificidad fue totalmente atribuible al sesgo de clasificación errónea. Algunos estudios (Nel 2017; Qvist 2014) han postulado que la infección por micobacterias (diseminadas) no tuberculosas (MNT) también puede dar lugar a resultados positivos falsos, aunque esta hipótesis todavía es cuestionada (Gupta‐Wright 2018). Solo se realizó un estudio (Thit 2017) fuera de África subsahariana, que informó las estimaciones de la especificidad más bajas de todos los estudios incluidos. Las razones de los posibles resultados positivos falsos aún son poco claras y se desconoce si las diferencias en la epidemiología de las MNT diseminadas y otras infecciones oportunistas en los distintos contextos podrían contribuir con la variación de la especificidad.

Calidad y calidad del informe de los estudios incluidos

Hubo pocos estudios que incluyeron a participantes incapaces de expectorar esputo y pocos estudios que incluyeron muestras extrapulmonares además del esputo. Hubo datos limitados para considerar estos ítems de calidad en los análisis de sensibilidad y se reconoce que estas características pueden haber contribuido al riesgo de sesgo en los cálculos de la exactitud. Para los estudios en participantes sintomáticos, en el dominio de la selección de los pacientes, se consideró que seis estudios (75%) tuvieron un alto riesgo de sesgo, y en el dominio del estándar de referencia, se consideró que siete estudios (88%) tuvieron un alto riesgo de sesgo. Para los estudios con participantes no seleccionados, en el dominio de la selección de los pacientes, se consideró que cuatro estudios (57%) tuvieron un alto riesgo de sesgo y en el dominio del estándar de referencia se consideró que cinco estudios (71%) tuvieron un alto riesgo de sesgo. El riesgo de sesgo se consideró bajo para la prueba índice y para los dominios del flujo y el tiempo.

Mediante el uso de los criterios GRADE se consideró que la calidad de la evidencia para la sensibilidad de la LF‐LAM fue moderada. Lo anterior significa que hay certeza moderada en la estimación del efecto: es probable que el verdadero efecto esté cerca de la estimación del efecto, aunque existe laa posibilidad de que sea considerablemente diferente. Se consideró que la evidencia para la especificidad de la LF‐LAM fue baja o muy baja. Este hecho significa que hay muy poca confianza en el cálculo del efecto: es probable que el efecto verdadero sea considerablemente diferente del cálculo del efecto.

En general, los estudios se informaron bastante bien, aunque se estableció contacto con algunos de los autores de los estudios primarios para solicitarles aclaraciones, principalmente en relación con la interpretación de la positividad de la prueba.

Aplicabilidad de los hallazgos a la pregunta de la revisión

En general, hubo pocas inquietudes sobre la aplicabilidad de los estudios incluidos a la pregunta de la revisión, según lo evaluado mediante la herramienta Quality Assessment of Diagnostic Accuracy Studies‐2 (QUADAS‐2). Sin embargo, los estudios en adultos con pruebas positivas para el VIH, independientemente de los signos y síntomas, tuvieron una baja representación de los individuos asintomáticos, debido a que la mayoría de los participantes de hecho presentaban signos y síntomas de tuberculosis. Hasta la fecha ningún estudio ha evaluado la LF‐LAM en una población asintomática. Esta revisión evaluó la LF‐LAM según el punto de corte de positividad recomendado por el fabricante actual. Por lo tanto, los hallazgos se deben considerar aplicables a la prueba. Sin embargo, es importante señalar que esta revisión evaluó la sensibilidad y la especificidad en ámbitos de investigación aplicada. Aunque las características de los pacientes y los ámbitos coincidieron con la pregunta de la revisión en la mayoría de los casos, debido a que los estudios se realizaron en condiciones de investigación, es posible que la exactitud de la LAM‐FL sea inferior en ámbitos de la práctica habitual. Todos los estudios se realizaron en países de ingresos bajos o medios, aunque solo un estudio se realizó fuera de África subsahariana. Por lo tanto, es posible que la LF‐LAM tenga un rendimiento diferente en ámbitos fuera de África. Para el dominio de la prueba de referencia, en la mayoría de los estudios hubo pocas inquietudes en cuanto a la aplicabilidad.

Study flow diagram
Figures and Tables -
Figure 1

Study flow diagram

Studies with symptomatic participants ‐ Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.
Figures and Tables -
Figure 2

Studies with symptomatic participants ‐ Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.

Studies with unselected participants ‐ Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.
Figures and Tables -
Figure 3

Studies with unselected participants ‐ Risk of bias and applicability concerns summary: review authors' judgements about each domain for each included study.

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among symptomatic participants. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).
Figures and Tables -
Figure 4

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among symptomatic participants. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among symptomatic participants, by health care setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. The individual studies are ordered by decreasing sensitivity. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).
Figures and Tables -
Figure 5

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among symptomatic participants, by health care setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. The individual studies are ordered by decreasing sensitivity. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies with symptomatic participants, stratified by CD4 (CD4 > 200 and CD4 ≤ 200; CD4 > 100 and CD4 ≤ 100). The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).
Figures and Tables -
Figure 6

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies with symptomatic participants, stratified by CD4 (CD4 > 200 and CD4 ≤ 200; CD4 > 100 and CD4 ≤ 100). The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Plot by CD4 of diagnostic accuracy in adults with signs and symptoms of tuberculosis.(A) Sensitivity by CD4 strata; (B) Specificity by CD4 strata. The circle represents the pooled estimates (median), with bars representing 95% credible intervals.
Figures and Tables -
Figure 7

Plot by CD4 of diagnostic accuracy in adults with signs and symptoms of tuberculosis.

(A) Sensitivity by CD4 strata; (B) Specificity by CD4 strata. The circle represents the pooled estimates (median), with bars representing 95% credible intervals.

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants not assessed for signs and symptoms of tuberculosis. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).
Figures and Tables -
Figure 8

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants not assessed for signs and symptoms of tuberculosis. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants, by health care setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. The individual studies are ordered by decreasing sensitivity. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).
Figures and Tables -
Figure 9

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants, by health care setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. The individual studies are ordered by decreasing sensitivity. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

(A) AlereTM TB LAM Ag test. To the sample pad (white pad marked by the arrow symbols) 60 µL of urine is applied and visualized bands are read 25 minutes later. (B) Updated Reference Scale Card accompanying test strips to ‘grade' the test result and Alere positivity. Copyright © [2019] [Abbott Inc]: reproduced with permission.
Figures and Tables -
Figure 10

(A) AlereTM TB LAM Ag test. To the sample pad (white pad marked by the arrow symbols) 60 µL of urine is applied and visualized bands are read 25 minutes later. (B) Updated Reference Scale Card accompanying test strips to ‘grade' the test result and Alere positivity. Copyright © [2019] [Abbott Inc]: reproduced with permission.

Reference card grading of Alere Determine™ TB LAM. Comparison of the current reference card (top) with the prior reference card (bottom). Copyright © [2019] [Abbott Inc]: reproduced with permission.
Figures and Tables -
Figure 11

Reference card grading of Alere Determine™ TB LAM. Comparison of the current reference card (top) with the prior reference card (bottom). Copyright © [2019] [Abbott Inc]: reproduced with permission.

Summary plot of LF‐LAM sensitivity and specificity for tuberculosis detection in symptomatic participants. The blue circles represent individual study estimates for sensitivity and specificity for the studies among symptomatic participants. The size of the circle is proportional to the sample size of the study. The filled black circle is the pooled estimate for sensitivity and specificity. The solid red line marks the 95% credible region around the summary estimate, the dashed red line marks the 95% prediction region.
Figures and Tables -
Figure 12

Summary plot of LF‐LAM sensitivity and specificity for tuberculosis detection in symptomatic participants. The blue circles represent individual study estimates for sensitivity and specificity for the studies among symptomatic participants. The size of the circle is proportional to the sample size of the study. The filled black circle is the pooled estimate for sensitivity and specificity. The solid red line marks the 95% credible region around the summary estimate, the dashed red line marks the 95% prediction region.

Summary plot of LF‐LAM sensitivity and specificity for tuberculosis detection in unselected participants. The blue circles represent individual study estimates for sensitivity and specificity for the studies among unselected participants. The size of the circle is proportional to the sample size of the study. The filled black circle is the pooled estimate for sensitivity and specificity. The solid red line marks the 95% credible region around the summary estimate, the dashed red line marks the 95% prediction region.
Figures and Tables -
Figure 13

Summary plot of LF‐LAM sensitivity and specificity for tuberculosis detection in unselected participants. The blue circles represent individual study estimates for sensitivity and specificity for the studies among unselected participants. The size of the circle is proportional to the sample size of the study. The filled black circle is the pooled estimate for sensitivity and specificity. The solid red line marks the 95% credible region around the summary estimate, the dashed red line marks the 95% prediction region.

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants, by CD4 strata (CD4 > 200 and CD4 ≤ 200) and health setting. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).
Figures and Tables -
Figure 14

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants, by CD4 strata (CD4 > 200 and CD4 ≤ 200) and health setting. The individual studies are ordered by decreasing sensitivity. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line).

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants, by CD4 strata (CD4 > 100 and CD4 ≤ 100) and health setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line)
Figures and Tables -
Figure 15

Forest plots of LF‐LAM sensitivity and specificity for tuberculosis against a microbiological reference standard for studies among unselected participants, by CD4 strata (CD4 > 100 and CD4 ≤ 100) and health setting. TP = True Positive; FP = False Positive; FN = False Negative; TN = True Negative. Between brackets are the 95% confidence interval (CI) of sensitivity and specificity. The figure shows the estimated sensitivity and specificity of the study (blue square) and its 95% CI (black horizontal line)

Symptomatic adults, all settings.
Figures and Tables -
Test 1

Symptomatic adults, all settings.

Symptomatic adults, inpatients.
Figures and Tables -
Test 2

Symptomatic adults, inpatients.

Symptomatic adults, outpatients.
Figures and Tables -
Test 3

Symptomatic adults, outpatients.

Symptomatic adults, CD4 > 200, all settings.
Figures and Tables -
Test 4

Symptomatic adults, CD4 > 200, all settings.

Symptomatic adults, CD4 ≤ 200, all settings.
Figures and Tables -
Test 5

Symptomatic adults, CD4 ≤ 200, all settings.

Symptomatic adults, CD4 ≤ 200, inpatients.
Figures and Tables -
Test 6

Symptomatic adults, CD4 ≤ 200, inpatients.

Symptomatic adults, CD4 ≤ 200, outpatients.
Figures and Tables -
Test 7

Symptomatic adults, CD4 ≤ 200, outpatients.

Symptomatic adults, CD4 > 100, all settings.
Figures and Tables -
Test 8

Symptomatic adults, CD4 > 100, all settings.

Symptomatic adults, CD4 ≤ 100, all settings.
Figures and Tables -
Test 9

Symptomatic adults, CD4 ≤ 100, all settings.

Symptomatic adults, CD4 ≤ 100, inpatients.
Figures and Tables -
Test 10

Symptomatic adults, CD4 ≤ 100, inpatients.

Symptomatic adults, CD4 ≤ 100, outpatients.
Figures and Tables -
Test 11

Symptomatic adults, CD4 ≤ 100, outpatients.

Symptomatic adults, CD4 101‐200, all settings.
Figures and Tables -
Test 12

Symptomatic adults, CD4 101‐200, all settings.

Symptomatic adults, CD4 101‐200, inpatients.
Figures and Tables -
Test 13

Symptomatic adults, CD4 101‐200, inpatients.

Symptomatic adults, CD4 101‐200, outpatients.
Figures and Tables -
Test 14

Symptomatic adults, CD4 101‐200, outpatients.

Unselected adults, all settings.
Figures and Tables -
Test 17

Unselected adults, all settings.

Unselected adults, inpatients.
Figures and Tables -
Test 18

Unselected adults, inpatients.

Unselected adults, outpatients.
Figures and Tables -
Test 19

Unselected adults, outpatients.

Unselected adults, CD4 > 200, all settings.
Figures and Tables -
Test 20

Unselected adults, CD4 > 200, all settings.

Unselected adults, CD4 ≤ 200, all settings.
Figures and Tables -
Test 21

Unselected adults, CD4 ≤ 200, all settings.

Unselected adults, CD4 ≤ 200, inpatients.
Figures and Tables -
Test 22

Unselected adults, CD4 ≤ 200, inpatients.

Unselected adults, CD4 ≤ 200, outpatients.
Figures and Tables -
Test 23

Unselected adults, CD4 ≤ 200, outpatients.

Unselected adults, CD4 > 100, all settings.
Figures and Tables -
Test 24

Unselected adults, CD4 > 100, all settings.

Unselected adults, CD4 ≤ 100, all settings.
Figures and Tables -
Test 25

Unselected adults, CD4 ≤ 100, all settings.

Unselected adults, CD4 ≤ 100, inpatients.
Figures and Tables -
Test 26

Unselected adults, CD4 ≤ 100, inpatients.

Unselected adults, CD4 ≤ 100, outpatients.
Figures and Tables -
Test 27

Unselected adults, CD4 ≤ 100, outpatients.

Unselected adults, CD4 101‐200, all settings.
Figures and Tables -
Test 28

Unselected adults, CD4 101‐200, all settings.

Unselected adults, CD4 101‐200, inpatients.
Figures and Tables -
Test 29

Unselected adults, CD4 101‐200, inpatients.

Unselected adults, CD4 101‐200, outpatients.
Figures and Tables -
Test 30

Unselected adults, CD4 101‐200, outpatients.

Summary of findings 1. LF‐LAM for symptomatic participants

Review question: what is the diagnostic accuracy of LF‐LAM for the diagnosis of active tuberculosis in HIV‐positive adults with signs and symptoms of tuberculosis?

Studies: cross‐sectional studies and randomized controlled trials

Participants: HIV‐positive adults with tuberculosis signs and symptoms

Setting: all settings (inpatient and outpatient)

Index test: LF‐LAM

Threshold for index tests: manufacturer's recommended threshold for positivity i.e. grade 1 of 4 (revised reference card) or the corresponding grade 2 of 5 (prior reference card)

Reference standard: microbiological (mycobacterial culture and/or nucleic acid amplification test)

Role: an add on to clinical judgement and with other tests to assist in tuberculosis diagnosis

Pooled sensitivity (95%CrI): 42% (31% to 55%); pooled specificity (95% CrI): 91% (85% to 95%)

Test result

Number of results per 1000 participants tested (95% CrI)

Number of participants (studies)

Certainty of the evidence (GRADE)

Prevalence 1%

Typically seen in asymptomatic persons in outpatient settings

Prevalence 10%

Typically seen in symptomatic persons in all settings

Prevalence 30%

Typically seen in seriously ill persons in inpatient settings

True positives

4 (3 to 6)

42 (31 to 55)

126 (93 to 165)

1277 (8)

⊕⊕⊕⊝
MODERATEa,b,c,d

False negatives

6 (4 to 7)

58 (45 to 69)

174 (135 to 207)

True negatives

901 (842 to 941)

819 (765 to 855)

637 (595 to 665)

2172 (8)

⊕⊝⊝⊝
VERY LOWc,e,f

False positives

89 (49 to 148)

81 (45 to 135)

63 (35 to 105)

Abbreviations: Crl: credible interval.

Explanations

aAs assessed by QUADAS‐2, in the patient selection domain, we judged six studies (75%) at high risk of bias because they did not avoid inappropriate exclusions. We downgraded one level for risk of bias.
bFor individual studies, sensitivity estimates ranged from 23% to 68%. We thought that differences in enrolment criteria (different populations targeted) or CD4 count could explain in part the heterogeneity. We did not downgrade for inconsistency.
cThe median tuberculosis prevalence in the studies was 42% and thus the results tend to be more applicable to settings with a higher tuberculosis prevalence. For tuberculosis prevalence of 1% and 10%, whether or not to downgrade remains unclear. It is possible the test will perform differently at lower prevalences. We did not downgrade for indirectness.
dWe thought the 95% CrIs around true positives and false negatives would likely not lead to different decisions depending on which credible limits are assumed. We did not downgrade for imprecision.
eAs assessed by QUADAS‐2, in the reference standard domain, we judged seven studies (88%) at high risk of bias because we thought the reference standard used was unlikely to correctly classify the target condition. We downgraded two levels for risk of bias.
fWe thought the 95% CrIs around true negatives and false positives would likely lead to different decisions depending on which credible limits are assumed. We downgraded one level for imprecision.

GRADE certainty of evidence (GRADEpro 2015; Balshem 2011)
High: we are very confident that the true effect lies close to that of the estimate of the effect.
Moderate: we are moderately confident in the effect estimate: The true effect is likely to be close to the estimate of the effect, but there is a possibility that it is substantially different.
Low: our confidence in the effect estimate is limited: The true effect may be substantially different from the estimate of the effect.
Very low: we have very little confidence in the effect estimate: The true effect is likely to be substantially different from the estimate of effect.

The table displays normalized frequencies within a hypothetical cohort of 1000 patients at three different prevalences of tuberculosis (pre‐test probabilities): 1%, 10% and 30%. Credible limits (Crls) were estimated based on those around the point estimates for pooled sensitivity and specificity.

Note: the results on this table should not be interpreted in isolation from the results of the individual included studies contributing to each summary test accuracy measure. These are reported in the main body of the text of the review.

Figures and Tables -
Summary of findings 1. LF‐LAM for symptomatic participants
Summary of findings 2. LF‐LAM for unselected participants

Review question: what is the diagnostic accuracy of LF‐LAM for the diagnosis of active tuberculosis in HIV‐positive adults irrespective of signs and symptoms of tuberculosis?

Studies: cross‐sectional studies and randomized controlled trials

Participants: HIV‐positive unselected adults not assessed for signs and symptoms of tuberculosis i.e. irrespective of symptoms

Setting: all settings (inpatient and outpatient)

Index test: LF‐LAM

Threshold for index tests: manufacturer's recommended threshold for positivity i.e. grade 1 of 4 (revised reference card) or the corresponding grade 2 of 5 (prior reference card)

Reference standard: microbiological (mycobacterial culture and/or nucleic acid amplification test)

Role: an add on to clinical judgement and with other tests to assist in tuberculosis diagnosis

Pooled sensitivity (95% CrI): 35% (22% to 50%); pooled specificity (95% CrI): (89% to 98%)

Test result

Number of results per 1000 participants tested (95% CrI)

Number of participants (studies)

Certainty of the evidence (GRADE)

Prevalence 1%

Typically seen in asymptomatic persons in outpatient settings

Prevalence 10%

Typically seen in symptomatic persons in all settings

Prevalence 30%

Typically seen in seriously ill persons in inpatient settings

True positives

3 (2 to 5)

35 (22 to 50)

105 (66 to 150)

432 (7)

⊕⊕⊕⊝
MODERATEa,b,c

False negatives

7 (5 to 8)

65 (50 to 78)

195 (150 to 234)

True negatives

941 (881 to 970)

855 (801 to 882)

665 (623 to 686)

2933 (7)

⊕⊕⊝⊝
LOWd,e,f

False positives

49 (20 to 109)

45 (18 to 99)

35 (14 to 77)

Abbreviations: Crl: Credible interval.

Explanations

aAs assessed by QUADAS‐2, in the patient selection domain, we judged four studies (57%) at high risk of bias because they did not avoid inappropriate exclusions. We downgraded one level for risk of bias.
bFor individual studies, sensitivity ranged from 0% to 67%. We thought that the percentage of patients with tuberculosis symptoms or differences in CD4 count could explain in part the heterogeneity. One study, LaCourse 2016, with sensitivity of 0% differed from the other studies by including a) a population of exclusively pregnant women attending an antenatal care setting, b) a low proportion of symptomatic participants (19%), c) a low tuberculosis prevalence (1%), and d) a high median CD4 cell count (437 cells per µL). One study, Thit 2017, with sensitivity 67% differed from the other studies by being conducted in Myanmar, and was the only study included in this review that evaluated LF‐LAM in a setting outside sub‐Saharan Africa. We did not downgrade for inconsistency.
cWe thought the 95% CrI around true positives and false negatives would likely not lead to different decisions depending on which credible limits are assumed. We did not downgrade for imprecision.
dAs assessed by QUADAS‐2, in the reference standard domain, we judged five studies (71%) at high risk of bias because we thought the reference standard used was unlikely to correctly classify the target condition. We downgraded one level for risk of bias.
eFor individual studies, specificity ranged from 67% to 99%. Eighty‐six per cent (6/7) of the included studies had specificity of 94% or higher. One study, Thit 2017, with specificity 67% differed from the other studies by being conducted in Myanmar, and is the only study included in this review that evaluated LF‐LAM in a setting outside sub‐Saharan Africa. We did not downgrade for inconsistency.
fWe thought the wide 95% Crls around true negatives and false positives would lead to different decisions depending on which credible limits are assumed. We downgraded one level for imprecision.

GRADE certainty of evidence (GRADEpro 2015; Balshem 2011)
High: we are very confident that the true effect lies close to that of the estimate of the effect.
Moderate: we are moderately confident in the effect estimate: The true effect is likely to be close to the estimate of the effect, but there is a possibility that it is substantially different.
Low: our confidence in the effect estimate is limited: The true effect may be substantially different from the estimate of the effect.
Very low: we have very little confidence in the effect estimate: The true effect is likely to be substantially different from the estimate of effect.

The table displays normalized frequencies within a hypothetical cohort of 1000 patients at three different prevalences of tuberculosis (pre‐test probabilities): 1%, 10% and 30%. Credible limits (Crls) were estimated based on those around the point estimates for pooled sensitivity and specificity.

Note: the results on this table should not be interpreted in isolation from the results of the individual included studies contributing to each summary test accuracy measure. These are reported in the main body of the text of the review.

Figures and Tables -
Summary of findings 2. LF‐LAM for unselected participants
Table 1. Summary characteristics of included studies

Study

Participants (% symptom)

Setting

Median CD4 cell count per µL (IQR)

TB prevalence % (n/N)

Did the study avoid inappropriate exclusion?

Specimens collected

High‐quality reference standarda

Unique study characteristics

HIV‐positive adults with signs and symptoms of TB

Drain 2016

Symptomatic:
Two of four TB‐related symptoms (cough, fever weight loss, night sweat) for > 2 weeks; smear microscopy negative x 2

Outpatient

168 (89 to 256)

63%
(57/90)

No

Pulmonary samples

No

Adults (> 18 years); HIV positive (93.2%); targeting a relatively well outpatient population; Karnofsky performance score > 50

Huerga 2017

Symptomatic:

Cough > 2 weeks or any cough and one of weight loss, night sweats or fever; severely ill; CD4< 200 or BMI below 17

Outpatients (33%); Inpatients (67%)

109 (43 to 214)

57% (156/275)

No

Pulmonary samples; urine Xpert only for patients without sputum available

No

Adults (> 15 years); LAM‐guided treatment; excluded many participants from analysisb

Juma 2017

Symptomatic:

Suggestive of extrapulmonary TB, not specified

Inpatients

Not stated

33%
(29/67)

No

Extrapulmonary samples only, no sputum samples

No

Adults (> 14 years), HIV‐positive (68%); excluded patients with concomitants active pulmonary TB

Nakiyingi 2014

Symptomatic:

Any of cough, fever weight loss, night sweat

Outpatients (45%); Inpatients (55%)

152 (41 to 337)

37%
(367/997)

No

Pulmonary samples; Blood culture for all

Yes

Adults (> 18 years); multisite; large sample size.

Pandie 2016

Symptomatic:

Presence of a pericardial effusion and suspected of pericardial TB

Inpatients

139
(81 to 249)

95%
(36/38)

No

Extrapulmonary samples (pericardial effusion); pulmonary samples for some

No

Adults (> 18 years); HIV‐positive (74%); excluded participants from analysis affecting specificityc

Peter 2012a

Symptomatic:

Any of cough, fever weight loss, night sweat

Inpatients

90
(47 to 197)

48%
(116/241)

Yes

Clinically relevant pulmonary samples; clinically relevant extrapulmonary samples. No study defined algorithm.

No

Adults (> 18 years); multisite; TB diagnostic work‐up was not standardized but up to clinical judgements

Peter 2015

Symptomatic:

Any of cough, fever weight loss, night sweat

Outpatients

210
(103 to 375)

32%
(181/569)

No

Pulmonary samples

No

Adults (> 18 years); multisite; nested within a randomized, parallel‐arm trial.

Peter 2016

Symptomatic:

Any of cough, fever weight loss, night sweat

Inpatients

81

(26 to 198)

29%
(342/1172)

Yes

Pulmonary samples; clinically relevant extrapulmonary samples. No study defined algorithm.

No

Adults (> 18 years); multisite; LAM arm of a randomized controlled trial.

HIV‐positive adults irrespective of signs and symptoms of TB

Bjerrum 2015

Unselected:

91% symptomatic

Outpatients (85%); Inpatients (15%)

127
(35 to 256)

12%
(55/469)

No

Pulmonary samples

No

Adults (> 18 years); majority symptomatic.

Drain 2015a

Unselected:

proportion symptomatic not stated

Outpatient

248
(107 to 379)

17%
(54/320)

No

Pulmonary samples

No

Adults (> 18 years)

Floridia 2017

Unselected:

34% symptomatic

Outpatient

278
(142 to 395)

9%
(90/972)

No

Pulmonary samples

No

Adults (> 15 years). LAM‐guided treatment.

Hanifa 2016

Unselected:

53% symptomatic

Outpatient

111
(56 to 161)

9%
(40/408)

Yes

Pulmonary samples; blood culture for all

Yes

Adults (> 18 years); CD4 < 200; reference standard included any sample taken within six months from enrolment.

LaCourse 2016

Unselected:

19% symptomatic

Outpatient

437
(342 to 565)

1%
(3/266)

No

Pulmonary samples

No

Pregnant women (> 16 years) attending ANC; healthy population; one person with CD4< 400; Few TB cases (n = 3).

Lawn 2017

Unselected:

91% symptomatic

Inpatients

149
(55‐312)

33%
(139/413)

Yes

Pulmonary samples; Blood culture for all; Clinically relevant extrapulmonary samples

Yes

Adults (> 18 years). Included many samples from different sites

Thit 2017

Unselected:

33% symptomatic

Outpatients (90%); Inpatients (10%)

270
(128 to 443)

10%
(54/517)

Yes

Pulmonary samples

No

Conducted in Myanmar. Adults (median age 34). Reference standard included samples taken within six months from enrolment.

Abbreviations: LF‐LAM: lateral flow urine lipoarabinomannan assay (Alere Determine™ TB lipoarabinomannan assay); ANC: antenatal clinic; BMI: body mass index; IQR: interquartile range; TB: tuberculosis; Xpert: Xpert MTB/RIF
aFor a microbiological reference standard, we considered a higher quality reference standard to be one in which two or more specimen types were evaluated for TB diagnosis in all participants as part of a defined standardized study algorithm.
bHuerga 2017 excluded participants from analysis if missing Xpert results or culture contaminated for any of the samples in the absence of a positive result; overall samples size 474 (156 with TB); 275 included in analysis (156 with TB).
cPandie 2016 excluded a large number of non‐TB participants from analysis; Overall samples size 102 (36 with TB); 38 included for analysis (36 TB cases).

Figures and Tables -
Table 1. Summary characteristics of included studies
Table 2. LF‐LAM pooled sensitivity and specificity for TB diagnosis, by study population

Type of analysis

Symptomatic participants

Unselected participants

Studies (total participants)

Participants with TB (%)

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Studies (total participants)

Participants with TB (%)

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Overall accuracy

8 studies

(3449)

1277

(37%)

42%

(31% to 55%)

91%

(85% to 95%)

7 studies

(3365)

432

(13%)

35%

(22% to 50%)

95%

(89% to 98%)

By setting

Inpatient

6 studies

(2253)

868

(39%)

52%
(40% to 64%)

87%
(78% to 93%)

3 studies

(537)

159

(30%)

62%
(41% to 83%)

84%
(48% to 96%)

Outpatient

4 studies

(1196)

409

(34%)

29%

(17% to 47%)

96%

(91% to 99%)

6 studies

(2828)

273

(10%)

31%

(18% to 47%)

95%

(87% to 99%)

By CD4 cell

CD4 > 200

3 studies

(738)

163

(22%)

16%
(8% to 31%)

94%
(81% to 97%)

1 studya

(156)

11

(7%)

Not applicable

Not applicable

CD4 ≤ 200

4 studies

(1825)

722

(40%)

45%
(31% to 61%)

89%
(77% to 94%)

2 studies

(706)

82

(12%)

26%
(9% to 56%)

96%
(87% to 98%)

CD4 > 100

4 studies

(1519)

425

(28%)

17%
(10% to 27%)

95%
(89% to 98%)

4 studies

(952)

115

(12%)

20%
(10% to 35%)

98%
(95% to 99%)

CD4 ≤ 100

4 studies

(1239)

512

(41%)

54%
(38% to 69%)

88%
(77% to 94%)

3 studies

(417)

130

(31%)

47%
(40% to 64%)

90%
(77% to 96%)

CD4 101‐199

4 studies

(586)

210

(36%)

24%
(14% to 38%)

90%
(77 to 96)

1 study

(103)b

13

(13%)

Not applicable

Not applicable

By CD4 and setting

CD4 ≤ 200

inpatients

2 studies

(1009)

348

(34%)

54%

(34% to 73%)

80%

(58% to 91%)

1 studyc

(54)

14

(26%)

Not applicable

Not applicable

CD4 ≤ 100

inpatients

2 studies

(734)

270

(37%)

61%

(40% to 78%)

81%

(61% to 91%)

2 studies

(200)

84

(42%)

57%

(33% to 79%)

90%

(69% to 97%)

CD4 101‐199

inpatients

2 studies

(275)

78

(28%)

32%

(16% to 57%)

81%

(55% to 92%)

1 studyd

(9)

4

(44%)

Not applicable

Not applicable

CD4 ≤ 200

outpatients

1 studyf

(249)

97

(39%)

Not applicable

Not applicable

2 studies

(652)

68

(10%)

21%

(8% to 48%)

96%

(89% to 99%)

CD4 ≤ 100

outpatients

1 studyg

(121)

48

(40%)

Not applicable

Not applicable

2 studies

(217)

46

(21%)

40%

(20 to 64)

87%

(68 to 94)

CD4 101‐199

outpatients

1 studyh

(128)

51

(40%)

Not applicable

Not applicable

1 studye

(94)

9

(10%)

Not applicable

Not applicable

Abbreviations: LF‐LAM: lateral flow urine lipoarabinomannan assay (Alere Determine™ TB lipoarabinomannan assay); Crl: credible interval; TB: tuberculosis.
aBjerrum 2015, Sensitivity 27% (6% to 61%); Specificity 99% (96% to 100%); bBjerrum 2015, Sensitivity 38% (14% to 68%); Specificity 99% (94% to 100%); cBjerrum 2015, Sensitivity 64% (35% to 87%); Specificity 82% (67% to 93%); dBjerrum 2015, Sensitivity 75% (19% to 99%); Specificity 100% (48% to 100%); eBjerrum 2015, Sensitivity 22% (3% to 60%); Specificity 99% (94% to 100%); fPeter 2015, Sensitivity 24% (16% to 33%); Specificity 94% (89% to 97%); gPeter 2015, Sensitivity 30% (18% to 46%); Specificity 93% (85% to 98%); hPeter 2015, Sensitivity 18% (8% to 31%); Specificity 95% (87% to 99%).

Figures and Tables -
Table 2. LF‐LAM pooled sensitivity and specificity for TB diagnosis, by study population
Table 3. Sensitivity analyses, LF‐LAM

Type of analysis

Symptomatic participants

Unselected participants

Studies participants

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Studies participants

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Including studies at low risk of patient selection bias

2 studies

1413

48%

(29% to 67%)

82%

(61% to 92%)

3 studies

1338

39%

(17% to 66%)

93%

(69% to 98%)

Including studies at low risk of reference standard bias

1 study

997

Insufficient data

Insufficient data

2 studies

821

24%

(8% to 53%)

99%

(95% to 99%)

Including studies that used only fresh specimens

4 studies

2511

52%

(38% to 68%)

91%

(82% to 95%)

5 studies

2544

41%

(26% to 56%)

93%

(82% to 97%)

Re‐classificiation of Bjerrum 2015; Lawn 2017 as studies among symptomatic participant (> 80% participants symptomatic)

10 studies 4331

42%

(33% to 52%)

93%

(88% to 96%)

5 studies

2483

31%

(16% to 50%)

94%

(84% to 98%)

Abbreviations: LF‐LAM: lateral flow urine lipoarabinomannan assay (Alere Determine™ TB lipoarabinomannan assay); Crl: Credible Interval

Figures and Tables -
Table 3. Sensitivity analyses, LF‐LAM
Table 4. Original Alere LAM review, main findings

Type of analysis

Symptomatic participants

Unselected participants

Studies (total participants)

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Studies (total participants)

Pooled sensitivity (95% CrI)

Pooled specificity (95% CrI)

Overall accuracy

5 studies (2313)

45% (29% to 63%)

92% (80% to 97%)

3 studiesa (1055 )

30% (20% to 43%)

94% (86% to 97%)

By setting

Inpatient

4 studies (1299)

53% (38% to 70%)

90 % (73% to 96%)

Insufficient data

Outpatient

Insufficient data

Insufficient data

Abbreviations: LF‐LAM: lateral flow urine lipoarabinomannan assay (Alere Determine™ TB lipoarabinomannan assay); Crl: credible interval

Main findings from the original review on LF‐LAM accuracy (Shah 2016).
aReported at grade 1 on the previous reference scale card with five bands that is outdated and no longer the recommended positivity threshold.

Figures and Tables -
Table 4. Original Alere LAM review, main findings
Table Tests. Data tables by test

Test

No. of studies

No. of participants

1 Symptomatic adults, all settings Show forest plot

8

3449

2 Symptomatic adults, inpatients Show forest plot

6

2253

3 Symptomatic adults, outpatients Show forest plot

4

1196

4 Symptomatic adults, CD4 > 200, all settings Show forest plot

3

738

5 Symptomatic adults, CD4 ≤ 200, all settings Show forest plot

4

1825

6 Symptomatic adults, CD4 ≤ 200, inpatients Show forest plot

2

1009

7 Symptomatic adults, CD4 ≤ 200, outpatients Show forest plot

1

249

8 Symptomatic adults, CD4 > 100, all settings Show forest plot

4

1519

9 Symptomatic adults, CD4 ≤ 100, all settings Show forest plot

5

1251

10 Symptomatic adults, CD4 ≤ 100, inpatients Show forest plot

3

746

11 Symptomatic adults, CD4 ≤ 100, outpatients Show forest plot

1

121

12 Symptomatic adults, CD4 101‐200, all settings Show forest plot

4

586

13 Symptomatic adults, CD4 101‐200, inpatients Show forest plot

2

275

14 Symptomatic adults, CD4 101‐200, outpatients Show forest plot

1

128

17 Unselected adults, all settings Show forest plot

7

3365

18 Unselected adults, inpatients Show forest plot

3

537

19 Unselected adults, outpatients Show forest plot

6

2828

20 Unselected adults, CD4 > 200, all settings Show forest plot

1

156

21 Unselected adults, CD4 ≤ 200, all settings Show forest plot

2

706

22 Unselected adults, CD4 ≤ 200, inpatients Show forest plot

1

54

23 Unselected adults, CD4 ≤ 200, outpatients Show forest plot

2

652

24 Unselected adults, CD4 > 100, all settings Show forest plot

4

952

25 Unselected adults, CD4 ≤ 100, all settings Show forest plot

3

417

26 Unselected adults, CD4 ≤ 100, inpatients Show forest plot

2

200

27 Unselected adults, CD4 ≤ 100, outpatients Show forest plot

2

217

28 Unselected adults, CD4 101‐200, all settings Show forest plot

1

103

29 Unselected adults, CD4 101‐200, inpatients Show forest plot

1

9

30 Unselected adults, CD4 101‐200, outpatients Show forest plot

1

94

Figures and Tables -
Table Tests. Data tables by test