Estimar la concordancia interobservador en la detección de bocio por exploración física en población escolar.
MetodologíaSe realizó un estudio transversal para la detección de bocio en una muestra representativa de 1.134 escolares de 6 a 12 años de 20 colegios del área de salud de La Mancha Centro. La exploración fue realizada de forma enmascarada por 2 únicos observadores. Se establecieron 5 grados de tamaño tiroideo (0, ia, ib, ii y iii). Se consideró bocio a partir del grado ia. La concordancia se valoró en relación con variables como edad, sexo, índice de masa corporal, talla y día de exploración. Se utilizó el índice kappa como medida de concordancia.
ResultadosEn los 1.097 escolares con doble exploración, en 96 (8,8%) se detectó bocio por el observador 1 y en 102 (9,3%) por el 2 (p=0,58). El grado de acuerdo interobservador en la identificación y en la graduación del bocio fue moderado (kappa 0,55; IC del 95%, 0,46-0,64) para la primera y sustancial (kappa ponderado 0,61; IC del 95%, 0,51-0,71) para la segunda. Fue algo mayor en las niñas y en los escolares de mayor edad, peso, talla e índice de masa corporal. La concordancia entre observadores fue relativamente estable a lo largo de la realización del estudio.
ConclusionesLa concordancia interobservador en la detección de bocio por palpación en nuestro estudio es moderada, aunque más baja en los niños más pequeños e invariable durante todo el periodo en el que se realizó.
To estimate the agreement between observers on the detection of goitre by physical exploration in a school population.
MethodologyWe performed a cross-sectional study to detect goitre in a representative sample of 1134 schoolchildren aged 6 to 12 years from 20 schools in the health area of La Mancha Centro. The examination was performed blinded by two observers. Five grades in thyroid size were established (0, Ia, Ib, II and III). Above grade Ia was considered as goitre. The agreement was assessed in relation to variables such as age, sex, body mass index, height, and day of examination. The weighted kappa was used to measure the agreement.
ResultsIn the 1097 schoolchildren with a dual examination, 96 (8.8%) cases of goitre were detected by observer 1, and 102 (9.3%) cases by observer 2, (P=.58). The degree of interobserver agreement in the identification and grading of goitre was moderate (kappa 0,55, 95%CI: 0,46 to 0,64) for the first, and substantial (weighted kappa 0,61; 95%CI: 0,51 to 0,71) for the second. The degree of agreement was somewhat higher in girls, older schoolchildren, increased weight, height, and body mass index. The interobserver agreement was relatively stable throughout the study.
ConclusionsThe interobserver agreement in detecting goitre by palpation in our study is moderate, but is lower in younger children and stable for the duration of study.
La exploración física sigue siendo el método de elección de detección de bocio en estudios poblacionales1 por su facilidad de implantación, la estandarización de sus resultados y su bajo coste. La ecografía, a pesar de ser más precisa, no ha logrado imponerse para su uso en estos estudios por la dificultad de estandarización de sus valores a todas las poblaciones2, por su mayor coste económico y porque la palpación, en manos experimentadas, puede dar resultados que concuerdan satisfactoriamente con la medición ecográfica3,4.
En los trabajos de investigación en los que participan varios observadores es esencial demostrar una buena concordancia entre los resultados obtenidos de ellos.
El presente estudio, preliminar a otro que medirá la prevalencia de la deficiencia de yodo en la población escolar de un área sanitaria, tiene como objetivo establecer el grado de concordancia en la exploración tiroidea por palpación entre los 2 exploradores participantes.
Sujetos y métodosSe realizó un estudio transversal sobre una muestra representativa de los escolares de 6 a 12 años residentes en el área sanitaria de La Mancha Centro, que abarca poblaciones de Ciudad Real, Cuenca y Toledo.
Sobre una población de 13.896 niños repartidos en 73 centros escolares, se realizó un muestreo por conglomerados bietápico, con probabilidades proporcionales a los tamaños de la unidad de primera etapa. En la primera fase se seleccionaron 20 conglomerados (colegios) y en la segunda se realizó un muestreo aleatorio sistemático de 60 niños en cada centro seleccionado.
Los 2 únicos exploradores participantes en el estudio (AMS, PFG) son pediatras. Antes de iniciar el estudio ambos unificaron criterios con la ayuda del investigador principal (AGG), endocrinólogo. Todos ellos con más de 10 años de experiencia clínica. La evaluación del tiroides se realizó, por inspección y palpación, de manera enmascarada por los 2 exploradores.
La clasificación del tamaño tiroideo se basó en la definición de bocio propuesta por Pérez et al.5 (tabla 1). De cada niño se escogió como medida del tamaño tiroideo la menor de entre las obtenidas cuando hubo duda entre los 2 evaluadores.
Clasificación del tamaño del tiroides por inspección y palpación
Grado | Tamaño |
0 | No palpable o lóbulo palpable, pero menor o igual que la falange distal del pulgar del individuo explorado |
Ia | Nódulo palpable, pero mayor que la falange distal del pulgar del individuo explorado |
Ib | Bocio palpable y visible solo con el cuello en extensión completa |
II | Bocio visible con el cuello en posición normal |
III | Bocio de gran tamaño, visible a 10 m de distancia |
Las variables cuantitativas se resumieron mediante medidas de tendencia central y dispersión (media ± desviación estándar [DE]) y la cualitativas con frecuencias absolutas y relativas, expresadas como porcentajes.
La concordancia ente observadores se estimó para el acuerdo en la identificación del bocio (presencia/ausencia) y el acuerdo en la graduación del mismo (0, ia, ib, ii, iii). Se estimó el grado de acuerdo con el índice kappa, utilizando la versión ponderada (con pesos cuadráticos de las distancias) para la concordancia en la graduación. La interpretación del índice kappa se hizo siguiendo los criterios de Landis y Koch6.
Calculamos el grado de acuerdo entre los observadores para diferentes estratos definidos por la edad, el sexo y algunas características antropométricas (peso, talla e índice de masa corporal [IMC]) del escolar. El posible impacto de cada variable sobre la concordancia la comprobamos contrastando la homogeneidad de los índices kappa estimados para cada categoría.
Los cálculos fueron realizados con el programa estadístico PASW 18.0 y EPIDAT 3.1 (Xunta de Galicia, OPS).
ResultadosSe reclutó a 1.134 alumnos procedentes de 20 centros de educación primaria del área estudiada.
En 1.097 escolares (589 niños [53,7%] y 508 niñas [46,3%], con una edad media ± DE de 9,3 1,8 años) se realizó una exploración por 2 observadores de forma independiente, identificando y graduando la presencia de bocio.
De estos 1.097, en 96 (8,8%) se detectó bocio por el observador 1 y en 102 (9,3%) por el 2, aunque las diferencias no fueron estadísticamente significativas (p=0,58) (tabla 2). En 58 (5,3%) ambos observadores coincidieron en la detección de bocio y 140 niños (12,8%) fueron clasificados con bocio por uno u otro. El grado de concordancia entre observadores fue moderado (kappa 0,55; IC del 95%, 0,46 a 0,64).
El grado de acuerdo en la graduación del bocio fue mayor que en la identificación del mismo (kappa ponderado 0,61; IC95% 0,51 a 0,71).
El grado de acuerdo fue algo mayor en las niñas y en los escolares de mayor edad, peso, talla e IMC. La talla fue la variable que más se relacionó con el acuerdo en la identificación y graduación del bocio (tabla 3).
Niveles de concordancia en relación con la edad, el sexo y las variables antropométricas
N.° | Concordancia identificacióna | p | Concordancia graduaciónb | p | |
Sexo | 0,27 | 0,29 | |||
Niños | 589 | 0,50 (0,37-0,62) | 0,56 (0,41-0,71) | ||
Niñas | 508 | 0,59 (0,47-0,71) | 0,66 (0,54-0,78) | ||
Edad | 0,66 | 0,41 | |||
6-7 años | 300 | 0,45 (0,25-0,66) | 0,53 (0,30-0,76) | ||
8-9 años | 362 | 0,53 (0,38-0,67) | 0,52 (0,37-0,68) | ||
10-11 años | 344 | 0,61 (0,47-0,74 | 0,69 (0,54-0,84) | ||
12-14 años | 91 | 0,52 (0,15-0,89) | 0,68 (0,40-0,99) | ||
Masa corporal (kg/m2) | |||||
Q1 (12,6-15,9) | 265 | 0,45 (0,11-0,79) | 0,54 | 0,41 (0,08-0,74) | 0,58 |
Q2 (16,0-17,9) | 267 | 0,44 (0,22-0,65) | 0,66 (0,42-0,89) | ||
Q3 (18,0-20,4) | 276 | 0,51 (0,34-0,68) | 0,55 (0,37–0,73) | ||
Q4 (20,5-34,4) | 273 | 0,60 (0,47-0,73) | 0,63 (0,49-0,77) | ||
Peso (kg) | 0,049 | 0,31 | |||
Q1 (16,8-26,9) | 263 | 0,42 (0,09-0,74) | 0,39 (0,07-0,71) | ||
Q2 (27,0-33,1) | 272 | 0,44 (0,22-0,65) | 0,46 (0,20-0,72) | ||
Q3 (33,2-41,8) | 272 | 0,51 (0,35-0,68) | 0,65 (0,48-0,82) | ||
Q4 (41,9-93,8) | 276 | 0,61 (0,48-0,74) | 0,65 (0,51-0,79) | ||
Talla (cm) | 0,11 | 0,12 | |||
Q1 (110,1-127,5) | 269 | 0,38 (0,10-0,65) | 0,36 (0,09-0,64) | ||
Q2 (127,6-135,7) | 272 | 0,42 (0,22-0,61) | 0,55 (0,35-0,75) | ||
Q3 (135,8-145,8) | 274 | 0,55 (0,40-0,71) | 0,55 (0,37-0,72) | ||
Q4 (146,1-175,0) | 269 | 0,67 (0,53-0,81) | 0,72 (0,57-0,86) |
Resultados expresados como kappa (intervalo de confianza del 95%).
p: significación de la prueba de homogeneidad de kappas; Q1, Q4: cuartiles.
La concordancia entre observadores fue relativamente estable a lo largo de la realización del estudio, con un acuerdo que se mantuvo moderado, kappas entre 0,50 y 0,60, a partir del centenar de exploraciones realizadas (fig. 1).
DiscusiónLa prevalencia de bocio es una medida indirecta de deficiencia nutricional de yodo en una población determinada7. Las 2 técnicas utilizadas en los estudios poblacionales para la medición del tamaño tiroideo, la exploración física y la ecografía presentan ventajas y desventajas una sobre la otra4,8,9, pero la mayoría de los estudios utilizan la primera. Nosotros utilizamos una clasificación del tamaño tiroideo basada en un concepto de bocio propuesto en 1960 por Pérez et al.5, que considera patológico todo tiroides palpable con un lóbulo mayor que la falange distal del pulgar del individuo explorado, en lugar de una posterior (1993), más simple, que define como bocio todo tiroides detectado por palpación10 porque, aunque la segunda es más fácil de utilizar en estudios poblacionales, tiene menos especificidad y puede sobreestimar la prevalencia de bocio entre un 20 y un 30%8, y porque los estudios sobre prevalencia de bocio de zonas geográficas cercanas a la nuestra utilizaron clasificaciones similares. La prevalencia de bocio en nuestro estudio (8,8 y 9,3%, según el explorador) fue menor que la detectada en 1993 en 3 áreas diferentes de nuestra comunidad autónoma, que oscilaron entre el 18 y el 24%11-13.
Un índice kappa entre 0,41 y 0,61 se considera moderado, y bueno por encima de 0,614. El grado de concordancia interobservador en la identificación de bocio en nuestro estudio, que fue de 0,55, está en el rango medio de lo publicado4,8,14-16. Una baja concordancia entre observadores influye sobre las estimaciones de la prevalencia de bocio14. Por esta razón, proponemos introducir la medición del grado de concordancia interobservador en los protocolos de estudio de bocio endémico. Además, como una buena concordancia interobservador no garantiza necesariamente la validez del procedimiento diagnóstico, también sería interesante incorporar en estos protocolos el grado de acuerdo entre la exploración física y ecográfica (más objetiva), al menos en un grupo reducido de sujetos.
El índice de concordancia se mantuvo estable a lo largo de la duración del estudio. Esta estabilidad puede deberse a que nuestros exploradores poseían ya una amplia experiencia en la palpación cervical al inicio del estudio y probablemente no modificaron sus criterios diagnósticos a lo largo del mismo, algo que sí ocurre cuando los exploradores son inexpertos8.
El índice sí se modificó llamativamente con algunas características de los individuos analizados. La concordancia aumentó con la edad (salvo en el último cuartil), el IMC, el peso y, sobre todo, con la talla. Los índices de concordancia más bajos (≤ 0,45) fueron detectados en niños menores de 7 años, con un IMC<18kg/m2, con un peso menor de 33,2kg y una talla inferior a 135,8cm. Estos datos sugieren que la concordancia interobservador es paralela al tamaño de sujeto. Por otra parte, como además el volumen del tiroides aumenta progresivamente con la edad, el peso, la talla y el área de superficie corporal2,17, nuestros resultados podrían interpretarse como que la concordancia interobservador depende del tamaño tiroideo, siendo las medidas antropométricas medidas indirectas de este. Esta impresión se ve corroborada por el hecho de haber detectado en las áreas con menor prevalencia de bocio, donde el tamaño del tiroides es menor, un menor índice de concordancia18; y esto podría explicar, en parte, el menor índice kappa hallado en nuestro estudio frente al de Peris Roig et al.14, a pesar de utilizar unos criterios de detección de bocio similares. Parece, pues, que la exploración cervical no es un método diagnóstico fiable de bocio en los niños más pequeños2.
En conclusión, la concordancia interobservador en la detección de bocio por palpación en nuestro estudio es moderada, aunque más baja en los niños más pequeños y se muestra invariable durante todo el periodo en el que se realizó.
FinanciaciónEste trabajo ha sido financiado con la ayuda de un proyecto de investigación de la Fundación Socio-Sanitaria de Castilla-La Mancha (AN-2010/44).
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses.
A Angel Arias Arias, de la Unidad de Investigación de La Mancha Centro, por su labor en la confección y depuración de la base de datos.