Recientemente hemos constatado que se ha generalizado la idea errónea de que, a fin de que los resultados de un estudio epidemiológico sean generalizables, la muestra a estudio debe ser representativa de la población general. Se trata, desgraciadamente de un error persistente en investigación biomédica que radica en la tergiversación de las definiciones de la estadística descriptiva y la estadística inferencial1. Dado que no se puede estudiar la población completa, toda investigación debe apoyarse en muestras, más o menos grandes, de esa población. Decimos que una muestra es representativa cuando su estructura en relación a las variables de interés (proporción de varones y mujeres, de expuestos y no expuestos o de sanos y enfermos..., por ejemplo) es la misma que la de la población de la que procede.
La estadística descriptiva se apoya en la generalización estadística, la extrapolación mecánica de los resultados de una muestra a la totalidad de la población, por lo que, en este tipo de estudios, la representatividad de la muestra es una característica esencial. Este tipo de estudios no buscan establecer una relación causal entre 2 variables ni explicar un determinado mecanismo fisiopatológico, sino simplemente describir las características de una población en un determinado momento2. Por otro lado, la estadística inferencial pretende explicar el efecto de una exposición o una serie de exposiciones. Para ello serán necesarias una muestra de tamaño adecuado, una amplia variabilidad en la exposición y suficiente validez en la información reportada, pero no una muestra representativa de la población2.
La generalización de los resultados de un estudio científico no es un proceso puramente estadístico, sino un proceso de abstracción mediante el que se da paso de los hechos observados a una hipótesis abstracta universal. Así, la muestra a estudio debe poseer aquellas características que permitan comparar las hipótesis investigadas, pero no ha de ser necesariamente representativa de la población, en el sentido estadístico del término1,2.
Es importante señalar que la selección de muestras representativas no solo no es siempre necesaria, sino que además puede resultar en perjuicio de la investigación3. Es por ello que los mejores estudios de cohortes, como el Framingham, el estudio de las enfermeras (NHS) y el de los hijos de las enfermeras (GUTS), estos últimos de la Escuela de Salud Pública de Harvard y cuya calidad científica ha sido sobradamente demostrada, no se basan en muestras representativas de la población a estudio.
En conclusión, los estudios descriptivos, apoyados en la representatividad estadística, permiten establecer afirmaciones particulares sobre la población y son de gran utilidad para generar nuevas hipótesis. Sin embargo, el camino para una mejor comprensión de la naturaleza de la asociación entre 2 o más variables lo componen estudios analíticos que, sin requerir muestras representativas de la población, permitan controlar adecuadamente la confusión. El valor de los buenos estudios radica en que sus resultados pueden aplicarse a poblaciones muy diferentes, especialmente en el futuro, porque las relaciones biológicas son generalizables, aunque los individuos estudiados no lo sean.