Este interesante artículo fue publicado en la revista Malaria Journal en el 2010.
El Abstract es el siguiente:
La región donde se realiza el estudio es la siguiente:
He elegido el artículo para comentar por el uso que hace de un análisis estadístico muy interesante: el Análisis de componentes principales. Es una técnica multivariante que combina las variables originales creando unas macrovariables (Componentes) que son diferentes combinaciones, con distintos pesos, de esas variables originales, y que explican (las primeras de esas componentes: por eso se llaman principales) la mayor parte de la variabilidad que hay entre los datos que tenemos.
Observemos, a través de la redacción de los métodos, cuáles han sido las variables utilizadas en el análisis, en este estudio. Como podemos ver variables socioeconómicas, como nos indica el título del artículo:
El Análisis de componentes principales que realizan a una muestra de tamaño 1496, da los siguientes resultados básicos:
La primera componente no explica mucho. Pero es la que explica más varianza. Explica el 20% de la variabilidad. Observemos que se ha trabajado con 11 variables originales y se obtiene 11 componentes. Lo que sucede es que son 11 componentes (11 combinaciones distintas de las variables originales) con una capacidad muy desigual de explicar la variabilidad intrínseca en los datos, como puede verse en la columna donde está la proporción de la varianza explicada por cada componente (las denomina «factores»).
Ellos han trabajado con esta primera componente, que es la que explica más varianza y que, además, tiene gran interés para lo que persigue el estudio. Suma todas las variables originales. Con pesos un poco diferentes, es cierto, pero siempre con el coeficiente positivo. Lo que nos separa las personas con buen o con mas nivel socioeconómico evaluado por esas 11 variables originales. Quien tiene más comunidades de las enunciadas en las diferentes variables es el que puntúa más en la componente. Por lo tanto, esta componente evalúa el nivel socioeconómico pesando mediante esos coeficientes las 11 variables originales.
La utilización de las componentes a partir de un estudio así puede tener muchas direcciones. Ellos exponen el uso que le han dado a la principal de esas componentes, a la primera:
Es interesante ver ese uso. Están haciendo una Regresión logística relacionando esa primera componente principal con el tener o no malaria y obtienen esas Odds ratio.