Tema 18: ANÁLISIS FACTORIAL

1. El punto de partida del Análisis factorial (AF) es el mismo que el del Análisis de componentes principales (ACP). De hecho, como explicaré más adelante, en realidad, el ACP es un AF que, debido a su simplicidad y su aplicabilidad, se ha independizado y ha adquirido vida propia. Hemos visto primero el ACP porque es más sencillo en cuanto a maquinaria y, por razones, didácticas es mejor empezar por él.

2. La finalidades del AF son, pues, las mismas que teníamos en el ACP: 1) Conseguir una representación gráfica de una realidad que es imposible representar en toda su extensión, visualizar una visión aproximada de una nube de puntos original que es imposible visualizar por exceso de dimensiones. 2) Conseguir combinaciones de las variables originales que nos ayuden a discernir tipos de relaciones que se establecen entre las variables del estudio.

3. Recordemos, en primer lugar, en formato matemático, cuál era el procedimiento del ACP. Se trataba de crear unas nuevas variable (la componentes) que tuvieran una gran diferencia entre la variabilidad explicada y que, cada una de ellas fuera combinación lineal de las variables originales:

IMG_4601

4. De d variables originales obtenemos d componentes, pero nos quedamos únicamente con las primeras, las principales, por almacenar en su interior mucha más información de la nube de puntos original. El formato matemático del AF es este otro:

IMG_4629

5. A las variables F1, F2, …, Fc, las llamamos factores. Importante que c sea menor que d. En realidad, interesa que sea mucho menor, que con dos o tres factores tengamos suficiente, como con la componentes principales: interesa que unas pocas acumulen mucha información, mucha varianza de la nube de puntos original. Cada uno de los factores es, también, como las componentes, una combinación lineal de todas las variables originales:

IMG_4630

6. Como puede apreciarse estos factores son como las componentes. Los factores son independientes entre ellos, también, como las componentes. Pero no se crean d factores sino que se crean un número c que es siempre menor que d, como ya hemos dicho antes.

7. El conjunto de estos factores constituyen la llamada comunalidad. Esto es muy interesante. Observemos aquí la diferencia con el planteamiento del ACP. En el AF escribimos cada una de las variables originales como una combinación de esos factores comunes. Los factores son, por lo tanto, elementos que están en el interior de esas variables, como sus elementos indisociables. Los factores son como si fueran las piezas profundas de lo que está hecha la diversidad de las variables que vemos y cuantificamos. Los factores serían, pues, como los átomos que se combinan, en proporciones distintas, en las moléculas (que serían las variables del estudio).

8. Las variables U1, U2, …, Ud son las llamadas unicidades, porque cada una de ellas es única y distinta en cada una de las variables originales. La comunalidad capta lo común, las unicidades suman lo diverso.

9. Las unicidades son una especie de Residuo, un elemento individual de cada una de las d variables originales y que es lo que queda por explicar de cada una de ellas después de haber sumado una combinación peculiar y única de los factores en cada una de ellas, después de haber introducido en ellas lo que tienen de la comunalidad, de lo común, de lo que se explica por los factores comunes elegidos.

10. Es muy importante comparar el AF con el ACP, porque en esa comparación está el elemento diferencial entre esas dos técnicas y será precisamente esta comparación la que nos ayudará a encontrar la singularidad del Análisis que ahora nos ocupa.

11. Lo primero a distinguir es que en el ACP tiene solución única, lo que significa que, cuando se pone en marcha la maquinaria de la técnica frente a unos datos, hay una única solución, la que proporciona, como hemos visto, los valores propios y los vectores propios. La única opcionalidad que tenemos es, como ya hemos dicho en el tema dedicada al ACP, trabajar con la matriz de correlaciones o la de varianzas-covarianzas. Sin embargo, en el AF, no hay una única solución, hay distintas formas de extracción de los factores y cada una de ellas da lugar a un resultado distinto. Al separar una parte común (la comunalidad: los factores) y una parte única (las unicidades) de cada una de las variables originales, estamos creando las condiciones para generar formas distintas de llegar a esa situación y, por lo tanto, que haya soluciones distintas.

12. Al no haber una solución única, como sucede con el ACP, se han diseñado muchas formas de extracción de los factores. Posiblemente el sistema de extracción de los mínimos cuadrados sea el más usual, pero hay otros, por ejemplo: Método del centroide, Método de Jacobi, Método de la máxima verosimilitud. De hecho, el propio sistema de las componentes principales es también un método de extracción de factores: mediante ese método se seleccionan las dos o tres primeras componentes conviertiéndolas en los factores. Observemos que entonces las componentes Y las convertimos en factores F. Hay que decir que, aunque sean muchos los métodos de extracción, en realidad son pocos los que han sido implementados en los principales software estadísticos.

13. El sistema de los mínimos cuadrados, que es uno de los métodos más usado, se basa en la búsqueda de la recta, del plano o del hiperplano (dependiendo del número de factores elegidos) que minimice las unicidades, que actuarían aquí como el residuo de la Regresión. Es un planteamiento derivado, evidentemente, de la Regresión lineal.

14. Gráficamente esto que estoy diciendo se puede ilustrar de la siguiente forma: Dada una nube de puntos según el criterio que sigamos puede ser que el factor generado sea ligeramente diferentes. Por ejemplo, en el siguiente caso la recta roja podría seguir el criterio de las componentes (la búsqueda de la máxima variabilidad en el primer eje) y la recta verde podría seguir el criterio de los mínimos cuadrados:

IMG_2712

15. La segunda diferencia entre el ACP y el AF está en la idea de rotaciones presente en el AF y que no lo está en el ACP. Una vez se han extraído los factores, cada uno de ellos es, como hemos visto, una determinada combinación de las variables originales, combinación caracterizada por una serie de coeficientes que multiplican a esas variables y que están asociados a cada factor. Pues bien, esos factores se pueden rotar según criterios distintos. Se trata de pequeños giros de los nuevos ejes de coordenadas con la finalidad de mejorar algún aspecto prefijado.

16. Rotar implica que cambien los coeficientes. Cualquier cambio de los ejes supone un cambio de los coeficientes. Si con ligeros cambios de los ejes, y, por lo tanto, de los coeficientes, se pierde poca capacidad de representación y se gana en algún criterio prefijado, entonces vale la pena la rotación.

17. El método de rotación más usual es el Varimax que minimiza el número de variables, en cada factor, con coeficientes elevados en valor absoluto.

18. Pensemos que el juego de muchos coeficientes actuando en un factor, en el AF, o en una componente principal, en el ACP, puede dificultar mucho su interpretación. Es difícil ponerle  entonces nombre a esa macrovariable. La rotación Varimax realiza una rotación que simplifica, lo más posible, el repertorio de coeficientes. Se consigue que haya menos coeficientes con valores absolutos grandes pero que esos valores absolutos sean más grandes que sin la rotación. Esto aclara la interpretación, generalmente.

19. Existen otros criterios de rotación: Quartimax, Equamax, etc, pero son de largo mucho menos utilizados que el Varimax. Evidentemente la rotación es una opción, no una obligación. Puede hacerse un Análsis factorial sin rotación.

20. Por lo tanto, ante un AF debe decidirse el método de extracción y, luego, si se hace o no rotación. Si se hace rotación debe decidirse con qué criterio, con qué método de rotación.

21. Visto todo esto podemos situar ahora el ACP como un AF especial, tan especial que ha conseguido independizarse, como ya hemos dicho antes. El ACP es un AF al que se le aplica como método de extracción el de las componentes principales y al que no se le aplica ninguna rotación.

22. Vamos a aplicar el AF a los datos de las notas de 15 estudiantes en ocho materias diferentes que usamos para aplicar el ACP. Recordemos la matriz de datos:

IMG_4596

23. Si aplicamos el método de extracción de los mínimos cuadrados y la rotación varimax conseguimos los siguientes valores propios de la matriz de correlaciones:

IMG_4652

23. Con dos factores explicamos, por lo tanto, el 95.56 de la varianza. La comunalidad es la siguiente:

IMG_4653

24. Esto significa que los dos factores seleccionados explican estos tantos por uno de estas variables originales. Son todos muy altos (suele entenderse por alto a partir de 0.75 ó 0.8). El único que no llega a este nivel es la variable Educación física. Se trata de una variable que si le sumamos los factores combinados de alguna forma sólo conseguimos explicar el 47.12% de su medida, por lo tanto, tiene una elevadísima unicidad no contemplada en los factores. Esto ya lo veíamos en el ACP: la Educación física va un poco por libre, mide un tipo de cosas que no tiene relación con lo que miden las otras materias.

25. El número de factores elegidos será el resultado de valorar dos cosas: 1) Que mediante ellos obtengamos un porcentaje de explicación como mínimo del 75-80% y esto lo veremos mediante los valores propios. 2) Que la comunalidad de las variables originales, o al menos del grupo de ellas que especialmente queremos explicar, sea también, al menos del 75-80%, o de 0.75-0.8, en tanto por uno.

26. Y a continuación vamos a ver cuáles son las fórmulas de los dos factores con la rotación varimax:

IMG_4654

27. Como puede verse el primer factor recoge como coeficientes grandes las materias de letras: Lengua, Inglés Filosofía e Historia. El segundo factor recogen como coeficientes grandes las materias de ciencias: Matemáticas, Física y Química. Como sucedía en el ACP.

28. El gráfico de los 15 alumnos representados respecto a los dos factores elegidos es:

IMG_4657

29. Realmente si lo comparamos con el obtenido mediante el Análisis de componentes principales es muy similar. Recordemos aquél gráfico:

IMG_4620

30. Comparando ambas técnicas, el AF y el ACP, aplicadas a los mismos datos podemos comprobar que los resultados obtenidos son similares. Los dos factores y las dos componentes principales se interpretan de la misma forma. Las representaciones son prácticamente idénticas. Son dos formas distintas de llegar al mismo sitio, por lo tanto. En este ejemplo, las cosas son muy claras y de ahí la similaridad. La varianza explicada en ambos caso es muy alta lo que favorece la igualdad en los resultados. Si no fuera tan alta esta varianza total explicada podríamos encontrarnos con mayores diferencias.

31. El ejemplo que hemos utilizado es sencillo. Con datos complejos, donde el repertorio de variables es amplio y diverso suele ser muy difícil interpretar el ACP. Especialmente en estos casos el AF puede aportar una luz que no seamos capaces de ver mediante el ACP.

32. Por otra parte, mucha diferencia en las representaciones obtenidas por un método u otro no deben existir, porque, en realidad, estamos intentando, como ya hemos dicho, con ambas técnicas, representar una nube de puntos original, que no visualizamos, mediante una nube de puntos en menos dimensiones. Si un método de este tipo cumple su misión debe llegar a una solución similar a la obtenida por otro método diferente que persigue lo mismo. Únicamente en los casos en los que estemos haciendo representaciones muy poco fieles a la original podemos encontrar profundas diferencias entre estos distintos métodos.

2 comentarios en “Tema 18: ANÁLISIS FACTORIAL

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s