You are on page 1of 20

MODELOS DE VARIABLES

LATENTES : ANALISIS
FACTORIAL

Jos Luis Vicente Villardn


Departamento de Estadstica
Universidad de Salamanca

MODELOS DE VARIABLES LATENTES


INtTRODUCCION: EL PROBLEMA ESTADSTICO
Los mtodos estadsticos basados en modelos de variables latentes juegan un
importante papel en el anlisis de datos multivariantes. Se han desarrollado
para responder a necesidades prcticas en diversos campos de la ciencia pero,
especialmente, en psicologa y en las ciencias sociales.
Los sondeos estadsticos a gran escala generan mucha ms informacin de la
que puede ser asimilada por la persona que interpreta los resultados. Incluso
con las medidas de resumen clsicas como tablas de frecuencias, coeficientes de
correlacin, etc es difcil encontrar patrones en las interrelaciones entre las
variables , especialmente si el nmero es muy elevado.
Los

mtodos

basados

en

variables

latentes

pretenden

reducir

la

dimensionalidad del conjunto de datos a dos o tres dimensiones manteniendo


la mayor parte de la informacin posible. Esto puede hacerse debido a que
muchas de las cuestiones planteadas en los sondeos o muchas de las variables
medidas en un estudio son, en realidad, aspectos de la misma caracterstica
bsica.
Por ejemplo, cuando preguntamos en un cuestionario de salud general Ha
pensado de Ud. es una persona que no vale nada? y Ha tenido el sentimiento
de que la vida no merece la pena vivirse?, se trata en realidad de preguntar por
pensamientos relacionados con la depresin desde distintos puntos de vista.
Comenzamos con una matriz de datos que contiene las observaciones para p
variables tomadas sobre n in individuos

x 11
x
21
X=
M

x n1

x 12
x 22
M
x n2

K x 1p
K x 2P

M
K x np

Las observaciones pueden ser variables medidas o cdigos asignados a las


respuestas a cada pregunta.
El problema consiste en sustituir X por otra matriz con un nmero reducido de
columnas y que sea tan cercana a X como sea posible.
La segunda aproximacin a los modelos de variables latentes es ms terica y
procede del mbito de las ciencias sociales. La aproximacin tiene que ver con
cantidades que se tratan como si fueran medibles pero para las que no existe un
instrumento de medida. Por ejemplo, oimos hablar de la calidad de vida, el
conservadurismo, o la inteligencia general e incluso hacemos afirmaciones
sobre su incremento o disminucin y les asignamos valores numricos, aunque
tales variables son solo hipotticas y no son directamente medibles. El problema
del estadstico es desarrollar un marco terico en el que pueda hacerse esto. En
la prctica se elige un conjunto de indicadores que pueden medirse y entonces
se trata de extraer lo que es comn a todos ellos.
En cualquiera de los dos casos llegamos al mismo punto, el nmero de variables
tiene que resumirse. La terminologa usual para lo que hemos llamado variables
hipotticas o factores es la de variables latentes o factores. En la prctica existen
dos formas de entender las variables latentes, una realista, en la que las
variables latentes son consideradas como cantidades reales, definidas
tericamente antes de los indicadores, que incluso podran ser medibles y para
las que construimos una cantidad cercana a partir de los indicadores, y una
instrumentalista en la que las variables latentes se obtienen despus de los
indicadores, como resultado de la medida de los mismos.
Una buena parte del debate filosfico actual en lo que se refiere a modelos de
variables latentes se centra en lo que en la literatura anglosajona se denomina
reification, que consiste en la discusin de si las variables latentes son reales
en el sentido que los son, por ejemplo, la talla o el peso.
La utilidad y la validez de los mtodos que trataremos a continuacin no
depende de si se utiliza la visin realista o la instrumentalista, en cualquiera de
los dos casos es posible utilizar los mtodos para prediccin o para establecer
relaciones como si estuviramos tratando con cantidades reales.

Los mtodos que se incluyen en este apartado son los relacionados con el
anlisis factorial en sus distintas versiones, el anlisis de clases latentes, el
anlisis de la estructura latente y el estudio de mezclas de distribuciones.

Las variables que pueden observarse directamente se conocen como variables


manifiestas y sern denotadas con X. Una coleccin de p variables manifiestas
se distinguir mediante subndices y se escribir como vector columna

X = (X1 , X 2 ,K, X p )'


Denotaremos la observacin de un individuo h sobre una variable Xi se
denotar con xhi, y xh ser el vector para todas las variables sobre el individuo.
Las variables latentes se denotarn con F (U en algunos casos) y su nmero ser
q.
Para el restos clasificaremos el nivel de medida de las variables en mtrico y
categrico (no mtrico). Sern mtricas aquellas que toman valores en el
conjunto de los nmeros reales y pueden ser discretas o continuas. Las
categricas asignan a los individuos a un cierto nmero de categoras, y pueden
ser ordenadas o no.

Las tcnicas relacionadas con variables latentes pueden clasificarse como se


muestra en la tabla siguiente.

Variables Manifiestas
Mtricas

Mtricas

Categricas

Anlisis Factorial

Anlisis de la estructura
latente

Variables

Anlisis Factorial de
datos categricos

Latentes
Categricas

Anlisis de perfiles
latentes

An. De clases latentes.

El propsito general es explicar las relaciones entre las variables manifiestas a


travs de un conjunto de variables latentes de forma que, dadas stas las otras
sean independientes. Desde un punto de vista ms intuitivo se trata de extraer
que es lo que tienen en comn las variables manifiestas y resumirlo en un
conjunto reducido de variables latentes.

ANALISIS FACTORIAL
Mtodo del Anlisis Multivariante que intenta explicar las
relaciones entre un conjunto de variables observables mediante un
nmero reducido de variables hipotticas
MODELO FACTORIAL LINEAL: Sean X1, , X2

variables aleatorias

observables sobre una poblacin. Se trata de encontrar p+q nuevas variables


denominadas factores, F1, , Fq, U1, , Up, tales que

X 1 = a11 F1 + a12 F2 + Ka1q Fq + d1U1


X 2 = a21 F1 + a22 F2 + Ka2qFq + d2U 2
KKKKKKKKKKKKKKKK

X p = ap1F1 + ap2 F2 +Ka pq Fq + dpU p

con

F1 ,K,Fq Factores Comunes


U1 ,K,U p Factores Unicos
En el modelo factorial lineal suponemos:
-

q<p (queremos explicar las variables observadas con un nmero reducido


de variables hipotticas factores)

Los q+p factores son variables incorreladas.

SATURACIONES, COMUNALIDAD Y UNICIDAD


Suponemos que los factores y las variables observadas estn centrados y
estandarizados (reducidos)

E[X i ] = E[ Fj ] = E[ Ui ] = 0

Var[X i ] = Var[ Fj ] = Var[U i ] = 1


i = 1,K,p; j = 1,K,q
A los coeficientes a ij se les denomina saturaciones de la variable Xi en el factor
F j.

Como las variables y los factores estn reducidos


2

Var(Xi ) = ai1Var(F1 ) + K + aiq Var(Fq ) + di Var(Ui )


de donde
2

1 = ai1 + K + aiq + di
2

de aqu se deduce que aij es la contribucin del Factor Fj a la variabilidad total


2

de la variable Xi, mientras que di , es la contribucin del factor nico y se


denomina unicidad.
A la suma de las contribuciones de todos los factores comunes
2
hi2 = ai1
+K + aiq2

se la denomina comunalidad, de forma que la variabilidad de una variable


cualquiera es la suma de su comunalidad ms su unicidad

1 = hi2 + di2 ,

i = 1,K, p

El modelo factorial lineal puede expresarse en notacin matricial como

X = AF + DU
X = (X 1 ,K, X p ) ; F = (F1 ,K, Fq ); U = (U 1 ,K, U p )
A = (a ij ); D = diag(di )
EJEMPLOS TIPICOS EN LOS QUE SE UTILIZA ANALISIS FACTORIAL
-

Las diferentes asignaturas que componen la enseanza media se dividen en


ciancias y letras.

Ciertos sntomas clnicos propios de los enfermos mentales se clasifican en


sntomas de tipo neurtico y sntomas de tipo psictico.

El estudio de los conflictos internos de las naciones descubre la existencia de


tres factores: Agitacin, revolucin y subversin.

La estructura de la personalidad medida a travs de los diferentes items de


un test, est dominada por dos dimensiones: Factor neuroticismoestabilidad y factor introversin-extroversin.

Los items de un test de inteligencia se pueden agrupar en varios factores


que miden capacidades verbales, numricas, espaciales, etc

EJEMPLO PREVIO
Los datos siguientes corresponden a 8 alumos en las asignaturas de
Matemticas, Ciencias Naturales, Francs y Latn.
Alumno
1
2
3
4
5
6
7
8

Matem.
9
10
3
9
7
5
5
4

C. Nat.
8
9
5
9
6
5
5
4

Francs
6
10
9
8
3
5
7
3

Latn
7
10
8
8
5
5
6
4

Es bien conocida la divisin clsica de las asignaturas de la enseanza media en


asignaturas de Ciencias y asignaturas de Letras. En lineas generales, las
primeras se caracterizan por un factor racional y emprico, mientras que las
segundas tienen un significado ms especulativo, siendo la memoria una de sus
caractersticas ms importantes. Cada una de las asignaturas tendr un poco de
ambas componentes, aunque ser mayoritariamente de uno de los dos grupos.
Por ejemplo, las Ciencias Naturales son consideradas de Ciencias pero es
indudable que tambin tienen una importane componente de memoria.
Adems, cada asignatura tendr tambien un componente propio, ms alla de lo
que tengan de Ciencias o Letras.

Estructura de correlaciones entre las variables


Correlation Matrix
matemticas

C. Naturales

Francs

Latn

1,000

,943

,302

,560

C. Naturales

,943

1,000

,544

,758

Francs

,302

,544

1,000

,934

Latn

,560

,758

,934

1,000

matemticas

Observese como las asignaturas consideradas de Ciencias estn altamente


correlacionadas entre si y lo mismo ocurre con las asignaturas de letras. Las
correlaciones entre los dos grupos son ms bajas, aunque todava de una
magnitud importante, esto se debe a que los alumnos buenos suelen serlo en
todas las asignaturas aunque tengan preferencias por uno de los dos grupos,
sto se muestra tambin en el hecho de que las correlaciones son todas
positivas.
Trataremos, entonces de resumir la informacin de las cuatro variables en slo
dos factores, que esperamos que se correspondan con Ciencias y Letras.
Tngase en cuenta que los factores estn definidos en teora slo a priori, y que
el procedimiento de anlisis puede no detectarlos.
La variabilidad recogida por los distintos factores (2) se muestra en la tabla
siguiente

Eigenvalues
Magnitude

Variance Prop.

Value 1

3,016

,754

Value 2

,891

,223

Es decir, con slo dos factores recogemos el 97,7% de la variabilidadtotal.


Supongamos que las saturaciones (correlaciones) de las asignaturas con cada
uno de los dos factores son las siguientes, despus de haber aplicado una
solucin para el problema planteado en Anlisis Factorial.

Matriz Factorial
Orthogonal Solution
Factor 1

Factor 2

matemticas

,974

,158

C. Naturales

,901

,416

Francs

,154

,971

Latn

,429

,894

La solucin obtenida muestra claramente los dos factores tericos (Ciencias y


letras) y como caba esperar de los principios de la teora relacionada con el
problema, las Ciencias Naturales tienen, adems de su parte de Ciencias, una
componente clara relacionada con las Letras debida a la componente
memorstica de la asignatura. Lo mismo ocurre con el latn en relacin a la
componente de azonamiento.
Las contribuciones, comunalidades y unicidades son

Matemticas
C. naturales
Francs
Latn

Contribuciones
Factor 1 Factor 2 Comunalidad Unicidad
,949
,025
,974
,026
,812
,173
,985
,015
,024
,943
,967
,033
,184
,799
,983
,017

Los dos factores explican prcticamente el 100% (Alrededor del 97-98%) de la


variabilidad en la nota de las 4 asignaturas. Las unicidades, en torno al 2-3%
muestran que, en los datos del ejemplo, la parte propia de cada una es muy
pequea.

Podramos calcular, entonces, puntuaciones para los alumnos en las dos


materias generales. La puntuaciones que se muestran estn escalasdas para que
tengan media cero y varianza 1, y se han calculado con las variables escaladas
de la misma forma.

Alumno
1
2
3
4
5
6
7
8

Matem.
,95
1,34
-1,34
,95
,19
-,57
-,57
-,95

C. Nat.
,81
1,32
-,69
1,32
-,19
-,69
-,69
-1,19

Francs
-,14
1,39
1,00
,62
-1,29
-,53
,24
-1,29

Latn
,19
1,69
,69
,69
-,81
-,81
-,31
-1,32

Ciencias
1,11
,80
-1,73
1,09
,59
-,43
-,80
-,63

Letras
-,46
1,20
1,68
,20
-1,30
-,52
,25
-1,04

Las puntuaciones sobre los ejes factoriales nos permiten la representacin de los
individuos en dos dimensiones para estudiar las similitudes entre ellos con
respecto a los dos factores considerados.

Bsqueda de la Matriz Factorial:


Mtodos de extraccin de factores.
LA MATRIZ DE CORRELACIONES REDUCIDA
A partir de la expresin matricial de del modelo factorial

X = AF + DU
X = (X 1 ,K, X p ) ; F = (F1 ,K, Fq ); U = (U 1 ,K, U p )
A = (a ij ); D = diag(di )
podemos expresar la matriz de correlaciones entre las variables observadas
como

R = AA + D 2
La diagonal de R* = AA contiene la comunalidades y las correlaciones entre
2

las variables observadas fuera de la diagonal y D es una matriz diagonal que


contiene las unicidades.
A la matriz AA , es decir, la matriz de correlaciones en la que los unos de la
diagonal se sustituyen por las comunalidades se la denomina matriz de
correlaciones reducida.
El problema factorial se reduce, pues, a descomponer una matriz de
correlaciones en otra factorial A de forma que el producto de ella por su
traspuesta reproduzca la matriz de correlaciones reducida.
Si la matriz de correlaciones fuera conocida a priori, la solucin sera sencilla,
basata con calcular los valores y vectores propios de la misma.

R* = VV'
y tomar

A = V1/2 '
El problema consiste en que las comunalidades dependen de las saturaciones y
stas solo son conocidas despus de la estimacin.

METODO DE LAS COMPONENTES PRINCIPALES


Mtodo de estimacin de la matriz factorial a partir del modelo que considera
slo los factores comunes y prescinde de los factores nicos.
Calcula los valores y vectores propios directamente de la matriz de
correlaciones de las variables originales sin utilizar las comunalidades en la
diagonal. El mtodo de las componentes principales fue estudiado como tcnica
descriptiva (geomtrica) para la reduccin de la dimensin y puede
considerarse tambien como una solucin para el problema factorial.
METODO DEL FACTOR PRINCIPAL (ITERATIVO)
Bsicamente consiste en la diagonalizacin de la matriz de correlaciones
reducida utilizando distintas formas para estimar la comunalidad a priori y
siguiendo un proceso iterativo en el que en cada paso se reestiman las
comunalidades.
El proceso sera:
Paso 1: Calcular la matriz de correlaciones y sustituir la diagonal por un
estimador de la comunalidad
Paso 2: Diagonalizar la matriz de correlaciones educida obtenida en el paso 1
para obtener la matriz factorial
Paso 3: Recalcular las comunalidades a partir de la matriz factorial.
Paso 4: Comparar as comunalidades antes y despues de la diagonalizacin. Si
la diferencia es lo suficientemente pequea, terminar el proceso y sino, volver al
paso 1 con las nuevas comunalidades calculadas.
Las estimaciones de la comunalidad habitualmente utilizadas en la primera
iteracin son las siguientes:
SMC: (Square Mltiple Correlation)
Las comunalidades se estiman a partir del cuadrado del
coeficiente de correlacin mltiple de la variable con todas las
dems.
OFF-DIAGONAL: utiliza el coeficiente de correlacin ms grande
de cada variable con todas las dems.
1 : utiliza el valor uno como estimacin inicial
para las comunalidades.

CUNTOS EJES DEBEMOS RETENER?

VALORES PROPIOS MAYORES QUE UNO

El nmero de factores estar determinado por el nmero de valores propios


mayores que uno.

REGLA DEL 75% DE LA VARIANZA

El nmero de factores esta determinado por la absorcin de inercia. Se tomarn


tantos valores propios como sean necesarios para conseguir un 75% de inercia
absorbida.

REGLA DEL CODO (CATTELL (1966) ;CATTELL & JESPERS (1967)).


SCREE PLOT
El procedimiento del scree plot de Cattell consiste en representar grficamente
los valores propios en orden descendente y dibujar una recta a travs de las
componentes con los valores propios ms bajos. Se retienen las componentes que se
corresponden con los autovalores que quedan por encima de la lnea.
ESPECIFICACION DEL USUARIO
Es posible especificar personalmente el nmero de factores. Usualmente no ser
mayor que el nmero de variables dividido por dos. En el caso en que se
sobrestime ste valor, el n ser ajustado por el ordenador.

INTERPRETACIN DE LOS EJES FACTORIALES.


Se analizan las saturaciones (en valor absoluto). Aquellas variables que
presentan altas saturaciones son las que tiene mayor importancia en la
interpretacin del eje.
Las ms interesantes suelen ser las que presentan altas saturaciones para ese eje
y bajas para los dems.
Las saturacionas se suelen colocar sobre un diagrama que permite la
interpretacin factorial de las mismas.

ROTACIN
Los ejes factoriales se rotan para mejorar la interpretabilidad, de forma que
aumenten unas saturaciones y disminuyan otras. Se mantiene la solucin
general paro cambian los factores individuales para que sean ms
interpretables.

Hay dos tipos de rotaciones:

ORTOGONALES: Los nuevos factores siguen siendo incorrelados


(ortogonales).
ROTACIN VARIMAX (KAISER, 1958)
Transforma la matriz factorial hasta conseguir la solucin que verifique
que la suma de las simplicidades de los factores sea mxima.
Simplicidad = varianza de los cuadrados de las saturaciones
Rota los factores forzando a que unas saturaciones se aproximen ms a
uno y las otras a cero, para facilitar as su interpretacin.
ROTACIN QUARTIMAX (CARROL, 1953)
Halla la matriz factorial transformada de modo que la curtosis de los
cuadrados de las saturaciones sea mxima.
La mayor parte de la varianza es absorbida por el primer factor.
Generalmente los otros ejes no tienen una estructura sencilla.

OBLICUOS: No se respeta la ortogonalidad.


ROTACION EQUAMAX (SAUNDER, 1962)
La varianza se reparte por igual entre todos los factores.

LA ESTRUCTURA SIMPLE
NECESIDAD DE LA ROTACION
El rpincipal objeto del Anlisis Factorial es el de sugerir y comprobar hiptesis
cientficas
El problema consiste en comparar los factores hallados con los factores
previstos
Una misma matriz de correlaciones piede ser factorizada de infinitas formas
Si R = AA es una factorizacin vlida, tambien lo es

R = AT TA

con

T T = I

donde T es una matriz ortogonal que define una rotacin del espacio.
La solucin obtenida del procedimiento de factorizacin responde slo a un
criterio matemtico pero es arbitraria desde el punto de vista aplicado.
El problema es
Cul es la posicin de los ejes que tiene un mayor inters cientfico?
Hay alguna posicin que pueda considerarse como especialmente
relevante?
Cmo giramos los ejes a esa posicin?
EL PRINCIPIO DE LA ESTRUCTURA SIMPLE
a) La configuracin simple
Podemos ver la estructura factorial (la matriz factorial) como puntos en un
espacio multidimensional con dimensin igual al nmero de factores y en el
que cada variable est representada por un vector cuya longitud es igual a la
raz cuadrada de la comunalidad.
Eje II
V3

V5

V6
Eje I
V2
V1

V4
Esperamos que cada una de las variables et relacionada con unos pocos
factores y no relacionada con el resto. Por ejemplo, si la variable est
relacionada con un solo factor, ser colineal al eje correspondiente en la

representacin, si et relacionada con 2, estar en el plano definido por los


mismos, etc
Una configuracin en la que todos los vectores estn en rectas, planos o
hiperplanos de menor dmensin se denomina una configuracin simple.
Una definicin ms rigurosa: Se dice que p vectores, en un espacio de q
dimensiones, forman una configuracin simple cuando todos estn
comprendidos en q hiperplanos de dimensin q-1. (algunos pueden estar an las
intersecciones y en los subespacios de menores dimensiones).
b) La estructura simple
Una vez obtenida una solucin factorial la pregunta es
Cul es la estructura que mejor refleja las caractersticas de la configuracin?
lo que es lo mismo Dnde situamos los ejes de coordenadas para recoger la
configuracin simple?
Los ejes sirven para interpretar un factor y el factor se interpreta a travs de las
proyecciones , luego el eje debe situarse en la posicin ms conveniente para la
interpretacin, tratando de reflejar en lo posible la configuracin simple.
Llamaremos estructura (factorial) simple a aquella que refleja una configuracin
simple.
c) Propiedades de la estructura simple
La estructura simple permite una mayor sencillez en la interpretacin de los
factores ya que, estos estn fuertementemente relacionados con unas variables y
escasamente relacionados con el resto.
Resumen de las propiedades
- Cada una de las columnas de la matriz factorial tiene varios elementos
prcticamente nulos.
- Cada fila tendr uno o ms ceros.
- Para cada par de columnas habr pocos elementos no nulos en ambas.
LA ESTRUCTURA SIMPLE COMO HIPOTESIS DE TRABAJO
Generalmente, en la investigacin aplicada, la hiptesis de trabajo inicial es que
la informacin que proporcionan un conjunto elevado de variables manifiestas
puede resumirse en unos cuantos factores hipotticos claramente definidos y
que contienen informacin no relacionada, es decir que muestran aspectos
independientes (linealmente) del mismo problema. Esto se traduce, desde el
punto de vista de lo explicado antes en una estructura simple para el problema.
Si partimos de la hiptesis de que en nuestro problema tenemos una estructura
simple, y la hiptesis es cierta, podremos girar los ejes hasta la posicin que
recoge dicha estructura.
Incluso en el caso de que en nuestro campo no est bien desarrollado el
problema a estudiar (no tengamos una idea previa de cmo deben ser los
factores), podemos guiarnos por el principio de la estructura simple ya que, si
sta existe, probablemente la encontraremos en el anlisis.
LA ROTACION
El mtodo para encontrar la estrucra simple consiste simplemente en rotar el
espacio de los factores hasta conseguir la mayor simplicidad posible.
Supongamos que tenemos la siguiente estructura factorial:
Si hubiera una estrucra factorial simple, los vectores estaran en dos rectas, (a y
B). No hay estructura simple, tampoco la hay en la mayor parte de las

aplicaciones, pero es posible rotar para obtener una estructura mucho ms


simple que la actual
(Eje II)

B (Eje II)

V5

B
V5

V3

V6

V3

V6

V1

(Eje I)

V2

V1

V2

V4

A (EJE I)

V4
A

Ahora se ha conseguido que, al menos algunas de las proyecciones sean cero en


algunos de los ejes.
Con un ejemplo numrico

1
2
3
4
5
6

I
0,81
0,78
0,35
0,70
0,45
0,64

II
0,00
-0,44
0,61
-0,40
0,78
0,32

I
II

A
0,87
-0,50

A*

B
0,50
0,87

1
2
3
4
5
6

A
0,7
0,9
0,00
0,81
0,00
0,4

B
0,40
0,01
0,71
0,00
0,90
0,60

La segunda de las soluciones es mucho ms clara ya que, se ha conseguido que


los coeficientes sean muy altos para algunas de las variables y muy bajos en
otras con lo que se mejora la interpretabilidad.
En algunos casos la estructura simple no se consigue con una rotacin
ortogonal, De forma que para obtenerla es necesario tomar ejes relacionados.
(Eje II)

V5
V3

V6

(Eje I)

V2

V1
V4

En este caso obtendramos una roracin oblicua por lo que tedramos que
aadir, adems la correlacin entre los ejes ya que stos estn relacionados.

OBTENCION DE LAS PUNTUACIONES DE LOS INDIVIDUOS


Las puntuaciones de los individuos en un anlisis factorial pueden utilizarse
para realizar una reprresentacin grfica de la misma manera que hacamos en
Componentes Principales.

Mtodo basado en los autovectores.


Cuando la matriz factorial se calcula a partir de un conjunto de vectores propios
el clculo de las puntuaciones es simple ya que se trata de una simple
proyeccin como en las CP
Si llamamos F a la matriz de puntuaciones

F = 1 A X
y para los factores rotados, si las puntuaciones estn en G

G = T F
donde T es la matriz de rotacin.
Mtodo basado en regresiones
Queremos poner los factores en funcin de las variables

F = BX
de donde obtenemos

FX ( X X ) 1 = B
B = A' R 1X
si los factores son incorrelados.

COMPARACION DEL ANALISIS FACTORIAL


CON EL ANALISIS DE COMPONENTES
PRINCIPALES
Anlisis Factorial
Explica correlaciones
Trata de explicar las variables
observadas en funcin de unos
cuantos factores hipotticos
Los factores son incorrelados solo
dentro del espacio de los factores
comunes
Los residuales son incorrelados (en
teora)
Hay varios procedimientos de
estimacin.
Hay varias soluciones.
Aadir un nuevo factor puede
cambiar los anteriores

Componentes Principales
Explica variabilidad
Proyecta las observaciones en un
espacio de dimensin reducida con
prdida de informacin mnima
Las componentes principales son
incorreladas incondicionalmente

Los residuales estn normalmente


correlacionados
Un nico procedimiento de
estimacin.
La solucin es nica.
Aadir una nueva componente
principal no cambia a las
anteriores.
Algunas soluciones son invariantes La solucin cambia con los
con respecto a los cambios de
cambios de escala
escala
En algunos modelos es difcil
No hay que estimar comunalidades
estimar las comunalidades
En algunos modelos complejos los Los clculos son bastante simples.
clculos son problemticos

You might also like