You are on page 1of 8

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

1
ROTAO E INTERPRETAO DAS COMPONENTES PRINCIPAIS
Consideremos o seguinte exemplo (exerccio 6):
15 alunos de uma determinada escola foram sujeitos a testes de 6
disciplinas e os resultados obtidos encontram-se registados na tabela seguinte:
Aluno Ingls
(X
1
)
Histria
(X
2
)
Portugus
(X
3
)
lgebra
(X
4
)
Calculo
Aritmtico (X
5
)
Geometria
(X
6
)
1 14 13 12 6 9 10
2 15 13 10 10 8 11
3 7 10 11 16 14 16
4 8 9 12 11 13 13
5 16 17 15 14 14 13

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
2
Clculos efectuados em computador permitiram-nos determinar:
- Matriz amostral de correlaes:
R=
1
0 81503 1
0 71227 0 89968 1
0 29166 0 51222 0 60434 1
016655 0 31606 0 45533 0 8536 1
0 24453 0 42003 0 49165 0 88395 0 86269 1
.
. .
. . .
. . . .
. . . . .

- Valores prprios da matriz R:

1
= 3.87327,
2
= 1.5547,
3
= 0.25535,
4
= 0.15061,
5
= 0.09929 e

6
= 0.06678;
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
3
- Vectores prprios respectivos normalizados:
a
1
a
2
a
3
a
4
a
5
a
6
0,32989 0,52879 0,73272 0,09289 -0,17125 -0,191627
0,414596 0,4198 -0,24068 -0,2502 0,12612 0,71794
0,43889 0,30014 -0,55256 0,29697 0,17499 -0,5414
0,44488 -0,31801 -0,13742 -0,27231 -0,77603 -0,07561
0,39206 -0,44935 0,1651 0,70982 0,09927 0,32161
0,41836 -0,388595 0,23179 -0,512465 0,55867 -0,213375
NOTA: Como as duas primeiras componentes principais explicam 90,5% da
varincia total, vamos reter apenas estas duas componentes principais.
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
4
Os resultados da anlise factorial de componentes principais podem ser
resumidos no quadro seguinte:
c
ij
=

j ij
a
1 componente principal - Y
1
(j=1)
2 componente principal - Y
2
(j=2)
Soma dos quadrados por linha =
Comunalidades h
i
X
1
(i=1) 0.64925 0.65933 0.85624
X
2
(i=2) 0.81595 0.52345 0.93978
X
3
(i=3) 0.86376 0.37424 0.88614
X
4
(i=4) 0.87556 -0.39652 0.92383
X
5
(i=5) 0.77159 -0.56029 0.90927
X
6
(i=6) 0.82336 -0.48453 0.9127
Soma dos quadrados
por coluna =
j
3.87327 1.5547
% de varincia
explicada
3.87327/6= 64.6 1.5547/6= 25.9
% cumulativa de
varincia explicada
64.6 90.5
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
5
A interpretao das componentes principais feita atravs dos pesos
(loadings) c
ij
=

j ij
a
. Denotamos por C a matriz destes pesos.
Neste caso particular temos que:
C=
0 64925 0 65933
0 81595 0 52345
0 86376 0 37424
0 87556 0 39652
0 77159 0 56029
0 82336 0 48453
. .
. .
. .
. .
. .
. .

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL


6
Como todas as variveis tm pesos positivos e mais ou menos da mesma
ordem de grandeza na 1 componente, podemos sugerir que esta seja
designada por Factor Geral de Inteligncia, j que parece reflectir a resposta
geral dos alunos instruo recebida. Metade dos pesos na 2 componente
principal so negativos e outra metade so positivos. Este factor no
facilmente identificado mas tal que, alunos que tenham valores altos nos
testes da rea de letras ficam com scores altos neste factor e alunos que
tenham valores altos nos testes da rea de matemtica ficam com scores
baixos. Talvez, este factor (2 componente principal) possa ser identificado por
Factor Matemtica / no Matemtica.
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
7
No grfico seguinte esto representados os pares (c
i1
,c
i2
) (com i=1,2,3,4,5,6)
de pesos das variveis X
1
, X
2
, X
3
, X
4
, X
5
e X
6
nos 2 factores.
O grfico apresenta tambm uma rotao ortogonal dos eixos no sentido dos
ponteiros do relgio. Com esta rotao todos os pontos caem no 1 quadrante,
isto , as variveis passam todas a ter pesos positivos em ambos os factores.
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
8
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
9
Depois de efectuada a rotao torna-se mais simples identificar e interpretar
cada factor (componente principal). As variveis correspondentes aos testes de
matemtica passam a ter pesos elevados no 1 factor e pesos muito pequenos
no 2 factor. As variveis correspondentes aos testes da rea de letras passam
a ter pesos elevados no 2 factor e pequenos no 1. Assim o 1 factor pode ser
designado por Habilidade para a Matemtica e o 2 factor por Habilidade para
as Letras.
Sendo C a matriz de pesos antes da rotao dos factores, a matriz C
*
de
pesos depois da rotao dada por: C
*
= C T, onde T a matriz ortogonal
correspondente rotao pretendida.
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
10
de notar que quando k=2 (nmero de componentes a reter) a simples
visualizao grfica permite-nos identificar facilmente os factores sem ter de
calcular a matriz de pesos C
*
. Mas quando k>2 esta visualizao grfica no
fcil, sendo geralmente necessrio inspeccionar a matriz de pesos depois da
rotao (C
*
) afim de interpretar os factores.
A rotao dos factores permite-nos encontrar uma matriz de pesos mais
facilmente interpretvel.
O ideal seria atingir uma matriz na qual cada varivel tivesse um peso alto
em apenas um factor e pesos pequenos ou moderados nos restantes factores.
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
11
Por isso a matriz ortogonal T, correspondente rotao a efectuar, deve ser
escolhida de forma a que os pesos de C
*
tornem a interpretao dos factores
mais fcil. Existem vrios mtodos para encontrar T de modo a facilitar esta
interpretao:
mtodo Varimax: um mtodo de rotao ortogonal e pretende que, para
cada componente principal, existam apenas alguns pesos significativos e
todos os outros sejam prximos de zero, isto , o objectivo maximizar a
variao entre os pesos de cada componente principal, da o nome
Varimax;
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
12
mtodo Quartimax: tambm um mtodo de rotao ortogonal e pretende
simplificar as linhas de uma matriz de pesos, isto , o seu objectivo tornar
os pesos, de cada varivel, elevados para um n reduzido de componentes
e prximos de zero para todas as restantes componentes;
mtodo Equimax: tambm um mtodo de rotao ortogonal, que
pretende ser uma soluo de compromisso entre os dois mtodos
anteriores. Em vez de se concentrar nas linhas ou nas colunas da matriz
de pesos, o seu objectivo simplificar simultaneamente linhas e colunas.
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
13
Nota: Alm dos mtodos de rotao ortogonal existem mtodos oblquos em
que o pressuposto de independncia entre os factores retirado. permitido
aos factores que rodem livremente de maneira a simplificarem a sua
interpretao.
Depois de efectuada a rotao, torna-se mais simples identificar e interpretar
cada componente principal (factor) a partir dos pesos das variveis que a
compem. Quanto mais prximo de 1 estiver esse peso, mais forte a
associao entre a dita varivel e a componente, enquanto que um peso da
varivel prximo de zero nos permite concluir que pouco contribui para a
formao do factor.
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
14
Cabe ao analista decidir, com um certo grau de subjectividade, qual o
significado ou interpretao daquela componente principal e qual a designao
a dar-lhe.
No exemplo considerado foi utilizado o mtodo Varimax que, ao fim de 3
iteraes, forneceu a matriz T=

7375 , 0 675 , 0
675 , 0 7375 , 0
. Os resultados finais podem ser
resumidos na seguinte tabela:
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
15
c*
ij
1 componente
principal - Y
1
*
(j=1)
2 componente principal
- Y
2
*
(j=2)
Soma dos quadrados por
linha = Comunalidades h
i
X
1
(i=1) 0.03353 0.92473
0.85624
X
2
(i=2) 0.24824 0.9371
0.93978
X
3
(i=3) 0.38427 0.85934
0.88614
X
4
(i=4) 0.91351 0.29889
0.92383
X
5
(i=5) 0.94743 0.10789
0.90927
X
6
(i=6) 0.93445 0.19872
0.9127
Soma dos
quadrados por
coluna
2.81732 2.61221
% de varincia
explicada
2.81732/6= 46.96 2.61221/6= 43.54
% cumulativa de
varincia explicada
46.96 90.5
ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL
16
Note-se que a percentagem de varincia total explicada pelas duas
componentes depois da rotao a mesma, mas cada uma delas explica
diferentes percentagens das que eram explicadas pelas componentes antes da
rotao.

You might also like