Analiza Factoriala

Metode cantitative avansate
de cercetare sociala
Tema 5-7: Analiza factoriala (II)

Bibliografie: Capitolul 4

George H. Dunteman. 1989. Principal Components Analysis. Newbury Park,
Ca.: Sage Publications.
Jae-On Kim, Charles W. Mueller. 1978a. Introduction to Factor Analysis.
What It Is and How to Do It. Newbury Park, Ca.: Sage Publications.
Jae-On Kim, Charles W. Mueller. 1978b. Factor Analysis. Statistical Methods
and Practical Issues. Newbury Park, Ca.: Sage Publications.
J. Scott Long. 1983. Confirmatory Factor Analysis. Newbury Park, Ca.: Sage
Publications.
Recapitulare: Elementele critice intr-o analiza
factoriala
Urmarim sa identificam structuri de corelatii
puternice intre variabile, pe care le punem pe seama
unor fatori latenti
Construim un model teoretic, un care variabilele
observate Xi, i=1,m sunt determinate de factorii Fj,
j=1,n. [n<m]. corelatiile pot fi exprimate in
functie de de saturatii, pe care vrem sa le punem in
acord cu corelatiile observate empiric baza de
calcul a factorilor.
Factorii vor fi extrasi rind pe rind, astfel incit sa
explice mai mult din varianta totala a variabilelor.

[Nota: consultati prezentarea nr. 1, si prezentarile ppt de pe site-ul cursului.]

Figura 1: Modelul general al analizei factoriale, cu m variabile observate, n factori
comuni ortogonali.

X
1
U
1

F
1

X
2
U
2

F
2

X
3
U
3

... ... ...

F
n

X
m
U
m

X
1
= b
11
F
1
+ b
12
F
2
+ ... + b
1n
F
n
+ d
1
U
1

X
2
= b
21
F
1
+ b
22
F
2
+ ... + b
2n
F
n
+ d
2
U
2

...
X
m
= b
m1
F
1
+ b
m2
F
2
+ ... + b
mn
F
n
+ d
m
U
m

F
1
F
2
... F
n

X
1
b
11
b
12
... b
1n

X
2
b
21
b
22
... b
2n

...
X
m
b
m1
b
m2
... b
mn

Pentru factori ortogonali doi cte doi (independeni):

b
ij
= r(X
i
,F
j
) pentru i = 1, ..., m, j = 1, ..., n

Comunalitatea variabilei X
i
:

h
i
2
= b
i1
2
+ b
i2
2
+ ... + b
in
2

r(X
i
,X
k
) = b
i1
b
k1
+ b
i2
b
k2
+ b
i3
b
k3
+ ... + b
in
b
kn

Realizarea unei analize factoriale
1. Definirea problemei de cercetare:
2. Matricea de corelaie: existena unei corelaii suficient
de mari ntre variabile.
testul de sfericitate Bartlett
matricea de corelaii anti-imagine
indicele Kaiser-Meyer-Olkin (KMO)
Figura 8. Ipoteza testului de sfericitate Bartlett.
r(X
1
,X
1
) r(X
1
,X
2
) ... r(X
1
,X
m
) 1 0 ... 0
r(X
2
,X
1
) r(X
2
,X
2
) ... r(X
2
,X
m
) 0 1 ... 0
... = ...
r(X
m
,X
1
) r(X
m
,X
2
) ... r(X
m
,X
m
) 0 0 ... 1
Figura 9. Formula de calcul al indicelui KMO.
KMO =

i i j
2
j i
i i j
2
j i
i i j
2
j i
) X , X ( a ) X , X ( r
) X , X ( r
unde a(X
i
, X
j
) este coeficientul de corelaie parial ntre X
i
i X
j
cnd toate
celelalte variabile sunt controlate.
3. Extragerea factorilor.
Algoritmul de extragere pornete de la ipoteza unui factor comun
unic, dup care se testeaz discrepana dintre matricea de corelaii
observate i cea produs prin model. Dac testul este respins
(discrepana dintre cele dou seturi de corelaii este prea mare din
punct de vedere statistic), atunci se estimeaz
un model cu doi factori. Acestui nou model i se aplic de asemenea
testul discrepanei dintre matricile de corelaii. Dac testul nu este
trecut, se mai adaug nc un factor i se estimeaz
un nou model. Acest algoritm continu pn cnd testul
discrepanei este trecut.
Exist mai multe metode de extragere a factorilor, n funcie de
criteriile de testare a discrepanei dintre cele dou matrici de
corelaie.
(a) metoda celor mai mici ptrate the least squares method,
(b) metoda probabilitii maxime - the maximum likelihood method,
(c) metoda de extragere factorial Alpha Alpha factoring,
(d) analiza imaginii image factoring,
(e) metoda factorilor principali principal axis factoring,
(f) metoda componentelor principale principal component
analysis.
Una din diferenele conceptuale fundamentale ntre aceste
metode, care distinge ntre analiza componentelor
principale (f) i toate celelalte, poate fi descris n felul
urmtor. Variana total a variabilelor observate poate fi
descompus astfel:
(1) variana comun (comunalitatea), adic totalul varianei
variabilelor care se datoreaz factorilor comuni,
(2) variana specific (unicitatea), datorat factorilor unici, i
(3) eroarea introdus de msurare, eantionare, culegerea
datelor etc.

n analiza componentelor principale (principal
component analysis) se va descompune ntreaga
varian a variabilelor.
n analiza factorial propriuzis (principal axis
factoring) se va descompune doar variana
comun a variabilelor.
n analiza factorial ncercm s estimm coeficienii b
ik
, adic
saturaiile factoriale pentru fiecare variabil observat, avnd la
dispoziie coeficienii de corelaie r(X
i
,X
k
).
Vom pune condiia ca matricea rezidual, adic diferena dintre
matricea de corelaie ajustat (R
1
) i matricea de corelaii rezultat
(B B
T
), s fie ct mai aproape de zero, adic diferenele dintre
corelaiile observate i cele rezultate din modelul factorial, s fie
minimizate.
ntotdeauna putem reproduce corelaiile observate printr-un model
care are exact atia factori cte variabile, iar adecvarea modelului
pentru date crete odat cu numrul de factori.
Noi dorim: o structur redus a datelor, explicarea covarianelor dintre
variabile printr-un numr ct mai mic de factori comuni.

Primul factor extras va corespunde valorii proprii celei mai mari, cu alte
cuvinte primul factor extras este cel care explic cel mai mult
din variana variabilelor observate. Urmtorul factor extras va
explica ct mai mult din restul de varian rmas neexplicat, i aa
mai departe.

La ci factori ne oprim?
De ci factori avem nevoie pentru a reprezenta datele?
Oprim descompunerea varianei n momentul n
care factorul explic mai puin dect variana unei
singure variabile, adic atunci cnd valoarea proprie
corespunztoare factorului este mai mic dect 1.
Examinarea graficului care reprezint valorile
proprii (scree plot).
Alt soluie este s stabilim un procent de varian
care s fie explicat (n mod obinuit acesta se alege
70% sau 80%), i s ne oprim atunci cnd variana
explicat de factori, cumulat, depete acest prag.
Unii autori sugereaz c nu trebuie s ne bazm
automat pe astfel de criterii formale i c numrul
de factori obinut prin aplicarea acestor teste
trebuie s ne indice doar numrul maxim de factori.
Factorii pe care i vom reine trebuie s fie
substaniali i interpretabili teoretic (ndeosebi dup
rotaie).
4. Rotaia factorilor

Prin rotaia factorilor ncercm s obinem exact acest
lucru. Prin transformri ale matricii de saturaii
iniiale urmrim s ajungem la o matrice mai simpl,
care s fie uor de interpretat.
Problema rotaiei factorilor este o problem de
transformare a datelor ntr-un model factorial lipsit de
ambiguiti n ceea ce privete semnificaia factorilor.
Astfel, o transformare care s micoreze
complexitatea factorial a variabilelor i s mreasc
gradul lor de determinare factorial ne-ar uura
substanial nelegerea, interpretarea, numirea
factorilor.
Termenul de rotaie denumete exact ceea ce implic:
sistemul de axe ortogonale reprezentat de factori este rotit
n jurul originii ntr-o alt poziie.
Figura 10. Obinerea unei structuri simple prin examinarea configuraiei grafice a
variabilelor.
Factor1 Factor2
X
1
0.83 -0.15
X
2
0.76 -0.24
X
3
0.90 -0.35
X
4
0.20 0.80
X
5
0.25 0.85
FACTOR1
1.0 .8 .6 .4 .2 0.0
F
A
C
T
O
R
2
1.0
.8
.6
.4
.2
0.0
-.2
-.4
X5
X4
X3
X2
X1
Metode de rotaie a factorilor: ortogonale i oblice
Metoda ortogonal varimax urmeaz criteriul
simplificrii coloanelor matricii factoriale, maximiznd
variana dat de ptratul saturaiilor pentru fiecare
factor. Cu alte cuvinte, minimizeaz numrul de variabile
cu saturaii factoriale mari pentru fiecare factor,
simplificnd astfel interpretarea factorilor.
Metoda ortogonal quartimax folosete alt criteriu de
simplificare, i anume maximizeaz variana dat de
ptratul saturaiilor pentru fiecare variabil. Prin aceasta
se minimizeaz numrul de factori care explic fiecare
variabil (se reduce complexitatea factorial a
variabilelor).
O metod ortogonal care aplic ambele criterii de
simplificare este equamax. Aceasta minimizeaz
numrul de variabile care satureaz un factor i numrul
de factori necesari pentru a explica variana unei
variabile.
5. Interpretarea factorilor
n general interpretarea factorilor este facilitat atunci
cnd variabilele satureaz n mod semnificativ doar unul
din factori.
Numele factorului i definiia sa nu pot fi date dect de
cercettor. El este cel care va sintetiza coninutul
variabilelor care satureaz un factor ntr-un concept
denominat printr-o etichet sau o descriere.
6. Scoruri factoriale, scale factoriale i
variabile surogat.
Odat identificate dimensiunile latente ale unui set de
date, analistul poate dori s examineze comportamentul
cazurilor n funcie de aceste dimensiuni, i nu doar n
funcie de variabilele date. Mai mult, el poate dori s
obin cte o variabil pentru fiecare dintre aceti factori,
care s poat fi folosite n continuare ca variabile
explicative n locul setului iniial de variabile, mai
numeros.
Exist dou opiuni principale pentru a face acest lucru.
(1) Examinnd matricea factorial (matricea saturaiilor
factoriale), analistul poate selecta variabila cu cel mai mare
scor factorial pentru un anume factor ca reprezentativ
pentru dimensiunea factorial respectiv (variabil
surogat).
(2) Analistul poate construi o scal factorial (o variabil
care s reprezinte factorul respectiv), dat de scoruri
factoriale pentru fiecare obiect din eantion.
Pentru ca o persoan din Romnia de
azi s reueasc n via, ct de
important este.

rv1 s se nasc ntr-o familie bogat?
rv2 . s aib relaii?
rv3 s aib noroc/ans?
rv4 s cread n Dumnezeu?
rv5 s fie deteapt/inteligent?
rv6 s arate bine?
rv7 s fac coal?
rv8 s munceasc mult?
rv9 s fure?
rv10 s tie s se descurce?

Exemplu: Care sunt factorii crora li se atribuie succesul n via?
Explicai utiliznd setul de variabile vr1 vr10 din BOP 2003!

Variante de rspuns:
1. Foarte important
2. Important
3. Destul de important
4. Puin important
5. Deloc important
8. NS (recodat ca missing value)
9. NR (recodat ca missing value)
Exist o varian comun n cazul acestui set de indicatori?
Care variabile coreleaz ntre ele i n ce msur?
Care sunt direciile corelaiilor dintre variabile (pozitive sau negative)?

Corelaiile observate:
Correlations
1 ,168** ,566** ,347** ,097** ,147** ,286** ,067** ,081** ,214**
, ,000 ,000 ,000 ,000 ,000 ,000 ,003 ,000 ,000
2027 1999 2011 2016 2015 2017 1999 2012 2015 1911
,168** 1 ,227** ,216** ,115** ,243** ,145** ,209** ,213** ,115**
,000 , ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
1999 2025 2003 2013 2013 2014 1999 2013 2011 1927
,566** ,227** 1 ,389** ,162** ,190** ,258** ,069** ,061** ,198**
,000 ,000 , ,000 ,000 ,000 ,000 ,002 ,006 ,000
2011 2003 2028 2023 2014 2021 2002 2016 2015 1917
,347** ,216** ,389** 1 ,287** ,268** ,214** ,124** ,147** ,107**
,000 ,000 ,000 , ,000 ,000 ,000 ,000 ,000 ,000
2016 2013 2023 2044 2030 2034 2013 2031 2033 1926
,097** ,115** ,162** ,287** 1 ,248** ,136** ,241** ,222** -,037
,000 ,000 ,000 ,000 , ,000 ,000 ,000 ,000 ,103
2015 2013 2014 2030 2047 2029 2011 2029 2031 1926
,147** ,243** ,190** ,268** ,248** 1 ,240** ,474** ,402** -,059**
,000 ,000 ,000 ,000 ,000 , ,000 ,000 ,000 ,010
2017 2014 2021 2034 2029 2041 2016 2029 2029 1926
,286** ,145** ,258** ,214** ,136** ,240** 1 ,240** ,157** ,164**
,000 ,000 ,000 ,000 ,000 ,000 , ,000 ,000 ,000
1999 1999 2002 2013 2011 2016 2021 2014 2013 1912
,067** ,209** ,069** ,124** ,241** ,474** ,240** 1 ,523** -,131**
,003 ,000 ,002 ,000 ,000 ,000 ,000 , ,000 ,000
2012 2013 2016 2031 2029 2029 2014 2041 2031 1925
,081** ,213** ,061** ,147** ,222** ,402** ,157** ,523** 1 -,104**
,000 ,000 ,006 ,000 ,000 ,000 ,000 ,000 , ,000
2015 2011 2015 2033 2031 2029 2013 2031 2042 1926
,214** ,115** ,198** ,107** -,037 -,059** ,164** -,131** -,104** 1
,000 ,000 ,000 ,000 ,103 ,010 ,000 ,000 ,000 ,
1911 1927 1917 1926 1926 1926 1912 1925 1926 1937
Pearson Correl ati on
Si g. (2-tai l ed)
N
Si g. (2-tai l ed)
N
Si g. (2-tai l ed)
N
Si g. (2-tai l ed)
N
Si g. (2-tai l ed)
N
Si g. (2-tai l ed)
N
Si g. (2-tai l ed)
N
Si g. (2-tai l ed)
N
Si g. (2-tai l ed)
N
Si g. (2-tai l ed)
N
S se nasc
ntr-o famil i e
bogat?
S sti e s
se
descurce?
S ai b
relati i ?
S ai b
noroc/
sans?
S cread n
Dumnezeu?
S fi e
desteapt/i n
teli gent?
S arate
bi ne?
S fac
scoal ?
S
munceasc
mul t?
S fure?
S se nasc
ntr-o famil i e
bogat?
S sti e s se
descurce?
S ai b
relati i ?
S ai b
noroc/
sans?
S cread n
Dumnezeu?
S fi e
desteapt/i
ntel i gent?
S arate
bi ne?
S fac
scoal ?
S
munceasc
mul t? S fure?
Correl ati on i s si gni fi cant at the 0.01 l evel (2-tail ed).
**.
Observm c exist sub-seturi de variabile care
coreleaz relativ puternic ntre ele.

Exist factori lateni care explic variana comun a
sub-seturilor de variabile observate? Cu alte cuvinte,
putem considera c exist o tipologie a rspunsurilor i
factori lateni care determin aceast tipologie?

ncercm s realizm o analiz exploratorie deoarece
nu tim ci factori avem, nici dac acetia coreleaz
sau nu.

VAR (rv1) = b
11
2
+ b
12
2
+ b
11
* b
12
* 2 r(F1, F2) - d
1
2

r (rv1, F1) = b
11
+ b
12
* r(F1,F2)

r (rv1, F2) = b
12
+ b
2
11
*r(F1,F2)

Efect direct al lui F2 Efect indirect,
mediat de F1
Corelaiile dintre factori i variabile
sunt prezentate n matricea structur
(Structure Matrix) din SPSS output.
rv1 U1
F1
rv2 U2
.
F2 .
.
rv10 U10

Comunalitatea lui rv1 (partea din
varian explicat de factori)
Ceea ce rmne ne-explicat de
factori din variana lui rv1
b11 este saturaia lui F1 (factor loading F1) iar b12 este saturaia lui F2 (factor loading F2).
Aceste saturaii sunt prezentate n matricea saturaiilor factoriale (Factor Matrix sau
Factor Loadings Matrix) din SPSS output. Dac noi alegem un model n care factorii
sunt independeni, atunci corelaiile dintre factori i variabile se reduc la efectele directe,
deci sunt identice cu saturaiile (factor loadings).
Un model simplu ar putea fi:
Extracia factorilor:
Construim un model al relaiilor dintre factori i variabile astfel
nct diferena dintre corelaiile observate i cele re-construite
(reproduced correlations) s fie ct mai mic.
Reproduced Correlations
,515
b
,197 ,546 ,354 ,135 ,137 ,261 4,165E-02 4,790E-02 ,215
,197 ,143
b
,215 ,182 ,139 ,214 ,159 ,214 ,187 3,333E-02
,546 ,215 ,580
b
,380 ,151 ,160 ,283 6,187E-02 6,590E-02 ,224
,354 ,182 ,380 ,276
b
,153 ,206 ,221 ,165 ,149 ,114
,135 ,139 ,151 ,153 ,148
b
,245 ,145 ,267 ,231 -7,39E-03
,137 ,214 ,160 ,206 ,245 ,424
b
,211 ,485 ,417 -6,04E-02
,261 ,159 ,283 ,221 ,145 ,211 ,184
b
,194 ,172 6,622E-02
4,165E-02 ,214 6,187E-02 ,165 ,267 ,485 ,194 ,582
b
,498 -,126
4,790E-02 ,187 6,590E-02 ,149 ,231 ,417 ,172 ,498 ,426
b
-,103
,215 3,333E-02 ,224 ,114 -7,395E-03 -6,037E-02 6,622E-02 -,126 -,103 ,126
b
-3,280E-02 1,566E-02 -2,06E-02 -4,674E-02 -2,378E-02 2,373E-02 1,408E-02 2,268E-02 -2,29E-03
-3,280E-02 5,831E-03 2,858E-02 -2,616E-02 1,697E-02 -2,14E-02 -1,02E-02 2,308E-02 7,841E-02
1,566E-02 5,831E-03 -2,85E-03 1,624E-04 2,552E-04 -2,98E-02 6,989E-03 -1,056E-02 -2,82E-02
-2,063E-02 2,858E-02 -2,85E-03 ,135 4,050E-02 -1,46E-02 -5,10E-02 -8,712E-03 -5,73E-03
-4,674E-02 -2,616E-02 1,624E-04 ,135 9,117E-03 -5,90E-03 -1,35E-02 -1,445E-02 -3,31E-02
-2,378E-02 1,697E-02 2,552E-04 4,050E-02 9,117E-03 5,076E-03 -3,40E-03 -1,279E-02 -1,94E-03
2,373E-02 -2,139E-02 -2,98E-02 -1,46E-02 -5,895E-03 5,076E-03 2,904E-02 -2,041E-02 9,804E-02
1,408E-02 -1,020E-02 6,989E-03 -5,10E-02 -1,345E-02 -3,396E-03 2,904E-02 1,121E-02 -1,65E-02
2,268E-02 2,308E-02 -1,06E-02 -8,71E-03 -1,445E-02 -1,279E-02 -2,04E-02 1,121E-02 -2,62E-03
-2,293E-03 7,841E-02 -2,82E-02 -5,73E-03 -3,315E-02 -1,942E-03 9,804E-02 -1,65E-02 -2,624E-03
S se nasc ntr-o fami l i e
bogat?
S sti e s se descurce?
S ai b rel ati i ?
S ai b noroc/ sans?
S cread n Dumnezeu?
S fi e
desteapt/i ntel igent?
S arate bi ne?
S fac scoal ?
S munceasc mul t?
S fure?
bogat?
S ai b rel ati i ?
S ai b noroc/ sans?
S cread n Dumnezeu?
S fi e
S arate bi ne?
S fac scoal ?
S munceasc mul t?
S fure?
Reproduced Correl ati on
Resi dual
a
S se nasc
ntr-o famil i e
bogat?
S sti e s se
descurce?
S ai b
relati i ?
S ai b
noroc/
sans?
S cread n
Dumnezeu?
S fi e
desteapt/i
ntel i gent?
S arate
bi ne?
S fac
scoal ?
S
munceasc
mul t? S fure?
Extracti on Method: Maxi mum Li kel i hood.
Resi duals are computed between observed and reproduced correl ati ons. There are 4 (8,0%) nonredundant resi dual s wi th absol ute val ues greater than 0.05. a.
Reproduced communal i ti es
b.
Extracia factorilor:
Diferena dintre corelaiile observate i cele re-construite (reproduse) este
msurat ca suma ptratic a diferenelor i interpretat ca o msur de tip
CHI-ptrat. Se testeaz semnificaia statistic a diferenelor pe baza
distribuiei lui CHI-ptrat.
Goodness-of-fit Test
182,705 26 ,000
Chi-Square df Si g.
Avem o diferen statistic semnificativ ntre
matricea corelaiilor observate i matricea
corelaiilor reproduse. Modelul nostru
simplific considerabil realitatea
complexitatea relaiilor dintre variabile.
Cum au fost
extrai factorii?
Rezultatele extraciei factorilor:
KMO and Bartlett's Test
,756
3351,885
45
,000
Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
Approx. Chi-Square
df
Sig.
Bartlett's Test of
Sphericity
Testul de adecvare a eantionrii ne
arat c analiza este statistic
semnificativ.
Exist o diferen statistic semnificativ ntre
matricea corelaiilor dintre variabile i matricea
unitate. Avem o ans apropiat de zero
(sig.=0.000) de a obine aceast valoare a lui
HI-ptrat dac variabilele supuse analizei nu ar
fi corelate ntre ele.
Comunaliti (communalities)
Iniiale Extrase
s aib relaii? ,378 ,580
s arate bine? ,165 ,184
s cread n Dumnezeu? ,150 ,148
s aib noroc/ans? ,248 ,276
s fac coal? ,382 ,582
s fie inteligent? ,316 ,424
s fure? ,113 ,126
s munceasc mult? ,307 ,426
s tie s se descurce? ,128 ,143
s se nasc ntr-o familie bogat? ,360 ,515
Extraction Method: Maximum Likelihood.
37,8% din variana primei variabile
este datorat corelaiilor
(covarianei) din setul de date.
(comunalitatea iniial a primei
variabile este 0,378).
n urma extraciei factorilor, 58%
din variana primei variabile este
explicat de factorii in model
(comunalitatea extras este 0,580).
Total Variance Explained
2,787 27,866 27,866 2,176 21,756 21,756 1,803 18,031 18,031
1,781 17,813 45,679 1,229 12,287 34,043 1,601 16,011 34,043
,966 9,656 55,335
,875 8,752 64,087
,828 8,277 72,364
,680 6,804 79,168
,633 6,329 85,497
,576 5,755 91,252
,452 4,516 95,768
,423 4,232 100,000
Factor
1
2
3
4
5
6
7
8
9
10
Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Primul factor explic
variana
corespunztoare a 2,78
variabile, iar factorul al
doilea variana a 1,78
variabile. Toi ceilali
factori extrai explic
mai puin dect variana
unei unei variabile.
Primul factor explic
27,8% din variana
comun total a
variabilelor, iar cel de-al
doilea 17,8%. Cumulat,
primii doi factori extrai
explic 45% din
variana comun
total a variabilelor.
Pentru soluia factorial iniial, suma ptratelor
saturaiilor factoriale este 2,176 pentru F1 i 1,229
pentru F2. Factorul F1 explic 21,5% din variana
total a variabilelor, iar F2 12,8%. Cumulat,
ptratul saturaiilor factoriale constituie 34% din
variana total a variabilelor. Dup rotaia factorilor,
suma ptratelor saturaiilor este 1,803 pentru F1 i
1,601 pentru F2. Observm c proporia de
varian total explicat cumulat de F1 i F2 nu
se schimb n urma rotaiei factorilor (este tot
34%!). Se schimb valoarea saturaiilor pentru
fiecare factor, dar NU se schimb suma ptratelor
acestor saturaii.
Soluia factorial optim este cea cu doi factori extrai.
Soluia (modelul) factorial iniial:
Acest model este destul de
dificil de interpretat.
Oare nu am putea redistribui
variana comun explicat de
factori a ntregului set de
variabile astfel nct modelul
relaiilor dintre factori i
fiecare dintre variabile s fie
ct mai clar i adecvat unei
interpretri teoretice?
Aceasta este problema rotaiei
factorilor.
Factor Matrix
a
,572 ,503
,565 -,324
,562 -,516
,524 ,490
,492 -,428
,483 ,206
,421
,378
,367 -,118
,343
S ai b rel ati i ?
S fi e
S fac scoal ?
bogat?
S munceasc mul t?
S ai b noroc/ sans?
S arate bi ne?
S cread n Dumnezeu?
S fure?
1 2
Factor
2 factors extracted. 4 i terations requi red.
a.
Dac presupunem c factorii sunt independeni, atunci sistemul de axe este ortogonal
iar saturaiile factorilor sunt egali cu coeficienii de corelaie Pearson dintre variabile i
factori.
Corelaia dintre factori: r
F1F2
=F
1
*F
2
* cos 90 = F
1
*F
2
* 0 = 0.
Putem roti soluia factorial pstrnd independena (ortogonalitatea) factorilor.

Interpretarea coeficientului de corelaie ca un produs vectorial

F
1

b
11
X
1

b
21
X
2

F
2

b
11
b
22

Coeficientul de corelaie a lui Pearson r
X1,X2
=X1*X2*cos
Cos 90=0
Cos 0=1
Noi nu cunoatem lungimea vectorilor, doar valoarea coeficientului de corelaie.
Acesta poate fi descompus n funcie de saturaiile factorilor:
r
X1 X2
= b
11
* b
21
+ b
12
* b
22
+ b
11
* b
22
* r
F1F2
+ b
21
* b
12
* r
F1F2
Dac factorii sunt ortogonali, atunci r
X1 X2
= b
11
* b
21
+ b
12
* b
22

Dac presupunem c factorii sunt corelai, atunci sistemul de axe NU este ortogonal, ci
oblic. Saturaiile factorilor (efectele directe ale fiecrui factor) vor diferi de coeficienii de
corelaie dintre factori i variabile, pentru c o parte din corelaie se datoreaz corelaiei
dintre factori (efecte indirecte ale factorilor prin ceilali factori). Corelaia dintre factori:
r
F1F2
=F
1
*F
2
* cos
Putem roti soluia factorial presupunnd c factorii coreleaz (rotaie oblic).

Interpretarea coeficientului de corelaie ca un produs vectorial

F
1

b
11
X
1

b
21
X
2

F
2

b
11
b
22

Coeficientul de corelaie a lui Pearson r
X1,X2
=X1*X2*cos
Cos 90=0
Cos 0=1
r
X1 X2
= b
11
* b
21
+ b
12
* b
22
+ b
11
* b
22
* r
F1F2
+ b
21
* b
12
* r
F1F2

Saturaiile factorilor (b
11
, b
21
pentru F1, b
12
, b
22
pentru F2 etc.) vor fi egale cu
coeficienii de corelaie pariali, obinui prin controlarea efectelor celorlali factori.
Saturaiile pot fi interpretate ca i coefieni de regresie multinear standardizai (beta).

Variana = comunalitatea + variana datorat factorului unic U
VAR (X
1
) = b
11
2
+ b
12
2
+ b
11
* b
12
* 2 r
F1F2
- d
1
2

Dac presupunem c factorii nu sunt corelai, atunci matricea de structur
(Factor Matrix sau Structure Matrix) care prezint corelaiile dintre factori i
variabile va fi identic cu matricea saturaiilor (Pattern Matrix sau Pattern
Loadings).
Dac factorii sunt corelai, atunci acestea au att efecte directe asupra
variabilelor (prezentate n matricea saturaiilor Pattern Matrix sau Pattern
Loadings) ct i efecte indirecte.
r
X1 X2
= b
11
* b
21
+ b
12
* b
22
+ b
11
* b
22
* r
F1F2
+ b
21
* b
12
* r
F1F2

efectul efectul efectele indirecte
direct al lui F1 direct al lui F2 datorate corelaiei dintre F1 i F2

Soluia iniial: Factor Matrix sau Matricea de Structur
Factor 1 Factor 2
s arate bine? ,565 -,324
s cread n Dumnezeu? ,562 -,516
s fac coal? ,492 -,428
s fie inteligent? ,483 ,206
s fure? ,421
s munceasc mult? ,378
s tie s se descurce? ,367
s se nasc ntr-o familie bogat? ,343
Extraction Method: Maximum Likelihood. 2 Factors extracted. 4 iterations required.
Rotated Factor Matrix Matricea de structur dup rotirea ortogonal a factorilor
Factor 1 Factor 2
s fac coal? ,762
s fie deteapt/inteligent? ,641
s cread n Dumnezeu? ,357
s aib relaii? ,753
s fure? ,321
Extraction Method: Maximum Likelihood. Rotation Method: Equamax with Kaiser Normalization.
a Rotation converged in 3 iterations.
Corelaiile dintre factori i variabile
conform soluiei iniiale.
Dup rotirea factorilor, observm c
variabilele s fac coal, s
munceasc, s fie inteligent coreleaz
puternic cu primul factor, iar variabilele s
aib relaii, s se nasc ntr-o familie
bogat, s aib noroc cu cel de-al
doilea factor. Celelalte variabile coreleaz
doar moderat cu factorii, iar dou dintre
ele coreleaz aproximativ la fel cu ambii
factori extrai.
Dac renunm la condiia de independen a factorilor i realizm o rotire oblic atunci
matricea de structur (Factor matrix) va fi diferit de matricea saturaiilor (Pattern Matrix
sau factor Loadings Matrix).
Pattern Matrix: Matricea saturaiilor
Factor 1 Factor 2
s fac coal? ,783
s aib relaii? ,753
s aib noroc/ans? ,447
s arate bine? ,346
s fure? ,238 ,306
Extraction Method: Maximum Likelihood. Rotation Method: Oblimin with Kaiser Normalization.
a Rotation converged in 8 iterations.
Structure Matrix: Matricea corelaiilor dintre factori i variabile
Factor 1 Factor 2
s fac coal? ,752
s fure? ,302
Extraction Method: Maximum Likelihood. Rotation Method: Oblimin with Kaiser Normalization.

Factor Correlation Matrix
1,000 ,233
,233 1,000
Factor
1
2
1 2
Rotation Method: Oblimin with Kaiser Normalization.
Corelaia dintre factori este slab,
coeficientul de corelaie a lui
Pearson ia valoarea 0.233.
n acest caz, este de preferat soluia
factorial ortogonal deoarece dimensiunile
sugerate de cei doi factori sunt distincte i
(teoretic) independente.
Corelaia slab dintre factori, identificat prin
rotirea oblic, ne arat c modelul oblic nu
difer considerabil de cel ortogonal.
Interpretare?
Primul factor reflecta dimensiunea efortului personal (educaie,
munc, inteligen) pentru a reusi in viata, iar cel de-al doilea factor, a
contextului social (relaii, a fi nscut ntr-o familie bogat, a avea
noroc).
Am putea construi doi indeci, care sa reflecte acesti doi factori:
1. efortul personal (achieved) Index efort
2. elemente contingente, ce nu in de individ (ascribed, contextual)
Index factori externi
Cum s construim aceti indeci?
I. Scale aditive simple, care nu in seama de intensitatea relaiilor dintre
factori i variabile.
Index efort = s fac coal + s munceasc mult + s fie deteapt
Index factori externi = s aib relaii + s se nasc ntr-o familie bogat + s aib noroc
Putem pstra valorile iniiale ale varibilelor, sau le putem recoda n variabile
dihotomice, unde 0 nseamn nu e important i 1 important.

Scoruri factoriale
II. Construirea unor scale aditive ce in seama de intensitatea relaiilor dintre
variabile i factori i acord ponderi diferite variabilelor.

Avnd n vedere c variabilele observate indic mai puternic sau mai modest
dimensiunea latent (factorul) cercetat, acestea capt ponderi (weights) diferite n
indicele final. Ponderea este dat de un scor (un numr) cu care multiplicm
valoarea variabilei respective pentru fiecare caz (individ statistic).
Acest scor ne este furnizat n urma analizei factoriale i apare ca o nou variabil
n baza de date (cu valori diferite pentru fiecare obiect din eantion).
Scorul poate fi determinat prin mai multe metode:

1. Metoda regresiei. Scorul este o estimat a coeficientului de regresie dintre factor
i variabil. Se caut obinerea unui factor F estimat astfel nct corelaia dintre
factorul latent F i variabil s fie maxim.
2. Metoda Bartlett. Varianele datorate factorilor de unicitate sunt considerate erori
de eantionare, deci drept aleatoare. Se acord astfel scoruri mai sczute
variabilelor care prezint erori mai mari prin mprirea la erori.
3. Metoda Rubin-Anderson. Utilizeaz aceeai procedur de estimare a diferenei
ptratice dintre factorii estimai i variabilele observate, dar pune condiia c
factorii estimai sunt ortogonali doi cte doi.

Contruirea unor indici (scale) aditive
Conform modelului nostru:

S fac coala = 0.78*F1 0.13*F2 + U1
S munceasc mult =0.67*F1 + U2
S fie deteapt = 0.64*F1 + U3
S cread n Dumnezeu=0.34*F1+0.1*F2
..

Pattern Matrix
a
,785 -,137
,670
,643
,348 ,101
,269 ,208
,755
,717
,187 ,447
-,194 ,348
,236 ,306
S fac scoal ?
S munceasc mul t?
S fi e
S cread n Dumnezeu?
S ai b rel ati i ?
bogat?
S ai b noroc/ sans?
S fure?
S arate bi ne?
1 2
Factor
Rotati on Method: Obli mi n wi th Kai ser Normal i zati on.
Rotati on converged in 7 i terati ons.
a.
Index efort personal =
rv7*score_F1 + rv8*score_F1
+ rv5*score_F1
Index factori externi =
rv2*score_F2 + rv1*score_F2
+ rv3*score_F2
Celelalte variabile nu au o apartenen clar la nici
unul dintre cei doi indeci.

Analiza Factoriala

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Analiza Factoriala

Uploaded by

Copyright:

Available Formats

Metode cantitative avansate

You might also like