Professional Documents
Culture Documents
= =
Analiza tabelelor de contingen, prin utilizarea distribuiei cu dou
dimensiuni, surprinde corelaia care exist ntre variabilele studiate X i Y, ct i
intensitatea dependenei dintre acestea.
n urma nregistrrii simultane a msurtorilor asupra unitilor populaiei,
dup cele dou caracteristici, se obine tabelul de condingent de forma:
Tabelul 10.1.
Y
X
y
i
... y
j
...
y
j
n
i
.
x
1
n
11
... n
1j
... n
1p
n
1
.
M M
x
i
n
i1
... n
ij
... n
ip
n
i
.
M
M
x
k
n
k1
... n
kj
... n
kp
n
k
.
n.
j
n.
1
n.
j
n.
p
n.. (=n)
n tabelul 10.1. n
j
. reprezint numrul unitilor statistice pentru care,
corespunztor caracteristicii X, s-a nregistrat modalitatea x
i
, fr a ine seama de
valorile caracteristicii (variabilei) Y. n.
j
definete numrul unitilor statistice pentru
care, corespunztor variabilei Y, s-a nregistrat modalitatea y
i
, fr a lua n considerare
valorile nregistrate pentru caracteristica X. Numerele
(10.2.2.) n
ij
= card{uP: X(u)=x
i
;i Y(u)=y
j
}
din interiorul tabelului de corelaie se mai numesc efective pariale. Seriile
10.2. Metoda tabelului de contingen 231
(10.2.3) ;
. n
y
;
. n
x
p , 1 j
j
i
k , 1 i
i
i
= =
reprezint distribuiile unitilor populaiei statistice dup o singur caracteristic X,
respectiv Y, frecvenele lor se mai numesc efective marginale pentru variabila X,
respectiv Y, n=n.. reprezentnd numrul de uniti ale populaiei se numete efectiv
total. ntre efectivele definite mai sus exist relaiile:
(10.2.4) . n n . n n , . n n
p
1 j
k
1 i
ij
k
1 i
i ij
p
1 j
i ij
= = =
= = = =
Efectivele de mai sus sunt, de fapt, frecvene absolute pe baza lor se pot
construi frecvenele relative corespunztoare.
(10.2.5)
.. n
n
f
ij
ij
= ,
care definesc ponderea fiecrei nregistrri (x
i
, y
j
) n raport cu efectivul total.
Frecvenele pariale raportate la efectivele marginale se numesc frecvene
pariale condiionate:
(10.2.6) p , 1 * j , k , 1 i ,
. n
n
f f
* j
* ij * j
i * j / i
= = = = fixat.
* j
i
f definete proporia unitilor care au valoarea variabilei X ncadrat n
modalitatea x
i
, n raport cu efectivul unitilor care au n comun modalitatea y
j
pentru
variabila Y.
n mod analog se definesc i frecvenele pariale condiionate
(10.2.7) k , 1 * i , p , 1 j ,
. n
n
f f
* i
j * i
* i
j * i / j
= = = = fixat.
Prin raportarea efectivelor marginale la efectivul total se obin frecvenele
relative marginale pentru variabila X, respectiv Y:
p , 1 j ,
.. n
. n
. f ; k , 1 i ,
.. n
. n
. f
j
j
i
i
= = = =
ntre frecvenele relative definite mai sus se stabilesc relaiile:
(10.2.8)
= = = =
= = =
p
1 j
j
k
1 i
i
k
1 i
p
1 j
ij
1 . f ., 1 . f , 1 f
(10.2.9)
ij
* j
i
j ij
* i
j i
f f . f , f f . f = =
Metode de analiz statistic a legturilor dintre fenomene - 10 232
Analiza tabelului de contingent cuprinde n primul rnd analiza distribuiilor
marginale corespunztoare celor dou caracteristici X, respectiv Y. Fiecare din acestea
poate fi analizat ca o serie unidimensional.
Astfel, pentru seria de frecvene:
(10.2.10)
. n ... . n . n
x ... x x
: X
k 2 1
k 2 1
se poate calcula media ponderat:
(10.2.11)
=
=
=
= =
k
1 i
i i
k
1 i
i
k
1 i
i i
x . f
. n
x . n
x
innd seama de relaia
=
=
p
1 j
ij i
n . n , aceast valoare medie este dat de
asemenea prin:
(10.2.12)
= =
=
k
1 i
p
1 j
ij i
n x
.. n
1
x
Pentru aceeai distribuie marginal corespunztoare caracteristicii X se obine
variana (dispersia):
(10.2.13)
( )
( )
=
=
=
=
=
k
i
i i k
i
i
k
i
i i
f x x
n
n x x
X V
1
2
1
1
2
.
.
.
) (
Abaterea medie ptratic (X) se calculeaz ca rdcin ptrat din variant,
(V(X)=
2
(X)), deci avem:
(10.2.14) ), ( ) ( X V X =
iar coeficientul de variaie exprimat n procente este definit prin :
(10.2.15) C(X)
%
=
x
X) (
100
Aceleai caracteristici numerice pot fi calculate pentru distribuia marginal
corespunztoare caracteristicii Y.
Fie acum o modalitate fixat y
j
corespunztoare caracteristicii Y, utiliznd frec-
venele absolute (efectivele) coloanei lui y
j
i valorile caracteristicii X se definete seria
unidimensional a caracteristicii X condiionat de modalitatea y
j
a caracteristicii Y:
10.2. Metoda tabelului de contingen 233
(10.2.16) p , 1 j ,
n ... n n
x ... x x
: X
kj j 2 j 1
k 2 1
j
=
fixat
Corespunztor acestei distribuii condiionate de variabil X i corespunde:
medie condiionat:
(10.2.17)
=
=
=
=
= = =
k
1 i
* j / i i
j .
k
1 i
ij i
k
1 i
ij
k
1 i
ij i
j f x
n
n x
n
n x
x ,
pentru fiecare j= p , 1 fixat;
varian condiionat:
(10.2.18)
( )
( ) ; p , 1 j , f x x
. n
n x x
) X ( V
k
1 i
* j / i
2
j i
j
k
1 i
ij
2
j i
j
=
=
= =
=
abatere standard:
(10.2.19) p , 1 j , ) x ( V ) X (
j j
= = fixat;
un coeficient de variaie:
(10.2.20) p , 1 j , 100
x
) X (
) X ( C
j
j
%
j
=
= fixat.
Dac se fixeaz o modalitate x
i
a caracteristicii X, atunci aceleai caracteristici
numerice pot fi construite pentru distribuiile condiionate ale variabilei Y, de
modalitile x
i
, i= k , 1 fixat:
(10.2.21) .
n ... n n
y ... y y
: y
ip 12 1 i
p 2 1
i
Vom obine:
(10.2.22)
( )
.
1
2
.
1
) ( ,
i
p
j
ij i i
i
i
p
j
ij i
i
n
n y y
Y V
n
n y
y
= =
= =
(10.2.23) 100
y
) X (
) Y ( C ) Y ( V ) Y (
i
i %
i i i
= = .
Metode de analiz statistic a legturilor dintre fenomene - 10 234
Valorile numerice prezentate anterior caracterizeaz variabilele statistice
marginale i condiionate, ca serii unidimensionale de variabil X, respectiv Y, fr
a stabili legturi ntre aceste caracteristici.
Pornind de la faptul c ntre efectivele acestor serii unidimensionale exist
relaiile de legtur (10.2.4), vom arta c acestea conduc la anumite relaii de legtur
ntre aceste caracteristici numerice.
Dac pentru fiecare j= p , 1 asociem mediei condiionate a variabilei X, x
j
dat
de (10.2.17) frecvena absolut marginal n
.j
obinem o nou serie unidimensional.
(10.2.24) X =
p 2 1
p 2 1
. n ... . n . n
x ... x x
.
Dac pentru aceast serie statistic calculm valoarea medie, atunci aceasta
reprezint o medie a mediilor condiionate ale variabilei X, cu ponderile marginale
corespunztoare acesteia, i care poate fi interpretat ca media variabilei X, prezentat
printr-un tablou cu dubl intrare. O notm cu x i avem:
(10.2.25)
=
=
=
=
=
p
1 j
j j
p
1 j
j
p
1 j
j j
. f x
. n
. n x
x .
n mod asemntor se definete media pentru variabila Y. Avem:
(10.2.26)
=
=
=
=
=
k
1 i
i i
k
1 i
i
k
1 i
i i
. f y
. n
. n y
y .
Variana seriei (10.2.24) poart numele de variana mediilor condiionate
pentru variabila (caracteristica) X.
Notm cu V( x ) aceast varian i avem:
(6.2.27)
( )
( )
2
1
.
1
.
1
.
1
.
) ( x
n
n x
n
n x x
X V
p
j
j
p
j
j
j
p
j
j
p
j
j
j
=
=
=
=
.
10.2. Metoda tabelului de contingen 235
Abaterea standard a mediilor condiionate este ( X )= ( ) X V .
n mod asemntor pentru variabila Y variana mediilor condiionate este dat
prin:
(6.2.28)
( )
( )
2
1
.
1
.
1
.
1
.
) ( y
n
n y
n
n y y
Y V
p
j
j
k
i
i i
k
i
i
k
i
i j
=
=
=
=
,
iar abaterea standard a mediilor condiionate este ( Y )= ( ) y V .
Dac pentru variabila X, dat prin tabelul de covarian, considerm variana
total dat prin:
(10.2.29) ( )
. i
2
k
1 i
p
1 j
i
f x x ) X ( V
= =
= ,
iar media varianelor condiionate:
(10.2.30)
( )
= =
= =
=
=
= =
k
1 i
p
1 j
ij
ij
k
1 i
p
1 j
2
j
i
p
1 j
j .
p
1 j
j . j
n
n x x
n
n ) X ( V
) x ( V ,
atunci pornind de la relaia:
( ) ( )
j i j
i i
x x x x x x + =
se obine relaia
(10.2.31) ) x ( V ) x ( V ) X ( V + = ,
adic variana total a caracteristicii X este suma dintre media varianelor distribuiilor
condiionate i variana mediilor distribuiilor condiionate.
Indicatorii calculai mai sus pe baza datelor dintr-un tabel cu dubl intrare au
fost calculai pe baza seriilor univariate obinute din tabel. Analiznd simultan variaia
celor dou caracteristici nregistrate ntr-un tabel cu dubl intrare, pot fi introdui ali
indicatori statistici, dintre acetia covariana msoar intensitatea legturii dintre cele
dou variabile.
Exemplul 1. S presupunem c pentru dou variabile economice (X,Y) datele
nregistrate sunt coninute n tabelul 10.2 cu dubl intrare (bivariat).
Metode de analiz statistic a legturilor dintre fenomene - 10 236
Tabelul 10.2
Y
X
60 70 80 90 n
i.
150 3 4 1 - 8
160 1 7 7 2 17
170 1 3 5 4 13
180 - 1 3 8 12
n
.j
5 15 16 14 50
S se calculeze caracteristicile numerice (medie, dispersie, varian, coeficient
de variaie) pentru distribuiile marginale i condiionate dup variabilele X i Y.
Pentru variabila X avem distribuia marginal:
12 13 17 8
180 170 160 150
: X ,
pentru care se obin indicatorii: valoarea medie x =165,8, variana V(X)=104,36,
abaterea medie standard (X)= ) X ( V =10,22 i coeficientul de variaie
C(X)=6,16%.
Histograma din fig.10.2. prezint distribuia de frecvene marginale dup
caracteristica X.
0
2
4
6
8
10
12
14
16
18
150 160 170 180
Fig.10.2.
Distribuia de frecvene marginale dup variabila Y este:
14 16 15 5
90 80 70 60
: Y ,
10.2. Metoda tabelului de contingen 237
pentru aceasta se obin indicatorii: valoarea medie y =77,8, variana V(X)=93,16,
abaterea medie standard (y)=9,65, coeficientul de variaie C(Y)= 12,41% i
histograma de frecvene din fig.10.3.
0
2
4
6
8
10
12
14
16
60 70 80 90
Fig.10.3.
Pentru a calcula indicatorii menionai pentru distribuiile condiionate dup
variabila X este util s construim un tabel de forma:
Tabelul 10.3.
Y 60 70 80 90
X
(xi)
n
i1
n
i1
x
i
n
i1
x
i
2
n
i2
n
i2
x
i
n
i2
x
i
2
n
i3
n
i3
x
i
n
i3
x
i
2
n
i4
n
i4
x
i
n
i4
x
i
2
150 3 450 67500 4 600 90000 1 150 22500 0 0 0
160 1 160 25600 7 1120 179200 7 1120 179200 2 320 51200
170 1 170 28900 3 510 86700 5 850 144500 4 680 115600
180 0 0 0 1 180 32400 3 540 97200 8 1440 259200
Total 5 780 122000 15 2410 388300 16 2660 443400 14 2440 426000
Pe baza datelor din Tabelul 10.3 se obin indicatorii distribuiilor de frecvene
dup variabila X, condiionate de modalitile variabilei Y. Avem: 156
5
780
x
1
= = ,
64 156
5
122000
) X ( V
2
1
= = ,
I
(X)=8 i C
1
(X)=5,1%;
x
2
=160,7, V
2
(X)=62,18,
2
(X)=7,89 i C
2
(X)=4,91%;
x
3
=166,25, V
3
(X)=73,4,
3
(X)=8,57 i C
2
(X)=5,15%;
x
4
=174,3, V
3
(X)=48,08,
4
(X)=6,93 i C
2
(X)=3,98%.
Metode de analiz statistic a legturilor dintre fenomene - 10 238
Analiznd coeficientul de variaie observm c distribuia condiionat de
modalitatea y
i
=90 este cea mai omogen.
n mod analog se calculeaz indicatorii medii i ai variaiei pentru distribuiile
de frecvene condiionate dup variabila Y.
10.3. Covarian pentru dou
variabile statistice
n paragraful precedent, pornind de la tabelul cu dubl intrare pentru dou
variabile X, Y (tabelul 10.1), folosind seriile univariate marginale i condiionate, au
fost calculai diferii indicatori. Pe baza aceluiai tabel de contingen pot fi calculai
indicatori de analiz a variaiei simultane a celor dou caracteristici X i Y. Dintre
acetia vom prezenta momentele simple, momentele centrate i covariana.
Pentru u i v numere naturale, corespunztor variabilelor X i Y se calculeaz
pe baza datelor din tabelul de contingen momentele simple de ordinul u i v prin
relaia:
(10.3.1)
= =
=
k
1 i
p
1 j
ij
v
j
u
i
v , u
n y x
n
1
) Y , X ( M
Pentru u=1 i v=0 M
1,0
(X,Y)= x , iar pentru u=0 i v=1 M
0,1
(X,Y)= y .
Momentele centrate de ordinul u i v se calculeaz ca i momentele simple
pentru variabilele centrate X- x i Y- y, adic avem relaia:
(10.3.2)
= =
=
k
1 i
p
1 j
ij
v
j
u
i v , u
n y y x x
n
1
) Y , X ( m
Covariana unei variabile bidimensionale (X,Y) se utilizeaz ca indicator
intermediar n msurarea legturii liniare dintre cele dou variabile X i Y.
Calculul covarianei se face cu relaia:
(10.3.3) ( ) ( )
= =
=
k
1 i
p
1 j
ij j i
n y y x x
n
1
) Y , X ( cov ,
adic cov (X,Y)=m
1,1
(X,Y).
Din (10.3.3) se obine urmtoarea formul echivalent de calcul a covarianei:
(10.3.4) y x ) Y , X ( m y x n y x
n
1
) Y , X ( cov
k
1 i
p
1 j
1 , 1 ij j i
= =
= =
.
10.3. Covarian pentru dou variabile statistice 239
Din formulele de calcul a covarianei rezult urmtoarele proprieti ale
acesteia:
a) Covariana este un indicator simetric, adic are loc:
cov (X,Y) = cov (Y,X).
b) Covariana este o funcie omogen n ambele variabile, adic:
cov (X,Y) = cov (X,Y) oricare ar fi ,3.
c) Dac una din variabile este constant, atunci:
cov (X,Y) = 0.
d) Dac X
1
, X
2
sunt dou variabile independente i , dou numere reale,
atunci
cov(X
1
+X
2
, Y) = cov(X,Y) + cov(X
2
Y)
e) ( ) ) Y ( V ) X ( V Y , X cov
S reprezentm grafic prin puncte de coordonate (x
i
, y
i
) valorile nregistrate
pentru variabilele X, Y. Vom obine un grafic (fig.10.4) ce se numete norul de puncte
al variabilei bidimensionale (X,Y).
fig.10.4.
Punctele situate n cadranele I i III arat o legtur direct ntre cele dou
variabile X i Y, iar cele din cadranele II i IV pun n eviden o legtur indirect. Cu
ct predomin punctele dispuse, n una sau alta din cele dou perechi de cadrane, n
lungul uneia, respectiv alteia din cele dou bisectoare, cu att acea legtur este mai
puternic.
ntruct covariana nu este un indicator normalizat i depinde de unitile de
msur pe cele dou axe, ea nu se poate utiliza direct pentru aprecierea intensitii
Metode de analiz statistic a legturilor dintre fenomene - 10 240
legturii, dar, pornind de la covariant, se construiete coeficientul liniar de corelaie,
ca indicator de msur a intensitii legturii dintre dou variabile.
Exemplul 1. S se calculeze covariana pentru variabilele X, Y pentru care
datele nregistrate sunt prezentate n tabelul 10.3 de contingen (exemplul 1 din
.10.2.).
Se va utiliza formula (10.3.4), iar calculele pot fi aranjate ca n tabelul urmtor:
Tabelul 10.4
Y
X (y
i
)
(x
i
)
60
70
80
90
n
i.
x
i
n
i.
x
i
2
n
i.
=
4
1 j
ij j
n y
=
4
1 j
ij j i
n y x
150 3 4 1 - 8 1200 180000 540 81000
160 1 7 7 2 17 2720 435200 1290 206400
170 1 3 5 4 13 2210 375700 1030 175100
180 - 1 3 8 12 2160 388800 1030 185400
n
.j
5 15 16 14 50 8290 1379700 - -
y
j
n
.j
300 1050 1280 1260 3890
y
j
2
n
.j
18000 73500 102400 113400 307300
=
4
1 j
ij i
n x
780
2410
2660
2440
-
=
4
1 j
ij i j
n x y
46800
168700
212800
219600
-
Se obine cov (X,Y)=58,76, ce arat c ntre cele dou variabile exist o
legtur pozitiv (direct).
10.4. Graficul de corelaie. Curba de regresie.
Raportul de corelaie
S presupunem c pentru o serie bivariat (X,Y) s-au nregistrat n cupluri de
valori (x
i
, y
i
), i= n , 1 . Dac fiecrei perechi de valori (x
i
, y
i
) i se asociaz un punct
dintr-un plan, raportat la un sistem de axe carteziene, atunci spunem c s-a realizat
reprezentarea grafic a seriei bivariate. Poziionarea punctelor n plan d o imagine a
seriei bivariate, n funcie de care se poate stabili intuitiv gradul de dispersare a
unitilor, precum i forma legturii dintre cele dou variabile. Graficul astfel trasat
poart numele de grafic de corelaie sau graficul norului de puncte. Pentru a obine o
concluzie ct mai veridic trebuie ca numrul de valori nregistrate s fie suficient de
mare.
10.5. Metoda regresiei 241
Exemplul 1. S presupunem c variabilele X i Y reprezint cheltuielile de
reclam i respectiv volumul vnzrilor. Pe parcursul a 10 luni s-au nregistrat aceste
cheltuieli i vnzri, obinndu-se astfel urmtoarele perechi de valori (n aceleai
uniti bneti): (1,2; 101), (0,8; 92), (1,00; 110), (1,3; 120), (0,7; 90), (0,8; 82),
(1,0; 93), (0,6; 75), (0,9; 91), (1,1; 105).
Folosind aceste date se obine intuitiv legtura dintre cheltuielile de reclam i
volumul vnzrilor prin graficul de corelaie din fig.10.5.
Fig.10.5.
Se observ clar, de pe grafic, c la o cretere a lui x
i
corespunde o cretere a
lui y
i
. Mai mult, plasnd o linie dreapt printre aceste puncte, ea poate fi folosit la o
previziune asupra evoluiei vnzrilor, corespunztoare unei evoluii a cheltuielilor de
reclam.
Curba de regresie asigur o sintetizare, dup anumite reguli de calcul, a
norului de puncte (graficul de corelaie) prin marcarea n planul de reprezentare al
norului de puncte a graficului unei funcii analitice.
Pentru analiza dependenei statistice, dintre variabilele X i Y se construiesc
dou curbe de regresie:
a) Curba de regresie a variabilei Y n funcie de X se construiete pe baza
perechilor de numere (x
i
, y
i
), unde y
i
este media distribuiei condiionate
a variabilei Y pentru modalitatea x
i
.
b) Curba de regresie a variabilei X n funcie de Y se construiete pe baza
perechilor ( x
j
, y
j
), unde x
j
este media distribuiei condiionate a
variabilei X pentru modalitatea y
j
.
Metode de analiz statistic a legturilor dintre fenomene - 10 242
n cazul a) curba de regresie unete punctele (x
i
, y
i
), i= k , 1 , unde
y
i
=
=
p
1 j
ij ij
. i
n y
n
1
.
n cazul b) curba de regresie unete punctele ( x
j
, y
j
), j= p , 1 , unde
x
j
=
=
k
1 i
i ij
j
x n
. n
1
.
Pentru datele din Exempul 1 curba de regresie F
y/x
(a lui Y n funcie de X) i
F
x/y
(a lui X n funcie de Y) unete punctele respective din graficul de corelaie
deoarece la fiecare x
i
corespunde un singur y
j
i reciproc, i,j=1,10.
Pentru datele din Exemplul 1, .10.2. curbele de regresie F
x/y
i F
y/x
au forma
din fig.10.6.
Fig.10.6.
Dintre toate curbele de ajustare a evoluiei descrise de norul de puncte, cea
mai bun aproximare este asigurat de curba de regresie, F
Y/X
n sensul c, dac
y =f(x) este o curb de ajustare a norului de puncte, atunci:
(10.4.1) ( )
2
i j
k
1 i
p
1 j
ij
y y f
= =
este minim cnd F
Y/X
=f(x). F
X/Y
se bucur de aceeai proprietate.
Analiza interdependenei dintre fenomenele economice, sociale etc. este
deosebit de dificil. n special, definirea conexiunii cauzale dintre fenomenele
economice trebuie fcut innd seama de condiiile concrete n care apar.
n general, prin conexiune cauzal nelegem faptul c apariia unui eveniment
A determin apariia unui eveniment B, evident n anumite condiii, i neapariia
evenimentului A atrage dup sine neapariia evenimentului B.
Analiza conexiunii cauzale presupune n primul rnd o analiz calitativ i
apoi una cantitativ, pentru a msura att forma ct i intensitatea legturii.
10.5. Metoda regresiei 243
Dup intensitatea conexiunii cauzale distingem: independena total sau lipsa
de legturi, legturi funcionale sau totale i legturi relative sau statistice.
Dac pentru variabilele statistice X i Y s-au nregistrat datele ntr-un tabel cu
dubl intrare, atunci caracteristica X este independent de Y dac distribuiile
condiionate ale variabilei X de modalitile variabilei Y sunt identice ntre ele i de
asemenea sunt identice cu distribuia marginal dup variabila X.
Conexiunea statistic este tipul de legtur cel mai des ntlnit n studiul
fenomenelor din domeniul economic i social.
Particularitatea principal a acestui tip de legtur este c la o valoare dat a
variabilei factoriale X i corespunde o distribuie de valori ale caracteristicii rezultative
Y. O dependen statistic se prezint sub forma:
(10.4.2) f
j
= f(x
i
) +
j
,
unde
j
reprezint componenta aleatoare, care se datoreaz altor factori dect a
variabilei X.
Pe baza graficului norului de putere se determin curba de regresie. Forma
legturii dintre cele dou variabile se determin intuitiv prin modul de dispunere a
punctelor n planul de reprezentare grafic.
Ca tipuri de legturi distingem legturi liniare i neliniare. Cele neliniare pot fi
la rndul lor de diferite forme: parabolice, exponeniale etc. n fig.10.7. a) i b)
reprezint o legtur liniar direct (pozitiv), respectiv invers (negativ), c) una
parabolic, iar d) una exponenial.
S revenim asupra relaiei (10.2.31) numit egalitatea varianelor
(10.4.3) ) x ( V ) x ( V ) X ( V + =
pentru variabila X, ntr-un tabel cu dubl intrare.
Primul termen, variana marginal a caracteristicii X,
(10.4.4)
=
k
1 i
i
2
i
. n x x
.. n
1
) X ( V
este rezultatul tuturor factorilor, att a factorului de grupare ct i a factorilor aleatori.
Ea msoar dispersia global a caracteristicii X.
Variana mediilor distribuiilor condiionate:
(10.4.5) ( )
=
=
p
1 j
j .
2
j
n x x
.. n
1
) x ( V
reprezint dispersia mediilor condiionate ale variabilei X, ea este variana care rezult
din gruparea aplicat i se numete varian explicat prin grupare.
Metode de analiz statistic a legturilor dintre fenomene - 10 244
Fig.10.7.
Media varianelor condiionate
(10.4.6) ( )
=
=
p
1 j
j . j
n X V
.. n
1
) x ( V
reprezint dispersia punctelor din norul de puncte n jurul curbei de regresie F
X/Y
. Ea
se numete varian rezidual.
Raportul de corelaie (R
2
) reprezint un indicator normalizat al aprecierii
intensitii legturii dintre cele dou variabile ale tabelului de contingen. El se
calculeaz dup relaia:
(10.4.7)
) x ( V
) x ( V
1
) x ( V
) x ( V
R
2
Y / X
= = ,
pentru explicarea lui X n funcie de Y i dup relaia:
(10.4.8)
) y ( V
) y ( V
1
) y ( V
) y ( V
R
2
X / Y
= = ,
pentru explicarea lui Y n funcie de X.