You are on page 1of 18

10.

METODE DE ANALIZ STATISTIC A


LEGTURILOR DINTRE FENOMENE



Asupra fenomenelor de mas studiate de statistic acioneaz un numr de
factori principali i secundari, eseniali i neeseniali, sistematici i ntmpltori,
obiectivi i subiectivi, care se gsesc sau nu n legturi reciproce.
Avnd n vedere faptul c statistica studiaz fenomenele de mas prin prisma
legilor statistice care le guverneaz, ce se caracterizeaz prin forma de tendin,
cunoscut i verificat numai la nivelul ansamblului, se impune n mod natural,
analiza legturilor dintre fenomenele de mas studiate de statistic tot sub forma de
tendin a relaiilor de cauzalitate.
Se cunoate c n domeniile tiinifice, tehnice i ale naturii, un loc important
l ocup studiul legturilor cauzale n care un fenomen sau mai multe determin n
mod univoc schimbarea unui alt fenomen. n acest caz este vorba de o legtur
funcional de forma:
(10.1) y = f(x),
unde x, y pot fi variabile reale sau vectoriale.
Pe lng independena a dou sau mai multe fenomene sau existena unor
legturi funcionale, ntre acestea pot s existe legturi de natur statistic.
Particularitatea acestui tip de legturi const n faptul c o caracteristic X denumit
caracteristic factorial, independent (exogen sau cauz) exercit o anumit
influen asupra unei alte caracteristici Y, denumit caracteristic rezultativ,
dependent (endogen sau efect). n cadrul legturilor statistice, unei valori a
caracteristicii factoriale X i corespunde o distribuie de valori a caracteristicii
rezultative Y, din cauz c asupra caracteristicii dependente Y exercit influen i ali
factori (caracteristici), care din punctul de vedere al legturii dintre X i Y se
consider ntmpltori.
Specific legturilor statistice (sociale, economice etc.) este faptul c legitile
ce acioneaz n cadrul acestora nu pot fi verificate pentru fiecare caz n parte, ci
numai la nivelul ntregului ansamblu.
Legturile statistice se pot clasifica dup mai multe criterii.
Dac se ia n considerare o singur caracteristic factorial, care determin o
singur caracteristic rezultativ, ceilali factori fiind considerai reziduali, spunem c
avem o legtur simpl. Cnd se iau n studiu mai mult de dou caracteristici
factoriale spunem c avem o legtur multipl.
Metode de analiz statistic a legturilor dintre fenomene - 10 228
De exemplu, dac se studiaz dependena desfacerii Y, de suprafaa
comercial X, avem o legtur simpl, dac se studiaz profitul ca funcie de suprafaa
comercial, mrimea stocurilor, valoarea desfacerii etc., avem o legtur multipl.
Dup direcia legturilor deosebim: a) legturi directe, atunci cnd la creterea
(descreterea) valorilor caracteristicii factoriale i corespunde creterea (descreterea)
valorilor caracteristicii rezultative; b) legturi inverse, atunci cnd creterii
(descreterii) valorilor unei caracteristici factoriale i corespunde descreterea
(creterea) valorilor caracteristicii rezultative. De exemplu, ntre volumul desfacerii i
ncasrile respective exist o legtur direct.
Dup expresia analitic a legturii, deosebim legturi liniare sau neliniare
(parabolice, hiperbolice, exponeniale etc.).
Dup timpul cnd se produce legtura, pot fi legturi sincrone (concomitente)
sau asincrone (cu decalaj).
Studiul i analiza statistic a legturilor dintre fenomene se face att cu meto-
de simple (elementare), prin care se verific existena i forma legturii dintre caracte-
risticile nregistrate, ct i cu metode mai complexe, utiliznd unele rezultate mate-
matice din studiul funciilor, prin care se msoar intensitatea dependenei statistice.
10.1. Metode elementare de caracterizare
a legturilor dintre variabilele statistice
Dintre metodele elementare de cercetare a legturilor statistice amintim:
m
1
) metoda seriilor statistice paralele
m
2
) metoda gruprilor statistice
m
3
) metoda grafic
m
4
) metoda tabelului de corelaie sau contingen
m
5
) metoda analizei dispersionale.
Metoda seriilor statistice paralele reprezint un procedeu simplu, ce const n
organizarea n paralel a unor serii de date statistice, n ordinea cresctoare sau
descresctoare a caracteristicii factoriale. Prin compararea seriilor de valori astfel
ordonate se poate stabili dac exist sau nu anumite legturi ntre ele, i dac da, care
este direcia acestora. Se pot compara n acest mod serii de distribuie, cronologice sau
teritoriale.
Seriile paralele se folosesc cnd avem un numr relativ mic de uniti
observate. n cazul unui numr mai mare de uniti observate i a unei variaii de
amplitudine mare se recurge la metoda gruprilor statistice.
Metoda gruprilor ncearc s surprind aspectele eseniale ale legturilor
dintre variabilele statistice, dup ce unitile colectivitii se grupeaz n funcie de
caracteristica factorial. Pentru caracteristica rezultativ se calculeaz indicatorii
derivai (mrimi relative sau medii) specifice fiecrei grupe.
10.1. Metode elementare de caracterizare a legturilor dintre variabilele statistice 229
Prin compararea variaiei caracteristicii factoriale cu cea a caracteristicii
rezultative se pot aproxima: caracterul legturii, direcia i intensitatea ei. Pentru
analiza legturilor dintre fenomene trebuie s se obin grupe suficiente, pentru a se
desprinde corect forma de interdependen dintre caracteristicile luate n studiu. n
general este indicat s se lucreze cu intervale de grupare egale pentru fiecare din
caracteristicile implicate n analiza de corelaie.
Metoda grafic const n construirea graficului de corelaie (corelogramei), pe
baza unui sistem de coordonate rectangular. Valorile caracteristicii factoriale X sau
intervalele acesteia se trec pe abscis, iar pe ordonat se trec valorile caracteristicii
rezultative Y sau intervalele acesteia. Fiecare unitate observat, prin valorile msurate
pentru cele dou caracteristici, va determina un punct de aceste coordonate pe graficul
de corelaie. n funcie de amplitudinea variaiei caracteristicii factoriale se stabilete
scala de reprezentare pe abscis. Se recomand, ca i pentru caracteristica rezultativ
Y, s se stabileasc acelai numr de diviziuni al sclii.
Metoda grafic se mai numete i metoda norilor de puncte; ea st la baza
alegerii funciei analitice n cazul regresiei i corelaiei.
Corelograma d posibilitatea stabilirii att a existenei legturii, a sensului, a
formei, a intensitii, ct i a absenei legturii.


Fig.10.1.
Metode de analiz statistic a legturilor dintre fenomene - 10 230
n fig.10.1. graficul a) indic absena unei legturi ntre caracteristicile X i Y,
graficul b) indic o legtur direct, iar graficul c) indic o legtur invers.
10.2. Metoda tabelului de contingen
S considerm o populaie statistic P avnd un numr finit de uniti statistice
(card(P) = n), pentru care, n urma unei observri statistice, s-au nregistrat pentru
caracteristicile X, Y perechile de valori distincte (x
i
, y
j
) i= k , 1 , j= p , 1 cu frecvenele
absolute n
ij
, i= k , 1 , j= p , 1 . n
ij
definete numrul de uniti statistice pentru care s-a
nregistrat msurtoarea x
i
corespunztor caracteristicii X i y
j
corespunztor
caracteristicii Y.
Frecvenele absolute (efective) n
ij
satisfac relaia:
(10.2.1) n n
p
1 j
k
1 i
ij
=

= =

Analiza tabelelor de contingen, prin utilizarea distribuiei cu dou
dimensiuni, surprinde corelaia care exist ntre variabilele studiate X i Y, ct i
intensitatea dependenei dintre acestea.
n urma nregistrrii simultane a msurtorilor asupra unitilor populaiei,
dup cele dou caracteristici, se obine tabelul de condingent de forma:
Tabelul 10.1.
Y
X
y
i
... y
j
...

y
j
n
i
.
x
1
n
11
... n
1j
... n
1p
n
1
.
M M
x
i
n
i1
... n
ij
... n
ip
n
i
.
M
M
x
k
n
k1
... n
kj
... n
kp
n
k
.
n.
j
n.
1


n.
j
n.
p
n.. (=n)

n tabelul 10.1. n
j
. reprezint numrul unitilor statistice pentru care,
corespunztor caracteristicii X, s-a nregistrat modalitatea x
i
, fr a ine seama de
valorile caracteristicii (variabilei) Y. n.
j
definete numrul unitilor statistice pentru
care, corespunztor variabilei Y, s-a nregistrat modalitatea y
i
, fr a lua n considerare
valorile nregistrate pentru caracteristica X. Numerele
(10.2.2.) n
ij
= card{uP: X(u)=x
i
;i Y(u)=y
j
}
din interiorul tabelului de corelaie se mai numesc efective pariale. Seriile
10.2. Metoda tabelului de contingen 231
(10.2.3) ;
. n
y
;
. n
x
p , 1 j
j
i
k , 1 i
i
i
= =


reprezint distribuiile unitilor populaiei statistice dup o singur caracteristic X,
respectiv Y, frecvenele lor se mai numesc efective marginale pentru variabila X,
respectiv Y, n=n.. reprezentnd numrul de uniti ale populaiei se numete efectiv
total. ntre efectivele definite mai sus exist relaiile:
(10.2.4) . n n . n n , . n n
p
1 j
k
1 i
ij
k
1 i
i ij
p
1 j
i ij
= = =

= = = =

Efectivele de mai sus sunt, de fapt, frecvene absolute pe baza lor se pot
construi frecvenele relative corespunztoare.
(10.2.5)
.. n
n
f
ij
ij
= ,
care definesc ponderea fiecrei nregistrri (x
i
, y
j
) n raport cu efectivul total.
Frecvenele pariale raportate la efectivele marginale se numesc frecvene
pariale condiionate:
(10.2.6) p , 1 * j , k , 1 i ,
. n
n
f f
* j
* ij * j
i * j / i
= = = = fixat.
* j
i
f definete proporia unitilor care au valoarea variabilei X ncadrat n
modalitatea x
i
, n raport cu efectivul unitilor care au n comun modalitatea y
j
pentru
variabila Y.
n mod analog se definesc i frecvenele pariale condiionate
(10.2.7) k , 1 * i , p , 1 j ,
. n
n
f f
* i
j * i
* i
j * i / j
= = = = fixat.
Prin raportarea efectivelor marginale la efectivul total se obin frecvenele
relative marginale pentru variabila X, respectiv Y:
p , 1 j ,
.. n
. n
. f ; k , 1 i ,
.. n
. n
. f
j
j
i
i
= = = =
ntre frecvenele relative definite mai sus se stabilesc relaiile:
(10.2.8)

= = = =
= = =
p
1 j
j
k
1 i
i
k
1 i
p
1 j
ij
1 . f ., 1 . f , 1 f
(10.2.9)
ij
* j
i
j ij
* i
j i
f f . f , f f . f = =
Metode de analiz statistic a legturilor dintre fenomene - 10 232
Analiza tabelului de contingent cuprinde n primul rnd analiza distribuiilor
marginale corespunztoare celor dou caracteristici X, respectiv Y. Fiecare din acestea
poate fi analizat ca o serie unidimensional.
Astfel, pentru seria de frecvene:
(10.2.10)

. n ... . n . n
x ... x x
: X
k 2 1
k 2 1

se poate calcula media ponderat:
(10.2.11)

=
=
=
= =
k
1 i
i i
k
1 i
i
k
1 i
i i
x . f
. n
x . n
x
innd seama de relaia

=
=
p
1 j
ij i
n . n , aceast valoare medie este dat de
asemenea prin:
(10.2.12)

= =
=
k
1 i
p
1 j
ij i
n x
.. n
1
x
Pentru aceeai distribuie marginal corespunztoare caracteristicii X se obine
variana (dispersia):
(10.2.13)
( )
( )

=
=
=
=

=
k
i
i i k
i
i
k
i
i i
f x x
n
n x x
X V
1
2
1
1
2
.
.
.
) (
Abaterea medie ptratic (X) se calculeaz ca rdcin ptrat din variant,
(V(X)=
2
(X)), deci avem:
(10.2.14) ), ( ) ( X V X =
iar coeficientul de variaie exprimat n procente este definit prin :
(10.2.15) C(X)
%
=
x
X) (
100
Aceleai caracteristici numerice pot fi calculate pentru distribuia marginal
corespunztoare caracteristicii Y.
Fie acum o modalitate fixat y
j
corespunztoare caracteristicii Y, utiliznd frec-
venele absolute (efectivele) coloanei lui y
j
i valorile caracteristicii X se definete seria
unidimensional a caracteristicii X condiionat de modalitatea y
j
a caracteristicii Y:
10.2. Metoda tabelului de contingen 233
(10.2.16) p , 1 j ,
n ... n n
x ... x x
: X
kj j 2 j 1
k 2 1
j
=

fixat
Corespunztor acestei distribuii condiionate de variabil X i corespunde:
medie condiionat:
(10.2.17)

=
=
=
=
= = =
k
1 i
* j / i i
j .
k
1 i
ij i
k
1 i
ij
k
1 i
ij i
j f x
n
n x
n
n x
x ,
pentru fiecare j= p , 1 fixat;
varian condiionat:
(10.2.18)
( )
( ) ; p , 1 j , f x x
. n
n x x
) X ( V
k
1 i
* j / i
2
j i
j
k
1 i
ij
2
j i
j

=
=
= =

=
abatere standard:
(10.2.19) p , 1 j , ) x ( V ) X (
j j
= = fixat;
un coeficient de variaie:
(10.2.20) p , 1 j , 100
x
) X (
) X ( C
j
j
%
j
=

= fixat.
Dac se fixeaz o modalitate x
i
a caracteristicii X, atunci aceleai caracteristici
numerice pot fi construite pentru distribuiile condiionate ale variabilei Y, de
modalitile x
i
, i= k , 1 fixat:
(10.2.21) .
n ... n n
y ... y y
: y
ip 12 1 i
p 2 1
i


Vom obine:
(10.2.22)
( )
.
1
2
.
1
) ( ,
i
p
j
ij i i
i
i
p
j
ij i
i
n
n y y
Y V
n
n y
y

= =

= =
(10.2.23) 100
y
) X (
) Y ( C ) Y ( V ) Y (
i
i %
i i i

= = .
Metode de analiz statistic a legturilor dintre fenomene - 10 234
Valorile numerice prezentate anterior caracterizeaz variabilele statistice
marginale i condiionate, ca serii unidimensionale de variabil X, respectiv Y, fr
a stabili legturi ntre aceste caracteristici.
Pornind de la faptul c ntre efectivele acestor serii unidimensionale exist
relaiile de legtur (10.2.4), vom arta c acestea conduc la anumite relaii de legtur
ntre aceste caracteristici numerice.
Dac pentru fiecare j= p , 1 asociem mediei condiionate a variabilei X, x
j
dat
de (10.2.17) frecvena absolut marginal n
.j
obinem o nou serie unidimensional.
(10.2.24) X =

p 2 1
p 2 1
. n ... . n . n
x ... x x
.
Dac pentru aceast serie statistic calculm valoarea medie, atunci aceasta
reprezint o medie a mediilor condiionate ale variabilei X, cu ponderile marginale
corespunztoare acesteia, i care poate fi interpretat ca media variabilei X, prezentat
printr-un tablou cu dubl intrare. O notm cu x i avem:
(10.2.25)

=
=
=
=

=
p
1 j
j j
p
1 j
j
p
1 j
j j
. f x
. n
. n x
x .
n mod asemntor se definete media pentru variabila Y. Avem:
(10.2.26)

=
=
=
=

=
k
1 i
i i
k
1 i
i
k
1 i
i i
. f y
. n
. n y
y .
Variana seriei (10.2.24) poart numele de variana mediilor condiionate
pentru variabila (caracteristica) X.
Notm cu V( x ) aceast varian i avem:
(6.2.27)
( )
( )
2
1
.
1
.
1
.
1
.
) ( x
n
n x
n
n x x
X V
p
j
j
p
j
j
j
p
j
j
p
j
j
j

=
=
=
=
.

10.2. Metoda tabelului de contingen 235
Abaterea standard a mediilor condiionate este ( X )= ( ) X V .
n mod asemntor pentru variabila Y variana mediilor condiionate este dat
prin:
(6.2.28)
( )
( )
2
1
.
1
.
1
.
1
.
) ( y
n
n y
n
n y y
Y V
p
j
j
k
i
i i
k
i
i
k
i
i j

=
=
=
=
,
iar abaterea standard a mediilor condiionate este ( Y )= ( ) y V .
Dac pentru variabila X, dat prin tabelul de covarian, considerm variana
total dat prin:
(10.2.29) ( )
. i
2
k
1 i
p
1 j
i
f x x ) X ( V

= =
= ,
iar media varianelor condiionate:
(10.2.30)
( )

= =
= =
=
=

= =
k
1 i
p
1 j
ij
ij
k
1 i
p
1 j
2
j
i
p
1 j
j .
p
1 j
j . j
n
n x x
n
n ) X ( V
) x ( V ,
atunci pornind de la relaia:
( ) ( )
j i j
i i
x x x x x x + =
se obine relaia
(10.2.31) ) x ( V ) x ( V ) X ( V + = ,
adic variana total a caracteristicii X este suma dintre media varianelor distribuiilor
condiionate i variana mediilor distribuiilor condiionate.
Indicatorii calculai mai sus pe baza datelor dintr-un tabel cu dubl intrare au
fost calculai pe baza seriilor univariate obinute din tabel. Analiznd simultan variaia
celor dou caracteristici nregistrate ntr-un tabel cu dubl intrare, pot fi introdui ali
indicatori statistici, dintre acetia covariana msoar intensitatea legturii dintre cele
dou variabile.
Exemplul 1. S presupunem c pentru dou variabile economice (X,Y) datele
nregistrate sunt coninute n tabelul 10.2 cu dubl intrare (bivariat).
Metode de analiz statistic a legturilor dintre fenomene - 10 236
Tabelul 10.2
Y
X
60 70 80 90 n
i.
150 3 4 1 - 8
160 1 7 7 2 17
170 1 3 5 4 13
180 - 1 3 8 12
n
.j
5 15 16 14 50

S se calculeze caracteristicile numerice (medie, dispersie, varian, coeficient
de variaie) pentru distribuiile marginale i condiionate dup variabilele X i Y.
Pentru variabila X avem distribuia marginal:

12 13 17 8
180 170 160 150
: X ,
pentru care se obin indicatorii: valoarea medie x =165,8, variana V(X)=104,36,
abaterea medie standard (X)= ) X ( V =10,22 i coeficientul de variaie
C(X)=6,16%.
Histograma din fig.10.2. prezint distribuia de frecvene marginale dup
caracteristica X.
0
2
4
6
8
10
12
14
16
18
150 160 170 180

Fig.10.2.
Distribuia de frecvene marginale dup variabila Y este:

14 16 15 5
90 80 70 60
: Y ,
10.2. Metoda tabelului de contingen 237
pentru aceasta se obin indicatorii: valoarea medie y =77,8, variana V(X)=93,16,
abaterea medie standard (y)=9,65, coeficientul de variaie C(Y)= 12,41% i
histograma de frecvene din fig.10.3.
0
2
4
6
8
10
12
14
16
60 70 80 90

Fig.10.3.
Pentru a calcula indicatorii menionai pentru distribuiile condiionate dup
variabila X este util s construim un tabel de forma:
Tabelul 10.3.
Y 60 70 80 90
X
(xi)
n
i1
n
i1
x
i

n
i1
x
i
2
n
i2
n
i2
x
i

n
i2
x
i
2
n
i3
n
i3
x
i

n
i3
x
i
2
n
i4
n
i4
x
i

n
i4
x
i
2

150 3 450 67500 4 600 90000 1 150 22500 0 0 0
160 1 160 25600 7 1120 179200 7 1120 179200 2 320 51200
170 1 170 28900 3 510 86700 5 850 144500 4 680 115600
180 0 0 0 1 180 32400 3 540 97200 8 1440 259200
Total 5 780 122000 15 2410 388300 16 2660 443400 14 2440 426000

Pe baza datelor din Tabelul 10.3 se obin indicatorii distribuiilor de frecvene
dup variabila X, condiionate de modalitile variabilei Y. Avem: 156
5
780
x
1
= = ,
64 156
5
122000
) X ( V
2
1
= = ,
I
(X)=8 i C
1
(X)=5,1%;
x
2
=160,7, V
2
(X)=62,18,
2
(X)=7,89 i C
2
(X)=4,91%;
x
3
=166,25, V
3
(X)=73,4,
3
(X)=8,57 i C
2
(X)=5,15%;
x
4
=174,3, V
3
(X)=48,08,
4
(X)=6,93 i C
2
(X)=3,98%.
Metode de analiz statistic a legturilor dintre fenomene - 10 238
Analiznd coeficientul de variaie observm c distribuia condiionat de
modalitatea y
i
=90 este cea mai omogen.
n mod analog se calculeaz indicatorii medii i ai variaiei pentru distribuiile
de frecvene condiionate dup variabila Y.
10.3. Covarian pentru dou
variabile statistice
n paragraful precedent, pornind de la tabelul cu dubl intrare pentru dou
variabile X, Y (tabelul 10.1), folosind seriile univariate marginale i condiionate, au
fost calculai diferii indicatori. Pe baza aceluiai tabel de contingen pot fi calculai
indicatori de analiz a variaiei simultane a celor dou caracteristici X i Y. Dintre
acetia vom prezenta momentele simple, momentele centrate i covariana.
Pentru u i v numere naturale, corespunztor variabilelor X i Y se calculeaz
pe baza datelor din tabelul de contingen momentele simple de ordinul u i v prin
relaia:
(10.3.1)

= =
=
k
1 i
p
1 j
ij
v
j
u
i
v , u
n y x
n
1
) Y , X ( M
Pentru u=1 i v=0 M
1,0
(X,Y)= x , iar pentru u=0 i v=1 M
0,1
(X,Y)= y .
Momentele centrate de ordinul u i v se calculeaz ca i momentele simple
pentru variabilele centrate X- x i Y- y, adic avem relaia:
(10.3.2)

= =

=
k
1 i
p
1 j
ij
v
j
u
i v , u
n y y x x
n
1
) Y , X ( m
Covariana unei variabile bidimensionale (X,Y) se utilizeaz ca indicator
intermediar n msurarea legturii liniare dintre cele dou variabile X i Y.
Calculul covarianei se face cu relaia:
(10.3.3) ( ) ( )

= =
=
k
1 i
p
1 j
ij j i
n y y x x
n
1
) Y , X ( cov ,
adic cov (X,Y)=m
1,1
(X,Y).
Din (10.3.3) se obine urmtoarea formul echivalent de calcul a covarianei:
(10.3.4) y x ) Y , X ( m y x n y x
n
1
) Y , X ( cov
k
1 i
p
1 j
1 , 1 ij j i
= =

= =
.
10.3. Covarian pentru dou variabile statistice 239
Din formulele de calcul a covarianei rezult urmtoarele proprieti ale
acesteia:
a) Covariana este un indicator simetric, adic are loc:
cov (X,Y) = cov (Y,X).
b) Covariana este o funcie omogen n ambele variabile, adic:
cov (X,Y) = cov (X,Y) oricare ar fi ,3.
c) Dac una din variabile este constant, atunci:
cov (X,Y) = 0.
d) Dac X
1
, X
2
sunt dou variabile independente i , dou numere reale,
atunci
cov(X
1
+X
2
, Y) = cov(X,Y) + cov(X
2
Y)
e) ( ) ) Y ( V ) X ( V Y , X cov
S reprezentm grafic prin puncte de coordonate (x
i
, y
i
) valorile nregistrate
pentru variabilele X, Y. Vom obine un grafic (fig.10.4) ce se numete norul de puncte
al variabilei bidimensionale (X,Y).

fig.10.4.
Punctele situate n cadranele I i III arat o legtur direct ntre cele dou
variabile X i Y, iar cele din cadranele II i IV pun n eviden o legtur indirect. Cu
ct predomin punctele dispuse, n una sau alta din cele dou perechi de cadrane, n
lungul uneia, respectiv alteia din cele dou bisectoare, cu att acea legtur este mai
puternic.
ntruct covariana nu este un indicator normalizat i depinde de unitile de
msur pe cele dou axe, ea nu se poate utiliza direct pentru aprecierea intensitii
Metode de analiz statistic a legturilor dintre fenomene - 10 240
legturii, dar, pornind de la covariant, se construiete coeficientul liniar de corelaie,
ca indicator de msur a intensitii legturii dintre dou variabile.
Exemplul 1. S se calculeze covariana pentru variabilele X, Y pentru care
datele nregistrate sunt prezentate n tabelul 10.3 de contingen (exemplul 1 din
.10.2.).
Se va utiliza formula (10.3.4), iar calculele pot fi aranjate ca n tabelul urmtor:
Tabelul 10.4
Y
X (y
i
)
(x
i
)

60

70

80

90

n
i.

x
i
n
i.


x
i
2
n
i.

=
4
1 j
ij j
n y

=
4
1 j
ij j i
n y x
150 3 4 1 - 8 1200 180000 540 81000
160 1 7 7 2 17 2720 435200 1290 206400
170 1 3 5 4 13 2210 375700 1030 175100
180 - 1 3 8 12 2160 388800 1030 185400
n
.j
5 15 16 14 50 8290 1379700 - -
y
j
n
.j
300 1050 1280 1260 3890
y
j
2
n
.j
18000 73500 102400 113400 307300

=
4
1 j
ij i
n x

780

2410

2660

2440

-

=
4
1 j
ij i j
n x y

46800

168700

212800

219600

-


Se obine cov (X,Y)=58,76, ce arat c ntre cele dou variabile exist o
legtur pozitiv (direct).
10.4. Graficul de corelaie. Curba de regresie.
Raportul de corelaie
S presupunem c pentru o serie bivariat (X,Y) s-au nregistrat n cupluri de
valori (x
i
, y
i
), i= n , 1 . Dac fiecrei perechi de valori (x
i
, y
i
) i se asociaz un punct
dintr-un plan, raportat la un sistem de axe carteziene, atunci spunem c s-a realizat
reprezentarea grafic a seriei bivariate. Poziionarea punctelor n plan d o imagine a
seriei bivariate, n funcie de care se poate stabili intuitiv gradul de dispersare a
unitilor, precum i forma legturii dintre cele dou variabile. Graficul astfel trasat
poart numele de grafic de corelaie sau graficul norului de puncte. Pentru a obine o
concluzie ct mai veridic trebuie ca numrul de valori nregistrate s fie suficient de
mare.
10.5. Metoda regresiei 241
Exemplul 1. S presupunem c variabilele X i Y reprezint cheltuielile de
reclam i respectiv volumul vnzrilor. Pe parcursul a 10 luni s-au nregistrat aceste
cheltuieli i vnzri, obinndu-se astfel urmtoarele perechi de valori (n aceleai
uniti bneti): (1,2; 101), (0,8; 92), (1,00; 110), (1,3; 120), (0,7; 90), (0,8; 82),
(1,0; 93), (0,6; 75), (0,9; 91), (1,1; 105).
Folosind aceste date se obine intuitiv legtura dintre cheltuielile de reclam i
volumul vnzrilor prin graficul de corelaie din fig.10.5.

Fig.10.5.
Se observ clar, de pe grafic, c la o cretere a lui x
i
corespunde o cretere a
lui y
i
. Mai mult, plasnd o linie dreapt printre aceste puncte, ea poate fi folosit la o
previziune asupra evoluiei vnzrilor, corespunztoare unei evoluii a cheltuielilor de
reclam.
Curba de regresie asigur o sintetizare, dup anumite reguli de calcul, a
norului de puncte (graficul de corelaie) prin marcarea n planul de reprezentare al
norului de puncte a graficului unei funcii analitice.
Pentru analiza dependenei statistice, dintre variabilele X i Y se construiesc
dou curbe de regresie:
a) Curba de regresie a variabilei Y n funcie de X se construiete pe baza
perechilor de numere (x
i
, y
i
), unde y
i
este media distribuiei condiionate
a variabilei Y pentru modalitatea x
i
.
b) Curba de regresie a variabilei X n funcie de Y se construiete pe baza
perechilor ( x
j
, y
j
), unde x
j
este media distribuiei condiionate a
variabilei X pentru modalitatea y
j
.
Metode de analiz statistic a legturilor dintre fenomene - 10 242
n cazul a) curba de regresie unete punctele (x
i
, y
i
), i= k , 1 , unde
y
i
=

=

p
1 j
ij ij
. i
n y
n
1
.
n cazul b) curba de regresie unete punctele ( x
j
, y
j
), j= p , 1 , unde
x
j
=

=

k
1 i
i ij
j
x n
. n
1
.
Pentru datele din Exempul 1 curba de regresie F
y/x
(a lui Y n funcie de X) i
F
x/y
(a lui X n funcie de Y) unete punctele respective din graficul de corelaie
deoarece la fiecare x
i
corespunde un singur y
j
i reciproc, i,j=1,10.
Pentru datele din Exemplul 1, .10.2. curbele de regresie F
x/y
i F
y/x
au forma
din fig.10.6.

Fig.10.6.
Dintre toate curbele de ajustare a evoluiei descrise de norul de puncte, cea
mai bun aproximare este asigurat de curba de regresie, F
Y/X
n sensul c, dac
y =f(x) este o curb de ajustare a norului de puncte, atunci:
(10.4.1) ( )
2
i j
k
1 i
p
1 j
ij
y y f

= =

este minim cnd F
Y/X
=f(x). F
X/Y
se bucur de aceeai proprietate.
Analiza interdependenei dintre fenomenele economice, sociale etc. este
deosebit de dificil. n special, definirea conexiunii cauzale dintre fenomenele
economice trebuie fcut innd seama de condiiile concrete n care apar.
n general, prin conexiune cauzal nelegem faptul c apariia unui eveniment
A determin apariia unui eveniment B, evident n anumite condiii, i neapariia
evenimentului A atrage dup sine neapariia evenimentului B.
Analiza conexiunii cauzale presupune n primul rnd o analiz calitativ i
apoi una cantitativ, pentru a msura att forma ct i intensitatea legturii.
10.5. Metoda regresiei 243
Dup intensitatea conexiunii cauzale distingem: independena total sau lipsa
de legturi, legturi funcionale sau totale i legturi relative sau statistice.
Dac pentru variabilele statistice X i Y s-au nregistrat datele ntr-un tabel cu
dubl intrare, atunci caracteristica X este independent de Y dac distribuiile
condiionate ale variabilei X de modalitile variabilei Y sunt identice ntre ele i de
asemenea sunt identice cu distribuia marginal dup variabila X.
Conexiunea statistic este tipul de legtur cel mai des ntlnit n studiul
fenomenelor din domeniul economic i social.
Particularitatea principal a acestui tip de legtur este c la o valoare dat a
variabilei factoriale X i corespunde o distribuie de valori ale caracteristicii rezultative
Y. O dependen statistic se prezint sub forma:

(10.4.2) f
j
= f(x
i
) +
j
,
unde
j
reprezint componenta aleatoare, care se datoreaz altor factori dect a
variabilei X.
Pe baza graficului norului de putere se determin curba de regresie. Forma
legturii dintre cele dou variabile se determin intuitiv prin modul de dispunere a
punctelor n planul de reprezentare grafic.
Ca tipuri de legturi distingem legturi liniare i neliniare. Cele neliniare pot fi
la rndul lor de diferite forme: parabolice, exponeniale etc. n fig.10.7. a) i b)
reprezint o legtur liniar direct (pozitiv), respectiv invers (negativ), c) una
parabolic, iar d) una exponenial.
S revenim asupra relaiei (10.2.31) numit egalitatea varianelor
(10.4.3) ) x ( V ) x ( V ) X ( V + =
pentru variabila X, ntr-un tabel cu dubl intrare.
Primul termen, variana marginal a caracteristicii X,
(10.4.4)

=
k
1 i
i
2
i
. n x x
.. n
1
) X ( V
este rezultatul tuturor factorilor, att a factorului de grupare ct i a factorilor aleatori.
Ea msoar dispersia global a caracteristicii X.
Variana mediilor distribuiilor condiionate:
(10.4.5) ( )

=
=
p
1 j
j .
2
j
n x x
.. n
1
) x ( V
reprezint dispersia mediilor condiionate ale variabilei X, ea este variana care rezult
din gruparea aplicat i se numete varian explicat prin grupare.
Metode de analiz statistic a legturilor dintre fenomene - 10 244

Fig.10.7.
Media varianelor condiionate
(10.4.6) ( )

=
=
p
1 j
j . j
n X V
.. n
1
) x ( V
reprezint dispersia punctelor din norul de puncte n jurul curbei de regresie F
X/Y
. Ea
se numete varian rezidual.
Raportul de corelaie (R
2
) reprezint un indicator normalizat al aprecierii
intensitii legturii dintre cele dou variabile ale tabelului de contingen. El se
calculeaz dup relaia:
(10.4.7)
) x ( V
) x ( V
1
) x ( V
) x ( V
R
2
Y / X
= = ,
pentru explicarea lui X n funcie de Y i dup relaia:
(10.4.8)
) y ( V
) y ( V
1
) y ( V
) y ( V
R
2
X / Y
= = ,
pentru explicarea lui Y n funcie de X.

You might also like