Professional Documents
Culture Documents
9
5.1. Noţiunea de distribuţie de eşantionare
10
În majoritatea situaţiilor însă, se apelează doar la un subset din
totalitatea eşantioanelor posibile,
iar distribuţia frecvenţei relative a valorilor statisticii găsită pe
baza acestui subset se va numi distribuţie de eşantionare
experimentală.
11
0.25
f x
0.2
0.15
0.1
0.05
0
x
0 1 2 3 4 5 6 7 8
12
Sub acest aspect, cunoaşterea distribuţiei de eşantionare a V.A
T este foarte importantă, permiţând să se răspundă la chestiuni
practice din capitolele următoare, ca de exemplu:
- cum se poate estima cea mai potrivită valoare pentru
parametrul θ̂ al populaţiei, pe baza valorii lui t de eşantion;
- ce încredere se poate acorda valorii θ̂ obţinută ca mai sus, pe
baza intervalului de confidenţă (sau încredere);
13
unde n 2 reprezintă talia eşantioanelor formate din populaţia
originară.
Variabila
x X
z
X (5.3)
n
corespunde unei V.A. normale standard Z şi deci
distribuţia de eşantionare a mediei X urmează o lege
normală N X , X n .
14
Pentru N mari în comparaţie cu dimensiunea eşantionului n,
acest factor tinde către 1, iar relaţia (5.4) devine identică cu (5.2).
iar variabila
X X s / n
va avea o distribuţie încă apropiată de legea normală standard.
Pentru n 30 , raportul
X X s / n
nu mai dă valori ale unei distribuţii standard normale,
ci valorile unei statistici T a cărei distribuţie se numeşte
distribuţie t sau distribuţie Student-t. Valorile lui T sunt date de:
x X
t
s/ n
(5.5)
cu s varianţa de eşantion.
15
Fiecare distribuţie t are asociat un număr de grade de libertate
notat cu ν şi ν n 1 , existând câte o distribuţie t diferită pentru
fiecare n diferit.
16
Legea distribuţiei de eşantionare a varianţei tinde spre o
lege normală, oricare ar fi forma distribuţiei pentru populaţia
originară. (totuşi, convergenţa este foarte lentă şi apare pentru n
superior lui 100).
17
Legile de distribuţie a variabilelor Mk tind asimptotic către
distribuţia normală.
Cv Cv
şi 2
C
2 4 4 4 2 3 4 3
(5.11)
v 4n 4 2
redus,
varianţa lui Cv de eşantionare este dată aproximativ de:
2
C
v
C v2
2n
1 2C v2 (5.12)
cu Cv - coeficientul de variaţie al populaţiei.
18
atunci distribuţia de eşantionare a diferenţei mediilor, X 1 X 2 , va fi
aproximativ normal distribuită, cu media şi abaterea standard
date de relaţiile:
X 1 X 2 1 2 ; 12 22
X 1 X 2
n1
n2
(5.13)
Mărimea
z
x1 x 2 1 2
12 22 (5.14)
n1 n2
va furniza valori ale variabilei Z, cu distribuţie normală standard.
Spre exemplu,
19
De exemplu,
- în Eşantionarea sistematică se alege pentru eşantion fiecare al
k-lea element dintr-o populaţie, începând de la un punct de start
definit aleator din primele k elemente.
20
Din evidenţele Ministerului Sănătăţii, greutăţile
Exemplul 5.2.1
Soluţie
a) Selecţia se face dintr-o populaţie foarte mare şi aproximativ
normal distribuită.
În consecinţă şi media de eşantion X va fi distribuită
aproximativ normal, cu media X 3 kg şi abaterea standard
X 0,4
X 0,08 kg .
n 25
Rotunjind greutatea la zeci de grame, interesează valoarea
variabilei normale standard Z care corespunde la x 3,155 kg , adică
X X 3,155 3
z 1,94
X 0,08
21
varianţei rezultă:
n 1 2 25 1
S 2 X 0,4 2 0,1536
n 25
iar varianţa distribuţiei se obţine cu (5.9):
2 n 1 4
2 2 X 0,002 şi atunci S 2 0,047
S n2
respectiv F y 2 0,75 .
Rezultă valorile varianţelor de eşantion a varianţei
2 0,4 2
S12 y1 X 19,037 0,1218 şi respectiv S 22 0,1808 .
n 25
În consecinţă P 0,1218 S 2 0,1808 0,5
Reamintind că S 2 0,1536 , şi S 2 0,0447 ,
rezultă că intervalul S 2 S 2 S 2 S 2 , adică intervalul (0,1089;
0,1983) va conţine evident mai mult de 50% dintre valorile V.A. S 2 .
22
pungi, cu abaterea standard pe lot de 12 g, pentru a putea
presupune că 90% dintre pungile produse vor avea greutatea medie
dorită de 500 g ?
Soluţie
a) Este vorba despre o populaţie normală cu varianţă
necunoscută şi valoare dorită a mediei de 500 g.
Lotul aleator de n = 16 pungi controlate are greutatea medie de
eşantion x 491,9 g şi abaterea standard s = 12 g.
Conform relaţiei (5.5), statistica T având valoarea
x X 491,9 500
t 2,7
s n 12 16
are o lege de distribuţie Student-t cu 16 1 15 grade de libertate.
Probabilitatea ca T să ia valori mai mici decât -2,7 se găseşte cu
programul LegiVAC şi este P T 2,7 0,0082
23
Suma notelor obţinute de studentele unei universităţi
Exemplul 5.2.3
Soluţie
Notând cu X 1 şi X 2 V.A. reprezentând media de eşantionare
pentru studente şi respectiv studenţi, conform relaţiilor (5.13):
- media diferenţelor mediilor de eşantionare este
X X 1 2 336 300 36
1 2
2 2 36 50
- varianţa acestei diferenţe este 2 1 2 4
X1X 2 n1 n2 18 25
z
x1 x 2 1 2
Valoarea 12 22
n1 n2
corespunde unei V.A. Z cu distribuţie normală standard.
Dacă media eşantionului de studente depăşeşte pe cea a
eşantionului de studenţi cu 41 puncte, adică x1 x 2 41 ,
valoarea variabilei Z corespunzătoare va fi:
41 36
z
2
2,5 şi atunci
P X 1 X 2 41 P Z 2,5 1 P Z 2,5 1 0,9938 0,0062
adică o probabilitate de sub 1%.
24
opţiunilor la un referendum, dar ţinând seama de nivelul studiilor,
câte persoane din fiecare categorie trebuie alese prin eşantionare
aleatoare stratificată pentru ca lotul rezultat să fie reprezentativ ?
Soluţie
Conform (5.15), în care n = 1000 talia eşantionului, N = 50 000
– numărul persoanelor cu drept de vot şi N i = numărul total de
persoane din fiecare categorie:
- dintre cei N1 6000 locuitori cu cel mult şcoala primară se vor
alege aleator
6000
n1 1000 120 persoane
50000
- dintre cei N 2 18000 absolvenţi de gimnaziu se vor alege aleator
persoane
n2 360
- dintre cei N 3 17000 absolvenţi de liceu se vor alege n3 340
persoane
- dintre cei N 4 9000 locuitori cu studii superioare se vor alege
aleator n4 180 persoane
Problema 5.2.1
?
Din populaţia S 1,2,2,3,3,4 se efectuează eşantioane aleatoare de
câte 2 componente, fără reinserţie.
a) Presupunând că toate cele 30 de eşantioane posibile sunt
echiprobabile, să se construiască distribuţia de eşantionare a mediei X
b) Să se reprezinte histograma de probabilitate a distribuţiei lui
X
N n
c) Să se verifice că X şi X
n N 1
Problema 5.2.2
?
O populaţie mare sau infinită are abaterea standard de 72. Ce
talie de eşantioane este necesară astfel ca eroarea standard a mediei să
fie
a) 24; b) 9; c) 6 ?
25
Problema 5.2.3
?
Timpul consumat de 1000 persoane pentru a completa un
formular simplu este aproximativ normal distribuit, cu media 29,3
secunde şi abaterea standard de 8,6 secunde. Dacă se alcătuiesc 400 de
eşantioane aleatoare de câte 25 persoane, din această populaţie, să se
găsească:
a) Media şi abaterea standard a mediei X ;
b) Numărul de medii de eşantion care cad între 25,1 şi 30,6
secunde;
c) Numărul de medii de eşantion mai mari de 31,7 secunde.
Se admite că timpii se rotunjesc la zecimi de secundă.
26