You are on page 1of 18

5.

ELEMENTE DE TEORIA EŞANTIONĂRII


(SELECŢIEI)

Statistica studiază caracteristicile populaţiilor de V.A..


dar de regulă, o populaţie oarecare are un număr de realizări
posibile foarte mare sau chiar infinit, iar manipularea lor este
imposibilă sau nepractică.

Aceasta obligă la limitarea studiului asupra unor eşantioane


(sau selecţii) de talie redusă din populaţia respectivă.

Dacă – de ex.- V.A. sunt variabile de natură hidrologică sau


meteoclimatică, este evident că populaţiile infinite corespunzătoare
lor nu există la dispoziţia analistului,
ci el dispune doar de eşantioane de date observate, culese de la
începerea măsurătorilor asupra acestor V.A.

Analizele bazate pe eşantioane conduc la concluzii corecte în


legătură cu populaţia din care provin doar dacă aceasta este
omogenă (realizări neafectate de schimbarea condiţiilor de
observare sau de factori suplimentari de influenţă apăruţi la un
moment dat) şi
staţionară (insensibilă la modificarea originii timpului).

În plus, metoda de eşantionare trebuie să asigure caracterul


aleator (echiprobabilitate de selecţie a oricărui element din
populaţie) şi
independent (alegerea unui element să nu influenţeze
probabilitatea de selecţie a elementelor următoare).

9
5.1. Noţiunea de distribuţie de eşantionare

Fie o V.A. având o populaţie originară de realizări posibile şi


pentru care nu se cunosc dinainte
- nici caracteristicile descriptive (media  , varianţa  2 , etc.) şi
- nici legea de distribuţie pe care o urmează.

Din populaţia respectivă se poate extrage (printr-o metodă având


caracteristicile de mai sus) un număr oarecare k de eşantioane de
aceeaşi talie, n.
Pentru oricare dintre eşantioane se poate calcula o caracteristică
descriptivă (sau o „statistică”) de interes (de exemplu media
xi , i  1,2,...k ) cu formula cunoscută.

Evident că, funcţie de componenţa fiecărui eşantion extras,


valorile statisticilor de eşantion vor diferi, de regulă, unele de altele
(adică x i  x j , i, j  k ) şi deci
valoarea statisticii respective pentru fiecare eşantion (aici
media) poate fi privită ca realizare a unei V.A. (notată – în cazul
mediei prin X ).

Ca orice V.A., aceasta va urma o lege de distribuţie care, în


exemplul dat, se va numi distribuţie de eşantionare a mediei X .

Studiul distribuţiilor de eşantionare se poate realiza


- analitic (prin metodele statisticii matematice) sau
- experimental (prin simulări Monte Carlo).

Pentru o populaţie finită a unei V.A., dacă


- se definesc toate eşantioanele posibile de o anumită talie n,
- se calculează statistica de interes pentru fiecare eşantion şi
- se construieşte apoi distribuţia frecvenţei relative a valorilor
acestor statistici,
se obţine distribuţia de eşantionare teoretică.

10
În majoritatea situaţiilor însă, se apelează doar la un subset din
totalitatea eşantioanelor posibile,
iar distribuţia frecvenţei relative a valorilor statisticii găsită pe
baza acestui subset se va numi distribuţie de eşantionare
experimentală.

Fie o V.A. discretă cu populaţia definită pe spaţiul de


Exemplul 5.1.1

eşantionare S   0,2,4,6,8 . Să se formeze, cu reinserţie, cele 25 de


eşantioane posibile a câte 2 componente şi
a) Să se construiască distribuţia de eşantionare a mediei X ;
b) Să se reprezinte graficul histogramei de probabilitate pentru
distribuţia lui X ;
c) Să se compare media populaţiei,  , cu media distribuţiei lui
X , X .
Soluţie
a) Cele 25 eşantioane de câte 2 componente posibil de format
din S (cu reinserţie după extragerea oricărei componente) sunt trecute
în tabelul 5.1.1, împreună cu media fiecărui eşantion.
Tabel 5.1.1
Setul eşantioanelor posibile şi mediile lor
Eşant. X Eşant. X Eşant. X Eşant. X Eşant. X
0,0 0 0,2 1 0,4 2 0,6 3 0,8 4
2,0 1 2,2 2 2,4 3 2,6 4 2,8 5
4,0 2 4,2 3 4,4 4 4,6 5 4,8 6
6,0 3 6,2 4 6,4 5 6,6 6 6,8 7
8,0 4 8,2 5 8,4 6 8,6 7 8,8 8
Se constată că spaţiul de eşantionare pentru V.A. X conţine, în
acest caz, valorile  0,1,2,3,4,5,6,7,8 care apar de 1,2,3,4,5,4,3,2 şi
respectiv 1 ori dintr-un total de 25 date.
Rezultă tabloul distribuţiei de frecvenţă relativă pentru X sub
forma:
Tabel 5.1.2
Distribuţia de frecvenţă pentru X
x 0 1 2 3 4 5 6 7 8
 
f x 1 2 3 4 5 4 3 2 1
25 25 25 25 25 25 25 25 25
b) Graficul histogramei de probabilitate pentru distribuţia lui
X transpune datele din tabelul 5.1.2 sub forma de mai jos.

11
0.25  
f x

0.2

0.15

0.1

0.05

0
x
0 1 2 3 4 5 6 7 8

c) Cele 5 observaţii ale populaţiei originare sunt valori ale V.A.


1
X, având distribuţia de probabilitate f  x   , pentru x  0,2,4,6,8
5
Media V.A. X se obţine cu relaţia (3.29), adică
1 1 1 1 1
  E x  0   2   4   6   8   4
5 5 5 5 5

Cu aceeaşi relaţie, dar pentru V.A. X şi datele din tabelul 5.1.2


rezultă:
1 2 3 4 5 4 3 2 1
X  0  1  2   3   4.  5   6   7   8   4
25 25 25 25 25 25 25 25 25
Se constată că    X , adică media populaţiei originare este
egală cu media distribuţiei de eşantionare a mediilor de eşantion.
În plus, alura histogramei de frecvenţă este simetrică şi pare
apropiată de forma în clopot.

Notând generic prin t o statistică (sau caracteristică descriptivă)


oarecare (ca media, varianţa, etc.) a unui eşantion ,
- cel mai adesea nu interesează informaţii despre ea în sine, ci
- se urmăreşte estimarea, pe baza ei, a parametrului care îi
corespunde (notat generic prin θ ) pentru populaţia originară şi care
este în fapt necunoscut apriori.

12
Sub acest aspect, cunoaşterea distribuţiei de eşantionare a V.A
T este foarte importantă, permiţând să se răspundă la chestiuni
practice din capitolele următoare, ca de exemplu:
- cum se poate estima cea mai potrivită valoare pentru
parametrul θ̂ al populaţiei, pe baza valorii lui t de eşantion;
- ce încredere se poate acorda valorii θ̂ obţinută ca mai sus, pe
baza intervalului de confidenţă (sau încredere);

- cum se verifică, prin teste statistice, adecvarea valorilor


estimate pentru θ̂ şi intervalul lui de încredere, în raport cu o lege
de distribuţie admisă pentru V.A de interes.

5.2. Exemple de distribuţii de eşantionare pentru


diverse statistici

5.2.1. Distribuţia de eşantionare a mediei

Se poate demonstra analitic în ce mod depinde distribuţia de


eşantionare teoretică de dimensiunile populaţiei şi a eşantionului,
precum şi de procedura de eşantionare.

S-a văzut în Ex. 5.1.1 că dacă se admit extrageri cu reinserţie şi


se formează toate eşantioanele posibile de talie n, dintr-o populaţie
finită de N componente, având media  X şi abaterea standard  X ,
atunci media distribuţiei de eşantionare a mediei X a rezultat
egală cu media populaţiei originare:
X  X (5.1)
Cu datele aceluiaşi exemplu, este uşor de verificat că varianţa
populaţiei de 5 valori rezultă:
 
5
1
 2X  E  x   X  2    xi  4  2   8 ,
i 1
5

iar varianţa distribuţiei de eşantionare a mediei va fi


25
8 2
X 
 

 
2
2

2  E x   X    f xi xi  4  4   X
2
n ,
i 1

13
unde n  2 reprezintă talia eşantioanelor formate din populaţia
originară.

Într-adevăr, relaţia dintre abaterea standard a populaţiei şi cea


a distribuţiei de eşantionare a mediei X se poate demonstra că este:

X  X (5.2)
n

Variabila
x X
z
X (5.3)
n
corespunde unei V.A. normale standard Z şi deci
distribuţia de eşantionare a mediei X urmează o lege
normală N  X ,  X n  .

Afirmaţia este valabilă pentru orice populaţie finită (indiferent


de legea ei de probabilitate), dacă n  30 .

Când n  30 , afirmaţia rămâne corectă doar dacă populaţia din


care se realizează eşantionarea nu este prea diferită de o populaţie
normală.

În particular, dacă populaţia originară este unimodală şi


simetrică, pentru n  10 se respectă cele de mai sus,
iar pentru populaţie normală – talia eşantionului, n, nu are
importanţă.

Dacă la eşantionare nu se reintroduc (fără reinserţie)


elementele deja extrase în populaţie, dar n  30 şi N  2 n ,
atunci distribuţia de eşantionare a mediei X va fi aproximativ
normală, cu media  X   X şi abaterea standard dată de relaţia:
X N n
X 
n N 1
(5.4)
N n
în care N 1
se numeşte factor de corecţie pentru populaţie finită.

14
Pentru N mari în comparaţie cu dimensiunea eşantionului n,
acest factor tinde către 1, iar relaţia (5.4) devine identică cu (5.2).

Rezultatele anterioare derivă din teorema limită centrală cu


următorul enunţ literar:
orice sumă de n V.A. independente X i având aceeaşi
distribuţie comună, este ea însăşi o V.A. normală, dacă n
tinde spre infinit şi X i sunt de acelaşi ordin de mărime.

Dacă varianţa populaţiei  2 nu este cunoscută, dar talia


eşantioanelor n  30 ,
o bună estimare a lui  2 se obţine prin varianţele de eşantion
s2 ,

iar variabila
 X   X  s / n 
va avea o distribuţie încă apropiată de legea normală standard.

Pentru n  30 , raportul
 X   X  s / n 
nu mai dă valori ale unei distribuţii standard normale,
ci valorile unei statistici T a cărei distribuţie se numeşte
distribuţie t sau distribuţie Student-t. Valorile lui T sunt date de:
x X
t
s/ n
(5.5)
cu s varianţa de eşantion.

S-a văzut că distribuţia t are de asemenea formă de clopot în


jurul mediei zero - ca şi distribuţia lui Z.
În schimb, varianţa lui T este mai mare decât 1 (atât X , cât şi
s 2 variază de la eşantion la eşantion şi depind de talia n).

15
Fiecare distribuţie t are asociat un număr de grade de libertate
notat cu ν şi ν  n  1 , existând câte o distribuţie t diferită pentru
fiecare n diferit.

Pe măsură ce n creşte, curbele distribuţiei t devin tot mai


apropiate de graficul distribuţiei normale standard.

5.2.2. Distribuţia de eşantionare a varianţei


Dacă se notează prin
1 n
S2  
 Xi  X
n i 1
2

V.A. ce defineşte varianţa în raport cu media de eşantion, atunci se
demonstrează teoretic faptul că
media varianţei S 2 este:
n 1 2
S2 
n
X (5.6)
unde  2X este varianţa populaţiei.

La fel, pentru varianţa lui S2 rezultă:


4
    2 4  4  3 4
2 2  4 2 4  (5.7)
S n n2 n3
unde  4 şi  4 sunt momentul centrat de ordin 4 şi respectiv pătratul
varianţei populaţiei lui X.

Dacă talia n este destul de mare, ultimii doi termeni devin


neglijabili şi se poate scrie aproximativ:
  4
2 2  4
S n
(5.8)

Dacă populaţia originară este normală (caz în care  4  3 4 ),


din (5.7) rămâne:
2 n  1 4
2 2  X (5.9)
S n2
2
sau  2 2   4X pentru n suficient de mare.
S n

16
Legea distribuţiei de eşantionare a varianţei tinde spre o
lege normală, oricare ar fi forma distribuţiei pentru populaţia
originară. (totuşi, convergenţa este foarte lentă şi apare pentru n
superior lui 100).

Dacă însă populaţia originară este normală, atunci variabila


n S 2  2X
urmează o distribuţie 2 cu n 1 grade de libertate.

5.2.3. Distribuţia de eşantionare a momentelor


centrate

Dacă se notează prin


-  k momentul centrat de ordin k al populaţiei originare şi
prin
- M k momentul centrat de eşantion,
media şi varianţa de eşantion a variabilei Mk sunt date de
relaţiile:
1
 M k   k  0 
n
(5.10)
 2M 
1
   1 
 2k  2k k 1 k 1   2k  k 2  2  2k 1  0 
k n  n3 
cu ultimii termeni - erori de aproximare, neglijabili pentru n  30 .

Deoarece 1  0 prin definiţie şi  22   4 ,


dacă se admite k  2 în (5.10) rezultă pentru varianţa lui S2 :
4
 
2 2  4
S n
adică relaţia (5.8) de mai sus.

17
Legile de distribuţie a variabilelor Mk tind asimptotic către
distribuţia normală.

Se pot prezenta elemente asemănătoare şi pentru alte


statistici (coeficient de variaţie, coeficient de asimetrie, coeficient
de corelaţie, covarianţă, etc.) de eşantionare.

De exemplu, pentru coeficientul de variaţie de eşantion,


media şi varianţa lui sunt date de:

 Cv  Cv 

şi 2
C 
 
 2  4   4  4 2 3  4 3
(5.11)
 v 4n 4  2

unde  ,  2 ,  3 şi  4 sunt media, varianţa şi momentele centrate de


ordin 3 şi 4 ale populaţiei originare.

În cazul distribuţiei normale trunchiată la X  0 şi pentru Cv

redus,
varianţa lui Cv de eşantionare este dată aproximativ de:
2
C 
v
C v2
2n
1  2C v2  (5.12)
cu Cv - coeficientul de variaţie al populaţiei.

5.2.4. Alte distribuţii de eşantionare

Fie – de exemplu statistica


X1  X 2 ,
unde X 1 şi X 2 sunt mediile a două eşantioane selectate independent
din două populaţii distincte

Extrăgând eşantioane independente de talii n1 şi n2 din două


populaţii mari sau infinite, discrete sau continue,
având mediile 1 şi  2 şi varianţele 12 şi respectiv  22 ,

18
atunci distribuţia de eşantionare a diferenţei mediilor, X 1  X 2 , va fi
aproximativ normal distribuită, cu media şi abaterea standard
date de relaţiile:
 X 1  X 2  1   2 ;  12  22
X 1 X 2

n1

n2
(5.13)

Mărimea
z
 x1  x 2    1   2 
12  22 (5.14)

n1 n2
va furniza valori ale variabilei Z, cu distribuţie normală standard.

Dacă n1 şi n2 sunt ambele  30, aproximaţia distribuţiei lui


X 1  X 2 printr-una normală este foarte bună, indiferent de legile
celor două populaţii originare
şi rămâne rezonabil de bună chiar şi pentru valori n1 , n2 < 30
- dacă populaţiile originare nu sunt foarte îndepărtate de unele cu
legi normale de distribuţie.

Aspectele despre distribuţia V.A.  X 1  X 2  se pot generaliza


asupra unor variabile care nu sunt neapărat medii.

Spre exemplu,

- dacă V.A. X şi Y sunt independente şi normal distribuite,


- cu mediile  X şi Y şi varianţele  2X şi Y2 ,

atunci distribuţia diferenţei  X  Y  este de asemenea normală,


de medie  X Y   X  Y şi varianţă  2X Y   2X  Y2 .

Se observă că varianţa diferenţei a două V.A. independente este


egală cu suma varianţelor celor două variabile aleatoare.

Există şi alte proceduri de eşantionare decât cea având


caracteristicile de aleatoare şi independentă.

19
De exemplu,
- în Eşantionarea sistematică se alege pentru eşantion fiecare al
k-lea element dintr-o populaţie, începând de la un punct de start
definit aleator din primele k elemente.

- în Eşantionarea aleatoare stratificată se aleg eşantioane


aleatoare independente din subpopulaţii mutual exclusive (sau
straturi) ale populaţiei originare.
Dacă se împarte o populaţie de talie N în k straturi de
dimensiuni N1 , N 2 ,..., N k şi se aleg eşantioane de talii n1 , n2 ,..., nk din
cele k straturi,
această procedură foloseşte o alocare proporţională în sensul că:
N 
ni   i   n pentru i  1,2,..., k (5.15)
N 
unde n este dimensiunea totală a eşantionului aleator stratificat.

Eşantionarea „cluster” selectează un eşantion conţinând toate


sau o selecţie aleatoare, dintre elementele unor „clusters” (grupări,
mănunchiuri) care – şi ele - sunt alese aleator din populaţia originară.

Procedurile menţionate furnizează informaţii la fel de


valoroase asupra populaţiei originare, uneori chiar la costuri mai
scăzute sau când natura experimentului nu permite eşantionarea
aleatoare independentă.

Atunci când condiţiile din viaţa reală nu permit observarea a


foarte multor realizări posibile din populaţia unei V.A. de interes,
pentru a studia distribuţiile de eşantionare a diferitelor statistici,
devine profitabil să se genereze sintetic date aparţinând acelei
populaţii.
Programul GenerVA permite astfel de generări pentru o serie de
legi de probabilitate utilizate frecvent..

20
Din evidenţele Ministerului Sănătăţii, greutăţile
Exemplul 5.2.1

copiilor la naştere urmează o distribuţie aproximativ normală de


medie 3 kg şi abatere standard 0,4 kg. Să se găsească:
a) Probabilitatea ca un eşantion aleator format din 25 nou
născuţi să aibă greutatea medie mai mare de 3,15 kg, dacă se
rotunjeşte cântărirea la a doua cifră după virgulă (zeci de grame);
b) Probabilitatea ca media de greutate a eşantionului să fie
sub
2,9 kg;
c) Media şi varianţa distribuţiei de eşantionare a varianţei
greutăţii nou născuţilor din eşantion;
d) Valorile cuartilelor S 0,25 şi S 0,75 , între care se plasează
2 2

50% dintre valorile distribuţiei de eşantionare a varianţei:

Soluţie
a) Selecţia se face dintr-o populaţie foarte mare şi aproximativ
normal distribuită.
În consecinţă şi media de eşantion X va fi distribuită
aproximativ normal, cu media  X  3 kg şi abaterea standard
X 0,4
X    0,08 kg .
n 25
Rotunjind greutatea la zeci de grame, interesează valoarea
variabilei normale standard Z care corespunde la x  3,155 kg , adică
X X 3,155  3
z   1,94
X 0,08

Probabilitatea care interesează va fi atunci:


P  X  3,155  P Z  1,94  1  P  Z  1,94  1  0,9738  0,0262 ,

adică circa 2,62%

b) Interesează valoarea mediei x  2,895 kg , pentru care Z ia


valoarea
2,895  3
z  1,31
0,08
şi P  X  2,895  P  Z  1,31  0,0951 ,

adică circa 9,51%

c) Conform (5.6), media varianţei distribuţiei de eşantionare a

21
varianţei rezultă:
n 1 2 25  1
S 2  X   0,4 2  0,1536
n 25
iar varianţa distribuţiei se obţine cu (5.9):
2 n  1 4
2 2   X  0,002 şi atunci  S 2  0,047
S n2

Conform afirmaţiei că dacă populaţia originară este


d)
normală,
nS 2
atunci variabila Y 
 2X
are o distribuţie 2 cu n-1 grade de
libertate,
rezultă că trebuie găsite cuartilele y1 şi y 2 pentru care F  y1   0,25 şi
respectiv F  y 2   0,75 ale distribuţiei  2 cu   25  1  24 grade de
libertate.

Cu programul Test_S_F_H şi opţiunea H la rulare, pentru


  24 şi nivel de semnificaţie 0,25, se găsesc valorile y1  19,037 şi
respectiv y 2  28,241 pentru variabila    24 , la care F  y1   0,25 şi
2

respectiv F  y 2   0,75 .
Rezultă valorile varianţelor de eşantion a varianţei
2 0,4 2
S12  y1 X  19,037   0,1218 şi respectiv S 22  0,1808 .
n 25
În consecinţă P 0,1218  S 2  0,1808  0,5
Reamintind că  S 2  0,1536 , şi  S 2  0,0447 ,
rezultă că intervalul  S 2   S 2    S 2   S 2  , adică intervalul (0,1089;
0,1983) va conţine evident mai mult de 50% dintre valorile V.A. S 2 .

Se speră că un echipament computerizat de ambalare


Exemplul 5.2.2

a cafelei în pungi vidate va realiza pungi cu o greutate medie de 500


g. La un control aleator pe 16 astfel de pungi s-a găsit o greutate
medie de 491,9 g, cu o abatere standard pe lot de 12 g.
a) Este de aşteptat ca echipamentul să producă pungi cu
greutatea medie dorită de 500 g, dacă se acceptă că distribuţia
greutăţii pungilor realizate este normală ?
b) Cât ar trebui să fie greutatea medie a unui lot aleator de 16

22
pungi, cu abaterea standard pe lot de 12 g, pentru a putea
presupune că 90% dintre pungile produse vor avea greutatea medie
dorită de 500 g ?

Soluţie
a) Este vorba despre o populaţie normală cu varianţă
necunoscută şi valoare dorită a mediei de 500 g.
Lotul aleator de n = 16 pungi controlate are greutatea medie de
eşantion x  491,9 g şi abaterea standard s = 12 g.
Conform relaţiei (5.5), statistica T având valoarea
x X 491,9  500
t   2,7
s n 12 16
are o lege de distribuţie Student-t cu   16  1  15 grade de libertate.
Probabilitatea ca T să ia valori mai mici decât -2,7 se găseşte cu
programul LegiVAC şi este P T  2,7   0,0082

Cu alte cuvinte, pe baza informaţiilor găsite cu eşantionul de


16 pungi, dacă media populaţiei ar fi cea dorită (500 g), variabila T
ar lua valoarea -2,7 în mai puţin de 1% dintre situaţii.
Dimpotrivă, dacă media populaţiei ar fi mai mică decât 500,
valoarea t găsită ar fi mai mare şi P T  t  ar creşte.
În concluzie nu este de aşteptat ca echipamentul să producă
pungi cu greutatea medie de 500 g, ci cu o greutate medie mai mică.
b) Pentru a putea presupune că 90% dintre pungi vor avea
greutatea medie de 500 g ar fi trebuit ca media de eşantion x q să fie
astfel încât variabila T să aibă:
  
P T  t q  F t q  0,9

Cu programul Test_S_F_H şi opţiunea S la rulare, pentru


nivelul de semnificaţie 0,1 se găseşte cuantila distribuţiei Student cu
  15 grade de libertate pentru care F t q   0,9 ca fiind t q  1,341 .
s 12
Rezultă x q   X  tq
n
 500  1,341
16
 504,02 g

În concluzie, dacă greutatea medie a pungilor din eşantion ar


fi fost x  504,02 g şi abaterea standard pe lot de s = 12 g, s-ar fi putut
sconta ca 90% dintre pungile produse de echipament să aibă
greutatea medie de 500 g.

23
Suma notelor obţinute de studentele unei universităţi
Exemplul 5.2.3

la examenele din primii 4 ani are o medie de 336 şi o varianţă de 36


puncte. Studenţii aceleiaşi universităţi şi la aceleaşi examene au
înregistrat o medie a sumei notelor de 300 puncte cu o varianţă de 50
puncte. Distribuţiile sumei notelor pentru ambele categorii sunt
aproximativ normale.
Să se găsească probabilitatea ca suma medie a unui eşantion
aleator de 18 studente să depăşească cu peste 41 puncte suma medie
a unui eşantion aleator de 25 studenţi.

Soluţie
Notând cu X 1 şi X 2 V.A. reprezentând media de eşantionare
pentru studente şi respectiv studenţi, conform relaţiilor (5.13):
- media diferenţelor mediilor de eşantionare este
 X  X  1   2  336  300  36
1 2

 2  2 36 50
- varianţa acestei diferenţe este 2  1  2   4
X1X 2 n1 n2 18 25

z
 x1  x 2    1   2 
Valoarea 12  22

n1 n2
corespunde unei V.A. Z cu distribuţie normală standard.
Dacă media eşantionului de studente depăşeşte pe cea a
eşantionului de studenţi cu 41 puncte, adică x1  x 2  41 ,
valoarea variabilei Z corespunzătoare va fi:
41  36
z
2
 2,5 şi atunci
 
P X 1  X 2  41  P Z  2,5  1  P Z  2,5  1  0,9938  0,0062
adică o probabilitate de sub 1%.

Conform evidenţei oficiale, dintre cei 50000


Exemplul 5.2.4

locuitori cu drept de vot ai unui oraş, 6000 nu au urmat şcoala sau


au făcut doar şcoala primară, 18000 au absolvit gimnaziul, 17000
au terminat liceul şi respectiv 9000 au studii superioare. Dacă se
doreşte realizarea unui eşantion de 1000 persoane în vederea sondării

24
opţiunilor la un referendum, dar ţinând seama de nivelul studiilor,
câte persoane din fiecare categorie trebuie alese prin eşantionare
aleatoare stratificată pentru ca lotul rezultat să fie reprezentativ ?

Soluţie
Conform (5.15), în care n = 1000 talia eşantionului, N = 50 000
– numărul persoanelor cu drept de vot şi N i = numărul total de
persoane din fiecare categorie:
- dintre cei N1  6000 locuitori cu cel mult şcoala primară se vor
alege aleator
 6000 
n1     1000  120 persoane
 50000 
- dintre cei N 2  18000 absolvenţi de gimnaziu se vor alege aleator
persoane
n2  360
- dintre cei N 3  17000 absolvenţi de liceu se vor alege n3  340
persoane
- dintre cei N 4  9000 locuitori cu studii superioare se vor alege
aleator n4  180 persoane

Problema 5.2.1
?
Din populaţia S  1,2,2,3,3,4 se efectuează eşantioane aleatoare de
câte 2 componente, fără reinserţie.
a) Presupunând că toate cele 30 de eşantioane posibile sunt
echiprobabile, să se construiască distribuţia de eşantionare a mediei X
b) Să se reprezinte histograma de probabilitate a distribuţiei lui
X
 N n
c) Să se verifice că X   şi X 
n N 1

Problema 5.2.2
?
O populaţie mare sau infinită are abaterea standard de 72. Ce
talie de eşantioane este necesară astfel ca eroarea standard a mediei să
fie
a) 24; b) 9; c) 6 ?

25
Problema 5.2.3
?
Timpul consumat de 1000 persoane pentru a completa un
formular simplu este aproximativ normal distribuit, cu media 29,3
secunde şi abaterea standard de 8,6 secunde. Dacă se alcătuiesc 400 de
eşantioane aleatoare de câte 25 persoane, din această populaţie, să se
găsească:
a) Media şi abaterea standard a mediei X ;
b) Numărul de medii de eşantion care cad între 25,1 şi 30,6
secunde;
c) Numărul de medii de eşantion mai mari de 31,7 secunde.
Se admite că timpii se rotunjesc la zecimi de secundă.

26

You might also like