You are on page 1of 45

4.

LEGI DE PROBABILITATE FOLOSITE


FRECVENT

4.1. Distribuţii de probabilitate discrete

Unele distribuţii discrete s-au menţionat anterior / au apărut


în exemple, dar se reiau aici mai sistematic şi concentrat, împreună
cu altele frecvent folosite.

4.1.1. Distribuţia uniformă discretă


Dacă o V.A discretă admite pentru toate valorile sale
probabilităţi egale, distribuţia ei se numeşte uniformă discretă.
1
Se va nota prin u  x; n   n pentru x  x1 , x2, ..., xn , unde
xi , i  1,2,...., n sunt cele n valori ale lui S pentru X.

Caz tipic: V.A discretă = cifra ieşită la aruncarea unui zar,


1
pentru care S  1,2,3,4,5,6 , n = 6 şi – evident - u  x; n   6 pentru orice
xi , i  1,2,....,6

4.1.2. Distribuţia binomială


Se referă la o clasă de experimente stocastice la care, în
fiecare experiment, se repetă n încercări independente.
Fiecare încercare are două rezultate posibile numite succes şi
eşec şi fie probabilitatea unui succes notată cu p şi admisă
constantă de la încercare la încercare.
Un astfel de experiment se numeşte experiment binomial.

V.A X definită ca numărul de succese în n încercări ale unui


experiment binomial se numeşte V.A binomială şi distribuţia ei
discretă de probabilitate este distribuţia binomială.

Valorile acestei distribuţii se vor nota cu b x ; n, p  şi sunt date


de

9
b x ; n, p   C nx  p x  q n x
pentru x  0,1,..., n (4.1)
unde q  1 p este probabilitatea de eşec la o încercare.

Spre exemplu, pentru n = 6, p = 0,4 şi q = 0,6, distribuţia binomială va


fi
Xi 0 1 2 3 4 5 6
b xi ;6; 0,4  0,047 0,187 0,311 0,276 0,138 0,037 0,004

Media distribuţiei binomiale este   n p , iar varianţa sa


 2  npq    q

Probabilitatea valorii X  xi se calculează uşor cu formula de


recurenţă
p  n  1  xi 
b xi ; n, p   b xi 1 ; n, p   (4.2)
q x i

Funcţia de repartiţie corespunzătoare valorii X  xi se obţine


cu:
i i
 b x j ; n, p    C nx j p
xj n x j
F  X  xi   q (4.3)
j 0 j 0

4.1.3. Distribuţia multinomială

Presupune un experiment cu aceleaşi proprietăţi ca şi


experimentul binomial,
exceptând faptul că la fiecare încercare există mai mult decât
două rezultate posibile (acolo succes şi eşec).

Dacă un experiment multinomial poate avea într-o încercare


k rezultate E1 , E 2 ,..., E k ,
cu probabilităţile cunoscute p1 , p2 ,..., p k ,
atunci variabilele aleatoare X 1 , X 2 ,..., X k reprezentând numărul de
apariţii al lui E1 , E 2 ,..., E k se numesc V.A multinomiale şi distribuţia
lor de probabilitate este distribuţia multinomială.

Se va nota cu m x1 , x2 ,..., x k ; p1 , p 2 ,..., p k ; n  şi este dată de:


n!
m x1 , x 2 ,..., x k ; p1 , p 2 ,..., p k ; n  
x x x
p 1 p 2 ... p k k
x1! x 2 !...x k ! 1 2 (4.4)

10
n n
unde trebuie ca  xi n şi  pi 1
i 1 i 1

Pentru k = 2 aceasta revine la experimentul binomial.

4.1.4. Distribuţia hipergeometrică


Fie o populaţie de N obiecte dintre care k se admit „speciale”
(sau succese sau bune), iar N  k sunt privite ca „obişnuite” (sau
eşecuri sau rebuturi).

Experimentul de a alege un eşantion aleator de n obiecte fără


reinserţie (care nu se mai pun la loc printre cele N) se numeşte
hipergeometric.

Probabilitatea de a nimeri un obiect special în prima selecţie


k
este iniţial N ,
k 1 k
dar ea devine apoi N  1 sau N  1 pentru al doilea obiect
extras, dacă la prima selecţie a rezultat un succes sau respectiv un
eşec, ş.a.m.d.

Proprietăţile experimentului diferă de cazul binomial sau


multinomial (unde după fiecare încercare obiectul extras revine în
masa de obiecte).

Aici interesează V.A discretă X care reprezintă numărul de


succese dintr-o extragere aleatoare de n obiecte.
Ea se numeşte V.A hipergeometrică, iar distribuţia sa de
probabilitate – distribuţie hipergeometrică.

Se va nota cu h x; N , n, k  şi este dată de relaţia:


n x
C kx C N
h x; N , n, k   k
pentru x  0,1,2,.., n (4.5)
n
CN

Acest de tip de distribuţie s-a folosit deja Ex. 3.2.2, Ex. 3.2.3, etc.

Media şi varianţa distribuţiei h x; N , n, k  sunt

11
nk  k  N  n  k 
 şi  2  n  1   (4.6)
N  N  N  1  N

Observaţia 1. Dacă n este mic în raport cu N, atunci probabilitatea


de a nimeri un succes la prima, a doua, etc. încercare este practic
k
aceeaşi, experimentul poate fi admis de tip binomial, cu p  N ,
iar experimentul hipergeometric se aproximează prin unul cu
distribuţie binomială de medie şi varianţă:
nk  k  k   k 
  n p  ;  2  npq  n 1    1   (4.7)
N  N  N  N

Observaţia 2. Ca în cazul distribuţiei multinomiale,


dacă populaţia de N obiecte este constituită din k partiţii
A1 , A2 ,..., Ak

având câte a1 elemente în prima, a2 elemente în a doua,.......,


ak elemente în partiţia k,
iar V.A sunt numerele x1 = numărul de elemente din A1 , ..., x k
= numărul de elemente din partiţia Ak într-un eşantion de n
elemente,
k k
în condiţiile  xi  n şi  ai N ,
i 1 i 1

se defineşte o funcţie de distribuţie multihipergeometrică de


forma:
x x x
C a 1 C a 2 ...C a k
mh x1 , x 2 ,...x k ; a1 , a 2 ,...a k ; N , n   1 2 k
(4.8)
n
CN

4.1.5. Distribuţia binomială negativă şi


cea geometrică

În experimentul binomial există un număr fixat de încercări.

Fie experimentul cu aceleaşi proprietăţi, exceptând faptul că


încercările se repetă până când apare un număr precizat de succese.
El se numeşte experiment binomial negativ şi aici interesează
V.A X care reprezintă numărul de încercări necesare pentru a obţine
k succese. Această V.A se numeşte binomială negativă.

12
Deoarece cel puţin k încercări sunt necesare pentru a produce
k succese, valorile V.A X vor fi k , k  1, k  2,.....
Distribuţia de probabilitate a lui X se va nota prin b*  x; k , p  ,
este numită distribuţie binomială negativă şi are valorile date de
relaţia:
b *  x; k , p   C xk11 p k q x  k , pentru x  k  1, k  2,... (4.9)

Observaţie: Un caz special al ei apare pentru k = 1.


Distribuţia b*  x;1, p  reprezintă distribuţia de probabilitate a
numărului de încercări necesare pentru primul succes.
Această distribuţie se numeşte geometrică, se notează g  x; p 
şi are formula:
g  x; p   pq x 1 , pentru x  1,2,3,.... (4.10)

4.1.6. Distribuţia Poisson


Experimentele referitoare la valorile unei V.A X reprezentând
numărul de realizări ce apar într-un interval de timp dat sau într-o
zonă spaţială dată se numesc experimente Poisson şi au proprietăţile:

i) Numărul mediu de realizări,  care se produc într-un


interval de timp dat sau o zonă spaţială dată este cunoscut;
ii) Probabilitatea ca un singur rezultat să apară pe un interval
foarte scurt (de timp sau spaţial) este proporţională cu lungimea sau
suprafaţa zonei şi nu depinde de numărul de realizări care apar în
afara intervalului de timp sau a zonei ;
iii) Probabilitatea ca mai mult decât un rezultat să apară într-
un astfel de interval scurt sau zonă redusă, este neglijabilă.

Numărul X de realizări într-un experiment Poisson se


numeşte V.A Poisson şi distribuţia ei de probabilitate – distribuţie
Poisson. Se va nota cu p x;   şi este dată de relaţia:
x
p  x;    e   pentru x  0,1,2,3,.... (4.11)
x!

Exemple de tipuri de V.A la care se admite că este aplicabilă


distribuţia Poisson sunt:

13
- numărul de particule emis de o sursă radioactivă într-un timp
dat;
- numărul de erori de editare pe pagina de text;
- numărul de vehicule trecând printr-o poziţie dată într-un
interval dat de timp în trafic normal;
- numărul de apeluri primite la o centrală telefonică într-un
interval de timp, etc.

Probabilitatea valorii X  xi se obţine cu relaţia de recurenţă:



p  xi ;    p  xi  1;   (4.12)
xi
şi p  0;    e  .
Funcţia de repartiţie corespunzătoare valorii X  xi va fi
dată de relaţia:
i i x
    j
F  X  xi   p x j ;   e  x ! (4.13)
j 0 j 0 j

Observaţie: Dacă într-un experiment binomial numărul de încercări


n este mare şi probabilitatea de succes p este foarte apropiată de
zero, distribuţia Poisson cu   n p poate fi utilizată pentru a
aproxima probabilităţile binomiale.
La fel, dacă p este foarte apropiată de 1, aceeaşi aproximaţie
este posibilă prin schimbarea semnificaţiei succesului şi eşecului şi
modificându-l astfel pe p la o valoare foarte mică.

Un trăgător cu arcul nimereşte o ţintă fixă în 4


Exemplul 4.1.1

încercări din 6. Care este probabilitatea ca într-o serie viitoare de 6


încercări
a) Să lovească ţinta de 2 ori ?
b) Dar de 5 ori ?
c) Care este probabilitatea de a nu avea mai mult de 4
reuşite ?

Soluţie

14
Acesta poate fi privit ca un experiment binomial cu n = 6
încercări, în care un succes înseamnă atingerea ţintei.
Din seturile anterioare se ştie că probabilitatea succesului la o
4 4 2
încercare este p  6 , iar a eşecului q  1  6  6
a) Probabilitatea ca în seria de 6 curentă să aibă 2 reuşite este:
2 4
4 2
b 2;6; 4 6   C 62      0,082
6 6
b) Probabilitatea a 5 reuşite va fi:
5 1
4 2
b 5;6; 4 6   C 65      0,263
6 6
c) Probabilitatea a cel mult 4 reuşite pe set, adică P 0  X  4
este egală cu valoarea funcţiei de repartiţie (probabilitate cumulată)
corespunzătoare lui X = 4, adică
4 4 xi 6 xi
x 4 2
F  X  4   b xi ;6, 4 6   C6 i  6   6 
i 0 i 0

unde sunt: 0, 1, 2, 3 şi 4.
xi

După un calcul simplu se găseşte FX  X  4  0,65 şi deci, cu


probabilitatea de 65%, arcaşul va avea cel mult 4 reuşite.

În mod evident, este posibil să aibă 5 sau 6 reuşite din 6, cu


probabilitatea 1  F  X  4 , adică 35% !.

Într-un coş se găsesc bucăţi de pânză roşii, galbene şi


Exemplul 4.1.2

albastre. S-a constatat că la extrageri aleatoare de câte 15 bucăţi au


rezultat în medie câte 5 roşii şi 7 galbene. Care este probabilitatea ca
la o extragere următoare să se obţină pânzele necesare pentru 5
steaguri tricolore ?

Soluţie
Probabilităţile evenimentelor E1 (roşu), E 2 (galben) şi E3
(albastru) sunt:
5 1 7 15  5  7 3 1
p1   ; p2  ; p3    .
15 3 15 15 15 5
Admiţând un experiment multinomial, probabilitatea ca într-o
extragere de 15 bucăţi să avem câte 5 din fiecare culoare, adică
x1  5 , x 2  5 , x3  5 va fi dată de (4.4), adică:

15
5 5 5
 1 7 1  15!  1   7   1 
m 5,5,5; , , ;15          0,022
 3 15 5  5! 5! 5!  3   15   5 

deci circa 2,2%.

Exemplul 4.1.3

a) Considerând figuri într-un pachet de 52 cărţi: valeţii,


reginele, regii şi aşii, care este probabilitatea ca o mână de 5 cărţi să
conţină doar figuri ?
b) Folosind teorema lui Cebâşev, să se găsească şi să se
interpreteze intervalul   2   pentru cazul de mai sus

Soluţie
a) Este vorba despre o distribuţie hipergeometrică având N =
52, n = 5 şi k  4  4  16 cărţi figuri în pachet.
Conform (4.5) probabilitatea a x = 5 succese (figuri) în mâna
5 0
C16 C36
de 5 cărţi este de h X  5;52,5,16    0,0017
5
C52

c) Conform (4.6), media distribuţiei este:


n k 5  16
   1,5385
N 52
 k  N  n  k   16  52  5  16 
iar varianţa  2  n  1    5  1    0,9816
 N  N  1  N  52  52  1  52 
Rezultă abaterea standard   0,9907

Intervalul   2   este 1,5385  2  0,9907 , adică între -0,4429 şi


3,5199.
Conform teoremei, cel puţin în 75% dintre ocazii, jucătorul va
avea din 5 cărţi, un număr de figuri între -0,44 (raţional 0) şi 3,52
(rotunjit la 4).

Într-un lot de 20000 păpuşi vorbitoare, 2000 au


Exemplul 4.1.4

sistemul de sunet defect. Un magazin de jucării primeşte 20 de păpuşi

16
din lotul respectiv. Care este probabilitatea ca exact 3 dintre cele 20
să aibă acest defect ?

Soluţie
Este vorba de o distribuţie hipergeometrică, cu N = 20000 şi n =
20.
Deoarece n este mult mai mic decât N, se poate aproxima
distribuţia respectivă printr-o distribuţie binomială.

Probabilitatea de a primi o păpuşă defectă (privit aici ca un


2000
succes) este p
20000
 0,1 .

Cele 20 păpuşi ajunse la magazin pot fi considerate ca n = 20


încercări. Probabilitatea de a avea exact 3 succese (păpuşi defecte)
va fi dată de:
b x ; n, p   C nx  p x 1  p  n  x

adică b X  3 ;20, 0,1  C 20


3
 0,13  1  0,1 17  0,19

Aflaţi probabilitatea ca acelaşi zar să iasă de trei ori


Exemplul 4.1.5

din 6 aruncări.

Soluţie
În problemă, V.A este numărul de încercări după care apare al
treilea succes. Deci este vorba despre un experiment binomial
negativ, având
x = 6 (numărul de aruncări),
k = 3 (numărul de apariţii a aceluiaşi zar)
şi p  1 6 probabilitatea apariţiei zarului de interes la o
încercare.
Probabilitatea ca din 6 aruncări să apară de 3 ori acelaşi zar se
obţine cu (4.9), adică: b *  x; k , p   C xk11 p k q x  k

unde X  6 , k  3 , p  1 6 şi q  1  1 6  5 6
3 3
1 5
Rezultă b*  6;3,1 6   C52      0,027
6 6

17
Numărul mediu anual de accidente rutiere grave pe
Exemplul 4.1.6

dealul Feleacului este de 6. Să se găsească probabilitatea ca într-un


an dat să se producă acolo 8 accidente grave.

Soluţie
În acest experiment Poisson, V.A X este numărul de accidente
produse într-un an dat în zona respectivă, ştiind că media anuală
este   6 .
Conform (4.11) probabilitatea valorii x pentru distribuţia
Poisson este:
x
p  x;    e  
x!
Aici interesează probabilitatea pentru X = 8 şi 6 , rezultând
8
6
p  8;6   e  6  0,103
8!

La o populaţie de 2,5 milioane locuitori, în Bucureşti


Exemplul 4.1.7

sunt rănite anual 250 de persoane pe treceri de pietoni.


Să se găsească probabilitatea ca în anul următor să existe mai
puţin de 8 accidentaţi în aceste condiţii la 100000 de locuitori.

Soluţie
La nivelul oraşului, probabilitatea de accidentare pe trecerea
250
de pietoni a unei persoane este de. p  2500000  0,0001
Dacă accidentarea unei persoane este privită ca un „succes”,
la n  100000 de locuitori,
numărul mediu de accidentaţi anual este
  n  p  100000  0,0001  10 .

V.A X reprezentând numărul de persoane accidentate astfel, este


o V.A binomială cu distribuţia b x ;100000,0,0001 .

18
Totuşi, s-a menţionat că dacă n este foarte mare şi p apropiat de
0, distribuţia binomială poate fi aproximată satisfăcător printr-o
distribuţie Poisson cu media  .

Răspunsul la întrebare corespunde probabilităţii cumulate


(funcţiei de repartiţie) pentru valoarea lui X = 7. Deci:
7
j
P X  8  F  X  7   e   
j 0
j!

conform relaţiei (4.13). Se mai poate scrie


                
P X  8  e    1  1  1  1  1  1      
 2  3  4  5  6  7     
iar pentru   10 rezultă P X  8  0,2202 .

..Problema 4.1.1
?
Un şofer a constatat că este prins cu exces de viteză de către
60% dintre filtrele radar prin care trece. Dacă în călătoria din concediu
a trecut prin 10 filtre, care este probabilitatea să fi fost prins cu exces
de viteză
a) exact de 6 ori ?
b) între 4 şi 7 ori inclusiv ?
c) cel puţin de 8 ori ?

..Problema 4.1.2
?
Dintr-o subgrupă de 16 studenţi, 10 sunt băieţi şi restul fete.
Dacă pentru o lucrare de laborator se formează aleatoriu o echipă de 4
studenţi, care este probabilitatea ca echipa să conţină:
a) doar studente ?
b) doar băieţi ?

19
..Problema 4.1.3
?
Între 6000 de flori din aceeaşi specie, un grădinar a observat 900
cu un colorit aparte. După perioada de florescenţă a cules aleatoriu
seminţe de la 3 plante. Care este probabilitatea ca printre seminţe să
existe şi unele de la o floare de culoare deosebită ?

..Problema 4.1.4
?
Probabilitatea ca un student să scrie un program simplu de calcul
fără greşeli este de 0,4. Să se găsească probabilitatea ca el să realizeze
3 programe fără greşeli în nu mai mult de 5 ocazii.

..Problema 4.1.5
?
Pe străzile nereabilitate din Bucureşti se găsesc în medie câte 5
gropi cu diametrul mai mare de 20 cm la 1000 m 2 de şosea. Să se
determine probabilitatea ca pe 1000 m 2 oarecare să se întâlnească
a) 5 astfel de gropi
b) mai mult decât 5 astfel de gropi

..Problema 4.1.6
?
Bazat pe 85 ani de observaţii la o staţie hidrometrică,
probabilitatea apariţiei unui debit mai mare decât Q * este
P Q  Q *   0,02326 . Admiţând debitele maxime anuale ca evenimente

independente, să se găsească probabilitatea ca în următorii 10 ani


a) să apară de 4 ori debite de viitură mai mari sau egale cu Q *
b) să nu apară nici o dată un astfel de debit
Comparaţi rezultatele cu cele date de aproximarea prin
distribuţie Poisson.

20
4.2. Distribuţii de probabilitate continue
Se prezintă aspectele referitoare la un număr de distribuţii de
probabilitate continue - dintre cele cu utilizare mai frecventă în
aplicaţiile de analiză statistică a datelor experimentale.

4.2.1. Legea normală (sau legea lui Gauss, sau legea


Laplace – Gauss, sau legea erorilor)

Este cea mai importantă distribuţie de probabilitate care apare


în statistică. Foarte multe seturi de date rezultate din experimente
realiste urmează o astfel de distribuţie.

Reprezentarea grafică a legii normale se numeşte curbă


normală (sau clopotul Gauss).

Fig.4.1. Graficul distribuţiei normale

Are într-adevăr formă de clopot şi este simetrică în raport cu o


axă verticală ce trece prin media X   .
În punctele de abscise X     şi X     , apar inflexiuni,
după care ramurile coboară, tinzând asimptotic către axa
orizontală.

21
Ordonata maximă apare la X   şi deci moda coincide cu
media. Din motive de simetrie, şi mediana (care împarte suprafaţa
de sub grafic în două părţi egale), coincide cu media şi moda
Domeniul V.A. cuprinde axa absciselor, deci S    ;   ,
iar valorile funcţiei de densitate pentru X  x se obţin cu :
2
1  x  
, pentru    x  
  
f  x 
1
e 2   (4.14)
 2
cu şi e  2,71828...
  3,14159...

În (4.14) apar ca parametri atât media  , cât şi abaterea


standard  .
În mod prescurtat, distribuţia normală se notează N  ,   .

Deoarece  şi  pot lua o infinitate de valori, există o


infinitate de funcţii de densitate normală.
Media localizează axa centrală a unei astfel de curbe,
iar abaterea standard determină împrăştierea în jurul poziţiei
centrale. Cu cât  este mai mare, cu atât maximul se reduce, curba
se turteşte (aplatisează) şi se extinde mai mult după axa x.

Multe V.A.din lumea reală au distribuţii de probabilitate ce pot


fi descrise de legea normală, cu condiţia ca  şi  să fie
cunoscute.
O astfel de V.A. apare ca rezultat al mai multor factori
independenţi, ale căror efecte se cumulează pentru a influenţa
mărimea respectivă.

Funcţia de repartiţie corespunzătoare unei valori X  x* este


dată de:
2
x*  1  x  

F X x *
  1
2  

e 2  


dx (4.15)
şi desigur P  X  x *   F  X  x*  , iar F  X    1 .

Probabilitatea ca V.A cu  şi  cunoscute să ia valori între


două limite x1 şi x2 (cu x1  x2 ) este suprafaţa de sub graficul lui
f  x  , delimitată de orizontală şi verticalele prin x1 şi x 2 , adică
2
x2  1  x  
1
P x1  X  x 2  
 2 x
 e 2   dx  F  x 2   F  x1  (4.16)
1

22
Momentul de ordin 1 faţă de origine este evident M 1   , iar
momentele centrate vor fi:
 2   2 ;  3  0 ;  4  3 4 ,
rezultând că, pentru distribuţia normală,
coeficientul de asimetrie este zero, iar
coeficientul de boltire după Pearson (relaţia 2.38) este
constant şi egal cu 3, sau după Fisher (relaţia 2.39) este egal cu 0.

Dacă X 1 şi X 2 sunt două V.A normal distribuite,


de legi N  1 , 1  şi respectiv N   2 ,  2  ,
atunci V.A Y  X 1  X 2 urmează, de asemenea, o lege normală
N  ,   , unde   1   2 şi   12   22 .

Observaţie: Histograma de probabilitate a unei distribuţii


binomiale cu probabilitatea de succes p apropiată de 0,5, este
apropiată de forma în clopot.
Apare rezonabil să se folosească aria de sub o curbă normală
pentru a aproxima probabilităţi binomiale, (chiar dacă este vorba
despre folosirea unei distribuţii continue pentru a aproxima
probabilităţi asociate unei distribuţii discrete).
Distribuţia normală aproximează distribuţia binomială dacă
are media şi dispersia   n p , respectiv  2  n p q , iar n tinde către
infinit, cu p apropiat de 0,5.
În aplicaţii se acceptă această aproximare şi pentru valori n
relativ reduse, dacă n p şi n q rezultă mai mari decât 5.

Formulele (4.14) la (4.16) conţin parametrii  şi  , iar


integrala (4.16) nu are primitivă analitică şi atunci orice calcule de
probabilitate presupun evaluări numerice ale lor, efectuate cu un
program de calcul specializat.

Inconvenientul se depăşeşte dacă în locul V.A. X, cu  şi  , se


consideră V.A. transformată Z dată de transformarea:

23
X 
Z

(4.17)
care are de asemenea o distribuţie normală, de medie 0 şi abatere
standard 1.

Se numeşte distribuţie normală standard, se notează N  0,1

şi are funcţia de densitate de probabilitate


z2

f  z 
1
e 2 , (4.18)
2
(expresie fără nici un parametru !).
Alura lui f  z  este redată în Fig. 4.2.

Fig.4.2. Distribuţia normală standard N  0,1

În afara intervalului z    3,49; 3,49 cele două ramuri ale curbei


se suprapun practic cu axa absciselor.

Funcţia de repartiţie corespunzătoare unei valori Z  z* se


obţine cu:
2
z*  z

F Z  z *
 1
2  
 e 2 dz (4.19)
şi deoarece nu depinde de nici un parametru, este convenabil să fie
tabelată pentru diverse valori z * .

24
Aceste tabele sunt utilizate pentru a calcula P x1  X  x 2  unei
V.A de tip N  ,   deoarece

P x1  X  x2   P z1  Z  z 2   F  z 2   F  z1  (4.20)
x  x 
unde z1  1 , z2  2 ,
 
iar F  z1  şi F  z 2  se iau din tabelă (direct sau prin interpolare)

Din motive de simetrie F  z   F   z   1


şi atunci este suficient ca tabela cu F  z  să fie construită doar
pentru z  0 , ştiind că F  z  0  0,5 .

Pentru a evita calculul numeric sau folosirea tabelelor, se pot


obţine evaluări satisfăcătoare ale funcţiei de repartiţie cu ajutorul
unor relaţii de aproximare cum ar fi:
F  z *   1  f  z * a1t  a 2 t 2  a3t 3    z  , pentru z *  0 (4.21)
1
şi unde: t ; a1  0,4361836 ; a 2  0,1201676 ;
1  0,33267  z *
a3  0,9372980 , cu   z   10 5

sau
    
F z *  1  f z * b1t  b2 t 2  b3t 3  b4 t 4  b5t 5   z  ,
pentru z*  0 (4.22)
1
şi unde t ; b1  0,31938153 ; b2  0,356563782 ;
1  0,2316419  z *
b3  1,781477937 ; b4  1,821255978 ; b5  1,330274429 , cu  z   7,5  10 8

Dacă interesează cuantila z q pentru care funcţia de repartiţie


ia valoarea specificată F  z q   q , se pot folosi relaţiile aproximative:
a0  a1t
zq  t    q  , pentru 0  q  0,5 (4.23)
1  b1t  b2 t 2
 1 
şi unde t ln   ; a0  2,30753 ; a1  0,27061 ;
 1  q  
2

b1  0,99229 ; b2  0,04481 , cu  q   3  10 3

sau
c0  c1t  c2 t 2
zq  t    q  , pentru 0  q  0,5 (4.24)
1  d1t  d 2 t 2  d 3t 3

25
 1 
şi unde t ln   ; c0  2,515517 ; c1  0,802853 ; c 2  0,010328
 1  q  
2

d1  1,432788 ; d 2  0,189269 ; d 3  0,001308 , cu  q   4,5  10 4

S-a constatat că timpul de aşteptare pentru a fi servit


Exemplul 4.2.1

la un fast-food este o variabilă aproximativ normal distribuită de


medie   4,6 minute şi abatere standard   1,3 minute. Dacă timpul
de aşteptare poate fi măsurat cu orice precizie dorită, să se găsească
probabilitatea ca un consumator să aibă de aşteptat:
a) mai mult de 6 minute;
b) între 3 şi 5 minute;
c) mai puţin de 2 minute.

Soluţie
Considerând N  4,6;1,3 cu graficul funcţiei de densitate de
probabilitate de mai jos, răspunsurile corespund suprafeţelor
haşurate şi marcate prin literele corespunzătoare.

a) Variabila normală standard se calculează cu (4.17) adică:


X  6  4,6
Z

. Pentru x = 6 rezultă Z 
1,3
 1,0769

Probabilitatea ca X  6 va fi
P X  6  P Z  1,0769  1  P Z  1,0769 .
P  Z  1,0769 este egală cu valoarea funcţiei de repartiţie a

distribuţiei N  0,1 la argumentul z  1,0769 , şi se poate obţine din


*

26
tabelele funcţiei Laplace sau cu un program de calcul care
transpune una dintre relaţiile de aproximare (4.21) sau (4.22).
Funcţia RepNO1(z: real):real de mai jos calculează F  z  cu *

relaţia (4.22) pentru argumentul z * .


Function RepN01(z:real):real;
{ Caculeaza functia de repartitie pentru v.a. Z cu legea N(0,1),
la un z specificat cu aproximatia Hastings }
var b0,b1,b2,b3,b4,b5,t,zc,fzc:real;
begin
b0:=0.2316419; b1:=0.31938153; b2:=-0.356563782;
b3:=1.781477937; b4:=-1.821255978; b5:=1.330274429;
if abs(z) <= 0.00001 then repn01:=0.5
else
begin
if z < 0 then zc:=-z
else zc:=z;
t:=1.0/(1+b0*zc); fzc:=DensN01(zc);
repn01:=1-fzc*t*(b1+t*(b2+t*(b3+t*(b4+t*b5))));
if z < 0 then repn01:=1-repn01;
end;
end;
Este inclusă în programul Gauss dedicat calculelor pentru
distribuţii normale.
Cu acesta se obţine că F 1,0769  0,8592 , astfel încât
P X  6  1  0,8592  0,1408

b) Pentru x1  3 şi x2  5 corespund valorile variabilei normale


standard z1  1,2308 şi respectiv z 2  0,3077 .
Atunci
P 3  X  5  P  1,2308  Z  0,3077  F  0,3077  F   1,2308

Cu programul menţionat se obţine F  0,3077   0,6208 şi respectiv


F   1,2308  0,1092 , astfel încât
P  3  X  5  0,6208  0,1092  0,5116

2  4,6
c) La x2 corespunde z
1,3
 2 ,

iar P  X  2   P  Z  2   F   2  pentru care programul indică valoarea


F   2   0,0228

27
O maşină unealtă reglată corect produce piese cu
Exemplul 4.2.2

diametrul mediu de 25 mm şi având pentru această caracteristică


dimensională o distribuţie normală N  ,  .
Totuşi, la fabricarea unui lot de 100 piese s-a constatat că 9
dintre acestea au diametrul mai mic de 22 mm şi 6 piese îl au mai
mare decât 28 mm.
a) Să se găsească cu ce medie  şi abatere standard  a lucrat
maşina lotul respectiv;
b) Să se găsească probabilitatea ca o piesă oarecare dintre
acestea să aibă diametrul cuprins în intervalul 24,5 – 25,5 mm

Soluţie
Notând cu X V.A. N  ,   reprezentată de diametrul unei piese
realizate, se ştie că:
9 6
P  X  22  şi respectiv P X  28 
100 100
X 
a) Dacă se introduce variabila normală standard Z

şi se
22   28  
notează z1   şi respectiv z 2   , rezultă că
P X  22   P Z  z1   F  z1   0,09 şi respectiv
P X  28  P Z  z 2   1  P Z  z 2   1  F  z 2   0,06
unde F  z  este valoarea funcţiei de repartiţie pentru variabila N  0,1 ,
la argumentul z . Este necesar să se găsească cuantilele z1 şi z 2
pentru care F  z1  =0,09 şi F  z 2   0,94 .
Se pot folosi tabele sau un program de calcul.
Funcţia CuantNO1 (q:real):real de mai jos calculează cuantila
z corespunzătoare unei valori F  z   q specificate, folosind metoda
bisecţiei.
Function CuantN01(q:real):real;
{ Calculeaza cuantila Zq a repartitiei N(0,1) pentru care
F(Zq) = q, folosind aproximatia Hastings pentru F(z) si
metoda bisectiei intre z = -4 si 0 }
var qc,zs,fs,zd,fd,zm,fm:real;
begin
if q = 0.5 then cuantn01:=0.0
else
begin

28
if q < 0.5 then qc:=q
else qc:=1-q;
zs:=-4.0; fs:=qc-RepN01(zs);
zd:=0.0; fd:=qc-RepN01(zd);
repeat
zm:=0.5*(zs+zd); fm:=qc-RepN01(zm);
if fs*fm <= 0 then
begin
zd:=zm; fd:=fm;
end
else
begin
zs:=zm; fs:=fm;
end;
until abs(fm) <= 0.00001;
cuantn01:=zm;
if q > 0.5 then cuantn01:=-cuantn01;
end;
end;
Rulând programul Gauss pentru   1 şi   0 , se găseşte că:
la F  z1  =0,09 corespunde z1 = -1,3407,
iar la F  z 2   0,94 corespunde z 2 = 1,5548.
22   28  
Deoarece z1    1,3407 şi respectiv z 2    1,5548 ,
se obţin parametrii   24,7782 mm şi respectiv   2,0722 mm.

b) Având  şi  găsiţi mai sus pentru lotul de piese din


problemă şi notând
24,5  24,7782 25,5  24,7782
z1   0,1343 şi z 2   0,3483
2,0722 2,0722
rezultă că
P 24,5  X  25,5  P   0,1343  Z  0,3483  F  0,3483  F   0,1343

unde valorile F  z  se găsesc cu funcţia RepNO1(z:real)


Programul indică F  0,3483  0,6362 şi F   0,1343  0,4466
astfel încât P 24,5  X  25,5  0,6362  0,4466  0,1896

Optzeci de procente dintre pasagerii rutelor aeriene


Exemplul 4.2.3

declară că sunt neliniştiţi la aterizări. Să se găsească probabilitatea


ca dintre 100 de pasageri ai unui zbor:
a) să fie neliniştiţi la aterizare între 78 şi 85 inclusiv;
b) să fie neliniştiţi exact 80 pasageri.

Soluţie

29
Este vorba de un experiment binomial în care o încercare
corespunde unui pasager oarecare, iar starea de nelinişte
corespunde unui succes.
Numărul de încercări independente este n  100 pasageri iar
probabilitatea de succes la fiecare încercare este p  0,8 .
Media şi varianţa distribuţiei sunt   n p  100  0,8  80
şi respectiv  2  n p q  100  0,8  0,2  16 , cu abaterea standard   4 .
Cu n  100 , atât n p  80 , cât şi n q  20 sunt mai mari decât 5 şi
deci distribuţia binomială discretă poate fi aproximată prin
distribuţia normală continuă N  80,4  .

a) Se urmăreşte aproximarea suprafeţelor dreptunghiurilor


histogramei de probabilitate a distribuţiei binomiale care sunt
centrate pe x  78 , x  79 ,..., x  85 .
Primul dreptunghi cu baza unitară începe la x1  77,5 , iar
ultimul se termină la x2  85,5 .
Suprafaţa de sub graficul N  80,4  cuprinsă între aceste limite
va aproxima suprafeţele dreptunghiurilor histogramei distribuţiei
binomiale.

Trecând la variabila normală standard se obţin valorile


77,5  80 85,5  80
z1   0,625 şi z 2   1,375
4 4
şi atunci
P 77,5  X  85,5  P  0,625  Z  1,375  F 1,375  F   0,625 
 0,9154  0,2660  0,6494

85

Deci x b xi ;100, 0,8  0,6494


 78
i

b) Aria dreptunghiului centrat pe x  80 se va aproxima cu aria


de sub curba N  80,4  delimitată de x1  79,5 şi respectiv x2  80,5 .
79,5  80
Rezultă z1  4  0,125 şi z 2  0,125 , astfel că
P 79,5  X  80,5  P   0,125  Z  0,125  F  0,125  F   0,125 
 0,5497  0,4503  0,0995

30
Pentru a evalua precizia aproximaţiei, formula (4.1) adică
b x ; n, p   C nx  p x  q n x ,

unde n  100 ; p  0,8 ; q  0,2 , va da pentru x  80 :


b 80 ;100; 0,8  C100
80
 0,880  0,2 20  0,0993
0,0995  0,0993
Rezultă o diferenţă de circa 0,0993
 100  0,2% deci într-

adevăr o aproximaţie foarte bună obţinută cu legea normală.

4.2.2. Legea log-normală (sau legea Galton, sau legea


Gibrat, sau legea efectului proporţional)

Această lege este definită pe intervalul pozitiv al axei  x  0 , şi


reflectă faptul că logaritmul variabilei Y  X  c urmează o lege
normală.
În general, poate avea trei parametri şi se va nota LN  a, b, c  , iar
când c  0 , devine lege de doi parametri şi se va nota LN  a, b  .
Parametri se numesc şi reprezintă:
a – parametru de poziţie = Y , cu Y  ln X  c  ;
b – parametru de formă = Y ;
c – limita inferioară a distribuţiei, în sensul că X  c .

Funcţia de densitate de probabilitate este:


1
1   ln  x c  a  2
f  x  e 2b
2
(4.25)
b x  c  2 
iar caracteristicile descriptive pentru V.A X au forma:
b2
   e  1e b2 2a  b 2
M1    c  e 2 ; (4.26)
a 2
 

2 2
coeficientul de variaţie Cv     eb  1
M1
coeficientul de asimetrie C s  3  3

Alura funcţiei de densitate log-normală apare în Fig. 4.3 pentru


cazul particular b  1 ; c  0 şi câteva valori ale lui a.

31
f(x)

0,6

0,4
a=0

0,2 a=1
a=2

0 2 4 6 8 10
12

Fig.4.3. Distribuţii log-normale pentru diverse valori a ( b  1 , c  0 )

Legea LN se obţine ca lege a produsului unui număr mare de


V.A. independente (de aici se mai numeşte şi legea efectului
proporţional).

Este utilizată în multe domenii ale ingineriei, iar în hidrologie


poate reprezenta – de ex. – distribuţia debitelor maxime anuale,
curbele intensitate – durată ale precipitaţiilor ş.a.m.d.

Dacă o V.A. X urmează o lege LN, atunci orice funcţie de V.A.


având forma Y  aX b are, de asemenea, o lege log-normală.

Dacă două V.A. independente X 1 şi X 2 au legi LN1  a1 ,b1  şi


respectiv LN2  a 2 ,b2  , atunci V.A. X 3  X 1  X 2 va urma o lege LN3
a  a , b2  b2 
.
 1 2 1 2 

Cuantila corespunzătoare unei valori   specificate a


q  F xq

funcţiei de repartiţie se obţine sub forma:


 abzq   c
xq  e (4.27)
cu z q cuantila variabilei normale standard pentru q specificat
găsită din tabele sau cu relaţiile aproximative (4.23) – (4.24).

32
Prelucrând un şir de debite maxime anuale
Exemplul 4.2.4

înregistrate pe Olt în amonte de zona amenajată, s-a găsit că:


media lor are valoarea Q  450 m s , 3 1

abaterea standard este s  225 m s , 3 1

iar coeficientul de asimetrie C s a rezultat C s  1,52 ,


datele variind între Qmin  110 m 3s 1 şi Qmax  1220 m 3s 1 .
Presupunând că debitul maxim anual este o variabilă aleatoare
distribuită log-normal
a) Să se determine ecuaţia funcţiei de densitate de
probabilitate;
b) Să se calculeze media, varianţa şi momentul centrat de
ordin
3 pentru distribuţia respectivă;
c) Să se calculeze şi reprezinte grafic funcţiile de densitate şi de
repartiţie;
d) Să se determine valorile cuartilelor Q0,25 şi Q0,75 , între care
se va plasa debitul maxim anual cu probabilitatea de 50%;
e) Ce valori ale debitului maxim anual nu sunt şi respectiv sunt
depăşite cu probabilitatea de 5%?

Soluţie
a) Admiţând pentru populaţie că parametri sunt egali cu
statisticile de eşantion şi observând (4.26), se constată că:
2 s 225
Cv   θ  0,5
M1 Q 450
şi atunci C s  3θ  θ 3  3  0,5  0,53  1,625 , (o valoare apropiată de C s  1,52
găsită pe baza şirului de date înregistrate).
În concluzie, apare justificat să se accepte că distribuţia log-
normală este adecvată aici.

33
Deoarece Cv  e b  1 , se obţine succesiv
2

C v2  1  e b , b  ln C v  1 şi respectiv b  ln 0,5 2  1  0,47238 .


2 2 2

Din relaţiile (4.26) mai rezultă:


 2  s 2   e b  1e 2 a b  C v2 e 2 a b
2 2 2

 

s2 2  s2 
şi apoi  e 2a b , 2a  b 2  ln 
C v2 C2 
 v 
1   s 2  2  1   225 2  
  0,47238 2   5,99768
deci a ln b  , adică a ln
2   C v2   2   0,5 2 
 
 
Folosind a şi b găsite mai sus, se verifică uşor că parametrul c
rezultă c=0.
Expresia analitică a funcţiei de densitate devine
exp  2,24072 ln x 5,99768
0,844537 2
f  x 
x

b) Calculele s-au făcut cu programul Lognormala care dă


1200
 x f  x .dx  435,21 m s
3 -1
- pentru medie: 
0
1200
  x   f  x .dx  40064,32 m 6 s - 2
2
- pentru varianţă: 2 
0
1200
  x   f  x .dx  8 551 797,7 m 9 s - 3
3
- pentru momentul 3 
0

c) Funcţiile de densitate şi repartiţie sunt afişate de program la


pas de afişare Q  50 m s , iar integrarea numerică se face la pas
3 -1

Q  1 m 3s -1 .

Pentru variaţia cu debitul maxim a densităţii f şi a repartiţiei de


probabilitate au rezultat următoarele date şi grafice:


Qmax m 3 s 1  f  % F  % 
Qmax m 3 s 1  f  % F  %
50 0,00 0,00 650 0,08 84,49
100 0,01 0,16 700 0,06 87,93
150 0,06 1,83 750 0,05 90,62
200 0,14 6,94 800 0,04 92,71
250 0,20 15,67 850 0,03 94,32
300 0,23 26,69 900 0,02 95,58
350 0,23 38,37 950 0,02 96,55
400 0,21 49,48 1000 0,01 97,30
450 0,18 59,34 1050 0,01 97,88
500 0,15 67,70 1100 0,01 98,33
550 0,12 74,57 1150 0,01 98,69

34
600 0,10 80,10 1200 0,00 98,96

f(%)

0,2

0,15

0,1

0,05

Qmax (m 3s -1 )
0
0 200 400 600 800 1000 1200

Reprezentarea grafică a funcţiei de densitate de probabilitate

100
F(%)

50

Qmax (m 3s -1 )
0
0 200 400 600 800 1000 1200

Reprezentarea grafică a funcţiei de repartiţie

d) Programul găseşte cuartilele Qmax pentru care F  Q   0,25 şi


respectiv 0,75, ca având valorile 292,7 m 3s 1 şi respectiv 553,5 m 3s 1 ,
între acestea plasându-se debitul maxim anual în circa 50% dintre
ani.

f) Valoarea debitului maxim anual care nu se depăşeşte în 5%

35
dintre ani este egală cu cuantila pentru care F  Q0,05   0,05 şi rezultă
Q0,05  185,1 m 3s -1 , iar valoarea care se depăşeşte în 5% dintre ani este

cuantila pentru care F  Q0,95   0,95 şi rezultă Q0,95  875,4 m 3s -1 .

4.2.3. Legea hi – pătrat cu  grade de libertate


V.A. X formată ca sumă a  variabile aleatoare normale standard
z i , ridicate la pătrat, adică

X   Z i2
i 1

are o lege de densitate de probabilitate numită hi – pătrat cu  grade


de libertate, notată prin  2 şi definită de relaţia:
  x
 1 
x 2  e 2
f  x 
 ,  0; 0 x  (4.28)

22   
2

unde  este funcţia gamma de parametru 
2
, dată de integrala:

    t
 1
 e t dt (4.29)
0

Se observă că f  x  din (4.28) depinde de un singur parametru


şi anume  , numărul de grade de libertate. Alura graficului funcţiei
de densitate pentru legea hi – pătrat apare în Fig. 4.4, pentru câteva
valori ale lui  .

36
f(x)

0,6

 1
0,4

 3
0,2
 6
x

0 2 4 6 8 10
12
Fig.4.4. Distribuţia hi – pătrat pentru diverse valori 

Caracteristicile descriptive ale legii  2 sunt date de relaţiile:


M 1     ;  2  2 ;  3  8 ;  4  48
moda =   2 , pentru   2

Se utilizează în special în testele statistice de concordanţă (sau


ajustare), prin care se verifică măsura în care o serie de date
experimentale se ajustează la o lege teoretică oarecare.
2
Dacă X 1 şi X 2 sunt două variabile independente de legi 
1 şi
respectiv  2 , atunci V.A. Y  X 1  X 2 urmează o lege  2   .
2 1 2

Observaţii
Dacă  creşte indefinit, distribuţia  2 tinde către distribuţia
normală N , 2  , cu o convergenţă relativ lentă.

Pentru    şi dacă V.A. X are o lege  2 ,


atunci V.A. Y  2 X tinde rapid spre legea normala N  2  1,1 .
Aproximarea prin legea normală devine deci justificată pentru
  30 şi folosind relaţiile:

z 2x  2  1 sau x
z  2  1 2
2
unde z este variabila normală standard.

Pentru calculul funcţiei de repartiţie corespunzătoare unei


valori X  x * date, adică:

37
x*
F x 
*
 f  x  dx
0

cu f  x  de forma (4.28), se pot utiliza două metode practice.


Prima se bazează pe o dezvoltare în serie a lui F  x  .
Cea de-a doua este aplicabilă pentru   8 şi furnizează valori F  x 
între 0,0001 şi 0,9999 la o precizie mai bună de 10 4 , cu relaţiile:
- dacă x*    1 , atunci F  x *    t1 
1 0,08

unde t1   3 
2  2
- dacă x*    1 , atunci  
F x*   t 2  (4.30)
 
a    1 ln  * 1   x *     1 2 0,08
unde t2 
 x  şi a  x*    
3 
x *     1

iar  t  este funcţia de repartiţie a legii normale standard, pentru


argumentul t.

4.2.4. Legea Student (sau legea t, sau legea Student – t)


cu  grade de libertate
O V.A. X definită pe domeniul   ,   prin raportul între o V.A.
normal distribuită standard, Z şi radical din V.A. Y  , cu Y de tip  2
Z
, adică X  Y  , are funcţia de densitate de probabilitate:
1    1
   2   2   1
2   x 
f  x   1 (4.31)
     
  
2
şi se notează prescurtat t .

Alura graficului funcţiei de densitate t este redată în Fig. 4.5


pentru câteva valori  .
Se observă că este o distribuţie simetrică de medie M 1    0 ,

având  2    2 (pentru   2 ) şi cu  3  0 .

38
De asemenea, pentru    , legea t tinde către legea N  0,1 ,

aproximaţia fiind complet acceptabilă dacă   30 .

f(x)

 

 1

Fig.4.5. Distribuţia Student pentru diferite valori ale lui 

Ca şi  2 , legea t are aplicaţii în efectuarea testelor statistice,


la determinarea intervalelor de încredere, ş.a.m.d.

Dacă  este mare, funcţia de repartiţie corespunzătoare lui


X  x * se poate obţine cu:
 2 
x*
 
F x *   t  , unde t
8  1
8  3

 ln 1 
 



(4.32)
 
şi  t 
- funcţia de repartiţie a lui N  0,1 de parametru t.
Când   10 , precizia relaţiei (4.32) este de ordinul lui 10 4 .

Cuantila xq pentru care q  F xq  se aproximează cu relaţia:


 z q  1 5 z q4  16 z q2  3 3z q6  19 z q4  17 z q2  15 
x q  z q 1     (4.33)
 4 96 2 384 3 
 
în care zq este cuantila q a legii . N  0,1

Aproximaţia (4.33) este precisă până la trei cifre semnificative dacă


  15 şi q  0,999 .

4.2.5. Legea Fisher – Snedecor (sau legea F)

39
Se notează cu F  1 , 2  , unde 1 şi  2 sunt parametri (grade de
libertate) şi este legea de probabilitate a V.A. X definită pe domeniul
Y 
pozitiv al axei, prin raportul: X  1 1 unde Y1 şi Y2 sunt două
Y2  2
2 2
V.A. independente, de legi 
1 şi respectiv 
2 .

Are densitatea de repartiţie:


   1   
 1 2  1 1  1 2
2   1  2 2  1  2
f  x     x 1  x (4.34)
 1    2    2    2 
    
2  2 
2
cu media M 1      2 şi momentul centrat de ordin doi
2
2 22  1   2  2 
2  , pentru 2  2 (media) şi respectiv
1   2  2  2   2  4 
pentru 2  4 (varianţa).

Indiferent de valorile lui 1 şi 2 , graficele distribuţiei F  1 ,  2 


au asimetrie pozitivă (vezi Fig. 4.6).

f (x)

0,8 F(10,50)

0,6
F(10,4)
0,4

0,2
x
0
0 2 4 6 8

Fig.4.6.Distribuţia Fisher – Snedecor cu 1 =10 şi  2 =50 şi 4

Când 1 şi 2 tind către infinit,  tinde către 1 şi varianţa


către 0.

40
Dacă X este V.A. de lege F  1 ,  2  , atunci V.A. 1 X va avea o
lege F   2 , 1  .

Dacă 1  1 , atunci F 1,  2   t 2 , deci variabila Fisher –


2

Snedecor cu 1  1 şi  2 grade de libertate este identică cu pătratul


unei variabile Student cu  2 grade de libertate.

Distribuţia F  1 ,   este identică cu distribuţia variabilei hi –


pătrat cu 1 grade de libertate, împărţită la 1 .

Cea mai importantă utilizare a distribuţiei F este în testele de


omogenitate a varianţei şi în inferenţa statistică.

Funcţia de repartiţie a distribuţiei F  1 , 2  este tabelată pentru


diverse valori x * şi respectiv grade de libertate 1 şi  2 . Utilizarea
acestor tabele este destul de greoaie şi cere interpolare armonică
între grade de libertate vecine.
O aproximaţie satisfăcătoare, de ordinul lui 10 4 ca precizie se
obţine dacă 1 sau  2  12 , cu relaţia:
 1
  S  T  2 
1  qg  p   pg  p   
 

 
*
F x   d n 
 1
 n  
 (4.35)
   n   pq
 
   6  


 

 1  1   2 p  2
în care: S 2 ; T  1 ; n 1 2 ; ;
2 2 2 1 x *   2
1  1  q p q  0,5 
q  1 p ; d S  p n    0,04   
6  3   2 1 1   2 
1  y 2  2 y ln y
iar funcţia g y  pentru şi
1  y 2  x*  0 p 1

cu g  0  1 şi g 1  0 ,  t  fiind funcţia de repartiţie a lui N  0,1 la


parametrul t.

4.2.6. Legea exponenţială

O V.A. X având funcţia de densitate de probabilitate

41
 xa

1 e b pentru x  a, b  0

b
f  x   (4.36)
 0 in rest



se notează prescurtat E  a, b  .

Depinde de parametrul a (de poziţie sau limită inferioară) şi


respectiv parametrul b (de dispersie sau de scară).

Are media M 1    a  b şi varianţa  2   2  b 2 .


Coeficientul de asimetrie (Fisher) este egal cu 2, coeficientul de
boltire (Pearson) este egal cu 9, iar moda se înregistrează la x  a .

În Fig. 4.7 este reprezentată funcţia f(x) pentru legea E(0,1).


f(x)

1,2

0,8

0,4

0 2 4 6 8

Fig.4.7. Legea exponenţială de parametri a  0 şi b  1

Valoarea funcţiei de repartiţie pentru X  x* se obţine simplu:


x*  a
 
*
F x 1 e

b (4.37)
xa
Cu variabila redusă v
b
, inversa funcţiei de repartiţie se
scrie:
xa
 v   ln1  F  x  
b
astfel încât cuantila xq pentru care q  F  xq  rezultă direct cu:
x q  a  b v q , unde v q   ln1  q  (4.38)

42
Se utilizează, printre altele, în modelarea timpilor de defectare
a utilajelor, a timpilor de aşteptare în cozi, etc.
O substanţă chimică sub formă lichidă adusă la
Exemplul 4.2.5

temperatura de 150 0 C , trece în faza gazoasă printr-o reacţie de


ordinul întâi, cu o constantă a vitezei de reacţie k  3,5  10 1 s (sau 4

1,26 1/h). Prin aceasta se înţelege faptul că numărul de molecule, N  t 


, de substanţă lichidă rămase la momentul t după începerea reacţiei
este dat de:
N  t   N  0  e  kt

unde N  0
este numărul de molecule în faza lichidă la t = 0.
Descreşterea numărului de molecule în faza lichidă,  dN  t  , în
intervalul  t , t  dt  va fi atunci  dN  t   N  0  ke  kt dt

Dar  dN  t  este numărul de molecule din totalul iniţial care


supravieţuiesc pentru un timp T şi nu mai mult, cu t  T  t  dt .
Deci, probabilitatea ca una din moleculele originale în faza
lichidă să supravieţuiască până la acest moment este:
dN  t 
P t  T  t  dt     ke  kt dt
N  0
Conform definiţiei probabilităţii elementare pentru o V.A.
continuă, rezultă că funcţia de densitate de probabilitate a duratei de
supravieţuire a moleculelor în faza lichidă este:
f  t   ke  kt
1
adică o lege exponenţială ca (4.36), de parametri a0 şi b
k
, deci
 1
E  0,  .
 k

În figură se redă variaţia mărimii y  f  t  h 1 în funcţie de t h .

43
y  f  t  / h 1

1,2

1,0

0,8

0,6

0,4

0,2
t/h

0 0,5 1 1,5 2 2,5 3 3,5

Durata medie de supravieţuire în faza lichidă este


1 1h
   2857 s  .
k 1,26
De asemenea, 50% dintre molecule dispar din lichid în
ln 2
t1 2   0,55 h   1980 s  ,
k
aceasta fiind cuantila pentru care F  t   0,5 aşa cum se poate
verifica cu (4.37) sau (4.38).
Pe durata medie de supravieţuire, mai puţin de jumătate dintre
molecule rămân în fază lichidă (mai precis 1 e  0,368 ), în timp ce
restul de 1  1 e  0,632 din numărul iniţial s-au transformat în gaz.

Un caz mai general este legea Weibull pentru care V.A. X are
funcţia de densitate de probabilitate.

44
 x
a
 a a1  b 
f  x   a x e pentru x  0, a  0, b  0 (4.39)
b
0 în rest
şi se va nota prescurtat W  a, b  .
Depinde de parametru de formă a şi de parametrul de scară b.

Se utilizează frecvent în teoria fiabilităţii, având o expresie


analitică pentru funcţia de repartiţie corespunzătoare unei valori
X  x * specificate, şi anume:
a
 x* 

F x   1  e
*

 b 


 (4.40)

Dacă V.A. X este timpul, atunci, conform noţiunilor din


fiabilitate, F  x *  reprezintă
probabilitatea de defectare a componentei unui sistem fizic
înainte de momentul x * de la darea în exploatare,
iar complementul funcţiei de repartiţie, adică:
R x *   1  F  x *  (4.41)
reprezintă probabilitatea de funcţionare fără defect (fiabilitatea)
până la momentul x * .

Evident, f  x  dat de (4.39) este în acest caz funcţia densităţii de


defectare (sau rata de defectare),
iar funcţia:
f  x
h x   (4.42)
R x 
se numeşte funcţia hazard (sau viteză instantanee de defectare sau
rată de mortalitate dacă f  x  este asimilată unei funcţii de vârstă).

4.2.8. Legea Gamma cu doi parametri


Se notează G  a, b  , are densitatea de repartiţie

45
 a b x b 1e  ax
 pentru x  0, a  0, b  0
  b 

f  x   (4.43)
 0 in rest



şi reflectă o V.A. care este suma a n variabile independente de tip
exponenţial, fiecare având aceeaşi medie.

Adesea parametrul b este număr întreg şi se numeşte număr de


grade de libertate a V.A. X.
Raportul  b  1  b   b , astfel că  b  2  b    b  1 b etc, iar dacă b
este întreg, atunci  b    b  1!
Se constată că distribuţia G  a,1 este identică cu distribuţia
exponenţială de parametru 1 b  a şi începând de la 0, adică E  0, a 

Media şi varianţa distribuţiei Gamma sunt


M1    b a şi respectiv  2   2  b a2 .

Legătura între distribuţiile Gamma şi Poisson se face admiţând o


V.A. Z cu distribuţie G 1, m  unde m este număr întreg. Se poate arăta
că:

m 1  z
z e dz
(4.44)
P Z  c   c
 P  K  m  1
 m  1!
unde K este valoarea funcţiei de repartiţie a distribuţiei Poisson de
medie   c pentru x  m  1 , adică, conform relaţiei (4.12):
m1 j
c
K  F  X  m  1  e c  (4.45)
j 0
j!

S-ar ajunge la acest rezultat considerând un proces în care


evenimentele apar în medie cu viteza de 1 pe secundă.
În acest caz, Z secunde ar reprezenta timpul de aşteptare până
la apariţia evenimentului cu numărul m.
Probabilitatea ca acest timp de aşteptare să fie mai mare decât
c secunde este chiar probabilitatea ca nu mai mult de m-1
evenimente să fi apărut în intervalul de timp dintre 0 şi c secunde.

Acum, dacă Y este de tip G  a, m  , atunci variabila Z  aY este


distribuită ca G 1, m  , rezultat valabil şi dacă m nu este întreg.
În consecinţă: P Y  c   P Z  a c 

46
care este dată de relaţia (4.45), înlocuind c prin ac.

La un ghişeu de bilete RATB, o persoană este a


Exemplul 4.2.6

cincea din coadă. Timpul ei de aşteptare este suma timpilor de servire


a celor patru persoane din faţă. Timpii de servire sunt variabile
independente, distribuite exponenţial, cu media 20 secunde.
Care este probabilitatea ca persoana în cauză să aştepte mai mult
de 90 s ?

Soluţie
Notând cu T durata de servire în secunde, se ştie că aceasta are
1
distribuţia de forma ae  at , cu media   a  20 .

Astfel, dacă timpul de aşteptare este W secunde, W este suma a


4 variabile independente de tip exponenţial, fiecare de parametru
 1 
a  1 / 20 şi urmează o distribuţie Gamma G ,4  .
 20 
Probabilitatea PW  90 se obţine înlocuind c  90 / 20  4,5 în
relaţia (4.44) şi apoi folosind (4.45), adică
 4,5 2 4,53 
PW  90   e  4,5 1  4,5     0,3423
 2 6 

4.2.8. Legea Beta cu doi parametri

Se notează cu B a, b  şi are densitatea de repartiţie


x a 1 1  x  b 1
f  x  , pentru 0  x 1, cu a, b  0 (4.46)
 a, b 
în care
1
(a )(b)
 a, b   x
a 1
1  x  b 1 dx  (4.47)
 a  b 
0

este funcţia beta de doi parametri a şi b, exprimată cu ajutorul


funcţiei  .

În acest caz V.A. X este mărginită la domeniul  0,1 .

47
Dacă a  0 şi b  1 , moda are valoarea  a  1 a  b  2 .
Când a  2 , curba atinge axa x în origine.
Dacă 1  a  2 , graficul curbei este tangent la axa ordonatelor în
origine,
iar dacă 0  a  1 graficul tinde asimptotic către axa
ordonatelor.

Proprietăţi asemănătoare apar la extremitatea x  1 , dar legate


de valorile parametrului b
.
Pentru a şi b subunitari, distribuţia se transformă într-o
distribuţie uniformă.

a
Media distribuţiei (4.46) este 
ab
, iar varianţa ei
ab
2   a  b  1 .
 a  b 2

Există numeroase situaţii practice în care o caracteristică


admisă ca V.A. poate avea o funcţie de densitate de probabilitate
reprezentată bine de distribuţia Beta.
Spre exemplu, în domeniul resurselor de apă:
- nivelul într-un lac de acumulare nu poate să se plaseze decât
între două limite fizice
- sau nivelul pânzei freatice într-un acvifer freatic poate varia
doar între suprafaţa solului şi respectiv primul strat de rocă
impermeabilă de sub suprafaţă.

Evident, notând cu X max şi respectiv X min cele două limite


fizice extreme,
X  X min
variabila x
 X max  X min  va lua valori din domeniul  0,1
şi poate fi modelată printr-o distribuţie de tipul (4.46).

48
Sub o altă formă şi anume:
x a 1 1  x   a b 
f  x  , pentru x  0 (4.48)
 a, b 
distribuţia Beta este definită pe domeniul pozitiv al V.A. X.

4.2.9. Legi ale valorilor extreme

Fie o V.A. X reprezentată printr-un eşantion de N valori


discrete sau o serie continuă de lungime T.
Acest eşantion se poate diviza în n subserii de dimensiuni
egale, având fiecare câte m componente, astfel încât N  n  m sau
T  nm .
Din fiecare subserie se poate alege / defini câte o mărime,
corespunzând unei anumite proprietăţi a subseriilor respective.

Mărimea aleasă / definită reprezintă o nouă V.A., notată cu Y,


iar cele n valori Y obţinute din cele n subserii, formează un eşantion
(sau o populaţie) pentru această variabilă aleatoare.

Ca mărime reprezentativă de interes pentru subserii poate fi


privită, de exemplu:
- valoarea cea mai mare din fiecare subserie;
- valoarea cea mai mică din fiecare subserie;
- valoarea cumulată pe câte un număr de date, cea mai mare
sau respectiv cea mai mică din fiecare subserie, etc.

În hidrologie, dacă subseriile sunt compuse din câte 365 de


date de debite medii zilnice înregistrate,
atunci alegând cea mai mare valoare din fiecare an de
înregistrări, se obţine şirul debitelor maxime anuale ca V.A. Y.
Selectând cea mai mică valoare din cele 365 ale fiecărui an, va
rezulta şirul debitelor minime anuale ca V.A. Y.
Alte mărimi de interes în analiza şi managementul resurselor
de apă sunt şi volumele minime (sau maxime) de apă scurse printr-o

49
secţiune într-un interval de durată precizată (7 zile, 10 zile, o lună
etc.) şi desigur că pentru fiecare subserie anuală se pot obţine
valorile respective care corespund la V.A. Y.

S-a constatat că distribuţia valorilor extreme Y, este


independentă de distribuţia variabilelor aleatoare originale X şi
tinde asimptotic către o funcţie limită, în principiu de tip dublu
exponenţial.

Deoarece distribuţiile valorilor extreme prezintă interes practic,


se vor prezenta în continuare doar elementele referitoare la acestea.

1. Funcţia de distribuţie a valorilor maxime, sub forma


funcţiei de repartiţie se scrie:
 
  x 
F  x   e e (4.49)
cunoscută şi ca legea Gumbel. Aici  este un parametru de poziţie,
iar  - un parametru de scară.
Cu variabila redusă y   x   , relaţia (4.49) devine:
y
F  x   e e (4.50)

Expresia funcţiei de densitate de probabilitate se obţine prin


derivarea lui F  x  în raport cu x, adică:
   X  
f  x    e   X   e
y
sau f  x   e  y e (4.51)

Când x sau y tinde către   sau   , F  x  tinde către 0 sau


respectiv 1, astfel încât funcţiile (4.51) sunt nemărginite, având ca
asimptotă axa x.

Dacă media  şi abaterea standard  ale V.A. X sunt


specificate, parametrii  şi  au expresiile:
1,281


;     0,45  = moda (4.52)

De asemenea, dacă x0,25 şi x0,75 sunt cuartilele pentru care


F  x  ia valorile 0,25 şi respectiv 0,75, atunci  se poate obţine cu:

 0,6359 x0,75  x0,25 


1

(4.53)

50
Pentru valori F  x   0,99 (sau y  4,6 ), relaţia (4.49) se poate
aproxima satisfăcător prin funcţia  x   e  y , iar relaţia (4.50) - prin
funcţia F  x   1   x  .

Probabilitatea totală de depăşire a valorii x0 , adică P X  x0  va


fi:
P  X  x 0   1  F  x0  (4.54)
iar pentru o probabilitate de depăşire specificată, P, se obţine din
(4.50)
y P   ln  ln1  P   şi respectiv x P    y P 

2. Funcţia de distribuţie a valorilor minime, sub forma


funcţiei de repartiţie, se scrie:

 x  

 

F  x   e    
, (4.55)
are cei trei parametri  ,  şi  şi poate fi aplicată dacă: x   ;   0
;   0 şi   
Prin derivare se obţine funcţia de densitate

 
 1   x   
f  x 
 x


 e     (4.56)
       

x
Cu variabila y   
  
, rezultă:
 1

F  x  e  y şi f  x  

y  e y (4.57)

Din (4.56) se observă că dacă  x    tinde către 0 sau  , f  x 


tinde către 0.

Din (4.55) rezultă că pentru x   (cea mai mică valoare


posibilă a lui x), F  x   1 , iar pentru x   , F  x   0 , astfel încât F  x 
dă probabilitatea ca X  x .

Parametrul  dă limita inferioară a domeniului lui x,  este


parametru de poziţie, iar  - parametru de scară.

Dacă x   , rezultă F  x   e 1  0,368 , deci valorile x au


probabilitatea de 0,368.

51
Relaţiile între parametrii  ,  şi  şi respectiv media, abaterea
standard şi coeficientul de asimetrie  , , C s  sunt următoarele:

  3  2  1   1  
3

C s  1    31  1    2 1    B    3
               
 
1

 1  
2
 2
  2  
B     1    1   
     
(4.58)
 
 
    A   ;      B     1 
A   1  1  B
   

La un eşantion cu valoare numerică precizată a coeficientului


de asimetrie, prin rezolvarea ecuaţiei provenită din prima relaţie
(4.58) se găseşte o estimare a lui  .
Apoi celelalte relaţii permit evaluarea parametrilor  şi  .
Dacă  = 1, rezultă simplu că    şi      , iar relaţiile
(4.55) – (4.56) devin mult mai simple.

..Problema 4.2.1
?
Într-o holdă de porumb plantele au înălţimea medie de 183 cm,
cu o abatere standard de 8,5 cm. Dacă înălţimea lor este o variabilă
aleatoare normal distribuită, să se găsească
a) procentul de plante mai înalte de 2 m;
b) procentul de plante mai scunde decât 170 cm;
c) înălţimea sub care se plasează 95% din holdă.

..Problema 4.2.2
?
Bateriile auto produse de Rombat au o durată de viaţă normal
distribuită, cu media 46 luni şi abaterea standard 5,8 luni.
a) Dacă fabrica garantează funcţionarea pentru 3 ani, ce procent
din produse va trebui să înlocuiască în perioada de garanţie ?
b) Ce procent din produse va funcţiona între termenul de
garanţie şi durata medie de viaţă ?
c) Ce procent din produse va funcţiona mai mult de 4 ani ?

52
..Problema 4.2.3
?
În urma examenului la Prelucrarea statistică a datelor
experimentale s-a constatat o repartiţie normală a punctajelor obţinute,
cu media 70 (din 100 puncte) şi abaterea standard de 10,6 puncte.
Rezultatele s-au clasificat în 5 categorii şi anume: A – cele mai slabe
5%, B – 20% mediocre, C – 50% medii, D – 20% bune şi E – 5%
foarte bune. Să se afle:
a) punctajul maxim pentru categoria A;
b) între ce punctaje s-au plasat rezultatele medii;
c) punctajul minim al rezultatelor foarte bune.

..Problema 4.2.4
?
Timpii de ecluzare la o ecluză de pe un canal navigabil sunt
aproximativ normal distribuiţi, cu o medie de 17,3 minute şi abaterea
standard 4,2 minute. Să se găsească probabilitatea de a realiza
ecluzarea în mai mult de 19,7 minute, dacă la măsurarea timpului
acesta se rotunjeşte la zecimea de minut cea mai apropiată.

..Problema 4.2.5
?
Distribuţia variabilei aleatoare cu funcţia de densitate de
probabilitate
ax
e b
f  x 
ax 2
 
 
b1  e b 
 
 

se numeşte distribuţie logistică, este definită pentru    x   şi are


media   a şi varianţa  2   b. 2 / 3 . Admiţând   10 şi   3 , să se
compare probabilitatea ca     X     în cazul acestei distribuţii şi
respectiv pentru distribuţia normală cu aceiaşi parametri.

53

You might also like