Professional Documents
Culture Documents
SUMRIO
1. AMOSTRAGEM 4
2. ESTIMAO 16
3. EXERCCIOS 24
5. REFERNCIAS 29
1. AMOSTRAGEM
1.1. C ONCEITOS BSICOS
Estatstica Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade no
possvel estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto.
O principal motivo para se trabalhar com uma parte do conjunto ao invs do conjunto inteiro o custo.
O conjunto de todos os elementos que se deseja estudar denominado de populao. Note-se
que o termo populao usado num sentido amplo e no significa, em geral, conjunto de pessoas.
Pode-se definir uma populao como sendo:
Uma coleo de todos os possveis elementos, objetos ou medidas de interes-
se.
Assim, so exemplos de populaes:
O conjunto das rendas de todos os habitantes de Porto Alegre;
O conjunto de todas as notas dos alunos de Estatstica;
O conjunto das alturas de todos os alunos da Universidade; etc.
Um levantamento efetuado sobre toda uma populao denominado de levantamento censit-
rio ou Censo.
Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral, muito
difcil. Isto se deve vrios fatores. O principal o custo. Um censo custa muito caro e demanda um
tempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da populao de-
nominadas de amostras. Uma amostra pode ser caracterizada como:
Uma poro ou parte de uma populao de interesse.
Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na
Agricultura, Poltica, Negcios, Marketing, Governo, etc., como se pode ver pelos seguintes exemplos:
Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado de
eleitores para ter uma idia do desempenho dos vrios candidatos nas futuras eleies.
Uma empresa metal-mecnica toma uma amostra do produto fabricado em intervalos de
tempo especificados para verificar se o processo est sob controle e evitar a fabricao de itens defei-
tuosos.
O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc.
Redes de rdio e TV se utilizam constantemente dos ndices de popularidade dos programas
para fixar valores da propaganda ou ento modificar ou eliminar programas com audincia insatisfat-
ria.
Bilogos marcam pssaros, peixes, etc. para tentar prever e estudar seus hbitos.
O processo de escolha de uma amostra da populao denominado de amostragem.
Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decises so-
bre toda a populao com base em apenas uma parte dela. A teoria da probabilidade pode ser utiliza-
da para fornecer uma idia do risco envolvido, ou seja, do erro cometido ao utilizar uma amostra ao in-
vs de toda a populao, desde que, claro, a amostra seja selecionada atravs de critrios probabilsti-
cos, isto , ao acaso.
Baseado nos conceitos anteriores pode-se definir Estatstica Indutiva ou Inferencial como
sendo:
A coleo de mtodos e tcnicas utilizados para se estudar uma populao baseados em amos-
tras probabilsticas desta mesma populao.
Uma amostra dita probabilstica se todos os elementos da populao tive-
rem probabilidade conhecida e no zero de pertencer a amostra.
Dentre as vrias maneiras de se selecionar uma amostra probabilstica ou aleatria de uma po-
pulao a mais simples atribuir a todos os elementos da populao a mesma probabilidade de perten-
cer a amostra.
Uma amostra que satisfaa tal critrio denominada de amostra aleatria simples (aas).
Uma aas pode ser extrada de uma populao de acordo com os critrios:
(a) com reposio e (b) sem reposio.
Se a populao for infinita ento as retiradas com e sem reposio sero equivalentes, isto ,
se a populao for infinita (ou ento muito grande), o fato de se recolocar o elemento retirado de volta
na populao. no vai afetar em nada a probabilidade de extrao do elemento seguinte.
Se, no entanto, a populao for finita (e pequena) ser necessrio fazer uma distino entre os
dois procedimentos, pois na extrao com reposio as diversas retiradas sero independentes, mas no
processo sem reposio haver dependncia entre as retiradas, isto , o fato de no recolocar o ele-
mento retirado afeta a probabilidade do elemento seguinte ser retirado. A amostragem sem reposio
mais eficiente que a amostragem com reposio e reduz a variabilidade uma vez que no possvel re-
tirar elementos extremos mais do que uma vez.
Assim se N representa o tamanho da populao e n < N o tamanho da amostra, ento o nme-
ro de amostras possveis de acordo com os critrios com e sem reposio ser:
(a) Com reposio
k = nmero de amostras = Nn
(b) Sem reposio
N N!
k = nmero de amostras = =
n n!(N n)!
Exemplo:
Considere a populao P = { 1, 3, 5, 6 }. Ento o nmero de amostras possveis de tamanhos
n = 2 e n = 3, de acordo com os critrios com e sem reposio ser:
(a) Sem reposio
(1) n = 2
N 4 4!
Como N = 4 e n = 2, ento o nmero de amostras possveis ser: = = =6
n 2 2!( 4 2)!
Estimador
Um estimador uma caracterstica da amostra.
Como a amostra aleatria um estimador uma varivel aleatria. Assim tudo o que foi visto
em probabilidade sobre variveis aleatrias, aplica-se aos estimadores. A distribuio de probabilidade
de um estimador denominada de distribuio amostral.
Os principais estimadores so:
(I) A mdia da amostra, X que um estimador da mdia da populao:
(ii) A varincia amostral, S2 que um estimador da varincia populacional: 2
(iii) A proporo amostral, P, que um estimador amostral da proporo populacional .
Estimativa
Uma estimativa um valor particular de um estimador
Assim x = 2 uma estimativa. O estimador a expresso (frmula) enquanto que a estimati-
va o valor particular que ele assume (nmero).
Clculo dos principais estimadores.
Se (X1, X2, ..., Xn) uma amostra aleatria de tamanho n extrada de uma populao, ento:
(a) X = Xi / n uma estimativa da mdia populacional quando a amostra no est agrupada
e X = f i Xi / n uma estimativa da mdia da amostra quando a amostra est agrupada em uma distri-
buio de freqncias (por ponto ou por valores).
( Xi X) 2 Xi2 n X2
(b) S = 2
n1
=
n1
uma estimativa da varincia populacional quando a
amostra no est agrupada e
f i( Xi X )
2 2
f i Xi n X2
2
S = n1
= n1
uma estimativa da varincia populacional quando a
amostra est agrupada em uma distribuio de freqncias. Note-se que agora a varincia calculada
com
n - 1 no denominador. Isto se deve ao fato de que a varincia for calculada com n no denomina-
dor, a mdia de sua distribuio amostral no ser igual a varincia populacional o que caracterizaria
um estimador tendencioso.
Embora a varincia seja calculada com n - 1 no denominador com o objetivo de que as es-
timativas variem em torno do parmetro, isto no ir ocorrer se a amostragem for sem reposio de po-
pulao finita. Neste caso necessrio utilizar, ainda, uma correo para a varincia que consiste em
multiplic-la pelo valor (N - 1) / N. Evidentemente esta correo s ser necessria se a populao for
pequena, caso contrrio o quociente acima ser aproximadamente igual a um e a correo no precisar
ser feita.
Assim se a populao for finita (e pequena) e a amostragem for realizada sem reposio a va-
rincia dever ser calculada por:
2 = N 1 S2
S
N
x f( x ) = P( X = x ) x f( x ) x2 f( x )
1,0 1/16 1/16 1,0/16
2,0 2/16 4/16 8,0/16
3,0 3/16 9/16 27,0/16
3,5 2/16 7/16 24,5/16
4,0 2/16 8/16 32,0/16
4,5 2/16 9/16 40,5/16
5,0 1/16 5/16 25,0/16
5,5 2/16 11/16 60,5/16
6,0 1/16 6/16 36,0/16
1 60/16 254,5/16
tre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional.
O valor X = 1,36 denominado erro padro da mdia. Ele mede a variabilidade entre as
mdias amostrais e d uma idia do erro que se comete ao se substituir a mdia da populao pela m-
dia da amostra.
De fato, verificando a tabela acima, pode-se ver que se por exemplo, fosse selecionada a
amostra (1, 1) seramos levados a crer que a mdia da populao seria um, quando de fato ela vale
3,75, cometendo assim um erro de 2,75 unidades. Felizmente este erro (o maior possvel neste caso) s
vai ocorrer com uma probabilidade de 1/16 = 6,25%. Se por exemplo, fosse selecionada a amostra (1,
6) a mdia amostral seria 3,5 e o erro cometido (neste caso) seria de 0,25 unidades. Este erro bem me-
nor que o anterior ocorre com uma probabilidade de 2/16 = 12,5%. O que o desvio padro da distribui-
o amostral da mdia faz determinar o erro mdio, sendo por isso denominado, ento, de erro pa-
dro da amostragem.
(2) Amostragem sem reposio
Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2
extradas sem reposio.
As possveis amostras com as respectivas mdias so:
Da tabela segue:
E( X ) = x f( x ) = 22,5/6 = 3,75 = , isto a expectncia (mdia) de todas as mdias amos-
trais, extradas sem reposio da populao P, tambm igual a mdia populacional (parmetro popu-
lacional mdia).
cia entre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional
multiplicada pelo fator de correo de populao finita. Este fator, pode ser considerado como o fator
de eficincia da amostragem sem reposio sobre a amostragem com reposio, que neste caso (N = 4
e n =2) vale 2/3. Como na amostragem sem reposio no possvel retirar o mesmo elemento duas
vezes, as mdias no podem assumir valores to extremos, como por exemplo, o valor um ou seis
que assumiram na amostragem com reposio. Isto faz com que a erro padro na amostragem sem re-
posio seja menor do que na amostragem com reposio.
O fator de reduo da varincia na amostragem sem reposio : (N - n) / (N -1)
Pode-se perceber facilmente que quanto maior for a diferena entre o tamanho da populao e
o tamanho da amostra mais prximo de um ser este fator. Ento, como regra prtica, pode-se admi-
tir como necessria a correo para a varincia das mdias amostrais sempre que o tamanho da amostra
exceder a 5% do tamanho da populao. Caso isto no ocorra no necessrio fazer-se a distino en-
tre os dois procedimentos (com e sem reposio).
Evidentemente as consideraes acima valem para populaes pequenas. Se a populao
bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distri-
buio das mdias amostrais. Neste caso necessrio procurar por modelos probabilsticos que descre-
vam a distribuio da mdia amostral. Neste caso, tambm, como declarado acima a distino entre
amostragem com e sem reposio no ser necessrio, pois o fator de correo ser aproximadamente
um e no necessitar ser utilizado.
Os modelos probabilsticos so conhecidos a partir dos dois seguintes resultados:
(a) Se (X1, X2, ..., Xn) uma amostra aleatria de uma populao com distribuio normal de
mdia e desvio padro , ento a mdia da amostra ( X ) ter uma distribuio tambm normal com a
mesma mdia da populao e com desvio padro (erro padro) raiz de n vezes menor que o desvio
padro da populao, isto :
Se X N(, ) ento X ser N(, )
n
(b) Teorema Central do Limite
Se (X1, X2, ..., Xn) uma amostra aleatria extrada de uma populao com qualquer distri-
buio de mdia e desvio padro , ento a mdia da amostra ( X ) ter uma distribuio aproxima-
damente normal com a mesma mdia da populao e com desvio padro (erro padro) raiz de n ve-
zes menor que o desvio padro da populao medida que o tamanho da amostra aumenta.
OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa,
para se poder utilizar este resultado.
Assim:
Se X tem qualquer distribuio ento X ter uma distribuio aproximadamente N(, )
n
para n grande (n 30).
Exemplos:
(1) Uma populao X tem uma distribuio normal de mdia 100 e desvio padro 10.
(a) Qual P(95 < X < 105)?
(b) Se X a mdia de 16 elementos extrada desta populao, qual a P(95 < X < 105) ?
Soluo:
(a) Como X uma N(100, 10) vem:
P(95 < X < 105) = P(-0,5 < Z < 0,5) = (0,5) - (-0,5) = 0,6915 - 0,3185 = 38,30%.
Neste caso X uma N(100; 2,5), ento:
(b) P(95 < X < 105) = P(-2,0 < Z < 2,0) = (2,0) - (-2,0) = 0,9772 - 0,0228 = 95,44%.
(2) A renda de um conjunto de pessoas de uma certa regio tem mdia 6 s.m. e desvio padro
de 2 s.m. Se desta populao for extrada uma amostra de n = 100 pessoas, qual a probabilidade de a
mdia desta amostra acuse um valor superior a 6,3 s.m?
Soluo:
Neste caso, como no foi declarado que a populao normal necessrio aplicar o teorema
central do limite, uma vez que n = 100 > 30, isto possvel. A mdia da amostra ter uma distribuio
aproximadamente normal com mdia 6 s.m. e desvio padro de: 2 / 10 = 0,20, uma vez que o erro pa-
dro da mdia raiz de n vezes menor do que o desvio padro populacional. Ento, a probabilidade
pedida ser:
P( X > 6,30) = P(Z > (6,30 - 6)/0,20 ) = P (Z > 1,5) = (-1,5) = 6,68%, isto , apenas 6,68%
das mdias de amostras de tamanho n = 100 apresentaro um valor superior a 6,30 s.m.
Portanto:
E(P) = pf(p) = 0,5/2 = 0,25 = , isto a expectncia (mdia) de todas as propores amos-
trais, extradas sem reposio da populao P, e igual a proporo populacional (parmetro populaci-
onal ). Isto significa, que o estimador P um estimador no tendencioso (ou no viciado) da propor-
o populacional , quando as amostras so retiradas sem reposio.
(1 ) N n
V(P) = p2f(p) - P2 = 0,25/2 - 0,252 = 0,0625 = 2
.
N1
, isto , a varincia entre as pro-
pores amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional multiplicada
pelo fator de correo de populao finita. Este fator, pode ser considerado como o fator de eficincia
da amostragem sem reposio sobre a amostragem com reposio que, neste exemplo, (N = 4 e n = 2)
vale 2/3.
Evidentemente as consideraes acima valem para populaes pequenas. Se a populao
bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distri-
buio das propores amostrais. Nesta situao necessrio procurar por modelos probabilsticos que
descrevam a distribuio da proporo amostral. Neste caso, tambm, como declarado acima a distin-
o entre amostragem com e sem reposio no ser necessria, pois o fator de correo ser aproxi-
madamente um e no precisar ser utilizado.
O modelo probabilstico para a proporo amostral dada pelo seguinte resultado:
(a) Se (X1, X2, ..., Xn) uma amostra aleatria retirada de uma populao com proporo ,
ento a distribuio da proporo amostral ser aproximadamente normal com mdia P = e desvio
(1 )
padro P = n
.
OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa,
para se poder utilizar este resultado. Para amostras pequenas a distribuio da proporo amostral
Binomial.
Exemplo:
(1) A proporo de eleitores do candidato D. M. A. Gogo numa certa regio de 20%. Ex-
trada uma amostra de 100 eleitores desta regio, qual a probabilidade que ela apresente um nmero de
eleitores do candidato
(a) Abaixo de 15% (b) Superior a 30%
Soluo:
Como n > 30 pode-se usar a distribuio normal com mdia = = 20% e desvio padro
(1 ) 0,2(1 0,2)
= = = 0,04 = 4%, Ento:
n 100
2. ESTIMAO
A inferncia estatstica tem por objetivo fazer generalizaes sobre uma populao com base
em valores amostrais. A inferncia pode ser feita estimando os parmetros:
(a) Por ponto e
(b) Por intervalo.
A estimao por ponto feita atravs de um nico valor, enquanto que a estimao por inter-
valo fornece um intervalo de valores em torno do valor da estimativa pontual.
Exemplo:
Uma amostra aleatria simples de 400 pessoas de uma cidade extrada e 300 respondem que
acham a administrao municipal boa ou tima. Ento o valor p = 300/400 = 75% uma estimativa por
ponto do percentual de pessoas da cidade que acham a administrao boa ou tima. Esta mesma esti-
mativa poderia ser enunciado como de: 70% a 80% das pessoas da cidade acham a administrao boa
ou tima. Neste caso, teramos uma estimativa por intervalo da proporo. Note-se que o centro do in-
tervalo o valor 75% da estimativa pontual.
2.1. P ROPRIEDADES DOS ESTIMADORES
Seja X uma populao com um parmetro de interesse e seja (X1, X2, ..., Xn) uma amostra
aleatria simples extrada desta populao. Seja um estimador do parmetro . Ento:
(i) Se E( ) = se dir que um estimador no-tendencioso ou no viciado do parmetro
populacional . Neste caso, a mdia do estimador o parmetro populacional , ou ainda, pode-se
dizer que o estimador varia em torno do parmetro populacional.
(ii) Se um estimador no tendencioso de um parmetro , se dir que consistente se
medida que o tamanho da amostra aumenta a variabilidade do estimador diminui, isto , as observa-
es vo ficando cada vez mais concentradas em torno do parmetro na medida em que a amostra vai
ficando cada vez maior. Em smbolos:
lim V( ) = 0
n
construir um intervalo em torno da estimativa por ponto. Este intervalo construdo baseado na distri-
buio amostral do estimador.
Este valor vale 1,96. Ento o intervalo de confiana de 95% para a mdia desta populao
ser:
[ X - z/2 ; X + z/2 ] = [50 - 1,96.10/10; 50 + 1,96.10/10] = [50 - 1,96; 50 + 1,96] =
n n
[48,04; 51,96], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conter
a mdia desta populao.
Obs.: O valor = z/2 denominado de erro padro da estimao. No confundir com o
n
valor que o erro padro da amostragem. O erro padro da estimao a semi-amplitude do in-
n
tervalo de confiana. A amplitude do intervalo de confiana (IC) ser; 2.
) desconhecido
(b) Desvio padro populacional (
Quando o desvio padro da populao () desconhecido necessrio utilizar sua estimativa
s. S que ao substituir-se o desvio padro populacional pelo sua estimativa no quociente:
( X - ) / no se ter mais uma normal padro. De fato, conforme demonstrado pelo es-
n
tatstico ingls W. S. Gosset, conhecido por Student o comportamento do quociente:
( X - ) / S segue uma distribuio simtrica em torno de zero, porm com uma variabili-
n
dade maior do que a da normal padro. A distribuio do quociente acima conhecida como distribui-
o t de Student.
Na realidade existem infinitas distribuies t, uma para cada tamanho de amostra. Estas
distribuies a exemplo da normal padro encontram-se tabeladas.
A tabela para a distribuio t segue uma metodologia um pouco diferente daquela da normal
padro. De fato, como existem muitas distribuies de Student no seria possvel tabel-las da mesma
forma que a da normal padro. Assim cada linha de uma tabela representa uma distribuio diferente e
cada coluna representa um valor de confiana que poder ser ou /2, isto , a tabela poder ser
unilateral ou bilateral. A linha de cada tabela fornece a distribuio t com parmetro n - 1 denomi-
nado de graus de liberdade, isto , o grau de liberdade = = n - 1 = linha da tabela.
Neste caso, o intervalo de confiana com probabilidade 1 - para a mdia ser:
[ X - t/2 S ; X + t/2 S ] onde:
n n
Exemplo:
Uma amostra de tamanho 25 foi retirada de uma populao com o objetivo de estimar a sua
mdia e forneceu os valores x = 50 e s = 10. Qual o intervalo de 95% de confiana para a mdia desta
populao?
Soluo:
Tem-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser
buscado na distribuio t com = n - 1 = 25 - 1 = 24. Esta a linha da tabela. A coluna poder ser o
valor = 5% ou ento o valor / 2 = 2,5%, dependendo do tipo de tabela. Em qualquer caso o que se
procura o valor t com grau de liberdade igual a 24, isto , o valor t24 tal que:
P(- t/2 < t24 < t/2) = 95%
Este valor vale 2,064. (Note-se que na a normal este mesmo valor valia 1,96). Ento o inter-
valo de confiana de 95% para a mdia desta populao ser:
[ X - t/2 S ; X + t/2 S ] = [50 - 2,064.10/5; 50 + 2,064.10/5] = [50 - 4,13; 50 + 4,13] =
n n
[45,87; 54,13], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conter a mdia
desta populao.
Convm notar que a ltima linha da tabela da distribuio t apresenta valores coincidentes
com aqueles que seriam obtidos se fosse utilizado a distribuio normal padro. Isto ocorre porque a
distribuio t tende a distribuio normal medida que o tamanho da amostra aumenta, isto , a dis-
tribuio normal o limite da distribuio t quando o tamanho da amostra tende ao infinito.
Esta aproximao j ser bastante boa para amostras de tamanho n > 30. Assim se a amostra
for superior a 30 pode-se utilizar a distribuio normal ao invs da distribuio t, isto , pode-se ler
os valores na normal padro, ou ento na ltima linha da tabela t.
sim necessrio utilizar, sua estimativa P , isto , necessrio substituir por P na expresso P =
(1 )
. Desta forma o intervalo acima ficar:
n
P(1 P) P(1 P)
[P- z/2 ; P + z/2 ], onde:
n n
z/2 o valor da distribuio normal padro cuja rea direita igual a /2. o valor de Z tal
que: P(Z > z/2) = /2, ou ento: (-z/2) = /2.
Exemplo 1:
Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua preferncia por deter-
minado produto. Destas 400 pessoas, 240 disseram preferir o produto. Determinar um intervalo de con-
fiana de 95% de probabilidade para o percentual de preferncia dos consumidores em geral para este
produto.
Soluo:
Tem-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser
buscado na normal padro valor z/2 de Z tal que:
P(Z > z/2) = 2,5%, ou ento: (-z/2) = 2,5%.
Este valor vale 1,96. A estimativa por ponto para a proporo populacional ser: p = f/n =
240/400 = 0,60 = 60%.
Ento o intervalo de confiana de 95% para a proporo populacional ser:
P(1 P) P(1 P) 0,60(1 0,60 ) 0,60(1 0,60 )
[P- z/2 ; P + z/2 ] = [0,60 - 1,96 .; 0,60 + 1,96 ]
n n 400 400
= [60% - 4,80% ; 60% + 4,80%] = [55,20%; 64,80%], ou seja, pode-se afirmar com uma certeza de
95% de que este intervalo conter a proporo populacional, isto , a verdadeira percentagem dos con-
sumidores que preferem o produto pesquisado.
Exemplo 2:
Numa pesquisa de mercado para estudar a preferncia da populao de uma cidade em relao
ao consumo de um determinado produto, colheu-se uma amostra aleatria de 300 consumidores da ci-
dade e observou-se que 180 consumiam o produto. Determinar um IC de 99% para a proporo popu-
lacional de consumidores do produto.
Soluo:
Tem-se 1 - = 99%, ento = 1% e / 2 = 0,5%. O coeficiente de confiana que deve ser
buscado na normal padro valor z/2 de Z tal que:
P(Z > z/2) = 0,5%, ou ento: (-z/2) = 0,5%.
Este valor vale 2,575. A estimativa por ponto para a proporo populacional ser: p = f/n =
180/300 = 0,60 = 60%.
2)
2.3.3. Da varincia populacional (
Sabe-se que o estimador no-tendencioso de 2 S2 e que E(S2) = 2, enquanto
V (S2) = 22/(n -1). No entanto, para se construir um intervalo de confiana para 2 necessrio, ainda
conhecer qual o comportamento de S2 , isto , qual o modelo terico (probabilstico) seguido pelo
estimador. Assim antes de se construir um intervalo de confiana para a varincia populacional ne-
cessrio se conhecer um novo modelo probabilstico denominado de qui-quadrado e representado por
2 (c grego).
A distribuio qui-quadrado
A distribuio ou modelo qui-quadrado pode ser obtida de uma soma de variveis normais
n
padronizadas, isto , 2n = Zi2 .
i =1
0,8
0,6
0,4
0,2
0
0,0
0,7
1,4
2,1
2,8
3,5
4,2
4,9
5,6
6,3
7,0
7,7
8,4
9,1
9,8
(n 1) S2
2n 1 = , isto , a varincia segue uma distribuio 2 com "n - 1" graus de liberdade a
2
O intervalo
Suponha que seja fixado um nvel de confiana de 1 - e que 12 e 22 sejam dois valores
da distribuio 2 tais que P( 12 < 2 < 22 ) = 1 - .
P( 12 < 2 < 22 ) = 1 -
(n 1) S2
P( 12 < < 22 ) = 1 -
2
P(
1
< 2 1
< 2)=1-
22 (n 1) S2
1
(n 1) S2 (n 1) S2
P( < 2 < )=1-
22 12
Assim o intervalo de confiana (probabilidade) de 1 - para a varincia da populao
dado por:
(n 1) S2 (n 1) S2
;
2 12
2
)
2.3.4. Do desvio padro populacional (
Para determinar um intervalo de confiana de "1 - " de probabilidade para o desvio padro
populacional basta apenas tomar a raiz quadrada positiva dos termos do intervalo para a varincia po-
pulacional. Assim o intervalo ser:
(n 1) S2 (n 1) S2
;
22 12
(n 1) S2 (n 1) S2
P << = 1 .
22 12
Exemplo:
Uma amostra extrada de uma populao normal forneceu uma varincia de s2 = 8,38. Deter-
minar um intervalo de confiana de 90% para a varincia da populao e um intervalo de mesma con-
fiabilidade para o desvio padro da populao.
Soluo.
Neste caso necessrio inicialmente determinar os valores da distribuio 2, de modo, que
12 tenha uma rea (probabilidade) direita igual a 95% e 22 tenha uma rea (probabilidade) direita
igual a 5%. Estes valores so: 12 = 3,940 e 22 = 18,307.
4,58; 21,27; ]
[2,14; 4,61].
3. EXERCCIOS
(01) De uma populao com N = 12 elementos retirada uma amostra aleatria simples, sem re-
posio, de n = 5.
(01.1) Quantas so as possveis amostras?
(01.2) Qual a probabilidade de cada uma destas amostras ser selecionada?
(02) Uma populao composta dos elementos: A, B, C, D e F.
(02.1) Liste todas as possveis amostras aleatrias simples, sem reposio, com n = 2.
(02.2) Liste todas as aas, sem reposio, de tamanho n = 3.
(02.3) Determine a probabilidade de ser sorteada a amostra BC.
(02.4) Determine a probabilidade de ser sorteada a amostra ACD.
(03) A tabela, ao lado, a distribuio de freqncias de uma amostra
proveniente de determinada populao. X f
1 40
(03.1) Determine o tamanho da amostra.
2 45
(03.2) Determine uma estimativa da mdia da populao.
3 8
(03.3) Determine uma estimativa da varincia da populao.
4 7
(03.4) Determine uma estimativa da proporo de valores pares na
populao.
(d) Utilize a correo de populao finita para as varincias obtidas em (c) obtendo a distri-
buio amostral da varincia corrigida e determine sua expectncia.
(5.4) (a) Construa a distribuio amostral para o estimador da proporo de elementos menores
que 8 utilizando aas, sem reposio, de tamanho n = 2.
(b) Determine a expectncia e a varincia da distribuio em (a).
(c) Construa a distribuio amostral para o estimador da proporo de elementos menores
que 8 utilizando aas, sem reposio, de tamanho n = 3.
(d) Determine a expectncia e a varincia da distribuio em (c).
(06) Utilize os valores da amostra tabelada ao lado, extrada aleatoriamente e
X f
sem reposio, de uma populao com N = 2000 elementos, para estimar:
0 |-- 2 27
(06.1) A mdia da populao. 2 |-- 4 51
(06.2) A varincia da populao. 4 |-- 6 49
(06.3) O percentual de elementos menores que 6. 6 |-- 8 48
(06.4) O erro amostral da mdia. 8 |-- 10 25
(07) De uma populao com N = 4000 pessoas de uma regio foi obtida uma
amostra aleatria, sem reposio, de 400 pessoas que revelou 60 analfabetos. Estime:
(07.1) A proporo de analfabetos da regio.
(07.2) O erro amostral do estimador proporo.
(08) Uma aas de tamanho 900 extrada de uma populao bastante grande apresentou 40% de pessoas
do sexo masculino. Estime o erro amostral do estimador proporo de pessoas do sexo masculino.
(09) Uma populao tem mdia 500 e desvio padro 30.
(09.1) Determinar a probabilidade que uma aas de 100 elementos apresentar um valor mdio supe-
rior a 504,50.
(09.2) Calcule a probabilidade de que uma aas com n = 64 valores apresentar mdia entre 492,5 e
507,5.
(09.3) Se uma aas de n = 144 for extrada desta populao, qual o percentual de mdias amostrais
que estaro entre 495,5 e 504,5?
(10) Uma populao normalmente distribuda com mdia 800 e desvio padro 60.
(10.1) Determine a probabilidade de que uma aas de tamanho 9 apresentar mdia menor que 780.
(10.2) Calcule a probabilidade de que uma aas de tamanho n = 16 tenha mdia entre os valores
781,4 e 818,6.
(10.3) Que percentual de mdias amostrais de uma amostra de tamanho n = 25 estaro no intervalo
[776; 824]?
(11) A proporo de eleitores de um candidato 20%.
(11.1) Qual a probabilidade de uma amostra aleatria simples de 100 eleitores apresentar uma pro-
poro amostral superior a 26%?
(11.2) Qual a probabilidade de uma amostra aleatria simples de 400 eleitores apresentar uma pro-
poro de eleitores do candidato entre 17% e 23%?
(11.3) Se a amostra aleatria for de 625 eleitores, qual a percentual de valores do estimador pro-
poro amostral que estaro no intervalo [0,16864; 0,23136]?
(12) Admitindo que a probabilidade nascer um menino ou uma menina seja iguais, determine a proba-
bilidade de que das prximas 400 crianas a nascerem:
5. REFERNCIAS
[BUS86] BUSSAB, Wilton O, MORETTIN, Pedro A. Estatstica Bsica. 3. ed. So Paulo, Atual,
1986.
[HOF80] HOFFMAN, Rodolfo. Estatstica para Economistas. So Paulo. Livraria Pioneira Editora,
1980.
[NET74] NETO, Pedro Luiz de Oliveira Costa. Estatstica. So Paulo, Edgard Blcher, 1977.
[NET74] NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades: resumos te-
ricos, exerccios resolvidos, exerccios propostos. So Paulo, Edgard Blcher, 1974.
[MAS90] MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And Econo-
mics. IRWIN, Boston, 1990.
[MEY78] MEYER, Paul L. Probabilidade: aplicaes Estatstica. Traduo do Prof. Ruy C. B.
Loureno Filho. Rio de Janeiro, Livros Tcnicos e Cientficos Editora S.A., 1978
[STE81] STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo. Editora Harbra,
1981.
[WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatstica. Rio de
Janeiro. Livros Tcnicos e Cientficos Editora S. A., 1985.