Professional Documents
Culture Documents
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Estimação de Parâmetros
Objetivos
Ao final deste módulo o aluno será capaz de entender o significado do termo
“estimação”, diferenciar estimativas intervalares das pontuais, construir in-
tervalos de confiança utilizando dados amostrais, explicar como o tamanho da
amostra, a dispersão amostral e o nível de confiança afetam o a construção do
intervalo de confiança, calcular o tamanho de uma amostra para ser utilizada
no processo de estimação.
1. Estimação de parâmetros
Esquematicamente:
Vocês devem estar lembrados que no módulo I estudamos que a inferência es-
tatística tem por objetivo fazer generalizações sobre uma população, com base em
valores obtidos de amostras representativas dessa população. A inferência pode ser
feita estimando os parâmetros por ponto ou por intervalo.
A estimação por ponto é um valor (ou ponto) único usado para avaliar um pa-
râmetro populacional. Assim, uma média amostral é usada como estimativa de uma
média populacional; um desvio padrão amostral serve de estimativa do desvio padrão
da população; e a proporção de itens numa amostra, com determinada característica,
serve para estimar a proporção da população que apresenta aquela característica.
Em todas essas situações se obtém um único valor para a estimativa do parâmetro
e por isso são chamadas de estimativas pontuais.
A estimação por intervalo estabelece um intervalo de valores que tem uma dada
probabilidade de conter o verdadeiro valor do parâmetro populacional desconhecido.
A esse intervalo, de confiança, está associado um grau de confiança, que é uma
medida da certeza de que o intervalo estabelecido contém o parâmetro populacional.
Exemplo: A altura média de uma amostra de 500 universitários, cujo valor foi igual
a i = 1,68m, é uma estimativa pontual da verdadeira média da altura da população
de universitários considerada. Para cada amostra retirada da população, podemos
obter diferentes estimativas para a média µ da população. Seria mais interessante
obtermos, a partir, de uma determinada amostra, um intervalo que apresente uma
probabilidade conhecida de conter o verdadeiro parâmetro populacional, ou seja,
obter uma estimativa por intervalo para o parâmetro em questão, como por exemplo,
P(1,60 < µ < 1,76) = 0,95.
É possível perceber que na estimação por ponto não temos como obter uma
idéia do erro cometido ao se fazer à estimativa do parâmetro. Para que se possa
associar uma confiança (probabilidade) a uma estimativa é necessário construir
um intervalo em torno da estimativa pontual conforme vimos no exemplo P(-1,96<
<1,96)=0,95. De uma maneira geral:
96
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Esquematicamente:
Onde
I: limite inferior do intervalo;
S: limite superior do intervalo;
: parâmetro que queremos estimar;
1 – : nível de confiança.
estiverem sendo comparados iremos preferir aquele que tenha o menor comprimen-
to esperado , ou o menor erro de estimativa e. O comprimento do intervalo é dado
por L = I - S e o erro = - = L / 2. Lembrando que,
Esquematicamente teríamos:
99
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Observe que a área total sob a curva normal é unitária. Se a área central é 1- ,
a notação representa o valor de Z, que deixa a sua esquerda a área /2, e a
notação representa o valor de Z, que deixa a sua direita a área /2.
Desta forma,
Observação
Os níveis de confiança mais usados são:
Exemplo:
Solução:
Como o desvio padrão da população é conhecido e a variável de interesse (
: a altura dos alunos desta faculdade) se distribui normalmente, e levando-se em
consideração que o tamanho da amostra n = 81 é pequeno em relação à população
de alunos de nossa faculdade poderemos tranquilamente supor que a população é
infinita isto é n/N 0,05, portanto, vamos ignorar o uso do fator de correção para
população finita. A expressão para o cálculo do intervalo é dada por:
101
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Solução:
n = 100 =5 = 500 1- = 0,95 = 95% N = 1.000
102
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Para grandes amostras, podemos admitir que a variação dos valores observados
na amostra, seja semelhante a variação da população. Porém, para pequenas amostras
isso pode não ser verdadeiro. Neste caso, a distribuição adequada é a distribuição
t-Student.
Observamos que para cada valor dos graus de liberdade temos uma curva dife-
rente, ou seja uma família de curvas distintas.
Quando o tamanho da amostra “n” tende para infinito, a distribuição t tende para
a distribuição normal. Na prática, a aproximação é considerada boa quando n>30.
Deste modo, podemos utilizar à estatística “z” no lugar da “t”.
Prezado aluno, vamos agora para a planilha do Excel comparar as duas estáticas
“z” e “t”. No local reservado para os graus de liberdade g.l. vamos colocar os valo-
res 3, e apertamos a tecla enter, observe o comportamento das duas curvas, depois
coloque o 6, 18, 25, 30 e 35. 103
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Após ter observado o comportamento das duas curvas o que você concluiu?
Exemplo:
Solução:
X: representa o número de falhas em cada peça.
104 O nível de significância de 10% corresponde a probabilidade de erro “ ”, isto é, a
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
temos:
Logo,
a)
b) Então,
105
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Solução:
Como se vê, a amostra é pequena (n=10) e o indicado é usar a distribuição de
t de Student. O objetivo é estimar o parâmetro µ = média da redução percentual
de acidentes de trabalho, devido ao programa preventivo, em todas as empresas da
construção civil da região. O intervalo de confiança é dado por:
Solução:
N= 200 (tamanho da População)
n = 15 (tamanho da amostra)
= 1,03 (média amostral)
S = 0,06 (desvio-padrão amostral)
1 - = 95%
106
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Onde:
P é a estimativa por ponto da proporção populacional .
valor crítico (representa o valor de Z, que deixa a sua direita a área /2,
e- representa o valor de Z, que deixa a sua esquerda a área /2);
Exemplo:
1) Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua
preferência por determinado produto. Destas 400 pessoas, 240 disseram preferir
o produto. Determinar um intervalo de confiança de 95% de probabilidade para o
percentual de preferência dos consumidores em geral para este produto.
Solução:
n = 400
x = 240 (elementos que apresentam a característica de interesse, isso é, pre-
ferem o produto)
(estimativa por ponto para a proporção populacional), ou seja, 60% dos entre-
vistados disseram preferir o produto.
n = 400
1- = 95%=0,95
1- = 95% ( /2 = 0,025)
Conclusão:
Podemos afirmar com uma certeza de 95% de que este intervalo [55,20%;64,80%]
conterá a proporção populacional, isto é, a verdadeira percentagem dos consumidores
que preferem o produto pesquisado.
Solução:
108
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
40% é a proporção dos funcionários que não mantêm convênio com nenhuma
empresa particular de assistência médica.
Isso significa que 0,60 é a proporção, na amostra, dos funcionários que mantém
convênio com alguma empresa particular de assistência médica (característica de
interesse). Então, P = 0,60.
Conclusão:
Podemos afirmar, com 90% de confiança, que a proporção dos funcionários desta
empresa que mantêm convênio com empresas particulares de assistência médica
está entre 53,765% e 66,24%.
Assim:
Uso da tabela
Na tabela tem-se;
Exemplo:
110 Solução:
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Logo,
a)
Temos que:
111
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Conclusão:
Podemos afirmar que o intervalo [1,091; 16,867] contém a variância populacio-
nal com 95% de confiança, e que, o intervalo [1,044; 4,107] contém o desvio padrão
populacional com 90% de confiança.
Solução:
n = 11
= n-1= g.l. 10
1 – = 0,90
/2 = 0,05
S2 = 8,38
=?
=?
Na tabela temos:
Conclusão:
Prezado aluno, com base no exemplo anterior como você concluiria ou interpretaria
esses intervalos? Faça isso em uma folha de rascunho.
Assim 1
e 2
possui uma distribuição normal ,
e a variável padronizada é
a)Variâncias conhecidas
b) Variâncias desconhecidas
• Populações Homocedásticas
Sendo as populações homocedásticas , assim , são duas
estimativas para um mesmo parâmetro ( 2) então o intervalo de confiança para a
diferença e soma entre duas médias é dado por:
Com t /2
, tendo; = n1 + n2 – 2 graus de liberdade. Em que,
• Populações Heterocedásticas
Sendo as populações homocedásticas , assim , são estimativas
de diferentes parâmetros, não podendo, pois serem combinadas em um único valor.
Então o intervalo de confiança para a diferença e soma entre duas médias é dado por:
114
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Com t /2
, tendo, graus de liberdade dado por,
Exemplo:
1) As empresas A e B produzem tubos para esgoto com as variâncias em seus
diâmetros iguais a 8mm2 e 10mm2, respectivamente. Uma amostra de 48 tubos da
empresa A apresentou diâmetro médio igual a 40mm, e uma amostra de 36 tubos da
empresa B apresentou diâmetro médio de 42mm. Verifique, por meio de um intervalo
de confiança com 0,95 de probabilidade, se existe diferença entre os diâmetros médios
dos tubos das marcas A e B.
Solução:
Conclusão:
Pode-se afirmar com 95% de confiança que a verdadeira diferença entre os
diâmetros médios dos tubos produzidos pelas empresas A e B está entre -3,2973
e -0,7027 mm. Como esse intervalo não compreende o valor 0 (zero) tem-se 95%
de confiança em afirmar que os diâmetros médios dos tubos produzidos por estas
empresas não são iguais.
Solução:
Variâncias populacionais são desconhecidas mas supostamente iguais.
Conclusão:
A folga de montagem provavelmente encontra-se entre 0,00986 e 0,026 a um
nível de confiança de 99%.
116
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
onde,
118
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Exemplo:
1) Que tamanho de amostra será necessário para produzir um intervalo de con-
fiança de 90% para a verdadeira média populacional com e = 1,0 se o desvio padrão
da população é 10,0?
Solução:
Solução:
N = 400
n = 80
x = 30
P = x/n = 30/80 = 0,375
Resumo:
Nesse módulo apresentamos os métodos de estimação para construção de inter-
valos de confiança para a média, proporção, variância e desvio-padrão da população
de interesse, além da diferença e soma de duas populações independentes. O pro-
pósito de desenvolver um intervalo de confiança é fornecer um melhor entendimento
da margem de erro que pode estar presente no processo de estimação. Um intervalo
de confiança amplo indica pouca precisão; em tais casos o tamanho da amostra
pode ser aumentado para reduzir a amplitude do intervalo de confiança e melhorar
a precisão da estimativa.
EXERCÍCIOS DE FIXAÇÃO
Obs: As fórmulas colocadas abaixo servem para auxiliá-los na resolução das
questões propostas.
1 - Uma amostra aleatória de 500 eleitores de um município mostrou que 120 deles
apoiavam determinado candidato a prefeito. Estimar, no nível de 90%, o percentual
de eleitores que apóiam esse candidato.
onde:
P: razão da proporção favorável pelo tamanho da amostra (n).
2 - Uma máquina enche pacotes de café com um desvio padrão de 10g. Ela
estava regulada para enchê-los com 500 g, em média. Agora ela se desregulou, e
queremos saber qual a nova média µ. Uma amostra de 25 pacotes apresentou uma
média igual a 485 g. Construir um intervalo de 95% de confiança para µ. Considerar
que a população é normalmente distribuída.
Quando a variância ( 2
) é conhecida e a população é infinita:
120
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Com t /2
, tendo; υ = n1 + n2 – 2 graus de liberdade. Em que,
s s
a) Quando a população é infinita P x − t α , v ≤ µ ≤ x + tα , v = 1−α
n n
2 2
s s
b) Quando a população é finita P x − t α , v ≤ µ ≤ x + t α , v = 1−α
n n
2 2
6 - Uma amostra que contém 20 unidades de um produto cujo peso é normalmente
distribuído, apresentou peso médio de 1 kg com desvio padrão de 5g. O produto é
embalado em caixas de papelão, cujo peso é normalmente distribuído, e uma mesma
amostra contendo 20 destas caixas apresentou peso médio de 120g com desvio de
3g. Determine um intervalo de 95% de confiança para o peso médio da caixa cheia.
Supor variâncias populacionais diferentes .
s s
P x − tα , v ≤ µ ≤ x + tα , v = 1−α
n n
2 2
Com t /2
, tendo, υ graus de liberdade dado por,
2
S12 S 22
+
n n
υ=
1 2
2 2
S12 S 22
n n
1 + 1
n1 − 1 n2 − 1
7 - A renda per-capita domiciliar numa certa região tem distribuição normal com
desvio padrão = 250 reais e média µ desconhecida. Se desejamos estimar a ren-
da média µ com erro = 50 reais e com uma confiança = 95%, quantos
2
domicílios devemos consultar? S12 S 22
+
n n
υ=
1 2
2 2
S12 S 22
n n
1 + 1
n1 − 1 n2 − 1
10 - Uma pesquisa recente efetuada com 300 habitantes de uma grande cidade
revelou que 128 consideravam a segurança o principal problema da cidade. Determine
um intervalo de confiança de 95% para a proporção dos habitantes desta cidade que
consideram a segurança o principal problema.
123
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
1. Introdução
Exemplos:
2. Conceitos Básicos
Hipótese Nula – Supõe-se que a alegação de igualdade seja aceita como ver-
dadeira para a população apresentando-se bastante específica a respeito do valor
do parâmetro. Configura-se como a hipótese da igualdade e é representada por Ho
(lê-se h zero).
Exemplos:
Configura-se como o valor que separa a região de não rejeição da região de rejeição.
A determinação desse valor crítico depende do tamanho da região de rejeição que está
diretamente relacionado com os riscos envolvidos em se utilizarem somente evidencias
da amostra para tomar decisões sobre um parâmetro da população.
Neste tipo de teste as caudas em uma distribuição são as regiões extremas de-
limitadas por valores críticos. A região crítica (Região de Rejeição) está situada nas
duas regiões extremas (caudas) sob a curva.
O nível de significância (alfa) é dividido igualmente entre as duas caudas que
constituem a região crítica. Exemplo, um teste bilateral, com nível de significância de
5% há uma área de 0,025 em cada uma das duas caudas.
125
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Exemplo:
- Fabricação de roupas camisas muito pequenas ou muito grandes
fogem ao padrão.
- Peças que devem se ajustar uma à outra porca e parafuso.
Avaliam situações do tipo “este item é melhor ou pior que aquele outro”. A região
de rejeição se localiza em uma única extremidade da curva de distribuição.
Exemplos:
- Vida útil mínima de determinados veículos garantidos pelo seu fabricante.
- Mínimo de pontos mínimos necessários para ser aprovado em um exame
qualquer.
- Quantidade mínima de combustível necessária para que haja o bom fun-
cionamento do veículo.
Região crítica localizada na região extrema direita sob a curva. Possuem o propó-
sito de analisar se os dados amostrais sustentam a hipótese da estimativa ser igual
ser igual ou menior que um parâmetro alegado.
126
ANÁLISE ESTATÍSTICA
Unidade 4
Conceitos Elementares e Metodologia dos Testes de Hipóteses
Exemplos:
- Validade e produtos perecíveis – o produto não deve ser utilizado após o
prazo limite estipulado pelo fabricante.
- Quantidade máxima de CO2 expelida por um veículo.
- Quantidade máxima de agrotóxica encontrada em determinados produtos
agrícolas.
O pesquisador pergunta:
“ Será que a droga A cura tanto quanto a droga B”?
- Se o tamanho da amostra for maior ou igual que 30, deve-se usar a tabela
da Distribuição Normal, ou tabela “Z”. Se o desvio populacional ( ) for
conhecido, este será empregado nos cálculos de estatísticas-teste;
Exemplo 1:
Hoje à noite você vai a uma festa. A previsão do tempo diz que há 80% de pos-
sibilidade de chuva. Você leva um guarda-chuva?
Exemplo 2:
Floresta Plantada ou Floresta Nativa ?
A situação:
No final do século passado, Manuel Gomes Acher foi incumbido por D. Pedro II
de reflorestar as encostas dos morros na região na Tijuca (Rio de Janeiro). As repe-
tidas secas que a cidade do Rio de Janeiro vinha sofrendo com a conseqüente falta
de água era atribuída ao desmatamento dos morros. Acher cumpriu sua missão com
bastante eficiência e um visitante passeando hoje pelo Parque Nacional da Tijuca
terá dificuldade em saber se a floresta que observa é nativa ou foi plantada pelo
“major” Acher.
Hipóteses
A partir de mapas o pesquisador selecionou certa área. Quais os erros que po-
dem ocorrer:
EXERCICIOS
1) A matéria-prima para fabricação das fitas para vídeo-cassete Sony, vem com
garantia de não mais que 5% de defeitos. Seja qual for à alegação do fornecedor, a
qualidade dos itens em estoque é constantemente avaliado pelo Controle Estatístico
de Processo (CEP). Quais as hipóteses (nula e alternativa) a analisar, tendo em conta
o índice de defeitos alegados pelo produtor?
3) Segundo a Roda Bem, seus pneus duram menos de 45.700 km. Estabeleça
Ho e H1.
131
ANÁLISE ESTATÍSTICA
Unidade 4
Teste de Hipóteses para Médias e Proporções e Análise da Variância
1. Introdução
Em termos gerais, uma hipótese é uma conjectura sobre algum fenômeno ou con-
junto de fatos. Em estatística inferencial o termo hipótese tem um significado bastante
específico. É uma conjectura sobre uma ou mais parâmetros populacionais. O teste
de hipóteses paramétrico envolve fazer inferências sobre a natureza da população
com base nas observações de uma amostra extraída desta população.
Critério de decisão:
Exemplo:
1) Um construtor supõe que a qualidade dos tijolos que utiliza em suas obras
está apresentando variações. Em face da experiência anterior sabe-se que a resis-
tência ao rompimento de tais tijolos é de 200 kg com um desvio padrão de 20 kg .
numa amostra de 100 tijolos apurou-se que a resistência ao rompimento alcançou um
total de 19.600 kg . fixado o nível de significância de 0,05, verifique se a qualidade
dos tijolos está apresentando variações.
134
ANÁLISE ESTATÍSTICA
Unidade 4
Teste de Hipóteses para Médias e Proporções e Análise da Variância
Então : x = 20 / =2
n = 100
x = 100;
= 20 – população
Z = (196 – 200) / 2 = -2
Exemplo 2:
Uma grande revista de negócios brasileira afirmou que o faturamento médio das
indústrias da região sul do país seria igual a R$ 820.000,00. Sabe-se que o desvio-
padrão do faturamento de todas as empresas da região é igual a R$ 120.000,00.
Um pesquisador independente analisou os dados de uma amostra formada por 19
empresas, encontrando um faturamento médio igual a 780.000,00. Assumindo nível
de significância (alfa) igual a 8%, seria possível concordar com a alegação?
Passo A: Ho : µ = 820.00
H1: µ 820.00
Passo B: Tabela : Z
Razão: desvio padrão populacional conhecido
135
ANÁLISE ESTATÍSTICA
Unidade 4
Teste de Hipóteses para Médias e Proporções e Análise da Variância
O valor de Zteste está na área de aceitação do gráfico, então é possível supor que
a alegação feita pela revista seja verdadeira.
Exemplo 3:
Um gerente de operações desconfia que o tempo médio de conclusão de produ-
ção de um tipo de peça está acima da meta de 3 minutos. Uma amostra de 28 peças
indicou o tempo de conclusão médio de 3,3 com desvio padrão de 1 (um) minuto.
Conclua a respeito com = 0,05.
Passo A: Ho : µ = 3 min.
H1 : µ > 3 min.
Passo B: Tabela : t
Razão : desvio padrão populacional desconhecido
n < 30
Exemplos:
- Com base em uma pesquisa amostral, menos de ¼ de todos os alunos da Fa-
nese fuma.
Então o teste de uma amostra para proporção difere do teste de amostra para
media apenas no que diz respeito aos dados amostrais. Estes são expressos em
termos de contagem, ao invés de medidas.
2.2.1. Propriedades
Exemplo 1:
A analise de uma amostra de 600 leitoras da revista Magazine revelou que 62%
não lêem a seção de cartas. Poderia esta amostra ter sido retirada de uma população
que tivesse 60% de não leitores desta seção? Use = 5%.
Exemplo 2:
138 Cerca de 2000 formulários de pedidos de compra estão sendo analisados. Os
ANÁLISE ESTATÍSTICA
Unidade 4
Teste de Hipóteses para Médias e Proporções e Análise da Variância
clientes podem ficar insatisfeitos se houver erro nos formulários. Neste caso admite-se
que a proporção máxima de formulários com erros seja de 5%. Suponha que dentre
os 2000 formulários 7% apresentavam erros. A proporção máxima foi ultrapassada
a 1% de significância?
1ª Passo:
Ho : = 5 % onde 0
= 5% (valor de teste)
H1 : > 5 %
Rejeita-se Ho. Neste caso o valor de Zteste está na área de rejeição, então há
provas estatísticas suficientes de que a proporção está acima do máximo admitido.
a) Tamanho da amostra (n) : Será igual à soma dos tamanhos das duas amostras
( n = n1 + n2 ).
b) Definição de Ho e H1
• Ho sempre apresentará igualdade das médias ou Ho: µ1 = µ2
• H1 sempre oferecerá uma alternativa ou: H1 : µ1 µ2 ou µ1 < µ2 ou
µ1 > µ2
Observação:
Para usar a tabela t em testes com duas amostras, o número de graus de liber-
dade sera sempre igual a (n1 + n2) -2
Exemplo 1:
A indústria de Chocolates Delícia afirmava que seus chocolates são os mais ven-
didos no canal de distribuição Supermercados, quando comparados com as vendas
do rival, Chocolates Saborosos. Uma amostra formada por 14 lojas revelou os dados
apresentados na tabela seguinte. É possível aceitar a hipótese que ambas vendem a
mesma quantidade de chocolate? O nível de confiança é igual a 95%.
H1 : µD > µS
Estatística teste:
141
ANÁLISE ESTATÍSTICA
Unidade 4
Teste de Hipóteses para Médias e Proporções e Análise da Variância
b) Definição de Ho e H1:
Exemplo:
A fábrica de televisores Tela Grande constatou que a proporção de televisores
fabricados com defeito era de 35 em cada amostra de 10.000 televisores fabricados
com defeito era 35 em cada amostra de 10000 televisores fabricados. Sua concor-
142 rente a fábrica Tela Pequena, constatou 50 unidades com defeito em uma amostra
ANÁLISE ESTATÍSTICA
Unidade 4
Teste de Hipóteses para Médias e Proporções e Análise da Variância
Passo E: Como o valor de Zteste (-0,8333) foi superior ao valor de Zcrítico (-1,65),
aceita-se a hipótese nula de igualdade das proporções. Não é possível concordar com
a alegação de que a proporção de defeitos da Tela Grande seja inferior.
Mais uma vez no passo C, o cálculo da estatística de teste deve ser alterado.
Deve-se aplicar a fórmula seguinte:
143
ANÁLISE ESTATÍSTICA
Unidade 4
Teste de Hipóteses para Médias e Proporções e Análise da Variância
Exemplo:
Uma lei extremamente polêmica está em tramitação na Assembléia Legislativa
de Santa Catarina. Parece que homens e mulheres apresentam opiniões divergen-
tes. Para avaliar se os dois grupos apresentam proporções de favoráveis diferentes,
realizou-se uma pesquisa , em que foi entrevistada uma amostra de 200 homens
e uma amostra de 300 mulheres em todo o estado. Na amostra de homens 50%
declararam-se favoráveis à lei, enquanto que na amostra de mulheres houve 47% de
favoráveis. Usando 5% de significância, há diferença entre as proporções populacio-
nais de favoráveis nos dois grupos?
Passo B: Identificar a Tabela : Em proporções as amostras são sempre grandes,
então vamos trabalhar com a tabela Z.
Aceitar Ho. Não há provas estatísticas suficientes que indiquem diferenças nas
proporções de favoráveis nas proporções de homens e mulheres.
144
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
1. Introdução
O uso do termo regressão deve-se a Francis Galton,, por volta de 1885, quando
investigava relações entre características antropométricas de sucessivas gerações.
Uma de suas constatações era de “cada peculiaridade de um homem é transmitida
aos seus descendentes, mas, em média, numa imensidade menor”. Por exemplo:
embora pais com baixa estatura tendam a ter filhos também com baixa estatura,
estes têm altura média maior que a altura de seus pais .Em seus estudos Galton
chega a conclusão que se as características permanecessem as mesmas de geração
para geração , esperar-se-ia que a reta de regressão tivesse seu coeficiente angular
próximo de 1. A este fenômeno da altura de os filhos moverem-se em direção da
altura média de todos os homens, ele chamou de regressão, e às vezes de reversão,
tendo aparecido num artigo de 1885, no Journal of the Anthropological Institute, com
o título “Regression Towards Mediocryty in Hereditary Stature” Regressão para a
Mediocridade das Estaturas Hereditárias, mediocridade aqui referindo-se a médio.
2. Regressão Linear
y = a + b.x
O modelo linear pode ser utilizado para estimar valores de uma variável com base
em em valores estipulados para a outra variável, dentro dos limites da amplitude dos
valores da amostra , como também para predizer valores de uma variável, com base
no conhecimento de quais serão os valores da outra variável, fora dos limites dos
valores da amostra. O modelo linear obtido consiste em uma estimativa da reta de
ajuste para as duas populações.
Exemplo
1) Ajuste uma reta de mínimos quadrados aos dados da tabela abaixo que repre-
sentam um número de anos que certos candidatos ao serviço diplomático estudaram
alemão no curso secundário ou faculdade, e as notas por eles obtidas em um teste
de profeciência naquele idioma.
147
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
Solução
Com base nos valores obtidos para a e b , é possível determinar que a reta que
melhor se ajusta aos pontos é do tipo : y = 31,55 + 10,90 x. A reta de ajuste pode
ser vista no diagrama de dispersão apresentado a seguir.
3. Análise de Correlação
O grau de relação numérica entre duas variáveis contínuas é feito por um coefi-
ciente correlação linear simples denominado “r de Pearson”.
Então:
r = coeficiente de correlação linear simples para a amostra ;
= coeficiente de correlação linear simples para a população.
149
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
Correlação Negativa
150
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
Correlação Nula
4. Coeficiente de Determinação r2
152
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
Algebricamente:
O modelo obtido pode ser representado através de uma equação linear simples,
do tipo:
Y* = a* + bX*
Onde:
Y* = LN (Y)
a* = LN (a)
X* = LN(X)
153
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
154
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
e finalmente :
= 62,71 + 3,86 x
Exemplo: Vejamos agora uma situação onde existe um número par de períodos.
Vamos usar o mesmo exemplo anterior, porém com mais uma ano de observação,
ou seja
O período central agora seria algo entre 1975 e 1976; este seria o valor para
x=0. Uma codificação adequada é aquela indicada no quadro abaixo.
155
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
O valor 2,05 agora está indicando o quanto cresce em média o escritório em meio
ano, ou seja, cresce 4,1 empregados por ano. Já o escritório teve 65 empregados em
média no período médio entre 1975 e 1976. Por exemplo, se estes dados referem-se
a dezembro do ano em questão, o valor de 65 irá corresponder ao mês hipotético que
vai de 15.06.76 a 14.07.76.
Do exposto até aqui, para estes casos os estimadores serão dados por.
EXERCICIOS RESOLVIDOS
1) Os dados abaixo correspondem às variáveis número de comerciais e volume
de vendas, representadas em R$ mil.
156
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
Equação de Regressão
Então :
y = 36,15 + 4,95 x
Coeficiente de Correlação
157
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
158
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
Correlação
EXERCICIOS PROPOSTOS
1) Use os dados abaixo para estimar as equações de regressão:
159
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
160
ANÁLISE ESTATÍSTICA
Unidade 4
Análise de Regressão e Correlação
RESPOSTAS
1)
a) y = -5 + 2x; b) y = 0,028 + 5x; c) y = -30,5 + 0,95 x; d) y = 4,77 + 0,49x
2)
y = -12,0 + 1,32 x
3)
y =-60,462 + 3,3077 x ; r2=0,9059
4)
a) a = 142,5 e b = 0,043
c) y = 179.700
5)
a) Y = 20,5716 + 0,4582 X;
b) r = 0,982649303, r2 = 0,965599652; c) o percentual igual a r2;
d) Erro Padrão = 2,2765;
e) para vendas iguais a $300, custos iguais a $158,0175. Para vendas iguais a
$650,00 custos iguais a $318,3710;
f) para custos iguais a $220,00 vendas iguais a $246,0242.
161