Professional Documents
Culture Documents
e
Probabilidade
Professores:
Daniela Carine Ramires de Oliveira
Marcos Santos de Oliveira
Índice
1. Introdução à Estatística 1
2. Variáveis 3
3. Amostragem 6
4. Tabulação de Variáveis 11
5. Medidas de Posição 15
6.1. Motivação 19
6.2. Amplitude 19
6.3. Variância e Desvio Padrão 19
6.4. Intervalo Interquartil 21
6.5. Exercícios 21
7. Estatística Gráfica 22
8. Correlação e Regressão 32
Lista de Exercícios 1 41
9. Probabilidade 44
10.1. Introdução 56
10.2. Esperança Matemática (Média) 57
10.3. Variância 58
10.4. Exercício 58
10.5. Modelo Bernoulli 58
10.6. Modelo Binomial 59
10.7. Exercícios 60
10.8. Distribuição Hipergeométrica 60
10.9 Exercício 61
10.10. Distribuição Poisson 61
10.11. Exercícios 62
Lista de Exercícios 2 74
12. Estimação 77
13.1. Introdução 84
13.2. Formulação das Hipóteses 84
13.3. Tipos de Erros possíveis nos Testes de Hipóteses 84
13.4. Nível de Significância de um Teste de Hipótese (α) 85
13.5. Teste de Hipóteses para a Proporção 85
13.6. Exercícios 87
13.7. Teste de Hipóteses para Média com Variância Conhecida 88
13.8 Exercícios 90
13.9 Teste de Hipóteses para Média com Variância Desconhecida 91
13.10. Exercícios 93
Lista de Exercícios 3 94
Apêndice
Estatística é uma ciência que nos permite coletar, organizar, descrever, analisar e interpretar
dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
Estamos denominando por dados a um (ou mais) conjunto de valores, numéricos ou não. A
aplicabilidade das técnicas a serem discutidas se dá nas mais variadas áreas das atividades
humanas. Assim, o principal objetivo da Estatística é nos auxiliar a tomar decisões ou tirar
conclusões em situações de incerteza, a partir de informações numéricas.
Técnicas de amostragem
População Amostra
(Características) Planejamento de Experimentos
Análise
descritiva
descritiva
Inferência Estatística
Conclusões Informações
sobre as contidas nos
características Cálculo de Probabilidades
dados
da população
População: é o conjunto de todos os elementos que nos interessa estudar. Deve ser notado que na
terminologia estatística, população refere-se não somente a uma coleção de indivíduos, mas ao alvo
no qual reside nosso interesse. Exemplos: todos os clientes de um banco, todos os alunos de uma
faculdade, todos os automóveis da Ford, todo o sangue no corpo de uma pessoa, etc.
(a) Para avaliar a eficácia de uma campanha de vacinação no Estado de Minas Gerais, 200 mães de
recém-nascidos durante o primeiro semestre de um dado ano, em uma dada maternidade em Belo
Horizonte, foram perguntadas a respeito da última vez que vacinaram seus filhos.
População:
Amostra:
(b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia.
População:
Amostra:
(c) Para verificar a audiência de um programa de TV, 563 indivíduos foram entrevistados por
telefone com relação ao canal em que estavam sintonizados.
População:
Amostra:
Tabela 2.1: Informações sobre estado civil, grau de instrução, número de filhos, salário (expresso
como fração do salário mínimo), idade (medida em anos e meses) e procedência de 36 empregados
da seção de orçamentos de uma Empresa.
Idade
N° Estado Civil Grau de Instrução N° de Filhos Salário Anos Meses Região de Procedência
1 Solteiro Fundamental ... 4,00 26 3 Interior
2 Casado Fundamental 1 4,56 32 10 Capital
... ... ... ... ... ... ... ...
35 Casado Médio 2 19,40 48 11 Capital
36 Casado Superior 3 23,30 42 2 Interior
Fonte: Bussab e Morettin (2002)
Variável Qualitativa Nominal: para a qual não existe nenhuma ordenação nos possíveis
resultados.
Exemplo: Região de Procedência, etc.
Variável Qualitativa Ordinal: para a qual existe uma ordem natural nos seus resultados.
Exemplo: Grau de instrução, etc.
Resumindo
Como as variáveis são classificadas e outros exemplos:
Para cada tipo de variável existem técnicas apropriadas para resumir as informações dos
dados obtidos da amostra. Por exemplo, a utilização de uma tabela é uma forma de escrever os
dados de uma forma resumida.
Em algumas situações podem-se atribuir valores numéricos às várias qualidades ou
atributos de uma variável qualitativa e depois se proceder à análise como se esta fosse quantitativa,
desde que o procedimento seja passível de interpretação.
Existe um tipo de variável qualitativa para a qual essa quantificação é muito útil: a chamada
variável dicotômica. Para essa variável podem ocorrer somente duas realizações, usualmente
chamadas de sucesso e fracasso.
1) Um questionário foi aplicado aos alunos do primeiro ano de uma escola fornecendo as seguintes
informações:
ID: Identificação do aluno;
Turma: Turma a que o aluno foi alocado (A ou B);
Sexo: Feminino (F) ou Masculino (M);
Idade: Idade;
Alt: Altura;
Peso: Peso;
Filh: Número de filhos na família;
Fuma: Hábito de fumar (sim ou não);
Toler: Tolerância ao cigarro: (I) Indiferente, (P) Incomoda Pouco e (M) Incomoda Muito;
Exer: Horas de atividade física, por semana;
Cine: Número de vezes que vai ao cinema por semana;
OpCine: Opinião a respeito das salas de cinema na cidade: (B) regular a boa e (M) muito boa
TV: Horas gastas assistindo TV, por semana
OpTV: Opinião da programação na TV: (R) Ruim, (M) Média, (B) Boa e (N) não sabe.
A amostragem é naturalmente usada em nossa vida diária. Por exemplo, para verificar o
tempero de um alimento em preparação, podemos provar (observar) uma pequena porção deste
alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (população), uma parte
(amostra) com propósito de avaliarmos sobre a qualidade do tempero de todo o alimento.
População pequena: Não há necessidade de utilizar técnicas estatísticas, pois neste caso é
aconselhável realizar o censo (análise de toda a população).
Característica de fácil mensuração: Talvez a população não seja tão pequena, mas a
variável que se quer observar é de tão fácil mensuração, que não compensa investir num
plano de amostragem. Por exemplo, para verificar a porcentagem de funcionários
favoráveis à mudança no horário de um turno de trabalho, podemos entrevistar toda a
população no próprio local de trabalho. Esta atitude pode ser politicamente mais
recomendável.
Necessidade de alta precisão: A cada dez anos o IBGE realiza um Censo1 Demográfico
para estudar diversas característica da população brasileira. Dentre estas características têm-
se o número total de habitantes, que é fundamental para o planejamento do país. Desta
forma, o número de habitantes precisa ser avaliado com grande precisão e, por isto, se
pesquisa toda a população.
1
Censo: estudo de todos os elementos da população.
Oliveira, D. C. R. e Oliveira, M. S. 6 ____/____/____
Procedimento para o uso deste método:
1) Numerar todos os elementos da população (N elementos);
2) Efetuar sucessivos sorteios até completar o tamanho da amostra (n).
Para realizar este sorteio, podemos utilizar urnas, tabelas de números aleatórios ou algum
software que gere números aleatórios. A Tabela abaixo foi feita usando o Excel®.
6 1 0 9 2 6 2 9 8 5 1 1 9 5 7 7 7 9 0 4 5 7 0 0 9 1 2 9 5 9 8 3 5 3 8 7 0 2 0 2
9 4 4 7 4 0 9 9 9 3 8 2 1 3 2 2 4 0 3 3 1 9 7 2 5 5 6 9 8 2 1 6 9 4 2 1 6 6 3 9
5 0 4 0 5 0 5 5 7 9 0 0 5 8 1 7 2 6 3 0 3 8 1 1 5 4 8 9 0 4 1 3 6 9 1 7 3 5 4 8
5 8 9 3 4 2 7 0 1 5 2 8 9 6 2 4 7 5 0 3 0 0 4 5 8 6 6 8 7 9 0 2 5 8 9 6 2 4 8 5
8 0 4 8 9 6 3 2 5 8 1 2 5 8 7 4 6 3 2 1 4 8 9 6 5 4 1 2 3 2 0 1 4 5 2 3 6 9 8 0
1 2 8 7 5 6 3 2 1 0 8 5 6 4 9 7 3 2 1 0 5 9 4 7 6 4 1 2 3 3 0 1 2 5 8 9 7 4 1 0
3 1 4 5 8 7 6 9 3 2 0 1 4 5 6 9 8 7 4 5 9 8 7 4 5 6 3 2 1 5 9 4 5 6 0 2 5 8 0 0
8 5 1 8 9 6 5 4 7 3 1 0 2 5 8 9 6 3 2 0 4 7 8 9 6 3 2 0 1 4 8 2 3 6 8 9 5 2 0 1
0 8 5 8 9 6 3 2 1 4 5 2 5 8 9 6 3 2 1 4 8 5 2 3 0 2 5 7 4 0 8 5 6 3 1 2 5 2 3 0
9 0 1 2 5 9 0 3 6 8 2 0 3 5 8 4 6 1 3 0 5 8 7 9 6 3 2 0 1 8 9 6 3 2 5 8 4 1 0 3
1 9 1 5 8 9 6 3 2 1 7 8 9 6 5 2 0 3 2 5 9 6 3 2 0 1 5 8 9 6 2 1 5 4 7 9 9 4 0 2
2 7 9 1 2 3 5 8 9 6 0 1 5 4 2 0 3 6 9 8 2 5 8 0 2 1 4 8 0 9 5 2 0 3 2 1 2 4 8 9
5 6 1 9 4 5 9 6 3 2 1 4 7 8 9 6 3 0 1 5 1 4 5 8 9 6 3 2 1 4 0 2 1 3 6 5 4 7 8 9
9 2 5 1 2 3 5 8 9 4 3 2 1 4 7 0 2 3 0 0 4 5 6 3 0 0 1 4 5 2 9 3 0 2 5 8 9 2 6 4
6 3 3 1 2 5 8 7 0 3 9 4 7 8 4 1 0 1 3 6 8 7 4 1 2 3 0 2 5 8 6 1 0 2 5 4 6 7 8 9
Exemplo: Considere agora, uma população com 500 elementos e, deseja-se retirar dessa população
10 elementos. Obtenha uma AAS utilizando a primeira linha da Tabela de Números Aleatórios.
É utilizada quando a população está naturalmente ordenada, como listas telefônicas, fichas
de cadastramento, produção de garrafas da cervejas, etc.
Procedimento para o uso deste método:
Exemplo: Numa turma com N = 36 alunos, deseja-se retirar uma amostra de n = 5 elementos para
verificar uma característica de interesse. Utilize a técnica de amostragem sistemática para retirar
essa amostra.
1) Calcular: i = N/n = 36/5 = 7,2. Considerando a parte inteira do número, temos que i = 7;
2) Sortear um número entre 1 e 7 da Tabela de Números Aleatórios. Escolhendo a última linha e a
primeira coluna, temos que o primeiro número que está entre 1 e 7 é 6. Logo a amostra será
composta dos elementos: {06, 13, 20, 27, 34}
Exemplo: Considere agora, uma população com 500 elementos e, deseja-se retirar dessa população
10 elementos. Obtenha uma AS utilizando a primeira linha da Tabela de Números Aleatórios,
quando for necessário.
A população é dividida em subgrupos, denominados estratos (por exemplo, por sexo, renda,
bairro, etc.) e a AAS é utilizada na seleção de uma amostra de cada estrato. Esses estratos devem
ser internamente mais homogêneos do que a população toda, com respeito às variáveis em estudo.
Aqui, um conhecimento prévio sobre a população em estudo é fundamental.
Exemplo: Com o objetivo de realizar uma pesquisa de opinião sobre a gestão atual da reitoria em
uma determinada universidade, realizaremos um levantamento por amostragem. A população é
composta por 100 professores, 100 servidores técnicos administrativos e 300 alunos, que
identificaremos da seguinte forma:
População
Professores P001 P002 … P100
Servidores S001 S002 ... S100
Alunos A001 A002 ... A300
Exemplo: Realização de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais. Usando a
técnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e,
em seguida, entrevistar todos os eleitores dessas zonas selecionadas
5
3
Zona 9
6 11
1
7 12
2
4 10
8
Entrevistar todos os
eleitores dessas zonas
Oliveira, D. C. R. e Oliveira, M. S. 9 ____/____/____
Obs.: É fácil confundir amostragem estratificada com amostragem por conglomerado, porque
ambas envolvem a formação de subgrupos. A diferença é que a amostragem por conglomerado usa
todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa
uma amostra de membros de todos os estratos.
Curiosidade
2) Um gerente de controle de qualidade estudará fontes de computador que passam numa esteira
transportadora dentro da empresa onde trabalha. Sabendo que por dia passam N = 85 fontes e na
amostra deverá ter n = 10 fontes, quais serão as fontes selecionadas utilizando a técnica de
amostragem sistemática? (Quando for necessário utilizar a Tabela de Números Aleatórios utilize a
primeira linha)
3) Num depósito em uma determinada empresa produtora de materiais eletrônicos possui N = 100
computadores que estão separados em duas qualidades. N1 = 40 computadores Pentium 3 e N2 =
60 computadores Pentium 4. O custo para verificar se cada computador está sob controle é muito
alto. O administrador responsável disse que a empresa tem condições de verificar apenas n = 12
computadores. Utilizando a técnica de amostragem estratificada proporcional, quais computadores
serão selecionados? (Quando for necessário utilizar a Tabela de Números Aleatórios utilize a
primeira linha)
Interpretação da Tabela 4.1.: Nota-se que dos 36 empregados da seção de orçamentos, 33,33%
tem nível fundamental, 50% nível médio e apenas 16,67% nível superior.
Notação: Usaremos a notação ni para indicar a freqüência (absoluta) de cada classificação ou
categoria da variável. A notação fi = ni/n para indicar a proporção (ou freqüência relativa) de cada
categoria, sendo o “n” o número total de observações.
As proporções são muito úteis quando se querem comparar resultados de duas pesquisas
distintas. O próximo exemplo ilustra este fato.
Exemplo: Suponhamos que se queira comparar a variável grau de instrução para empregados da
seção de orçamentos com a mesma variável para todos os empregados da Companhia MB.
Digamos que a empresa tenha 2000 empregados e que a distribuição de freqüências seja a tabela
abaixo:
Tabela 4.2: Freqüências e Porcentagens dos 2000 empregados da Companhia MB, segundo o grau
de instrução.
Grau de Instrução Freqüência (ni) Proporção (fi) Porcentagem (100 x fi)
Fundamental 650
Médio 1020 0,5100
Superior
Total n = 2000 1,0000
Fonte: Bussab e Morettin (2002)
Comparação entre a Tabela 4.1. e a Tabela 4.2.: Não podemos comparar diretamente as colunas
das freqüências (ni) das duas tabelas pois os totais de empregados são diferentes nos dois casos (n =
36 e n = 2000). Mas as colunas das porcentagens (ou proporções) são comparáveis, pois reduzimos
as freqüências relativas a um mesmo total.
Oliveira, D. C. R. e Oliveira, M. S. 11 ____/____/____
4.2. Variáveis Quantitativas Unidimensionais
Solução: Agrupar os dados por faixas de salário. Assim, construímos uma tabela chamada Tabela
de Classes de Freqüências.
Obs.: Procedendo desse modo, ao resumir os dados referentes a uma variável quantitativa, perde-se
alguma informação. Por exemplo, não sabemos quais são os oito salários da classe de 12 a 16, a
não ser que investiguemos a tabela original. Sem perda de muita precisão, poderíamos supor que
todos os oito salários daquela classe fossem iguais ao ponto médio da referida classe, isto é, 14.
Número de Classes
A escolha dos intervalos é arbitrária. A familiaridade do pesquisador com os dados é que lhe
indicará quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que,
com um número pequeno de classes, perde-se informação, e com um número grande de classes, o
objetivo de resumir os dados fica prejudicado.
Solução: Normalmente, sugere-se o uso de 4 a 8 classes com a mesma amplitude.
Dentre muitas regras citadas na literatura, duas tem sido universalmente adotadas, caso o
pesquisador não tenha idéia alguma sobre o número de classes adotar. O número ideal de classes é
um número inteiro próximo de:
As tabelas usadas neste caso são conhecidas como tabela de dupla entrada, tabela de
associação, tabela de contingência ou distribuições conjuntas de freqüências.
2) Ainda baseado na Tabela 4.7., construa uma Tabela de Classes de Freqüências para a variável
Redação, com as freqüências absoluta e relativa, as porcentagens, dê um título e interprete.
3) Construa uma tabela de dupla entrada para as variáveis “seção” e conceito tirado em “Inglês” da
Tabela 4.7.
4) Construa uma tabela de contingência para as variáveis “seção” e “notas em estatística” da Tabela
4.7.
5) Construa uma tabela de contingência para as variáveis “notas em redação” e “política” da Tabela
4.7.
5.2. Moda
Exemplo: Uma empresa de segurança deseja estudar qual o número de ligações a cobrar mais
freqüentes que são recebidas em um determinado bairro de classe alta da cidade de São Paulo no
mês de março. Foram selecionadas 30 residências e observadas 10 ligações em cada residência. O
resultado foi:
Moda = __.
Interpretação: __ ligações a cobrar foi o que ocorreu com maior freqüência.
5.3. Média
x1 + x 2 + x3 + L + x n ∑x
i
x= = i =1
(5.1)
n n
Exemplo: Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A média das notas é ___.
Oliveira, D. C. R. e Oliveira, M. S. 15 ____/____/____
Média para dados agrupados em Tabelas de Freqüências
Exemplo: Considere novamente o exemplo da empresa de segurança, mas suponha que o interesse
seja estudar o número médio de ligações a cobrar recebido em um determinado bairro de classe
alta da cidade de São Paulo no mês de março.
Nesse caso, a média é calculada levando em conta as freqüências de cada valor da variável,
da seguinte forma:
v
∑x n i i
, x= i =1
(5.2)
n
onde v é a quantidade de resultados que a variável contém e ni a respectiva freqüência da i-ésima
classe. Assim, para o exemplo temos:
n
∑x n
0 x 2 + 1x5 + 2 x15 + 3x8
i i
x= i =1
= = ___.
n 30
Logo, o número médio de ligações a cobrar recebido em um determinado bairro de classe alta da
cidade de São Paulo no mês de março é ___.
5.4. Mediana
É o valor que divide os dados, isto é, metade dos dados será maior ou igual que a mediana e
metade será menor ou igual.
Considere a seguinte série de valores: 5, 2, 6, 13, 9, 15, 10.
De acordo com a definição de mediana, o primeiro passo a ser dado é ordenar o conjunto de
valores: 2, 5, 6, 9, 10, 13, 15. O valor que divide a série em duas partes iguais é 9. Logo, a mediana
é 9.
x (P− ) + x (P+ )
Mediana =
2
Exemplo: Calcule a mediana da seguinte série de dados: 1, 3, 0, 0, 2, 4, 1, 2, 5
1º ordenar a série: __, __, __, __, __, __, __, __, __.
n = __ . Logo, P = (n + 1)/2 é dado por P = (__+1)/2 = 5, ou seja, o 5º elemento da série ordenada
será a mediana. Assim, mediana = __ .
Notas:
1) Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana
com um dos elementos da série.
2) Quando o número de elementos da série estatística for par, a mediana será sempre a média
aritmética dos 2 elementos centrais da série.
3) Em uma série de dados, a mediana, a média e a moda não têm, necessariamente, o mesmo valor.
4) A mediana, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma
diferença marcante entre mediana e média (que se deixa influenciar, e muito, pelos valores
extremos). Vejamos:
Na série: 5, 7, 10, 13, 15 Média = 10 e Mediana = 10;
Na série: 5, 7, 10, 13, 65 Média = 20 e Mediana = 10,
isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos
valores extremos, ao passo que a mediana permanece a mesma.
Nesse caso, utilizamos a freqüência acumulada para identificar qual o valor da mediana.
Exemplo: Considere novamente o exemplo da empresa de segurança que desejava estudar qual o
número de ligações a cobrar mais freqüentes recebidas em um determinado bairro de classe alta da
cidade de São Paulo no mês de março. Vamos introduzir uma nova coluna na tabela dos dados
referentes a freqüência acumulada.
Como o rol é par, pois n = __, a mediana é a média dos valores que estão nas posições 15 e 16.
Ambos valores que estão nestas posições são __ ligações a cobrar recebida por residência, pois F3 é
a primeira freqüência acumulada que contém os elementos 15 e 16.
2) Um artigo em Computers and Industrial Engineering (2001, p.51) descreve os dados de tempos
de falha (em horas) para motores de jatos. Alguns desses dados estão a seguir.
Obtenha mínimo, máximo, moda, média e mediana dos tempos de falhas das máquinas e interprete
os resultados.
6.1. Motivação
Para preencher uma única vaga existente em uma empresa, 50 candidatos foram submetidos
a 6 provas sobre conhecimentos específicos de interesse da empresa. Três destes candidatos
destacaram-se com as notas descritas na tabela abaixo:
Que candidato escolher? Um critério inicial poderia ser o de escolher o que tem a maior média,
mas:
Candidatos A B C
Média
De modo análogo, nem adianta pensar em moda ou mediana, pois:
Candidatos A B C
Moda
Mediana
Solução: Um segundo critério de escolha pode ser escolher o candidato que apresentou notas mais
homogêneas, isto é, aquele que apresentou menor dispersão das notas.
6.2. Amplitude
A amplitude é definida pelo intervalo entre o valor máximo e o valor mínimo da série de
dados, ou seja,
Amplitude = Máximo – Mínimo (6.1)
Exemplo: Para os três candidatos temos:
Candidatos A B C
Amplitude
( x − x ) 2 + ( x 2 − x ) 2 + ( x3 − x ) 2 + L + ( x n − x ) 2 ∑ (x i − x)2
s2 = 1 = i =1
(6.2)
n −1 n −1
Notas Média
Candidato A 7,0 7,5 8,0 8,0 8,5 9,0 8,0
Notas Média
Candidato B 6,0 7,0 8,0 8,0 9,0 10,0 8,0
s B2 = = = sB =
6 −1 5
Notas Média
Candidato C 7,5 8,0 8,0 8,0 8,0 8,5 8,0
sC2 = = = sC =
6 −1 5
Resumindo
O intervalo interquartil é a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1),
ou seja,
IQ = Q3 – Q1. (6.5)
Essa medida nos dá a informação da amplitude dos 50% pontos centrais do conjunto de
dados ordenados.
1) Considere o seguinte conjunto de dados: 2, 3, 5, 7, 10. Utilize a fórmula alternativa para calcular
a variância, sabendo que a média é 5,4.
3) Um laboratório clínico precisa decidir comprar um dentre três aparelhos (A, B, C) para dosagem
de sangue. Para isto o responsável pelas análises preparou uma substância de concentração
conhecida (10 mg/ml) e extraiu várias amostras para serem dosadas pelos três aparelhos. Os
resultados obtidos em cada um deles foram os seguintes:
A 5 10 7 15 16 12 4 8 10 13
B 10 9 10 9 11 8 9 7 8 9
C 10 11 9 10 10 9 11 12 8 10
Em medidas clínicas três termos são utilizados freqüentemente:
Precisão: refere-se à dispersão dos resultados
Não-viciado: refere-se à tendência de um conjunto de medidas produzir um resultado igual ao
“verdadeiro valor”
Exato: refere-se ao instrumento preciso e não-viciado
(a) Descreva os três instrumentos em termos das definições acima.
(b) Qual instrumento lhe parece recomendável? Justifique sua resposta.
O gráfico em Barras consiste em construir retângulos ou barras, em que uma das dimensões
é proporcional à magnitude a ser representada (ni), sendo a outra arbitrária, porém igual para todas
as barras. Essas barras são dispostas paralelamente uma às outras, horizontalmente ou
verticalmente. No exemplo a seguir temos o gráfico em barras (verticais) para a variável Grau de
Instrução.
18
18
16
14
12
12
Freqüência (ni)
10
6
6
4
0
Fundamental Médio Superior
Grau de Instrução
50%
Fundamental
Médio
33%
Superior
17%
500 100
400 80
Porcentagem Acumulada
Frequencia Absoluta
300 60
200 40
100 20
0 0
Modelo-Aviões MD-737 MD-777 MD-757 MD-767 MD-717 MD-747 MD-11 MD-90
Count 281 55 45 44 32 25 4 3
Percent 57,5 11,2 9,2 9,0 6,5 5,1 0,8 0,6
Cum % 57,5 68,7 77,9 86,9 93,5 98,6 99,4 100,0
Figura 7.3: Produção de aviões em 2000. (Fonte: Boeing Commercial Airplane Company)
Oliveira, D. C. R. e Oliveira, M. S. 23 ____/____/____
A Figura 7.3 apresenta um gráfico de Pareto para a produção de aviões de transporte da
Boeing Commercial Airplane Company no ano de 2000. Note que o 737 foi o modelo mais popular,
seguido pelos 777, 757, 767, 717, 747, MD-11 e o MD-90. A linha no gráfico de Pareto conecta as
porcentagens acumuladas dos k modelos produzidos com maior freqüência (k = 1, 2, 3, 4, 5). Nesse
exemplo, os dois modelos produzidos com maior freqüência respondem aproximadamente 69% do
total dos aviões produzidos em 2000.
90
Porcentagem Acumulada
80 100
Número de Defeitos
70
80
60
50 60
40
30 40
30
21
20
20
10 6 6 5 5 4 4
0 0
Tipo de Defeito o as as ia as es as os
orn ad ur nc ad nt iv tr
n t r h ê c ie o u
co
a an qü ifi sa
l /g O
o l ap s/r se ubr s d as
d a l
m ro de ão ar
te en
o ra s fu ra n P s /f
F e e e
rt d Fo s lh
Pa lta a r te ta
n
Fa P E
Count 30 21 6 6 5 5 4 4
Percent 37,0 25,9 7,4 7,4 6,2 6,2 4,9 4,9
Cum % 37,0 63,0 70,4 77,8 84,0 90,1 95,1 100,0
Os gráficos de Pareto são muito úteis na análise dos dados defeituosos em sistemas de
produção. A Figura 7.4 apresenta um gráfico de Pareto que mostra a freqüência com que vários
tipos de defeitos ocorrem em peças de metal usadas em um componente estrutural da moldura de
uma porta de automóvel. Note como o gráfico de Pareto realça os relativamente poucos defeitos
que são responsáveis pela maioria dos defeitos observados na peça. O gráfico de Pareto é parte
importante no programa de melhora da qualidade, porque permite que a gerência e a engenharia
concentrem sua atenção nos defeitos mais críticos do produto ou processo. Uma vez identificados
esses defeitos críticos, devem-se desenvolver e implementar ações corretivas para reduzi-los ou
eliminá-los.
Curiosidade: O gráfico de Pareto tem esse nome em homenagem ao economista italiano Vilfredo
Pareto que estabeleceu a teoria de que, em certas economias, a maior parte da riqueza (80%)
pertence à minoria da população (20%).
Exemplo: Considere a variável tempo, em segundos, entre carros que passam por um cruzamento,
viajando na mesma direção: 6, 3, 5, 6, 4, 3, 5, 4, 6, 3, 4, 5, 2, 10.
2 3 4 5 6 7 8 9 10
Figura 7.6: Gráfico de Dispersão – Dot Plot
7.2.3. Histograma
0,08
0,07 0,0833
Densidade de Freqüência
0,06 0,0695
0,05
0,0556
0,04
0,03 0,0347
0,02
0,01 0,007
0
04 |-- 08 08 |-- 12 12 |-- 16 16 |-- 20 20 |-- 24
Classes de Salários
200000
Dívida em Milhões de Dólares
150000
100000
50000
0
6
6
5
0
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
20
20
20
20
Ano
Figura 7.8: Gráfico de Linhas para a variável Dívida Externa do Brasil no período 1956 a 2006
7.2.5. Ramo-e-Folhas
Suponha que os dados sejam representados por x1, x2, ..., xn, e que cada número xi consista
em, pelo menos, dois dígitos. Para construir um diagrama ramo-e-folhas dividimos cada número xi
em duas partes: um ramo, que consiste em um ou mais dos dígitos líderes, e uma folha, que
consiste nos dígitos restantes. Por exemplo, se os dados representam porcentagens de defeitos
(valores entre 0 e 100), em lotes de placas de semicondutores, então poderíamos dividir o valor 76
no ramo 7 e na folha 6. Em geral, devemos escolher poucos ramos em comparação com o número
de observações. Usualmente, é utilizado entre 5 e 20 ramos. Uma vez escolhido um conjunto de
ramos, eles são listados ao longo da margem esquerda do diagrama e, ao lado de cada ramo, são
listadas todas as folhas que correspondem aos valores dos dados observados.
Tabela 7.5: Força de ruptura em libras por polegada para 100 garrafas
descartáveis de 1 litro de refrigerante.
176 221 242 253 261 265 271 278 286 301
187 223 243 254 262 265 272 278 287 307
197 228 245 254 263 267 274 280 290 308
200 231 246 257 263 267 274 280 293 317
205 231 248 258 264 268 274 280 294 318
208 234 248 258 264 268 274 280 296 321
210 235 250 260 265 269 275 281 298 328
214 235 250 260 265 269 276 281 299 334
215 235 250 260 265 270 276 283 299 337
220 242 251 260 265 271 277 283 300 346
Fonte: Hines et al. (2006), p. 157.
“M áx im o ”
Q3
75%
M ed ian a
50%
Q1
25%
“M ín im o”
Q 1 -1 ,5 (Q 3 -Q 1 )
27 27
26,67
26 25,9
25,38
Viscosidade (centipoise)
25 24,62
24,46
24
23,5
23
22,78
22,45
22,56
22 22,02 21,95
21,49
21
20,49
20,33
20
Mistura 1 Mistura 2 Mistura 3
Figura 7.11: Diagramas de caixas para os dados de viscosidade da mistura na Tabela 7.6.
2) Observe a sua conta de luz de 2007 e construa um gráfico temporal e um gráfico de barras,
colocando no eixo x, os meses (janeiro, ..., dezembro) e no eixo y, consumo de energia (em kWh).
3) Desenhe o ramo-e-folhas, box-plot e o dot plot para os dados das taxas médias geométricas de
incremento anual (por 100 habitantes) dos 30 maiores municípios do Brasil abaixo:
3,67 1,82 3,73 4,10 4,30
1,28 8,14 2,43 4,17 5,36
3,96 6,54 5,84 7,35 3,63
2,93 2,82 8,45 5,28 5,41
7,77 4,65 1,88 2,12 4,26
2,78 5,54 0,90 5,09 4,07
4) Construa uma tabela de classes de freqüências para os dados do exercício 3, com intervalos de
amplitude 1, de 0 a 10, isto é:
O objetivo é investigar a presença ou ausência de relação linear sob três pontos de vista:
Utilizado para estudar a relação entre duas variáveis quantitativas, fornecendo uma
representação gráfica das duas variáveis.
6
Nota
0
0 2 4 6 8 10 12 14
Tempo
Exemplo: Estudo da Renda Bruta Mensal pela Porcentagem da Renda Bruta Anual gasta com
Assistência Médica.
Numa pesquisa feita com 11 famílias com renda bruta mensal entre 10 e 60 salários
mínimos mediram-se:
Tabela 8.2
X Y X Y
12 7,2 40 6,0
16 7,4 48 5,6
18 7,0 50 6,0
20 6,5 54 5,5
28 6,6 32 6,5
30 6,7
0
0 10 20 30 40 50 60
Renda Bruta Mensal (em sal. mínimos)
Figura 8.2: Diagrama de Dispersão para as variáveis Renda Bruta Mensal e Porcentagem da
Renda Bruta Anual gasta com Assistência Médica.
7,5
Porcentagem da Renda Bruta Anual gasta com Assist. Médica
6,5
5,5
5
0 10 20 30 40 50 60
Renda Bruta Mensal (em sal. mínimos)
Figura 8.3: Diagrama de Dispersão para as variáveis Renda Bruta Mensal e Porcentagem da
Renda Bruta Anual gasta com Assistência Médica.
Oliveira, D. C. R. e Oliveira, M. S. 34 ____/____/____
8.3. Coeficiente de Correlação
∑(X i − X )2 ∑ (Y i − Y )2
Recordando: S x = i =1
e Sy = i =1
n −1 n −1
Classificação da correlação
1. r = 1 indica correlação linear positiva e perfeita;
2. r = −1 indica correlação linear negativa e perfeita;
3. r = 0 indica inexistência de correlação linear;
4. − 1 ≤ r ≤ 0 indica correlação linear negativa;
5. 0 ≤ r ≤ 1 indica correlação linear positiva.
30
Y
20
10
10 20 30 40 50
O valor do coeficiente de correlação não depende da escala que medimos as variáveis. Para
as duas figuras abaixo o valor do coeficiente de correlação é r = 0,46 .
Y
Z=Y/10+0,8
X X
r ≅ 0,01
r =0 r = 0.91
n
∑ X i Yi − nXY 2160,4 − 11.31,636363.6,454545
i =1
r= = = -0,9399564
(n − 1)S x S y 10.14,63744.0,62348
Podemos observar uma correlação negativa entre a renda bruta mensal e a
porcentagem da renda bruta anual gasta com assistência médica, isto é quanto maior for a renda
bruta mensal, menor é a porcentagem de sua renda gasta com assistência médica.
Reta Ajustada
A reta ajustada de duas variáveis quantitativas Y e X é dado por
)
Y = a + bX
Definição de a e b
a: intercepto;
b: inclinação da reta.
(n − 1) S x2
Tabela 8.3
Temperatura Consumo Temperatura Consumo
16 290 36 370
31 374 36 365
38 393 22 320
39 425 15 270
37 406
A correlação entre X e Y é:
n
X= Sx = Y= Sy = ∑X Y
i =1
i i =
450
430
410
y = 5,2194x + 200,42
390
Consumo de Cerveja
370
350
330
310
290
270
250
10 15 20 25 30 35 40 45
Temperatura Máxima
Figura 8.4: Diagrama de Dispersão para as variáveis Temperatura Máxima e Consumo de Cerveja,
juntamente com a Reta de Regressão
Oliveira, D. C. R. e Oliveira, M. S. 38 ____/____/____
(a) Qual a interpretação de b para o exemplo consumo de cerveja e temperatura?
Exemplo: Considere o estudo da renda bruta mensal pela porcentagem da renda bruta anual gasta
com assistência médica, onde o coeficiente de correlação deu aproximadamente -0,9399, com os
dados da Tabela 8.2, logo, o coeficiente de determinação será r2 ≅ 88,35%, isto é, 88,35% da
variabilidade nos dados é explicada pelo modelo de regressão y = 7,7212 – 0,04x.
7,5
porcentagem da renda bruta anual gasta com assistência médica
6,5
5,5
y = -0,04x + 7,7212
2
R = 0,8835
5
10 15 20 25 30 35 40 45 50 55 60
renda bruta mensal (em salários mínimos)
Tempo 3 7 2 1,5 12
Nota 4,5 6,5 3,7 4 9,3
4) Uma certa cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa
eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que estão
dentro dessas zonas eleitorais, isto é, foi utilizada amostragem por conglomerado. Apresentem
quais serão as 15 zonas eleitorais amostradas. (Utilize a primeira linha da tabela de números
aleatórios, quando for necessário)
6) Os dados abaixo se referem ao comprimento de 31 canos PVC vendidos em uma loja de material
de construção.
Tabela 2: Dados Brutos (em m)
19,5 20,0 14,1 16,1 10,0 16,0 22,0 20,5 15,0 16,7 22,0
12,5 16,3 15,3 16,0 13,8 19,7 17,0 14,1 18,8 12,3
15,5 14,7 20,3 17,4 19,5 17,9 18,2 16,9 19,3 16,9
7) Medidas da pulsação de 15 índios nativos dos Alpes Peruanos estão apresentadas a seguir:
Tabela 3: Medidas da pulsação
64 64 68 68 76 60 72 68
80 60 72 88 60 88 60
a) Calcule: Média, Mediana. Comente os resultados;
b) Calcule: Mínimo, Q1, Q3 e Máximo. Interprete estas 4 estatísticas;
c) Calcule: Variância e Desvio Padrão. Comente.
d) Construa o gráfico de barras para os dados de pulsação dos índios.
9) Três medicamentos para cicatrização estão sendo testados e um experimento é feito para estudar
o tempo (em dias) do completo fechamento em cortes provenientes de cirurgia. Os resultados
abaixo mostram o tempo de cicatrização em cobaias submetidas a um dos três tratamentos (A, B,
C):
Tabela 5: Tempo (em dias) do completo fechamento em
cortes provenientes de cirurgia
A 13 14 15 13 15 14 15 15 14 14
B 14 12 13 13 14 14 13 14
C 12 12 13 13 12 13 11 11
Analise os dados descritivamente utilizando todas as medidas apresentadas em aula e comente.
10) A seguir, temos informações do número de peixes-boi mortos e o número de barcos de turismo
(em milhares) que circulam em seu habitat na Flórida-EUA.
Tabela 6: Dados Brutos
Barcos(X) 68 68 67 70 71 73 76 81 83 84
Mortes(Y) 53 38 35 49 42 60 54 67 82 78
11) É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa
relação uma nutricionista selecionou 18 mulheres com idade entre 40 e 79 anos, e observou em
cada uma delas a idade (X) e a massa muscular (Y).
Tabela 7: Dados Brutos
X 71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78 73 68
Y 82 91 100 68 87 73 78 80 65 84 116 76 97 100 105 77 73 78
a) Faça o diagrama de dispersão dos dados.
b) Calcule o coeficiente de correlação linear entre X e Y e interprete-o.
c) Ajuste uma reta de regressão para mostrar a relação linear entre as variáveis Y: massa muscular
(dependente) e X: idade (independente) e interprete os coeficientes.
18 18 18 18
Alguns resultados: n = 18; ∑X
i =1
i = 1108 ; ∑X
i =1
i
2
= 70362 ; ∑Y
i =1
i = 1530 ; ∑Y
i =1
i
2
= 133300 e
18
∑X Y
i =1
i i = 91964 .
Definição 1: Qualquer fenômeno que gere resultado incerto ou casual é chamado de Processo ou
Experimento Aleatório.
Exemplos:
1) Jogar uma moeda duas vezes e observar a seqüência obtida de caras e coroas;
3) Peso de Animais;
3) Uma urna contém 10 bolas azuis e 10 brancas. 3 bolas são retiradas ao acaso e as cores são
anotadas:
4) Dois dados são lançados simultaneamente e estamos interessados na soma das faces observadas:
6) Uma máquina produz 20 peças por hora. Ao final da primeira hora de produção, observa-se o nº
de defeituosas:
Exemplos:
(a) Alguns eventos do experimento 1: A = {5}, B = {2, 4, 6}, etc.
Existem dois eventos especiais: espaço todo (Ω) e o conjunto vazio (∅).
• O evento união de A e B, denotado A∪B, é o evento em que A ocorre ou B ocorre (ou ambos).
A B
A B
Eventos Disjuntos
Definição 4: Dois eventos A e B são mutuamente exclusivos ou disjuntos se eles não podem
ocorrer simultaneamente (A ∩ B = ∅).
A B
(a) A ∩ B = (e) C ∩ D =
(b) A ∪ B = (f) E ∪ F =
No entanto, é fácil perceber que o termo probabilidade já está enraizado no senso comum,
pois as pessoas vivem o cotidiano calculando implicitamente algumas probabilidades, tais como:
9 situações de sua vida pessoal;
9 organizando-se em relações a horários a cumprir, levando em conta as circunstâncias do
tráfego;
9 agasalhando-se ao sair de casa se a previsão do tempo indicar uma frente fria.
O primeiro é devido a Laplace e é o mais conhecido, pois relaciona eventos favoráveis com
eventos possíveis. O segundo consiste em repetir um experimento várias vezes. O terceiro é
baseado na opinião pessoal e o último é devido a Kolmogorov e baseia-se no princípio de que
qualquer experimento pode ser modelado.
Oliveira, D. C. R. e Oliveira, M. S. 47 ____/____/____
9.6. Definição Clássica
Exemplo: Considere o lançamento de uma moeda equilibrada, nesse caso o espaço amostral
associado é Ω = {Cara, Coroa}. Então, pela definição clássica, a probabilidade de ocorrência do
evento “cara” é P(cara) = .
Ω = conjunto de 82.952 habitantes residentes em São João del Rei em 2006 por faixa etária.
Possíveis eventos de interesse:
M = Indivíduo sorteado é do sexo masculino F = Indivíduo sorteado é do sexo feminino
A = Indivíduo sorteado tem mais que 80 anos B = Indivíduo sorteado tem entre 15 e 29 anos
M ∩ A = Indivíduo sorteado é do sexo masculino e tem mais de 80 anos
F ∪ B = Indivíduo sorteado é do sexo feminino ou tem entre 15 e 29 anos
Distribuição da Faixa Etária da Cidade de São João del Rei em 2006, por Sexo
17,51
20,00
16,69
18,00
16,57
16,00
13,78
16,48
14,00
13,69
Masculino
12,00
9,41
Porcentagem
Feminino
8,50
8,70
10,00
8,22
9,09
6,46
8,00
8,62
5,54
8,13
7,61
6,79
6,00
2,70
5,74
4,00
4,16
1,50
1,34
0,99
2,00
1,78
0,00
Menos 1a4 5a9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 acima
que 1 de 80
Grupos de Idade
Passo 2 – Um membro do grupo vai lançar a moeda e o outro vai marcar os resultados na planilha
anexa, seguindo as seguintes instruções:
a) Jogar a moeda uma vez e anotar C ou K no espaço adequado (linha 2) da planilha.
b) Repetir este procedimento 30 vezes, preenchendo um a um todos os espaços da linha 2.
Passo 3 – Continuando com a planilha, trocar de lugar com o parceiro, voltar para os itens a) e b)
das instruções e continuar mais 30 jogadas – até perfazer 60.
d) Agora a linha 4 da planilha deve ser preenchida – em cada posição deve ser colocado o número
acumulado de CARAS, até aquela jogada (verifique que a jogada está explicitada na linha 1- que é
a linha n). Discutir com outro membro do grupo para ver se está claro – se não, pergunte! A linha
de baixo é continuação do acumulado da linha de cima.
e) Finalmente chegamos à última linha – linha 5: colocar a freqüência relativa (m/n) de CARAS em
cada momento – o que é isto? Discuta com o outro membro do grupo (desprezar as entradas
assinaladas com X).
1) Jogada(n) 31 32 33 40 47 50 55 60
2) C ou K
3) 1 ou 0
4) Caras Acumuladas (m)
5) Frequência Relativa (m/n) X X X X X X X X X X X X X X X X X X X X X X X X X X X
Passo 5 – depois de completar a 1a parte da planilha, construir a seguinte tabela, usando as linhas 4
e 5 da planilha:
n 1 2 3 4 5 6 7 8 9 10 20 30 40 50 60
m/n
Passo 6 – Completar o gráfico, usando os valores da tabela recém construída, do seguinte modo:
Eixo Y – valores m/n Eixo X – valores da linha 1: (n)
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
1 2 3 4 5 6 7 8 9 10 …… 20 30 40 50 60
n
Passo 7 – Comparar os resultados com os colegas e interpretar o resultado comentando sobre a
“honestidade” da sua moeda.
Conclusão: Com isto chegamos a uma possível “definição freqüentista” de probabilidade, ou seja,
probabilidade é o valor em que a freqüência relativa se estabiliza após um número muito grande de
ensaios.
Exemplo: Um médico experiente consegue calcular uma probabilidade do indivíduo ter uma
determinada doença baseado nos sintomas que o indivíduo apresenta.
Definição 8 (Moderna): Probabilidade é uma função P(.), que associa a cada evento do espaço
amostral Ω, um número real, pertencente ao intervalo [0, 1], satisfazendo os seguintes axiomas:
(1) 0 ≤ P(A) ≤ 1.
(2) P(Ω) = 1.
(3) Se A e B são eventos mutuamente exclusivos: P(A∪B) = P(A) + P(B).
Exemplos:
1) Distribuição Bernoulli
P(X = x ) = p x (1 − p )1− x , x = 0, 1.
2) Distribuição Binomial
⎛n⎞
P(X = x ) = ⎜⎜ ⎟⎟p x (1 − p ) , x = 0, 1, ..., n.
n−x
p
⎝ ⎠
3) Distribuição Hipergeométrica
⎛ r ⎞⎛ N − r ⎞
⎜⎜ ⎟⎟⎜⎜ ⎟⎟
⎝ x ⎠⎝ n − x ⎠ , 0 ≤ x ≤ mínimo(r, n).
P(X = x ) =
⎛ N⎞
⎜⎜ ⎟⎟
⎝n⎠
4) Distribuição Poisson
e − λ λx
P(X = x ) = , x = 0, 1, ...
x!
5) Distribuição Normal
1
1 −
2
(x −µ ) 2
f (x) = e 2σ , - ∞ < x< + ∞
σ 2π
Propriedades
P( A ∩ B) = P( B)P( A | B)
Exemplo: Voltando ao Exemplo da População Residente em São João del Rei em 2006, temos:
Exemplo: Joaninha tem probabilidade de 0,8 de passar no vestibular enquanto que Joãozinho tem
probabilidade de 0,6. Qual a probabilidade dos dois passarem no vestibular? Qual a suposição a ser
feita nesse caso para calcular a probabilidade?
Sejam os eventos: A: Joaninha passa no vestibular e B: Joãozinho passa no vestibular
P(A∩B) = 0,8.0,6 = 0,48
Sistema
Subsistema 1 Subsistema 2
Oliveira, D. C. R. e Oliveira, M. S. 53 ____/____/____
O sistema funciona se e somente se o subsistema 1 e o subsistema 2 funcionarem. Se os
subsistemas sobrevivem independentemente, a confiabilidade do subsistema 1 é de 0,90 e do
subsistema 2 é de 0,80, qual é a confiabilidade do sistema?
Exemplo: O Cruzeiro ganha com probabilidade 0.7 se chove e 0.8 se não chove. Em maio a
probabilidade de chuva é de 0.3. Qual a probabilidade do Cruzeiro ganhar uma partida no mês de
maio?
A: Cruzeiro vencer; B: chove; Bc: Não chove
P(A) = P(B).P(A | B) + P(Bc).P(A | Bc) = 0,3.0,7 + 0,7.0,8 = 0,77
Curiosidade
O teorema de Bayes, que aparentemente poderia ser encarado como mais um resultado na teoria de
probabilidades, tem importância fundamental, pois fornece a base para uma abordagem da
inferência estatística conhecida como inferência bayesiana.
Como estamos falando do Thomas Bayes, não podemos deixar de fazer um breve
comentário sobre o que chamamos de probabilidades subjetivas, ou seja, cada indivíduo, baseado
em informações anteriores e na sua opinião pessoal a respeito de um evento em questão, pode ter
uma resposta para a probabilidade desse evento. A inferência Bayesiana toma como uma de suas
bases o fato de que todas as probabilidades são subjetivas. O teorema de Bayes tem um papel
importante nesse tipo de inferência, pois passa a ser visto como um mecanismo de atualização de
opiniões, ou seja, o indivíduo aprende B e passa a ter opinião P(A|B) sobre A.
As probabilidades associadas a eventos de modo subjetivo têm propriedades análogas as
que foram mencionadas nesse texto.
Exemplo:
Níveis Históricos de Qualidade de Dois Fornecedores
% de Peças Boas % de Peças Ruins
Fornecedor 1 98 2
Fornecedor 2 95 5
Considere uma empresa fabricante que recebe embarques de peças de dois diferentes
fornecedores. Atualmente, 65% das peças compradas pela empresa são do fornecedor 1 e o
restante, 35%, são do fornecedor 2. Dado que uma peça selecionada seja defeituosa, qual a
probabilidade dela ter vindo do fornecedor 2?
Exemplos
1. Lança-se uma moeda 10 vezes e anota-se o número de caras. Este número pode ser 0, 1, 2 ...10.
2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes compram um
determinado produto. O número de pessoas que compram o produto varia de 0 a 200.
3. Conta-se o nº de acidentes que ocorrem em uma rodovia num feriado prolongado. O número de
acidentes em questão pode ser: 0, 1, 2… Como não temos um valor que limite esse número,
supomos que o número de acidentes é qualquer inteiro não negativo.
10.1. Introdução
Vamos incorporar o conceito de probabilidade ao estudo de variáveis associadas a
características em uma população. Muitos experimentos produzem resultados não-numéricos.
Antes de analisá-los, é conveniente transformar seus resultados em números. Isto é feito através da
variável aleatória que é uma função que associa um valor numérico a cada ponto do espaço
amostral.
Para entender melhor o conceito, considere o seguinte exemplo.
Exemplo: Observa-se o sexo das crianças em famílias com três filhos. O espaço amostral é
Ω = {(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM),(FFF)}
Uma variável aleatória de interesse é: X = {nº. de crianças do sexo masculino}. A cada evento
simples, ou ponto de Ω, associamos um número, que é o valor assumido pela variável aleatória X:
Definição: uma v.a. é discreta quando o conjunto de valores possíveis for finito ou infinito
numerável.
Exemplos: Número de filhos, Número de bactérias numa lâmina, número de lâmpadas em uma
residência, etc.
O passo fundamental para entendermos uma v.a. discreta é associar a cada valor a sua
probabilidade, obtendo o que se chamamos de distribuição de probabilidade.
X x1 x2 ... xn
P(X=x) P(X=x1) P(X=x2) ... P(X=xn)
Oliveira, D. C. R. e Oliveira, M. S. 56 ____/____/____
∑
n
A função de probabilidade (P(⋅)) deve satisfazer: 0 ≤ P(X=xi) ≤ 1 p/ ∀ xi e i =1
P ( X = xi ) = 1
MMH 2
14 13 12
MMM 3 x x = 0,056
35 34 33
É uma média ponderada dos xi, em que os pesos são as probabilidades associadas.
Exemplo: Um lojista mantém extensos registros das vendas diárias de certo aparelho. O quadro a
seguir dá o número xi de aparelhos vendidos em uma semana e a respectiva probabilidade:
Número xi 0 1 2 3 4 5
Probabilidade P(X = xi) 0,1 0,1 0,2 0,3 0,2 0,1
Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma semana?
10.3. Variância
Assim como a média é uma medida de posição de uma v.a., é natural que procuremos uma
medida de dispersão dessa variável em relação à média. Essa medida é a variância, a ser
representada por σ2 e definida por
n
σ 2 = Var (X) = ∑ ( x i − E (X)) 2 P(X = x i )
i =1
Desenvolvendo o termo quadrático do somatório, obtemos uma expressão mais fácil de calcular a
variância dada por:
σ 2 = Var (X) = E(X 2 ) − [E (X)]2
n
onde E(X 2 ) = ∑ x i2 P(X = x i ) .
i =1
Desvio Padrão
O desvio padrão (σ) é a raiz quadrada positiva da variância. Tem sobre essa última a
vantagem de exprimir a dispersão na mesma unidade de medida da v.a.:
σ = σ2
1, se ocorrer “sucesso”
X=
0, se ocorrer “fracasso”
e função de probabilidade,
X 1 0
P(X=x) p 1-p
Segue-se que
E(X) = p e Var(X) = p(1-p)
1) Nos Estados Unidos, 29% dos advogados e juízes são mulheres (Statistical Abstract of the
United States, 1997). Em uma jurisdição com 30 advogados e juízes, qual é o número esperado de
mulheres? Qual é a variância e o desvio padrão?
2) O maior número de reclamações dos proprietários de automóveis com dois anos de uso se
referem ao desempenho do sistema elétrico. Considere que um questionário anual, enviado aos
proprietários de mais de 300 marcas e modelos de automóveis, revelou que 10% dos proprietários
de automóveis com dois anos de uso encontraram pontos com problemas no sistema elétrico, que
incluíam o motor de arranque, o alternador, a bateria, controles diversos, luzes e radio. Qual a
probabilidade de que uma amostra de 12 proprietários de automóveis com dois anos ter
(a) exatamente dois proprietários com problemas no sistema elétrico
(b) pelo menos dois proprietários com problemas no sistema elétrico
(c) no máximo um proprietário com problemas no sistema elétrico.
Note-se que a unidade de medida (tempo, área) é contínua, mas a variável aleatória de
interesse (número de ocorrência) é discreta. Além disso, as falhas não são contáveis. Não é
possível contar os acidentes que não ocorreram, nem o número de defeitos por centímetros
quadrados que não ocorreram.
Notação: X ~ P(λ)
Esperança e Variância: E (X) = Var (X) = λ
Oliveira, D. C. R. e Oliveira, M. S. 61 ____/____/____
Exemplo: Um departamento de conserto de máquinas recebe uma média de cinco chamadas por
hora. Supondo que a distribuição de Poisson seja adequada nessa situação, obter a probabilidade de
que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente três chamadas:
1) Numa central telefônica, o número de chamadas chega segundo uma distribuição Poisson, com a
média de oito chamadas por minuto. Determine qual a probabilidade de que num minuto se tenha:
(a) duas ou mais chamadas;
Até aqui estudamos variáveis aleatórias discretas que são caracterizadas por ter uma
distribuição de probabilidade dada por uma tabela que associa a cada um de seus valores uma
probabilidade. Esta probabilidade é um número entre 0 e 1 cuja soma é igual a 1.
Definição: Seja X uma variável aleatória. Suponha que os possíveis valores de X seja um intervalo
que possui infinitos valores, então diremos que X é uma variável aleatória contínua.
Exemplos:
1. Mede-se a altura de uma mulher em uma cidade. O valor encontrado é um número real. Aqui
também sabemos que esse número não passa de 3 metros, mas é conveniente considerar qualquer
nº real positivo.
2. Em um exame físico para selecionar um jogador de futebol é medido o peso de cada candidato;
aqui também consideramos que o resultado pode ser qualquer número real positivo.
3. Em campanhas preventivas de hipertensão arterial é comum de tempos em tempos medir-se o
nível de colesterol. O valor de cada medida pode ser um número real não negativo.
4. Para pacientes que se apresentam num hospital a primeira atitude é medir-se a temperatura; o
valor da temperatura é um número real que se pode considerar compreendido entre 35º e 42ºC.
5. Retira-se uma lâmpada da linha de produção e coloca-se a mesma em um soquete acendendo-a;
observa-se a mesma até que se queime. O tempo de duração da lâmpada é um nº real não negativo.
Nos exemplos de 1 a 5, o número observado no experimento aleatório é um número
real e resulta em geral de uma medição:
• altura das mulheres;
• peso do atleta;
• nível de colesterol;
• temperatura;
• tempo de duração da lâmpada.
Uma variável aleatória contínua assume seus valores em um intervalo.
Como são atribuídas probabilidades nesse caso?
Exemplo: Suponha que observamos o peso, em kg, de 1500 pessoas adultas selecionadas
aleatoriamente numa população. O histograma por densidade desses valores é apresentado abaixo.
Para as variáveis contínuas as probabilidades são atribuídas por meio de uma função
cuja área entre a mesma e o eixo das abscissas (X) é igual a um.
∫ f(x)dx = P(a ≤ x ≤ b)
a
(c) P(a ≤ X ≤ b) = área sob a função densidade de probabilidade f(x) e acima do eixo x entre os
pontos a e b, isto é:
b
P(a ≤ X ≤ b) = ∫ f ( x )dx
a
Exemplo: Para uma variável que têm densidade f(x) = 2x, 0<x<1, então:
2 1 1
E(X) = 2 41 2
3 E (X 2 ) = ∫ x 2 2 x dx = ∫ 2 x 3 dx = x 0=
0 0
4 4
Logo, Var(X) = 2/4 – (2/3)2 =1/18 = 0,056
Também podemos obter o Desvio Padrão: 0,056 ≅ 0,23
3) O tempo de sobrevivência de uma bateria (em anos) pode ser modelado pela função:
f(x) = e-x, se x ≥ 0 e f(x) = 0, caso contrário.
(a) Qual a probabilidade da bateria sobreviver mais que 2 anos?
(b) Qual é o tempo médio de sobrevivência da bateria?
4) O diâmetro de um cabo elétrico é uma v. a. com fdp dada por: f(x) = 6x(1-x) para 0 < x < 1 e
f(x) = 0 fora desse intervalo.
(a) Verifique se f(x) é uma fdp, através do item (b) da definição 2.
(b) Obtenha a F(x).
2
1 ⎛ x −µ ⎞
1 − ⎜ ⎟
2⎝ σ ⎠
f ( x) = e , −∞< x<∞
2πσ 2
µ1 µ2
___N(µ, σ 12)
Curvas normais ___N(µ, σ 22)
com mesma média,
mas com desvios ___N(µ, σ 32)
padrão diferentes.
σ 12 < σ 22< σ 32
Cálculo de Probabilidades
a µ b
f(x)
f(z)
a µ b x
a–µ 0 b–µ z
σ σ
Dada a v.a. Z ~N (0;1) podemos obter a v.a. X ~ N (µ;σ2) através da transformação inversa
X = µ + Zσ
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
i) P(-1 ≤ Z ≤ 2)
b) P(X < 18 ou X > 24) = P(X < 18) + P(X > 24) =
1) O tempo gasto no exame vestibular de uma universidade tem distribuição Normal, com µ = 120
min e σ = 15 min.
(a) Sorteando-se um aluno ao acaso, qual é a probabilidade dele terminar o exame antes de 100
minutos?
(b) Qual deve ser o tempo de prova, de modo a permitir que 95% dos vestibulandos terminem no
prazo estipulado?
(c) Qual o intervalo central de tempo, tal que 80% dos estudantes gastam para completar o exame?
Exercício 01
Sendo A e B dois eventos de um mesmo espaço amostral, “traduza” para a linguagem da teoria dos
conjuntos as seguintes situações:
(a) Pelo menos um dos eventos ocorre.
(b) Exatamente um dos eventos ocorre.
(c) Nenhum dos eventos ocorre.
(d) A ocorre, mas B não ocorre.
Exercício 02
Dois processadores, A e B, são colocados em teste por 50 mil horas. A probabilidade de um erro
acontecer em A é 2/60, em B é 1/80 e em ambos é 1/100. Calcule a probabilidade de que:
(a) Pelo menos um processador apresente erro.
(b) Nenhum apresente erro.
(c) Somente A apresente erro.
Exercício 03
A probabilidade de que um homem que possui veículo motorizado se acidente num período de um
ano é de 0,113 e uma mulher que tenha um veículo motorizado se acidente num período de um ano
é de 0,057. Suponha que 55% dos motoristas em Lucas Country sejam homens. No preenchimento
de um questionário de histórico sobre desempenho ao volante, uma pessoa de Lucas Country
indicou um envolvimento em acidente com veículo motorizado durante o último ano. Qual é a
probabilidade de essa pessoa ser uma mulher?
Exercício 04
Um pai leva o filho ao cinema e gasta R$15,00 nas duas entradas. O filho vai pedir para comer
pipoca com probabilidade 0,7 e pedir para comer bala com probabilidade 0,9. Os pedidos são
atendidos pelo pai com probabilidade 0,5 independentemente. Se a pipoca custa R$2,00 e a bala
R$3,00 estude a variável aleatória “despesa efetuada com a ida ao cinema” construindo sua
distribuição de probabilidade.
Exercício 05
Suponha que a probabilidade de que um item produzido por uma máquina seja defeituoso é de 0,2.
Se 4 itens são produzidos por esta máquina são selecionados ao acaso, qual a probabilidade de que
não mais do que um item defeituoso seja encontrado?
Exercício 06
Na manufatura de certo artigo, é sabido que a proporção de artigos defeituosos é de 0,1. Qual a
probabilidade de que uma amostra casual de tamanho 5 contenha:
(a) nenhum defeituoso:
(b) exatamente um defeituoso:
(c) não mais que 2 defeituosos:
Exercício 08
Dos 25 estudantes (14 meninos e 11 meninas) na sala de aula de uma escola, 5 estudantes estavam
ausentes na quinta-feira.
(a) Qual é a probabilidade de que 2 dos ausentes fossem meninas?
(b) Qual é a probabilidade de que 2 dos ausentes fossem meninos?
(c) Qual é a probabilidade de que todos os ausentes fossem meninos?
(d) Qual é a probabilidade de que nenhum dos ausentes fosse um menino?
Exercício 09
Num certo tipo de fabricação de fita magnética, ocorrem cortes a uma taxa de um por 2000 pés.
Qual a probabilidade de que um rolo com 2000 pés de fita magnética tenha:
(a) nenhum corte;
(b) no máximo 3 cortes;
(c) pelo menos dois cortes.
Exercício 10
Os passageiros de uma linha aérea chegam às instalações de passageiros de um grande aeroporto
internacional a uma taxa média de 10 por minuto.
(a) Qual é a probabilidade de nenhuma chegada em 1 minuto?
(b) Qual é a probabilidade de que 3 passageiros ou menos cheguem em um período de 1
minuto?
(c) Qual é a probabilidade de nenhuma chegada em um período de 15 minutos?
Exercício 11
Depois de tomarmos várias amostras, decidiu-se adotar um modelo para as medidas do perímetro
do tórax de uma população de homens adultos com os parâmetros: média = 40 polegadas e desvio
padrão = 2 polegadas.
(a) Qual é a probabilidade de um indivíduo sorteado desta população ter um perímetro de tórax
entre 40 e 43 polegadas?
(b) Qual é a probabilidade de um indivíduo sorteado desta população ter um perímetro de tórax
maior ou igual a 43 polegadas?
(c) Qual é a probabilidade de um indivíduo sorteado desta população ter um perímetro de tórax
menor que 35 polegadas?
(d) Qual é o valor do tórax que seria ultrapassado por 25% da população?
Exercício 13
O diâmetro X de rolamentos de esfera fabricados por certa fábrica tem distribuição Normal com
média = 0,6140 e variância = (0,0025)2. O lucro T de cada esfera depende de seu diâmetro, e:
T = 0,10 se a esfera é boa (0,6100 < X < 0,6180);
T = 0,05 se a esfera é recuperável (0,6080 < X < 0,6100 ou 0,6180 < X < 0,6200);
T = - 0,10 se a esfera é defeituosa (X < 0,6080 ou X > 0,62). Calcular:
(a) As probabilidades das esferas serem boas, recuperáveis e defeituosas.
(b) A esperança do lucro ( E(T) ).
A tomada de decisões sobre a população com base em estudos feitos sobre os dados da
amostra constitui o problema central da Inferência Estatística. A tais decisões estão sempre
associados um grau de incerteza e, conseqüentemente, uma probabilidade de erro. A generalização
da amostra para a população é feita com o auxílio de um modelo estatístico para a situação em
estudo.
Conceitos Importantes
Parâmetro: qualquer função da população (θ).
Exemplos: P (proporção), µ (média), σ2 (variância).
Estimativa: valor que a estatística (ou o estimador) assume em uma amostra (θ0).
Exemplos: p̂ (proporção), x (média), s2 (variância).
Objetivo
Estimar uma proporção p (desconhecida) de elementos de uma população, apresentando certa
característica de interesse, a partir da informação fornecida de uma amostra.
Exemplos
p: proporção de consumidores satisfeitos com os serviços prestados por uma empresa de telefonia;
p: proporção de eleitores de São João del-Rei que votariam em um determinado candidato, caso a
eleição para prefeito se realizasse hoje;
p: proporção de crianças de 2 a 6 anos, do estado de Minas Gerais, que não estão matriculadas em
escola de educação infantil.
Estimador Pontual
O estimador pontual para p (proporção amostral) é definido por:
X
P̂ =
n
sendo que X denota o número de elementos na amostra que apresentam a característica;
n denota o tamanho da amostra coletada.
O valor assumido por p̂ na amostra é denominado estimativa pontual para p.
Estimativa Intervalar
Idéia: Se selecionarmos várias amostras de uma população contendo n dados, observaremos que
cada amostra terá sua respectiva proporção. A fim de obtermos uma estimativa da proporção da
população em estudo com certo grau de confiabilidade, recorremos a um intervalo de confiança,
que delimita essa proporção.
A estimativa por intervalo de p corresponde a um intervalo determinado da seguinte
maneira:
[ pˆ − ε ; pˆ + ε ] ,
sendo que ε representa o erro amostral ou margem de erro.
Exemplos
1) No exemplo da UFSJ, considere agora, n = 500 e pˆ = 0,20 . Construa um intervalo de confiança
para p com coeficiente de confiança γ = 0,95.
Resolução: Como γ = 0,95 fornece z = 1,96, o intervalo é dado por:
⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤ ⎡ 0,20 x0,80 0,20 x0,80 ⎤
⎢ pˆ − z ; pˆ + z ⎥ = ⎢0,20 − 1,96 ; 0,20 + 1,96 ⎥ = [0,165; 0,235]
⎣ n n ⎦ ⎣ 500 500 ⎦
Nesse intervalo (γ=0,95), a estimativa pontual para p é 0,20, com um erro amostral ε igual a
0,035.
1) A gerente de uma empresa quer estimar a proporção p de clientes que gostaram da última
exposição de arte apresentada pela empresa. Numa amostra de 300 clientes, 270 afirmaram que
gostaram da exposição. Qual seria a estimativa pontual de p?
2) Numa eleição de segundo turno, um instituto de pesquisa de opinião obteve, num levantamento
de boca de urna, que 40% (p = 0,40) dos entrevistados votaram no candidato A.
(a) Construa intervalos de confiança para a verdadeira proporção p de eleitores que votaram no
candidato A com coeficientes de confiança de 90%, 95% e 99%. Compare os intervalos. Comente.
Admita aqui que o tamanho da amostra seja n = 150.
b) Construa intervalos de confiança para p admitindo que a estimativa p̂ = 0,40 foi obtida de
amostras de tamanho n = 100, n = 150 e n = 200. Compare os intervalos. Comente. Considere aqui
um coeficiente de confiança de 90%.
Objetivo
Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de
uma população, a partir de uma amostra.
Exemplos
µ: quantia média gasta por cliente;
µ: salário médio dos empregados de um a indústria;
µ: tempo médio gasto usando a Internet.
Estimativa Pontual
Vamos observar n elementos, extraídos ao acaso de uma população;
Para cada elemento selecionado, observamos o valor da variável X de interesse.
Na prática, temos que o intervalo de confiança para µ com um nível de confiança γ é dado
por:
⎡ σ σ ⎤
⎢x − z n ; x + z n ⎥
⎣ ⎦
onde x é a média amostral, σ é o desvio padrão populacional e n é o tamanho amostral. Sendo
σ
assim, temos que o erro é: ε = z .
n
Exemplo: Não se conhece o consumo médio de combustível de automóveis da marca T. Sabe-se,
no entanto, que o desvio padrão do consumo de combustível de automóveis dessa marca é 10 km/l.
Na análise de 100 automóveis da marca T, obteve-se consumo médio de combustível de 8 km/l.
Encontre um intervalo de confiança para o consumo médio de combustível dessa marca de carro.
Adote um nível de confiança igual a 95%.
Graus de Liberdade
p = 90% 80% 70% 60% 50% 40% 30% 20% 10% 5% 4% 2% 1%
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 15,894 31,821 63,657 1
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 4,849 6,965 9,925 2
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 3,482 4,541 5,841 3
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 2,998 3,747 4,604 4
5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 2,756 3,365 4,032 5
6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 2,612 3,143 3,707 6
7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,517 2,998 3,499 7
8 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,449 2,896 3,355 8
9 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,398 2,821 3,250 9
10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 0,359 2,764 3,169 10
11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,328 2,718 3,106 11
12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,303 2,681 3,055 12
13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,282 2,650 3,012 13
14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,264 2,624 2,977 14
15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,248 2,602 2,947 15
16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,235 2,583 2,921 16
17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,224 2,567 2,898 17
18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,214 2,552 2,878 18
19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,205 2,539 2,861 19
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,197 2,528 2,845 20
21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,189 2,518 2,831 21
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,183 2,508 2,819 22
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,177 2,500 2,807 23
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,172 2,492 2,797 24
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,166 2,485 2,787 25
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,162 2,479 2,779 26
27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,158 2,473 2,771 27
28 0,127 0,256 0,389 0,530 0,684 0,855 1,056 1,313 1,701 2,048 2,154 2,467 2,763 28
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,150 2,462 2,756 29
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,147 2,457 2,750 30
35 0,126 0,255 0,388 0,529 0,682 0,852 1,052 1,306 1,690 2,030 2,133 2,438 2,724 35
40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,123 2,423 2,704 40
50 0,126 0,254 0,387 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,109 2,403 2,678 50
60 0,126 0,254 0,387 0,527 0,679 0,848 1,045 1,296 1,671 2,000 2,099 2,390 2,660 60
120 0,126 0,254 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,076 2,358 2,617 120
Graus de Liberdade
Graus de Liberdade
Exemplo:
1) Para n = 11 e p = 10%, temos t = 2) Para n = 11 e p = 5%, temos t =
3) Para n = 11 e p = 1%, temos t = 4) Para n = 20 e p = 15%, temos t =
Exemplo: Qual o intervalo de confiança para a média, no nível de 95%, sendo que uma amostra de
tamanho 20 forneceu média 38 e desvio padrão 5?
Solução:
x = 38 , n = 20, s = 5. No nível de 95%, obtemos o valor de t cruzando na tabela da t – Student: p =
5% e gl = n-1 = 20-1 = 19 → t = 2,093. Assim:
⎡ s s ⎤ ⎡ 5 5 ⎤
IC[µ, 95%] = ⎢ x − t , x+t ⎥ = ⎢38 − 2,093 , 38 + 2,093 ⎥ = [35.66 , 40.34]
⎣ n n⎦ ⎣ 20 20 ⎦
Exemplo: Estabeleça limites de confiança para a média, no nível de 90%, sendo que uma amostra
de tamanho 16 forneceu média 70 e desvio padrão 6,8?
Solução:
Temos que x = 70 , n = 16, s = 6,8 e para um nível de 90%, obtemos o valor de t cruzando na
tabela da t – Student: p = 10% e gl = n-1 = 16-1 = 15 → t = 1,753. Assim:
⎡ s s ⎤ ⎡ 6,8 6,8 ⎤
IC[ µ , 90%] = ⎢ x − t , x +t ⎥ = ⎢70 − 1,753 , 70 + 1,753 ⎥ = [ 67.02 , 72.98]
⎣ n n⎦ ⎣ 16 16 ⎦
13.1. Introdução
Quando colhemos uma amostra de uma determinada população, nosso objetivo é tirar
conclusões sobre os parâmetros dessa população. Assim, a partir das informações amostrais
estimamos os parâmetros da população.
Entretanto, se existe algum referencial sobre valores que os parâmetros de uma população
devem assumir, podemos testar hipóteses, formuladas sobre esses parâmetros, de conformidade
com as informações obtidas da amostra. Igualmente, pode-se testar a hipótese de que uma amostra
pertence a uma população de parâmetros dados ou ainda, se duas populações têm parâmetros
iguais.
Exemplo: Numa amostra de 100 peças produzidas por uma máquina foram encontradas 4
defeituosas. A proporção de peças defeituosas é p =0,05?
Erro tipo I: (α) – Rejeitar a hipótese H0 quando na realidade ela é verdadeira. (α é chamado de
nível de significância do teste)
(a) Os valores de α e β são as probabilidades de cada um dos erros tipo I e tipo II ocorrerem,
respectivamente, ou seja,
Exemplo 1: Numa amostra de 100 peças produzidas por uma máquina foram encontradas 4
defeituosas. Testar ao nível de significância de 5%, a hipótese de que a proporção de peças
defeituosas é p = 0,03 ou é maior.
Solução:
Hipóteses: H0: p = 0,03
Ha: p > 0,03 (curva unilateral à direita )
Para um nível de significância de 5% temos da Tabela da distribuição Normal Padrão que o z que
fornece a área cinza de 0,05, representada na figura, é z = 1,64.
Fórmula para obter o z observado na amostra:
p̂ − p 0,04 − 0,03 0,01
zobs = = = ≅ 0,5103
p(1 − p) 0,03(1 − 0,03) 0,0384
n 100 100
Região de
Aceitação
Região Crítica
Conclusão do Teste de Hipóteses: Como zobs = 0,5103 < z = 1,64, não conseguimos rejeitar H0,
isto é, aceita-se a hipótese de que a proporção de peças defeituosas é igual a 0,03.
Oliveira, D. C. R. e Oliveira, M. S. 85 ____/____/____
Exemplo 2: Numa amostra de 100 peças produzidas por uma máquina foram encontradas 3
defeituosas. Testar ao nível de significância de 5%, a hipótese de que a proporção de peças
defeituosas é p = 0,08 ou é menor.
Solução:
Hipóteses: H0: p = 0,08
Há: p < 0,08 (curva unilateral à esquerda)
Região de
0,05 Aceitação
Região Crítica
Para um nível de significância de 0,05 temos que z = - 1,64. O valor de z observado na amostra é:
p̂ − p 0,03 − 0,08 − 0,05
zobs = = = ≅ −1,84
p(1 − p) 0,08(1 − 0,08) 0,0736
n 100 100
Conclusão do Teste de Hipóteses: Como zobs = -1,84 < z = -1,64, então rejeito H0, ou seja, há
indícios de que a proporção de peças defeituosas é menor que 0,08.
Exemplo 3: Numa amostra de 100 peças produzidas por uma máquina foram encontradas 4
defeituosas. Testar ao nível de significância de 5%, a hipótese de que a proporção de peças
defeituosas é p = 0,05 ou é diferente.
Solução:
Hipóteses: H0: p = 0,05
Ha: p ≠ 0,05 (teste bilateral)
Regra de decisão para Nível de Significância α = 0,05:
0,025
0,025 Região de Aceitação
Regiões Críticas
Considerando o nível de significância de 5%, temos que os z’s que fornecem as áreas cinza
representada na figura acima, é z = - 1,96 e z= 1,96. O valor de z observado na amostra é:
Oliveira, D. C. R. e Oliveira, M. S. 86 ____/____/____
p̂ − p 0,04 − 0,05 − 0,01
zobs = = = ≅ −0,46
p(1 − p) 0,05(1 − 0,05) 0,05 . 0,95
n 100 100
Conclusão do Teste de Hipóteses: Como z = -1,96 < zobs = -0,46 < z = 1,96, então não rejeitamos
H0, isto é, aceito a hipótese de que a proporção de peças defeituosas é igual a 0,05.
2) Um contador acredita que os problemas de fluxo de caixa de uma empresa são o resultado direto
do lento recebimento das contas a receber. O contador afirma que pelo menos 70% das atuais
contas a receber têm mais de dois meses de idade. Uma amostra de 120 contas a receber mostrou
que 78 têm mais do que dois meses de idade. Teste a afirmação do contador a um nível de
significância de 5%.
Região de
Aceitação
Região Crítica
Conclusão do Teste de Hipóteses: Como zobs = 2,65 > z = 1,64, então rejeito H0, isto é, aceito a
hipótese de que a média da população é maior que 40.
Região de
Aceitação
0,05
Região Crítica
Conclusão do Teste de Hipóteses: Como zobs = -1 > z = -1,64, então aceito H0, isto é, aceito a
hipótese de que a média da população é igual a 44.
Hipóteses: H0: µ = 40
Ha: µ ≠ 40 (teste bilateral)
Nível de significância = 5% ⇒ z = -1,96 e z = 1,96.
x − µ 40 − 40 40 − 40 0
Valor de z observado na amostra: zobs = = = = =0
σ 12 12 2
n 36 6
0,025
0,025 Região de Aceitação
Regiões Críticas
Conclusão do Teste de Hipóteses: Como z = -1,96 < zobs = 0 < z = 1,96, então aceito H0, isto é,
aceito a hipótese de que a média da população é igual a 40.
Oliveira, D. C. R. e Oliveira, M. S. 89 ____/____/____
13.8. Exercícios – Parte III – A3
1) Uma máquina automática de encher pacotes de café enche-os segundo uma distribuição normal,
com média µ e variância (conhecida) 400 g2. A máquina foi regulada para µ = 500g. Desejamos, de
meia em meia hora, colher uma amostra de 16 pacotes e verificar se a produção está sob controle,
isto é, se µ = 500g ou não. Se uma dessas amostras apresentasse uma média x = 492g, você
pararia ou não a produção? Considere um nível de significância de 1%.
2) Sabe-se que o consumo mensal per capita de um determinado produto tem distribuição normal,
com desvio padrão (conhecido) 2 kg. A diretoria de uma firma que fabrica esse produto resolveu
que retiraria o produto da linha de produção se a média de consumo per capita fosse menor que 8
kg. Caso contrário, continuaria a fabricá-lo. Foi realizada uma pesquisa de mercado, tomando-se
uma amostra de 25 indivíduos, e verificou-se um consumo mensal médio de x = 7,2. Construa um
teste de hipótese adequado, utilizando um nível de significância de 5%, e com base na amostra
colhida, determine a decisão a ser tomada pela diretoria da firma.
Exemplo 1: Foi testada uma amostra de 9 cigarros de uma certa marca, com relação ao nível de
nicotina, fornecendo média x = 42 mg e desvio padrão s = 6 mg. Testar ao nível de significância de
5%, a hipótese de que a média é maior que 40 mg.
Solução:
Hipóteses: H0: µ = 40
Ha: µ > 40 (curva unilateral à direita)
Nível de significância de 5%, obtemos na Tabela da t-Student o t que fornece a área cinza de 0,05,
representada na figura.
Graus de liberdade: n – 1 = 9 – 1 = 8.
Se o teste tiver cauda unilateral à direita: p = 2 x α = 2 x 0,05 = 0,10 = 10%. Então: t = 1,860.
x − µ 42 − 40 2 2
Valor de t observado na amostra: tobs = = = = =1
s 6 6 2
n 9 3
Conclusão do Teste de Hipóteses: Como tobs = 1 < t = 1,860, então aceito H0, isto é, aceito a
hipótese de que a média da população é igual a 40.
Nível de significância de 5%, obtemos na Tabela da t-Student o t que fornece a área cinza de 0,05,
representada na figura.
Graus de liberdade: n – 1 = 16 – 1 = 15.
Se o teste tiver cauda unilateral à esquerda: p = 2 x α = 2 x 0,05 = 0,10 = 10%. Então: t = 1,753.
x − µ 40 − 44 − 4 − 4
Valor de t observado na amostra: tobs = = = = = −4
s 4 4 1
n 16 4
Região de Aceitação
Região de Rejeição
Conclusão do Teste de Hipóteses: Como t = -2,131 < tobs = 2 < t = 2,131, então aceito H0, isto é,
aceito a hipótese de que a média da população é igual a 40.
2) A experiência de muitos anos de uso de uma lâmpada, da marca A, tem mostrado que sua vida
média é de µ = 300 horas. Uma amostra de n = 9 lâmpadas de uma nova marca B deu uma vida
média de x = 290 horas com desvio padrão de s = 6 horas. Testar, ao nível de significância de 10%,
se as lâmpadas das duas marcas têm a mesma vida média ou se a vida média da B é menor que a da
A.
3) Uma amostra de 16 empregados de uma empresa forneceu os seguintes resultados com relação
às alturas: média 173 cm e desvio padrão 16 cm. Testar ao nível de 10% as hipóteses de que a
média da população é igual ou diferente 175cm.
Exercício 02
Uma amostra de 50 estudantes de uma Universidade mostrou que 8 destes apresentam problemas
visuais. Obter a estimativa intervalar, no nível de 90%, para a verdadeira percentagem dos
estudantes com problemas visuais.
Exercício 03
Uma amostra de n = 64 elementos de uma variável normalmente distribuída forneceu média 25,4,
sendo que o desvio padrão populacional é 5,2. Determine o intervalo de confiança de 90% para a
média.
Exercício 04
Determine o intervalo de confiança de 99% para a média do ponto de fusão de uma substância
química, sendo que uma amostra de tamanho n = 9 pontos de fusão desta mesma substância
forneceu uma média 75 e um desvio padrão amostral igual a 7.
Exercício 05: Uma moeda é lançada 100 vezes, obteve-se 42 caras. Testar com um nível de
significância de 10% a hipótese de que essa moeda é viciada.
Exercício 06: Uma amostra de 50 alunos de uma escola de 1o grau apresentou 3 canhotos. Testar,
ao nível de significância 10%, a hipótese de que a percentagem de alunos canhotos dessa escola é
diferente de 0,05.
Exercício 07: Sabe-se que o consumo mensal per capita de um determinado produto tem
distribuição normal, com desvio padrão 2 kg. A diretoria de uma firma que fabrica esse produto
resolveu que retiraria o produto da linha de produção se a média de consumo per capita fosse
menor que 8 kg. Caso contrário, continuaria a fabricá-lo. Foi realizada uma pesquisa de mercado,
tomando-se uma amostra de 25 indivíduos, e verificou-se um consumo mensal médio de x = 7,2.
Construa um teste de hipótese adequado, utilizando um nível de significância de 5%, e com base na
amostra colhida, determine a decisão a ser tomada pela diretoria.
Exercício 08: A experiência de muitos anos de uso de uma lâmpada, da marca A, tem mostrado
que sua vida média é de µ = 300 horas. Uma amostra de n = 9 lâmpadas de uma nova marca B deu
uma vida média de x = 290 horas com desvio padrão de s = 6 horas. Testar, ao nível de
significância de 10%, se as lâmpadas das duas marcas têm a mesma vida média ou se a vida média
da B é menor que a da A.
Exercício 09: Uma amostra de 16 empregados de uma empresa deu os seguintes resultados com
relação às alturas: média 173 cm e desvio padrão 16 cm. Testar ao nível de 10% as hipóteses de que
a média da população é igual ou diferente 175cm.
Observação: O gabarito da Lista de Exercícios 3 encontra-se no Apêndice C
2) (a) Qualitativa Ordinal; (b) Qualitativa Nominal; (c) Quantitativa Discreta; (d) Quantitativa Contínua.
3) Aleatória Simples: 61, 09, 26, 29, 11, 77, 79, 04, 57, 59.
Sistemática:N/n = 80/10 = 8; x = 6; Amostra: 6, 14, 22, 30, 38, 46, 54, 62, 70, 78.
Estratificada: Mulheres (4): 09, 26, 29, 11. Homens (6): 09, 26, 29, 11, 04, 02.
4) Zonas: 045, 020, 099, 033, 197, 166, 040, 005, 038, 115, 041, 173, 030, 025, 123.
5) (a)
Tabela: Conceitos obtidos de 60 alunos na disciplina de Estatística na Escola E
Conceitos Freqüência Absoluta Proporção Porcentagem
Ótimo 03 0,05 05,0
Bom 22 0,367 36,7
Médio 25 0,417 41,7
Ruim 10 0,166 16,6
Total 60 1 100
Interpretação: Podemos observar na Tabela acima que a maior proporção dos alunos da Escola E obtiveram conceito
Médio na disciplina Estatística (42%) e apenas 5% conquistaram o conceito Ótimo. Além disso, 37% concluíram com
conceito Bom e 16% com conceito Ruim.
(b)
25
25
22
20
Frequência Absoluta
15
10
10
5
3
0
Ótim o Bom Médio Ruim
Conce it o
Figura: Gráfico de Barras para os Conceitos obtidos na disciplina de Estatística de 60 alunos da Escola E.
B
O 36,7%
5,0%
M
41,7%
Figura: Gráfico de Composição em Setores para os Conceitos obtidos na disciplina de Estatística de 60 alunos da
Escola E. (O : Ótimo; B : Bom; M : Médio; R : Ruim)
60 100
50
Porcentagem Acumulada
80
Freqüência Absoluta
40
60
30
40
20
20
10
0 0
Conceitos Médio Bom Ruim Ótimo
Count 25 22 10 3
Percent 41,7 36,7 16,7 5,0
Cum % 41,7 78,3 95,0 100,0
Figura: Gráfico de Pareto para os Conceitos obtidos na disciplina de Estatística de 60 alunos da Escola E.
(d)
0,18
0,16129
0,16
0,14
0,12
Densidade
0,0967742 0,0967742
0,10
0,0806452
0,08
0,06
0,0483871
0,04
0,016129
0,02
0,00
10 12 14 16 18 20 22
Comprimento
Figura: Histograma do comprimento de 31 canos PVC vendidos em uma loja de material de construção.
(e)
10 11 12 13 14 15 16 17 18 19 20 21 22
Compriment o
Figura: Diagrama de dispersão unidimensional do comprimento de 31 canos PVC vendidos em uma loja de material de
construção.
20
18
Comprimento
16
14
12
10
Figura: Box-plot do comprimento de 31 canos PVC vendidos em uma loja de material de construção.
1 10 0
1 11
3 12 35
4 13 8
7 14 117
10 15 035
(7) 16 0013799
14 17 049
11 18 28
9 19 3557
5 20 035
2 21
2 22 00
Figura: Ramo-e-folhas do comprimento de 31 canos PVC vendidos em uma loja de material de construção.
7) a) Média = 69,87 e Mediana = 68. A média e a mediana foram bem diferentes. Embora 50% dos índios tenham
pulsação abaixo de 68, os índios com maior pulsação, fez com que o valor médio da pulsação fosse maior, isto é,
aproximadamente 70. Quando os valores são distintos da média e mediana, implica que os dados são assimétricos.
(conforme mostra o gráfico da alternativa (d) desse exercício)
b) Mínimo = 60, Q1 = 60, Q3 = 76 e Máximo = 88.A menor e a maior pulsação foram 60 e 88, respectivamente. 25%
dos índios tiveram pulsação inferior a 60 e 25% superior a 76. 50% obtiveram entre 60 e 76.
c) Variância = 91,12 e Desvio Padrão = 9,55. A variabilidade das pulsações foi de 9,55 em torno do valor médio da
pulsação.
d)
3
Freqüência Absoluta
0
60 64 68 72 76 80 88
P u ls aç ão
Figura: Gráfico de barras das medidas da pulsação de 15 índios nativos dos Alpes Peruanos.
9)
Embora as medidas de dispersão, em geral, mostram que o medicamento C tem maior variabilidade dos dados, as
medidas de posição mostraram que o medicamento C é o que fornece menor tempo de cicatrização do completo
fechamento dos cortes provenientes de cirurgia.
10) (a)
80
70
60
Mortes
50
40
30
65 70 75 80 85
Barcos
Figura: Gráfico de Dispersão do número de peixes-boi mortos versus o número de barcos de turismo (em milhares) que
circulam em seu habitat na Flórida-EUA.
Podemos observar visualmente que há uma relação linear positiva entre o número de peixes-boi mortos com o número
de barcos de turismo (em milhares), isto é, quanto mais barcos passar no habitat dos peixes-boi, maior será o número
de mortes.
(b) r ≅ 0,922. Podemos notar através de r, que a correlação positiva entre X e Y é significativa.
(c) Mortes = 2,27*Barcos – 113
11) (a)
120
110
100
Massa
90
80
70
60
40 50 60 70 80
Idade
Figura: Gráfico de Dispersão da idade versus a massa muscular de 18 mulheres com idade entre 40 e 79 anos.
(b) r = – 0,837. O valor do coeficiente de correlação indica que as variáveis idade e massa muscular estão relacionadas
linearmente de forma negativa, ou seja, quanto maior a idade menor é a massa muscular.
(c) Y = 148,197 – 1,027 X. O coeficiente a = 148,197 (intercepto) não pode ser interpretado, porque a variação de X
não contém o valor 0. O coeficiente b = - 1,027 (inclinação) indica que a cada aumento de um ano na idade, espera um
decréscimo de aproximadamente 1 da massa muscular.
⎡ 0,03.0,97 0,03.0,97 ⎤
1) IC[P ; 95%] = ⎢0,03 − 1,96 ; 0,03 + 1,96 ⎥ = [0 ; 0,0634]
⎣ 100 100 ⎦
⎡ 0,16.0,84 0,16.0,84 ⎤
2) IC[P ; 90%] = ⎢0,16 − 1,645 ; 0,16 + 1,645 ⎥ = [0,075 ; 0,245]
⎣ 50 50 ⎦
⎡ 5,2 5,2 ⎤
3) IC[µ ; 90%] = ⎢25,4 − 1,645 ; 25,4 + 1,645 ⎥ = [24.3 ; 26.5]
⎣ 64 64 ⎦
⎡ 7 7 ⎤
4) IC[µ ; 99%] = ⎢75 − 3,355 ; 75 + 3,355 ⎥ = [67.2 ; 82.8]
⎣ 9 9⎦
5) Hipóteses: Ho: p = 0,5
Ha: p ≠ 0,5
Nível de Significância: α = 0,10
Proporção Amostral: pˆ = 0,42
0,42 − 0,5
Estatística do Teste: z observado = = −1.6
0,5.0,5
100
Regra de Decisão: Pela tabela da distribuição normal, Ha e nível de significância:
RC = (-∞ , -1.645] ∪ [1.645 , +∞)
RA = (-1.645 , 1.645)
Conclusão: Como zobservado ∈ RA, então não rejeito Ho com um nível de significância de 10%, ou seja, não podemos
afirmar que a moeda é viciada.
7) Hipóteses: Ho: µ = 8 kg
Ha: µ < 8 kg
Nível de Significância: α = 0,05
c) Construa o Dot-Plot de X no MINITAB e escreva em qual intervalo de valores de X estão a maior parte
dos dados.
g) Faça o teste-t para testar, com um nível de significância de 5% se: Ho: µ = 50 contra Ha: µ ≠ 50.
X X
h) Sabendo que o desvio de Y é igual a 10, teste com um nível de significância de 10% as hipóteses: Ho: µ
Y
= 256 contra Ha: µ > 256.
Y
2) Se entrevistamos 1500 pessoas e 1050 são a favor de um candidato, teste com um nível de significância
de 1% se ele vencerá as eleições.
3) Quando uma máquina nova está funcionando adequadamente, somente 3% dos itens produzidos
apresentam defeitos. Suponha que 5 itens são selecionadas aleatoriamente.
(a) Qual a probabilidade de encontrarmos 2 defeituosos?
4) Para fazer o controle de qualidade numa empresa, lotes com 100 peças são examinados. Todo lote é
composto por 10 peças defeituosas. Após coletar uma amostra de 5 peças sem reposição, calcule a
probabilidade de que nessa amostra não haja nenhum item defeituoso?
5) Durante o período de tempo em que reservas por telefone estão sendo feitas na universidade local, as
chamadas chegam à razão de uma a cada dois minutos.
(a) Qual é a probabilidade de 3 chamadas em 2 minutos?