You are on page 1of 16

Estatstica e Probabilidade

Prof. Robson Soares Ferreira

Introduo Estatstica. Medidas de posio e medidas de disperso.

Estatstica - Introduo
uma parte da matemtica aplicada que fornece mtodos para a coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. A coleta, organizao e a descrio dos dados esto a cargo da Estatstica descritiva, enquanto que a anlise e a interpretao ficam a cargo da Estatstica Indutiva ou Inferencial. Fases do mtodo estatstico: Coleta de dados; Crtica dos dados; Exposio ou apresentaes dos dados; Anlise ou apresentao dos dados. Populao Ao conjunto de entes portadores de, pelo menos, uma caracterstica comum denominamos populao estatstica ou universo estatstico. Amostra Um subconjunto da populao. Para as inferncias serem corretas, necessrio garantir que a amostra possua pelo menos uma caracterstica bsica da populao. Tabelas um resumo dos dados. Numa tabela devem ter: Ttulo O qu? Quando? Onde? Corpo - As informaes sobre a varivel em estudo Fonte Notas ou chamadas no rodap (Quem?) Grficos uma forma de apresentao dos dados estatsticos, cujo objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais rpida e viva do fenmeno em estudo. A apresentao do grfico deve ser clara, simples e objetiva. Levantamento estatstico Fases do trabalho estatstico: Definio do problema Coleta de dados Apurao dos dados Apresentao dos dados (tabelas e grficos) Anlise e informao. Concluso

Qualitativas (qualidade) Variveis Quantitativas (quantidade)

Ordinais (tem que estar em ordem) Nominais (tem que estar em nome)

1, 2, 3 patentes Cor, Religio, Sexo

Discreta (enumerveis obtida por meio de contagem) Contnua ( obtida por meio de medio. Varivel mensurvel) Ex.: Altura de uma pessoa 1,72

Distribuio de frequncia
Ex.: Dados a amostra de 60 medidas de uma dada regio geogrfica: 10 3 10 2 5 8 Fonte: hipottica Dados brutos So os dados colhidos e dispostos em colunas e linhas (dados desordenados). Rol organizao numrica dos dados brutos (em ordem crescente ou decrescente). Amplitude total variao entre o maior e o menor valor observado. At = S I At = 16 1 = 15 Amplitude de classe (h) De forma prtica encontramos o valor da amplitude de classe aplicando as frmulas 7 15 11 1 9 6 8 1 12 3 5 7 5 13 13 8 3 8 4 14 14 10 2 9 3 4 2 1 3 1 2 3 15 13 3 12 9 6 5 14 4 13 9 6 4 15 4 14 6 8 10 16 4 16

At

5 20 0,75 h 3

At

Exemplo: 15 / 5 = 3 e 15 / 20 = 0,75 h=3 Ttulo Classe 1 | 4 4 | 7 7 | 10 10 | 13 13 || 16 fi 15 14 11 7 13 60

Font: hipottica Elementos de uma distribuio de frequncia fi frequncia absoluta ou frequncia simples absoluta.

Limites de classe (1 | 4)

LI limite inferior

LS limite superior

Ponto mdio (xi) - xi

LI

LS 2

ou xi

LI

h 2

Frequncia relativa (ou probabilidade)

fr

fi fi

100%

fac Frequncia acumulada crescente (menor do que ou abaixo de LS) fad - Frequncia acumulada decrescente (maior do que ou acima de LI)
Classe 1 | 4 4 | 7 7 | 10 10 | 13 13 || 16 fi 15 14 11 7 13 60 xi fac fad fr

Exerccio Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais emitidos durante um ms. Preencha os dados que faltam na tabela. Valor da nota N de notas 10 3 R$ 7 12 12 17 17 22 22 27 27 32 32 37 37 42 Fonte:hip 2 5 13 10 9 6 5 50 xi fac fad

Pede-se: a) A frequncia relativa da 3 classe. b) A classe de menor frequncia. c) O intervalo de maior frequncia. d) Os nmeros de notas fiscais cujo valor inferior a R$ 24.500,00. e) A porcentagem de notas fiscais cujo valor est compreendido entre R$ 12.000 e R$ 25.000,00

Medidas de posio Mdia ( x )


Dados no agrupados

x n

Soma de todos os valores amostrais Nmero de valores amostrais

Exemplo: Dada a amostra A = {2, 4, 5, 8, 2, 7}, calcule a mdia.

5 6

7 28 6

4,67

Exemplo prtico: Sabe-se que o chumbo tem alguns efeitos adversos sade. Abaixo esto listadas as medidas das quantidades de chumbo (em microgramas por metro cbico, ou g/m3. As medidas mostradas abaixo foram registradas no local do Edifcio 5 do World Trade Center, em dias diferentes, logo aps a destruio causadas pelos ataques terroristas de 11 de setembro de 2011. Ache a mdia para essa amostra de medidas de nveis de chumbo no ar. 5,40 1,10 0,42 0,73 0,48 1,10

x n

5,40

1,10

0,42 6

0,73

0,48

1,10

9,23 6

1,538

O nvel mdio de chumbo 1,538 g/m3. Independente do valor da mdia, tambm de se notar que o conjunto de dados contm um valor (5,40) que est bem afastado dos demais (outlier). Nesse caso, o nvel de chumbo de 5,40 g/m3 foi medido um dia aps o desmoronamento do World Trade Center, e havia nveis elevados de poeira e fumaa. Tambm, alguma quantidade de chumbo poderia ser proveniente do grande nmero de veculos que se dirigiam para o local. Esses fatores fornecem uma explicao razovel para um tal valor extremo.

Dados agrupados

fixi fi

477 60

7,95

Classe 1 | 4 4 | 7 7 | 10 10 | 13 13 || 16

fi
15 14 11 7 13

xi
2,5 5,5 8,5 11,5 14,5

fixi
37,5 77 93,5 80,5 188,5

60

477,0

Mediana(Md)
Uma desvantagem da mdia que ela sensvel a qualquer valor, de modo que um valor excepcional pode afetar dramasticamente a mdia. A mediana supera grandemente essa desvantagem. A mediana pode ser considerada como um "valor do meio", no sentido de que cerca da metade dos valores no conjunto dos dados est abaixo da mediana e metade est acima dela. A definio que se segue mais precisa. A mediana de um conjunto de dados a medida de centro que o valor do meio quando os dados originais esto arranjados em ordem crescente (ou decrescente) de magnitude. De forma simples podemos pensar que a mediana o valor da abscissa que ser 50% das observaes. Dados no agrupados Encontre a mediana para a amostra. 5,40 1,10 0,42 0,73 0,48 1,10

1) Ordene os valores 0,42 0,48 0,73 1,10 1,10 5,40

Como o numero de valores um nmero par (6), a mediana encontrada pelo clculo da mdia dos dois valores do meio (0,73 e 1,10).

Md

0,73 2

1,10

0,915

Dados agrupados

15

14

11

13 Posio = 16
30

| --------- | ------ | ------ | ------ | ------ |

n 60 2 2

30

1
30

10

13

Md

10 11 Md

7 Md 3

7 1 77 7,27

n / 2 fac ant

11 N Md LI 2 fi md fac ant .h

Dados no agrupados A = {2, 4, 5, 8, 2, 7} 2, 2, 4 | 5, 7, 8

xi n xi n
1

Md Md

2 4 5 2 4,5

B = {2, 5, 3, 15, 8} 2, 3, 5, 8, 15 Md = 5 Obs.: Se os dados no estiverem ordenados necessrio que ordene os dados antes de calcular a mediana.

Moda o valor que ocorre com maior frequncia ou o valor da abscissa de ordenada mxima (Mo).

Dados no agrupados A = {2, 4, 5, 8, 2, 7}. Mo = 2 B={5, 1, 3, 2, 9} Amodal (moda no existe)

Dados agrupados

Mo
1 2

Li
1

1 2

fi Mo fiant fi Mo fi post

Tomando como exemplo a distribuio de frequncia da pgina 6, calcule a moda.

Atividades para fixao 1) Para cada srie, calcule a mdia, a mediana e a moda. a) 2, 4, 6, 8 b) 2, 2, 8, 6, 6, 5, 4, 3, 2, 2, 3, 3, 6, 3, 5, 5, 4, 4, 4, 4 c) Ttulos: classes 20 25 30 35 40 25 30 35 40 45 fi 6 10 18 9 7 50

2) Foram feitas oito medidas do dimetro interno dos anis de pisto forjados de um motor de uma automvel. Os dados (em mm) so: 74,001; 74,003; 74,015; 74,000; 74,005; 74,002; 74,005 e 74,004. Calcule a mdia e a mediana da amostra. 3) Como determinar o maior valor que um determinado nmero pode assumir, sabendo que ele pertence a um grupo com cinco nmeros inteiros distintos, estritamente positivos, cuja mdia 16? 4) Um fabricante de molas est interessado em implementar um sistema de controle da qualidade para monitorar seu processo de produo. Como parte desse sistema de qualidade, foi decidido registrar o nmero de molas fora de conformidade, em cada batelada de produo, com um tamanho igual a 50. Durante 40 dias de produo, 40 bateladas de dados foram coletadas sendo reportadas abaixo. 9 8 11 19 12 5 4 19 6 9 4 18 9 7 8 12 7 8 7 11 14 11 5 17 12 3 6 15 4 6 4 17 6 7 5 13 7 7 8 13

a) Construa uma tabela de distribuio de frequncia, com as colunas fac, fad, fr. b) Encontre a mdia, mediana e moda da amostra. 5) Observe a tabela abaixo que representa a distribuio da idade de 50 pessoas, organizada por faixas de idade: Idade (anos) 10 l 20 20 l 30 30 l 40 40 l 50 50 l 60 N de casos 1 14 23 10 2 a) Qual a porcentagem de pessoas possuem idade inferior a 35 anos? b) Qual a idade mdia das pessoas? c) Qual a idade que separa 40% do grupo de pessoas?

6) Seja a distribuio salarial apresentada abaixo: Fbrica X. Nmero de operrios, segundo classes de salrios mensais 2010. Salrios Fi

3,0 3,2 3,4 3,6 3,8 4,0

3,2 3,4 3,6 3,8 4,0 4,2

10 18 12 9 8 3 60

Pede-se a) uma distribuio de frequncia relativa. b) a classe do salrio do 30 operrio. c) quantos operrios recebem at R$ 3340,00 (exclusive)? d) qual a porcentagem daqueles que recebem R$ 3400,00 ou mais? e) o valor do salrio que separa: 1. 50% dos operrios. 2. 25% dos operrios. 3. 10% dos operrios. f) o valor da mdia, mediana e da moda. 7) Na srie (15, 20, 30, 40, 50) h, abaixo da mediana, a) 2 valores b) 3 valores c) 3,5 valores d) 4 valores. 8) Complete as informaes ausentes na tabela seguinte. Xi 12 16 17 34 45 56 Soma () Fi 5 13 8 47 3 50 100 Fr Fac Fad

32

9) A tabela abaixo apresenta uma distribuio de frequncia das reas de 400 lotes. rea (m2) N de lotes Com referncia a esta tabela, determine: 300 l 400 400 l 500 500 l 600 600 l 700 700 l 800 800 l 900 900 l 1000 1000 l 1100 1100 l 1200 14 46 58 76 68 62 48 22 6 a) a amplitude total; b) o limite superior da 5 classe; c) o limite inferior da 8 classe; d) o ponto mdio da 7 classe; e) a amplitude do intervalo da 2 classe; f) a frequncia relativa da 6 classe; g) a frequncia da 4 classe; h) a frequncia acumulada da 5 classe; i) o n de lotes cuja rea no atinge 700 m2; j) o n de lotes cuja rea atinge e ultrapassa 800 m2; k) a percentagem dos lotes cuja rea no atinge 600 m2; l) a percentagem dos lotes cuja rea seja maior ou igual a 900 m2; m) a classe do 72 lote; n) at que classe esto includos 60% dos lotes. 9

Medidas de disperso

Amplitude total: a nica medida de disperso que no tem na mdia o ponto de referncia. Quando os dados no esto agrupados a amplitude total a diferena entre o maior e o menor valor observado: AT = Mximo - Mnimo. Ex: Para os valores 40, 45, 48, 62 e 70 a amplitude total ser: AT = 70 - 40 = 30

Com intervalos de classe a amplitude total a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. Ento: AT = LS mximo - LI mnimo Ex: Classes 4 |------------- 6 6 |------------- 8 8 |------------- 10 6 2 3 fi

AT = 10 - 4 = 6

A amplitude total tem o inconveniente de s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedirios. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de clculo rpido sem muita exatido.

- Desvio padro O desvio padro de um conjunto de valores amostrais uma medida da variao dos valores em torno da mdia. uma espcie de desvio mdio dos valores em relao mdia. Desvio mdio: a mdia aritmtica dos mdulos dos desvios, tomados em relao mdia.
N

xi x DM
i

N
N

dados no agrupados.

fi x i x DM
i 1

dados agrupados.

10

Desvio padro para dados no agrupados

| x i x |2 n 1 |x
i

amostral

x |2

populao

n
Desvio padro para dados agrupados

| xi x | 2 n 1

amostral

| xi x | 2 n

populacion al

Propriedades 1) Se somarmos ou subtrairmos cada elemento de um conjunto por um nmero qualquer, a mdia ser alterada por este valor e o desvio padro inalterado. 2) Se multiplicarmos ou dividirmos cada elemento da srie por um nmero qualquer, a mdia e o desvio padro sero alterados por este valor. - Varincia ou Variana (S2 ou
2

A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras. a razo entre o somatrio dos quadrados dos desvios, tomados em relao a mdia, e o nmero deles.
2

( xi n

x) 2 (dados no agrupados) ou S

( xi n

x) 2 fi (dados agrupados)

Obs.: Se amostra n < 30 usa-se no denominador n 1


Coeficiente de variao (disperso relativa) ou coeficiente de Pearson

CV CV

S x

100% 100%

x
CV > 30% - dispersos CV < 30% - homogneos Desvio quartlico Q3 Q1 Q 2

11

Quartil

25% 25% 25% 25%

nM Qn LI 4

fac ant h fiQn


posio =

nN 4

Desvio percentlico P90 P


10

Percentil

nN Pn LI 100

fac ant h fi Dn
posio =

nN 100

Exemplo: Para a distribuio de dados agrupados pede-se: a) A porcentagem de barras que pertencem ao intervalo x b) A varincia c) O coeficiente de variao Limites (kg) 29 | 36 36 | 43 43 | 50 50 | 57 57 | 64 64 | 71 fi 6 9 12 33 17 3 80 Xi fixi fi | xi - x |2

Exerccios 1) Calcule para a srie: Salrio dos Vendedores Classe

Fi

Xi

12

400 | 500 500 | 600 600 | 700 700 | 800 800 | 900

5 10 15 10 6

450 550 650 750 850

a) A mdia e o desvio padro dos salrios. b) O coeficiente de variao. Classifique os dados em dispersos ou homogneos. 2) Determinar o desvio padro da amostra 3) Numa empresa, o salrio mdio dos homens de R$ 4000,00 com desvio padro de R$ 1500,00 e o das mulheres em mdia de R$ 3000,00, com desvio padro de R$ 1200,00. Com essas informaes, conclui-se que o salrio das mulheres apresentam menor disperso relativa. verdadeira essa informao? Justifique. 4) Um pesquisador interessado na eficincia de grupos de dieta pesou 5 clientes aps vrias semanas no programa. Os valores da perda de peso ( em libras) foram: 13 12 6 9 10. Pedese calcular amplitude total, o desvio mdio, a varincia e o desvio padro para esses dados.. 5) Para as sries apresentadas a seguir, responda, com base na medida de disperso mais conveniente. Srie A: Srie B: Srie C: a) A srie mais homognea? b) A srie mais dispersa? 6) Para uma srie que apresenta coeficiente de variao e varincia, respectivamente 25% e 4 unidades, qual ser a mdia? 7) Calcule a varincia, o desvio padro, e o coeficiente de variao para a distribuio de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos. Consumo por 0 nota R$ N de notas 50 10 50 28 100 12 150 2 200 1 250 250 1 300

9) Em Recife a temperatura mdia do ano de

TREC T

27 C

e o desvio padro e o desvio padro

8 C . No 6 C.

Rio de Janeiro a temperatura mdia do ano de RIO Qual cidade apresenta a temperatura mais homognea?

24 C

13

Assimetria e Curtose
Assimetria - Mede o quanto a srie est enviesada em torno da mdia. Simtrica

Md

Mo

Assimtrica positiva

Mo

Md

Assimtrica negativa

Md

Mo

ndice de assimetria ou grau de assimetria

IA
IA

3( x
x

Md )

S Mo
S

Curtose Mede o grau de achatamento da curva Q3 Q 1 K 2( P90 P10 )

Se K = 0,263 temos uma curva normal chamada mesocrtica Se K < 0,263 a curva apresenta mais fechada que a normal leptocrtica Se K > 0,263 a curva mais achatada platicrtica

14

Exemplo: 1) Considere os seguintes resultados de 3 distribuies de freqncia: Distribuio A B C Determine: a) O tipo de assimetria de cada uma delas x 12 12,9 11,1 Md 12 13,5 10,5 Mo 12 16 8 Q1 814 63,7 28,8

Q3
935 80,3 45,6

P10
772 55 20,5

P90
1012 86,6 49,8

S 4,42 4,2 4,2

x a Md a Mo =>simtrica
x b Md Mo Md Mo => assimtrica negativa x c => assimtrica positiva

b) O ndice de assimetria de cada uma 3(12 12) IAA 0 4,42 3(12,9 13,5) IAB 0,43 4,20 3(11,1 10,5) IAC 0,43 4,20 c) Os respectivos graus de curtose e classifique-os 935 814 KA 0,252 leptocrti ca 2(1012 772)

KB KC

80,3 2(86,6 45,6 2(49,8

63,7 55) 28,8 20,5)

0,263 0,287

mesocrtica platicrti ca

Exerccio 1) Considerando a distribuio de freqncia relativa aos pesos de 100 operrios de uma fbrica. (Dados: Q1 = 66, Q3 = 82,5, P10 = 58 e P90 = 90) Pesos (Kg) 50 | 58 58 | 66 66 | 74 74 | 82 82 | 90 90 | 98 fi 10 15 25 24 16 10 100 Xi Determine: a) O grau de assimetria b) O grau de curtose

15

2) Dada distribuio, pede-se: Estaturas (cm) 150 | 154 154 | 158 158 | 162 162 | 166 166 | 170 170 | 174 fi 4 9 11 8 5 2 39 a) a percentagem de alunos no intervalo x b) o desvio quartlico. c) o desvio percentlico. d) o ndice de assimetria (usando a moda). e) o grau de curtose. f) Classificao da distribuio.

S.

Bibliografia: LARSON, Ron; FARBER, Betsy, Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2010. 4 ed. TRIOLA, Mario F. Introduo Estatstica. Rio de Janeiro: LTC, 2008. MONTGOMERY, Douglas C. Estatstica aplicada e probabilidade para engenheiros. Rio de Janeiro: LTC, 2003. FONSECA, J. Siman; MARTINS, G. Andrade Curso de Estatstica. So Paulo: Atlas.

16

You might also like