You are on page 1of 32

Estatstica Descritiva (I)

O que Estatstica
Origem relacionada com a coleta e construo de tabelas de dados para o governo.

A situao evoluiu: a coleta de dados representa somente um dos aspectos da Estatstica.


No sculo XIX, o desenvolvimento do clculo de probabilidade e outras metodologias matemticas, tais como a tcnica de Mnimos Quadrados, foram fundamentais para o desenvolvimento da Estatstica.

O que Estatstica
No sculo XX a Estatstica desenvolve-se como uma rea especfica do conhecimento a partir do desenvolvimento da Inferncia Estatstica, metodologia que faz uso da Teoria das Probabilidades e com ampla aplicao em cincias experimentais.

A Estatstica hoje consiste em uma metodologia cientfica para obteno, organizao e anlise de dados oriundos das mais variadas reas das cincias experimentais, cujo objetivo principal auxiliar a tomada de decises em situaes de incerteza.

Estatstica
Populao Caractersticas
Tcnicas de amostragem

Amostra

Anlise descritiva

Concluses sobre as caractersticas da populao

Inferncia estatstica

Informaes contidas nos dados


4

Amostragem
Associada coleta de dados, a tecnologia da amostragem desenvolveu um conjunto de tcnicas para obteno de amostras convenientemente obtidas da populao de interesse. Exemplos de uso:

Pesquisas de mercado Pesquisas de opinio pblica Ensaios clnicos


5

Estatstica Descritiva
Etapa inicial da anlise utilizada para descrever, organizar e resumir os dados coletados.

A disponibilidade de uma grande quantidade de dados e de mtodos computacionais muito eficientes revigorou esta rea da Estatstica.

Probabilidade
A teoria das probabilidades auxilia na modelagem de fenmenos aleatrios, ou seja, aqueles em que est presente a incerteza.

uma ferramenta fundamental para a inferncia estatstica.


7

Inferncia Estatstica
Conjunto de tcnicas que permite, a partir de dados amostrais, tirar concluses sobre a populao de interesse, controlando erros.

Exemplo 1:
Numa pesquisa eleitoral, um instituto de pesquisa tem como objetivo prever o resultado da eleio, utilizando uma amostra da populao.

Considere o Candidato A: Denomine por p a proporo de pessoas (na populao) que votaro em A na eleio.
Denomine por ^ a proporo de pessoas no p levantamento de opinio que expressam inteno de voto em A.

Estimao: Podemos usar o valor de ^ p para estimar a proporo p da populao.


10

Em anos de eleies, os institutos de pesquisa de opinio colhem periodicamente amostras de eleitores para obter as estimativas de inteno de voto da populao. As estimativas so fornecidas com um valor e uma margem de erro.

Pesquisa Sensus
Os quadros apresentados a seguir referem-se inteno de voto para presidente do Brasil para o primeiro e segundo turnos das eleies de 2010. A resposta foi estimulada e nica. Pergunta realizada: Se a eleio para presidente fosse hoje e os candidatos fossem estes, em quem o(a) Sr.(Sra) votaria?
12

Inteno de voto para presidente do Brasil, 1 Turno 2010

Pesquisa Sensus, em % do total de votos. 2.000 eleitores - Margem de erro de 2,2% com 95% de confiana.
13

Inteno de voto para presidente do Brasil, 2 Turno 2010

Pesquisa Sensus, em % do total de votos. 2.000 eleitores - Margem de erro de 2,2% com 95% de confiana.
14

Estattica Descritiva
O que fazer com as observaes que coletamos?

Primeira Etapa: Resumo dos dados = Estatstica descritiva


15

Varivel:
Qualquer caracterstica associada a uma populao.

Classificao das variveis:


NOMINAL
QUALITATIVA ORDINAL classe social, grau de instruo peso, altura, salrio, idade nmero de filhos, nmero de carros
16

sexo, cor dos olhos

CONTNUA QUANTITATIVA DISCRETA

Variveis Quantitativas
MEDIDAS DE POSIO:
Mnimo, Mximo, Moda, Mdia, Mediana, Percentis

MEDIDAS DE DISPERSO:
Amplitude, Intervalo-Interquartil, Varincia, Desvio Padro, Coeficiente de Variao.
17

Medidas de Posio
Mximo (max): a maior observao Mnimo (min): a menor observao Moda (mo): o valor (ou atributo) que ocorre com maior frequncia.

Dados: 4, 5, 4, 6, 5, 8, 4
max = 8 min = 4 mo = 4
18

Mdia:
n

x 1 x 2 x 3 ... x n n

i 1

Dados: 2, 5, 3, 7, 8
x
2 53 7 8 5
19

Mediana:
A mediana o valor da varivel que ocupa a posio central de um conjunto de n dados ordenados. Posio da mediana: n+1 2

20

Exemplos:
Dados: 2, 6, 3, 7, 8
Posio da Mediana

n = 5 (mpar)
5+1 = 3 Md=6 2

Dados ordenados: 2 3 6 7 8

Dados: 4, 8, 2, 1, 9, 6

n = 6 (par)
6+1 = 3,5 2

Dados ordenados: 1 2 4 6 8 9 Md Md = (4 + 6) / 2 = 5

21

Percentis:
O percentil de ordem p 100 (0 < p < 1), em um conjunto de dados de tamanho n, o valor da varivel que ocupa a posio p (n + 1) do conjunto de dados ordenados.

Casos particulares:
percentil 50 = mediana ou segundo quartil (Md)

percentil 25 = primeiro quartil (Q1)


percentil 75 = terceiro quartil (Q3)

percentil 10 = primeiro decil


22

Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7

n=10

Posio de Md: 0,5(n+1)= 0,511= 5,5 Md = (3 + 3,1)/2 = 3,05

Posio de Q1: 0,25 (11) = 2,75 Q1=( 2+2,1)/2=2,05 Posio de Q3: 0,75 (11) = 8,25 Q3=(3,7+6,1)/2=4,9 Md = 3,05 Q1 = 2,05 Q3 = 4,9

Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6

n=11
Md = 5,3 Q1 = 1,7 Q3 = 12,9
23

Exemplo 2: Considere as notas de um teste de 3 grupos de alunos


Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5

* * * * *
G1
* * *
* * * * *

G2

G3
0

10

Temos: x1 = x2 = x3 = 5

e md1= md2= md3 = 5


24

Medidas de Disperso
Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados
Amplitude (A): A = mx - min

Para os grupos anteriores, temos: Grupo 1, A = 4 Grupo 2, A = 8 Grupo 3, A = 0


25

Intervalo-Interquartil:
a diferena entre o terceiro quartil e o primeiro quartil, ou seja, Q3 - Q1.

Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
Q1 = 2,05 e Q3= 4,9

Q3 - Q1 = 4,9 - 2,05 = 2,85


26

Varincia:
Varincia s
2

(x1 x )

(x 2 x )

... ( x n x )

n 1

i 1

(x i x ) n 1

Desvio padro:
Desvio Padro s Varincia

27

Clculo para os grupos:


G1: s2 =(3-5)2+(4-5)2+ (5-5)2+ (6-5)2+ (7-5)2

4 s2 = 10/4= 2,5 s = 1,58


G2: s2 = 10 s = 3,16

G3: s2 = 0 s = 0
28

Frmula alternativa:
n

Xi
2

nX

i 1

( n 1)

Em G1: Xi2 = 9 + 16 + 25 + 36 +49 = 135


S2 = 135 - 5(5)2 = 2,5

4
29

Coeficiente de Variao (CV)


- uma medida de disperso relativa - elimina o efeito da magnitude dos dados - exprime a variabilidade em relao mdia
s x 100 %

CV

30

Exemplo 3:
Altura e peso de alunos
Mdia
Altura Peso 1,50m 50 kg Desvio Padro 0,05m 3.5kg Coef. de Variao 3,3% 7%

Concluso: Os alunos so, aproximadamente, duas vezes mais dispersos quanto ao peso do que quanto altura.
31

Exemplo 4:
Altura (em cm) de uma amostra de recmnascidos e de uma amostra de adolescentes
Mdia
Recm-nascidos Adolescentes

Desvio padro
6 16

Coef. de variao
12% 10%

50 160

Concluso: Em relao s mdias, as alturas dos adolescentes e dos recm-nascidos apresentam variabilidade quase iguais. 32

You might also like