You are on page 1of 44

ESTATSTICA

CURSOS DE GRADUAO EAD


Estatstica Prof. Ms. Carlos Alberto Marinheiro e Prof. Ms. Cludio Pereira Bidurin

Meu nome Carlos Alberto Marinheiro, sou mestre em


Bioengenharia, pela Interunidades Escola de Engenharia de So
Paulo, Instituto de Qumica de So Carlos e Faculdade de
Medicina de Ribeiro Preto, da Universidade de So Paulo.
Tenho formao em Matemtica (licenciatura plena), Pedagogia
e Engenharia Civil, com especializaes em: Geometria Analtica
(Matemtica), Mtodos de Procedimentos Didticos (Educao)
e Metodologia e Tcnicas de Ensino (Educao) e ps-graduao
lato sensu em Metodologia do Ensino de Matemtica. Atuo
como docente nas reas de Metodologia da Pesquisa Cientfica,
Administrao de Produo, Estatstica Aplicada Administrao,
Desenho Geomtrico e Geometria Descritiva, Tpicos de Educao Matemtica e
Biofsica em diversos cursos de Graduao, e com Metodologia da Pesquisa Cientfica nos
cursos de Ps-graduao. Alm disso, sou coordenador da CPA (Comisso Prpria de
Avaliao) e membro do CEP (Comit de tica em Pesquisa) no Centro Universitrio
Claretiano de Batatais.
E-mail: marinheiro@claretiano.edu.br

Ol! Meu nome Cludio Pereira Bidurin, sou bacharel e mestre em Estatstica pela Universidade Federal de So Carlos (UFSCar). J atuei como estatstico em indstrias e no setor pblico.
Atualmente, sou consultor e assessor em desenvolvimento de
anlises e modelagem estatstica. Sou professor de Estatstica
no ensino superior h mais de 15 anos. No Centro Universitrio
Claretiano, atuo h 10 anos, tanto em cursos presenciais quanto em EaD. Coloco-me disposio para contribuir com voc
para uma aprendizagem significativa.
E-mail: bidurin@claretiano.edu.br

Fazemos parte do Claretiano - Rede de Educao

Carlos Alberto Marinheiro


Cludio Pereira Bidurin

ESTATSTICA
Caderno de Referncia de Contedo

Batatais
Claretiano
2013

Ao Educacional Claretiana, 2011 Batatais (SP)


Verso: dez./2013

519.5 S713e

Marinheiro, Carlos Alberto


Estatstica / Carlos Alberto Marinheiro, Cludio Pereira Bidurin Batatais, SP :
Claretiano, 2013.
242 p.
ISBN: 978-85-67425-08-5
1. Sntese histrica e organizao da estatstica brasileira. 2.Dados estatsticos.
3. Distribuio de freqncias. 4. Medidas de tendncia central. 5. Medidas
de disperso. 6. Teoria elementar de probabilidade. 7. Distribuies de
probabilidade. 8. Teoria da amostragem. 9. Estimao. 10. Testes de hipteses.
I. Bidurin, Cludio Pereira. II. Estatstica.

CDD 519.5
Corpo Tcnico Editorial do Material Didtico Mediacional
Coordenador de Material Didtico Mediacional: J. Alves
Preparao
Aline de Ftima Guedes
Camila Maria Nardi Matos
Carolina de Andrade Baviera
Ctia Aparecida Ribeiro
Dandara Louise Vieira Matavelli
Elaine Aparecida de Lima Moraes
Josiane Marchiori Martins
Lidiane Maria Magalini
Luciana A. Mani Adami
Luciana dos Santos Sanana de Melo
Luis Henrique de Souza
Patrcia Alves Veronez Montera
Rita Cristina Bartolomeu
Rosemeire Cristina Astolphi Buzzelli
Simone Rodrigues de Oliveira
Bibliotecria
Ana Carolina Guimares CRB7: 64/11

Reviso
Ceclia Beatriz Alves Teixeira
Felipe Aleixo
Filipi Andrade de Deus Silveira
Paulo Roberto F. M. Sposati Ortiz
Rodrigo Ferreira Daverni
Snia Galindo Melo
Talita Cristina Bartolomeu
Vanessa Vergani Machado
Projeto grfico, diagramao e capa
Eduardo de Oliveira Azevedo
Joice Cristina Micai
Lcia Maria de Sousa Ferro
Luis Antnio Guimares Toloi
Raphael Fantacini de Oliveira
Tamires Botta Murakami de Souza
Wagner Segato dos Santos

Todos os direitos reservados. proibida a reproduo, a transmisso total ou parcial por qualquer
forma e/ou qualquer meio (eletrnico ou mecnico, incluindo fotocpia, gravao e distribuio na
web), ou o arquivamento em qualquer sistema de banco de dados sem a permisso por escrito do
autor e da Ao Educacional Claretiana.
Claretiano - Centro Universitrio
Rua Dom Bosco, 466 - Bairro: Castelo Batatais SP CEP 14.300-000
cead@claretiano.edu.br
Fone: (16) 3660-1777 Fax: (16) 3660-1780 0800 941 0006
www.claretianobt.com.br

Fazemos parte do Claretiano - Rede de Educao

SUMRIO
caderno de referncia de contedo
1 INTRODUO.................................................................................................... 9
2 oRIENTAES PARA ESTUDo........................................................................... 10

Unidade1 A natureza dos dados estatsticos


1 Objetivos......................................................................................................... 33
2 Contedos...................................................................................................... 33
3 ORIENTAES para o estudo da unidade................................................ 34
4 Introduo UNIDADE................................................................................ 35
5 UM POUCO DE HISTRIA................................................................................. 35
6 CONCEITOS IMPORTANTES.............................................................................. 37
7 POPULAO VERSUS AMOSTRA...................................................................... 39
8 QUESTES AUTOAVALIATIVAS......................................................................... 42
9 Consideraes............................................................................................... 43
10 refer ncias bibliogrficas....................................................................... 44

Unidade2 Tabulao de dados


1 Objetivos......................................................................................................... 45
2 Contedos...................................................................................................... 45
3 ORientaes para o estudo da unidade................................................ 46
4 INTRODUO unidade................................................................................ 46
5 DADOS BRUTOS................................................................................................. 47
6 TABELA DE DISTRIBUIO DE FREQUNCIAS................................................. 49
7 TABELA DE FREQUNCIAS SIMPLIFICADA....................................................... 50
8 TABELA DE FREQUNCIAS POR INTERVALOS.................................................. 53
9 GRFICOS DE FREQUNCIAS............................................................................ 55
10 G RFICOS DE FREQUNCIAS NO EXCEL 2003................................................. 57
11 Q UESTES AUTOAVALIATIVAS......................................................................... 63
12 CONSIDERAES............................................................................................... 66
13 refer ncias bibliogrficas....................................................................... 67

Unidade3 Medidas Estatsticas de posio


1
2
3
4
5
6
7

Objetivos......................................................................................................... 69
Contedos...................................................................................................... 69
orientaes para o estudo da unidade................................................ 69
INTRODUO unidade................................................................................ 70
MEDIDAS ESTATSTICAS DE TENDNCIA CENTRAL......................................... 71
RELAO ENTRE AS MEDIDAS DE TENDNCIA CENTRAL.............................. 88
MEDIDAS SEPARATRIZES.................................................................................. 90

8 QUESTES AUTOAVALIATIVAS......................................................................... 93
9 CONSIDERAES............................................................................................... 95
10 refer ncias bibliogrficas ...................................................................... 96

Unidade4 Medidas Estatsticas de disperso


1
2
3
4
5
6
7

Objetivos......................................................................................................... 97
ContedoS...................................................................................................... 97
orientaes para o estudo da unidade............................................... 98
INTRODUO unidade................................................................................ 98
MEDIDAS DE DISPERSO.................................................................................. 99
APLICAES DO DESVIO PADRO................................................................... 105
USO DE RECURSOS TECNOLGICOS PARA O CLCULO DA MDIA E
DO DESVIO PADRO.......................................................................................... 110
8 questes autoavaliativas......................................................................... 115
9 CONSIDERAES............................................................................................... 117
10 refer ncias bibliogrficas....................................................................... 118

Unidade5 Teoria Elementar de Probabilidade


1 Objetivos......................................................................................................... 119
2 Contedos...................................................................................................... 119
3 ORIENTAES para o estudo da unidade................................................ 119
4 Introduo unidade................................................................................ 120
5 CONCEITOS IMPORTANTES.............................................................................. 121
6 a probabilidade FREQUENTISTA.................................................................. 123
7 RELAES ENTRE EVENTOS ALEATRIOS....................................................... 127
8 PROBABILIDADE CONDICIONAL E INDEPENDNCIA...................................... 130
9 Notao de Probabilidade Condicional............................................... 131
10 questes autoavaliativas......................................................................... 134
11 consideraes............................................................................................... 135
12 refer ncias bibliogrficas ...................................................................... 135

Unidade6 Distribuies de Probabilidades


1
2
3
4
5
6

Objetivos......................................................................................................... 137
Contedos...................................................................................................... 137
ORIENTAES para o estudo da unidade................................................ 138
INTRODUO unidade................................................................................ 138
DISTRIBUIES DE PROBABILIDADE............................................................... 139
A CURVA NORMAL COMO UMA DISTRIBUIO DE PROBABILIDADES........ 143

7 A CURVA NORMAL PADRONIZADA.................................................................. 145


8 questes autoavaliativas......................................................................... 163
9 consideraes............................................................................................... 164
10 R eferncias Bibliogrficas ...................................................................... 164

Unidade7 Teoria da Amostragem


1 Objetivos......................................................................................................... 167
2 Contedos...................................................................................................... 167
3 ORIENTAES para o estudo da unidade................................................ 167
4 Introduo unidade................................................................................ 168
5 Mtodos de Amostragem.......................................................................... 169
6 DISTRIBUIES DE PROBABILIDADES AMOSTRAIS........................................ 173
7 DISTRIBUIO AMOSTRAL DA MDIA............................................................ 174
8 DISTRIBUIES DE PROBABILIDADE AMOSTRAL DA PROPORO.............. 184
9 Questes autoavaliativas......................................................................... 187
10 C onsideraes............................................................................................... 188
11 R eferncias Bibliogrficas....................................................................... 188

Unidade8 Estimao
1 Objetivos......................................................................................................... 189
2 Contedos...................................................................................................... 189
3 ORIENTAES para o estudo da unidade................................................ 190
4 Introduo unidade................................................................................ 190
5 Estimao pontUAL...................................................................................... 191
6 Estimao por intervalos......................................................................... 192
7 determinao do tamanho da amostra.............................................. 205
8 estimativas para pequenas amostras ou para s desconhecido......... 207
9 Fator de Correo para populao finita........................................... 216
10 Q uestes autoavaliativas......................................................................... 218
11 CONSIDERAES............................................................................................... 220
12 refer ncias bibliogrficas....................................................................... 220

Unidade9 Testes de hipteses


1
2
3
4

Objetivos......................................................................................................... 221
Contedos...................................................................................................... 221
Sugestes para o estudo da unidade.................................................... 222
Introduo unidade................................................................................ 222

5 Testes para a mdia populacional com grandes amostras


e desvio padro populacional conhecido........................................... 225
6 Testes para a proporo populacional com grandes amostras........ 231
7 Testes para a mdia populacional com pequenas amostras
ou desvio padro populacional desconhecido........................................235
8 Testes para a proporo populacional com pequenas amostras.........238
9 questes autoavaliativas......................................................................... 240
10 CONSIDERAES............................................................................................... 241
11 R EFERNCIAS BIBLIOGRFICAS....................................................................... 242

EAD

Caderno de
Referncia de
Contedo

CRC
Ementa

Sntese histrica e organizao da Estatstica brasileira. Dados estatsticos. Distribuio de frequncias. Medidas de tendncia central. Medidas de disperso.
Teoria elementar de probabilidade. Distribuies de probabilidade. Teoria da
amostragem. Estimao. Testes de hipteses.

1. INTRODUO
A Estatstica subdividida em quatro partes: a Unidade 1
destinada a uma viso mais conceitual sobre Estatstica; as Unidades 2, 3 e 4 so destinadas aos estudos da Estatstica Descritiva; as
Unidades 5, 6 e 7 so destinadas aos estudos de probabilidades;
e as Unidades 8 e 9 so destinadas aos estudos de Estatstica Inferencial.
Os estudos realizados sobre o que chamamos Estatstica
Descritiva so de fundamental importncia em qualquer rea de
atuao profissional, j que todos ns somos levados a decidir so-

10

Estatstica

bre uma diversidade de situaes, e essas decises sempre so


tomadas com base em informaes. Assim, de posse das informaes, anlises so feitas e decises tomadas. A Estatstica Descritiva ajuda na caracterizao das informaes, mas como restrita a
amostra, no capaz de ajudar no processo decisrio.
Todo processo decisrio envolvendo o uso de medidas estatsticas estudado no campo da Estatstica Inferencial, que o assunto desse Caderno de Referncia de Contedo. O que chamamos
Estatstica Aplicada a transformao das medidas descritivas em
medidas inferenciais, ou medidas de deciso.
claro que a composio das medidas inferenciais levar em
considerao a presena do erro da anlise, j que lidamos com
dados amostrais. Para trabalhar com o erro da anlise, vamos introduzir no campo da Estatstica as medidas de probabilidade, que
permitiro configurar de forma bem clara o erro dos dados e generalizar os dados amostrais para todo o universo de interesse,
possibilitando, assim, a tomada de decises.
Aps esta introduo aos conceitos principais, apresentamos a seguir, no tpico Sugestes para Estudo, algumas orientaes de carter motivacional, dicas e estratgias de aprendizagem
que podero facilitar o seu estudo.

2. oRIENTAES PARA ESTUDo


Abordagem Geral
Prof. Ms. Cludio Pereira Bidurin

Neste tpico, apresenta-se uma viso geral do que ser estudado neste Caderno de Referncia de Contedo. Aqui, voc entrar
em contato com os assuntos principais deste contedo de forma
breve e geral e ter a oportunidade de aprofundar essas questes
no estudo de cada unidade. Desse modo, essa Abordagem Geral
visa fornecer-lhe o conhecimento bsico necessrio a partir do

Caderno de Referncia de Contedo

11

qual voc possa construir um referencial terico com base slida


cientfica e cultural para que, no futuro exerccio de sua profisso, voc a exera com competncia cognitiva, tica e responsabilidade social.
Nessa Abordagem Geral, temos como objetivo ilustrar as
ideias conceituais deste Caderno de Referncia de Contedo, trabalhadas em cada unidade, bem como um direcionamento mais
amplo dos objetivos. Vamos em frente.
Para que serve a Estatstica? Quais motivos temos para estud-la?
Se voc considerar cenrios administrativos e gerenciais, situaes de anlises contbeis, problemas de gesto de pessoas e
de materiais, casos de logstica e de transportes, anlise de cenrios econmicos, enfim, toda uma sorte de situaes relacionadas
com a prtica de empresas, o que podemos detectar de comum
em todas elas?
Dentre as similaridades, vamos destacar uma que nos interessa mais. Em todas as situaes citadas, existe um momento importante chamado de tomada de deciso, ou seja, o momento em
que o analista decide qual o caminho a seguir, qual deciso levar
a empresa a atingir suas metas.
Se concordarmos que o processo de tomada de decises
de fato inerente aos cenrios descritos, cabe uma nova pergunta:
O que importante para uma tomada de deciso? O mais importante dispor de informaes que propiciem que essa deciso seja
feita com embasamento e critrios. Mas temos, ento, uma nova
questo a responder: Como as informaes devem ser analisadas
para propiciar uma deciso acertada?
Temos vrios caminhos para analisar as informaes. Um
desses caminhos, que contribui de forma decisiva para a tomada
de deciso, a Anlise Estatstica dos dados. Assim, temos de estudar Estatstica, pois natural sua utilizao no dia a dia dos ceClaretiano - Centro Universitrio

12

Estatstica

nrios gerenciais. Alm disso, veremos no decorrer deste estudo


que em muitos casos no basta conhecermos as ferramentas de
anlise, devemos tambm possuir um olhar crtico para saber utilizar os resultados.
Nosso objetivo, portanto, propiciar a voc um conjunto de
ferramentas para a anlise de conjuntos de dados, sob a tica da
Estatstica, trabalhando o ferramental matemtico, o processo de
clculo, associado necessidade de compreenso da aplicabilidade de cada ferramenta apresentada.
A Estatstica nasceu como uma ferramenta destinada apenas
coleta e descrio de dados, como veremos na Unidade 1, mas,
com o tempo, se transformou em uma importante ferramenta de
anlise, quando utilizada em conjunto com as probabilidades. Todas as reas do conhecimento fazem uso da Estatstica, seja para o
planejamento de pesquisas e experimentos, seja para a representao de dados, ou seja, para a anlise inferencial das informaes.
Contudo, como a Estatstica lida com a anlise de dados,
importante que eles sejam produzidos, coletados, pesquisados
com critrios tcnicos, de forma a produzir informaes pertinentes e confiveis. Se vamos analisar um conjunto de dados, necessrio que esses dados possam de fato representar o fenmeno de
interesse. Isso ocorre quando utilizamos metodologias adequadas
para a coleta dos dados.
Assim, quando elaboramos os procedimentos e metodologias que sero utilizados para a coleta e pesquisa dos dados, devemos seguir padres rigorosos e cientficos para que eles no
sejam distorcidos e/ou manipulados. Para tal rigor, podemos nos
valer dos procedimentos discutidos em Metodologia Cientfica,
que sugere etapas a serem seguidas para permitir uma pesquisa
de dados adequada, ou seja: definir os objetivos e hiptese que
desejamos atingir, nossas metas; definir as fontes a serem utilizadas, de onde sero retirados os dados; definir os instrumentos de
coleta de dados ou questionrios, que devem estar diretamente
relacionados com os objetivos e estabelecer as tcnicas apropria-

Caderno de Referncia de Contedo

13

das para a coleta efetiva das informaes, ou seja, um processo de


amostragem que seja o mais recomendvel para aquela situao.
Algum detalhamento sobre esse assunto ser dado na Unidade 1,
bem como a conceituao de Populao Estatstica e Amostra.
Quando definimos as fontes de dados, podemos trabalhar
com todas as fontes existentes, como, por exemplo, em uma pesquisa de mercado utilizar todos os possveis consumidores, ou em
uma anlise de qualidade, verificar 100% dos itens produzidos ou
ainda, em uma avaliao financeira de uma franquia, analisar todos os franqueados do Brasil. Contudo, voc deve refletir sobre a
viabilidade de analisar 100% das fontes existentes e pensar que
isso, na maioria dos casos, no ser prudente ou at mesmo impossvel de ser feito. Assim, podemos trabalhar ento com uma
Amostra das fontes, uma Amostra dos dados, utilizar apenas uma
parte representativa das informaes, que, apesar de gerar um
erro de anlise, muito mais coerente em termos prticos.
justamente nesse cenrio de utilizao de amostras que
a Estatstica tem maior importncia, em primeiro lugar para possibilitar uma anlise que faa o erro gerado ser minimizado e, em
segundo lugar, para viabilizar uma generalizao dos resultados
obtidos na amostra, para toda a populao.
Considerando a realizao da amostragem, o profissional
se depara com a seguinte situao: a partir da coleta de dados
realizada, dispe de um conjunto de dados (de informaes) que
devem ser analisadas a fim de permitir uma interpretao e uma
deciso, concluso final.
Na Unidade 2, discutiremos as formas de anlise de dados
chamadas de Tabulao, que nada mais so do que a disposio
dos dados em forma de tabelas e/ou grficos, construdos com
base no conceito de frequncia.
natural supor que ao coletar os dados, exista certa repetio de algumas informaes (qualitativas ou quantitativas). Essa
repetio de alguns resultados o incio do processo investigativo
Claretiano - Centro Universitrio

14

Estatstica

sobre os dados e a funo da frequncia justamente mostrar,


descrever, como ocorrem essas repeties. Estudaremos duas frequncias principais: a frequncia absoluta (ou frequncia simples)
que a contagem do nmero de vezes que cada informao se repete nos dados coletados, que possui a capacidade de ilustrar qual
resultado mais expressivo em relao aos demais, indicando um
incio de anlise por incidncia. Contudo, a frequncia absoluta
no permite comparaes entre perodos ou cenrios, e, portanto ser transformada em uma Frequncia Relativa (ou frequncia
percentual) que tem como principal funo permitir anlises comparativas entre as informaes originrias de perodos diferentes
ou grupos e cenrios diferentes.
A transformao de uma frequncia absoluta em uma frequncia relativa segue a mesma mecnica dos clculos percentuais tradicionais, isto , dividindo-se uma frequncia absoluta pelo
total e multiplicando-se por 100 obtemos a frequncia percentual
ou relativa.
O uso das frequncias pode ser feito por meio de tabelas de
frequncias, que se diferenciam de acordo com o tipo de informao coletada, que pode ser qualitativa (no so expressas numericamente), ou quantitativa inteira (expressas numericamente, mas
sempre por nmeros inteiros) e quantitativa fracionria (expressas
numericamente e podem apresentar casas decimais).
Alm das tabelas, as frequncias tambm podem ser representadas por meio de grficos de frequncias, cujos principais so
o grfico de colunas, o grfico de barras e o grfico de setores (ou
de pizza).
Tanto a tabela quanto os grficos de frequncias so ferramentas descritivas dos dados, ou seja, no possuem inteno de
permitir uma anlise mais aprofundada dos dados, apenas apresentar de forma ordenada as informaes a fim de facilitar a anlise posterior. muito comum encontrarmos tabelas e grficos em
artigos de jornais e revistas e mesmo em matrias de jornais tele-

Caderno de Referncia de Contedo

15

visivos, pois o impacto visual muito favorvel transmisso da


ideia sobre os resultados.
Quando trabalhamos com dados qualitativos, a representao descritiva das tabelas e grficos muito eficiente. Contudo,
quando trabalhamos com dados quantitativos, essa representao
no suficiente para uma plena compreenso dos resultados.
Para aprimorar a descrio dos dados, quando esses so
originrios de variveis quantitativas (expressas numericamente,
como preo, quantidade produzida, lucro, taxas, peso, nmero de
funcionrios etc.) fazemos uso das Medidas Estatsticas. Nas Unidades 3 e 4, estudaremos um conjunto de medidas que tem como
objetivo descrever de forma mais completa o comportamento de
variveis quantitativas. Iniciaremos nossos estudos com as Medidas Estatsticas de Posio, cuja funo resumir as informaes
coletadas em apenas um nico valor representativo.
Dentre as medidas existentes, veremos como trabalhar com
as mdias, em especial trataremos de:
mdia aritmtica simples: que definida pela diviso entre a soma dos valores e o nmero de elementos;
mdia aritmtica ponderada: que definida pela diviso
entre a soma ponderada dos valores e o peso total atribudo aos dados;
mdia geomtrica: que definida como uma mdia aritmtica na escala logartmica dos dados.
Essas trs mdias possuem caractersticas similares, mas so
calculadas por meios diferentes. Estudaremos detalhadamente
cada uma delas, desde a formalizao dos clculos at suas aplicaes.
As mdias se caracterizam por utilizar todos os dados disponveis e, portanto, so sensveis ao comportamento dos dados.
Quando temos valores muito altos (ou muito baixos) nos dados,
as mdias podem oscilar para cima (ou para baixo) resultando, em
Claretiano - Centro Universitrio

16

Estatstica

alguns momentos, em anlises que no representam a realidade.


Assim, nossos estudos no se limitaro utilizao de frmulas,
mas a uma viso criteriosa sobre a utilizao prtica das mdias.
Em muitos casos a aplicao de uma mdia pode prejudicar a anlise em vez de colaborar com ela.
Para complementar a anlise via mdias, estudaremos tambm a mediana, a moda e as medidas separatrizes, que possuem
caractersticas bem distintas das mdias, e que, em muitas situaes, permitem uma anlise mais coerente. importante reforar que cabe ao analista a seleo adequada das ferramentas que
sero utilizadas. Para isso, muito mais importante conhecer as
propriedades de cada uma do que sua forma de clculo, pois, se
soubermos calcular, mas no soubermos aplicar o resultado, de
que adianta o clculo?
Devido a alguns problemas na utilizao das mdias, estudaremos, na Unidade 4, as Medidas Estatsticas de Disperso (ou
medidas estatsticas de variabilidade). A disperso nada mais do
que o grau de variao que existe dentro de um conjunto de dados
numricos. Quando esse grau de variao alto, a anlise pelas
mdias fica prejudicada. Assim, importante saber mensurar, medir o grau de variao dos dados.
Faremos isso por meio das seguintes medidas:
Varincia amostral: uma medida de variabilidade absoluta definida como a diferena ao quadrado entre cada
valor existente no conjunto de dados e a mdia aritmtica
do conjunto.
Desvio Padro Amostral: uma medida de variabilidade absoluta definida como a raiz quadrada da varincia
amostral.
Coeficiente de Variao: uma medida de variabilidade
relativa definida pela diviso entre o desvio padro e a
mdia aritmtica dos dados.

Caderno de Referncia de Contedo

17

A varincia uma medida que serve para determinar o grau


de variao dos dados. Assim, quanto maior o valor da medida varincia, maior o grau de variao e, consequentemente, a mdia
perde a capacidade de mostrar uma informao pertinente. Como
a varincia tem uma caracterstica de trabalhar com as diferenas
tomadas ao quadrado, ela pode, muitas vezes, gerar resultados
inconsistentes com a prtica. Por essa razo, utilizamos outra medida que, de certa forma, anula o efeito dos expoentes quadrticos. Essa medida o desvio padro que, de to importante no
segmento de anlise de dados, aparece em todas as calculadoras
cientficas e financeiras. Durante nossos estudos vamos abordar o
uso dos recursos tecnolgicos para o clculo de algumas medidas
estatsticas.
O desvio padro permitir uma srie de anlises importantes, como, por exemplo, o clculo de uma medida de variabilidade
relativa, que chamamos de coeficiente de variao. Por ser uma
medida de variabilidade relativa, o coeficiente de variao permite
compararmos o grau de variao entre dois ou mais cenrios, o
que pode ser de fundamental importncia na tomada de deciso.
Outra medida que estudaremos na Unidade 4 o ndice de
Assimetria dos dados, que o resultado de uma relao entre a
mdia aritmtica, a mediana e o desvio padro amostral. A assimetria dos dados est diretamente relacionada com a aplicabilidade
da mdia. Dados simtricos permitem uma anlise mais criteriosa
da mdia, enquanto que dados assimtricos podem resultar em
uma representao no significativa pela mdia. Note que no estamos falando apenas de clculos, mas de clculos que permitem
uma anlise crtica sobre os dados e, por assim dizer, sobre a possibilidade efetiva de avaliar esses dados a fim de tomar decises.
Nas unidades 2, 3 e 4, discutiremos as ferramentas descritas
anteriormente e que correspondem chamada Estatstica Descritiva. Como o prprio nome cita, a principal funo dessas ferramentas apresentar, descrever os dados que foram coletados na
amostragem.
Claretiano - Centro Universitrio

18

Estatstica

Contudo, devemos lembrar que a amostragem foi realizada


para representar uma determinada populao. Por exemplo, uma
amostra de 1 000 clientes de uma empresa ser avaliada para se
ter uma ideia do que pensam todos os clientes da empresa (a populao de clientes).
Dessa forma, no podemos simplesmente nos limitar a avaliar apenas os dados na amostra. Com base na informao obtida
com os dados amostrais, devemos obrigatoriamente procurar generalizar os resultados para toda a populao, que, afinal, o que
interessa ao analista.
Essa tarefa de generalizar os dados amostrais ser incumbida
s ferramentas de Estatstica Inferencial. Para iniciar os estudos de
inferncia, necessitamos discutir um pouco sobre Probabilidades.
Na Unidade 5, faremos uma breve reviso das teorias da probabilidade frequentista. Essa reviso importante, pois ser de
uso constante a partir da Unidade 6.
Veremos que o conceito de probabilidade frequentista nada
mais do que o relacionamento entre conjuntos de dados: um
que determina os resultados de interesse e outro que determina o
conjunto total de resultados possveis, que chamado de espao
amostral, sempre considerando que esses conjuntos so resultado
de uma ao ou cenrio aleatrio, isto , com certo grau de incerteza sobre os resultados.
As probabilidades, que se originaram para atribuir chances
em jogos de azar, evoluram de forma acelerada no campo das cincias com muitas aplicaes importantes. Em conjunto com as
medidas estatsticas, as probabilidades so capazes de propiciar a
generalizao dos dados amostrais para dados populacionais.
No entanto, como voc ver ao estudar a Unidade 5, a aplicao direta das frmulas conhecidas de probabilidade, apresenta
algumas limitaes de ordem prtica, isto , dependendo do cenrio envolvido com os dados, no possvel avaliar as probabilidades pelas frmulas que estudamos na Educao Bsica.

Caderno de Referncia de Contedo

19

Assim, na Unidade 6 estenderemos os estudos das teorias


frequentistas de probabilidades para as Distribuies de Probabilidades. Temos muitas formas de determinar uma distribuio de
probabilidades, mas nos limitaremos a estudar aquela que apresenta uma gama maior de possibilidades prticas.
Essa distribuio de probabilidade chamada distribuio
normal de probabilidades, ou distribuio de Gauss, que representada e avaliada por meio de um grfico em forma de sino, chamado de Curva Normal ou Curva de Gauss.
Devido complexidade de se trabalhar com essa curva, que
exigiria um conhecimento mais apurado em Clculo Integral, vamos conceituar alguns elementos que nos permitiro uma anlise
mais direta da Curva:
Curva Normal Padronizada: apresenta uma mdia fixa
igual a zero e um desvio padro fixo igual a um.
Frmula da Padronizao: permite trabalhar em qualquer cenrio prtico, com uma mdia e desvio padro
qualquer, e transformar esse cenrio de acordo com a
curva normal.
Tabela da Normal Padronizada: utilizada para calcular
efetivamente as probabilidades.
importante salientar que todos os clculos envolvendo probabilidades dependero da tabela normal padronizada. Na Unidade 6, voc encontrar uma tabela completa de fcil utilizao para
subsidiar os clculos. Contudo, existem diversos outros modelos
de tabelas, que se diferenciam na forma de utilizao (no no resultado final).
Aps estudar como utilizar a curva e a tabela normal padronizada, vamos relacionar essa medida de probabilidade com nossos problemas em Estatstica, ou seja, atrelar as probabilidades ao
estudo de amostras. Para isso, devemos inicialmente pensar sobre
o comportamento das amostras.
Claretiano - Centro Universitrio

20

Estatstica

J dissemos que as probabilidades devem estar relacionadas com fenmenos aleatrios e cabe uma questo: Toda amostra
coletada na avaliao de um cenrio ser aleatria? A resposta :
depende de como foram selecionados os elementos da amostra.
Dessa forma, no incio da Unidade 7, estudaremos meios
de garantir que a amostra seja Aleatria, ou tambm chamada de
Amostra Probabilstica. Em particular, estudaremos as amostras
aleatrias simples (que so resultados de procedimentos de sorteio), as amostras aleatrias sistemticas e as amostras aleatrias
estratificadas. Cada um dos tipos de amostra aleatria tem sua finalidade e situao tpica de uso. O mais importante lembrar
que: o uso de um procedimento de amostragem aleatria garante
a aplicao das medidas de probabilidades sobre os resultados originrios da amostra, como as mdias ou uma porcentagem qualquer.
isso que possibilita generalizar os dados amostrais para a
populao. Em cenrios onde a amostra coletada por convenincia (no aleatria ou no probabilstica), as inferncias no so
possveis de serem efetuadas e ficamos apenas com a descrio
dos dados, insuficiente para uma boa deciso.
Ainda na Unidade 7, veremos como fazer a articulao entre
a amostra e a Curva Normal, definindo a Frmula da Padronizao para dados amostrais. Nesse sentido, vamos diferenciar essa
padronizao de acordo com o tipo de informao que foi utilizada na amostra. Lembre-se de que em uma coleta de dados podemos utilizar dados qualitativos (a preferncia do cliente, o tipo de
ao mais negociada na bolsa, os bens declarados no IRPF etc.) ou
quantitativos (o salrio de uma pessoa, o nmero de funcionrios
de uma empresa etc.), de forma que teremos uma frmula para
padronizar e medir probabilidades quando lidamos com uma mdia (dados quantitativos, numricos) e outra frmula para padronizar e medir probabilidades quando lidamos com uma proporo
(dados qualitativos, no numricos).

Caderno de Referncia de Contedo

21

Por meio das frmulas de padronizao, na Unidade 8, daremos incio ao estudo de Estatstica Inferencial, por intermdio da
montagem das Estimativas por Intervalos de confiana. A finalidade da construo dessas estimativas por intervalos justamente
realizar a generalizao dos dados amostrais. Por exemplo, se em
uma anlise de uma amostra de 50 empresas encontramos um
passivo mdio de um determinado valor em reais, qual ser a estimativa do passivo mdio para a populao de empresas? A resposta obtida por meio dessas estimativas. Voc deve direcionar
seus estudos na Unidade 8 em duas frentes: a primeira no entendimento da montagem do intervalo, que levar em considerao
o clculo da Margem de Erro da estimativa; a segunda na compreenso do que a margem de erro, que estar relacionada com
trs componentes: o tamanho da amostra utilizada, uma medida
do grau de variao dos dados amostrais e uma medida de probabilidade (que chamamos de grau de confiabilidade da estimativa).
Cada um dos componentes gera um impacto nessa margem de
erro e permite encontrarmos estimativas confiveis e precisas ao
mesmo tempo.
Ser importante voc associar essa margem de erro como
uma medida do erro de anlise que citamos no incio dessa abordagem. Quando trabalhamos com amostras natural supor que
temos um erro envolvido j que no utilizamos todos os dados
disponveis. Assim, a margem de erro representa esse erro e, combinando os componentes citados anteriormente, podemos fazer o
tal erro se tornar to pequeno quanto necessrio.
No cenrio das estimativas, vamos discutir a construo das
estimativas para mdias (quando temos dados quantitativos) e
para propores (quando temos dados qualitativos), utilizando as
frmulas geradas na Unidade 7. Contudo, um alerta deve ser feito. Conforme a discusso a respeito das probabilidades (Unidade
6), a curva e a tabela normal padronizada exigem algumas condies para seu uso (o tamanho da amostra deve ser superior a 30
Claretiano - Centro Universitrio

22

Estatstica

elementos e o desvio padro dos dados deve ser populacional).


Quando tais condies no ocorrem, devemos mudar de distribuio de probabilidades.
Na Unidade 8, falaremos de outro tipo de distribuio de
probabilidades conhecida como Distribuio t-Student, que tambm utilizada sob a forma de uma tabela de valores, que est
presente na unidade. Toda a discusso realizada em relao curva e tabela normal padronizada vale, tambm, para a curva e a
tabela t-Student. Com as duas tabelas, podemos construir estimativas para qualquer situao prtica.
Para finalizar nossos estudos, na Unidade 9, conheceremos
as tcnicas de testes de hipteses, que efetivamente um processo de anlise de deciso. Da mesma forma que os intervalos de
confiana, os testes so importantes para abordar os resultados
populacionais com base nos dados amostrais. A principal diferena
entre as duas tcnicas que as estimativas procuram encontrar
um intervalo para descobrir os resultados da populao, enquanto
os testes procuram avaliar se hipteses iniciais sobre o cenrio populacional so verdadeiras ou falsas.
Por exemplo: ao suspeitar que os clientes de determinada
empresa esto reduzindo suas compras (uma hiptese), um analista avaliou uma amostra de 200 desses clientes, determinou o consumo mdio atual e comparou-o com o consumo mdio de meses
atrs. Se na amostra coletada no for verificada uma queda, podemos admitir que a hiptese inicial est correta (verdadeira). Verificaes como essa podem ser implementadas com o ferramental
que discutiremos na Unidade 9.
Com as estimativas e os testes de hipteses, temos uma condio inicial de anlise Estatstica Inferencial.
Nessas condies, estaremos preparados para executar coleta de dados (Unidade 1), representar os dados amostrais (estatstica descritiva, Unidades 2, 3 e 4), determinar probabilidades para
os dados amostrais (Unidades 5, 6 e 7) e realizar inferncias populacionais (Unidades 8 e 9).

Caderno de Referncia de Contedo

23

claro que o contedo aqui estudado, no esgota a Estatstica Bsica. Temos outras ferramentas que no foram consideradas
neste Caderno de Referncia de Contedo e que podem ser teis
na anlise de cenrios gerenciais. Portanto, vale a pena voc pesquisar sobre esses assuntos na bibliografia indicada. Sugerimos,
nesse sentido, um estudo sobre os modelos de regresso e correlao linear e, tambm, outros testes de hipteses, como para
diferena entre mdias.
Com base nessa descrio do contedo e pequeno direcionamento sobre o que ser estudado, esperamos que voc desenvolva seus estudos de uma forma tranquila e natural, lembrando
que os tutores estaro disposio para auxiliar sua caminhada.
Bons estudos!
Glossrio de Conceitos
O Glossrio de Conceitos permite a voc uma consulta rpida e precisa das definies conceituais, possibilitando-lhe um
bom domnio dos termos tcnico-cientficos utilizados na rea de
conhecimento dos temas tratados no Caderno de Referncia de
Contedo Estatstica. Veja, a seguir, a definio dos principais conceitos:
1) Amostra: subconjunto da populao. Por possuir um nmero reduzido de elementos, a amostra mais vivel de
ser pesquisada do que a populao, mas em compensao gera possibilidade de erro maior na anlise.
2) Amostras aleatrias: caso particular de amostragem
que visa garantir a todos os elementos da populao
uma chance real de ser selecionado para a amostra e,
ainda, visa garantir a representatividade de todas as caractersticas importantes da populao na amostra. So
tambm chamadas amostras probabilsticas e permitem
anlises inferenciais de deciso.
3) Distribuio amostral: aplicao dos conceitos de distribuio de probabilidade dentro de uma amostra, considerando que todos os resultados obtidos em amosClaretiano - Centro Universitrio

24

Estatstica

tras so aleatrios e sujeitos a incerteza ou erro. Assim,


podemos associar uma medida de probabilidade para
todos os resultados amostrais. Com base nessas distribuies amostrais so construdas as ferramentas de inferncia estatstica.
4) Distribuio de probabilidade: pode ser entendida
como um comportamento tpico e padronizado dos valores das probabilidades relacionadas com um particular
fenmeno. Dentre as inmeras distribuies de probabilidades existentes, veremos duas que possuem maior
aplicabilidade, a normal e a t-Student.
5) Distribuies de frequncias: ferramentas de tabulao
de dados e correspondem a uma ordenao dos dados
segundo um agrupamento por frequncia de ocorrncia, que podem ser absolutas ou relativas.
6) Estimativa e estimador: estimativas so resultados atribudos a determinados parmetros populacionais com
base em informaes amostrais, e estimador a medida
amostral que permite a construo das estimativas. Por
exemplo, a mdia amostral o estimador que permite
construir estimativas para a mdia populacional.
7) Fenmenos aleatrios: situaes ou aes cotidianas
cujos resultados ou consequncias so marcados pela
incerteza, ou seja, no possvel prever afirmar com
certeza seu resultado final. Os resultados amostrais advindos da Estatstica so todos aleatrios.
8) Grficos de frequncias: representaes grficas das tabelas que permitem a transmisso e a anlise dos dados
mais facilitadas.
9) Hipteses: condies ou resultados a priori que podemos estabelecer para os parmetros populacionais, e
que caracterizam, de forma ampla, o conceito de deciso. Ao testar uma hiptese estamos automaticamente
decidindo sobre os resultados populacionais.
10) Margem de erro: componente principal na construo
das estimativas, pois fornece a dimenso real do erro da
anlise. Por meio dele, possvel estabelecer a preciso
das estimativas. Quanto menor a margem de erro, me-

Caderno de Referncia de Contedo

25

lhores sero os resultados obtidos e mais precisas sero


as decises.
11) Medidas de disperso: so utilizadas para mensurar o
grau de variabilidade no conjunto de dados, considerando a representao dos dados mediante a mdia aritmtica.
12) Medidas de posio: so ferramentas de anlise descritiva dos dados e podem ser classificadas em de tendncia central (mdias, mediana e moda) e de ordem (quartil, decil e percentil).
13) Nvel de confiabilidade: na construo da margem de
erro, estabelecemos a probabilidade de acerto da estimativa, ou seja, qual a probabilidade da estimativa
construda de fato acertar o valor populacional. Essa
probabilidade de acerto o nvel de confiana ou de
confiabilidade da estimativa.
14) Nvel de significncia: podemos tambm tratar das estimativas do ponto de vista do erro. Como lidaremos com
probabilidades, existe a chance de erro, ou seja, uma
probabilidade da estimativa errar o valor populacional
e essa probabilidade de erro o nvel de significncia.
15) Notaes importantes: neste caderno, trabalharemos
simultaneamente com a amostra e com a populao, ento, importante estabelecer a notao para cada caso:
a) N: tamanho da populao.
b) n: tamanho da amostra.
c) fa: frequncia absoluta.
d) fr%: frequncia relativa percentual.
e) X : mdia aritmtica simples.
f) X p : mdia aritmtica ponderada.
g)
h)
i)
j)
k)

G: mdia geomtrica.
Md: mediana.
Mo: moda.
Q1, Q2 e Q3: quartis.
Var: varincia amostral.
Claretiano - Centro Universitrio

26

Estatstica

l) S: desvio padro da amostra ou desvio padro


amostral.
m) CV: coeficiente de variao.
n) IA: ndice de assimetria.
o) : mdia da populao ou mdia populacional.
p) : desvio padro da populao ou desvio padro
populacional.
q) : proporo da populao ou proporo populacional.
r) p: proporo da populao ou proporo populacional.
s) Z: valor da tabela da distribuio normal padronizada.
t) t: valor da tabela da distribuio t-Student.
u) : nvel de significncia.
v) (1 ): nvel de confiana.
16) Populao estatstica: conjunto que contm todas as
fontes de dados de interesse; todos os dados e informaes sobre uma varivel qualquer. Em geral, muito
grande e invivel de ser pesquisada completamente.
17) Probabilidade: ferramenta que possibilita associar uma
chance de ocorrncia a um determinado fenmeno aleatrio.
18) Simetria: particularidade de alguns conjuntos de dados,
que possuem a mdia igual mediana e moda. Algumas distribuies de probabilidade, como a normal e a
t-Student, apresentam um comportamento simtrico,
que facilita os clculos e gera menor variabilidade na informao.
Esquema dos Conceitos-chave
Para que voc tenha uma viso geral dos conceitos mais
importantes deste estudo, apresentamos, a seguir (Figura 1), um
Esquema dos Conceitos-chave do Caderno de Referncia de Contedo. O mais aconselhvel que voc mesmo faa seu esquema de

Caderno de Referncia de Contedo

27

conceitos-chave ou at mesmo seu mapa mental. Esse exerccio


uma forma de voc construir seu conhecimento, ressignificando as
informaes a partir de suas prprias percepes.
importante ressaltar que o propsito desse Esquema dos
Conceitos-chave representar, de maneira grfica, as relaes entre os conceitos por meio de palavras-chave, partindo dos mais
complexos para os mais simples. Esse recurso pode auxiliar voc
na ordenao e na sequenciao hierarquizada dos contedos de
ensino.
Com base na teoria de aprendizagem significativa, entende-se que, por meio da organizao das ideias e dos princpios em
esquemas e mapas mentais, o indivduo pode construir seu conhecimento de maneira mais produtiva e obter, assim, ganhos pedaggicos significativos no seu processo de ensino e aprendizagem.
Aplicado a diversas reas do ensino e da aprendizagem escolar (tais como planejamentos de currculo, sistemas e pesquisas
em Educao), o Esquema dos Conceitos-chave baseia-se, ainda,
na ideia fundamental da Psicologia Cognitiva de Ausubel, que estabelece que a aprendizagem ocorre pela assimilao de novos
conceitos e de proposies na estrutura cognitiva do aluno. Assim,
novas ideias e informaes so aprendidas, uma vez que existem
pontos de ancoragem.
Tem-se de destacar que aprendizagem no significa, apenas, realizar acrscimos na estrutura cognitiva do aluno; preciso, sobretudo, estabelecer modificaes para que ela se configure
como uma aprendizagem significativa. Para isso, importante considerar as entradas de conhecimento e organizar bem os materiais
de aprendizagem. Alm disso, as novas ideias e os novos conceitos devem ser potencialmente significativos para o aluno, uma vez
que, ao fixar esses conceitos nas suas j existentes estruturas cognitivas, outros sero tambm relembrados.
Nessa perspectiva, partindo-se do pressuposto de que voc
o principal agente da construo do prprio conhecimento, por
Claretiano - Centro Universitrio

28

Estatstica

meio de sua predisposio afetiva e de suas motivaes internas


e externas, o Esquema dos Conceitos-chave tem por objetivo tornar significativa a sua aprendizagem, transformando o seu conhecimento sistematizado em contedo curricular, ou seja, estabelecendo uma relao entre aquilo que voc acabou de conhecer com
o que j fazia parte do seu conhecimento de mundo (adaptado do
site disponvel em: <http://penta2.ufrgs.br/edutools/mapasconceituais/utilizamapasconceituais.html>. Acesso em: 11 mar. 2010).

Figura 1 Esquema dos conceitos-chave do Caderno de Referncia de Contedo Estatstica.

Caderno de Referncia de Contedo

29

Como voc pode observar, esse Esquema d a voc, como


dissemos anteriormente, uma viso geral dos conceitos mais importantes deste estudo. Ao segui-lo, voc poder transitar entre
um e outro conceito e descobrir o caminho para construir seu
processo de ensino-aprendizagem. Por exemplo, o mapa indica
para voc que existe um roteiro predeterminado para uma melhor
compreenso dos assuntos, assim, antes de estudar os conceitos
de inferncia, devemos estudar os conceitos de probabilidades e
de distribuies de probabilidades. Pelo processo explicitado pelo
mapa, pode-se ter uma viso clara do tratamento da temtica da
Estatstica no CRC.
O Esquema dos Conceitos-chave mais um dos recursos de
aprendizagem que vem se somar queles disponveis no ambiente virtual, por meio de suas ferramentas interativas, bem como
queles relacionados s atividades didtico-pedaggicas realizadas presencialmente no polo. Lembre-se de que voc, aluno EaD,
deve valer-se da sua autonomia na construo de seu prprio conhecimento.
Questes Autoavaliativas
No final de cada unidade, voc encontrar algumas questes
autoavaliativas sobre os contedos ali tratados, as quais podem
ser de mltipla escolha, abertas objetivas ou abertas dissertativas.
Responder, discutir e comentar essas questes, bem como
relacion-las com a prtica profissional pode ser uma forma de
voc avaliar seu conhecimento. Assim, mediante a resoluo de
questes pertinentes ao assunto tratado, voc estar se preparando para a avaliao final, que ser dissertativa. Alm disso, essa
uma maneira privilegiada de voc testar seus conhecimentos e
adquirir uma formao slida para sua prtica profissional.
Voc encontrar, ainda, no final de cada unidade, um gabarito, que lhe permitir conferir suas respostas sobre as questes
autoavaliativas de mltipla escolha.
Claretiano - Centro Universitrio

30

Estatstica

As questes de mltipla escolha so as que tm como resposta


apenas uma alternativa correta. Por sua vez, entende-se por
questes abertas objetivas as que se referem aos contedos
matemticos ou queles que exigem uma resposta determinada,
inalterada. J as questes abertas dissertativas obtm por
resposta uma interpretao pessoal sobre o tema tratado; por isso,
normalmente, no h nada relacionado a elas no item Gabarito.
Voc pode comentar suas respostas com o seu tutor ou com seus
colegas de turma.

Bibliografia Bsica
fundamental que voc use a Bibliografia Bsica em seus
estudos, mas no se prenda s a ela. Consulte, tambm, as bibliografias complementares.
Figuras (ilustraes, quadros...)
Neste material instrucional, as ilustraes fazem parte integrante dos contedos, ou seja, elas no so meramente ilustrativas, pois esquematizam e resumem contedos explicitados no
texto. No deixe de observar a relao dessas figuras com os contedos, pois relacionar aquilo que est no campo visual com o conceitual faz parte de uma boa formao intelectual.
Dicas (motivacionais)
O estudo deste Caderno de Referncia de Contedo convida
voc a olhar, de forma mais apurada, a Educao como processo
de emancipao do ser humano. importante que voc se atente
s explicaes tericas, prticas e cientficas que esto presentes
nos meios de comunicao, bem como partilhe suas descobertas
com seus colegas, pois, ao compartilhar com outras pessoas aquilo que voc observa, permite-se descobrir algo que ainda no se
conhece, aprendendo a ver e a notar o que no havia sido percebido antes. Observar , portanto, uma capacidade que nos impele
maturidade.

Caderno de Referncia de Contedo

31

Voc, como aluno dos cursos de Graduao na modalidade


EaD, necessita de uma formao conceitual slida e consistente.
Para isso, voc contar com a ajuda do tutor a distncia, do tutor
presencial e, sobretudo, da interao com seus colegas. Sugerimos, pois, que organize bem o seu tempo e realize as atividades
nas datas estipuladas.
importante, ainda, que voc anote suas reflexes em seu
caderno ou no Bloco de Anotaes, pois, no futuro, elas podero
ser utilizadas na elaborao de sua monografia ou de produes
cientficas.
Leia os livros da bibliografia indicada, para que voc amplie
seus horizontes tericos. Coteje-os com o material didtico, discuta a unidade com seus colegas e com o tutor e assista s videoaulas.
No final de cada unidade, voc encontrar algumas questes
autoavaliativas, que so importantes para a sua anlise sobre os
contedos desenvolvidos e para saber se estes foram significativos
para sua formao. Indague, reflita, conteste e construa resenhas,
pois esses procedimentos sero importantes para o seu amadurecimento intelectual.
Lembre-se de que o segredo do sucesso em um curso na
modalidade a distncia participar, ou seja, interagir, procurando
sempre cooperar e colaborar com seus colegas e tutores.
Caso precise de auxlio sobre algum assunto relacionado a
este Caderno de Referncia de Contedo, entre em contato com
seu tutor. Ele estar pronto para ajudar voc.

Claretiano - Centro Universitrio

Claretiano - Centro Universitrio

EAD

A natureza dos dados


estatsticos

1. Objetivos
Conhecer um pouco da histria da Estatstica.
Entender o que populao e amostra e suas relaes.
Conhecer e aplicar as fases de desenvolvimento de um
trabalho estatstico.
Compreender a metodologia da coleta dos dados.

2. Contedos
Origem histrica da Estatstica.
Populao e amostra.
Fases de um trabalho estatstico. Coleta, crtica, apurao
e exposio de dados.

34

Estatstica

3. ORIENTAES para o estudo da unidade


Antes de iniciar o estudo desta unidade, importante que
voc leia as orientaes a seguir:
1) Tenha sempre a mo o significado dos conceitos explicitados no Glossrio e suas ligaes pelo Esquema dos
Conceitos-chave para o estudo de todas as unidades
deste CRC. Isso poder facilitar sua aprendizagem e seu
desempenho.
2) Procure desenvolver as atividades e interatividades dentro do cronograma previsto para no prejudicar o andamento de seus estudos.
3) Antes de iniciar os estudos desta unidade pode ser interessante refletir sobre alguns conceitos introdutrios
importantes. Parte desses conceitos ser discutida com
mais detalhes durante o andamento deste caderno.
Populao estatstica: o conjunto que contm todos
os elementos ou indivduos de interesse para a realizao de uma pesquisa. Em geral, a populao estatstica bem grande, sendo invivel a coleta ou estudo
de todos os seus elementos.
Amostra: um subconjunto, uma parte representativa da populao. Como invivel estudar toda a populao, em geral, faz-se uma amostragem para efetivar as pesquisas e anlises de dados. A amostra deve
satisfazer algumas propriedades e a principal delas
ser aleatria.
Metodologia de pesquisa: como as anlises estatsticas so feitas com base em amostragem, importante que a metodologia empregada na coleta dos dados
seja a mais adequada possvel, a fim de garantir a representatividade dos dados da amostra, ou seja, para
permitir que a anlise dos dados amostrais permita
uma extrapolao para a populao.

U1 - A natureza dos dados estatsticos

35

4. Introduo UNIDADE
Nesta unidade, vamos conversar um pouco sobre a origem e
a evoluo da Estatstica. Alm disso, compreender a incluso dos
tratamentos da informao nos Parmetros Curriculares Nacionais
e sua importncia.
Abordaremos, tambm, a Fundao Instituto Brasileiro de
Geografia e Estatstica (IBGE), que responsvel por todas as estatsticas no Brasil, fornecendo dados importantes para a tomada de
deciso de nossos governantes.

5. UM POUCO DE HISTRIA
A origem da palavra estatstica est associada diretamente ao termo latino status (estado) e ao termo latino sticas (contagem), portanto estatstica, originalmente, significa contagem do
estado.
Desde a antiguidade, realizava-se coleta de informaes com
finalidades tributrias. H indcios, tambm, de que 3000 a.C. j se
realizavam coletas de dados na Babilnia, China e Egito.
De acordo com Moreira (1983), a Estatstica pode ser dividida em trs grandes perodos para caracterizao de sua histria e
evoluo. So eles: perodo focado na obteno de fatos, perodo
de evoluo das teorias estatsticas e perodo do aperfeioamento
tcnico-cientfico. Observemos cada um deles a seguir.
Perodo focado na obteno de fatos
Esse perodo abrange a Idade Antiga, a Idade Mdia e parte
da Idade Moderna. Pelos registros encontrados, a Estatstica era
conhecida como Estatstica Administrativa, tendo em vista o interesse estatal dos dados. Vejamos alguns destaques:

Claretiano - Centro Universitrio

36

Estatstica

Por meio do livro sacro Chou king, de autoria atribuda a


Confcio, tm-se notcias da preparao dos estados da
China, no ano 2238 a.C.
Na Idade Mdia, no ano de 721, os rabes fizeram uma
coleta numrica das cidades dominadas, computando a
populao e a produo para controle das conquistas territoriais.
Guilherme, o Conquistador, ordenou a elaborao de um
cadastro da diviso do solo da Inglaterra das vrias classes
sociais existentes, para fins de arrecadao de impostos.
Perodo de evoluo das teorias estatsticas
No segundo perodo, surge a denominao Estatstica, que
passa a ser uma disciplina autnoma. Citaremos alguns destaques
desse perodo:
Na Inglaterra, no sculo 17, John Grant inicia as investigaes sobre a Estatstica Demogrfica e estabelece algumas relaes entre nascimento e morte.
Blaise Pascal e Pierre Fermat descobrem os clculos das
probabilidades, instrumento muito til hoje em dia para
anlise de fenmenos aleatrios.
Adolphe Quetelet, no sculo 18, aplica a lei dos grandes
nmeros no estudo demogrfico e social.
Perodo do aperfeioamento tcnico cientfico
O terceiro perodo foi caracterizado pela aplicao dos conceitos estatsticos na cincia. Vejamos os destaques deste perodo:
Em 1853, h o Primeiro Congresso de Estatstica.
Francis Galton emprega a Estatstica Metodolgica nos
problemas de hereditariedade.
James Maxwell emprega a Estatstica na Teoria Cintica
dos Gases.

U1 - A natureza dos dados estatsticos

37

No Brasil, a Estatstica tem sua histria associada histria


do Instituto Brasileiro de Geografia e Estatstica (IBGE), cujas razes
remontam ao Imprio.
claro que a evoluo da Estatstica como cincia foi promovida em virtude das aplicaes nas mais diversas reas do conhecimento. Conforme as cincias naturais, as cincias da sade, as
cincias sociais foram se aprofundando, as metodologias de anlise estatstica foram se estruturando e evoluindo naturalmente,
em especial, aps a utilizao mais eficiente dos recursos computacionais.
Inicialmente, para entender a extenso da aplicao da Estatstica importante entender claramente os principais conceitos
desse Caderno de Referncia de Contedo.

6. CONCEITOS IMPORTANTES
Conforme Moreira (1983), podemos dar Estatstica diversas definies, seja como cincias, seja como ferramenta.
Cincia: o conjunto de conhecimentos exatos e racionais, relativos s causas das realizaes e deduzidas pela
demonstrao.
Ferramenta: a ordem ou conjunto de processos que
devem ser estabelecidos para, mediante a investigao,
atingir determinado objetivo. Quando definimos um procedimento que j se mostrou vlido para vrios experimentos, temos o mtodo cientfico.
Nas reas de aplicao, podemos entender que a Estatstica
um conjunto de tcnicas relacionadas com a coleta, representao, interpretao e anlise de dados obtidos em processos investigativos, sejam eles relacionados a experimentos de laboratrio,
experimentos de campo, simulaes, pesquisas de mercado, pesquisas de opinio, isto , qualquer procedimento cuja finalidade
seja coletar dados para anlise.
Claretiano - Centro Universitrio

38

Estatstica

Para uma melhor visualizao e entender de fato os objetivos da Estatstica, considere um exemplo bem simples. Suponha
que voc retire uma fatia de um bolo inteiro. Ao experiment-la,
uma pessoa pede sua opinio sobre o bolo, perguntando: O bolo
est bom?. Em geral, a tendncia que voc responda algo como:
O bolo est bom, ou ento O bolo no est bom.
claro que as respostas apresentadas no esto totalmente
de acordo com a situao, pois no temos como afirmar se o bolo
est ou no est bom, pois conhecemos apenas uma pequena
parte dele. Ento, por que as pessoas respondem dessa forma?
Simples: ns temos a tendncia de generalizar o todo pela
parte. Porm, a generalizao s tem sentido se o bolo for totalmente homogneo, o que no podemos afirmar. Avalie: quando
voc se serve de um pedao de bolo, costuma optar pelos pedaos
dos cantos? Ou prefere os pedaos que esto na regio central?
Ao observar que h partes diferentes no bolo, voc pode perceber
argumentos contrrios homogeneidade dele.
Se o bolo for homogneo, a generalizao seria imediata, j
que o pedao veio do bolo e se o pedao est bom, ento o bolo
tambm estar. Como no podemos afirmar se o bolo ou no
homogneo, no podemos afirmar se est bom ou no.
Se pudssemos comer o bolo todo, o nvel de acerto da resposta seria muito maior, mas ainda teramos um problema. Como
no podemos afirmar que o bolo homogneo, encontraramos
diferentes sabores no bolo, o que dificultaria afirmarmos algo sobre o bolo.
Nesse sentido, temos situaes prticas em que a informao de interesse no total, apenas uma parte dos dados, e ainda tem um fator de variabilidade no totalmente controlvel, e,
nesses casos, todas as concluses no so totalmente corretas.
Estatstica, ento, uma cincia que analisa e caracteriza
variveis, considerando a presena de variabilidade e resultados

U1 - A natureza dos dados estatsticos

39

parciais. A variabilidade presente nas variveis natural, visto que


no processo de coleta de qualquer tipo de varivel ocorre a particularidade de cada elemento estudado, mesmo em situaes de
alto controle. Sempre existiro componentes no controlveis que
acarretaro variabilidades nos resultados, gerando, assim, probabilidades de acerto ou no em nossas anlises.

7. POPULAO VERSUS AMOSTRA


Quanto parcialidade dos resultados, podemos melhorar o
conceito, pensando o seguinte: em um processo de pesquisa ou
de investigao, sempre temos um conjunto de fontes de informaes, e, em geral, contendo um grande nmero de elementos. Por
exemplo, certamente voc j ouviu falar em pesquisas eleitorais.
Ento, imagine uma pesquisa sobre candidatos ao cargo de prefeito de uma determinada cidade. Considerando que ela possui,
aproximadamente, 42 mil eleitores, poderamos pesquisar todos?
Se pesquisarmos todas as fontes, teramos trs problemas: o
tempo gasto para a coleta e o custo da coleta, tendendo a ser significativos, podendo inviabilizar a coleta e, por ltimo, a possibilidade de desconhecimento de parte dos elementos. Nesse sentido,
torna-se invivel o estudo de toda a populao de elementos.
Populao estatstica o conjunto total de elementos disponveis, com, pelo menos, uma caracterstica em comum e de interesse, que contm n elementos (tendendo a ser muito grande). A
populao pode ser classificada como: finita ou infinita (em relao ao nmero de elementos) e discreta ou contnua (em relao
ao tipo de elementos). No confundir o conceito de populao estatstica com o conceito de populao humana.
Populao estatstica deve ser entendida como qualquer
tipo de agrupamento, no s pessoas, mas tambm de objetos,
empresas, espcimes animais e vegetais, entre outros.

Claretiano - Centro Universitrio

40

Estatstica

Utilizando a populao, garantimos benefcios importantes


para a preciso dos resultados finais, j que toda a informao disponvel passa a ser conhecida. Contudo, permanece o problema
da variabilidade natural dos dados, que pode ser mais bem entendido com 100% da informao disposio.
Quando a inviabilidade do estudo populacional se fizer presente, a coleta de dados se faz com apenas uma parte representativa da populao, conhecida como amostra.
Amostra um subconjunto da populao, uma parte representativa do todo, que deve necessariamente conservar todas as
caractersticas dos elementos da populao. Em geral, deve ser
definida de forma finita e bem definida para viabilizar a coleta dos
dados. por meio da amostra que chegamos ao conhecimento da
populao.
O uso de amostra gera reduo nos custos da coleta, reduo no tempo de execuo da coleta, maior facilidade na coleta e
erros nas anlises.
Como no temos todos os elementos, existir uma chance
de os resultados no serem significativos a ponto de representar a populao. Assim, fundamental estruturar corretamente
a amostragem, a fim de minimizar a margem de erro dos dados.
Nem toda amostra til para anlises estatsticas. A amostra deve
ser representativa, ou seja, deve ser um retrato em miniatura da
populao.
Garantindo-se um procedimento correto de amostragem,
podemos analisar o comportamento das variveis mediante a anlise estatstica descritiva e construir estimativas confiveis e precisas a respeito das variveis por intermdio da anlise estatstica
inferencial, que o processo no qual tiramos concluses sobre o
comportamento populacional de uma varivel, com base no comportamento particular observado e estudado na amostra.

U1 - A natureza dos dados estatsticos

41

A composio de uma amostra deve considerar critrios rigorosos para possibilitar resultados mais confiveis. Em Estatstica
lidamos com amostras probabilsticas, que permite trabalharmos
com estimativas e determinar de forma correta o erro amostral.
Mais detalhes sobre as amostras probabilsticas sero dados na
Unidade 7.
Como todas as anlises sero feitas com base nos dados coletados, importante que a metodologia utilizada na coleta seja
cientificamente correta e que os instrumentos ou questionrios
utilizados sejam eficientes.
Assim, importante que se conhea com detalhes os objetivos da pesquisa ou o objetivo que se deseja atingir com os dados,
quais as hipteses de interesse e o que desejamos testar e investigar. Com os objetivos definidos, podemos pensar de uma forma
geral no seguinte procedimento metodolgico:
1) Identificao da populao de interesse e estruturao
de como ser o procedimento amostral, caso seja necessrio.
2) Construo dos instrumentos para a coleta dos dados
(questionrios, formulrios, roteiros etc.). Para a elaborao dos instrumentos de coleta dos dados, devemos
considerar que esse item a espinha dorsal de qualquer
levantamento e precisa reunir as informaes necessrias para avaliar os objetivos definidos, utilizando uma
linguagem adequada e de fcil compreenso e que no
induzam a resposta. Pode mesclar questes abertas (dissertativas) e questes fechadas (mltipla escolha).
3) Realizao de uma pr-pesquisa, cujo propsito avaliar a eficcia dos instrumentos de coleta ou mesmo do
processo amostral. Aps a aplicao da pr-pesquisa, os
resultados obtidos devem ser utilizados para efetuar as
correes necessrias, tanto nos instrumentos quanto
no perfil da amostragem.
4) Coleta de dados a fase de obteno de dados, e dever ser feita com muito cuidado, pois dela depender
a veracidade dos resultados obtidos. Basicamente, a
Claretiano - Centro Universitrio

42

Estatstica

aplicao dos instrumentos, j revisados, nos elementos


selecionados na amostragem, que deve ser probabilstica (ou aleatria). Assim, o procedimento a ser aplicado
para se efetivar a coleta dos dados deve respeitar as caractersticas probabilsticas da amostra.
5) Crtica de dados a fase que tem por objetivo verificar
possveis ocorrncias de dados equivocados, tanto na
coleta direta dos dados quanto na fase de digitao ou
de registro dos dados.
6) Tabulao dos dados a fase da organizao dos dados
obtidos na amostragem. A tabulao, que pode ser feita
com tabelas ou com grficos, permite uma viso inicial
dos resultados e tambm serve para uma divulgao inicial dos dados.
7) Anlise dos dados a fase onde, de fato, utilizamos os
recursos da anlise estatstica, mediante as medidas
descritivas e inferenciais, que permitiro a determinao
das estimativas e dos testes das hipteses de interesse.
O sucesso no processo metodolgico representa o sucesso
na coleta dos dados, ou seja, com ele teremos dados representativos para analisar, e assim poderemos obter respostas significativas
para avaliar os interesses estipulados no objetivo inicial.

8. QUESTES AUTOAVALIATIVAS
Sugerimos que voc procure responder, discutir e comentar
as questes a seguir que tratam da temtica desenvolvida nesta
unidade.
A autoavaliao pode ser uma ferramenta importante para
voc testar seu desempenho. Se encontrar dificuldades para responder a essas questes, procure revisar os contedos estudados
para sanar suas dvidas. Esse o momento ideal para realizar uma
reviso desta unidade. Lembre-se de que, na Educao a Distncia, a construo do conhecimento ocorre de forma cooperativa
e colaborativa; compartilhe, portanto, suas descobertas com seus
colegas.

U1 - A natureza dos dados estatsticos

43

Confira, a seguir, as questes propostas para verificar o seu


desempenho no estudo desta unidade:
1) Quais motivos tornam invivel a coleta de toda a populao estatstica?
Quais as vantagens e quais as desvantagens em utilizar uma amostra em vez
de utilizar a populao?
2) Na realizao de uma pesquisa de mercado para avaliar a potencialidade de
venda de uma determinada marca de bebida energtica, que ser realizada
por amostragem, qual o procedimento amostral mais indicado?

Gabarito
Confira, a seguir, as respostas corretas para as questes autoavaliativas propostas:
1) Em geral, a populao representa uma quantidade muito grande, ou at
mesmo infinita, de elementos; sendo assim, difcil coletar todos os elementos, alm de gastar um tempo elevado, bem como um custo alto. Assim,
coletar uma amostra mais rpido e barato, bem como mais fcil, mas em
compensao se a metodologia da amostragem no for bem executada o
erro gerado pela mesma pode ser muito alto. Um exemplo prtico so as
pesquisas eleitorais, em que apenas parte dos eleitores so ouvidos pelos
institutos de pesquisa. Quando bem feitas, essas pesquisas conseguem prever com qualidade os resultados.
2) Em pesquisas de mercado onde o perfil do consumidor importante, o melhor a amostragem estratificada, pois assim podemos ter uma representao proporcional de cada perfil na amostra.

9. Consideraes
Estudamos nessa primeira unidade alguns conceitos importantes para um bom entendimento da Estatstica. Vimos que, em
geral, trabalhamos com uma amostra dos dados e que, para gerar uma amostragem com dados representativos, devemos utilizar
uma metodologia adequada.
Com base nos dados coletados, ou seja, com base na amostra obtida, passamos para as fases de tabulao e anlise, que sero discutidas nas unidades seguintes.
Bons estudos!
Claretiano - Centro Universitrio

44

Estatstica

10. referncias bibliogrficas


FONSECA, J. S. Curso de Estatstica. 6. ed. So Paulo: Atlas, 1996.
MARTINS, G. A. Estatstica geral e aplicada. 2. ed. So Paulo: Atlas, 2002.
MOREIRA, J. S. Elementos de Estatstica. 9. ed. So Paulo: Atlas, 1983.
OLIVEIRA, F. E. M. Estatstica e probabilidade. 2. ed. So Paulo: Atlas, 1999.

You might also like