You are on page 1of 31

Organizao de dados

quantitativos

Estatistica e a ciencia que tem por objetivo orientar a


coleta, o resumo, a apresentacao, a analise e a
interpretacao de dados.

Podem ser identificadas duas grandes areas de atuacao


desta ciencia: a estatistica descritiva, envolvida com o
resumo e a apresentacao dos dados, e a estatistica
inferencial, que ajuda a concluir sobre conjuntos maiores
de dados (populacoes) quando apenas partes desses
conjuntos (as amostras) foram estudadas.

Os metodos da estatistica inferencial sao ferramenta


imprescindivel no teste das hipoteses cientificas.

"Unidade experimental e unidade de


observacao sao a menor unidade a fornecer
uma informacao. "

"Dados sao as informacoes (numericas ou


nao) obtidas de uma unidade experimental
ou de observacao."

"Variavel e toda caracteristica que, observada


em uma unidade experimental, pode variar de
um individuo para outro. "

"E importante identificar que tipo de variavel


esta sendo estudado, uma vez que sao
recomendados procedimentos estatisticos
diferentes em cada situacao.

A principal divisao ocorre entre variaveis


quantitativas e qualitativas."

"Variaveis quantitativas sao aquelas cujos


dados sao valores numericos que expressam
quantidades, como a estatura das pessoas, o
nivel serico de calcio em roedores ou o
numero de sementes integras em uma
vagem.

Elas podem ainda ser classificadas em:"

Variaveis quantitativas discretas sao


aquelas em que os dados somente podem
apresentar determinados valores, em geral,
numeros inteiros.

"Variaveis quantitativas continuas sao


aquelas cujos dados podem apresentar
qualquer valor dentro de um intervalo de
variacao possivel."

"Variaveis qualitativas (ou variaveis


categoricas ou atributos) sao as que fornecem dados de natureza nao-numerica, como
a cor de uma flor, a raca de uma ovelha ou o
sexo de um paciente."

"Neste tipo de variavel, as diferentes


categorias que a compoem podem ter sido
obtidas segundo dois niveis de mensuracao:"

Nivel nominal: Como o nome implica, nesse


nivel diferencia-se uma catego- ria da outra
somente por meio da denominacao da
categoria.

As variaveis nominais podem ainda ser divididas


em binominais, binarias ou dicotomicas,
quando compostas por duas categorias (como e
o caso de pessoas Rh+ e Rh) e polinominais ou
politomicas, quando apresentam mais de duas
categorias possiveis (como os grupos A, B, AB e
O do sistema sanguineo ABO).

"Nivel ordinal: Nesse nivel, nao so e possivel


identificar diferentes categorias, mas
tambem reconhecer graus de intensidade
entre elas, o que possibilita uma ordenacao
das varias categorias."

E necessario, no entanto, que a gradacao


seja inerente a variavel e nao imposta por
conveniencia do pesquisador.

Populacao ou universo: todo conjunto de


unidades experimentais (ou observacionais)
que apresenta uma ou mais caracteristicas
em comum.

O objeto dos estudos sao sempre as


populacoes, pois, somente assim, as conclusoes dos trabalhos cientificos nao se
restringem apenas as unidades neles estudadas.

Amostra e qualquer fracao de uma


populacao.

Como sua finalidade e repre- sentar a


populacao, deseja-se que a amostra escolhida
apresente as mesmas carac- teristicas da
populacao de origem, isto e, que seja uma
amostra representativa ou naotendenciosa.

80 comprimidos do lote 53/1998 constituem


uma amostra representativa desse lote,
desde que escolhidos por um processo
casual.

Tanto o numero de individuos selecionados


para a amostra quanto a tecnica de selecao
sao extremamente importantes para que os
resultados obtidos no estudo sejam
generalizados para a populacao.

Parametro e um valor que resume, na


populacao, a informacao relativa a uma variavel.

Por exemplo, 45% dos alunos matriculados na


disciplina D, em 1999, eram do sexo masculino.
Todos os alunos matriculados nesse ano foram
estudados; portanto, a informacao e referente a
populacao toda. No caso, 45% e um parametro.

Da mesma forma, se a estatura media de todos


esses alunos foi 175 cm, essa media e um
parametro.

Estatistica: denominacao dada a uma


quantidade, calculada com base nos elementos
de uma amostra, que descreve a informacao
contida nesse conjunto de dados.

A media, a percentagem, o desvio padrao, o


coeficiente de correlacao, calculados em uma
amostra, sao estatisticas.

As estatisticas variam de uma amostra para


outra; portanto, sao, elas proprias, variaveis
aleatorias.

Os parametros sao dificeis de se obter, pois implicam o


estudo de toda a populacao e costumam ser substituidos
por valores calculados em amostras representativas da
populacao-alvo.

Se tivesse sido examinada uma amostra de 50 estudantes


matriculados na disciplina D, e 40% fossem do sexo
masculino, esse valor constituiria uma estimativa do
parametro percentagem de homens matriculados
naquela disciplina.

A estimativa e o valor numerico de uma estatistica,


usado para realizar inferencias sobre o parametro. Da
mesma forma, o valor numerico da media para a estatura
desses 50 alunos, digamos 173 cm, e uma estimativa da
media populacional.

Suponha que, ao estudar a quantidade de albumina no


plasma de pessoas com determinada doenca, um
pesquisador obtenha, em 25 individuos, os seguintes valores
(em g/100 mL):

Dos dados obtidos, opesquisador pode


concluir inicialmente que:
(1)Os valores de albumina nos pacientes variam

de individuo para individuo.


(2)Alguns individuos apresentam valores iguais.
(3)Os valores oscilam entre 4,5 e 5,5.

Tabela de grupamento simples

A Fr pode ser usada para se obter percentis;

O percentil de ordem k (Pk) e o valor de x que


e precedido por k% valores e seguido por
(100-k)% dos valores.

Por exemplo, P25 e o valor de x que e


precedido por 25% dos valores (os 25%
menores da serie) e seguido pelos restantes
75%.

Os percentis P25, P50 e P75 dividem o


conjunto de dados em quatro partes iguais;
por isso, recebem o nome de quartis e sao
respectivamente os quartis Q1, Q2 e Q3.

Na Tabela 1.1, o percentil P25 e um valor


entre 4,8 e 4,9, ja que 16% dos individuos
tem valores iguais ou menores do que 4,8 e
28% das pessoas tem niveis de albumina
iguais ou menores do que 4,9.

(1) A tabela deve ser precedida de um titulo,


suficientemente claro para que o leitor nao necessite
voltar ao texto para entender o conteudo da mesma.
(2) A tabela e limitada por uma linha limitante
superior e outra inferior, que indica seu final. O
cabecalho deve ser separado do restante do texto por
umalinha horizontal.
(3) Nao se usam linhas verticais separando as colunas;
usam-se espacos em branco.
(4) As abreviaturas e os simbolos pouco conhecidos
devem ser explicados no rodape da tabela.
(5) Deve ser indicada a fonte dos dados.

Histograma
O histograma e o grafico mais utilizado para variaveis
continuas.
Consiste de uma sucessao de retangulos contiguos, cuja
base e o intervalo de classe, e a altura, a frequencia
relativa em cada classe dividida por h, a amplitude do
intervalo de classe.
Se as classes forem todas de igual amplitude, nao e
necessario realizar a divisao.

A ogiva e o grafico adequado para representar as frequencias acumuladas (F ou


Fr).

A ogiva e util para se identificar graficamente


percentis de interesse, como, por exemplo, a
mediana (percentil 50).

A representacao grafica apropriada para


variaveis quantitativas discretas e o diagrama em bastao.

Esse grafico e parecido com um histograma,


com uma importante diferenca: as
frequencias para cada valor de x sao agora
representadas por bastoes e nao retangulos,
pois inexiste continuidade entre os valores.

A frequencia relativa (fr) de um valor estima a


probabilidade verdadeira de ocorrencia deste
valor, que so e conhecida tendo-se
informacao quanto a todos os individuos da
populacao.

You might also like