You are on page 1of 60

Campus de Botucatu

Disciplina: Estatística e Experimentação Curso: Agronomia


Profª Drª Juliana Gadum de Lalla

DEFINIÇÃO DE ESTATÍSTICA

A Estatística constitui-se em uma ciência destinada a:

I. Decidir o melhor plano (experimental ou observacional) para a


execução de uma pesquisa  metodologia científica.

II. Organizar e resumir dados de contagem, mensuração e


classificação  raciocínio dedutivo.

III. Inferir sobre populações de unidades (indivíduos, animais, objetos)


quando uma parte (amostra) é considerada  raciocínio indutivo.

ESTATÍSTICA: CIÊNCIA + TECNOLOGIA + ARTE

Definição de Bioestatística

É a metodologia estatística aplicada às ciências biológicas,


com a finalidade planejar, coletar, organizar, resumir, analisar e
interpretar os dados, permitindo tirar conclusões biológicas sobre
populações a partir do estudo de amostras.

BIOESTATÍSTICA: VIDA + ESTATÍSTICA


VARIÁVEL BIOLÓGICA (Conceito)

 Quando se estuda uma variável biológica, o maior interesse


do pesquisador é conhecer o comportamento dessa variável,
analisando a ocorrência de suas possíveis realizações.

 O estudo de bioestatística compreende o planejamento e a


análise estatística (estatística descritiva e inferencial), mas voltado
às informações biológicas contidas nas variáveis em consideração,
transformadas em dados coletados para a operacionalização dos
métodos estatísticos.

ANÁLISE DESCRITIVA

 Organização dos dados coletados por meio de


classificação, contagem ou mensuração. Os dados devem ser
apresentados de forma clara por meio tabelas, gráficos e medidas
resumo (posição e variabilidade), não permitindo, no entanto,
conclusões analíticas.

ANÁLISE INFERENCIAL

 Permite realizar inferências (conclusões e analíticas) a


respeito de populações a partir de amostras pela aplicação de
testes de hipóteses e/ou construção de intervalos de confiança.
Deve ser considerado que está utilizando-se amostras para inferir
aos dados reais da população (parâmetros), portanto existindo
nestas estatísticas (dados obtidos de amostras) uma margem de
erro. A exceção é o censo, quando toda a população é pesquisada.
PLANEJAMENTO

Consiste em estabelecer o desenho amostral com poder


adequado para os testes de hipóteses e estimações sem viéses
(distorções). Deve ser considerado o cálculo do tamanho da
amostra (tamanho ético e estatístico) e a definição da forma de
coleta de dados (técnicas de amostragem).

DADOS EXPERIMENTAIS

 Dados obtidos através de um experimento, relacionados com


uma determinada característica existente nos indivíduos ou objetos
em estudo.

POPULAÇÃO

 Grande conjunto de dados que contém a característica que se


tem interesse em estudar

População finita

População infinita

 Dificuldade de obter todas as medidas da população (natureza


econômica, ética, física)

AMOSTRA

 Parcela representativa (subconjunto) da população, escolhida


arbitrariamente e sobre a qual recairá o estudo a ser feito.

 Amostragem
AMOSTRA ALEATÓRIA

 Validade das conclusões que serão feitas a respeito da


população: extração aleatória

 Cada indivíduo da população deve possuir chance não-nula


de pertencer à amostra e que sua seleção seja independente.

VARIÁVEL

 Qualquer característica associada a uma população, que pode


assumir diferentes valores de indivíduo para indivíduo, ou no
mesmo indivíduo ao longo do tempo.

Cor Verde, azul


Atributo da variável Tamanho de ninhada Variações 1, 2,3...
Peso 30 kg, 40 kg

VARIÁVEIS QUALITATIVAS

São as quais se referem às qualidades (atributos) das


unidades de observação (características) e podem ser classificadas
em categorias que não se sobrepõem (medição numérica não é
possível)

Nominal: não existe nenhuma ordenação nas possíveis


realizações (os valores atribuídos são de modo
arbitrário).

Ex.: Cor de flor de uma espécie: branca, vermelha,


violeta; região de procedência dos indivíduos: sul,
sudeste, oeste; tipo sanguíneo, causa de morte.
Ordinal: existe uma ordem, um critério específico para
seus resultados

Ex.: Grau de instrução: primário, secundário, superior;


altura de planta: baixa, média, alta; aparência; status
social; estágio da doença

VARIÁVEIS QUANTITATIVAS (ou intervalar)

São as quais representam as possíveis realizações como


números, resultantes de contagem ou mensuração.

Discretas: conjunto finito ou enumerável, que resulta


freqüentemente, de uma contagem (números inteiros)

Ex.: Número de filhos

Contínuas: valores pertencentes a um intervalo de


números reais e que resultam de uma mensuração.

Ex.: Estatura e massa de um indivíduo; peso de


animais, volume de árvores.

ESTATÍSTICA DESCRITIVA
 Coleta, organização e apresentação dos dados amostrais, sem
inferir sobre a população

COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS

 Observações na forma de números (dados)


 As variáveis são mensuradas em uma amostra, e as suas
realizações (ou observações) podem ser dispostas da seguinte
forma:

DADOS BRUTOS: Dados originais na forma com que foram


coletados (não foram numericamente organizados ou ordenados).

Ex. Peso de 10 coelhos híbridos NORFOLK em kg abatidos aos 90


dias.

2,61 2,56 2,47 2,62 2,59


2,56 2,62 2,70 2,49 2,62
De uma forma geral:

X1, X2, ..., Xn.

DADOS ELABORADOS: Dados numéricos arranjados em ordem


crescente ou decrescente.

2,47 2,49 2,56 2,56 2,59


2,61 2,62 2,62 2,62 2,70
De uma forma geral:

X(1), X(2), ..., X(n).

AMPLITUDE TOTAL (A), ou seja, a diferença entre o maior e


menor valor da amostra (expressa a variação máxima)

A = X(n) – X(1) = MAIOR VALOR – MENOR VALOR


REPRESENTAÇÃO DOS DADOS: Dependente da sua natureza

DADOS QUALITATIVOS – enumeração e tabulação

Exemplo: Num determinado estudo de cor de flor, as cores branca e


roxa foram observadas. Na progênie F2 constituída de 100
indivíduos foi anotada a cor de flor:

Tabela 1.1. Representação tabular para representar a herança de


cor de flor em uma progênie F2.

Cor da flor BRANCA ROXA


Número de
15 85
indivíduos

Representação gráfica
90
Número de indivíduos

80
70
60
50
BRANCA
40
30 ROXA
20
10
0
BRANCA ROXA

Figura 1.1. Gráfico de colunas para representar a herança de cor


de flor em uma progênie F2

15%

BRANCA
85% ROXA

Figura 1.2. Gráfico de pizza para representar a herança de cor de


flor em uma progênie F2.
DADOS QUANTITATIVOS – distribuição de frequência dos dados
em classes ou categorias, onde o número de elementos
pertencentes a cada classe é determinado e representa a
frequência de classe

a) Determinar o número de classes (k): geralmente o número de


classes é escolhido por muitos autores em um valor entre 5 e 20, de
uma forma empírica.

(i) Critério baseado no tamanho amostral (n) proposto por Oliveira


(1995).

Tamanho da amostra (n) Número de classes (k)


Até 100 n (inteiro mais próximo)
Acima de 100 5 log10 n (inteiro mais
próximo)

(ii) Critério baseado na distribuição normal dos dados da amostra


proposto por SCOTT (1979).

Partindo-se do pressuposto que os dados seguem a distribuição


normal, a qual possui forma de sino, o número de classes é
determinado por:

n
k
s

Em que: A é a amplitude total, n o tamanho da amostra e s o desvio


padrão
b) Amplitude de classe (c): é a diferença entre os limites superior e
inferior de uma determinada classe. Neste material é adotado o
seguinte critério.

c
k

c) Limite inferior da primeira classe (LI1ª)

No exemplo dos coelhos tem-se: LI1ª = 2,47 – 0,115/2 = 2,413

d) Determinação das classes: é necessário seguir os seguintes


passos:

(i) Somar ao valor do limite inferior da primeira classe a amplitude


de classe e obter-se o limite superior;

(ii) O limite superior da primeira classe será o limite inferior da


segunda classe;

(iii) Repetem-se os passos (i) e (ii) até completar k classes, ou


equivalentemente até que o maior valor esteja contido na última
classe.

Tabela 1.2. Distribuição de freqüência para o peso dos coelhos


híbridos Norfolk abatidos aos 90 dias.

Classes (kg) Fi Fri Fpi


2,413├─ 2,528 2,471 2 0,20 20
2,528├─ 2,643 2,586 7 0,70 70
2,643├─ 2,758 2,701 1 0,10 10
Total 10 1,00 100
Histograma
8

Frequência
5

0
2,471 2,586 2,701

Classes (kg)

MEDIDAS DE POSIÇÃO E DISPERSÃO


Medidas de posição ou de tendência central

- procura sintetizar as informações da amostra em um único e


informativo valor

- os dados são mais freqüentes perto de um valor central e são


mais raros ao afastar-se deste

MÉDIA ARITMÉTICA

- principal medida de posição

- utilizada principalmente quando os dados apresentam distribuição


simétrica ou aproximadamente simétrica

- simbologia:

μ para população e amostra em que, o estimador da média


populacional é:

n
i i n
n n

em que, n é o tamanho da amostra


Para o exemplo dos coelhos, tem-se que:

kg

Para os dados agrupados em distribuição de freqüência o estimador


é:
k
i i i
n
em que, i é o ponto médio e Fi é a freqüência da classe i

Para o exemplo dos coelhos em questão

kg

Propriedades da média

(i) A soma algébrica dos desvios em relação à média aritmética é


nula
n

i
i

(ii) A soma dos quadrados dos desvios de um conjunto de dados


em relação a sua média é um valor mínimo
n

i
i

(iii) A média de um conjunto de dados acrescido (ou subtraído) em


cada elemento por uma constante e igual à média original essa
constante

em que é a média do novo conjunto de dados.


(iv) Multiplicando todos os dados por uma constante a nova média
será igual ao produto da média anterior pela constante.

(v) A média é influenciada por valores extremos

(vi) Não pode ser mensurada em distribuições com classes


indeterminadas (bastante usada em distribuições simétricas)

Classes Fi
05├─ 10 10
10├─ 20 20
20├─ 50 45
50 ou mais 20

MEDIANA (md)

- divide as observações ordenadas em partes iguais

- conhecimento da posição central. Basicamente têm-se duas


situações distintas:

n n
(i) Se n for par: md

(ii) Se n for impar: md n

No caso dos coelhos a posição central esta entre o 5º e o 6º


elemento. Portanto, a mediana é a média aritmética destas duas
observações.

md = (2,59 + 2,61)/2 = 2,60kg


Outro exemplo

A = {1, 2, 3}

n=3

md = X(2) = 2

No caso de dados agrupados a mediana pode ser calculada de


acordo com a seguinte expressão:

n
md md cmd
md

Em que, Fmd é a freqüência da classe mediana

cmd a amplitude da classe mediana

FA a freqüência acumulada das classes anteriores à classe mediana

LImd é o limite inferior da classe mediana

A classe mediana é a classe que contém a posição n/2 (posição


mediana) da distribuição de freqüência

No exemplo,

LImd = 2,528

Posição mediana = 10/2 = 5 (contida na 2ª classe)

FA= 2

Fmd = 7

cmd = 0,115kg

md = 2,528 + [(5-2)/7] x 0,115 = 2,577 kg


Propriedades

(i) md' = md ± K (somando constante aos dados)

(ii) md' = md.K (multiplicando os dados por uma constante)

- Pouco afetada por valores discrepantes

- Bastante utilizada para distribuições assimétricas

MODA (mo)

- valor de maior freqüência na amostra

- um conjunto pode ter mais de uma moda ou até mesmo não ter
moda (amodal)

Relações empíricas entre média, mediana e moda

(i) = md = mo (distribuição simétrica)

(ii) > md > mo (distribuição assimétrica à direita)

(iii) < md < mo (distribuição assimétrica à esquerda)

MEDIDAS DE DISPERSÃO
As medidas de posição não informam sobre a variabilidade dos
dados e são insuficientes para sintetizar as informações amostrais.
Para exemplificar este fato, têm-se a seguir três amostras com a
mesma média

A = {8, 8, 9, 10, 11, 12, 12} A = 10

B = {5, 6, 8, 10, 12, 14, 15} B = 10

C = {1, 2, 5, 10, 15, 18, 19} C = 10


- amostras diferem grandemente em variabilidade

- necessário estabelecer medidas que indiquem o grau de


dispersão, ou a variabilidade em relação ao valor central

(a) Amplitude total (A)

- diferença entre o maior e o menor valor de uma amostra

No exemplo do peso de coelhos a amplitude foi A = 0,23kg

(b) Variância e desvio padrão

- medem a variabilidade absoluta de uma amostra

- indicam como os valores variam entre si, por meio do afastamento


dos valores em relação à média

- A variância apresenta unidade quadrática

- Quanto mais afastado o valor se encontra em relação à média,


maior será sua contribuição para o valor da variância (desvio
padrão)

- Ambas as medidas apresentam variação absoluta

Simbologia

População: Variância  σ2 Desvio padrão  σ

Amostra: Variância  S2 Desvio padrão  S


A variância amostral é dada por:

n
n i i
n i i n
i i
n n

em que, n – 1 é denominado graus de liberdade.

No exemplo dos coelhos

kg

kg

Cálculo para dados agrupados em distribuições de freqüência:

n
n i i i
i i i n
n

Para o exemplo:


kg

kg

Propriedades

(i) Variância

- Somando ou subtraindo uma constante aos dados a variância não


se altera;
- Multiplicando todos os dados por uma constante K a nova
variância ficara multiplicada por K2

(ii) Desvio padrão

- Somando ou subtraindo uma constante K aos dados o desvio


padrão não se altera;

- Multiplicando todos os dados por uma constante K o novo desvio


padrão fica multiplicado por K.

(c) Coeficiente de variação (CV)

- variabilidade dos dados mensurada em relação a sua média

- Quanto menor o coeficiente de variação, mais homogêneo o


conjunto de valores

- É obtido pela expressão

No exemplo dos coelhos o CV = (0,0675/2,584) x 100 = 2,61%


representa relativamente uma pequena dispersão dos dados em
relação ao valor central.

(d) Erro padrão da média ( )

- medida de variabilidade da média amostral, ou seja, como a média


varia de uma amostra pra outra ( )

n
O erro padrão fornece um mecanismo de medir a precisão com que
a média populacional foi estimada (pela média amostral)

O valor do erro padrão é dado em função do tamanho amostral, ou


seja, inversamente proporcional à raiz quadrada do tamanho da
amostra.

Para o exemplo dos coelhos o erro padrão é:

kg

Nesse caso o erro padrão foi de 0,02135kg e representou 0,83% do


valor médio, indicando que a média foi estimada com alta precisão

PROBABILIDADE

DEFINIÇÃO

 Fenômeno aleatório, casual, que se refere a uma situação cujos resultados


não podem ser previstos com certeza, uma vez que estão sujeitos a uma série
de fatores

 A maior ou menor ocorrência de um determinado acontecimento deve-se às


circunstâncias nas quais ele se realiza.

 A essa possibilidade de ocorrer ou não chamamos de chance ou


probabilidade.
 Está relacionada com a ocorrência de um evento em relação a todas as
possibilidades possíveis.

Alguns conceitos

EXPERIMENTO: qualquer processo que permite ao pesquisador fazer


observações.

ESPAÇO AMOSTRAL OU UNIVERSO (Ω): conjunto de todos os possíveis


pontos para os resultados de um experimento.

Ω { ω1 ω2 ω3 ω4 ...} onde os elementos ωi são pontos amostrais

PROBABILIDADE é a frequência teórica de cada ponto amostral do conjunto –


P ωi)

E – Evento de interesse do pesquisador e é definido com um subconjunto de Ω

m
PE
n

em que m é o número de pontos amostrais do subconjunto E, e n é o número


de pontos amostrais do espaço amostral Ω com m  n

A probabilidade de qualquer evento E é um n° entre 0 e 1

≤PE ≤
EXEMPLO: Proporção de ocorrência do sexo de bezerros ao nascimento

n nascimentos, número ni de vezes que nasce o sexo i = M, F (M para


macho e F para fêmea)

ni/n é a distribuição de frequência do nascimento de bezerros

Ω { ω1 ω2 = M}

Distribuição de sexo em bezerros é ½

P eP

 Seja o nascimento de fêmeas numa leitegada de tamanho três. Qual é a


probabilidade de nascer duas fêmeas? E nenhuma fêmea?

 Os eventos possíveis são apresentados a seguir pelo espaço amostral Ω:

Ω: {1.MMM; 2.MMF; 3.MFM; 4.FMM; 5.MFF; 6.FMF; 7.FFM; 8.FFF}

E1 = {ocorrência de duas fêmeas} = {5,6,7}

m
PE n

E2= {não ocorrência de fêmeas} = {1}

m
PE n

 Os conjuntos Ω espaço amostral e Ф conjunto vazio são considerados


eventos certo e improvável, respectivamente

PΩ ePФ
LEIS DA PROBABILIDADE

Lei da soma

“ probabilidade que um grupo de eventos mutuamente e clusivos ocorra é a


soma da probabilidade de cada evento separadamente. Dois eventos são
mutuamente exclusivos se a ocorrência de um deles exclui a possibilidade de
outro.”

Lei do produto

“ probabilidade que dois ou mais eventos independentes ocorram juntos é o


produto das probabilidades individuais. Dois ou mais eventos são ditos
independentes se a ocorrência de um deles não afeta a ocorrência dos outros.”

PROBABILIDADE CONDICIONAL: É a probabilidade de ocorrer um dado


evento sob uma dada condição. Indica-se a probabilidade de ocorrer o evento
sob a condição de ter ocorrido o evento B por P │B que se lê
“probabilidade de dado B”

EVENTOS INDEPENDENTES: Quando a probabilidade de ocorrer um deles


não é modificada pela ocorrência do outro P │B P

Em uma amostra de 260 nascimentos registrou-se o sexo e a cor da pelagem


dos animais. Os resultados obtidos estão apresentados a seguir:

Sexo
Cor Total
Macho Fêmea
Branca 32 33 65
Cinza 65 64 129
Preta 34 32 66
Total 131 129 260
P(Pelagem branca e animal macho)=32/260

P(Pelagem preta e animal macho)=34/260

VARIÁVEIS ALEATÓRIAS

 Variável que pode ser influenciada pelo acaso

- peso de ratos, embora em condições controladas de alimentação e


manejo, de mesmo sexo e idade, variam.

- essa variabilidade ocorre ao acaso e é resultante da soma de fatores


não controlados

 Podem assumir qualquer valor de um determinado conjunto de dados,


denominado de domínio da variável aleatória

VARIÁVEL ALEATÓRIA DISCRETA

 Quando a variável assume valores que podem ser associados a n° naturais


(1, 2, 3...), geralmente resultantes de uma contagem

- n° de animais atendidos por dia numa clínica

- V.A.D.binária: só pode assumir dois valores

RH+; RH-

Sim, Não

Presente; Ausente

VARIÁVEL ALEATÓRIA CONTÍNUA

 Assumem infinitos valores em um dado intervalo

- peso, altura, etc


DISTRIBUIÇÃO DE PROBABILIDADE

 É o comportamento das variáveis aleatórias (características que podem


assumir valores ou categorias diferentes, ou seja, que são influenciadas pelo
acaso).

 Essa distribuição ou modelo de probabilidade identifica os valores que as


variáveis podem assumir, com suas respectivas ocorrências ou probabilidades.

 Distribuição de probabilidade para variáveis aleatórias discretas.

Seja X uma v.a. discreta e x1; x2; x3, ..., seus diferentes valores possíveis. A
sua função de probabilidade é denotada por:

P i pi i

Propriedades essenciais da distribuição de variáveis discretas:

≤P i ≤

P i
i

O valor esperado ou a média de uma v.a. discreta é a soma de seus valores


possíveis, multiplicados pelas respectivas probabilidades, ou seja:

i P i
i

A variância de uma variável aleatória é:

ar - , para

i P i
i
DISTRIBUIÇÃO BINOMIAL

 É a mais importante das distribuições de variáveis aleatórias discretas

 Deriva de um processo conhecido com teste de Bernoulli, em que cada


tentativa tem duas possibilidades excludentes de ocorrência chamadas de
sucesso ou fracasso.

 Se em uma amostra de tamanho n forem mantidas constantes as


probabilidades associadas ao sucesso e ao fracasso, pode-se definir a variável
X pelo número de sucessos observados  e essa variável tem distribuição
binomial

Exemplos de variáveis binomiais: florescimentos de plantas de uma espécie;


nascimento de fêmeas; entre outros

 Binômio de Newton (p + q)n

 Se p é a probabilidade do sucesso de um evento ocorrer em uma única


tentativa e q = 1 – p é a probabilidade do fracasso, então, a probabilidade do
evento ocorrer x vezes em n tentativas é apresentada a seguir:

P n p qn –

em que,

n
n
n–

e x é o número de sucessos ocorridos em n tentativas. X = 0, 1, 2, ..., n.

p + q=1

Outras propriedades:

Dados os parâmetros da distribuição binomial (n e p),

Média = µ =n.p

Variância = σ2 = n.p.q
EXEMPLO 1: No nascimento de dois bezerros considerando o sucesso a
ocorrência de fêmeas, pergunta-se qual a probabilidade de nascer duas
fêmeas? E uma fêmea? E nascer pelo menos uma fêmea?

n = 2; p = 1/2; q = 1 – p = 1/2 e X: número de fêmeas; x = 0, 1, 2.

Ω={MM, MF, FM, FF}


P


P

P(X ≥ 1) = P(Pelo menos uma fêmea) = P(X=1)+P(X=2) = 0,25 + 0,50 = 75%

P(X = 0) = 25%

A distribuição de probabilidade de X (número de fêmeas), que se refere aos


possíveis valores que X pode assumir associados as suas respectivas
probabilidades de ocorrência.

x 0 1 2

P(X = x) 0,25 0,50 0,75

0,75
Probabilidade

0,5

0,25

0
0 1 2
X
EXEMPLO 2: Em média, 60% dos pacientes que se submetem a uma
determinada cirurgia do coração, se restabelecem. Qual a probabilidade de em
5 casos todos os operados se restabelecerem.

EXEMPLO 3: A leishmaniose canina é uma doença causada por um parasita


unicelular (Leishmania infantum) e pode afetar 40% dos cães. Numa matilha de
cinco animais, qual a probabilidade de todos serem afetados por essa doença?

DISTRIBUIÇÃO DE POISSON

 Aproximação da binomial quando o n é grande, tendendo para e a


probabilidade do sucesso p é pequena, tendendo para zero

 Finito e não nulo o produto n.p (média da distribuição)

 Conhecida como lei dos fenômenos raros (n 50 e p 0,10)

P e

Onde; n.p é a média da distribuição e “e” é a base dos logaritmos


neperianos

EXEMPLO 1: Em um rebanho, 2% dos animais são atacados por uma doença.


Qual a probabilidade de encontrar em uma amostra de 100 animais:

(i) nenhum animal doente?

(ii) 1 doente?

(iii) 2 doentes?

(iv) mais de três animais doentes?

n = 100 > 50

p = 0,02 < 0,10 (sucesso ou fracasso)  Poisson

= n.p =100 x 0,02 = 2


(i) P e-

(ii) P e-

(iii) P e-

(iv) P 1 – P (X ≤ 3) = 1 – [ P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)]
= 1 – 0,8571 = 14,29%

Média e Variância da Poisson

n.p k

σ n.p. k

A distribuição Poisson possui média e variâncias iguais.

EXEMPLO 3: A incidência de uma anomalia congênita é 0,5 por


1000 recém-nascidos. Em uma amostra de 2.000 recém-nascidos,
qual é a probabilidade de ela não incluir casos dessa anomalia?

DISTRIBUIÇÃO NORMAL

 É a mais importante das distribuições das variáveis aleatórias


contínuas

 Função, distribuição ou densidade de probabilidade dada por f(x).

 A probabilidade de X assumir um valor dentro de um intervalo é


dada pela área da curva

 A probabilidade de uma v.a. contínua assumir um valor particular


é nula.

 A função densidade satisfaz:

f ≥

 A área sob curva totaliza 1 (100%)


 Uma variável aleatória tem distribuição Normal (ou de Gauss), se


-
f e σ ,- - eσ
σ

Em que e σ2 são os parâmetros dessa distribuição, os quais são


respectivamente a média e variância dessa distribuição

 O gráfico da função normal é:

Propriedades

 Tem forma de sino e f é simétrica em relação a ;

 f(x) 0 quando x

 O valor máximo de f(x) se dá para x=

 Fica completamente definida conhecendo-se a sua média e


variância;

 Média = Moda = Mediana

 Área total sob a curva e igual a 1 (que é a probabilidade da


variável aleatória assumir qualquer valor real)

 A dificuldade da densidade normal é que sua integral só pode ser


resolvida por métodos numéricos.

 Existe uma distribuição normal de e σ2 = 1, que é tabelada


DISTRIBUIÇÃO NORMAL REDUZIDA OU PADRONIZADA

 É sempre possível transformar uma variável X N ( ) em uma


variável normal reduzida Z N (0, 1).

 e ∩ N σ2) então a variável aleatória Z é definida por



σ

 A probabilidade de X estar entre dois valores quaisquer (a, b) é


dada pela área sob a curva normal entre estes valores:

a b

b
P a≤ ≤b f d
a

Exemplo: No exemplo dos coelhos híbridos, assumindo distribuição


normal dos pesos, tem-se que = 2,584 e S = 0,0675. Qual é a
probabilidade de encontrar um animal pesando mais que 2,701kg?

P(X > 2,701) = ?

(i) Usar gráfico para visualizar melhor a probabilidade desejada

(ii) Colocar X na forma reduzida:


c

(iii) P(X > 2,701) = P(Z > 1,73) = 0,50 – 0,4582 = 0,0418 ⇒ P(X >
2,701) = 4,18%
TEORIA DA ESTIMAÇÃO

 Descrição do processo de amostragem de uma população com


parâmetros desconhecidos com os respectivos estimadores

POPULAÇÃO AMOSTRA

σ2 S2

Parâmetros populacionais Estimadores amostrais


desconhecidos

 Na inferência pode-se salientar

 Estimação de parâmetros: é o processo que usa os resultados


amostrais (estatísticas) para inferir, fazer afirmações ou conjecturas,
sobre a população (parâmetros);

 Testes de hipóteses sobre parâmetros populacionais.

ESTIMAÇÃO POR PONTO E POR INTERVALO

 Estimação por ponto: obtém-se nesse caso um único valor


amostral. Ex. é uma estatística usada para fazer a estimação por
ponto de .

 Como já foi visto, o estimador (ou estatística) é uma variável


aleatória que é função dos elementos amostrais e a estimativa é o
valor numérico obtido pelo estimador em certa amostra.
Principais propriedades de um estimador

 Não viciado ou não viesado: Quando sua esperança (valor médio)


é igual ao próprio valor do parâmetro populacional que se pretende
estimar.

Ex. E( portanto é um estimador não viciado de por outro


lado, E(S) ≠ σ, portanto S é um estimador viciado de σ.

 Consistência: Um estimador será consistente se além de não


viciado sua variância tender para zero, quando n tender para .

Ex. Como, E( e limn σ limn , portanto, é um

estimador consistente de .

 Eficiência: o estimador de maior eficiência é o que possui menor


variância.

 Estimação por intervalo

 É feita quando a partir da amostra procura-se construir intervalos


de confiança, com certa probabilidade, de conter o parâmetro
populacional.

 As probabilidades utilizadas são em geral de 95% e 99%.

 As estimativas por ponto são usadas quando se necessita, pelo


menos aproximadamente, conhecer o valor do parâmetro para
utilizá-lo numa expressão qualquer.

 No entanto, os estimadores são variáveis aleatórias, e as


estimativas obtidas quase certamente são distintas do valor do
parâmetro, ou seja, quase certamente se comete um erro de
estimação.
 Por esta razão torna-se necessário à construção de intervalos de
confiança que tenha probabilidade (1-α) de conter o valor do
parâmetro.

 O nível α é chamado de nível de significância, e refere-se à


probabilidade de se cometer o erro tipo I, rejeitar uma hipótese
verdadeira.

 No caso, o nível de probabilidade α, refere-se à probabilidade do


IC não conter o valor paramétrico.

 Como os níveis de confiança são, em geral, fixados com 95% e


99%, α será igual a 5% e 1%, respectivamente.

ESTIMAÇÃO DE MÉDIAS E PROPORÇÃO

 INTERVALO DE CONFIANÇA PARA μ

 Não se conhece a variância populacional (σ2) e deve-se usar seu


estimador amostral (S2)

 Nesse caso a distribuição de será aproximadamente normal.


Quanto maior o tamanho de n, melhor será a aproximação

 Na prática, quando n≥30, a aproximação é considerada boa, e a


distribuição normal pode ser usada.

 No entanto quando n<30, o estimador da variância populacional


(S2), está sujeito às variações amostrais, e a distribuição de t é mais
apropriada
 Por outro lado, foi comentado que quando n aumenta a
distribuição de t de Student se aproxima da distribuição normal. Por
essa razão, será usada somente a distribuição de t,
independentemente do tamanho da amostra.

Populações infinitas ou finitas e amostras com reposição

 A regra para construção do IC neste caso é:

α e

Onde e tα e tα com n-1 graus de liberdade (GL)


n

Populações finitas e amostras sem reposição


N

 A regra geral é a mesma para o caso da amostragem ser feita


com reposição de populações finitas ou amostragem com ou sem
reposição de populações infinitas, e está apresentada a seguir:

α e

N-n
Onde e tα e tα com n-1 graus de liberdade (GL), sendo
n N-

a única alteração o fator de correção para amostragem sem


reposição de populações finitas.
EXEMPLO

1. Em uma amostra de 25 plantas de uma variedade braquítica de


milho foi encontrada a média de altura de 122cm e variância
amostral de 28cm2. Obtenha o IC de 95% de confiança para a
média da variedade em questão.

Como o tamanho da população não foi fornecido, deve-se


considerar que a fração da amostra em relação ao da população é
menor que 5%, devendo esta população ser considerada infinita.
Com 95% de confiança tem-se que α=0,05. Para graus de liberdade
de n-1 = 24 o valor de t0,025 é 2,064. Portanto:

e , logo,

IC0,95: 122 2,18 = [119,82; 124,18]

Com 95% de confiança pode-se afirmar que a média da variedade


braquítica de milho está compreendida entre 119,82cm a 124,18cm.

2. De uma população de tamanho N = 40, foi retirada uma amostra


de tamanho n = 10. A média da amostra foi de 130,2cm e a
variância foi de 69,2888cm2. Faça o IC para a média populacional
com 90% de confiança.

Com 90% de confiança tem-se que α = 0,10. Para graus de


liberdade de n-1=9 o valor de t0,05 é 1,833. Portanto:
e

logo,

IC0,90: 130,2 4,23 = [125,97; 134,43]

 INTERVALO DE CONFIANÇA PARA P (PROPORÇÃO)

 As mesmas observações usadas para média valem para as


proporções, no que se refere ao uso de um estimador da variância
pq
populacional, que neste caso é
n

 A distribuição de amostragem aproximada é a normal.

IC para P utilizando a aproximação normal

 É recomendada quando p tende para 0,5 e n tende para .

Populações infinitas ou finitas e amostras com reposição

O IC é dado pela regra geral:

α p e

pq
onde e α n

Populações finitas e amostras sem reposição


N

α p e
pq N-n
Onde e α , sendo a única alteração o fator de correção
n N-

para amostragem sem reposição de populações finitas.

 É conveniente salientar que a aproximação normal para


populações finitas é apenas uma aproximação grosseira, uma vez
que o modelo normal assume populações infinitas. Mesmo em
condições favoráveis de P próximo a ½ ou grandes tamanhos
amostrais, tal aproximação é ainda considerada grosseira.

 INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS

 Muitas vezes o pesquisador se depara com o problema de estimar


o efeito diferencial entre duas populações ou entre dois
tratamentos, para alguma variável de interesse.

 Estas inferências sobre as médias de duas populações podem ser


feitas utilizando os IC para diferenças entre as médias destas
populações.

Variâncias populacionais desconhecidas e diferentes (σ ≠ σ )

 A distribuição da diferença entre médias, é aproximadamente

normal, com média 1 – 2 e variância


 Em geral, como não se conhece na prática a variância de ambas
as populações, deve-se utilizar, os estimadores amostrais.

 A distribuição apropriada é a distribuição de t de Student. No caso


de variâncias populacionais diferentes, o teste t é apenas
aproximado.

 Neste caso, a regra geral, é:

α e

Onde e α e α possui ν graus de liberdade, dados por

Satterthwaite (1946):

n n

n n
n n

Variâncias populacionais desconhecidas e iguais (σ = σ )

 Quando as variâncias são iguais o teste t é exato

 A regra geral é:

α e

Onde e tα P e α possui n1 + n2 – 2 graus de liberdade


n n
 Como as variâncias das duas populações são iguais, um melhor
estimador da variância comum é obtido pela média ponderada das
variâncias amostrais, cujos pesos são os graus de liberdade de
cada amostra. Esta

variância é definida por P onde o subscrito “p” refere-se a palavra


americana “pooled” que significa, combinada. Portanto, o símbolo
SP refere-se ao estimador do desvio padrão combinado, o qual é
apresentado a seguir:

n n
P
n n

TESTE DE HIPÓTESES

 É uma técnica para se fazer inferência estatística

 Técnica utilizada para a tomada de decisão a favor de uma das


duas hipóteses (H0 ou H1)

 HIPO: abaixo, inferior


 TESE: afirmação a ser defendida

HIPÓTESE ESTATÍSTICA Trata-se de uma suposição quanto ao


valor de um parâmetro populacional

TIPOS DE HIPÓTESES

H0: hipótese de nulidade (a ser testada)  ausência de efeito  não


há diferença nas respostas dos tratamentos

H1: hipótese alternativa  presença de efeito  há diferença nas


respostas dos tratamentos
ERROS ENVOLVIDOS NA DECISÃO  Há dois tipos possíveis de
erro ao testar uma hipótese estatística

ERRO TIPO I Rejeitar uma hipótese quando de fato ela é


verdadeira
ERRO TIPO II Não rejeitar uma hipótese quando ela é, de fato,
falsa.

 A probabilidade desses dois tipos de erros são designados,


respectivamente de α e β.

 probabilidade α do erro tipo é denominada “nível de


significância” do teste.

SIGNIFICATIVO  adjetivo  que significa, que expressa com


clareza; expressivo
SIGNIFICÂNCIA  substantivo  valor (latim: significantio)

Realidade
H0 verdadeira H0 falsa
Não rejeitar Decisão correta (1- Erro tipo β
H0 α
Decisão
Rejeitar H0 Erro tipo α Decisão correta (1-
β
CARACTERÍSTICAS

(i) Erro tipo I e tipo II são correlacionados: O aumento da


probabilidade de ocorrência de um reduz a probabilidade de
ocorrência do outro;

(ii) Erro tipo I é controlado com a escolha de α.

(iii) A única forma de causar uma redução de α e β


simultaneamente é aumentar o tamanho da amostra.

(iv) Se H0 for falsa, β será maior quanto mais próximo o valor do


parâmetro estiver do valor sob a hipótese H0.

Será realizado apenas teste de significância, haja vista que não se


pode controlar diretamente a probabilidade de se cometer o erro
tipo II a não ser indiretamente com amostras representativas e
suficientemente grandes e escolha de testes mais poderosos.
CONSTRUÇÃO DE UMA REGRA DE DECISÃO

ALGORITMO
(i) Formular as hipóteses H0 e H1;
(ii) Usar a teoria estatística e as informações disponíveis para julgar
o estimador adequado;
(iii) Fixar α e usar esse valor para criar a região crítica;

RNRH0

Região crítica para um teste unilateral, usando a distribuição de t de


Student ou a normal.

(iv) Calcular o valor da estatística que norteará a decisão;


(v) Se o valor da estatística pertencer RNRH0 não se rejeita H0,
caso contrario, rejeita-se.
TESTE PARA MÉDIA POPULACIONAL NORMAL COM
VARIÂNCIA DESCONHECIDA

Sabe-se que ∩t

Desta forma, o algoritmo para o teste de hipótese é:

(i) H0: o

H1: ≠ o (Hipótese bilateral) ou


H1: o (Hipótese unilateral) ou
H1: o (Hipótese unilateral).


(ii) tc
n
(iii) Define-se a região de rejeição de H0 com:

 tα/2 com n - 1 GL para o teste bilateral;


 tα com n - G para o teste unilateral o);e
 - tα com n - G para o teste unilateral o).

(iii) Rejeita-se H0 se ≥ , ou seja, se tc RRH0

 Existe uma relação direta entre teste de significância e intervalos


de confiança. Com a construção do IC pode-se verificar se o valor
do parâmetro sob H0 se encontra no mesmo. Se afirmativo não se
rejeita H0, caso contrário, rejeita-se.

 Para amostras sem reposição em populações finitas (n/N>0,05), o


erro padrão da média é:
Nn
n N
portanto, o valor de tc, neste caso é:


tc
Nn
n N

Exemplo: No caso dos coelhos abatidos aos 90 dias (n=10,


=2,584kg, S=0,0675kg), teste a hipótese de que a média
populacional é igual a 2,701kg, contra a hipótese alternativa que ela
é menor que 2,701Kg. Dado, α=0,05.

(i) H0: kg  o=2,701


H1: kg

– –
(ii) tc -
n

(iii) t0,05 = 1,833 ⇒ -t0,05 = -1,833 com 9 GL.


(iv) Como ≥ , ou seja, 5,481>1,833, então rejeita-se H0 em
nível de 5% de probabilidade pelo teste t, ou seja, a média do peso
ao abate aos 90 dias é inferior a 2,701kg, com 95% de confiança.

TESTES PARA PROPORÇÕES


 Testar a hipótese de que a proporção de uma população é igual
a um dado valor (P0)

 Pressupõe-se que a distribuição do estimador de P é


aproximadamente normal e que quando se utiliza o estimador da
variância a distribuição adequada passará a ser a distribuição t de
Student.

(i) Formulam-se as hipóteses de nulidade e a alternativa, que pode


ser unilateral ou bilateral.

H0: P = Po
H1: P ≠ Po (Hipótese bilateral) ou
H1: P > Po (Hipótese unilateral) ou
H1: P < Po (Hipótese unilateral).

(ii) O nível crítico, ou a probabilidade de se cometer o erro tipo I é


fixado em geral por α = 5% ou α = 1%

(iii) Determina-se o valor da estatística do teste adequado por:


P–P
c
pq
n
(iv) Se c ≥ T B rejeita-se H0

Exemplo: Numa amostra de 100 plantas de um campo de produção


de sementes, verificou-se que 2% estavam com uma determinada
doença. Teste a hipótese que a verdadeira proporção de doenças
do campo é igual a 3,5%, como afirma um técnico de inspeção do
campo de produção de sementes.

(i) Determinando as hipóteses


H0: P = 0,035
H1: P < 0,035 (unilateral)

(ii) Fixar o nível de significância em 5%


(iii) Calculando o valor de Zc

P–P –
c
pq
n

(iv) o valor de tabelado é: Z0,05=-1,645 com 99 GL

(v) Como c T B , não se rejeita H0 em nível de 95% de


confiança, ou seja, não existe razão para duvidar que a média da
incidência de doença no campo não seja de 3,5%. A diferença
amostral de 1,5% foi apenas casual.

EXEMPLO 1: Uma amostra de 20 elementos de uma variável X


normalmente distribuída forneceu: = 53,4 e S = 7,5. Testar, em
nível de significância a hipótese de que .

Resolução

Hipóteses
H0:
H1: ≠ teste bilateral

A amostra é pequena (n < e σ desvio padrão populacional é


desconhecido. Logo, a distribuição a ser utilizada é a t-Student, com
n = 20 ⇒ eα . onsultando a tabela encontraremos
tTAB=2,0930

Desenhando a curva, temos:


– –
t
n

Como: -tTAB<tCALC<tTAB, em nível de significância de 5%, não rejeito


H0:µ=50

EXEMPLO 2: Uma amostra de tamanho n = 18 de população


normal tem média = 31,5 e desvio padrão S = 4,2. Em nível de
significância de 5%, estes dados sugerem que a média populacional
seja superior a 30?

Resolução
Hipóteses:
H0:
H1: 0 (teste unilateral à direita);
Amostra pequena (n = 18) e σ desconhecido. ogo t-Student, com
eα .

Desenhando a curva, temos:

– –
t
n

Resposta: Não, pois a média é igual a 30, pois como: tCALC<tTAB, não
rejeito H0: µ=30
EXEMPLO 3. Suponhamos que em indivíduos normais quanto à
visão, a pressão intra-ocular seja uma variável aleatória
normalmente distribuída com média 20 e variância 4 (em unidade
de mm de mercúrio). Um cientista, querendo por à prova a sua
hipótese de que o glaucoma causa um aumento tensional, mediu as
pressões de 16 pacientes portadores de glaucoma, obtendo uma
média igual a 24. O cientista deve ou não manter sua hipótese, em
nível de significância α ?

Resolução

O que o cientista quer provar? Que o glaucoma causa aumento da


pressão. Logo, a hipótese alternativa (que o cientista quer provar) é
que a média é superior a 20.

Portanto, as hipóteses são

H0:
H1: teste unilateral à direita)

2
Temos: n = 16; σ α .
2
amostra é pequena mas a variância populacional é conhecida σ
eσ . Portanto, usaremos a Tabela Normal, onde a área de
− corresponde a uma abscissa de . ogo
ZTAB=2,58

– –
σ
n
Como ZCALC>ZTAB, em nível de significância de 0,5%, rejeito H0:
20.
ssim aceito que > 20, ou seja, o cientista está correto e deve
manter sua hipótese de que o glaucoma aumenta a pressão intra-
ocular.
EXEMPLO 4. Os dados abaixo se referem ao efeito da adaptação
de phlorizin em ruminantes, medidos pela glucose arterial em mM
σ n

Teste a hipótese de que a média da glucose arterial é 3,40 mM

H0: 3,40
H1: 3,40

– –
σ
n
ZTAB=-1,645

ZCALC > ZTAB

Não rejeito H0

COMPARAÇÕES DE MÉDIAS ENTRE DUAS POPULACÕES


NORMAIS E INDEPENDENTES
 Um dos principais testes apresentado refere-se à necessidade de
comparar duas médias populacionais distintas.

 Duas médias populacionais distintas podem ser comparadas por


este método, desde que a amostragem, ou até mesmo a
experimentação, seja realizada de forma independente para cada
uma delas.

COM VARIÂNCIAS POPULACIONAIS DESCONHECIDAS E


IGUAIS (  12 = 22 )

 Pode questionar o fato de que se as variâncias populacionais são


desconhecidas, fato bastante comum na prática, como saber se
elas são iguais ou diferentes?
Teste para hipótese de igualdade entre as variâncias
populacionais
Inicialmente deve ser lembrado neste ponto que a estatística
definida por:

segue a distribuição F de Snedecor

 É usada para testar a igualdade entre duas variâncias

 As tabelas de F, são consultadas de acordo com os graus de


liberdade n1-1 associados a variância 1 (numerador da expressão)
na primeira linha, e graus de liberdade n2-1 associados a variância
2 (denominador da expressão), na primeira coluna, e probabilidade
desejada.

 Pode-se observar que a estatística F, se H0:  =


2 2
1 2
for

verdadeira, se resume em

 Desta forma Fc segue a distribuição de F, e um valor observado,


muito alto, ou seja, um valor que deixe menos de 5% ou menos de
1% dos valores de F acima do mesmo deve ser considerado
significativo.
 Desta forma, este valor indica que é mais fácil acreditar que a
hipótese, não seja verdadeira, do que este grande valor tenha
ocorrido ao acaso.

 Algoritmo para realizar o teste:

i) Formulam-se as hipóteses de nulidade e alternativa bilateral.

(ii) Fixa-se o valor crítico, ou a probabilidade de se cometer o erro


tipo I, que em geral é: α = 5% ou α = 1%

(iii) Determina-se o valor da estatística, para o teste adequado por:

S S
2 2
As variâncias amostrais são denominadas de tal forma que 1 2

Desta forma Fc será sempre maior ou igual a 1.

(iv) Rejeita-se a hipótese H0 se Fc ≥ Fα/2 com (n1 – 1) e (n2 – 1) GL,


respectivamente.

 Verificando que realmente as variâncias populacionais são


iguais,
 Implementar o seguinte algoritmo:

(i) Formulam-se as hipóteses de nulidade e alternativa, as quais


podem ser unilaterais ou bilaterais:
H0: 1- 2 =0
H1: 1- 2 ≠ 0 (bilateral); ou
H1: 1- 2 > 0 (unilateral); ou
H1: 1- 2 < 0 (unilateral); ou
 O teste de que a diferença entre as médias populacionais é igual
a zero equivale ao teste de que elas são iguais.

(ii) Se fixa o nível crítico, ou a probabilidade de se cometer o erro


tipo I, que em geral é: α = 5% ou α = 1%

(iii) Determina-se o valor da estatística, para o teste adequado por:

em que, tα/2 (teste bilateral) ou tα (teste unilateral) possui ν = n1 + n2


– 2 graus de liberdade.

COM VARIÂNCIAS POPULACIONAIS DESCONHECIDAS E


DIFERENTES (  12 ≠ 22 )

 Rejeitando-se a primeira hipótese de igualdade das variâncias, o


seguinte algoritmo deverá ser usado:

(i) Formulam-se as hipóteses de nulidade e alternativa, as quais


podem ser unilaterais ou bilaterais
H0: 1- 2 =0
H1: 1- 2 ≠ 0 (bilateral); ou
H1: 1- 2 > 0 (unilateral); ou
H1: 1- 2 < 0 (unilateral); ou
 O teste de que a diferença entre as médias populacionais é igual
a zero, equivale ao teste de que elas são iguais.

(ii) Fixa-se o nível crítico, ou a probabilidade de se cometer o erro


tipo I, que em geral é: α = 5% ou α = 1%

(iii) Determina-se o valor da estatística, para o teste adequado por:

onde, tα/2 (teste bilateral) ou tα (teste unilateral) possui ν graus de


liberdade dados por:

 Quando as variâncias populacionais são distintas, este teste é


apenas aproximado.
COMPARAÇÕES DE MÉDIAS ENTRE DUAS POPULACÕES
NORMAIS E DEPENDENTES E VARIÂNCIA DESCONHECIDA
(DADOS PAREADOS)

 Quando os dados são relacionados dois a dois, eles são


denominados pareados.

Exemplo: os dados de peso de bezerros foram medidos antes e


depois da aplicação de uma ração nova, em uma amostra de
tamanho n = 5. Seja:

X: peso antes do tratamento (ração nova); e


Y: peso após tratamento;
n=5 bezerros.

 É necessário que se calcule algumas estatísticas básicas, desta


variável aleatória Di. Estas estatísticas são a média e o desvio
padrão.

Média e Desvio Padrão:


 Se a ração, para o exemplo em questão, ou o tratamento
qualquer que se deseja testar, não possui efeito significativo, então
se espera que não haja diferença entre as medidas antes e após o
tratamento ser aplicado

 Desta forma, a diferença média real livre dos efeitos de meio


deve ser testada para hipótese de que ela é realmente igual a zero.

 Esta hipótese seguida dos testes apropriados está apresentada a


seguir:

(i) Determinar as hipóteses


H0: D = D0
H1: D ≠ D0 Bilateral; ou
H1: D > D0 Unilateral;
H1: D < D0 Unilateral

(ii) Se fixa o nível crítico, ou a probabilidade de se cometer o erro


tipo I, que em geral é α = 5% ou α = 1%.

(iii) Determina-se o valor da estatística, para o teste adequado por:

(iv) Rejeita-se H0 se |tc| > |ttab|.

 Voltando para o exemplo do ganho de peso nos bezerros, tem-se


os seguintes resultados: = 17,6kg e SD = 12,1984kg
 As hipóteses de nulidade e alternativa são:
H0: D =0
H1: D > 0 Unilateral;
 Significa que está se testando a ausência de efeito da ração para
promover o ganho de peso, contra a alternativa que esta possui um
efeito positivo no ganho de peso.

 O valor de tc, utilizando as expressões anteriormente


apresentadas, foi de 3,226. O valor de ttabelado (t0,05) foi 2,132 com n –
1 = 4 GL.

 Então, como |tc| > |ttab| rejeita-se H0, existe efeito positivo da
ração no ganho de peso dos bezerros.

DELINEAMENTOS EXPERIMENTAIS

OBJETIVOS:

 Saber delinear um experimento de modo a validar os dados, ou


seja, que os dados colhidos, verdadeiramente expressem a
realidade dos acontecimentos

 Habilitar o pesquisador a interpretar o delineamento dos


trabalhos científicos, bem como seus resultados

PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO

 Planejamento, instalação, condução, coleta de dados, avaliação


dos experimentos

 ALGUNS CONCEITOS

EXPERIMENTO  trabalho primeiramente planejado que segue


determinados princípios básicos, no qual se faz a comparação
dos efeitos com os tratamentos
TRATAMENTOS  método, elemento ou material cujo efeito
deseja-se medir ou comparar em um experimento

PARCELA OU UNIDADE EXPERIMENTAL  é a unidade que vai


receber o tratamento e fornecer os dados que serão analisados

 São indispensáveis para validar as conclusões que venham ser


alcançadas

REPETIÇÃO  consiste em repetir o experimento básico várias


vezes para fornecer uma estimativa do erro experimental (ou seja,
para que os tratamentos não sejam beneficiados por erros ao
acaso)

CASUALIZAÇÃO  consiste em distribuir os tratamentos


aleatoriamente às parcelas, deste modo todos os tratamentos têm a
mesma probabilidade de cair em cada parcela. Visa validar os
testes estatísticos realizados sobre os efeitos dos tratamentos

CONTROLE LOCAL  pode ou não ser utilizado e consiste numa


restrição a casualização que tem como objetivo reduzir o erro
experimental.

INTRODUÇÃO A ANÁLISE DE VARIÂNCIA

 Fornece estimativas sobre a variação devido aos tratamentos


(variação entre) e a variação do acaso (variação dentro) de um
determinado experimento

 Variação ao acaso devido a fatores não controláveis

TESTE F

 Quociente entre duas estimativas de variância


 Hipóteses testadas:

Os valores críticos de F são tabelados

ERRO TIPO I  aceitar como diferentes médias de tratamentos que


na verdade são iguais (nível de significância do teste

ERRO TIPO II  aceitar como iguais médias de tratamentos que


são diferentes

DELINEAMENTOS INTEIRAMENTE CASUALIZADOS (DIC)


 Só considera os princípios da repetição e aleatorização

 Usado em áreas homogêneas

 Pode-se usar número diferente de repetição por tratamento

 A vantagem é que deixa maior número de grau de liberdade para


o resíduo, diminuindo o erro da experimentação

 Facilidade de análise

 A desvantagem é que a variância residual apresenta estimativas


altas uma vez que todas as variações, além as dos tratamentos,
são tomadas como devidas ao acaso.

MODELO GERAL DE ANÁLISE

FV GL SQ QM F
TRAT I-1 SQTRAT QMTRAT QMTRAT/QMRES
RESÍDUO I(J-1) SQRES QMRES
TOTAL IJ-1 SQTOTAL

MODELO MATEMÁTICO

Yij    ti  eij

Yij  é o valor observado do tratamento i na repetição j

  é a média geral do experimento

ti  é o efeito do tratamento i

é o erro aleatório associado a observação Yij

Suponhamos um experimento de nutrição de plantas, em que


usaram quatro formulações (A, B, C, D), cada uma fornecida a cinco
plantas escolhidas ao acaso. O aumento de massa fresca, em g,
consta na tabela seguinte:

FORMULAÇÕES
A B C D
35 40 39 27
19 35 27 12
31 46 20 13
15 41 29 28
30 33 45 30
130 195 160 110

 X 2

SQTOTAL   X 2

N

X 2
 352  19 2  ...  40 2  ...  30 2  19625

 X  35  19  ...  40  ...  30  595


595 2
SQTOTAL  19625   1923,75
20
SQTRAT  130  195  160  110  
1 595 2
2 2 2 2
 823,75
5 20

SQRES  SQTOTAL  SQTRAT  1923,75  823,75  1100

s  68,75  8,3

274,58
F  3,99
68,75

ANÁLISE DE VARIÂNCIA

CAUSA DE VARIAÇÃO G.L S.Q Q.M F


TRATAMENTO 3 823,75 274,58 3,99*
RESÍDUO 16 1100,00 68,75
TOTAL 19 1923,75 s=8,3

FTAB (3,16:5%) = 3,24

FTAB(3,16:1%) = 5,29

Significativo em nível de 5% o teste F indica que há uma


probabilidade superior a 95% de que exista pelo menos um
contraste entre tratamentos que difira de zero, que não é nulo

DELINEAMENTOS EM BLOCOS CASUALIZADOS (DBC)


 É usado quando a área não é homogênea

 Cada bloco é constituído por plantas ou animais de características


semelhantes (mesma cultivar, mesmas condições de nutrição,
mesma idade, época de parição e produção de leite semelhantes)

MODELO GERAL DE ANÁLISE

FV GL SQ QM F
BLOCOS J-1 SQBLOCO QMBLOCO QMBLOCO/QMRES
TRAT I-1 SQTRAT QMTRAT QMTRAT/QMRES
RESÍDUO (I-1)(J-1) SQRES QMRES
TOTAL IJ-1 SQTOTAL
MODELO MATEMÁTICO

Yij    ti  b j  eij

Yij  é o valor observado do tratamento i na repetição j

  é a média geral do experimento

ti  é o efeito do tratamento i

b j =é o efeito do bloco j

é o erro aleatório associado a observação Y


ij

ESQUEMA FATORIAL
 Experimentos que incluem todas as combinações de vários
conjuntos de tratamentos ou fatores

 Mais eficientes e conclusões mais gerais

 MODELO MATEMÁTICO E ANAVA

Yij  μ  ai  bi  abij  rk  eijk


FV GL SQ QM F
Fator A I-1 V1 V1/V4
Fator B J-1 V2 V2/V4
Interação AxB (I-1)(J-1) V3 V3/V4
BLOCOS K-1
(TRAT) IJ-1 SQTRAT VT VT/V4
RESÍDUO (IJ-1)(K-1) SQRES V4
TOTAL IJK-1 SQTOTAL

TESTES DE COMPARAÇÕES ENTRE MÉDIAS

H0: t a = t b = t c = ... tn
Ha: existe pelo menos uma diferença
TESTE DE TUKEY
 É usado para comparar as médias duas a duas. Tem por base a
diferença mínima significativa (DMS)

RE
q
d
Onde d é o divisor de médias, ou seja, o número de repetições e q
= é o valor obtido na tabela de Tukey em um nível de significância
α, gl do resíduo e nº de tratamentos
Passos:
1º Ordenar as médias
2º Calcular a DMS
3º Comparar as médias duas a duas

4º Colocar as letras
Médias iguais recebem letras iguais
Médias diferentes recebem letras diferentes
5º Conclusão
As médias seguidas da mesma letra não diferem estatisticamente
pelo teste de Tukey em nível α de probabilidade.

Os dados referem-se as produções (t.ha-1) de variedades de cana


de açúcar em um ensaio em blocos casualizados

BLOCOS
VARIEDADES
I II III IV TOTAIS
1 94,0 80,6 98,5 91,0 364,1
2 95,7 83,2 75,5 69,4 323,8
3 96,5 93,4 81,6 86,8 358,3
4 57,0 46,5 70,2 42,2 215,9
5 77,0 52,4 59,0 47,9 236,3
TOTAIS 420,2 356,1 384,8 337,3 1498,4
FV GL SQ QM Fc P
--------------------------------------------------------------------------------------------
TRAT 4 480103.2000 120025.8000 16.61 0.0001
BLOCO 3 78338.8000 26112.9333 3.61 0.0457
RESÍDU0 12 86731.2000 7227.6000
--------------------------------------------------------------------------------------------
TOTAL 19 645173.2000
--------------------------------------------------------------------------------------------
CV (%) = 11.35
Média geral: 749.2000 Número de observações: 20
--------------------------------------------------------------------------------------------
Teste Tukey para a FV TRATAMENTOS
DMS: 19,1675 NMS: 0,05
--------------------------------------------------------------------------------

Tratamentos Médias Resultados do teste


--------------------------------------------------------------------------------
4 53,9750000 a1
5 59,0750000 a1
2 80,9500000 a2
3 89,5750000 a2
1 91,0250000 a2
-------------------------------------------------------------------------------

You might also like