You are on page 1of 72

UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO

INSTITUTO DE CIÊNCIAS EXATAS


Departamento de Matemática
Área de Estatística

IC 283 – BIOESTATÍSTICA
IC 284 – ESTATÍSTICA EXPERIMENTAL

Marcelo Jangarelli
Prof. Adjunto – DEMAT/ICE/UFRRJ

Seropédica – Rio de Janeiro


Agosto – 2011
UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO
INSTITUTO DE CIÊNCIAS EXATAS
Departamento de Matemática
Área de Estatística

IC 283 – BIOESTATÍSTICA
IC 284 – ESTATÍSTICA EXPERIMENTAL

Esta apostila constitui o material básico das disciplinas IC 283 – Bioestatística e IC


284 – Estatística Experimental. Em todas as aulas serão feitas complementações
suplementares com o objetivo de atualizar, acrescentar novas informações relevantes ainda
não implementadas e facilitar o entendimento do material apresentado. Adicionalmente, serão
disponibilizadas tabelas para o teste de Tukey e para as distribuições Normal, F (Fisher), t
(Student) e Qui-quadrado.

Marcelo Jangarelli
Prof. Adjunto – DEMAT/ICE/UFRRJ

Seropédica – Rio de Janeiro


Agosto – 2011
Sumário

I Distribuição Amostral e Intervalo de Confiança 01


II Testes de Hipóteses 05
III Contraste 18
IV Princípios Básicos da Experimentação 20
V Delineamentos Experimentais e Teste de Comparação de Médias 24
VI Experimentos Fatoriais 40
VII Regressão Linear 45
VIII Listas de Exercícios 50
IX Gabarito 67
X Referência Bibliográfica Adicional 69
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO I

DISTRIBUIÇÃO AMOSTRAL E INTERVALO DE CONFIANÇA

1 – INTRODUÇÃO

Ao retirarmos uma amostra aleatória de uma população e calcularmos a partir desta


amostra qualquer quantidade (medidas descritivas numéricas), encontramos a estatística, ou
seja, chamaremos os valores calculados em função dos elementos da amostra de estatísticas.
As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade,
com uma média, uma variância, etc. A distribuição de probabilidade de uma estatística é
denominada de Distribuição Amostral.
A inferência estatística tem por objetivo fazer generalização sobre uma população com
base em dados de uma amostra. As populações são caracterizadas por medidas descritivas
numéricas, chamadas de parâmetros. Muitas pesquisas estatísticas tem por objetivo fazer
inferência a respeito de um ou mais parâmetros da população. Essa inferência pode ser por
meio de um único valor numérico (estimação por ponto), por uma amplitude de valores
numéricos (estimação por intervalo) ou pelo simples “sim” ou “não” (teste de hipótese).
Como exemplo, considere uma nova marca de inseticida lançada no mercado. A
pesquisa estatística pode ter diversos interesses: i) saber qual dose de inseticida mata 90% dos
insetos (estimação por ponto); ii) desejar um intervalo da dose com coeficiente 1 – α de
confiança para que se tenha a mortalidade de 90% dos insetos (estimação por intervalo); iii)
ou ainda o interesse poderia focar se o inseticida novo é melhor do que os já existentes no
mercado (testes de hipóteses).
A estimação por ponto utiliza a informação da amostra para chegar a um único valor
numérico ou ponto, que estima o parâmetro de interesse (parâmetro populacional). Ex: Média,
Variância, Coeficiente de Variação, etc.
A estimação por intervalo utiliza a informação da amostra para chegar a dois números,
entre os quais pretende-se que esteja o parâmetro de interesse. Caso esse intervalo esteja
associado a uma probabilidade “1 – α”, tem-se um intervalo de confiança com coeficiente de
confiança de 1 – α.

1
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2 – DEFINIÇÕES

 População: é o conjunto de todos os elementos sobre os quais desejamos desenvolver


determinado estudo;
 Amostra: é uma parte desses elementos, ou seja, qualquer subconjunto da população;
 Parâmetro: é uma medida utilizada para descrever uma característica da população;
 Estatística: é uma característica da amostra, ou seja, uma estatística T é uma função
de X1, X2, X3, ..., Xn → T = f (X1, X2, X3, ..., Xn);
 Estimador: é qualquer estatística T = f (X1, X2, X3, ..., Xn) utilizada para estimar uma
quantia desconhecida. Em geral, ele é representado por uma determinada fórmula;
 Estimativa: é o valor numérico assumido pelo estimador quando os valores
observados (X1, X2, X3, ..., Xn) são considerados.

3 – DISTRIBUIÇÃO AMOSTRAL DA MÉDIA

A distribuição amostral de determinada estatística é a distribuição de todos os


possíveis valores que ela pode assumir, calculados a partir de todas as possíveis amostras de
mesmo tamanho.
Para determinado tamanho “n” da amostra, tomada de uma população com média “μ”,
o valor da média amostral ( X ) irá variar de uma amostra para outra. A distribuição amostral
da média é descrita para determinar o valor esperado [E( X )] e o desvio padrão [σ( X )] da
distribuição das médias. Uma vez que este desvio padrão indica a acurácia da média da
amostra como um estimador por ponto, σ( X ) é usualmente chamado de erro padrão da
média. Em geral, o valor esperado e o erro padrão da média são definidos como:
E( X ) = μ


σ( X ) =
n

Se o desvio padrão da população (σ) for desconhecido o erro padrão da média pode ser
estimado por meio do desvio padrão amostral (s).
s
s( X ) =
n
4 – INTERVALO DE CONFIANÇA (IC)

A estimação por ponto é bastante útil, embora não indique nenhuma acurácia ou
precisão associada a ela. Assim, ao invés de inferirmos sobre um único valor referente ao
parâmetro populacional, podemos inferir se o verdadeiro parâmetro está contido em um
determinado intervalo compreendido entre dois valores, que representam os extremos do
intervalo (LSuperior e LInferior).

2
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

O objetivo da estimação por intervalo é gerar intervalos pequenos que incluam o


verdadeiro parâmetro populacional com alta probabilidade.
Os extremos do intervalo podem variar aleatoriamente de uma amostra para outra, pois
estão em função das médias amostrais (estimativas).
O comprimento do intervalo pode ser obtido pela diferença entre os limites superior e
inferior (LSup. – LInf.).

4.1 – IC para a média (μ) de uma população normal com σ2 conhecida

   
P X  Z    X  Z  =1–α
 2 n 2 n

IC (μ) 1 – α: X ± Z 
2 n
Note que, o comprimento do IC também pode ser obtido pela expressão:

2. Z 
2 n
Caso seja mantido os valores de “n”, “σ” e “α” o seu comprimento será fixo/constante.
Já a estimativa da média ( X ) continua sendo uma variável aleatória, determinando os
extremos do intervalo de acordo com a amostra considerada.
A interpretação do IC pode ser assim mencionada: Tem-se 1 – α (%) de confiança de
que o parâmetro populacional (μ) esteja compreendido no intervalo obtido. Ou mesmo, se
construirmos n intervalos do mesmo tipo (tamanho e nível de confiança), espera-se que em 1
– α (%) deles contenha o verdadeiro parâmetro (μ).

4.2 – IC para a média (μ) de uma população normal com σ2 desconhecida

Se a variância populacional (σ2) não for conhecida, podemos substituir o σ( X ) por s(


X , em que o desvio padrão amostral (s) é a raiz quadrada da variância amostral (s2).
)
A pressuposição da distribuição normal é garantida para amostras grandes (n ≥ 30), ou
mesmo amostras menores, desde que sua população seja normalmente distribuída e o σ
conhecido. Para amostras pequenas em que não se pode afirmar sobre sua normalidade, a
distribuição normal (Z) deve ser substituída pela distribuição t de Student.
s t  ( n  1) g .l .
IC (μ) 1 – α: X ± t  …
2 n 2

EXERCÍCIOS PROPOSTOS

1 – Suponha que a média de uma população seja μ = 50,00 e o desvio padrão σ = 12,00.

3
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

a) Determinar a distribuição de amostragem das médias das amostras de tamanho n = 36


em termos de valor esperado e erro padrão;
b) Determinar o tamanho da amostra para se obter um erro padrão da média igual a 3,00.

2 – Uma variável aleatória X tem distribuição normal, com média 100 e desvio padrão 10.
a) Qual a P (90 < X < 110)?
b) Se X é a média de uma amostra de 16 elementos retirados dessa população, calcule P
(90 < X < 110);
c) Que tamanho deveria ter a amostra para que P (90 < X < 110) = 95%?

3 – Seja X a duração da vida de uma peça de equipamento tal que σ = 5 horas. Admita que
100 peças foram ensaiadas fornecendo uma duração de vida média de X = 500 horas.
a) Obter um intervalo de 95% para a média μ;
b) Qual o tamanho da amostra para que o intervalo 500 ± 1,63 tenha 95% de confiança?

4 – Em uma amostra aleatória de 25 crianças de uma determinada comunidade, encontrou-se


altura média 150 cm e desvio padrão 5 cm. Admitindo que a distribuição das alturas das
crianças é normal, determine:
a) Um intervalo de 95% de confiança para a altura média da população;
b) O comprimento do intervalo obtido na letra “a”.

CONTEÚDO II

TESTES DE HIPÓTESES

1 – INTRODUÇÃO

As duas principais áreas de inferência estatística são: estimação de parâmetros


populacionais e testes de hipóteses.
O objetivo dos testes de hipóteses é desenvolver métodos gerais para testar hipóteses,
aplicando tais metodologias a alguns problemas comuns. Em geral, é feita uma determinada
afirmação sobre uma população, usualmente sobre um parâmetro desta, e desejamos saber se
os resultados de uma amostra contrariam ou não tal afirmação.
Desta forma, a finalidade do teste estatístico de hipótese é fornecer ferramentas que
nos permitam validar ou rejeitar uma hipótese através dos resultados amostrais.

2 – DEFINIÇÕES

4
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Parâmetro → é uma função de valores populacionais. Em geral, representa um valor


desconhecido associado à população;
Estimador → O estimador de um parâmetro é qualquer função das observações
amostrais (X1, X2, ..., Xn). Ele representa uma determinada fórmula de cálculo, fornecendo
valores diferentes conforme a amostra selecionada;
Estimativa → É o valor numérico assumido pelo estimador quando os valores
amostrais (X1, X2, ..., Xn) são considerados.

3 – TESTES DE HIPÓTESES

É uma regra decisória que nos permite aceitar ou rejeitar uma hipótese estatística com
base nos elementos de uma amostra. Estas hipóteses são, em geral, sobre parâmetros
populacionais ou relacionadas à natureza da distribuição da população.

3.1 – Hipótese Estatística

É uma suposição referente ao valor de um parâmetro populacional que será verificada


por um teste paramétrico, ou mesmo uma afirmação quanto à natureza da população que pode
ser verificada por meio de um teste de aderência.
Exemplos de hipóteses estatísticas:
1. A média populacional da altura dos brasileiros é de 1,66 metros, isto é, μ = 1,66;
2. A proporção de brasileiros com determinada doença é de 40%, ou seja, p = 0,40;
3. A distribuição dos pesos dos alunos da UFRRJ é normal, ou seja, X ~ N (μ;σ2);

Hipóteses a serem formuladas:

3.1.1 – Hipótese de Nulidade (H0)

É a hipótese a ser testada, também chamada de hipótese básica ou nula. Os testes são
construídos sobre a pressuposição de que H0 seja verdadeiro.

5
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

O teste de hipótese consiste em verificar se determinado valor estimado, a partir de


uma amostra representativa da população, difere significativamente do resultado esperado sob
H0.
Exemplos:
1. Um pesquisador informa que a produtividade média de uma cultura é de 500 kg/ha;
H0: μ = 500;
2. Duas marcas de rações (I e II) para leitões em fase de crescimento propiciam em
média o mesmo ganho de peso. H0: μ1 = μ2.

Para os dois exemplos, o raciocínio é que enquanto não houver evidências amostrais
sugerindo que tais informações não sejam verdadeiras, elas são tomadas como verídicas
(verdadeiras).

3.1.2 – Hipótese Alternativa (H1)

É a hipótese que contraria H0, formulada com base no conhecimento prévio do


problema, informações de pesquisas/científicas, entre outras indagações. Considerando os
exemplos anteriores:
1. H1: μ > 500 ou μ < 500 ou μ ≠ 500;
2. H1: μ1 > μ2 ou μ1 < μ2 ou μ1 ≠ μ2.

No teste de hipótese, a rejeição de H 0 implicará na aceitação automática de H1. Isso se


deve ao fato dessas hipóteses serem contrastantes e mutuamente excludentes, impossibilitando
que sejam simultaneamente verdadeiras.
Denomina-se teste de significância àquele utilizado para se testar tais hipóteses.

3.2 – Região Crítica (RC)

É a faixa de valores da estatística do teste que nos leva a rejeição da hipótese H 0, ou


seja, a RC para um teste de hipótese é a que nos leva a rejeição de H 0. É válido ressaltar que o
teste estatístico é construído na suposição de que H0 é verdadeiro.
Caso o valor observado da estatística do teste (F, t,  2 , etc.) pertença à região crítica,
rejeitamos H0, caso contrário, não rejeitamos ou aceitamos H0.

6
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

3.3 – Tipos de Erros

Para qualquer decisão que tomarmos, a partir de uma amostra da população, estaremos
sujeitos a erros, pois trabalhamos com amostras e não com a população como um todo.

3.3.1 – Erro tipo I ou erro α

O erro tipo I é caracterizado pelo fato de rejeitarmos H 0 sendo H0 verdadeiro. Sua


probabilidade é representada por “α”, sendo denominada nível de significância do teste. Logo,
α = P (erro tipo I) = P (rejeitar H0/ H0 é verdadeiro).

3.3.2 – Erro tipo II ou erro β

O erro tipo II é caracterizado pelo fato de não rejeitarmos H 0 sendo H0 falso. A


probabilidade de cometermos este tipo de erro é indicada por β. Logo, β = P (erro tipo II) = P
(não rejeitar H0/ H0 é falso).

A tabela a seguir apresenta as probabilidades de cometermos os erros do tipo I e do tipo II.


Decisão \ Realidade H0 é verdadeiro H0 é falso
Rejeitar H0 α 1–β
Não rejeitar H0 1–α β

3.4 – Tipos de Testes

3.4.1 – Teste Unilateral à Direita

A partir de uma valor C (ponto crítico), rejeita-se H0 se X ≥ C.


H0: μ = K
H1: μ > K

3.4.2 – Teste Unilateral à Esquerda

A partir de uma valor C (ponto crítico), rejeita-se H0 se X ≤ C.


H0: μ = K

7
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

H1: μ < K

3.4.3 – Teste Bilateral

Rejeita-se H0 se X ≤ C1 ou X ≥ C2.
H0: μ = K
H1: μ ≠ K

3.5 – Etapas para construção de um Teste de Hipótese

1. Enunciar a hipótese nula (H0) e a hipótese alternativa (H1);


2. Especificar o nível de significância (erro I ou α) a ser utilizado, selecionando a
estatística do teste;
3. Estabelecer o valor crítico (C) ou os valores críticos (C 1 e C2) da estatística do teste
em função do nível α e das tabelas estatísticas apropriadas;
4. Determinar o valor real da estatística do teste por meio dos elementos amostrais;
5. Tomar a decisão pela não rejeição ou rejeição de H0 (conclusão) pela comparação do
valor obtido na 4ª etapa com o valor crítico (ou valores críticos) fixado (s) pela
estatística do teste na 3ª etapa.

4 – DISTRIBUIÇÃO F E O TESTE DA DIFERENÇA ENTRE DUAS VARIÂNCIAS


DE POPULAÇÕES NORMAIS (Teste F)

Sejam X e Y duas variáveis aleatórias normalmente distribuídas. Considere duas


amostras, casuais e independentes, de tamanho nx e ny, respectivamente.
Sejam as hipóteses: H0:  x =  y
2 2

H1:  x2 >  y ou
2

 x2 <  y2 ou

 x2 ≠  y2

Para testar H0, utiliza-se a estatística “F” (Teste F), definida por:
s x2
F ,
s y2

que tem Distribuição de Fisher com (nx – 1) e (ny – 1) graus de liberdade.

8
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

OBS: Para simplificar o uso da tabela utilizaremos a expressão:


 var iância
Fcalc.   F 1
 var iância
Assim, a hipótese alternativa corresponderá ao teste unilateral à direita.
H0:  x =  y
2 2

H1:  x2 >  y
2

O valor crítico da distribuição F será estabelecido de acordo com o nível de


significância (α) e o número de graus de liberdade.
Ftab = f (α; n1 ; n2)
n1 = número de g.l. do numerador
n2 = número de g.l. do denominador
Tomada de decisão (conclusão):
 Se Fcalc. ≥ Ftab: Rejeita-se H0;
 Se Fcalc. < Ftab: Não Rejeita-se H0 ou Aceita-se H0.

5 – DISTRIBUIÇÃO “t” DE STUDENT E O TESTE PARA UMA MÉDIA DA


POPULAÇÃO COM DESVIO PADRÃO POPULACIONAL (σ) DESCONHECIDO
(Teste t)

Para testar hipóteses referentes à média de uma população, cujo desvio padrão
populacional (σ) é desconhecido, utiliza-se a estatística “t” (Teste t), definida por:

X  X 
t calc.  
s( X ) s ,
n

que tem Distribuição de Student com n – 1 graus de liberdade (g.l.).

Hipóteses:

H0: μ = K
H1: μ > K ou
μ < K ou

9
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

μ≠K

Valor crítico da distribuição t:


ttab. = f [α; (n – 1)g.l.]

Tomada de decisão (conclusão):


 Se t calc . ≥ ttab: Rejeita-se H0;
 Se t calc . < ttab: Não Rejeita-se H0 ou Aceita-se H0.

OBS: A tabela da distribuição t de Student a ser utilizada em nossas aulas é bilateral. Assim,
se o teste efetuado for bilateral, entra exatamente com o α na tabela. Caso contrário, o teste
realizado seja unilateral, deve-se entrar com 2α na tabela.

6 – DISTRIBUIÇÃO “t” DE STUDENT E O TESTE PARA COMPARAR MÉDIAS DE


DUAS AMOSTRAS INDEPENDENTES DE POPULAÇÕES NORMAIS COM
VARIÂNCIAS DESCONHECIDAS (Teste t)

Muitos problemas aparecem quando se deseja testar hipóteses sobre médias de


populações. Por exemplo, um pesquisador pode ter interesse em investigar um novo tipo de
adubo, comparando a produtividade de determinada cultura em dois períodos simultâneos, um
referente à utilização do adubo antigo e outro referente à utilização do adubo novo.
Quando as variâncias das populações são substituídas pelas variâncias das amostras,
isto é, σ2 por s2, o teste recomendado é o Teste t. A execução do teste fica na dependência se
as variâncias das populações são ou não iguais entre si, tendo assim dois casos a serem
considerados.
Seja X a medida de certo atributo dos elementos de uma população A, e Y a medida
do mesmo atributo dos elementos de uma população B. Sejam X e Y normalmente
distribuídas com variâncias desconhecidas.
Considere as hipóteses:
H0: μA = μB
H1: μA > μB ou
μA < μB ou
μA ≠ μB

10
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Inicialmente deve-se efetuar um Teste Preliminar com o objetivo de comparar as


variâncias das duas populações, ou seja, temos que aplicar o Teste F.
H0’:  A2 =  B2

H1’:  A2 >  B2

Ao testar estas hipóteses teremos dois casos a considerar:

6.1 – Caso 1 ou Caso A

Quando H0’ não for rejeitada. Admitimos que as variâncias sejam iguais, cujos valores

assumidos por s A2 e s B2 são estimativas de um mesmo valor σ2. Devemos combinar essas

variâncias ( s A2 e s B2 ), estimando-se uma variância comum ( s C2 ).


SQD A
s A2 =  SQD A  (n A  1).s A2
nA 1

SQDB
s B2 =  SQDB  (n B  1).s B2
nB  1

(n A  1).s A2  ( n B  1).s B2 SQD A  SQD B


s C2 = 
n A  nB  2 n A  nB  2

A seguir, testa-se H0 utilizando-se a distribuição t de Student (Teste t), definida por:


X Y
t calc. 
 1 1 
sC2   
 n A nB 

ttab. = f (α ; nA + nB – 2 g.l.)

Tomada de decisão (conclusão):


 Se t calc . ≥ ttab: Rejeita-se H0;
 Se t calc . < ttab: Não Rejeita-se H0 ou Aceita-se H0.

6.2 – Caso 2 ou Caso B

11
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Quando H0’ for rejeitada. Admitimos que as variâncias sejam diferentes, não devendo
assim estimar uma variância comum. Neste caso, utilizaremos para o nosso teste, os valores

assumidos por s A2 e s B2 .
Neste caso, a estatística t de Student (Teste t) fica definida:
X Y
t calc. 
s A2 s B2 ,

n A nB

que segue distribuição “t” com n* graus de liberdade, em que n* é dado por:
2
 s A2 s B2 
  
n*   n A nB 
2 2
 s A2   s B2 
   
 n A    nB 
n A  1 nB  1

ttab. = f (α ; n* g.l.)

OBS: Adotar como g.l. o maior valor inteiro desde que não supere o valor calculado.

Tomada de decisão (conclusão):


 Se t calc . ≥ ttab: Rejeita-se H0;
 Se t calc . < ttab: Não Rejeita-se H0 ou Aceita-se H0.

7 – DISTRIBUIÇÃO “t” DE STUDENT E O TESTE PARA COMPARAR A


DIFERENÇA ENTRE AS MÉDIAS DE DUAS AMOSTRAS DEPENDENTES (DADOS
PAREADOS/EMPARELHAD0S) (Teste t)

Os procedimentos do item seis (6) são baseados na hipótese de que as duas amostras
foram coletadas independentemente uma da outra. Contudo, em muitas situações as amostras
são coletadas como pares de valores, tal como medidas sobre o mesmo indivíduo antes e
depois da aplicação de algum medicamento; sobre um mesmo animal antes e depois do

12
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

fornecimento de uma suplementação alimentar; ou também sobre uma mesma planta antes e
depois de administrar um determinado fertilizante. Referimo-nos a isto como
observações/dados emparelhados ou pareados. Contrastando com amostras independentes,
duas amostras que contém observações emparelhadas são chamadas de amostras dependentes.
Para observações emparelhadas, o teste apropriado para a diferença entre as médias
das duas amostras consiste em determinar primeiro a diferença “d” entre cada par de valores,
e então testar a hipótese nula de que a média das diferenças na população é zero (ou igual a
determinado valor ∆). Logo, do ponto de vista de cálculo, o teste é aplicado a uma única
amostra de n diferenças di.
A média e o desvio padrão da amostra de valores di são obtidos pelas fórmulas básicas
de estatística, substituindo os valores Xi por di.
2
 n 
n
  di 
d n
d i   i 1 

i
e 2
d i 1
n
n s d  i 1
n 1

O erro padrão da diferença média entre as observações emparelhadas é obtido por:


sd
sd 
n
Sejam as hipótese:
H0: D = 0
H1: D > 0 ou
D < 0 ou
D ≠0
Para testar H0, utiliza-se a estatística “t” de Student, definida por:
di  D
t calc. 
sd

Sob H0 D = 0:
di 0 di
t calc.  
sd sd ,
n n
que tem distribuição “t” de Student, cujo grau de liberdade representa o número de pares
observados menos um, ou seja, (n – 1) graus de liberdade (g.l.).
ttab. = f [α; (n – 1)g.l.]

13
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Tomada de decisão (conclusão):


 Se t calc . ≥ ttab: Rejeita-se H0;
 Se t calc . < ttab: Não Rejeita-se H0 ou Aceita-se H0.

8 – TESTE DE QUI-QUADRADO –  2

Na biologia/genética, assim como em muitas outras ciências, os resultados numéricos


observados em um experimento são frequentemente comparados com aqueles esperados com
base em alguma hipótese. Por meio dessas comparações obtêm-se os desvios. Devemos
verificar se os desvios são significativos ou não, de acordo com uma probabilidade de
ocorrência do evento. Se os desvios não são significativos, conclui-se que eles são devidos ao
acaso, aceitando a hipótese H0 formulada. Por outro lado, se os desvios são significativos, a
hipótese H0 é rejeitada, concluindo que os desvios não são devidos ao acaso.
O teste estatístico que pode ser utilizado para verificar a significância dos desvios,
muito utilizado na biologia/genética, é o Teste Qui-quadrado (  2 ). Nele, os desvios são

transformados em um único valor de  Calc. , o qual representa uma medida padronizada da


2

magnitude dos desvios. O valor de  Calc . é estimado pela seguinte expressão:


2

n  Oi  Ei 2 
 2
Calc .    , em que:
i 1 
 Ei 

 Oi = número/valor observado na classe/categoria i;


 Ei = número/valor esperado na classe/categoria i;
 n = número de classes/categorias.

A hipótese H0 é formulada no sentido de que a frequência observada se ajusta à


frequência esperada. Nesta hipótese testa-se se os desvios são devido ao acaso.
Para aceitarmos ou não a hipótese H0, isto é, para verificar se os desvios são devido ao

acaso, deve-se comparar o valor calculado do  Calc. com o valor tabelado. Esse valor
2

tabelado é obtido em tabelas próprias para o teste  2 , de acordo com um nível de


significância/probabilidade e um número de graus de liberdade (g.l.).

14
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Em uma análise de  2 , os g.l. correspondem ao número de classes/categorias em que


os dados foram separados (n) menos 1, ou seja, “n – 1”, representando o número de classes
independentes. De posse dos valores calculado e tabelado do  2 é tomada a decisão
(conclusão):

Se  calc. ≥  tab . : Rejeita-se H0;


2 2

Se  calc. <  tab. : Não Rejeita-se H0 ou Aceita-se H0.


2 2

OBS: O Teste  2 somente deve ser aplicado aos dados observados do experimento e nunca
às percentagens ou proporções oriundas dos mesmos.

EXERCÍCIOS PROPOSTOS

1 – Com o objetivo de controlar a Umidade Relativa (UR - %) em uma casa de vegetação ao


longo do dia, procedeu-se medições em dois períodos (manhã e tarde), em um intervalo de
duas horas. No período da manhã, de dez medições, foi obtida a média de 72,8% e desvio
padrão de 0,074%. No período da tarde, os seguintes valores de UR (%) foram fornecidos:
71,7%; 72,0%; 72,9%; 73,1%; 71,6%; 71,5% e 71,2%. Ao nível de 5% de significância,
podemos concluir que tenha ocorrido variabilidade da UR entre os dois períodos
investigados?

2 – Um fertilizante foi aplicado a uma variedade de tomate. As produções, em kg, de dez pés
de tomate foram: 1,6; 1,7; 1,8; 1,4; 1,5; 1,9; 2,3; 2,1; 1,9 e 1,7 Kg. Verificar se o fertilizante
proporciona uma produção superior a 1,5 kg por pé de tomate. Adotar α = 5%.

3 – Em indivíduos sadios o consumo renal de oxigênio (O 2) distribui-se normalmente com


média de 12 cm3/minuto. Deseja investigar, com base em cinco indivíduos portadores de certa
doença, se esta tem influência no consumo renal médio de O 2. Os consumos medidos para os
cinco pacientes foram: 14,4; 12,9; 15,0; 13,7 e 13,5 cm3/minuto. Qual a conclusão ao nível de
1% de significância?

4 – Os dados a seguir referem-se a um experimento de competição de duas progênies de


Eucalyptus saligna. Cada progênie foi cultivada em solos com características semelhantes e a
avaliação das plantas foi feita pela média dos diâmetros à altura do peito (DAP) de cada
parcela. Foram utilizadas dez parcelas para cada progênie. Aval iar as progênies (A e B) com
relação à característica mensurada. (α = 5%)
Progênie A Progênie B
Média – DAP (cm) 15,4 13,5
Variância – DAP (cm2) 2,5 3,0
Número de Parcelas 10 10

15
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

5 – Desejando saber se duas rações A e B, para determinada raça de suínos, são equivalentes
ou se a ração A é superior a ração B em relação ao ganho de peso, há 11 animais sorteados ao
acaso foi dado a ração A e a outros 19 a ração B. Os resultados, em kg, foram:
2
X A = 66 kg e s A = 40 kg2
2
X B = 63 kg e s B = 16 kg2
A que conclusão chegar se adotarmos o nível de significância de 5%?

6 – A Tabela abaixo apresenta dados da pressão sanguínea sistólica de dez mulheres, na faixa
etária de 30 a 35 anos, que fizeram uso de anovulatório por determinado período e depois não
o fez, e vice e versa. Teste a hipótese de que o uso de anovulatório não tem efeito sobre a pressão
sanguínea sistólica. (α = 5%)
Anovulatório Mulheres (30 – 35 anos)
Sim 111 119 121 113 116 126 128 123 122 121
Não 109 113 120 117 108 120 122 124 115 112

7 – Foi realizado um experimento envolvendo o estudo da herança da cor e textura da semente


do milho. Considere que cada caráter (cor e textura) seja controlado por um gene de modo
independente. Deste experimento foram obtidas 480 sementes assim distribuídas:
 268 → Sementes Amarelas e Lisas (AL);
 86 → Sementes Amarelas e Enrugadas (AE);
 97 → Sementes Brancas e Lisas (BL);
 29 → Sementes Brancas e Enrugadas (BE).

Verificar se os genes segregam na proporção 9:3:3:1 para as categorias AL, AE, BL e


BE, respectivamente. Adotar α = 5%.

CONTEÚDO III

16
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTRASTE

1 – INTRODUÇÃO

O estudo de contraste na estatística experimental é de grande relevância,


principalmente quando o experimento em análise é composto por dois ou mais tratamentos. O
uso de contraste possibilita ao pesquisador estabelecer comparações entre tratamentos ou
grupos de tratamentos que sejam de interesse. Os contrastes assim estabelecidos podem ser
testados por meio de um teste de comparação de médias, o qual complementa o resultado da
análise de variância.
Os conhecimentos adquiridos neste tópico serão posteriormente utilizados para
realização do teste de comparação de médias e procedimentos de análise de variância.

2 – DEFINIÇÃO DE CONTRASTE

Considere a seguinte função linear de médias populacionais de tratamentos:


Y = a1m1 + a2m2 + ... + anmn
A função Y será um contraste entre médias se satisfazer a seguinte condição:
n

a
i 1
i 0

3 – ESTIMADOR DO CONTRASTE

Na prática, geralmente não se conhece os valores das médias populacionais “mi”, mas
sim suas estimativas. Desta forma, na estatística experimental não trabalhamos com o
contraste Y, mas sim com o seu estimador Ŷ. Este também representa uma função linear de
médias obtidas por meio de experimentos ou amostras. Assim, tem-se que o estimador para o
contraste de médias é dado por:
^ ^ ^
m m m
Ŷ = a1 1 + a2 2 + ... + an n

4 – CONTRASTES ORTOGONAIS

17
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Em algumas situações desejamos testar um grupo de contrastes relacionados com o


experimento em estudo. Alguns tipos de testes indicados para este objetivo necessitam que os
contrastes, que compõem o grupo a ser testado, sejam ortogonais entre si.
A ortogonalidade entre os contrastes indica independência linear na comparação
estabelecida por um contraste com a comparação estabelecida pelos outros contrastes.
Sejam os estimadores dos contrastes de Y1 e Y2, dados respectivamente por:
^ ^ ^
m m m
Ŷ1 = a1 1 + a2 2 + ... + an n
^ ^ ^
m m m
Ŷ2 = b1 1 + b2 2 + ... + bn n
A condição para que estes dois contrastes sejam ortogonais entre si para determinado
experimento, de acordo com o número de repetições dos tratamentos, é dada por:
n
ai bi

i 1 ri
=0

EXERCÍCIOS PROPOSTOS

1 – Em um experimento de consórcio na cultura do abacaxi, com cinco repetições, as médias


de produções foram as seguintes (toneladas de frutos/ha):
Tratamentos m̂
Abacaxi (0,90 x 0,30 m) – Monocultura 53,50
Abacaxi (0,80 x 0,30 m) – Monocultura 56,50
Abacaxi (0,80 x 0,30 m) + Amendoim 62,00
Abacaxi (0,80 x 0,3 0m) + Feijão 60,40

Pede-se:
a) Obter a estimativa do contraste, interpretando;
Y = m1 + m2 – m3 – m4
b) Estabelecer um contraste para comparar a produção média de abacaxi quando em
consórcio.

2 – Por meio dos dados e dos contrastes fornecidos abaixo, obter suas estimativas e verificar
se são ortogonais.
tˆ1  67,20 ; tˆ2  63,00 ; tˆ3  40,00 ; tˆ4  105,00
r1 = r2 = 6 ; r3 = 4 ; r4 = 5
Y1 = m1 + m2 – m3 – m4
Y2 = m1 – m2
CONTEÚDO IV

PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO

18
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

1 – INTRODUÇÃO

Grande parte do conhecimento que a humanidade acumulou ao longo dos séculos foi
adquirido através da experimentação. A ideia de experimentar não se limita a antiguidade,
pois também está presente no nosso dia a dia. Todos nós já aprendemos alguma coisa ao
longo da vida experimentando. Entretanto, a experimentação só se difundiu como técnica
sistemática de pesquisa há pouco mais de um século, quando foi formalizada através da
estatística (Vieira, 2006).
Entende-se por experimento uma experiência realizada sob condições previamente
estabelecidas e que opera com causas controladas. O propósito da estatística experimental é
analisar, objetivamente, os dados experimentais, isolando as causas da variação do acaso,
próprias de qualquer conjunto de dados observados (Dias & Barros, 2009).
A experimentação tem por objetivo o estudo dos experimentos, ou seja, seu
planejamento, execução, análise dos dados e interpretação dos resultados.

2 – CONCEITOS

a) Experimento ou Ensaio: é um trabalho previamente planejado seguindo


determinados princípios básicos. Nele se faz a comparação dos efeitos dos
tratamentos;
b) Tratamento: é o método, elemento ou material cujo efeito desejamos medir ou
comparar em um experimento;
c) Unidade Experimental: é a unidade que vai receber o tratamento e fornecer os dados
que deverão refletir o seu efeito;
d) Delineamento Experimental: é o plano utilizado na experimentação. Implica na
forma como os tratamentos serão designados às unidades experimentais e em um
amplo entendimento das análises a serem feitas quando todos os dados estiverem
disponíveis.

A pesquisa científica está constantemente se utilizando de experimentos para avaliar e


validar suas hipóteses. Apesar dos experimentos variarem de uma pesquisa para outra, todos
eles são regidos por alguns princípios básicos, necessários para que as conclusões que venham
a ser obtidas se tornem válidas.

19
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

3 – PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO

São três os princípios básicos da experimentação: Repetição, Casualização e Controle


Local.

3.1 – Repetição

O princípio da repetição consiste na reprodução do experimento básico e tem por


finalidade propiciar a obtenção da estimativa do erro experimental. A repetição consiste em
aplicar determinado tratamento em várias parcelas em um mesmo experimento.
Quanto maior o número de repetições, maior será a precisão do experimento. Contudo,
esta relação é válida até determinado número de repetições, a partir do qual o incremento na
precisão não é significativo.
O número de repetições é dependente do conhecimento que o pesquisador tem sobre o
assunto e do conjunto de condições em que será realizado o experimento. O número de
tratamentos, o nível de precisão desejado, o tipo de unidade experimental a ser
estudada/utilizada e o custo da realização do experimento são alguns exemplos de fatores
limitantes ao número de repetições.
O número de repetições necessárias pode ser calculado através de fórmulas. A
aplicação de tais fórmulas exige, no entanto, que o pesquisador tenha informações estatísticas
de experimentos anteriores.
Quanto menor a diferença a ser comparada entre os tratamentos, maior deverá ser o
número de repetições para cada tratamento. Aumentando o número de repetições, menores
diferenças entre os tratamentos podem atingir a significância estatística, isto é, há um aumento
da precisão do experimento.
De acordo com Gomes (2009), os experimentos devem ter pelo menos 20 unidades
experimentais (parcelas) e 10 graus de liberdade para o erro experimental ou resíduo.

3.2 – Casualização

O princípio da casualização tem por finalidade propiciar, a todos os tratamentos, a


mesma probabilidade de serem designados a qualquer uma das unidades experimentais. Desta

20
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

forma, seu objetivo é evitar que determinado tratamento venha a ser sistematicamente
favorecido ou desfavorecido por fatores externos nas diversas parcelas. Isto significa que a
distribuição dos tratamentos nas unidades experimentais deve ser feita ao acaso, através de
um mecanismo qualquer de sorteio.
O princípio da casualização se faz necessário para que as variações que contribuem
para o erro experimental sejam convertidas em variáveis aleatórias. Além disso, a
casualização permite obter uma estimativa válida do erro experimental, além de garantir o uso
de testes de significância por tornar os erros experimentais independentes.
É digno de nota ressaltar que sem os princípios básicos da repetição e da casualização
não existe experimentação.

3.3 – Controle Local

A finalidade do controle local é dividir um ambiente heterogêneo em sub-ambientes


homogêneos, tornando o experimento mais eficiente pela redução do erro experimental. O
controle local isola fontes de variação que podem ser controladas e que normalmente seriam
incluídas no resíduo, o que acarreta a redução do erro.
O material experimental é dividido em porções homogêneas ou blocos, cada um dos
quais contendo todos os tratamentos. A formação dos blocos corresponde a uma
estratificação. A casualização dos tratamentos às unidades experimentais sofre a restrição de
ser dentro de cada bloco.
Entre os blocos poderá existir grande variabilidade. Entretanto, dentro de cada bloco a
uniformidade/homogeneidade deve ser máxima.

4 – FONTES DE VARIAÇÃO DE UM EXPERIMENTO

4.1 – Premeditada

É a variação introduzida pelo pesquisador com a finalidade de fazer comparações.


Exemplo: os tratamentos.
4.2 – Sistemática

21
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Variação não intencional, porém de natureza conhecida. São variações inerentes ao


material experimental, que podem ser controladas pelo pesquisador. Exemplo:
heterogeneidade do solo, tamanho de semente, idade dos animais, etc.

4.3 – Aleatória

São variações de origem desconhecida, que não podem ser controladas. Constituem o
erro experimental propriamente dito. São resultantes de duas fontes: variações do material
experimental e falta de uniformidade nas condições experimentais.
Ressalta-se que nem sempre é possível distinguir claramente esse tipo de variação da
variação sistemática.

CONTEÚDO V

22
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

DELINEAMENTOS EXPERIMENTAIS E TESTE DE COMPARAÇÃO DE MÉDIAS

1 – DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

É o tipo de delineamento mais simples que existe, representando o delineamento


básico. Os demais delineamentos se originam dele, pela imposição de restrições (ex. controle
local). A distribuição dos tratamentos às unidades experimentais é feita completamente ao
acaso, ou seja, sem nenhuma restrição na casualização.
O DIC envolve dois princípios básicos da experimentação: repetição e casualização.
Ele é indicado quando as condições experimentais são homogêneas, sendo mais recomendado
em experimentos de laboratório e casas de vegetação, em que as condições ambientais podem
ser melhor controladas.
Para a instalação deste delineamento no campo deve-se ter certeza quanto à
homogeneidade das condições ambientais e do material experimental.

1.1 – Vantagens e Desvantagens do DIC

1.1.1 – Vantagens

 Pode-se utilizar qualquer número de tratamento e repetições, sendo que o número de


repetições pode variar de um tratamento para outro sem ocasionar maiores
dificuldades na análise estatística. No entanto, sempre que possível, deve-se manter o
mesmo número de repetições entre os tratamentos;

1.1.2 – Desvantagens

 Exige homogeneidade total das condições experimentais;


 Pode conduzir a uma estimativa da variância residual bastante alta, uma vez que ao
não utilizar o princípio do controle local todas as variações serão consideradas como
variação do acaso, exceto as devidas aos tratamentos.

1.2 – Quadro de tabulação dos dados

23
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

A título de exemplo, considere um experimento instalado no DIC com I tratamentos e


J repetições. A coleta de dados da pesquisa pode ser resumida no quadro a seguir:

Tratamentos
Repetições 1 2 ..... I
1 Y11 Y21 ..... YI1
2 Y12 Y22 ..... YI2
..... ..... ..... ..... .....
J Y1J Y2J ..... YIJ
Totais T1 T2 ..... TI

Deste quadro podem-se retirar algumas informações de interesse:

 Nº de unidades experimentais: N = I x J
I ,J I

 Total geral: G =  ij
Y   Ti
i 1 i 1
j 1

 Total para o tratamento i: Ti = Y j 1


ij

^
Ti
mi
 Média para o tratamento i: = J

^
G
 Média geral do experimento: m= IJ

1.3 – Análise de Variância (ANOVA)

É uma técnica de análise estatística que permite decompor a variação total, ou seja, a
variação existente entre todas as observações, na variação devido à diferença entre os
tratamentos e na variação devido ao acaso (erro experimental ou resíduo). Entretanto, para
que esta técnica seja empregada é necessário que sejam satisfeitas diversas pressuposições,
entre elas citam-se:
 Os erros são variáveis aleatórias independentes;
 A variância é constante (homocedasticidade);
 A distribuição dos erros é normal ou aproximadamente normal.

24
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Por meio do modelo estatístico pode-se decompor a variação total entre as observações
em duas partes que a compõem, como será demonstrado a seguir.
Considere o modelo estatístico para um experimento instalado segundo o DIC:
Yij = m + ti + eij ,

fazendo ti = mi – m, tem-se:

(Yij – m) = (mi – m) + eij ,

Substituindo m e mi por seus estimadores, elevando ambos os membros ao quadrado e


aplicando somatório, tem-se:

I ,J ^ I ,J ^ ^ I ,J

(Y  m)  (m  m)   e
i 1
ij
2

i 1
i
2

i 1
2
ij

j 1 j 1 j 1

Escrevendo de forma mais simplificada, a igualdade anterior representa:

SQTotal = SQTratamentos + SQResíduo

Aplicando as propriedades do somatório em cada termo da soma de quadrados tem-se


o desenvolvendo de fórmulas mais práticas para encontrar os valores das respectivas somas de
quadrados.
Para a SQTotal tem-se que:
I ,J
I ,J

 (Y  m)
^
2 I ,J
( Y ij )2
SQTotal = =
Y
i 1, j 1
2

ij
i 1 ij
j 1
i 1 IJ
j 1

Para a SQTratamento:
I ,J

SQTrat. =
I ,J

 (m  m)
^
i
^
2
= Ti 2I
( Y ij )2

i 1, j 1
i 1 
i 1 J IJ
j 1

25
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Esta fórmula é utilizada quando o número de repetições é igual para todos os


tratamentos. Quando ocorrer variação no número de repetições entre os tratamentos a fórmula
apropriada é:
I ,J

SQTrat. = I 2
Ti
( Y ij )2
,

i 1, j 1

i 1 J N
em que:
I
 N = é o número de unidades experimentais = r
i 1
i ;

 ri = é o número de unidades experimentais (repetições) do tratamento i.

A soma de quadrados do resíduo é obtida por diferença:

SQResíduo = SQTotal – SQTratamento

O quadro da Análise de Variância (ANOVA) para um experimento instalado segundo


o DIC, com igual número de repetições para todos os tratamentos, é dado a seguir:

FV GL SQ QM F
Tratamentos (I – 1) SQTrat. SQTrat QMTrat
I 1 QM Re s
Resíduo I(J – 1) SQRes. SQ Re s
I ( J  1)
Total IJ – 1 SQTotal - -

A partir das SQTratamentos e SQResíduo obtêm-se os respectivos quadrados médios,


por meio do quociente entre a soma de quadrado com o respectivo número de graus de
liberdade.
Para concluir se existe diferença entre os tratamentos calcula-se o valor da estatística
F, que é obtido pelo quociente do QMTrat. com o QMRes. Este valor de F calculado deve ser
comparado com o valor de F tabelado, o qual é obtido na tabela de distribuição da variável
aleatória F (Fisher), de acordo com o nível de significância do teste, o grau de liberdade para
tratamento e o grau de liberdade para resíduo.

As hipóteses para o Teste F da Análise de Variância são:

26
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

 H0: m1 = m2 = ... = mI = m; O que equivale a dizer que todos os possíveis contrastes


entre as médias dos tratamentos são estatisticamente nulos ao nível “α” de
probabilidade/significância em que foi realizado o teste;
 H1: não H0; O que equivale a dizer que existe pelo menos um contraste entre as médias
dos tratamentos estatisticamente diferente de zero ao nível “α” de
probabilidade/significância em que foi realizado o teste.

A regra decisória para o Teste F é a seguinte:

 Se o valor do F calculado for maior ou igual ao valor do F tabelado, rejeita-se H0.


Conclui-se que os tratamentos tem efeitos diferenciados ao nível de significância em
que foi realizado o teste;
 Se o valor do F calculado for menor que o valor do F tabelado, não rejeita-se H0.
Conclui-se que os tratamentos tem efeitos iguais ao nível de significância em que foi
realizado o teste.

2 – MEDIDAS DE AVALIAÇÃO DA QUALIDADE DOS EXPERIMENTOS

2.1 – Coeficiente de Variação (C.V.)

O Coeficiente de Variação permite avaliar a precisão do experimento. Quanto menor o


C.V., maior será a precisão do experimento. O conhecimento desta precisão auxilia na
avaliação dos seus resultados.
O C.V. é calculado da seguinte maneira:

Q Re sd ^ G
C.V .(%)  ^
.100 , em que m 
m N

De acordo com Gomes (2009), na experimentação agrícola (experimentos de campo) o


coeficiente de variação pode ser classificado nas seguintes categorias, com relação a sua
precisão:
C.V.(%) Precisão
< 10% Alta

27
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

10% a 20% Média


20% a 30% Baixa
> 30% Muito Baixa

2.2 – Coeficiente de Determinação (R2)

Por definição, o Coeficiente de Determinação (R2) é a razão entre a soma de quadrado


de tratamento e a soma de quadrado total, isto é:

SQTrat .
R2 
SQTotal

Portanto, o R2 é uma medida da proporção da variação total explicada pela variação


devido aos tratamentos. Como o valor de R 2 varia entre 0 e 1, pode-se interpretá-lo como uma
percentagem.
Ex: R2 = 0,9215 → 92,15% da variação total está sendo explicada pela variação devido
aos tratamentos.

3 – TESTE DE COMPARAÇÃO DE MÉDIAS

Os modelos de Análise de Variância são geralmente utilizados para analisar os efeitos


de um ou mais fatores (variável independente sob estudo) sobre a variável dependente.
O Teste F tem seu emprego na Análise de Variância dos delineamentos experimentais.
Ele é utilizado para comparar variâncias, representando um teste preliminar, cujo resultado
estabelece se será necessária uma detalhada análise dos efeitos dos níveis do fator em estudo.
Se o Teste F leva a conclusão que os efeitos dos níveis do fator são iguais, a
implicação é que não existe nenhuma relação entre o fator e a variável dependente. Todavia,
se o Teste F leva a conclusão que nem todos os níveis do fator tem efeitos idênticos, a
implicação é que existe uma relação entre o fator e a variável dependente.
Em experimentos envolvendo dois ou mais tratamentos (ou níveis do fator) é de
interesse saber onde estão as diferenças no caso em que o Teste F leva a rejeição da hipótese
de igualdade dos efeitos dos tratamentos. Isso pode ser feito pela comparação direta dos
tratamentos (ou níveis do fator) utilizando técnicas de estimação. Neste caso, podem-se
estimar contrastes entre os níveis do fator em estudo e, posteriormente, aplicar um Teste de
Médias.

28
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Existe um grande número de procedimentos para comparações de médias utilizados


posteriormente à Análise de Variância quando o Teste F for significativo. Os testes de médias
são utilizados para identificar os níveis do fator (ou tratamentos) que diferem estatisticamente
entre si. Cada teste está fundamentado em um particular conjunto de suposições que o torna
efetivo para os propósitos específicos.

3.1 – Teste de Tukey

O teste de Tukey, baseado na amplitude total estudentizada, pode ser utilizado para
comparar todo e qualquer contraste entre duas médias de tratamentos. Ou seja, para nI
tratamentos (número de tratamentos ou de níveis do fator em estudo) poderão ser
estabelecidos nI(nI – 1)/2 contrastes do tipo Yij = mi – mj, para i ≠ j.
Este teste baseia-se na diferença mínima significativa (DMS), representada por ∆, dada
por:

∆=q 1^ ^
V (Y)
2
em que:
∆ = é a diferença mínima significativa (DMS);
q = é o valor tabelado da amplitude estudentizada, que é obtido pela expressão:
qα(n1;n2), em que α é o nível de significância; n1 é o número de tratamentos ou níveis do fator
e n2 representa o número de graus de liberdade do resíduo na Análise de Variância.
A estimativa da variância da estimativa do contraste é dada por:

^ ^ 1 1
= QMRes   
V (Y )  ri rj 

Para ri ≠ rj, o cálculo de ∆ é dado pela seguinte fórmula:

29
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

1  1 1
∆=q  QM Re s
2  ri r j 

Para ri = rj = r, o cálculo de ∆ pode ser representado pela expressão:

QM Re s
∆=q
r

Para a realização do Teste de Tukey é necessário:


a) Enunciar as hipóteses:
H0: mi = mj
H1: mi ≠ mj , para i ≠ j

b) Obter as estimativas dos contrastes: ^ ^ ^ , com base nos valores amostrais;

Y ij  mi  m j
c) Calcular a diferença mínima significativa (∆);
d) Concluir a respeito da significância dos nI(nI – 1)/2 contrastes em teste, utilizando a
seguinte relação:

^
 Y   , rejeita-se H ;
Se ij 0

^
 Y   , não rejeita-se H
Se ij 0.

Neste caso, a conclusão será: “As médias seguidas por pelo menos uma mesma letra
não diferem entre si ao nível “α” de probabilidade pelo Teste de Tukey”.

4 – DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC)

O Delineamento em Blocos Casualizados (DBC) constitui no delineamento estatístico


mais utilizado na pesquisa agronômica, devido a sua simplicidade, flexibilidade e alta
precisão. Ele é utilizado quando as condições experimentais não são completamente

30
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

homogêneas. Nesta situação, devemos subdividir a área ou o material experimental em blocos


(ou grupos), de modo que exista homogeneidade dentro de cada bloco e que ele contenha uma
repetição de cada tratamento, distribuído dentro de cada bloco inteiramente ao acaso.
Os experimentos em blocos casualizados levam em consideração os três princípios
básicos da experimentação: repetição, casualização e controle local. No controle local faz-se a
divisão do local ou material experimental em subgrupos ou blocos, de tal forma que se tenha
garantido a uniformidade dentro de cada bloco.
Em experimentos de campo deve-se subdividir a área em blocos de maneira que se
tenha homogeneidade dentro deles, por exemplo: com relação à declividade do solo; a
fertilidade do solo; a incidência de luz solar; etc. Em experimentos zootécnicos deve-se
subdividir os animais em blocos de tal forma que cada bloco possa ser homogêneo dentro de
si, por exemplo: com relação a idade; peso; raça; etc.
Em experimentos instalados segundo o DBC, não importa que as condições
experimentais de um bloco sejam diferentes das condições experimentais do outro bloco. O
importante é a homogeneidade dentro de cada bloco.

4.1 – Vantagens e Desvantagens do DBC

4.1.1 – Vantagens

 Se o controle local se fizer necessário, esse delineamento é mais eficiente que o


inteiramente casualizado (DIC), pois a formação dos blocos isola as variações
controláveis (sistemática) que causam a heterogeneidade, diminuindo sensivelmente a
variação ao acaso (aleatória ou erro experimental);
 O delineamento não tem restrições de uso, seja com relação ao número de tratamentos
(Delineamento em Quadrado Latino – DQL), seja por exigir uniformidade nas
condições experimentais (DIC).

4.1.2 – Desvantagens

 O delineamento perde eficiência quando o controle local for dispensável, uma vez que
o número de graus de liberdade do resíduo será menor ao que se obteria caso o
delineamento utilizado fosse o inteiramente casualizado;

31
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

 Esse delineamento exige que todos os tratamentos tenham o mesmo número de


repetições. Logo, quando há perda de parcela a soma de quadrado para tratamento
(SQTrat.) é apenas aproximada.

4.2 – Quadro de tabulação dos dados

Considere um experimento instalado no DBC, com I tratamentos e J repetições


(blocos). A coleta de dados da pesquisa pode ser resumida no quadro a seguir:

Tratamentos
Blocos 1 2 ..... I Totais
1 Y11 Y21 ..... YI1 B1
2 Y12 Y22 ..... YI2 B2
..... ..... ..... ..... ..... .....
J Y1J Y2J ..... YIJ BJ
Totais T1 T2 ..... TI G

Deste quadro podem-se retirar as seguintes informações:

 Nº de unidades experimentais: N = I x J
I ,J I

 Total geral: G =  ij
Y   Ti = B
J

i 1 i 1
 j j 1
j 1

 Total para o tratamento I: Ti = Y


j 1
ij

I
 Total para o bloco J: Bj = Y i 1
ij

^
Ti
mi
 Média para o tratamento I: = J

^ Bj

 Média para o bloco J:


mj =
I

^
G
 Média geral do experimento: m= IJ

32
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

4.3 – Análise de Variância (ANOVA)

Para analisar os dados obtidos no delineamento em blocos casualizados deve-se


decompor a variação total, que existe entre todas as observações, na variação devido à
diferença entre os efeitos de blocos, na variação devido à diferença entre os efeitos de
tratamentos e na variação devido ao acaso, que também é denominada de erro experimental
ou resíduo.
Neste tipo de delineamento a decomposição é feita da seguinte forma:

I ,J

I ,J
( Y ij )2
SQTotal =
Y
i 1, j 1
2
ij 
i 1 IJ
j 1

I ,J

SQTrat. = I
Ti2
( Y ij )2

i 1, j 1

i 1 J IJ

I ,J

SQBloco = J B 2j
( Y ij )2

i 1, j 1

j 1 I IJ

SQResíduo = SQTotal – SQTratamento – SQBloco

O quadro da Análise de Variância (ANOVA) para um experimento instalado no DBC


é dado a seguir:
FV GL SQ QM F
Blocos (J – 1) SQBlocos - -
Tratamentos (I – 1) SQTrat. SQTrat QMTrat
I 1 QM Re s
Resíduo (I – 1)(J – 1) SQRes. SQ Re s
( I  1)( J  1)
Total (IJ – 1) SQTotal - -

As hipóteses para o Teste F da Análise de Variância são as seguintes:

 H0: m1 = m2 = ... = mI = m
 H1: não H0

33
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Ou,

 Todos os possíveis contrastes entre as médias dos tratamentos são estatisticamente


nulos ao nível “α” de probabilidade/significância;
 Existe pelo menos um contraste entre as médias dos tratamentos estatisticamente
diferente de zero ao nível “α” de probabilidade/significância.
Por fim chega-se a tomada de decisão:

 Se Fcal ≥ Ftab → Rejeita-se H0


 Se Fcal < Ftab → Não Rejeita-se H0

5 – DELINEAMENTO EM QUADRADO LATINO (DQL)

Os delineamentos em quadrado latino, assim como os blocos casualizados, consideram


os princípios da repetição, casualização e controle local. Neste delineamento o controle é
efetuado em duas direções: blocos horizontais (linhas) e blocos verticais (colunas). Entretanto,
os delineamentos em quadrado latino são menos usuais na experimentação agrícola, em
analogia aos blocos casualizados.
O Delineamento em Quadrado Latino (DQL) é mais utilizado nas pesquisas em que
duas fontes principais de variação estão presentes e precisam ser controladas, sendo sua
aplicação mais comum na experimentação animal. A sua configuração é constituída de linhas
e colunas, cada qual estruturado como um bloco. Assim, em caso de I tratamentos, o número
total de parcelas é I2. No DQL cada tratamento está representado uma única vez em cada linha
e em cada coluna. Logo, o DQL é utilizado quando podemos observar duas fontes de
variabilidade nas unidades experimentais.
Vejamos alguns exemplos ilustrativos nos quais o seu emprego é recomendado:
Exemplo 1 – Em um laboratório devem ser comparados cinco métodos de análise (A,
B, C, D, E), programados em cinco dias úteis e, em cada dia, é feita uma análise a cada hora,
totalizando um período de cinco horas.
O quadrado latino assegura que todos os métodos sejam processados uma única vez
em cada período e em cada dia. O quadro abaixo ilustra a configuração a ser adotada.

34
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Dias
Períodos 1 2 3 4 5
1 A E C D B
2 C B E A D
3 D C A B E
4 E D B C A
5 B A D E C

OBS: Note que os níveis de uma fonte formam as linhas e os níveis da outra fonte formam as
colunas.
Exemplo 2 – Em um experimento com suínos pretende-se avaliar quatro tipos de
ração (A, B, C, D), em quatro raças distintas e em quatro idades de animais. Como o interesse
é avaliar os quatro tipos de ração, tomam-se as raças e as idades dos animais como blocos, ou
seja:
Raças
Idades R1 R2 R3 R4
I1 A B D C
I2 B C A D
I3 D A C B
I4 C D B A

5.1 – Características do DQL

 O número total de unidades experimentais necessárias é igual a I2, sendo I o número


de tratamentos;
 Cada tratamento é representado uma única vez, e ao acaso, em cada linha e em cada
coluna;
 O número de tratamento é igual ao número de repetições;
 Este delineamento é aconselhável quando o número de tratamentos oscila entre 3 e 10.
Contudo, para 3 e 4 tratamentos somente quando se puder repetir o experimento em
vários quadrados latinos.

5.2 – Análise de Variância (ANOVA)

Admitindo-se K tratamentos, I linhas e J colunas (I = J = K), o esquema da Análise de


Variância fica conforme o quadro a seguir:
FV GL SQ QM F
Linhas (I – 1) SQLinhas -

35
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Colunas (J – 1) SQColunas - -
Tratamentos (K – 1) SQTratamentos QMTrat. QMTrat
Resíduo (K – 1)(K – 2) SQResíduo QMRes. QM Re s
Total (K2 – 1) SQTotal - -

Considerando:
LI = Total da linha i;
CJ = Total da coluna j;
TK = Total do tratamento k;
G = Total geral.
As somas de quadrados são dadas por:
I ,J

SQTotal = 
I ,J
Y 2
ij C
→ C=
( Y
i 1, j 1
ij )2
G2 G2
i 1
j 1   2
IJ IJ I
1 I 2
SQLinhas =  Li  C
I i 1
1 J 2
SQColunas = C j  C
I j 1

1 K 2
SQTratamentos =  Tk  C
I k 1

SQResíduo = SQTotal – SQLinhas – SQColunas – SQTratamentos

As hipóteses para o Teste F da Análise de Variância, bem como a tomada de decisão,


seguem os mesmos princípios já mencionados para os delineamentos anteriores (DIC e DBC).

Hipóteses:
 H0: m1 = m2 = ... = mI = m
 H1: não H0
Ou,
 Todos os possíveis contrastes entre as médias dos tratamentos são estatisticamente
nulos ao nível “α” de probabilidade/significância;

36
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

 Existe pelo menos um contraste entre as médias dos tratamentos estatisticamente


diferente de zero ao nível “α” de probabilidade/significância.

Tomada de decisão:
 Se Fcal ≥ Ftab → Rejeita-se H0
 Se Fcal < Ftab → Não Rejeita-se H0
EXERCÍCIOS PROPOSTOS

1 – Para comparar o crescimento de mudas de quatro espécies de eucalipto um pesquisador


tomou 20 parcelas similares e distribuiu, inteiramente ao acaso, cada uma das quatro espécies
em cinco parcelas experimentais. A partir dos dados fornecidos abaixo, é possível concluir
que existe diferença significativa entre as espécies com relação ao crescimento das mudas?
Utilizar o nível de significância de 5%.

Espécies
A B C D
25 31 22 33
26 25 26 29
20 28 28 31
23 27 25 34
21 24 29 28
Totais 115 135 130 155

2 – Considere as seguintes produções diárias (kg) de leite a 4% de gordura de vacas em


lactação submetidas à administração de raízes e tubérculos como suplementação de inverno
na alimentação.

Sem Suplementação Mandioca Araruta Batata Doce


19,58 23,40 35,42 22,15
21,07 22,37 32,47 24,37
23,43 24,36 34,48 26,54
25,42 25,12 33,79 20,37
22,81 22,94 35,04 19,54
23,54 - 35,19 24,06

a) Ao nível de 5% de significância, concluir a respeito das suplementações utilizadas;


b) Obter o Coeficiente de Variação;
c) Obter o Coeficiente de Determinação, interpretando-o.

3 – Foi montado um experimento no DIC com o objetivo de verificar qual meio de cultura (A,
B, C e D) propicia maior crescimento de colônias bacterianas. O número de colônias
bacterianas, 48 horas após a inoculação, é fornecido abaixo:

Meio de Cultura Nº. de Colônias Bacterianas Totais

37
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

A - 19 31 15 30 95
B 40 35 46 41 33 195
C 39 27 20 29 45 160
D 27 12 13 28 30 110

Considerando o nível de significância de 5%, pede-se:


a) Proceder a ANOVA;
b) Comparar as médias pelo Teste de Tukey.
4 – Aplicar o Teste de Tukey as comparações múltiplas obtidas com as médias dos
tratamentos. O experimento foi conduzido utilizando o Delineamento Inteiramente
Casualizado (DIC). Concluir para o nível de 1% de significância.

ˆ 1  230,6 ; m
m ˆ 2  217,2 ; m ˆ 4  209,9 ; m
ˆ 3  204,9 ; m ˆ 5  188,3
r1 = r2 = r3 = 4 ; r4 = r5 = 3
SQResd. = 438,8631

5 – Com a finalidade de aumentar a produção de lã de suas ovelhas, por meio de uma


alimentação mais apropriada, um criador separou 28 ovelhas de sua criação. Como eram de
idades diferentes elas foram divididas em sete grupos, de modo que dentro de cada grupo
existiam quatro ovelhas com idade similar e homogeneidade para as demais características.
Em cada grupo foi realizado um sorteio para distribuir inteiramente ao acaso quatro tipos de
alimentação. O experimento iniciou-se no momento de se realizar uma nova tosquia, obtendo
os seguintes resultados expressos em unidades de medidas de lã por animal:

Grupos
Alimentação 1 2 3 4 5 6 7 Totais
1 30 32 33 34 29 30 33 221
2 29 31 34 31 33 33 29 220
3 43 47 46 47 48 44 47 322
4 23 25 21 19 20 21 22 151
Totais 125 135 134 131 130 128 131 914

Avaliar os tipos de alimentação. Adotar α = 1%.

6 – Com os resultados apresentados a seguir, resultantes de um experimento conduzido no


Delineamento em Quadrado Latino (DQL), pede-se: (α = 5%)

Dias
Períodos 1 2 3 4 5 Totais
1 40,8 (A) 57,3 (E) 61,8 (C) 38,5 (D) 50,6 (B) 249,1
2 66,3 (C) 46,5 (B) 54,8 (E) 38,7 (A) 30,2 (D) 236,5
3 33,4 (D) 70,6 (C) 53,2 (A) 41,7 (B) 50,1 (E) 249,0
4 60,2 (E) 35,6 (D) 54,2 (B) 64,0 (C) 45,3 (A) 259,3
5 51,7 (B) 48,7 (A) 29,8 (D) 55,3 (E) 55,7 (C) 251,2
Totais 252,4 258,7 253,8 238,3 241,9 1.245,1

a) ANOVA;

38
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

b) Teste de Tukey.

CONTEÚDO VI

EXPERIMENTOS FATORIAIS

1 – INTRODUÇÃO

Os Experimentos Fatoriais são aqueles em que se estudam dois ou mais fatores


simultaneamente, cada qual com dois ou mais níveis. O experimento fatorial é um tipo de
esquema, ou seja, uma maneira de organizar os tratamentos, não constituindo um tipo de
delineamento.
Os experimentos fatoriais são montados seguindo determinado tipo de delineamento
(DIC, DBC ou DQL). Neles, os tratamentos são obtidos pelas combinações dos níveis dos
fatores. Cada nível de um fator combina com todos os níveis dos outros fatores.
Exemplo:
 Fator A → A1 ; A2 ; A3 ; A4 (quatro níveis)
 Fator B → B1 ; B2 ; B3 (três níveis)
A combinação dos níveis entre os Fatores A e B totalizam 12 tratamentos (4Ai x 3Bj).
O objetivo da aplicação dos experimentos fatoriais é avaliar o efeito/influência de
diversos fatores sobre a variável em estudo, bem como o relacionamento entre os fatores
sobre a variável resposta.
A simbologia comumente utilizada é indicar o produto dos níveis dos fatores em teste.
Exemplo: o experimento fatorial (2 x 4 x 6) informa que foram testados três fatores
simultaneamente. O primeiro com dois níveis, o segundo com quatro níveis e o terceiro com
seis níveis. Quando o número de níveis é igual para todos os fatores pode-se utilizar a
seguinte simbologia: nF, em que: F é o número de fatores e n é o número de níveis de cada
fator. Exemplo: 43 → indica que no experimento fatorial foram testados três fatores com
quatro níveis cada (4 x 4 x 4).

39
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2 – VANTAGEM E DESVANTAGEM DO EXPERIMENTO FATORIAL

2.1 – VANTAGEM
 Permite o estudo dos efeitos principais dos fatores e a interação entre fatores;

2.2 – DESVANTAGEM
 Requer maior número de unidades experimentais em comparação aos experimentos
simples.

3 – EFEITOS AVALIADOS EM UM EXPERIMENTO FATORIAL

Nos experimentos fatoriais podem ser estudados os seguintes efeitos:

 Efeito Principal: é o efeito de cada fator, independente do efeito dos outros fatores;
 Efeito da Interação: é o efeito simultâneo dos fatores à variável em estudo. Ocorre
interação entre os fatores quando os efeitos dos níveis de um fator são modificados
pelos efeitos dos níveis de outros fatores.

4 – QUADRO DE TABULAÇÃO DOS DADOS

Uma maneira de tabular os dados de um experimento fatorial com dois fatores A e B,


com i e j níveis, respectivamente, instalados segundo o DIC com k repetições, é fornecida
abaixo:
A1 A2 ... AI
B1 B2 ... BJ B1 B2 ... BJ ... B1 B2 ... BJ
Y111 Y121 ... Y1J1 Y211 Y221 ... Y2J1 ... YI11 YI21 ... YIJ1
Y112 Y122 ... Y1J2 ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ... ... ... ...
Y11K Y12K ... Y1JK Y21K Y22K ... Y2JK ... YI1K YI2K ... YIJK
A1B1 A1B2 ... A1BJ A2B1 A2B2 ... A2BJ ... AIB1 AIB2 ... AIBJ

K
 Total do ij-ésimo tratamento : (AB)ij = Y
k 1
ijk

K ;J

 Total do i-ésimo nível do fator A: Ai =  Y k 1


ijk

j 1

40
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

K ;I

 Total do j-ésimo nível do fator B: Bj =  Y k 1


ijk

i 1

K ; J ;I

 Total geral: G =
Y k 1
ijk

j 1
i 1

^ Ai
 Média do i-ésimo nível do fator A: m Ai 
JK
^ Bj
 Média do j-ésimo nível do fator B: m Bj 
IK
^ G
 Média geral: m
IJK

A tabulação dos dados fornecida acima pode ser resumida no quadro a seguir:
Bj \ A i A1 A2 ... AI Total
B1 A1B1 A2B1 ... AIB1 B1
B2 A1B2 A2B2 ... AIB2 B2
... ... ... ... ... ...
BJ A1BJ A2BJ ... AIBJ BJ
Total A1 A2 ... AI G

5 – ANÁLISE DE VARIÂNCIA

A Análise de Variância de um experimento fatorial é feita desdobrando-se a soma de


quadrados de tratamentos (SQTrat.) nas partes devido aos efeitos principais de cada fator e na
parte devido à interação entre os fatores.
O quadro abaixo representa a ANOVA de um experimento fatorial com dois fatores A e
B, com i e j níveis, respectivamente, e com k repetições, instalado segundo o DIC.
FV GL SQ QM F
Fator A (I – 1) SQA QMA QMA
QM Re s
Fator B (J – 1) SQB QMB QMB
QM Re s
Interação (AxB) (I – 1)(J – 1) SQ(AxB) QM(AxB) QMAxB
QM Re s
Tratamento (IJ – 1) SQTrat.(AB) - -
Resíduo (IJ)(K – 1) SQResíduo QMRes.

41
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Total (IJK – 1) SQTotal - -

I ,J ,K
G2
SQTotal =

i 1
Y  2
ijk
IJK
j 1
k 1

1 I ,J G2
SQTrat(AB) = K  i j 
2
( A B )
i 1 IJK
j 1

1 I
G2
SQA =
JK

i 1
A  i
2

IJK

1 J
G2
SQB =
IK
B
j 1
2
j 
IJK

SQ(AxB) = SQTrat(AB) – SQA – SQB

SQResíduo = SQTotal – SQTrat(AB)


ou
SQResíduo = SQTotal – SQA – SQB – SQ(AxB)
As hipóteses estatísticas para o Teste F da análise de variância devem ser lançadas
para cada um dos efeitos principais, como também para a interação. As hipóteses serão assim
enunciadas:

 Efeitos Principais

Fator A:
H0: mA1 = mA2 = ... = mAI = m
H1: Não H0
Ou,
H0: Todos os possíveis contrastes entre as médias dos níveis do fator A são estatisticamente
nulos ao nível de α% de probabilidade;
H1: Existe pelo menos um contraste entre as médias dos níveis do fator A estatisticamente
diferente de zero ao nível de α% de probabilidade.

Fator B:

42
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

H0: mB1 = mB2 = ... = mBJ = m


H1: Não H0
Ou,
H0: Todos os possíveis contrastes entre as médias dos níveis do fator B são estatisticamente
nulos ao nível de α% de probabilidade;
H1: Existe pelo menos um contraste entre as médias dos níveis do fator B estatisticamente
diferente de zero ao nível de α% de probabilidade.

 Efeito da Interação

H0: Os fatores atuam independentemente;


H1: Os fatores não atuam independentemente.

Os valores de Fcal obtidos na análise de variância para cada uma das fontes de variação
em teste (efeitos principais e efeito da interação) devem ser comparados com os valores de
Ftab apropriados, os quais serão obtidos na tabela para valores de F, de acordo com o nível de
significância (α) desejado, graus de liberdade da fonte de variação em teste (n1) e o grau de
liberdade do resíduo (n2).
A Tomada de Decisão deve ser feita inicialmente para a interação. Se Fcal ≥ Ftab → A
decisão é Rejeitar H0 ao nível de significância em que foi executado o teste. Caso contrário
(Fcal < Ftab) → Não Rejeita H0.
A Não Rejeição de H0 para a interação implica que os fatores atuam
independentemente. Assim, devem-se estudar os fatores isoladamente. Neste caso, observa-se
o resultado do teste F para cada fator e, caso ele seja significativo, aplica-se um teste de média
para comparar os níveis do fator.
A Rejeição de H0 para a interação implica que os fatores não atuam
independentemente. Assim, não se devem estudar os fatores isoladamente. Neste caso, deve-
se proceder a uma nova análise estatística de cada fator dentro dos níveis do (s) outro (s) fator
(es).

EXERCÍCIO PROPOSTO

1 – Considere um Experimento Fatorial com dois fatores: Variedade de Sorgo com três níveis
e Adubação Nitrogenada com quatro níveis. Ele foi instalado utilizando o DBC, com três
repetições (blocos). Os dados, para os totais de produção, são apresentados a seguir:

43
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Adubação Nitrogenada
Variedade de 1 2 3 4 Totais
Sorgo
1 25,4 27,8 29,6 31,4 114,2
2 23,1 25,0 27,2 29,6 104,9
3 20,5 22,8 24,8 26,8 94,9
Totais 69,0 75,6 81,6 87,8 314,0
Dados: SQResd. = 36,2780 e α = 5%

Pede-se:
a) ANOVA;
b) Teste de Tukey.
CONTEÚDO VII

REGRESSÃO LINEAR

1 – INTRODUÇÃO

A Análise de Regressão consiste na realização de uma análise estatística com o


objetivo de verificar a existência de uma relação funcional entre variáveis dependente e
independente.
A expressão Análise de Regressão Simples indica que a predição da variável
dependente é feita por uma única variável independente, enquanto a Análise de Regressão
Múltipla diz respeito à predição da variável dependente com base em duas ou mais variáveis
independentes.
Na análise de regressão obtém-se uma equação que tenta explicar a variação da
variável dependente pela variação dos níveis da (s) variável (is) independente (s). As variáveis
independentes são classificadas como quantitativas, cujos níveis representam diferentes
quantidades de um mesmo fator.

2 – ANÁLISE DE REGRESSÃO

Para tentar estabelecer uma equação que representa o fenômeno em estudo pode-se
plotar (desenhar) um Diagrama de Dispersão para verificar como se comporta os valores da
variável dependente (Y) em função da variação dos níveis da variável independente (X). O
diagrama de dispersão é um gráfico no qual cada ponto plotado representa um par observado

44
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

de valores para as variáveis dependente e independente. O valor da variável independente X é


plotado no eixo horizontal, enquanto o valor da variável dependente Y no eixo vertical.
O comportamento de Y em relação a X pode-se apresentar de diversas maneiras:
linear, quadrático, exponencial, etc. Para estabelecer o modelo apropriado para explicar o
fenômeno, deve-se verificar qual o tipo de curva e equação de um modelo matemático que
mais se aproxima dos pontos plotados no diagrama de dispersão.
Contudo, pode-se observar que os pontos do diagrama de dispersão não se ajustarão
perfeitamente ao modelo matemático proposto. Existirá, na maioria dos pontos, uma distância
entre os pontos do diagrama e os pontos do modelo matemático. Isto é devido ao fato do
fenômeno em estudo não ser um fenômeno matemático e sim um fenômeno sujeito a
influências que acontecem ao acaso. Desta forma, o objetivo da regressão é obter um modelo
matemático que melhor se ajuste aos valores observados de Y em função da variação dos
níveis da variável X.

2.1 – Método e Estimação dos Parâmetros do Modelo de Regressão Linear

Um método adequado para estimar a equação de regressão linear simples entre duas
variáveis X e Y será aquele que minimize as distâncias entre os pontos do diagrama de
dispersão e do modelo matemático. Este método é denominado de Método dos Mínimos
Quadrados (MMQ). Nele, a soma dos quadrados das distâncias entre os pontos do diagrama
de dispersão e os respectivos pontos na curva da equação estimada é minimizada, obtendo
assim uma relação funcional entre X e Y com o mínimo de erro possível, de acordo com o
modelo escolhido.
Seja o modelo estatístico da Regressão Linear Simples (1º grau):

Yi = β0 + β1Xi + ei

em que:
Yi → é o valor observado para a variável dependente Y no i’ésimo nível da variável
independente X;
β0 → é a Constante de Regressão. Representa o intercepto da reta com o eixo Y;
β1 → é o Coeficiente de Regressão. Representa a variação de Y em função da variação de uma
unidade da variável X;
Xi → é o i’ésimo nível da variável independente X (i = 1, 2, 3, ..., n);

45
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

ei → é o erro associado a distância entre o valor observado Yi e o seu respectivo


correspondente na curva do modelo proposto (valor estimado).

Os estimadores de β0 e β1 são obtidos pelo MMQ, minimizando a soma de quadrados


dos erros, por meio de derivações. As fórmulas pelas quais se estimam os valores de β0 e β1
são:

^ ^
 0  Y  1 X
 X Y
 XY  n  X Y
^ Cov ( X , Y ) n 1
 XY  n  SPXY
1   
Var. X  X  2
 X 2 SQDX
X 2

n
X 2

n
n 1

Uma vez obtida as estimativas de β0 e β1, podemos escrever a equação estimada de


regressão linear simples (1º grau) da seguinte maneira:

^^^
Y   0  1 X i
2.2 – Análise de Variância da Regressão

A obtenção da equação estimada apenas estabelece uma relação funcional entre a


variável dependente e a variável independente para o fenômeno em estudo. A simples
obtenção da equação estimada não responde ao pesquisador se a variação dos níveis da
variável independente (X) influencia significativamente a variável dependente (Y).
Para solucionar esta indagação é necessário realizar um teste estatístico para a

^
estimativa do coeficiente de regressão (  ). Um teste que pode ser realizado para verificar
1

tal fato é o Teste F da Análise de Variância.

46
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

O quadro para Análise de Variância da Regressão fica assim estabelecido:


FV GL SQ QM F
Regressão p SQRegressão SQ Re gres. QM Re gres.
p QM Re sd .
Resíduo da n–1–p SQResíduo SQ Re sd .
Regressão n 1 p
Total n–1 SQTotal - -

em que:
 p → é o número de Coeficientes de Regressão (não inclui o β0);
 n → é o número de observações ou níveis;
n

n
( Yi ) 2
SQTotal =
Y
i 1
i
2
 i 1

 SPXY 
2 ^
SQRegressão =  1 (SPXY )
SQD X
SQResíduo = SQTotal – SQRegressão

As hipóteses estatísticas para o Teste F são as seguintes:

 H0: β1 = 0; O que equivale a dizer que a variável independente não exerce influência
na variável dependente, de acordo com o modelo proposto;
 H1: β1 ≠ 0; O que equivale a dizer que a variável independente exerce influência na
variável dependente, de acordo com o modelo proposto.

Considerando Fα (p ; n – 1 – p), a regra decisória para o Teste F é a seguinte:

 Se o valor do F calculado for maior ou igual ao valor do F tabelado, então Rejeita H0


ao nível α% de probabilidade. Pode-se inferir que o modelo proposto é adequado para
descrever o fenômeno.
 Se o valor do F calculado for menor que o valor do F tabelado, então Não Rejeita H0
ao nível α% de probabilidade. Infere-se que o modelo proposto não é adequado para
descrever o fenômeno.

2.3 – Coeficiente de Determinação

47
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

O Coeficiente de Determinação, denominado R2 (Regressão Linear Múltipla) ou r2


(Regressão Linear Simples), fornece uma informação auxiliar ao resultado da análise de
variância da regressão, verificando se o modelo proposto é adequado ou não para descrever o
fenômeno.

SQ Re gressão SPXY  2
2
R =r = 2

SQTotal SQD X .SQDY

O valor do coeficiente de determinação varia no intervalo de 0 a 1. Valores próximos


de 1 indicam que o modelo proposto é adequado para descrever o fenômeno. Ele representa a
percentagem da variação total (Y – variável dependente) que é explicada pela equação de
regressão (X – variável independente).
2.4 – Gráfico da Equação de Regressão Estimada

O Gráfico da Equação de Regressão Estimada pode ser obtido atribuindo valores para
a variável independente e, consequentemente, obtendo os respectivos valores estimados para a
variável dependente. Esses pares de valores são plotados nos respectivos eixos X e Y, obtendo
assim o gráfico da equação de regressão estimada.
A distância dos pontos observados no experimento em relação ao gráfico (curva ou
reta) da equação de regressão estimada também é uma indicação da adequação ou não do
modelo de regressão proposto para descrever o fenômeno.

EXERCÍCIOS PROPOSTOS

1 – De acordo com os dados fornecidos abaixo para a variável X (dose de Zn em ppm) e para a
variável Y (MS(g)/planta), pede-se:

a) Obter a equação de regressão de 1º grau;


b) Verificar se o modelo de regressão linear de 1º grau é adequado para descrever a
relação entre as variáveis. Utilize os métodos vistos em sala de aula: i) ANOVA; ii)
Coeficiente de Determinação; iii) Gráfico da Equação de Regressão Estimada. (α =
5%).

X 1,0 2,5 4,0 5,5 7,0 8,5


Y 20,3 26,3 29,6 31,1 32,2 34,7

48
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2 – Um laboratório está interessado em medir o efeito da temperatura sobre a potência de um


antibiótico. Sete amostras foram guardadas em diferentes temperaturas (ºC) e após 15 dias
mediu-se a potência. Os resultados estão no quadro abaixo:

Temperatura (ºC) 20 30 40 50 60 70 80
Potência 43 41 34 30 26 23 18

a) Estime a equação de regressão de 1º grau;


b) Proceder a ANOVA (α = 5%);
c) A que temperatura (ºC) a potência do antibiótico seria nula?

VIII – LISTAS DE EXERCÍCIOS

CONTEÚDO I – Distribuição Amostral e Intervalo de Confiança

1 – O peso dos ovos de determinada linhagem de ave de postura tem distribuição normal, com
média de 65 gramas e desvio padrão de cinco gramas. Considere uma amostra aleatória de
uma dúzia (caixa) desses ovos. Qual a probabilidade de que o peso dessa caixa esteja
compreendido entre o intervalo de 750 e 825 gramas?

2 – Para avaliar a precisão de uma balança de laboratório, pesa-se repetidas vezes um objeto
padrão de peso conhecido igual a 10 gramas. As leituras da balança tem distribuição normal.
Sabe-se que o desvio padrão das leituras é 0,0002 gramas. Pesa-se o objeto cinco vezes e o
resultado médio é 10,0023 gramas.
Estabeleça um intervalo de 95% de confiança para a média de repetidas pesagens do
objeto;
Quantas pesagens ou medidas devem entrar no cálculo da média a fim de que se obtenha
uma margem de  0,0001 de erro com 95% de confiança?

3 – Uma agência de propaganda, que atende a uma das principais estações de rádio, gostaria
de calcular a quantidade média de tempo que a audiência gasta diariamente ouvindo radio. A
partir de estudos anteriores, o desvio padrão é calculado em 45 minutos.
Que tamanho de amostra é necessário se a agência quiser ter 90% de confiança de estar
correta em um intervalo de ± 5 minutos?
Se for desejado um nível de 99% de confiança, que tamanho de amostra é necessário para
o mesmo intervalo da alínea anterior (± 5 minutos)?
Faça inferências a respeito dos tamanhos das amostras encontrados nas alíneas anteriores
(a e b), explicando o motivo de ter encontrado dimensões distintas.

49
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

4 – O tempo de reação de um novo medicamento pode ser considerado como tendo


distribuição normal. Deseja-se fazer inferência sobre a média que é desconhecida por meio de
um intervalo de confiança. Vinte pacientes foram sorteados ao acaso e tiveram seu tempo de
reação anotado. Os dados foram os seguintes (em minutos):

2,9 3,4 3,5 4,1 4,6 4,7 4,5 3,8 5,3 4,9
4,8 5,7 5,8 5,0 3,4 5,9 6,3 4,6 5,5 6,2

a) Obter um intervalo de 95% de confiança para a média do tempo de reação;


b) Obter um intervalo de 99% de confiança para a média do tempo de reação;
c) Estabelecer a amplitude (comprimento) para cada intervalo de confiança obtido nas
alíneas anteriores (a e b). Faça inferências pertinentes ao comprimento.

5 – Estudos anteriores levam a supor que crianças de dois meses alimentadas exclusivamente
com leite do tipo A sofrem um aumento de peso que segue distribuição normal, com média
desconhecida, porém de variância 9.000 gramas 2. Escolhe-se ao acaso 20 crianças de dois
meses, alimentando-as exclusivamente com leite do tipo A. Nesta amostra o aumento de peso
médio foi de 475 gramas. Obtenha um intervalo de 99% de confiança para o aumento médio
do peso das crianças nas condições apresentadas.

6 – O consumo mensal de calorias (kcal/g) de certa espécie de esquilos segue distribuição


normal com desvio padrão 0,16. Recolheu-se uma amostra aleatória de dimensão 18 cuja
média amostral foi de 0,41.
a) Obtenha um intervalo de confiança a 95% para o consumo médio de calorias;
b) Qual deve ser a dimensão da amostra para que um intervalo de confiança a 95% para a
média tenha amplitude 0,2?

7 – Um conjunto, composto por 12 animais em experiência, foi alimentado com uma dieta
especial durante determinado tempo e verificou-se que os ganhos de peso (em kg) foram de:
25 – 22 – 30 – 26 – 24 – 39 – 32 – 26 – 32 – 33 – 28 – 30. Encontrar os limites de confiança
para a média ao nível de 90% de probabilidade.

8 – Qual deve ser a dimensão da amostra a recolher de uma população normal de valor médio
μ e desvio padrão 10 de modo que o intervalo de confiança para μ a 99% tenha amplitude 1?

9 – Considere que o comprimento dos corpos de uma espécie de camarão de água doce
apresente distribuição normal. Uma amostra de 60 camarões apresentou uma média de 5,315
cm e desvio padrão 0,8293 cm.
a) Determine um intervalo de confiança a 99% para a média da população;
b) Qual o erro padrão associado à média da amostra?

50
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

10 – A altura (em mm) da espuma de sabão em uma bacia é importante para os fabricantes de
detergentes e supõe-se que sua distribuição é normal. Foi efetuada uma experiência colocando
a mesma quantidade de detergente em 10 bacias de tamanho padrão e, depois de certa
agitação da água, mediu-se a altura da espuma. Obtiveram-se os seguintes resultados:

 x 
10 10

 xi  229
2
; i x  1.553
i 1 i 1
a) Determine uma estimativa pontual para a média e para o desvio padrão;
b) Determine um intervalo a 99% de confiança para a média;
c) Comente os dois tipos de estimativa obtidos (nas alíneas anteriores) para a média.

CONTEÚDO II – Testes de Hipóteses

1 – Um experimentador deseja testar o efeito de certo fertilizante na produção de milho. Para


realizar o experimento tinha-se 12 unidades experimentais de áreas iguais, onde 7 receberam
o fertilizante e as outras não. As demais condições foram mantidas iguais. As produções em
kg/unidade experimental foram as seguintes:

c/ fertilizante 25 35 45 30 20 25 30
s/ fertilizante 35 25 20 15 30

De posse dos dados acima, pode o experimentador concluir que há aumento de


produção de milho por causa do fertilizante, com nível de significância igual a 5%?

2 – Desejando comparar os efeitos de dois analgésicos, A e B, em termos do tempo de ação sobre


pacientes com certa doença, ambos foram aplicados a 14 doentes, em dias diferentes, sendo que 7
pacientes receberam primeiro o A, e os outros 7 primeiro o B. A situação foi controlada de forma a
não haver interferência do efeito de um sobre o outro. Os resultados (em minutos) foram:
Pacient 1 2 3 4 5 6 7 8 9 10 11 12 13 14
e
A 362 345 356 370 360 365 345 363 358 332 335 370 335 362
B 320 330 315 325 323 328 318 322 320 310 308 332 307 325

Testar a hipótese de diferença nula entre as médias populacionais, ao nível de


significância de 1%.

3 – Considere uma amostra de 10 leitões da raça Large White. Aos 21 dias de idade foram
feitas medições dos seus pesos (kg), fornecendo os seguintes dados:

51
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Leitões 1 2 3 4 5 6 7 8 9 10
Peso (kg) 5,0 5,2 5,4 4,8 5,1 4,9 5,0 5,2 5,5 5,6

Pode-se concluir, ao nível de 5% de probabilidade, que o peso médio aos 21 dias de


idade dos leitões não difere de 5,0 kg?

4 – Determinada cultura apresenta uma produtividade média de 10,8 t/ha. Um


experimentador, desejando aumentar a produtividade média, introduziu um novo tratamento à
cultura. Uma amostra de 20 parcelas submetidas ao novo tratamento apresentou uma
produtividade média de 11,50 t/ha e desvio padrão de 1,2 t/ha. Testar H 0 e concluir para α =
5%.

5 – Em um estudo sobre metabolismo de citrato no fígado foram tomadas amostras de sangue


da veia hepática de 10 indivíduos normais e amostra de sangue arterial de outros 10
indivíduos normais, obtendo-se as seguintes determinações de citrato em cada amostra (em
mg/ml):
Veia Hepática 20,2 24,6 18,3 19,0 29,5 12,6 18,2 30,8 22,2 25,4
Sangue Arterial 26,4 32,2 37,8 25,0 28,4 26,2 31,3 35,0 29,7 27,4
Verificar se existe diferença significativa entre o conteúdo médio de citrato do sangue
arterial e da veia hepática, adotando α = 1%.

6 – Modificações foram implementadas na linha de produção de determinado artigo, utilizado


em motores agrícolas, com o objetivo de reduzir a porcentagem de peças defeituosas
produzidas nas diversas máquinas da linha. Considerando os dados abaixo e α = 1%, testar a
hipótese H0 e concluir:

Máquina 1 2 3 4 5 6 7 8
% defeito antes (X) 3,8 4,2 2,3 3,3 3,4 3,1 3,0 2,5
% defeito após (Y) 2,5 4,2 2,5 2,2 2,0 1,8 2,0 2,0

7 – Um nutricionista, desejando comparar dois produtos com relação ao teor de Vitamina C,


retira 10 amostras de cada produto e obtém os teores listados abaixo:

Produto Teores de Vitamina C (mg)


A 20,2 25,3 21,3 27,0 22,0 26,0 20,0 21,2 23,1 29,3
B 27,3 28,4 29,5 27,0 28,0 29,8 30,1 30,5 28,5 29,1

Testar H0 e concluir para α = 5%.

8 – Os dados abaixo referem aos pesos, em gramas, de ratos machos da raça Wistar com 15
dias de idade, segundo a condição normal e submetidos à extirpação do timo aos 4 dias de
idade. Verificar se a timectomização piora o ganho de peso destes animais, usando α = 5%.

Condição Normal 40,3 40,0 39,6 35,2 32,0

52
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Timectomizado 18,6 20,3 23,6 22,2 20,9

9 – Para verificar o efeito da suplementação de alfafa no ganho de peso (kg), considerou-se 8


pares de coelhos, cujos resultados são dados a seguir:

Sem Suplementação 0,32 0,49 0,51 0,45 0,70 0,52 0,35 0,60
Com Suplementação 0,72 0,90 0,67 0,83 0,67 0,93 0,80 0,75

Há evidência que a suplementação aumenta o desempenho, considerando α = 5%?

10 – Para verificar o efeito da suplementação de alfafa no ganho de peso (kg), considerou-se 8


coelhos, cujos resultados são dados a seguir:

Sem Suplementação 0,32 0,49 0,51 0,45 0,70 0,52 0,35 0,60
Com Suplementação 0,72 0,90 0,67 0,83 0,67 0,93 0,80 0,75

Há evidência que a suplementação aumenta o desempenho, considerando α = 5%?


11 – Verificou-se em uma amostra casual de 100 casos de câncer pulmonar que 64 eram de
homens e 36 de mulheres. Ao nível de 5% de significância, pode-se aceitar a hipótese de que
a ocorrência deste tipo de câncer é a mesma para homens e mulheres?

12 – Um touro vermelho e branco é acasalado com 120 vacas de igual genótipo. Nasceram 20
animais vermelhos, 70 vermelhos e brancos e 30 brancos. Testar para α = 5%, se pode aceitar
a proporção de 1:2:1 para as cores (fenótipos) vermelho, vermelho e branco e branco,
respectivamente.

53
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

CONTEÚDO III – Contraste

1 – Considere os dados abaixo relativos aos totais de tratamentos de um experimento


realizado com a finalidade de testar quatro meios de cultura no crescimento bacteriano.

Meios de cultura à base de: Nº de repetições Total (u.c.)


Uréia 5 16,20
Amônio 4 18,00
Nitrato 4 20,40
Fósforo 5 30,00
* Unidades de Colônias (u.c.)

Admitindo o contraste Y = 2m 1 + 3m2 + 2m3 – 7m4, obter a estimativa e sua


interpretação.

2 – Os dados a seguir referem-se a um experimento no qual se testaram quatro tratamentos:

Tratamentos ^ ri

m i
1 25,00 5
2 18,70 5
3 30,40 5
4 27,50 6

Considere os seguintes contrastes:


 Y1 = m1 – m2
 Y2 = m1 + m2 – 2m3
 Y3 = m1 + m2 + m3 – 3m4

54
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

Pede-se:
a) As estimativas dos contrastes Y1, Y2 e Y3;
b) Verificar se os contrastes são ortogonais entre si.

3 – Verificar se os contrastes a seguir são ortogonais, admitindo-se que m 1, m2 e m3 tem,


respectivamente, 5, 3 e 6 repetições.

Y1 = m1 – m2
Y2 = m1 + m2 – 2m3

4 – Por meio dos dados e dos contrastes fornecidos abaixo, obter suas estimativas e verificar
se são ortogonais.
T1 = 67,20 T2 = 63,00 T3 = 40,00 T4 = 105,00
r1 = r2 = 6 r3 = 4 r4 = 5
Y1 = m1 + m2 – m3 – m4
Y2 = m1 – m2

CONTEÚDO V – Delineamentos Experimentais e Teste de Comparação de Médias

1 – Para comparar a produtividade de quatro variedades de milho, tomou-se 20 parcelas


similares e distribuiu, inteiramente ao acaso, cada uma das quatro variedades em cinco
parcelas experimentais. A partir dos dados fornecidos abaixo, é possível concluir que existe
diferença significativa entre as variedades com relação à produtividade, utilizando o nível de
5% de significância.
Variedades
A B C D
25 31 22 33
26 25 26 29
20 28 28 31
23 27 25 34
21 24 29 28
Totais 115 135 130 155

2 – Um treinador de corrida rústica, objetivando melhorar o desempenho de seus atletas,


testou três novas técnicas de preparação. Para tanto trabalhou com um grupo de 15 atletas
completamente homogêneos para características essenciais. A designação das técnicas de
preparação aos atletas foi feita totalmente ao acaso, de tal forma que o número de atletas
avaliados em cada uma das técnicas fosse o mesmo. Os resultados obtidos, após determinado
período de tempo de aprendizado das técnicas pelos atletas, foram os seguintes:

Técnicas de Preparação
Repetições 1 2 3
1 130 125 127
2 129 131 129

55
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

3 128 130 131


4 126 129 128
5 130 127 130
Totais 643 642 645

De acordo com os resultados, pede-se:

a) Quais foram os princípios básicos da experimentação utilizados pelo pesquisador neste


experimento?
b) Qual/quem foi a unidade experimental utilizada nesta pesquisa?
c) É possível concluir que exista diferença entre as técnicas de preparação? (α = 1%)
d) Qual seria a técnica a ser recomendada?

3 – Com o objetivo de diminuir o consumo dos motores à gasolina, determinada indústria


petroquímica testou quatro novas formulações de gasolina, as quais se diferenciavam pelo tipo
de aditivo que era acrescentado à mesma durante o seu processo de fabricação. Para efetuar o
teste, a indústria petroquímica utilizou carros completamente homogêneos para todas as
características. A designação das formulações aos carros foi feita inteiramente ao acaso. Após
os testes de rodagem, os resultados obtidos foram (km/l):

Aditivos a base de:


Ácido Forte Ácido Fraco Base Forte Base Fraca
Médias 14,81 6,56 10,06 10,09
Nº de carros 10 10 10 10
Dado: SQResíduo = 6,0264

Com base nas informações fornecidas, pede-se:

a) Existe diferença entre os quatro tipos de formulações?


b) Estabeleça um contraste entre o grupo à base de formulação ácida contra o grupo à
base de formulação básica. Obtenha a estimativa para este contraste.
c) Estabeleça um contraste para comparar aditivos de formulação ácida. Obtenha a
estimativa para este contraste.
d) Estabeleça um contraste para comparar aditivos de formulação básica. Obtenha a
estimativa para este contraste.

4 – Com a finalidade de comparar o efeito do tempo de pastejo no desempenho de suínos,


foram comparados 16 animais distribuídos em três tempos. Os ganhos de peso (kg) no final
do experimento são dados a seguir:

Tempos Ganhos de Peso (kg)


4h 7,12 6,91 6,80 6,72 6,34 6,45
6h 8,45 8,53 9,02 8,94 8,35 -
8h 6,58 7,04 7,15 7,38 7,23 -

Existe algum tempo de pastejo no qual o ganho de peso médio diferiu dos demais, ao
nível de 5% de significância?

56
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

5 – Dez reprodutores foram separados em dois grupos independentes e alimentados com


rações diferentes, obtendo-se os seguintes ganhos de peso (kg):

Ração A 5,0 6,0 7,0 4,0 3,0


Ração B 8,0 9,0 6,0 7,0 10,0

Verifique se as rações influenciam no ganho de peso, ao nível de 5% de significância,


utilizando a análise de variância para experimentos inteiramente casualizados. Concluir a
respeito das duas rações fornecidas.

6 – Com o objetivo de avaliar a utilização de farelo bruto foi realizado um experimento com
uma duração de 28 dias, composto de quatro tratamentos e cinco repetições por tratamento.
Cada parcela foi constituída de 50 pintos de um dia de idade, da linhagem “Ross”, sendo 25
machos e 25 fêmeas. Os resultados dos ganhos de peso médio por parcela são dados a seguir:

0% de Farelo 10% de Farelo 20% de Farelo 30% de Farelo


0,60 0,82 0,79 0,82
0,62 0,85 0,83 0,81
0,61 0,78 0,82 0,79
0,64 0,79 0,81 0,80
0,63 0,80 0,82 0,79

Ao nível de 5% de significância, qual tratamento, em média, propiciou o maior ganho


de peso?

7 – Para os dados fornecidos a seguir, concluir pelo teste de Tukey (α = 5%).


^ ^ ^ ^ ^ ^
m1  370 m2  338 m3  380 m 4  320 m5  325 m6  367
 = 33

8 – Com os dados abaixo, oriundos do delineamento inteiramente casualizado (DIC), aplicar o


teste de Tukey e concluir ao nível de 5% de probabilidade.
r1 = r2 = r3 = 4 r4 = r5 = 5 Y
i, j
2
ij  22.446,51

T1 = 120,6 T2 = 130,7 T3 = 140,8 T4 = 180,6 T5 = 115,6

9 – Aplicar o teste de Tukey às comparações múltiplas obtidas com as médias dos tratamentos
de um experimento realizado no delineamento inteiramente casualizado (DIC). Concluir para
o nível de 1% de probabilidade.
SQResíduo = 438,8631 r1 = r2 = r3 = 4 r4 = r5 = 3

57
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

^ ^ ^ ^ ^
m1  230,6 m 2  217,2 m3  204,9 m 4  209,9 m5  188,3

10 – Em uma propriedade agrícola foi realizado um experimento com cinco empregados. Eles
realizaram a pulverização de cinco áreas (uma área/empregado) com pulverizadores costais
manuais (em condições iguais). No fim de cada turno de trabalho foi avaliado o consumo do
pulverizador por empregado, obtendo, para 10 turnos, as seguintes médias (consumo em
litros/100m2):
^ ^ ^ ^ ^
m1  2,11 m 2  2,51 m3  1,87 m 4  2,23 m 5  1,80
Sabendo-se que a SQTotal = 235,51. Qual empregado apresentou maior consome em
seu pulverizador ao nível de 5% de significância? Se necessário utilize o teste de Tukey.

11 – Um experimento para avaliar a influência de quatro tipos de aleitamento, no ganho de


peso de leitões, foi conduzido utilizando o delineamento inteiramente casualizado com quatro
repetições. Foram obtidos os seguintes resultados:

Tratamentos 1 2 3 4
Totais 37,2 44,8 31,6 32,8

F.V. G.L. SQ QM F
Tratamento
Resíduo
Total 33,82

Complete o quadro da ANOVA e, considerando α = 1%, responda: Qual(is) o(s)


melhor(es) tipo(s) de aleitamento? (Use o teste de Tukey, se necessário).

12 – Foi realizado um experimento utilizando o delineamento inteiramente casualizado para


comparar a produtividade de cinco variedades de mandioca. Os resultados foram:

Variedades
1 2 3 4 5
9,1 11,5 8,2 14,2 15,2
6,8 13,7 11,1 10,9 16,1
11,3 14,1 6,2 13,1 11,1
10,4 8,9 15,7 11,4 14,4
11,4 16,1 11,7

a) Efetuar a análise de variância e concluir para α = 5%.

58
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

b) Para recomendar a(s) variedade(s) mais produtiva(s) é necessário aplicar algum teste
de médias? Justifique sua resposta.

13 – Com a finalidade de aumentar a produção de lã de suas ovelhas, por meio de uma


alimentação mais apropriada, um criador separou 28 ovelhas de sua criação. Como as ovelhas
eram de idades diferentes, elas foram divididas em sete grupos, sendo que dentro de cada um
destes grupos existiam quatro ovelhas da mesma idade e homogeneidade para as demais
características. Em cada grupo foi realizado um sorteio para distribuir, inteiramente ao acaso,
os quatro tipos de alimentação (TA) às ovelhas do grupo. O experimento iniciou-se no
momento de se realizar uma nova tosquia, da qual se obteve os seguintes resultados,
expressos em unidade de medida de lã por animal:

Grupos
TA 1 2 3 4 5 6 7 Totais
1 30 32 33 34 29 30 33 221
2 29 31 34 31 33 33 29 220
3 43 47 46 47 48 44 47 322
4 23 25 21 19 20 21 22 151
Totais 125 135 134 131 130 128 131 914
Com base nas informações anteriores, pede-se:

Qual o tipo de delineamento experimental utilizado pelo criador? Justifique sua resposta.
Existe diferença entre os tipos de alimentação fornecidos às ovelhas? (α = 1%).
Com base no teste de Tukey, qual (is) seria (m) o (s) tipo (s) de alimentação a ser (em)
recomendado (s) às ovelhas?
Calcular o coeficiente de variação do experimento.

14 – Um experimento no DBC, com quatro repetições, forneceu os dados abaixo:

Blocos
Tratamentos 1 2 3 4 Totais
1 142,36 144,78 145,19 138,88 571,21
2 139,28 137,77 144,44 130,61 552,10
3 140,73 134,06 136,07 144,11 554,97
4 150,88 135,83 136,97 136,36 560,04
5 153,49 165,02 151,75 150,22 620,48
Totais 726,74 717,46 714,42 700,18 2.858,80

Para o nível de 5% de significância, pede-se:

ANOVA.
Teste de Tukey, se necessário.

15 – Com o objetivo de verificar qual tipo de pneu que proporciona menor consumo de
combustível, para trabalhar em terrenos encharcados, testou quatro diferentes tipos. Como a
área que dispunha para realizar o experimento era heterogênea com relação à declividade,
subdividiu a área total em três sub-áreas, de tal forma que dentro de cada uma delas existia

59
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

uniformidade com relação a declividade. Dentro de cada sub-área realizou-se um sorteio ao


acaso dos tipos de pneus às unidades experimentais. Com a realização da pesquisa obtiveram-
se os seguintes resultados de consumo, expressos em litros/hora trabalhada:

Pneus
Sub-área 1 2 3 4
1 30 32 33 35
2 29 30 31 33
3 25 26 30 31

Por meio das informações fornecidas acima, pede-se: (utilize o nível de 5% de


significância, quando necessário)

a) Quais foram os princípios básicos da experimentação utilizados neste experimento?


Justifique sua resposta.
b) Qual foi o tipo de delineamento experimental utilizado? Justifique sua resposta.
c) Em termos de consumo, conclua com relação aos tipos de pneus testados, por meio da
análise de variância.
d) Qual (is) o (s) tipo (s) de pneu (s) que atende (m) ao objetivo da pesquisa? Use o teste
de Tukey, se necessário.

16 – Um experimento com cinco variedades de batata (A, B, C, D e E), em blocos


casualizados, apresentou as seguintes produções (toneladas por hectare):

Variedades
Blocos A B C D E
1 9 21 22 15 12
2 13 27 29 11 18
3 11 26 24 10 18
4 9 25 25 12 17

Para o nível de significância igual a 5%, pede-se:

a) ANOVA.
b) Teste de Tukey, se necessário.

17 – Em um experimento de competição de variedades de cana forrageira foram utilizadas


cinco variedades: A = COOO290; B = CO294; C = CO297; D = CO299 e E = CO295. Elas
foram dispostas em quadrado latino 5 x 5. O controle feito através de blocos horizontais e
verticais teve por objetivo eliminar influências atribuídas as diferenças de fertilidade em duas
direções. As produções, em kg/parcela, foram as seguintes:

Colunas
Linhas 1 2 3 4 5 Totais
1 432 (D) 518 (A) 458 (B) 583 (C) 331 (E) 2.322
2 724 (C) 478 (E) 524 (A) 550 (B) 400 (D) 2.676
3 489 (E) 384 (B) 556 (C) 297 (D) 420 (A) 2.146

60
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

4 494 (B) 500 (D) 313 (E) 486 (A) 501 (C) 2.294
5 515 (A) 660 (C) 438 (D) 394 (E) 318 (B) 2.325
Totais 2.654 2.540 2.289 2.310 1.970 11.763

Considerando α = 5%, pede-se:

a) Análise de Variância.
b) Qual variedade deve ser recomendada com relação a sua produtividade? Utilize o teste
de Tukey, se necessário.

18 – Aplicar o teste de Tukey para comparar as médias de tratamentos relativas ao


delineamento em quadrado latino 5 x 5.

Dados:

T1 = 3.024,0 T2 = 2.549,0 T3 = 2.349,0 T4 = 1.970,0 T5 = 1.734,0


SQResíduo = 34.116,0

19 – O objetivo do experimento foi estudar o efeito da época de castração no desenvolvimento


e na produção de suínos. Dispunha-se para este estudo de cinco matrizes da mesma raça, que
foram submetidas à mesma alimentação e manejo durante o período de gestação. Os
tratamentos foram: (A) Castração aos 56 dias de idade; (B) Castração aos 7 dias de idade; (C)
Castração aos 36 dias de idade; (D) Inteiros “sem castração”; (E) Castração aos 21 dias de
idade. Foi utilizado o delineamento em quadrado latino buscando controlar a variação entre
leitegadas (linhas) e a variação no peso inicial dos leitões (colunas), sendo a parcela
experimental constituída de um leitão. Os ganhos de peso, em kg, após o período
experimental (28 semanas), estão apresentados no quadro abaixo:

Faixas de Peso Inicial


Leitegadas 1 2 3 4 5 Totais
1 93,0 (A) 115,4 (C) 116,9 (E) 110,2 (D) 110,4 (B) 545,9
2 110,6 (C) 96,5 (E) 108,9 (B) 97,6 (A) 112,0 (D) 525,6
3 102,1 (B) 108,6 (D) 77,9 (A) 102,0 (E) 111,7 (C) 523,3
4 115,4 (D) 94,9 (A) 114,0 (C) 100,2 (B) 118,5 (E) 543,0
5 117,6 (E) 114,1 (B) 118,7 (D) 108,8 (C) 80,2 (A) 539,4
Totais 538,7 529,5 536,4 518,8 532,8 2.656,2

Considerando α = 5%, pede-se:

a) Proceder à análise de variância. Dado: SQTotal = 2.998,4824.


b) Formule um contraste que permita avaliar o efeito médio da prática de castração.
Interpretá-lo de acordo com sua estimativa.

61
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

20 – Descreva sobre os delineamentos experimentais DIC, DBC e DQL, respondendo: i) Em


quais condições são indicados; ii) Características semelhantes; iii) Características que os
distinguem.

CONTEÚDO VI – Experimentos Fatoriais

1 – Abaixo é fornecido o quadro da Análise de Variância e o quadro de Interação para um


experimento fatorial instalado segundo o DBC, com 4 repetições, que foi realizado por um
Zootecnista para comparar três raças de suíno e dois tipos de ração, com relação ao teor de
gordura na carcaça.

FV GL SQ QM F
Ração 5,0400
Raça 1,0000
Interação
(Tratamento (20,3750)
)
Blocos -
Resíduo 15,0000
Total

Rações
Raças 1 2 Totais
1 45 40 85

62
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2 38 45 83
3 39 48 87
Totais 122 133 255

Pergunta-se: Os fatores Raça e Ração atuam independentemente no teor de gordura


dos suínos ao nível de 5% de probabilidade?

2 – Suponha que você esteja participando de uma seleção para um emprego em uma empresa
de pesquisa. Dentre as várias áreas em avaliação, consta a área de estatística, que objetiva
avaliar seus conhecimentos na área de experimentação, não simplesmente pedindo-lhe para
fazer “contas” (na ocasião, de menor relevância), mas sim com relação à estratégia de análise,
interpretação, discussão e tomada de decisão. São feitas as seguintes perguntas:

Como você faria um “leigo” entender o que vem a ser Interação entre dois Fatores A e B.
Qual a estratégia de análise a ser efetuada (ou os passos das análises subsequentes) nos
seguintes casos de um experimento fatorial com dois fatores A e B:
b.1) Interação Não Significativa;
b.2) Interação Significativa.

3 – Do experimento fatorial 3 x 4, instalado no DIC com quatro repetições, são dados:

B1 B2 B3 B4 Totais
A1 29 25 22 18 94
A2 29 23 20 15 87
A3 21 23 19 18 81
Totais 79 71 61 51 262
Dados: SQResd. = 56,43 e α = 5%.

a) Proceder a ANOVA;
b) Aplicar o teste de Tukey, se necessário.

4 – O experimento fatorial 3 x 2 foi montado no DQL. Os resultados estão apresentados


abaixo. Ao nível de 5% de probabilidade, pede-se:

B1 B2 B3 Totais
A1 20,6 40,5 42,3 103,4
A2 19,8 41,6 42,5 103,9
Totais 40,4 82,1 84,8 207,3

Dados: SQLinhas = 18,4682; C


j 1
2
j  8.362,22 ; Y 2
ijk  1.556,32

Testar os efeitos principais (A e B) e o efeito de interação pela ANOVA;


Aplicar o teste de Tukey, se necessário.

63
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

5 – Com o objetivo de se estudar a produtividade de três cultivares de soja plantadas com


cinco adubos diferentes, foi instalado um experimento no esquema fatorial 3 x 5, em blocos
casualizados com três repetições, obtendo os seguintes resultados:

Cultivares
Adubos IAC-9 UFV-1 Criatalina Totais
1 29,8 53,4 21,0 104,2
2 35,0 42,4 40,1 117,5
3 52,9 44,6 33,7 131,2
4 54,2 49,9 39,0 143,1
5 52,9 23,1 27,5 103,5
Totais 224,8 213,4 161,3 599,5
Dados: SQResd. = 218,73 e α = 5%.

a) Avaliar se a interação entre Adubos e Cultivares é significativa;


b) De acordo com o resultado para interação entre Adubos e Cultivares, explique
teoricamente os procedimentos das análises estatísticas a serem executados
sequencialmente.

6 – Com os dados do quadro de interação do experimento fatorial 2 x 6, montado no DBC


com duas repetições, verificar se os Fatores A e B atuam independentemente. Considere α =
5%.
B1 B2 B3 B4 B5 B6 Totais
A1 46,8 48,2 47,3 49,0 48,5 46,9 286,7
A2 47,2 60,8 69,3 71,6 61,5 46,8 357,2
Totais 94,0 109,0 116,6 120,6 110,0 93,7 643,9

Dado: SQResd. = 120,8325

CONTEÚDO VII – Regressão Linear

1 – Utilizando os dados amostrais fornecidos abaixo, pede-se:

Temperatura (0C) 10 15 20 25 30
Comprimento (mm) 1.003 1.005 1.010 1.011 1.014

a) Estimar a equação de regressão linear de 1º grau entre o efeito da temperatura sobre o


comprimento de uma barra de aço;
b) Avaliar a adequação do modelo de regressão utilizado por meio da Análise de
Variância. (α = 5%)

2 – Para verificar se existe uma relação linear de 1º grau entre Umidade Relativa (UR - %) do
ar da secagem de sementes e a germinação das mesmas, um pesquisador realizou um teste
com quatro diferentes valores para a porcentagem de UR do ar que atravessava as sementes
armazenadas, obtendo-se os seguintes valores amostrais:

64
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

UR (%) 20 30 40 50
Germinação (%) 94 96 95 97

a) Estabelecer a equação linear de 1º grau estimada;


b) Ao nível de 5% de probabilidade, qual seria a conclusão do pesquisador com relação à
adequação da equação de regressão entre UR e germinação?

3 – Para o conjunto de pares de valores de X (variável independente) e Y (variável


dependente), obter a equação de regressão linear de 1º grau estimada e proceder a análise de
variância da regressão. Use o nível de significância de 5%.

X 2 4 6 8 10 12 14 16 18 20
Y 10,3 18,2 25,1 35,6 43,0 50,0 59,1 67,8 75,2 85,0

4 – O modelo de regressão linear de 1º grau foi proposto para explicar a relação entre a
quantidade de ração fornecida e a produção de leite por cabras. Por meio dos dados fornecidos
abaixo, pede-se:

Níveis de Ração (g) 50 75 100 125 150


Produção de Leite (l/dia) 1,2 1,7 2,0 2,1 2,5

a) Estimar o modelo de regressão proposto;


b) Verificar se o modelo é adequado pela ANOVA; (α = 5%)
c) Interpretar o coeficiente de regressão com relação aos níveis de ração fornecida e a
produção de leite pelas cabras.

5 – Suponha que tenha sido realizada uma pesquisa a respeito da influência do tempo de
estudo na nota da prova de determinada disciplina. Os dados relacionados a cinco alunos
aleatoriamente entrevistados são dados abaixo:

X = Tempo de estudo (horas) 2 3 4 5 6


Y = Nota obtida (0,0 a 10,0) 3,0 5,0 6,0 8,0 9,0

Dados:
5 5 5 5 5

 X i  20 ;
i 1
 X i2  90 ;
i 1
 Yi  31 ;
i 1
 Yi 2  215 ;
i 1
X Y
i 1
i i  139

Pede-se:

a) Ajuste um modelo de regressão linear de 1º grau para tentar explicar a variação na


nota do aluno em função do tempo de estudo;
b) Poderíamos dizer que o tempo de estudo influencia significativamente a nota obtida?
(α = 5%)
c) Estime o tempo requerido de estudo (em horas/minutos) para que o aluno obtenha a
nota 7,0 na disciplina.
d) Obter o diagrama de dispersão associado ao gráfico da equação de regressão estimada.

65
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

6 – Para estudar a influencia do número de plantas existentes na parcela experimental (X)


sobre a produção de grãos (Y), em uma variedade de sorgo gramíneo, montou-se um
experimento cujos resultados foram:

X 18 15 17 16 19 24 15 14 17 18
Y 58 90 95 53 92 96 75 84 94 87

Pede-se:

a) Obter a equação de regressão linear de 1º grau estimada;


b) Proceder à análise de variância da regressão; (α = 5%)
c) Calcular o coeficiente de determinação, interpretando-o;
d) Faça inferências a respeito do modelo de regressão escolhido para tentar explicar as
variáveis X e Y, com base nos resultados obtidos nas letras b e c.

IX - GABARITO

CONTEÚDO II – Testes de Hipóteses


1 – tcal = 1,06 tα = 1,81
2 – tcal = 14,61 tα = 3,01
3 – Teste t para uma média
4 – tcal = 2,61 tα = 1,73
5 – tcal = 3,57 tα = 2,88
6 – tcal = 3,64 tα = 3,00
7 – Teste t para duas médias independentes
8 – tcal = 8,81 tα = 1,86
9 – tcal = 5,19 tα = 1,76
10 – tcal = 4,72 tα = 1,90
11 – Teste Qui-Quadrado
12 – Teste Qui-Quadrado

CONTEÚDO III – Contraste


1 – Ŷ = - 11,82

66
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

2 – a) Ŷ1 = 6,30 ; Ŷ2 = - 17,10 ; Ŷ3 = - 8,40


b) São ortogonais
3 – Não são ortogonais
4 – Ŷ1 = - 9,30 ; Ŷ2 = 0,70 ; Y1 e Y2 são ortogonais

CONTEÚDO V – Delineamentos Experimentais e Teste de Comparação de Médias


1 – Fc = 7,8 Fα = 3,24
2 – c) Fc = 0,135 Fα = 6,93
3 – a) Fc = 685,06 Fα = 2,84 b) 1,22 c) 8,25 d) – 0,03
4 – Fc = 63,41 Fα = 3,81
5 – Fc = 9,0 Fα = 5,32
6 – Fc = 118,22 Fα = 3,24 ∆ = 0,0351
7 – Aplicação direta do teste de Tukey
8 – ∆(4;4) = 10,267 ∆(4;5) = 9,7406 ∆(5;5) = 9,183
9 – ∆(4;4) = 16,645 ∆(4;3) = 17,980 ∆(3;3) = 19,22
10 – Fc = 0,1589 Fα = 2,61
11 – Fc = 15,17 Fα = 5,95 ∆ = 2,1
12 – a) Fc = 1,33 Fα = 2,93
13 – b) Fc = 177,81 c) ∆ = 3,84 d) 6,115%
14 – a) Fc = 5,869 b) ∆ = 13,12
15 – c) Fc = 20,96 d) ∆ = 2,36
16 – a) Fc = 37,70 b) ∆ = 5,05
17 – a) Fc = 12,09 b) ∆ = 107,54
18 – ∆ = 107,54
19 – a) Fc = 9,016 b) Ŷ = 33,66

CONTEÚDO VI – Experimentos Fatoriais


1 – FA = 5,04; FB = 0,50; FAxB = 7,1675
3 – a) FA = 1,68; FB = 7,85; FAxB = 0,93
b) Teste de Tukey: Fator B (∆ = 1,349)
4 – a) FA = 0,0049; FB = 25,35; FAxB = 0,0393
b) Teste de Tukey: Fator B
5 – a) Interação significativa
6 – Fatores A e B não atuam independentemente

CONTEÚDO VII – Regressão Linear


^
1 – a) Y  997,4  0,56 X
b) Fc = 84,43
^
2 – a) Y  92,7  0,08 X
b) Fc = 3,55

67
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

^
3– Y  1,522  4,128 X
Fc = 8.079,8
^
4 – a) Y  0,7  0,012 X
b) Fc = 67,669
^
5 – a) Y  0,2  1,5 X
b) Fc = 225,00
c) 4 horas e 32 minutos
^
6 – a) Y  53,895  1,648 X
b) Fc = 0,7947
c) r2 = 0,0904

X – REFERÊNCIA BIBLIOGRÁFICA ADICIONAL

BANZATTO, D. A.; KRONKA, S. N. Experimentação Agrícola. 4ª Ed. Editora FUNEP,


2006.

DIAS, L. A. S.; BARROS, W. S. Biometria Experimental. 1ª Ed. Editora UFV, 2009.

FERREIRA, P. V. Estatística Experimental Aplicada à Agronomia. 3ª Ed. Editora


EDUFAL, 2000.

GOMES, F. P. Curso de Estatística Experimental. 15ª Ed. Editora FEALQ, 2009.

68
IC283 – Bioestatística e IC284 – Estatística Experimental
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ

GOMES, F. P.; GARCIA, C. H. Estatística Aplicada a Experimentos Agronômicos e


Florestais. Vol. 11. Editora FEALQ, 2002.

SAMPAIO, I. M. S. Estatística Aplicada à Experimentação Animal. 3ª Ed. FEPMVZ –


Editora, 2007.

STORCK, L.; GARCIA, D. C.; LOPES, S. J.; ESTEFANEL, V. Experimentação Vegetal. 2ª


Ed. Editora UFSM, 2006.

VIEIRA, S. Análise de Variância: Anova. 1ª Ed. Editora Atlas, 2006.

69

You might also like