Testes Estatísticos Não-Paramétricos

UNIVERSIDADE FEDERAL DO PARAN
DEPARTAMENTO DE ESTATSTICA
APOSTILA
ESTATSTICA NAO-PARAMTRICA
Elaborada a partir de notas de aula do prof. Paulo Ricardo B. Guimares
MINISTRIO DA EDUCAO E DO DESPORTO

SETOR DE CIENCIAS EXATAS
DEPARTAMENTO DE ESTATISTICA
ndice
I - Mtodos Estatsticos No-Paramtricos
1.1 - Suas vantagens e desvantagens
1.2 - Discusso geral dos testes estatsticos
1.3 - Escolha do teste estatstico adequado
1.4 - Nveis de mensurao.
II - Testes para o Caso de Uma Amostra

2.1 - Teste binomial
2.2 - Teste do X2
2.3 - Teste de Kolmogorov-Srnirnov
2.4 - Teste de Lilliefors
2.5 - Teste de Aleatorizao
III - Testes para Duas Amostras Relacionadas
3.1 - Teste de McNemar
3.2 - Teste dos Sinais
3.3 - Teste de Walsh
3.4 - Teste de Wilcoxon
IV- Testes para duas Amostras Independentes
4.1 - Teste Exato de Fischer
4.2 - Teste do X2
4.3 - Teste da Mediana
4.4 - Teste U de Mann-Whitney
4.5 - Teste Kolmogorov-Srnirnov
4.6 - Testes das Iteraes de Wald-Wolfowitz
4.8 - Teste Moses das Reaes Extremas
V - Testes para K - Amostras Relacionadas

5.1 - Teste Q de Cochran
5.2 - Teste de Friedman
5.3 - Comparaes Mltiplas
VI - Testes para K - Amostras Independentes
6.1 - Teste da mediana
6.2 Teste do X2
6.3 - Teste de Kruskal-Wallis
6.4 - Comparaes Mltiplas
VII - Medidas de Correlao e Seus Testes de Significncia
7.1 - Coeficiente de Contingncia C
7.2 - Coeficiente de Spearman
7.3 - Coeficiente de Kendal
Referncias Bibliogrficas
1 - SIEGEL, Sidney (1956). Estatstica No - Paramtrica para as Cincias do
Comportamento, McGraw-Hill.
2 - CAMPOS, H. (1983). Estatstica Experimental No - Paramtrica, ESALQ.
3 - GIBBONS, Jean D. (1971). Nonparametric Statistical Inference, McGraw-Hill.
4 - HOLLANDER, M. and WOLFG, D.A. (1973). Nonparametric Statistical Method,
John Wiley & Sons.
5 - CONOVER, W.J. (1971). Practical Nonpararnetric Statistics, John Wiley & Sons.
A Estatstica No-Paramtrica pode ser definida como uma coleo de mtodos

estatsticos aplicada a conjuntos de dados onde as suposies distribucionais necessrias para
aplicao de uma tcnica clssica (Intervalo de Confiana, Teste de Hiptese) no so
satisfatoriamente atendidas. tambm bastante til no tratamento de dados onde o nvel de
mensurao das observaes no dos melhores.
Tais procedimentos so usados desde h muitos anos atrs embora no com o mesmo
nome atual.
O rei Nabucodonossor aplicou informalmente o teste da permutao, 600 anos AC.
Clculos da probabilidade binomial foram feitos em 1710 pelo mdico ingls Arbuthnott. O
primeiro livro-texto denotado aos mtodos No-Paramtricos foi escrito por Siegel (1956) e
usado at hoje pela facilidade de leitura.
No entanto, Savage designa o ano de 1936 como o verdadeiro incio da Estatstica
No-Paramtrica, marcado pela publicao do artigo de Hotelling e Pabst sobre correlao por
postos.
O seu maior crescimento ocorreu nos ltimos 40 anos
Atualmente esta rea da Estatstica est bastante desenvolvida e os tpicos modernos
so Estimao de Densidade, Regresso No-Paramtrica e Semi-Paramtrica.
Em 1991 foi lanado o Journal of Nonparametric Statistics.
O tema central em Estatstica a chamada Inferncia Estatstica que aborda dois tipos
de problemas fundamentais: a estimao de parmetros de uma populao, e o teste de
hipteses. Este ltimo ao que ser tratado nesse curso. Na Inferncia Estatstica procuramos
tirar concluses sobre um grande nmero de eventos com base na observao de apenas parte
deles. Os testes relacionados a Inferncia Estatstica nos dizem qual a margem de diferena
que deve ser encontrada na amostra para que possamos afirmar que elas representam
realmente diferenas nos tratamentos (grupos). Como nesses procedimentos, na verdade so
testadas hipteses a respeito dos parmetros populacionais, esses so chamados de
Paramtricos.
Algumas tcnicas no so to rigorosas na especificao de condies acerca dos
parmetros da populao da qual a amostra foi obtida. Consequentemente as concluses no
so to poderosas quanto as obtidas por tcnicas paramtricas. Essas tcnicas so chamadas
de distribuio livre ou no paramtricas.
Essas tcnicas sero estudadas neste curso.
1.1 SUAS VANTAGENS E DESVANTAGENS

1.1.1 Vantagens
Dispensam Normalidade dos dados;
O p valor exato (no caso paramtrico o clculo do p-valor se baseia na
distribuio Normal);
So testes mais simples;
So teis quando difcil estabelecer uma escala de valores quantitativa para os
dados;
So mais eficientes que os paramtricos quando no existe Normalidade.
1.1.2 Desvantagens
Proporcionam um desperdcio de informaes, j que em geral no consideram a
magnitude dos dados;
Quando as suposies do modelo estatstico so atendidas so menos eficientes
que os paramtricos;
A utilizao das tabelas dos testes mais complicada.
1.2 ALGUMAS DEFINIES BSICAS
1.2.1 Amostra Aleatria
X 1 , X 2 , , X n constituem uma amostra aleatria se cada Xi apresenta a mesma
distribuio e independncia entre si.
1.2.2 Parmetro
um valor desconhecido, associado a uma certa populao.
1.2.3 Estimador
uma funo da amostra aleatria que estima o valor do parmetro.
1.2.4 Nvel de Confiana
a probabilidade de abrangncia do intervalo de confiana para um certo
parmetro.
2
1.2.5 Hiptese Nula

uma afirmao acerca do parmetro (ou parmetros) em questo que
expressa sempre uma posio conservadora, em forma de igualdade, que se deseja
sempre rejeitar. No caso no-paramtrico estas afirmaes nem sempre se referiro a
parmetros, podendo estar associadas ao interesse do pesquisador.
1.2.6 Hiptese Alternativa
a hiptese que se deseja testar, expressa sempre em oposio hiptese nula.
1.2.7 Teste de Hiptese
uma regra de deciso que, com base na amostra, ir rejeitar ou no Ho.
1.2.8 Regio Crtica
um subconjunto de valores to extremos, que nos leva a rejeio da hiptese
nula.
1.2.9 Erro Tipo I
Ocorre quando se rejeita Ho quando na verdade esta hiptese verdadeira. A
probabilidade do Erro Tipo I ( ) chamada nvel de significncia.
1.2.10 Erro Tipo II
Ocorre quando Ho no rejeitada quando na verdade deveria ter sido. A
probabilidade do Erro Tipo II representada por .
1.2.11 Posto
Quando atribumos s observaes, nmeros correspondentes s suas posies
na classificao (ranking em ordem crescente). Cada nmero chamado de posto.
1.3 DISCUSSO GERAL DOS TESTES ESTATSTICOS

Mostraremos aqui, em forma de exemplo, os problemas que surgem ao utilizarmos testes
paramtricos quando as suposies no so atendidas.
Considere por exemplo um experimento onde foram observadas concentraes de
partculas em 28 amostras de solo aps aplicao de um pesticida. O histograma para o
conjunto de dados observado dado abaixo:
Distribuio dos dados
11
10
9
8
7
6
5
4
3
2
1
0
<= 0
(0;,1]
(,1;,2]
X = 0,314
(,2;,3]
(,3;,4]
(,4;,5]
s 2 = 0,07
(,5;,6]
(,6;,7]
> ,7
s = 0,264
Ao testar a afirmao do fabricante de que a concentrao mdia de pesticida se dar

na ordem de 0,35g/cm3. Ento teremos:
H 0 : = 0,35
X 0,314 0,35
=
= 0,72
s
0,264
H a : < 0,35
n
28
No temos porque rejeitar a hiptese nula ao usarmos o teste de hiptese paramtrico.
Assim a afirmao do fabricante estar comprovada. Porm;
t=
podemos notar uma grande assimetria na distribuio dos dados, o que causou um
aumento do valor da mdia em favor da hiptese nula;
Observamos que 8 amostras apresentaram alto teor de concentrao de inseticida (>0,60) e
a grande maioria (71%) no passou de 0,40;
Essas amostras de solo foram obtidas perto de um rio (parte baixa da rea) para onde
provavelmente desceu o pesticida levado pela ao das chuvas;
O que notamos na verdade que o produto parece no ter se espalhado homogeneamente;

Neste caso talvez se tivssemos testado a mediana (0,19) ao invs da mdia teramos
obtido resultados diferentes;
Essas 8 amostras com alto teor de concentrao no podem simplesmente ser eliminadas
do estudo, pois constituem um nmero considervel de informaes alm de apontar o
fato do pesticida se espalhar de forma desigual na rea considerada.
interessante, no momento oportuno, que retornemos a este exemplo, aplicando a tcnica
adequada e comparando com o resultado obtido no teste paramtrico (testando a mdia e a
varincia).
1.4 ESCOLHA DO TESTE ESTATSTICO ADEQUADO

importante a definio de critrios que nos ajudem a decidir qual o teste ideal para
determinado problema.
Um desses critrios, sem dvida. o Poder do Teste (1 ) . O teste que apresenta
uma maior probabilidade de rejeitar H0 quando H0 falsa, entre todos os testes de nvel
deve ser escolhido. Mas s isto no basta e nem sempre simples de ser obtido, portanto
precisamos de outras informaes para escolher o teste mais adequado:
Como foi obtida a amostra, ou seja, o plano experimental;
Natureza da Populao (pessoas, objetos, reas, animais, etc.);
Tipo de Mensurao dos dados (escala de mensurao).
Quando se usa um teste paramtrico existe uma srie de pressupostos a serem
verificados, alm do nvel mnimo de mensurao exigido ser a escala intervalar.
Quando essas suposies no so verificadas possvel que o teste nos leve a
resultados errneos.
No caso no-paramtrico, o primeiro critrio a ser verificado deve ser o nvel de
mensurao dos dados.
1.5 NVEL DE MENSURAO

a) Escala Nominal
o mais baixo nvel de mensurao. Utiliza smbolos ou nmeros
simplesmente para distinguir elementos em diferentes categorias (como um nome),
no havendo entre eles, geralmente, possibilidade de comparao do tipo maiormenor, melhor-pior).
Exemplos:
Masculino (M), Feminino (F)
Perfeito (1), Defeituosa (0)

Europeu (1), Americano(2), Africano (3), Asitico(4)
b) Escala Ordinal
Utiliza nmeros apenas para classificarmos elementos numa ordem crescente
ou decrescente. Existe assim algum tipo de relao entre as categorias embora a
diferena entre elas seja de difcil quantificao.
Exemplos:
Classes scio - econmicas: (A, B, C, D, E)
Patentes do Exrcito (soldado, cabo, sargento, etc)
Opinio de um determinado produto (Ruim, Regular, Bom, Muito bom,
Excelente)
c) Escala Intervalar (Intervalo de medida)

Ocorre quando a escala tem as caractersticas da escala ordinal e ainda
possvel quantificar a diferena entre dois nmeros desta escala.
Exemplo:
Temperatura, Peso, Altura, Rendimentos
obs: Alguns autores apontam ainda a existncia de outra escala: a Escala de
Razo, equivalente a escala intervalar porm, o valor zero o verdadeiro ponto de
origem.
Estes testes so teis para verificar se determinada amostra pode provir de uma
populao especificada. So usualmente conhecidos como testes de aderncia ou bondade do
ajuste. Neste caso, retira-se uma amostra aleatria e compara-se a distribuio amostral com a
distribuio de interesse.
2.1 TESTE BINOMIAL
aplicado em amostras provenientes de populaes que constituem-se de apenas 2
categorias (variveis dicotmicas).
Exemplo: (masculino, feminino), (negativo, positivo), (defeituoso, perfeita)
til para verificarmos se a proporo de sucesso p observada na amostra pode
pertencer a uma populao com um determinado valor de p.
2.1.1 Pressupostos
Cada observao classificada como sucesso ou fracasso;
A probabilidade p de sucesso no se altera com a repetio do experimento;
As n tentativas so independentes.
2.1.2 O Mtodo
Este mtodo ir calcular a probabilidade de obter valores mais extremos do que
os observados.
Inicia-se com a formulao das hipteses:
H 0 : p = p0
H a : p > p0 ou H a : p < p0 (unilateral) ou H a : p p0 (bilateral)
Determinar N;
Determinar as freqncias observadas;
De acordo com a hiptese, calculamos com a ajuda da Distribuio Binomial
e/ou tabela, a probabilidade de ocorrncia de valores mais extremos do que o
observado (nmero de sucessos):
x
N
N i N i
N i N i
P( X x ) =
p q ou P ( X x ) =
p q
*
i
i
i =0
i=x
*dependendo da hiptese alternativa
Exemplo 1 - H 0 : p = 0,5 versus

H a : p < 0,5 ; x = 5 = nmero de sucessos em 11
tentativas. Considera-se x como sendo o nmero de sucessos observados.
P ( X 5) =
5
i =0
N i N i
p q
=
i
5
i =0
11 i 11i
p q
= 0,5
i
Concluso: No rejeitamos a hiptese nula.
Pequenas Amostras
Consideramos aqui N 25 ento:
P( X x ) =
(para p = 1
i =0
p i q N i ou P ( X x ) =
i=x
p i q N i
Tabela D SIEGEL)
Grandes Amostras
Consideramos aqui
N > 25 e
p 1
ou Npq 9 , para este caso utilizamos a
Aproximao pela Normal:

Z=
x np
npq
e procede-se como num teste de hiptese convencional
Tabela: A SIEGEL
Exemplo 2: Uma empresa lanou recentemente no mercado uma dieta de emagrecimento. E

pretende-se averiguar se a proporo de seguidores com idades superiores a 60 anos
superior a 0.3. Para tal procedeu na escolha aleatria de 16 indivduos entre os adeptos da
nova dieta, e apurou que apenas 5 tinham idade superior a 60 anos.
H 0 : p 0,30
Ha : p
versus
0,30
x = nmero de sucessos =5 e considerando n = 16.

^
Obs: note que a hiptese alternativa foi definida pelos dados amostrais, pois p =
x
P ( X 5) =
i=0
16
i =0
p i q N i = 1
5
.
16
0,3 i 0,7 16 i = 0,551
Concluso: Com um nvel de significncia de 5% no rejeitamos a hiptese nula pois o pvalor aproximadamente igual a 0,55. No podemos afirmar que a proporo de seguidores
com idades superiores a 60 anos superior a 30%.
Exemplo 3: Num ensaio de degustao de caf, cada mesa era constituda de 5 amostras,
sendo duas delas de caf mole e as 3 restantes, de caf comum. Dos 8 degustadores que
foram utilizados, 3 classificaram corretamente os tipos de caf.
Teste a hiptese de que os degustadores conseguem distinguir o caf mole dos demais.
Primeiramente precisamos saber qual a probabilidade de um degustador distinguir por acaso

1
1
2 1
os dois cafs moles dentre as 5 amostras. p 0 = 2 =
= 0,10 ou
5 4
C 5 10
H 0 : p = 0,10
P ( X 3) =
H a : p > 0,10
versus
8
p i q N i =
0,10 i 0,90 8i = 0,0381
i
i =3 i
Concluso: A probabilidade de 3 ou mais degustadores distinguirem corretamente os tipos de
caf aleatoriamente de apenas 0,0381 ou 3,81%. Ao nvel de significncia de 5% rejeitamos
a hiptese nula. Isto indica que o resultado observado no deve ser devido ao acaso.
i =0
Exerccio - A Lei de Mendel afirma que para 4 genes, 3 so dominantes e 1 recessivo. Em

um certo experimento observou-se 54 genes dominantes e 26 recessivos. Verifique, pelo teste
Binomial, se a lei se aplica ao experimento realizado.
2.1.3 Discusso do Mtodo

a tcnica mais poderosa aplicvel a dados medidos em escala nominal e
ainda por cima dicotmicas.
Quando a varivel aleatria em estudo contnua e procede-se uma
dicotomizao haver certamente perda de eficincia.
10
2.2 TESTE DE QUI-QUADRADO ( 2 )

um teste amplamente utilizado em anlise de dados provenientes de experimentos
onde o interesse est em observar freqncias em diversas categorias (pelo menos duas).
uma prova de aderncia til para comprovar se a freqncia observada difere
significativamente da freqncia esperada. Esta geralmente especificada por uma distribuio
de probabilidade.
2.2.1 Exigncias do Teste

Quando o nmero de categorias igual a 2 (k=2) as freqncias esperadas devem
ser superiores a 5;
Quando k > 2, o teste de Qui-Quadrado no deve ter mais de 20% das freqncias
esperadas abaixo de 5 e nenhuma freqncia esperada igual a zero;
Para evitar freqncias esperadas pequenas deve-se combinar as categorias (juntar)
at que as exigncias sejam atendidas;
Caso as categorias sejam combinadas em apenas duas e mesmo assim as exigncias
no tenham sido atendidas, deve-se utilizar o Teste Binomial;
As observaes devem ser independentes.
2.2.2 O Mtodo
Aps se definir a hiptese nula como a proporo esperada definida pela
distribuio de probabilidade em questo, testamos se as freqncias observadas
diferem muito das freqncias esperadas da seguinte forma:
(oi ei )2
i =1
ei
k = nmero de categorias (classes )

em que oi = freqncia observada na categoria i
ei = freqncia esperada na categoria i
Quanto maior o valor de 2 maior ser a probabilidade de as freqncias

observadas estarem divergindo das freqncias esperadas.
A estatstica do teste 2 tem distribuio Qui-Quadrado com graus
de liberdade onde:
= k 1 se as freqncias esperadas puderem ser calculadas sem precisar estimar

os parmetros distribucionais;
= k m 1 se as freqncias esperadas s puderem ser calculadas aps a estimao
dos m parmetros populacionais.
11
Exemplo 1: Deseja-se testar se a posio de largada de um cavalo (por dentro ou por fora)
influencia no resultado de uma corrida de cavalos.
Tabela 2.1 Distribuio do nmero de vitrias dos cavalos na sua posio de largada.
Posio
1
2
3
4
5
6
7
8
29
19
18
25
17
10
15
11
Nmero
de
18*
18*
18*
18*
18*
18*
18*
18*
Vitrias
Fonte: Livro-Siegel
* Resultado esperado pela hiptese nula
H 0 : f1 = f 2 =
2 =
k =1
(oi ei )2
ei
= f8
=
versus
H a : f1 f 2
(29 18)2 + (19 18)2

18
18
f8
(11 18)2
18
= 16,3
72 indica que o valor 16,3 acusa um p-valor = 0,02224, considerado um valor exato e
bilateral.
Concluso: Ao nvel de significncia de 1% no rejeitamos H 0 , porm a um nvel de 5%
rejeitamos H 0 . So necessrias mais repeties do experimento para as concluses serem
mais confiveis. (Tabela C SIEGEL)
Exemplo 2: A tabela dada a seguir apresenta o nmero observado de falhas mecnicas, por
hora, em uma linha de montagem a partir de um experimento com durao de 40 horas.
Tabela 2.2 Distribuio do nmero de falhas mecnicas por hora em uma linha de
montagem.
Falhas
0
1
2
3
4
5
6
7 + de 7
0
6
8
11
7
4
3
1
0
Freq. Observada
1,6
5,2
8,3
8,9
7,1
4,6 2,4 1,1
0,7
Freq. Esperada
Fonte: Livro-Siegel
Um engenheiro afirma que o processo descrito acima segue uma distribuio de

Poisson com mdia igual a 3,2.
H 0 : A distribuio das falhas mecnicas por hora se ajusta a um processo de Poisson com
= 3,2
H a : A distribuio das falhas mecnicas por hora no se ajusta a um processo de Poisson
com = 3,2
12
Como a tabela dada apresenta mais de 20% das freqncias com valores inferiores a 5
devemos unir as categorias. Assim:
Tabela 2.3 Juno das Categorias em que as freqncias so inferiores ao valor 5.

Falhas
0e1
2
3
4
5 ou mais
6
8
11
7
8
Freq. Observada
6,8
8,3
8,9
7,1
8,8
Freq. Esperada
Fonte: Livro-Siegel
2 =
(oi ei )2
k =1
ei
= 0,675
= 5 1 = 4 ento 42 indica que o valor 0,675 acusa um p-valor = 0,954375.
Concluso: Ao nvel de significncia de 5% no podemos rejeitar H 0 . A distribuio das

falhas mecnicas parece se ajustar satisfatoriamente a um processo de Poisson com uma
mdia de 3,2 falhas por hora.
13
Exerccio - O recenseamento de 320 famlias com 5 filhos revelam os dados abaixo:

Tabela 2.4 Distribuio do nmero de famlias com 5 filhos de acordo com o sexo
Nmero 5 mulheres 4 mulheres
de filhos
0 homens
1 homem
18
56
Nmero
de famlias
10
50
ei
3 mulheres
2 homens
110
2 mulheres
3 homens
88
1 mulher
4 homens
40
0 mulheres
5 homens
8
Total
100
100
50
10
320
320
Teste a hiptese de que o nascimento de homens e mulheres igualmente provvel. Caso H0

seja Rejeitada, estimar o parmetro da distribuio e refazer o teste.
14
2.2.3 - Discusso do Mtodo

Se os dados permitirem a utilizao de uma tcnica paramtrica esta prova
certamente leva a perda de informaes;
Para variveis nominais a nica tcnica adequada de verificao da bondade do
ajuste;
Para variveis ordinais no sensvel ao efeito da ordem. Quando a hiptese levar
em conta a ordem , o teste de Qui-Quadrado deixa de ser a melhor opo.
2.3 TESTE DE KOLMOGOROV SMIRNOV

Este teste de aderncia proposto em 1933 avalia a concordncia entre a distribuio
observada da amostra e uma determinada distribuio terica. Avalia se os dados amostrais se
aproximam razoavelmente de uma determinada distribuio. Para isso utilizamos a funo
distribuio acumulada observada, compara-se com a terica, determina-se o ponto em que
estas distribuies mais divergem, e testamos se essa divergncia aleatria ou no.
2.3.1 Exigncia do Teste

Os dados devem seguir ao menos uma escala ordinal.
2.3.2 O Mtodo
Seja F0 ( X ) uma distribuio terica acumulada e S n ( X ) uma distribuio
observada em uma amostra de n observaes (distribuio emprica)
Encontra-se a seguir o maior valor das diferenas entre F0 ( X ) e S n ( X ) , ou
seja,
D = mx F0 ( X ) S n ( X )
Compara-se o valor observado com o valor crtico (Tbua E Siegel)
bilateral.
Na tabela associa-se o valor observado com o seu p-valor.
15
Exemplo 1: Num experimento para calibrar a luminosidade adequada de uma nova mquina
fotogrfica, foram tiradas 5 fotos de cada uma das 10 pessoas que participaram do
experimento. A cada pessoa perguntou-se qual das fotos apresentava uma qualidade maior, de
1 a 5, onde 1 representa um grau baixo e 5 um grau alto de luminosidade.
H 0 : f1 = f 2 =
= f5
versus
F0 ( X )
S10 ( X )
F0 ( X ) - S10 ( X )
H a : f1 f 2
1
1
5
0
10
2
10
2
2
5
1
10
3
10
f5
3
3
5
1
10
5
10
4
4
5
6
10
2
10
5
5
5
10
10
0
Concluso: Para n =10 a P(D 0,5) < 0,01 , portanto rejeita-se H 0 , em favor de H a . Os
indivduos apresentam preferncia significativa em relao ao grau de luminosidade.
Exemplo 2 :Verifique se os dados abaixo podem ser ajustados por uma distribuio de
Poisson com mdia igual a 1,2.
F0 ( X i )
0,3012
0,6626
0,8794
0,9661
0,9921
0,9983
Xi
fi
0
1
2
3
4
5
15
25
10
5
4
1
Sn (X i )
0,250
0,666
0,833
0,917
0,983
1,000
F0 ( X i ) - S n ( X i )
0,0512*
0,0041
0,0461
0,0494
0,0088
0,0017
H 0 : Os dados seguem uma distribuio Poisson (1,2) ou F = F0 ( X )

H a : Os dados no seguem uma distribuio Poisson (1,2) ou F F0 ( X )
Concluso: D = mx F0 ( X i ) S n ( X i ) = 0,0512 e com isto p > 0,20. Ento no podemos
rejeitar a hiptese nula.
16
Como vimos no exemplo acima os dados foram agrupados em classes ( i ), onde era
associado a cada valor Xi a sua respectiva freqncia f i . Este teste tambm pode ser aplicado
quando as classes so definidas por intervalos; no entanto desta forma ele perde em preciso.
Exerccio: As produes mdias de um experimento envolvendo adubao em milho

encontram-se tabuladas abaixo
Classes
2700-3000
3000-3300
3300-3600
3600-3900
3900-4200
4200-4500
fi
13
18
24
32
17
11
115
xi
2850
3150
3450
3750
4050
4350
F (xi )
0,332
0,397
0,465
0,534
0,602
0,667
S (xi )
0,111
0,265
0,478
0,756
0,904
1,00
F (xi ) - S (xi )
0,221
0,132
0,012
0,221
0,301
0,332
Podemos admitir que a produo mdia segue uma distribuio normal com mdia
= 3.600 e 2 = 3.000.000 ?

Este teste tem vantagens em relao ao 2 , so elas:
Pode ser aplicado para pequenas amostras;
na maioria dos casos mais poderoso do que o 2 .
17
2.4 TESTE DE LILLIEFORS

No caso em que se deseja testar normalidade e a mdia e a varincia no so
previamente especificadas, mas sim estimadas atravs dos dados da amostra, deve-se utilizar
o teste de Lilliefors.
Este teste tem procedimento anlogo ao Kolmogorov Smirnov porm utiliza uma
tabela prpria e mais adequada a este tipo de situao. (Tabela 6 Campos)
Exerccio: Resolva o exerccio anterior estimando os parmetros populacionais.

2.5 TESTE DE ALEATORIZAO DAS ITERAES
Para comprovar a propriedade de aleatoriedade de uma amostra utilizamos o teste de
aleatorizao, que faz uso da anlise das iteraes (seqncia de smbolos idnticos).
Este teste, basicamente, verifica o nmero de iteraes existentes na amostra; se o
nmero de iteraes muito grande ou muito pequeno sugere-se falta de aleatoriedade.
2.5.1 - Exigncia do Teste

Exige-se ao menos que os dados sigam uma escala nominal e que eles possam
ser divididos em duas categorias.
2.5.2 Mtodo
Seja n1 o nmero de elementos da categoria 1, n2 o nmero de elementos da
categoria 2 e N = n1 + n2
Se n1 e n2 < 20 verificamos o nmero r de iteraes, obtemos os limites inferior e
superior, que definem o nmero aceitvel de iteraes em caso de aleatoriedade
(Tbua F1 e F2 Siegel)
Se n1 ou n2 > 20 usamos a seguinte aproximao:
r =
2n1n2
+1
n1 + n2
r =
2n1n2 (2n1n2 n1 n2 )
(n1 + n2 ) 2 (n1 + n2 1)
Z=
r r
E fazemos uso da tabela da distribuio normal padro.
18
Exemplo 1: 24 crianas foram avaliadas com relao a um ndice de agressividade e em

seguida converteram-se os dados em sinais positivos (+) e negativos (-), dependendo se o
ndice estava acima ou abaixo da mediana do grupo. Deseja-se verificar a aleatoriedade dos
escores de agressividade com relao ordem em que foram obtidos.
H 0 : Os escores de agressividade ocorrem de forma aleatria
H a : Os escores de agressividade no ocorrem de forma aleatria
Sendo N=24, n1 = 12 e n2 = 12 temos a seguinte seqncia de sinais:
1 2 3 4 5 6 7 8 9 10 11
+ - + + + + - + + + 1 2 3 3 3 3 4 5 5 5 6
12
6
13
6
14
6
15
+
7
16
8
17 18
+
8 9
19 20
+ +
9 9
21
10
22
10
23
10
24
10
Concluso: A Tbua F (Siegel) indica para n1 = n2 = 12 os limites 7 e 19, portanto

r = 10 iteraes no encontra-se na regio de rejeio. No rejeitaremos Ho. Os dados
parecem ter sido gerados de forma aleatria.
Exemplo 2: Deseja-se verificar se a disposio de homens e mulheres numa fila de cinema se

d de forma aleatria. Foram observados 30 homens e 20 mulheres, que forneceram os
seguintes resultados:
N = 50
n1 = 30
n2 = 20
r = 35
r =
r =
2.30.20
+ 1 = 25
50
2.30.20(2.30.20 30 20)
(30 + 20) 2 (30 + 20 1)
Z=
= 3,356
35 25
= 2,98
3,356
Concluso: Pela Tabela da Normal Padro temos pelo teste bilateral um p-valor igual a
0,0028. Assim, rejeitamos a hiptese nula. Na fila observada, a ordem de homens e mulheres
no foi aleatria.
19
Exerccio: Suponha que um teste de QI tenha sido aplicado a 8 homens e 8 mulheres

candidatos a um certo cargo de uma empresa. Os resultados foram os seguintes:
Sexo
QI
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
H
H
M H
M M M H
M M M H
H
H
H
M
125 127 128 132 133 135 136 137 140 141 142 143 144 145 146 147
Temos evidncias para acreditar que a ordem dos quocientes no seja aleatria?
2.5.3 - Discusso do mtodo

Observe neste exerccio que tnhamos uma varivel em escala intervalar e que
esta foi transformada em nominal, levando a uma perda considervel de observaes.
Neste caso, seria mais adequada a verificao da suposio de normalidade e se
atendida aplicar um teste paramtrico.
Se no atendido o pressuposto, deveramos tentar a aplicao de uma tcnica
no-Paramtrica para comparao de duas amostras, que veremos mais adiante.
20
Muitas vezes estamos interessados na comparao de dois tratamentos. No entanto

muito comum ocorrer uma grande disparidade entre os elementos dos grupos.
Para evitar que um grupo de indivduos seja naturalmente superior ao outro, comum
proceder algum tipo de pareamento entre os indivduos. O tipo mais comum de pareamento
utilizando cada indivduo como seu prprio controle, submetendo-o aos dois tratamentos em
ocasies diferentes. Outro tipo de pareamento tentar selecionar, para cada par, indivduos
que sejam to semelhantes quanto possvel. Por exemplo: Gmeos, rgos (ouvidos, braos,
ps etc..). Os testes no paramtricos apropriados a experimentos com amostras relacionadas
so os seguintes:
3.1 TESTE DE MCNEMAR
um teste aplicvel a situaes do tipo antes e depois onde cada indivduo
observado duas vezes: antes e depois de um certo tratamento e deseja-se testar a eficincia do
tratamento. Cada indivduo se encaixa em uma das duas categorias de resposta, antes e depois
do tratamento. Este teste avalia a mudana de uma categoria para outra.
3.1.1. Exigncias do Teste
Dados em escala nominal ou ordinal (dicotmicos);
Os pares ( X i , Yi ) so mutuamente independentes onde X i representa a situao
pr e Yi representa a situao ps do i-simo indivduo.
3.1.2 Mtodo
As freqncias observadas no experimento devem ser classificadas no quadro
abaixo:
Antes
A
B
Depois
A
B
a
b
c
d
a+c
b+d
a+b
c+d
A hiptese nula admite que as mudanas ocorridas nos dois sentidos no so

significativamente diferentes.
21
Devemos considerar dois casos:

b + c 20 , neste caso devemos aplicar o teste binomial considerando
1
p 0 = , N = b + c e x a menor freqncia entre b e c.
2
b + c > 20 , utilizamos o teste de 2 com 1 grau de liberdade adaptado da
seguinte forma:
2
(
b c)
=
2
b+c
Exemplo 1: Dois supermercados disputam a preferncia dos consumidores de uma cidade. O

supermercado A realiza ento uma campanha com distribuio de prmios para aumentar o
nmero de fregueses. 100 consumidores foram acompanhados antes e depois da campanha,
onde perguntou-se a cada um deles sobre a sua preferncia. Os resultados seguem abaixo:
Antes
A
B
Depois
A
B
37
3
13
47
50
50
40
60
Teste agora a eficincia da campanha.

Como b + c 20 aplicamos o teste Binomial:
N = b + c = 16
x=3
3
p =
= 0,1875
16
H 0 : P ( A, B ) = P (B, A)
H a : P ( A, B ) < P (B, A)
P(B 3) = 0,0106 (corresponde ao p-valor)

Concluso: Existem evidncias para afirmar que a campanha foi eficiente.
22
Exemplo 2: Numa campanha poltica, aps uma srie de fatos que supostamente denegririam
a imagem do candidato B em favor do candidato A, investigou-se as mudanas ocorridas com
relao preferncia do eleitorado. Os resultados so os seguintes.
Antes
A
B
H 0 : P ( A, B ) = P(B, A)
2
(
47 18)
=
2
47 + 18
Depois
A
B
83
47
18
52
101
99
versus
130
70
H a : P( A, B ) > P (B, A)
= 12,93 cujo p-valor < 0,001
Concluso: Os fatos, na verdade, foram prejudiciais ao candidato A. Rejeitamos a hiptese de

nulidade.
Exerccio: Antes da implantao do divrcio no Brasil, 400 funcionrios de uma empresa

foram entrevistados, posicionando-os contra ou a favor. Depois de implantado, os mesmos
funcionrios foram novamente entrevistados. Houve mudana significativa de opinio dos
entrevistados?
Depois
Antes Contra Favor
116
24
Contra
48
212
Favor
164
236
140
260
23

Quando os dados possuem escala nominal, a prova de McNemar a nica opo.
Quando os dados permitem a aplicao de uma tcnica paramtrica como teste t para amostras
pareadas, a eficincia desse teste inferior.
Ex: para b + c = 6
eficincia = 95% e b + c > 30
eficincia = 63% .
3.2 TESTE DO SINAL

Este teste aplicado a situaes onde se deseja estabelecer comparao entre dois
tratamentos sendo um deles o controle. Visando a reduo da heterogeneidade entre os grupos
feito um pareamento das unidades amostrais. Este processo se faz necessrio para evitar
qualquer influncia de fatores colaterais nos resultados da pesquisa. Este teste na verdade
1
uma Prova Binomial com p 0 = .
2

Os pares ( X i , Yi ) so mutuamente independentes para i = 1, 2, ..., n ;
A escala de mensurao ao menos ordinal.
3.2.2 O Mtodo
Consiste na atribuio de sinais + ou - para cada situao dependendo
da diferena observada, e ento testar se a mediana nula. Da o nome Teste dos
Sinais.
Pequenas Amostras
1
, N sendo
2
o nmero de pares, e x o nmero de sinais que corresponde menor freqncia.
(Tbua D Siegel). Deve-se calcular P(X x).
Caso N 25 , fazemos uso da Prova Binomial considerando p0 =
24
Grandes Amostras
Quando N > 25 utilizamos a Aproximao Normal fazendo
N
2 = 2x N
N
N
4
x
z=
Empates
Algumas vezes pode ocorrer X i = Yi , ou seja , no h diferena entre os escores do par i.
Neste caso, os empates so eliminados da anlise.
Exemplo 1: Para se testar a eficincia de um novo herbicida, foram analisadas 10 reas. Em

cada rea, metade foi tratada e a outra metade no. Os dados foram os seguintes.
Tabela 3.1 Distribuio do Peso em gramas de ervas daninhas
em reas que receberam um certo tipo de tratamento e outras que no
receberam nenhum tratamento.
X= Grupo Controle Y Grupo Tratado com o novo Herbicida
rea Sinal
(X-Y)
1
+
2
+
3
+
4
+
5
6
+
7
+
8
+
9
+
10
+
Verifique se o herbicida foi eficiente.
H 0 : O herbicida no eficiente (Mediana=0)
H a : O herbicida eficiente (Mediana +)
25
Como a amostra pequena, usamos a prova Binomial onde n = 10, p =

p = 0,10
P( X 1) =
1
ex=1
2
10 1 10 10 1 10
+
= 0,0107 Assim o p-valor = 0,0107 inferior a 0,05.
1 2
0 2
Concluso: Rejeitamos a hiptese nula, ento podemos dizer que o herbicida eficiente.
Exemplo 2: Extraiu-se uma amostra de 100 adultos de uma comunidade e perguntou-se a

cada um a opinio sobre o tipo de punio a ser aplicado em casos de delinqncia juvenil (se
mais forte ou mais fraca) . Em seguida exibiu-se um filme sobre instituies de reabilitao,
depois repetiu-se a pergunta. Os resultados seguem no quadro abaixo.
Antes
+
-
Depois
+
59
7
8
26
H 0 : O filme no produz efeito

H a : O filme produz efeito
Utilizamos o teste do sinal devido a escala ser ordinal e temos uma amostra
consideravelmente grande. Como houveram 15 empates, estes so excludos da anlise.
Assim, sob Ho, de se esperar que metade dos demais 85 entrevistados mudem sua opinio
de para + e a outra metade, de + para -.
Assim
z=
59 (42,5)
85
4
= 3,58 em que o p-valor = 0,00034.
Concluso: Rejeitamos H0, assim o filme teve efeito significativo sobre a atitude dos adultos.
26
Exerccio: Uma firma submeteu 8 de seus empregados a um treinamento intensivo sobre um

novo mtodo a ser implantado, visando a um maior rendimento na produo. O resultado em
nmero mdio de peas produzidas por empregado segue abaixo:
Tabela 3.2 Distribuio do nmero mdio de peas
produzidas pelos empregados submetidos a
dois tipos de treinamentos.
Empregado
Sinal
1
2
3
4
5
6
7
8
+
+
+
+
+
0
Compare a eficincia dos dois mtodos

A prova dos sinais exige nvel de mensurao pelo menos em escala ordinal,
ao contrrio do Teste de McNemar que aceita um nvel de mensurao em escala
nominal.
3.2.4 Poder Eficincia

n=6
95%
n>6
63%
27
3.3 TESTE DE WALSH

Este teste se aplica a dados pareados onde supe-se que diferenas entre os escores
(dis) provm de distribuio simtrica, no necessariamente Normal, ou seja, a mdia
aproximadamente igual a mediana.
O objetivo, como sempre, verificar o efeito de um tratamento aplicado a indivduos
(antes e depois)

Nvel de Mensurao em escala intervalar
3.3.2 O Mtodo
Considere a tabela abaixo, onde so ilustrados os dados observados e os
escores de diferenas.
Tabela 3.3 Dados observados e escores de diferena
X
x1
x2
x3
y1
y2
y3
d1
d2
d3
xj
yj
dj
xn
yn
dn
1
2
Devemos ordenar os d i ' s em ordem crescente, levando em conta o sinal (+ ou - ). As

hipteses a serem testadas esto definidas a seguir:
0
H 0 : Mediana = 0
versus
Aps ordenarmos os escores
H a : Mediana > 0
<0
d i ' s tais que d1 d 2
dj
dn
consultamos a Tabela H Siegel que nos indicar a regra de deciso do teste. Esta
regra depende do tamanho da amostra n, se o teste unilateral ou bilateral, e o valores
dos d i ' s .
28
Exemplos de utilizao da Tabela
1
(d + d 2 ) > 0
a) n = 5 , H a : > 0 Se 2 1
d1 > 0
b) n = 6 , H a : < 0 Se mx d 5 ou
p = 0,062
p = 0,031
1
(d 4 + d 6 )
2
<0
Exemplo 1 Quinze sujeitos participaram de um experimento que consistia em aprender 10

slabas sem sentido e associar a 5 delas uma reao negativa (choque eltrico). Aps 40 horas
foi solicitado aos indivduos que evocassem a lista com as 10 slabas. O pesquisador suspeita
que as slabas no associadas aos choques sero mais lembradas:
H 0 : Os indivduos escolheram igualmente os dois grupos de slabas.
H a : As slabas no associadas a choques sero mais evocadas.
Indivduo
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
Sem
Choque
5
4
3
5
2
4
2
2
4
4
3
1
5
3
1
Com
Choque
2
2
0
3
3
2
3
1
1
3
4
2
2
4
0
D
3
2
3
2
-1
2
-1
1
3
1
-1
-1
3
-1
1
29
Pela tabela H, considerando n = 15, teste unilateral e:

d 1 = d 2 = d 3 = d 4 = d 5 = 1
d 6 = d 7 = d8 = 1
d 9 = d 10 = d11 = 2
d 12 = d13 = d 14 = d15 = 3
min
1
(d1 + d12 ), 1 (d 2 + d11 ) > 0
2
2
Verdadeira
min
1
(d1 + d11 ), 1 (d 2 + d10 ) > 0
2
2
Verdadeira
1
(d1 + d10 ), 1 (d 5 + d 6 ) > 0 Falsa
2
2
p (unilateral ) = 0,023 e p (bilateral ) = 0,047
min
Concluso: Rejeitamos a hiptese nula. O nmero de slabas evocadas sem choque

significativamente superior ao nmero de slabas evocadas com choque.
Exerccio: Trabalhando-se com duas variedades de cana-de-acar, constatou-se que a

variedade B produzia acima de 15% a mais do que a variedade A. Para a comprovao de
tal resultado, foram consideradas as unidades de produo (t/he) das duas variedades, em
10 locais distintos, segundo a tabela abaixo:
Tabela 3.4 Distribuio da produo das variedades de cana-de-acar
em 10 locais diferentes
Locais
X
Y
X* = 1,15 * X
Variedade A Variedade B 1,15 * Var.A Y-X* d
D
1
75,8
93,5
87,2
2
84,3
100,2
96,9
3
78,4
95,4
90,2
4
81,5
98,6
93,7
5
85,6
102,5
98,4
6
68,7
80,5
79,0
7
70,4
73,6
81,0
8
79,7
93,5
91,6
9
78,3
94,6
90,0
10
83,5
105,1
96,0
Assumindo que as diferenas se distribuem de forma simtrica, construa as hipteses
apropriadas comparando as duas variedades de cana-de-acar.
30
3.3.3 Discusso
Comparada prova paramtrica t, a prova de Walsh acusa poder eficincia de
95% para a maioria dos valores de n e .
31
3.4 TESTE DE WILCOXON

Este teste para dados pareados, ao invs de considerar apenas o sinal das diferenas
entre os pares, considera o valor dessas diferenas, sendo assim um teste No Paramtrico dos
mais poderosos e populares. Este teste o primeiro que veremos que utiliza ranks, pois
atribui postos ao ordenar as diferenas entre os pares.

Os pares ( X i , Yi ) so mutuamente independentes;
As diferenas di so variveis contnuas, com distribuio simtrica;
Nvel de mensurao em escala intervalar.
3.4.2 O Mtodo
Considere, as diferenas dis onde di = Yi - Xi. Devemos ordenar os dis,
porm agora sem considerar o sinal da diferena (em mdulo).
Pequenas Amostras
Considere T sendo a menor soma dos postos de mesmo sinal. A tbua G Siegel apresenta valores de T tabelados e respectivos nveis de significncia
associados.
Compara-se ento o valor de T calculado com aqueles tabelados. O objetivo
testar se a mediana nula, ou seja,
H 0 : Mediana = 0
H a : Mediana > 0
Mediana < 0
Mediana 0
Grandes Amostras (N>25)
Neste caso T tem distribuio aproximadamente Normal e podemos usar a
aproximao considerando:
T =
N ( N + 1)
4
T =
N ( N + 1)(2 N + 1)
24
32
Calcula-se assim a estatstica z =
T T
e compara-se com os valores
tabelados da distribuio de Z (Normal Padro)
Empates
Consideremos duas situaes :
a) Quando Xi = Yi , ou seja, a informao pr eqivale a informao ps para
um mesmo indivduo, descarta-se este par da anlise e redefinimos n como
sendo o nmero de pares tais que X i Yi para i = 1, 2, 3, ... , n.
b) Quando duas ou mais dis tem o mesmo valor atribui-se como posto a
mdia dos postos que seriam atribudos a eles caso no ocorresse empate.
Exemplo
Di
di
Postos
-5
5
5
5
2
2
5
7
10
-13
5
7
10
13
2
4
5
6,5
13
15
13
15
6,5
8
Clculo para
Empates
1+ 2 + 3
=2
3
6+7
= 6,5
2
33
Exemplo 1: Num experimento estudando a prevalncia de ocluso normal em crianas do

sexo masculino e feminino de 11 escolas, obtiveram-se os seguintes resultados:
Escola
1
2
3
4
5
6
7
8
9
10
11
% de ocluso Normal
Masculino (X) Feminino (Y)
8,7
7,7
18,6
9,6
8,0
16,0
12,9
13,4
10,9
9,6
13,4
13,0
11,9
23,7
14,3
6,2
20,0
9,6
14,4
13,8
6,6
15,1
di
di
1,0
9,0
-8,0
-0,5
1,3
0,4
-11,8
8,1
10,4
0,6
-8,5
1,0
9,0
8,0
0,5
1,3
0,4
11,8
8,1
10,4
0,6
8,5
4
9
6
2
5
1
11
7
10
3
8
Verifique se h influncia do sexo na % de ocorrncia de ocluso normal.

Aplicando o teste de Wilcoxon testaremos as seguintes hipteses:
H 0 : me = 0
versus
H a : me 0
Pela Tbua G, T=27 e n = 11 fornece , considerando = 0,05 (bilateral ) um valor limite de

11. Assim p-valor>0,05.
Concluso: No podemos rejeitar Ho, ou seja, a porcentagem de ocluso normal no sofre
influncia do sexo.
Pelo teste de Wilcoxon: recomendvel quando se possvel quantificar as diferenas.

Pelo Teste dos Sinais: recomendvel quando conhecemos somente os sinais das diferenas.
Exemplo 2: No exerccio resolvido utilizando o teste de Walsh no rejeitamos Ho. Aplicando

o teste de Wilcoxon teramos:
Com T=9 e n = 10 teramos um p-valor = 0,032 ( teste unilateral)
Concluso: A deciso aqui seria de rejeitar a hiptese nula.
34
Exemplo 3: Considere o quadro de notas abaixo referente a estudo para comparar a eficincia
de um novo mtodo de aprendizagem.
Aluno
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Nota 1
5.1
4.2
3.3
6
7.1
3.2
2.8
1.4
0.8
5.6
3.8
4.7
6.2
5.4
1.2
2.2
1.9
5.4
5.5
5.2
3.8
4.2
1.8
2.6
4.3
1.4
Nota 2
5.8
4.7
6.1
7.4
6.5
3.2
4.5
3.5
4
5.5
3.9
4.5
5
5.4
6
5
2.2
1.8
5.2
6
4.5
4.7
5.1
2.9
2.6
6.5
di
0.7
0.5
2.8
1.4
-0.6
0
1.7
2.1
3.2
-0.1
0.1
-0.2
-1.2
0
4.8
2.8
0.3
-3.6
-0.3
0.8
0.7
0.5
3.3
0.3
-1.7
5.1
Postos
10.5
7.5
18.5
14
9
15.5
17
20
1.5
1.5
3
13
23
18.5
5
22
5
12
10.5
7.5
21
5
15.5
24
Utilizaremos uma aproximao para a normal dado que a amostra aqui considerada grande.
H 0 : O novo mtodo no eficiente
H a : O novo mtodo foi eficiente
T =
24(24 + 1)
= 150
4
24.25.49
= 35
24
T = 69 Z = -2,31
Concluso: Como o valor de p igual a 0,0104 existem evidncias para se acreditar que o
novo mtodo eficiente.
35
Exerccio: Um grupo de 8 indivduos se submete a um estmulo. A tabela abaixo apresenta as

medidas de presso sangnea (mm/Hg) antes e depois do estmulo. O pesquisador desconfia
que os estmulos aumentam a presso sangnea. Teste esta afirmao.
Paciente
1
2
3
4
5
6
7
8
Antes (Xi)
118
120
128
124
130
136
128
140
Depois (Yi)
127
128
136
131
135
138
125
136
di (Yi Xi)
Posto
Concluso: No rejeitamos a hiptese de que existe diferena entre a presso sangnea

medida antes e depois do estmulo.
3.4.3 - Discusso
Quando as suposies paramtricas esto atendidas, a eficincia do teste de
Wilcoxon de cerca de 95% tanto para pequenas como para grande amostras.
Embora semelhante, uma prova mais poderosa que a de Walsh.
36
3.5 TESTE DE ALEATORIZAO

Este teste, bastante poderoso, utilizado para se obter a probabilidade exata, sob Ho,
da ocorrncia de um resultado qualquer relacionado a pares de dados. No se exige aqui
verificao da suposio de Normalidade. Este teste usa basicamente todas as combinaes
possveis de resultados (2n), levando em conta o sinal, e verifica quantas somas dessas
combinaes se encontram acima de um certo valor crtico, valor este definido pelo nvel de
significncia.
Se o resultado observado estiver dentro da regio de rejeio, rejeitamos Ho.

Escala de mensurao em nvel intervalar.
3.5.2 O Mtodo
Pequenas Amostras (n <12)
Primeiramente calcula-se o nmero de combinaes possveis de resultados
variando-se o sinal das diferenas encontradas (2n). Define-se, pelo nvel de
significncia, o nmero de combinaes que iro definir a regio de rejeio.
Compara-se ento a soma de escores observada com os valores crticos das regies de
rejeio.
Grandes Amostras
Se 12< n <25, no prtico utilizar o teste de aleatorizao. Sugere-se

aplicao da prova de Wilcoxon;
(d )2 5
Se n 25 e as diferenas no variam muito, tal que mx 2
aplica2n
di
se a aproximao normal, utilizando-se:
Mdia = 0
desvio padro =
d i2
Utilizamos neste caso a Tbua A Siegel

(d mx )2 5
>
deve-se aplicar o teste de Wilcoxon.
2n
d i2
z=
di
d i2
da Normal Padro. Caso
37
Exemplo1: Considere a comparao de dois tratamentos aplicados a indivduos de forma

pareada onde foram obtidos os dados abaixo.
Indivduo
1
2
3
4
5
6
7
8
Antes
38
46
61
18
35
72
24
47
Soma das diferenas
Depois
19
19
62
12
28
59
28
44
Diferena
+19
+27
-1
+6
+7
+13
-4
+3
+70
Assim, teremos 28 = 256 resultados diferentes se alterarmos os sinais das diferenas

observadas. Exemplo: +19, +27, -1, +6, +7, +13, -4, -3; um resultado diferente do observado
e assim por diante.
Se definirmos o nvel de significncia em = 0,05 , teremos que 256x0,05 =12,8 que
o nmero de resultados que devero pertencer a regio de rejeio. Se considerarmos apenas
12
os 12 resultados mais extremos, teremos = 0,047
. Definimos ento as hipteses:
256
H0: Os dois tratamentos no diferem entre si;
Ha: Os dois tratamentos diferem entre si.
Teremos uma regio de rejeio bilateral, ficando dessa forma, 6 resultados para as
somas de escores positivos e os outros 6 para somas de escores negativos.
Dado que obtivemos uma soma de diferenas igual a +70, esta soma cair na regio
de rejeio caso esteja entre as 6 somas extremas positivas, so elas:
Resultados
1
2
3
4
5
6
+19
+19
+19
+19
+19
+19
+27
+27
+27
+27
+27
+27
+1
-1
+1
+1
-1
-1
+6
+6
+6
+6
+6
+6
+7
+7
+7
+7
+7
+7
di
+13
+13
+13
+13
+13
+13
+4
+4
+4
-4
+4
-4
+3
+3
-3
+3
-3
+3
80
78
74
72
72
70
O resultado observado se encontra portanto na regio de rejeio

d i = 70
Concluso: Rejeitamos H0, portanto existe diferena significativa entre os tratamentos.
38
Exerccio: Um grupo de 6 pilotos da Aeronutica testou dois novos altmetros digitais quanto
quantidade de erros de leitura. Os escores para cada piloto, deste teste de induo ao erro,
foram os seguintes :
1
2
3
4
5
6
Altmetro A
73
78
82
71
81
90
Altmetro B
78
81
83
74
80
81
Diferena
5
3
1
3
-1
-9
Teste a diferena entre os altmetros.
3.5.3 Discusso
Dado que o teste de aleatorizao utiliza todas as informaes da amostra, o
seu poder-eficincia de 100%. Recomenda-se o uso desta prova sempre que n no
afete a praticidade do teste.
39
Estes testes se aplicam a planos amostrais onde se deseja comparar dois grupos
independentes . Esses grupos podem ter sido formados de duas maneiras diferentes:
a) Extraiu-se uma amostra da populao A e outra amostra da populao B;
b) Indivduos da mesma populao foram alocados aleatoriamente a um dos dois tratamentos
em estudo.
Diferente do caso de dados pareados, no se exige que as amostras tenham o mesmo
tamanho.
Quando as suposies paramtricas so atendidas, o teste t de Student para amostras
independentes mais adequado para comparao das mdias dos grupos.
Quando estas no so atendidas, deveremos aplicar alguma das provas no-paramtricas
apresentadas a seguir:
4.1 TESTE EXATO DE FISHER
Este teste faz uso de tabelas de contingncia 2X2, para se comparar 2 grupos. indicado
quando o tamanho das duas amostras independentes pequeno e consiste em determinar a
probabilidade exata de ocorrncia de uma freqncia observada, ou de valores mais extremos.
Amostras aleatrias e independentes;
Duas classes mutuamente exclusivas;
Nvel de Mensurao em escala nominal ao menos.
4.1.2 O Mtodo
Considere a definio de duas amostras I e II, agrupadas em duas classes e +.
I
II
A
C
A+C
+
B
D
B+D
A+B
C+D
N
Calculamos, em seguida, a probabilidade de interesse. Por exemplo, a probabilidade

de ocorrncia das freqncias observadas nas caselas acima, se faz com o uso da
distribuio hipergeomtrica, ou seja:
40
P=
A+C
B+D
B
N
A+ B
Ou da mesma forma:
P=
( A + B )!(C + D )!( A + C )!(B + D )!

N ! A! B!C! D!
Como a hiptese deseja testar a probabilidade de ocorrncia de uma situao mais

extrema, devemos calcular as probabilidades referentes as freqncias observadas e das
demais situaes extremas.
Exemplo 1: Numa classe de 24 alunos, comparou-se o rendimento de estudantes

provenientes de escolas particulares e escolas pblicas. Os resultados seguem abaixo:
A (Particular)
B (Pblica)
Acima da Mdia Abaixo da Mdia

5
7
10
2
15
9
12
12
24
H 0 : P ( A) = P ( B )
H a : P ( A) P ( B )
P2 =
12!12!15!9!
= 0,04
24!5!7!10!2!
P1 =
12!12!15!9!
= 0,0045
24!4!8!11!1!
P0 =
12!12!15!9!
= 0,0002
24!3!9!12!0!
Assim p = p0 + p1 + p2 = 0,0447 (teste unilateral) e 2p = 0,0894 (teste bilateral)
41
Exemplo 2: Num estudo sobre fecundidade de duas raas bovinas foram feitos
acasalamentos obtendo-se os seguintes resultados:
Raa A
Raa B
Total
Fecundos No - Fecundos
3
7
4
1
7
8
Total
10
5
15
Verifique se as duas raas diferem quanto fecundidade.

p-valor = 0,1002 ( teste bilateral)
Exerccio: Numa pesquisa sobre desquites, realizada entre as classes mdia e alta, foram
obtidos os seguintes resultados.
Classe
Alta
Mdia
Total
Amigvel
6
2
8
No - Amigvel
4
8
12
Total
10
10
20
A proporo de desquites amigveis maior na classe alta?
4.1.3 Discusso
O Teste Exato de Fisher a alternativa ao caso de duas amostras
independentes, quando o tamanho da amostra pequeno, pois nesse caso o teste
2 no se aplica.
42
4.2 TESTE DE 2
Aplicvel a dados representados em forma de freqncia para detectar significncia
estatstica da diferena entre dois grupos independentes. Tem as mesmas caractersticas do
teste para uma amostra, com os mesmos procedimentos e restrio com relao ao tamanho
das freqncias.

Nvel de mensurao em escala nominal(ao menos);
N>20 e freqncias esperadas superiores a 5 quando ocorre o caso 2x2;
Se k>2, o nmero de clulas com freqncia esperada inferior a 5 deve ser menos
de 20% do total de clulas.
4.2.2 O Mtodo
Testamos a hiptese nula obtendo a estatstica
2
(O E )2
E
onde
Freqncia Observada
Freqncia Esperada
Obtemos os valores crticos de 2 atravs da consulta a Tbua C Siegel

definindo o nvel de significncia e os graus de liberdade:
g .l. = (k 1)
43
Exemplo 1: Antes da descoberta da teoria da doena causada por germes a taxa de

mortalidade aps cirurgias era muito alta devido infeco. Louis Pasteur e Joseph Lister
foram os grandes responsveis pela teoria dos germes. Lister achava que se cido carblico
fosse usado como um desinfetante, a chance de sobrevivncia do paciente poderia ser
melhorada. Ele o utilizou para desinfetar tudo na sala de operao que pudesse ter contato
com o paciente. As roupas do paciente tambm foram desinfetadas. Lister comparou 40
operaes (amputaes) nas quais este procedimento foi utilizado, com 35 amputaes nas
quais ele no tinha sido usado. Os resultados so sumarizados na tabela abaixo:
cido usado
cido no usado
Total
Paciente
viveu
34
19
53
Paciente
morreu
6
16
22
Total
40
35
75
Ao nvel de significncia de 1%, teste se o uso ou no do cido carblico interfere no

resultado da cirurgia (paciente viveu ou morreu), ou seja, se a proporo de pacientes
sobreviventes com o uso do cido maior do que a proporo de pacientes sobreviventes sem
o uso do cido.
H 0 : A taxa de mortalidade no se altera com o uso do cido carblico;
H a : A taxa de mortalidade diminui com o uso do cido carblico.
Observados
Usou
No usou
2
(O E ) 2
E
+
34
19
6
16
Esperados
Usou
No usou
+
28,27
24,73
11,73
10,27
= 1,16 + 2,8 + 1,33 + 3,2 = 8,49
com 1 grau de liberdade sendo que 0,001 < p < 0,01

Concluso: Rejeitamos a hiptese nula pois o p-valor baixo. A proporo de pacientes
sobreviventes com uso do cido carblico na desinfeco significativamente superior
proporo de sobreviventes sem uso do cido.
44
Exemplo 2: Considere um estudo em que o objetivo saber, se ser alta ou baixa, definir se
uma pessoa ser lder ou no. Os dados seguem abaixo:
Lder
Liderado
No-Classificado
Baixo
12 (19,9)
22 (16,3)
9 (6,8)
Alto
32 (24,1)
14 (19,7)
6 (8,2)
H0: baixo=alto
Ha: baixo alto
2 = 10,67
g .l. = (3 1)(2 1) = 2
0,001 < p valor < 0,01
Concluso: Rejeitamos a hiptese nula pois o p-valor baixo. Podemos afirmar que,
estatisticamente, a altura das pessoas define a liderana. O fato da pessoa ser alta aumenta sua
probabilidade de se tornar lder.
Exerccio
Em 2 hospitais foram coletados a quantidade de pacientes em 5 diagnsticos diferentes
conforme tabela abaixo. Teste se h diferena entre os hospitais.
Hospital 1
Hospital 2
Total
D1
34
12
46
D2
16
6
22
D3
12
6
18
D4
4
4
8
D5
2
0
75

Deve-se destacar, sobre este teste, a sua aplicabilidade a situao em que as
freqncias so suficientemente grandes e o nvel de mensurao pelo menos
nominal.
No caso em que certas freqncias so pequenas, utiliza-se o critrio de
agrupar classes, tomando-se o cuidado de preservar o sentido das classes. Por exemplo
em uma situao com mensurao nominal, pode no ser correto agrupar certas
classes:
Negro Amarelo Branco Mestio Pardo
5
3
12
8
3
Sugere-se que, quando n<20, se utiliza a prova exata de Fisher. Quando n
grande o poder do teste tende para 1.
45
4.3 TESTE DA MEDIANA

Este teste, como o nome sugere, se utiliza da mediana para efetuar a comparao de
dois grupos independentes. Assim, o teste se baseia no clculo da possibilidade de que os dois
grupos provenham de populaes com a mesma mediana.

O nvel de mensurao em escala ordinal
4.3.2 O Mtodo
Primeiramente devemos obter o valor mediano referente aos dados fornecidos
pelos dois grupos, conjuntamente (mediana combinada).
Em seguida devemos construir a tabela de contingncia 2X2 abaixo.
Acima da mediana
Abaixo ou igual a mediana
Grupo I Grupo II
A
B
C
D
Com o auxlio da distribuio hipergeomtrica calcula-se a probabilidade de

ocorrncia dessa disposio de freqncias.
A+C
P ( A, B ) =
B+D
A
B
A+ B+C + D
n1 = A + C
n2 = B + D
A+ B
Como a hiptese deseja testar a probabilidade de ocorrncia de uma situao mais
extrema, devemos calcular as probabilidades referentes as freqncias observadas e das
demais situaes extremas, assim como no Teste exato de Fisher.
Se P(A, B) inferior ao nvel de significncia, rejeitamos Ho.
46
Exemplo 1: Os dados apresentam escores de um teste de inteligncia emocional aplicado a

funcionrios de dois setores de uma empresa: Recursos Humanos e Controle de Qualidade.
Verifique a hiptese de que as amostras provm de populaes com a mesma mediana.
H0: Os escores de inteligncia emocional dos dois setores provm de populaes com a
mesma mediana.
Ha: Os escores de inteligncia emocional dos dois setores no provm de populaes com a
mesma mediana.
RH
15
12
13
18
9
11
12
13
14
14
12
12
11
10
n1=14
CQ
8
7
14
10
8
6
7
6
8
4
A mediana obtida neste caso igual a 11
Acima
Abaixo ou igual
RH
10
4
14
CQ
1
9
10
11
13
n2=10
14 10
P ( A, B ) =
10 1
24
= 0,004
11
47
Exerccio: Nos mesmos dois setores da empresa citada anteriormente, registrou-se o salrio
de alguns funcionrios. Verifique agora se os salrios provm de populaes com mesma
mediana.
RH
CQ
(em salrios mnimos)
4
3
8
3
5
7
2
n1=7
11
10
7
6
5
8
9
10
n2=8
A Mediana neste exemplo ser igual a 7.
Acima
Abaixo ou igual
Total
RH
1
6
7
CQ
5
3
8
Total
6
9

Na verdade este teste recai na aplicao do teste exato de Fisher quando o
tamanho da amostra pequena (n < 20) e o teste 2 se n 20.
Para n1 + n2 pequeno o poder eficincia de 95%
Para n1 + n2 grande o poder eficincia de 63%
48
4.4 TESTE U DE MANN WHITNEY

Esta prova se aplica na comparao de dois grupos independentes, para se verificar se
pertencem ou no mesma populao. Na verdade, verifica-se se h evidncias para acreditar
que valores de um grupo A so superiores aos valores do grupo B.

Nvel de Mensurao em escala ordinal (pelo menos);
Amostras independentes.
4.4.2 O Mtodo
Pequenas Amostras
Primeiramente ordenam-se os valores misturados dos dois grupos, em ordem
crescente indicando sempre a que grupo cada valor pertence.
Em seguida, fixando-se nos valores referentes ao menor dos grupos (I), contamos o
nmero de vezes que um valor no grupo (I) precede um valor no grupo (II).
Para no restar dvidas sobre qual o grupo que deve ser fixado para o clculo da
estatstica U, conveniente calcular-se para cada grupo. U ser o menor deles. O
maior ser U .
Exemplo:
6
II
8
II
9
I
I
II
10
II
9
6
11
I
11
8
13
II
15
10
15
I
13
U=0+0+1+2=3
U=2 + 3 + 4 = 9
Utilizamos neste caso a Tbua J Siegel.
Quando 9 n2 20 utiliza-se a Tbua K Siegel e calcula-se U fazendo :
n (n + 1)
U = n1n 2 + 1 1
R1 onde R1 a soma dos postos atribudos aos valores
2
do grupo 1.
49
Grandes Amostras (n2 >20)

Utiliza-se neste caso a aproximao Normal dada por:
U =
n1n2
2
U =
n1n2 (n1 + n2 + 1)
12
z=
U U
Exemplo 1 : Num experimento onde se comparavam ratos treinados e ratos sem treinamento
(controle), com relao a um teste de aprendizado, registraram-se os seguintes valores:
Ratos Treinados (E)
Ratos Controle (C)
78 64 75
110 70 53
45 82 II
51
I
45 51 53 64 70 75 78 82 110
E C C E C E E E C
U : nmero de escores E que precedem cada escore C

U = 1+1+ 2 + 5 = 9
U ' = 0 + 2 + 3 + 3 + 3 = 11
H0 : E = C
Ha : E > C
Concluso: Pela Tbua J Siegel, verificamos que para n2 = 5 e U = 9 temos para um teste
unilateral um p-valor = 0,452, portanto no podemos rejeitar a hiptese de que E igual a C.
Exemplo 2: Dois tipos de soluo qumica, A e B, foram ensaiadas para a determinao do

Ph. As anlises de 10 amostras de cada soluo esto apresentadas na tabela que segue.
Verifique se h diferena entre elas.
H0: PHA = PHB

Ha: PHA > PHB
A
7,49
7,35
7,54
7,48
7,48
7,37
7,51
7,50
7,52
7,56
Posto (A)
13
4,5
19
11
11
6
16
14,5
17,5
20
RA = 132,5
B
7,28
7,35
7,52
7,50
7,38
7,48
7,31
7,22
7,41
7,45
Posto (B)
2
4,5
17,5
14,5
7
11
3
1
8
9
RB =77,5
50
U = 100 +
110
132,5
2
U = 22,5
U ' = 100 +
110
77,5
2
U ' = 77,5
O valor crtico para n1 = n2 = 10 em que = 0,05 (teste bilateral ) ser Uc =22,5.
Concluso: Com um p-valor igual a aproximadamente 0,025 no temos evidncias de que
existam diferenas entre as solues qumicas.
Exerccio: Num ensaio sobre competio de variedades de tomates foram considerados as

produes individuais (em kg) de 15 plantas de uma variedade A e dez de uma variedade B,
obtendo-se os seguintes resultados:
Var. A
4.3
3.8
5.2
2.5
3.5
4.1
5.1
4.0
Var. B
2.2
1.8
4.5
1.7
3.6
4.5
5.0
4.2
4.8
4.7
6.5
6.3
5.9
7.2
5.1
6.2
6.8
Verifique se as variveis A e B diferem em produtividade.

Poder-eficincia em torno de 95%.
51
4.5 TESTE DE KOLMOGOROV SMIRNOV

Este teste se aplica na comparao de dois grupos independentes, quando os dados
observados se posicionam de maneira dispersa, quando ordenados em ordem crescente, ou
seja, no possvel notar uma certa distino de um dos tratamentos em relao ao outro. Esta
prova verifica a concordncia entre duas distribuies acumuladas.

Nvel de mensurao em escala ordinal.
4.5.2 O Mtodo
Devemos construir uma distribuio de probabilidade acumulada para cada
uma das amostras, considerando sempre intervalos iguais.
Em seguida, para cada intervalo subtramos uma funo da outra. Seja
k
S n1 ( x) =
onde k o nmero de escores no superiores a X. Da mesma forma
n1
define-se S n2 ( x) para o outro grupo. Assim, deve-se obter:
D = mx S n1 ( x) S n 2 ( x) (caso bilateral )
D = mx[S n1 ( x) S n 2 ( x)] (caso unilateral )
Sugere-se a utilizao de tantos intervalos quanto possvel.
Pequenas Amostras (n1 e n2 40) e n1=n2

Utilizamos a Tbua L Siegel. Se n1 n2 usamos uma tabela mais
completa como a Tabela 9 Campos.
Grandes Amostras (n1 ou n2 > 40)

Utilizamos a Tbua M Siegel no caso bilateral. No caso unilateral,
calcula-se a seguinte estatstica.
2 = 4D 2
n1 n 2
n1 + n 2
Recorre-se ento Tbua C Siegel com graus de liberdade igual a 2.
52
Exemplo 1: No exemplo anterior que se tratava da comparao de duas solues qumicas

com relao ao grau de P.H. obtivemos.
7.49
7.35
7.54
7.48
7.48
A
7.37
7.51
7.50
7.52
7.46
7.28
7.35
7.52
7.50
7.38
B
7.48
7.31
7.22
7.41
7.45
Para verificar se h diferena significativa entre as solues, aplicaremos o teste KS

considerando 7 intervalos.
S10 A (x)
S10 B (x)
S10 A S10 B
7,21-7,25 7,26-7,30 7,31-7,35 7,36-7,40 7,41-7,45

0/10
0/10
1/10
2/10
2/10
1/10
2/10
4/10
5/10
7/10
1/10
2/10
3/10
3/10
5/10
7,46-7,5
7/10
9/10
2/10
7,51-7,55
10/10
10/10
0
D = mx S10 A( x) S10 B( x) = 5 / 10 e conseqentemente KC = 5 (numerador da maior

diferena entre as duas distribuies acumuladas). Pela tabela KD crtico = 7. Desta forma,
no podemos rejeitar Ho.
Concluso: Pelo teste de Mann-Whitney temos que o p-valor aproximadamente 0,05 e pelo
teste de Kolmogorov-Smirnov temos p-valor igual a 0,168 que encontrado a partir da tabela
9 Campos. Assim no temos evidncias para afirmar que existem diferenas significativas
entre as solues qumicas.
Exemplo 2: Um coordenador de um curso deseja saber se os alunos que ingressam via

vestibular tm desempenho diferente dos que entram por outros meios. Os resultados esto
apresentados abaixo:
Ingresso
Aprovados
por mdia
(8,5 10)
Vestibular 10 (0.238)
Outros
6 (0.089)
Aprovados
por mdia
(7 8,4)
28 (0.905)
55 (0.910)
Aprovados
em final
(6 -6,9 )
2 (0.952)
6 (1,0)
Aprovados
em final
(5 5,9)
1 (0.976)
0 (1,0)
Reprovados
(0 4,9)
1 (1,0)
0 (1,0)
D = 0,149 com = 0,05

Dcrtico = 1,36
n1 + n2
= 0,268
n1 * n2
Concluso: No temos evidncias suficientes para rejeitarmos Ho. No podemos afirmar que
existe diferena significativa entre o desempenho dos dois grupos de estudantes.
53
Exerccio: Aplique o teste de Kolmogorov Smirnov com os dados referentes ao ensaio de

variedades de tomates. Compare os resultados.
Var(A)S15A
Var(B)S10A
S15A-S10A
1.6-2.1
1/15
0
2.2-2.7
3/15
0
2.8-3.3
3/15
0
3.4-3.9
7/15
0
4.0-4.5
12/15
1/10
4.6-5.1 5.2-5.7 5.8-6.3 6.4-6.9 7.0-7.5

14/15 15/15
1
1
1
4/10
4/10
7/10
9/10
1
4.6 - TESTE DAS ITERAES DE WALD-WOLFOWITZ

Este teste se aplica a comparao de dois tratamentos (grupos), para se verificar se
existe diferena entre eles, com relao a diversos aspectos:
Tendncia central;
Variabilidade;
Assimetria;
etc;

Nvel de mensurao em escala ordinal (pelo menos).
4.6.2 - Mtodo
Primeiramente, deve-se ordenar os n1 + n2 escores em ordem crescente.
Determina-se, em seguida, o nmero de iteraes desta srie ordenada.
A idia do teste consiste em verificar se os valores desta srie estaro bem
misturados, o que indica ento, que os dois grupos devem pertencer mesma
populao. Se isso se verificar, r, o nmero de iteraes, ser bastante alto.
Pequenas amostras (n1 e n2 20)

A tbua F1 - Siegel fornece os valores crticos de r para um nvel de significncia
de 5%. Se r menor que o valor crtico fornecido pela tabela, deveremos rejeitar H0.
Grandes amostras (n1 ou n2 > 20)
54
Neste caso, utiliza-se a aproximao Normal, fazendo:
r =
r =
2n1n2
+1
n1 + n2
2 n1n2 ( 2 n1n2 n1 n2 )
( n1 + n2 ) 2 ( n1 + n2 1)
e obtendo-se
z=
r r
. Determina-se, ento, o p-valor associado a z, consultando-
se a tabela.
Obs: no caso de empates entre escores de grupos diferentes, deveremos obter
os diferentes nmeros r de iteraes para cada possvel srie, considerando todas as
ordenaes possveis. Se alguns rs fornecerem resultados significativos e outros no,
devemos tirar a mdia de todos os p-valores obtidos.
Poder Eficincia
Cerca de 75% para amostras de tamanho 20.
55
4.7 - TESTE DE ALEATORIZAO PARA DUAS AMOSTRAS INDEPENDENTES

Esta prova bastante til na comprovao da hiptese de igualdade entre as
caractersticas de duas amostras independentes pequenas. Consiste em obter a probabilidade
exata associada aos valores observados, supondo que eles pertencem mesma populao.
4.7.1 - Exigncias do Teste

Nvel de mensurao em escala intervalar.
4.7.2 O Mtodo
Pequenas amostras
Inicialmente, calcula-se o nmero de maneiras diferentes que os escores poderiam
n A + nB
estar dispostos, considerando os tamanhos de amostra nA e nB, fazendo
e
nA
assim, o nmero de resultados que iro compor a regio de rejeio ser
n A + nB
nA
Onde o nvel de significncia. Esta regio ser ento, formada pelos resultados
mais extremos.
Verifica-se ento se o resultado observado se encontra entre esses resultados
extremos.
Grandes amostras
Neste caso, aplica-se a aproximao pelo teste t fazendo-se
t=
A B
( B B ) 2 + ( A A) 2 1
1
+
n A + nB 2
n A nB
Esta estatstica tem aproximadamente a distribuio t de Student com g.l.= nA + nB - 2.

Obs. No necessria aqui a verificao de Normalidade e Variabilidade comum.
Exemplo 1:
Poder Eficincia = 100%
56
4.8 - TESTE DE MOSES DAS REAES EXTREMAS

Este teste se aplica em situaes em que existe uma suspeita de que uma determinada
condio experimental afetou de certa forma um grupo de indivduos, e de forma oposta, a
outro grupo. Explicando de outra forma, imagine a ordenao dos dados observados dos
grupos controle (C) e experimental (E). Suspeita-se ento que os valores E se encontram
concentrados em uma (ou ambas) extremidade(s) da srie.

Nvel de mensurao em escala ordinal (pelo menos)
57
Neste captulo sero abordadas tcnicas no-paramtricas de comparao de 3 ou mais

grupos relacionados entre si. Imagine ento a seguinte estrutura de dados:
Bloco 1
Bloco 2
Bloco 3
...
Bloco n
1
X11
X12
X13
..
X1n
TRATAMENTOS
2
3
...
X21
X31
...
X22
X32
...
X23
X33
...
...
...
...
X2n
X3n
...
k
Xk1
Xk2
Xk3
...
Xkn
Onde os blocos representam as unidades amostrais utilizadas no experimento e os

tratamentos so as k condies de avaliao (tempo, dietas, distncia, etc...).
5.1 - TESTE Q DE COCHRAN

Este teste uma extenso do teste de McNemar para duas amostras e se aplica na
verificao de diferena significativa entre 3 ou mais grupos de freqncias ou propores.
5.1.1 - Exigncia Do Teste
Nvel de mensurao em escala Nominal ou Ordinal dicotomizada
58
5.1.2 - Mtodo
Se considerarmos a disposio de dados ilustrada acima, com n linhas e k
colunas, podemos testar a diferena entre os k tratamentos fazendo uso da expresso:
k
( k 1) k
j =1
Q=
k
i =1
G j2
Li
k
j =1
Gj
n
j =1
L2i
onde Gj o total da coluna j e Li o total da linha i. A estatstica Q acima tem

distribuio aproximadamente Qui-quadrado com g.l. = k-1. (Tbua C - Siegel)
Exemplo 1: Estamos interessados em analisar a influncia da atitude de um entrevistador
sobre as respostas a uma pesquisa sobre opinio pblica, dadas pelas donas de casa. Os
entrevistadores so treinados de acordo com os seguintes mtodos:
I Demonstrando interesse, cordialidade, entusiasmo;
II Demonstrando formalismo, reserva e cortesia;
III Demonstrando modo abrupto, formalismo spero.
Cada entrevistador visita 18 casas (uma casa em cada bairro) e aplica um dos mtodos
de abordagem. Os resultados esto demonstrados a seguir.
Bairro
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
Gj
Ent.1
0
1
0
0
1
1
1
0
1
0
1
1
1
1
1
1
1
1
13
Ent.2
0
1
1
0
0
1
1
1
0
0
1
1
1
1
1
1
1
1
13
Ent.3
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
1
0
0
3
Li
0
2
1
0
1
2
2
1
1
0
3
3
2
2
2
3
2
2
29
59
H 0 : A probabilidade de um sim na resposta a mesma nos trs tipos de entrevistas.

H a : A probabilidade de um sim na resposta difere entre pelo menos dois tipos de
entrevistas.
Q=
(3 1)[3(13 2 + 13 2 + 3 2 ) (29) 2 ] 400

=
= 16.7
3.29 63
24
Pela Tbua C com 2 graus de liberdade temos um p-valor inferior a 0,001.

Concluso: Existe diferena significativa entre as formas de abordagem.
Exemplo 2: Um fabricante de sapatos para senhoras mostra 4 de seus ltimos lanamentos

(A,B,C e D) a 7 compradores de lojas de calados. As encomendas esto resumidas abaixo.
Estabelecer e testar a hiptese adequada.
Comprador
1
2
3
4
5
6
7
A
X
Modelo
B
C
X
X
X
X
X
X
X
X
X
X
3[4(12 + 3 2 + 5 2 + 2 2 ) (11) 2 ] 3.35

Q=
=
= 4,565
4.11 21
23
Pela Tbua C com 3 graus de liberdade temos um p-valor igual a 0,20.
Concluso: No existem diferenas significativas.
60
Exerccio: Um professor deseja descobrir a melhor maneira de demonstrar uma certa frmula
matemtica a seus alunos. Existem 3 maneiras possveis de demonstrar a frmula, mas talvez
seus alunos no as considerem igualmente fceis (ou difceis) de entender. Ele explica cada
uma das 3 demonstraes a seus 18 alunos e depois pergunta a cada estudante qual das 3
demonstraes ele havia entendido. Os resultados esto apresentados abaixo. Existe
diferena entre os trs mtodos?
Estudante
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
G
A
X
X
X
X
X
B
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
C
X
61
5.2 - TESTE DE FRIEDMAN

Este teste til quando deseja-se comprovar a hiptese de que as k amostras
relacionadas provm da mesma populao. Neste tipo de estudo observa-se o mesmo grupo de
indivduos sob cada uma das k condies, ou ento se formam conjuntos de indivduos
homogneos entre si, e estes so alocados aleatoriamente a cada uma das condies.
Podemos considerar este teste uma extenso do teste do Sinal para comparao de
duas amostras pareadas.
5.2.2 O Mtodo
Considera-se aqui a mesma disposio dos dados observada anteriormente,
com n linhas e k colunas. Para cada linha da tabela atribui-se postos de 1 a k (exemplo
Siegel pg. 190).
Calcula-se em seguida a estatstica r2 de Friedman dada por:
2r =
12
nk ( k + 1 )
2
R
3n ( k + 1)
i
i=1
onde Ri a soma dos postos na coluna i.
Pequenas Amostras
No caso em que k = 3 e n = 2 a 9 utiliza-se a tbua N -Siegel pg. 311; para k = 4
e n = 2 a 4 utiliza-se a tbua N - Siegel pg. 312.
Grandes Amostras
Valores crticos: Tbua C -Siegel com g.l. = k - 1.
62
Exemplo 1: Um teste de consumo de combustvel envolvendo carros produzidos por trs

fabricantes foi realizado e os resultados, em quilmetros por litro de combustvel esto
apresentados na tabela abaixo. Estabelecer e testar a hiptese adequada.
Modelo
G
9,0
9,4
8,1
8,3
8,2
Pequeno
Mdio- 6 cil.
Mdio- 8 cil.
Grande-8 cil.
Esporte
2r =
Fabricante
F
C
11,3
10,6
10,9
10,2
8,6
9,1
8,6
8,8
9,2
9,5
12
(5 2 + 12 2 + 13 2 ) 3.5.4 = 7,6
5.3(3 + 1)
Pela tabela N (Siegel) p valor = 0,024
Concluso: Existem diferenas significativas.
Por comparaes mltiplas:

n 15
RG=5 RF=12 RC=13 |RG-RF|=7
|RG-RC|=8
|RF-RC|=1
Olhar na tabela Campos n=5 e k=3 p-valor=0,039 para a diferena |RG-RC|=8.
Exemplo 2: Uma pesquisa foi delineada para determinar a eficcia de um programa de grupo
para a reduo do estresse baseado em meditao para pacientes com problemas de ansiedade.
Os sujeitos foram selecionados dentre os encaminhados para programas de reduo do
estresse e de relaxamento. Foram coletados dados da Escala Hamilton de Ansiedade em
quatro momentos diferentes: recrutamento (IR), pr-tratamento (Pr), ps-tratamento (Ps) e
trs meses aps o ps-tratamento (3-M). Os dados esto apresentados abaixo. O tratamento
teve algum resultado?
Sujeito
1
2
3
4
5
6
7
8
9
10
11
12
13
14
IR
21
30
38
43
35
40
27
18
31
21
18
28
40
35
Pr
21
38
19
33
34
40
15
11
42
23
24
8
37
32
Ps
16
10
15
30
25
31
11
4
23
21
16
5
31
12
3-M
19
21
6
24
10
30
6
7
27
17
13
2
19
21
63
r2 =
12
(50,5 2 + 47 2 + 23,5 2 + 19 2 ) 3.14.5 = 33,107
14.4.5
Com graus de liberdade igual a 3 temos que o p-valor inferior a 0,001.

Por comparaes multiplas:
R1=50,5 R2=47 R3=23,5 R4=19 k=4 n=14
1=3,5
2=27*
3=31,5*
4=23,5*
5=28*
6=4,5
As diferenas indicadas como * so significativas.
Exerccio: Num ensaio sobre adubao nitrogenada de alface, compararam-se 4 tratamentos:

Tratamento 1: controle
Tratamento 2: 5 g de salitre/10 litros de gua
Tratamento 3: 10g de salitre/10 litros de gua
Tratamento 4: 20g de salitre/10 litros de gua
Os resultados de produo se encontram abaixo:
Blocos
I
II
III
IV
Trat.1
3640
4890
4800
4460
Trat.2
4200
4550
5320
5500
Trat.3
4700
6020
5250
5580
Trat.4
5300
5900
5150
5560
64
5.3 COMPARAES MLTIPLAS
Com a finalidade de complementar a anlise do teste de Friedman, quando a hiptese

H0 rejeitada, devemos proceder ao teste de comparaes mltiplas para identificar as
diferenas entre pares de tratamentos.
5.3.1 O Mtodo
Pequenas Amostras (k e n 15)
Primeiramente, calcula-se para cada par de tratamentos a diferena Ri - Rj onde
Ri a soma de postos atribuda ao tratamento i.
Em seguida obtm-se a diferena mnima significativa (d.m.s.) na tabela 24
(Campos).
As diferenas observadas entre as somas de postos, superiores a d.m.s. indicam
diferenas significativas entre aqueles tratamentos.
Grandes Amostras
Para k e/ou n maiores que 15 calcula-se a d.m.s atravs da expresso
d . m. s. = Q
nk ( k + 1)
12
onde os valores de Q podem ser obtidos na tabela 17 (Campos).
Obs. Para o caso em que o objetivo do estudo comparar um tratamento controle

contra os demais tratamentos ler Campos pg. 252.
Exerccio: Aplicar o teste de comparaes mltiplas aos exemplos e exerccios do teste de
Friedman.
65
Neste captulo sero abordados testes no-paramtricos de comparao de 3 ou mais

grupos independentes entre si, teis quando as suposies paramtricas no forem atendidas.
Consideremos ento, a seguinte estrutura de dados:
TRATAMENTOS
2
3
...
X21
X31
...
X22
X32
...
X23
X33
...
...
...
...
X2m
X3n
...
1
X11
X12
X13
...
X1l
k
Xk1
Xk2
Xk3
...
Xkp
Onde as informaes do tratamento i no esto relacionadas s informaes do tratamento j, e

os tamanhos das amostras em cada tratamento no necessariamente so iguais.
As provas que sero vistas aqui so competidores do teste F (Anlise de Varincia).
6.1 - TESTE DA MEDIANA
A funo deste teste verificar se k grupos independentes pertencem mesma
populao ou populaes com a mesma mediana.
6.1.1 - Exigncias do Teste
6.1.2 O Mtodo
Inicialmente deve-se calcular a mediana geral, considerando todos os valores
observados. Ento, cada escore substitudo por um sinal + (se for superior
mediana) ou - (se no for superior mediana) e estas informaes so representadas
pela tabela k x 2 a seguir:
+
-
1
O1+
O1-
TRATAMENTOS
2
3
...
O2+
O3+
...
O2O3...
k
Ok+
Ok66
Calcula-se, em seguida a estatstica 2 dada por
2 =
(Oj Ej)2
j=1
Ej
2 =
(Oj+ Ej+)2
j=1
Ej+
(Oj Ej )2
j=1
Ej
Onde Ej so as freqncias esperadas relacionadas a cada casela na tabela acima.

Compara-se ento, o valor da estatstica com os valores crticos da Tbua C Siegel considerando-se g.l. = k-1.
Exemplo1: Suponha que se deseja estudar a influncia do nvel de instruo das mes sobre o
grau de interesse das mesmas pela educao de seus filhos. O pesquisador toma o nmero de
visitas espontneas que cada me faz escola durante o ano letivo. Ele obtm o grau
educacional de 44 mes, que iro constituir a amostra.
o
8 grau
4
3
0
7
1
2
0
3
5
1
Grau educacional atingido pela me

10 grau 12o grau Universidade Universidade
(parcial)
(diplomada)
2
2
9
2
4
0
4
4
1
4
2
5
6
3
3
2
3
8
0
0
2
5
5
2
1
1
2
7
1
6
5
1
o
Psgraduao
2
6
H0: No h diferena na mediana de visitas escola nos diferentes nveis educacionais da

me.
Ha: Existe diferena na mediana de visitas escola nos diferentes nveis educacionais da me.
67
2 =
(5 5) 2 (4 5,5) 2
+
+
5
5,5
(4 5) 2
= 1,295
5
p-valor = 0,26
Considerando = 0,05 , N=44 e g.l = k-1 = 4-1=3 (agregando as 3 ltimas classes); assim
pela Tbua C verificamos o valor tabelado de Qui-quadrado e obtemos o valor 7.81.
Concluso: No temos evidncias suficientes para rejeitar H0, portanto no existe diferena no
nvel educacional das mes com relao s visitas na escola.
Exemplo 2: 186 indivduos com excesso de peso foram submetidos a quatro dietas diferentes.
Abaixo esto apresentados os resultados, do peso perdido aps um perodo de quatro semanas.
Verificar se as dietas provm de populaes com a mesma mediana.
Dietas
+
Total
A
23 (18)
13 (18)
36
B
10 (20)
30 (20)
40
C
10 (25)
40 (25)
50
D
50 (30)
10 (30)
60
2 = 1,39 + 5 + 9 + 13,33 + 1,39 + 5 + 9 + 13,33 = 57,44

p valor < 0,001
Concluso: Temos evidncias suficientes para rejeitar Ho, isto significa que as dietas provm
de populaes com diferentes medianas.
Exerccio: Quatro grupos de crianas de escolas pblicas urbanas (A), particulares urbanas
(B), pblicas rurais (C) e particulares rurais (D) so submetidas a um teste fsico. Os
resultados esto apresentados abaixo. Verificar se h diferena no desempenho.
A
16
27
10
17
12
23
21
12
22
B
4
9
13
19
22
18
13
C
12
16
20
24
18
D
15
26
28
29
30
33
21
68
69
6.2 - TESTE DE KRUSKAL-WALLIS

Outro teste til na comparao de k tratamentos independentes o teste de KruskalWallis. Ele nos indica se h diferena entre pelo menos dois deles.
na verdade uma extenso do teste de Wilcoxon para duas amostras independentes e se
utiliza dos postos atribudos aos valores observados.

6.2.2 - Mtodo
Primeiramente deve-se atribuir a cada valor observado, um posto, sempre
atribuindo o menor posto ao menor valor e o maior posto ao maior valor. Aps se
efetuar a soma dos postos para cada tratamento (Rj) calcula-se a estatstica H, onde
12
H=
N ( N + 1)
R2j
j=1
nj
3( N + 1)
QUANDO K = 3
E os njs 6: Compara-se ento este valor com o valor crtico fornecido pela
tabela 14 - Campos, onde n1 n2 n3; Pequenas amostras
QUANDO K > 3 OU PELO MENOS UM nj > 6
Utiliza-se a Tbua C - Siegel com g.l. = k - 1. Grandes amostras
EMPATES
Atribui-se aos empates a mdia dos postos. A estatstica H dever ser dividida
pela correo C (ver exemplo 2)
70
Exemplo 1: Suponha-se que um pesquisador resolva investigar o grau de autoritarismo do

pessoal de escolas, usando a escala de autoritarismo de Adorno e colegas. Os escores esto
apresentados abaixo. Verificar se h diferena entre os grupos.
Professores de
E.F.
96
128
83
61
101
Outros
professores
82
124
132
135
109
POSTOS
TOTAL
4
9
3
1
5
22
Administradores
115
149
166
147
2
8
10
11
6
37
7
13
14
12
46
12
(96,8 + 273,8 + 529) 45 = 6,406
14.15
h = 5,643
H=
0,025 < p < 0,05

Rejeitamos assim Ho. Teremos por esta razo que realizar o teste de comparaes mltiplas
entre os grupos:
R1 R2 = 3 d .m.s = 39,5 = 6,28 p-valor < 0,001

R1 R3 = 7,1 d .m.s = 6,66
p-valor < 0,001
R2 R3 = 4,1 d .m.s = 6,66
p-valor < 0,001
Todas as diferenas so significativas.
71
Exemplo 2: Considere um experimento de alimentao de sunos, em que se usaram 4 raes

(A, B, C, D), cada uma fornecida a 5 animais. Os aumentos de peso observados, em Kg, aps
1 anos foram os seguintes:
A
35 (14,5)
19 (4)
31 (12)
15 (3)
30 (10,5)
44
B
40 (17)
35 (14,5)
46 (20)
41 (18)
33 (13)
82,5
C
39 (16)
27 (6,5)
20 (5)
29 (9)
45 (19)
55,5
D
27 (6,5)
12 (1)
13 (2)
28 (8)
30 (10,5)
28
H = 9,037
Observa-se pela tabela acima 3 empates.
Considere agora t1, t2, t3, o nmero de casos em cada empate.
d.m.s = 9,612
Assim t1= t2=t3= 2.
Calcula-se ento:
T1 = t13 - t1 = 6 . Assim T1 = T2 = T3 = 6 e fazemos:
C = 1
T
N
= 1
18
= 0 ,9 9 7 7
7980
A estatstica do teste chamada agora de H1 ser dada por
H1 =
H
9 , 037
=
= 9 , 058 (0,02 < p < 0,05)
C
0 , 9970
Por comparaes mltiplas:
Ra Rb = 38,5
Ra Rc = 11,5
Rb Rc = 27
p-valor < 0,01

p-valor > 0,05
p-valor = 0,011
Ra Rd = 16
p-valor >0,05
Rb Rd = 54,5 p-valor < 0,01
Rc Rd = 27,5
p-valor < 0,01
Temos como significativas as diferenas entre: A e B ; B e C ; B e D ; C e D.
72
Exerccio: Numa pesquisa sobre qualidade de vinho, foram provados trs tipos por cinco
degustadores. Cada degustador provou 12 amostras (4 de cada tipo) e atribuiu a cada uma
delas uma nota de zero a dez. As mdias das notas atribudas pelos 5 degustadores a cada uma
das amostras foram:
Tipo 1
5,0
6,7
7,0
6,8
Tipo 2
8,3
9,3
8,6
9,0
Tipo 3
9,2
8,7
7,3
8,2
Verifique se h preferncia dos degustadores por algum dos tipos de vinho.
6.3 - COMPARAES MLTIPLAS

Este teste til para complementar a anlise do teste de Kruskal-Wallis e verificar
entre que pares de tratamentos existem diferena significativa.
73
6.3.1 - Mtodo
Pequenas amostras
para ns iguais
Primeiramente, calcula-se para cada par de tratamentos a diferena
Ri - Rj
onde Ri a soma de postos atribuda ao tratamento i.
Em seguida obtm-se a diferena mnima significativa (d.m.s.) na tabela 16 Campos. As diferenas observadas entre as somas de postos, superiores a d.m.s.
indicam diferenas significativas entre aqueles tratamentos.
para ns diferentes
d . m. s. =
N ( N + 1) 1 1
+
h
12
ni n j
onde h obtido pela tabela 14 - Campos e deve-se utilizar
Ri R j
onde Ri =
Ri
ni
Grandes amostras
para ns iguais
Determinam-se as diferenas
d.m. s.= Q
k ( N +1)
12
R i R j e ento calcula-se
em que a tabela 17 - Campos fornece os valores de Q.
74
para ns diferentes
d. m. s. = Z
N ( N + 1) 1 1
+
ni n j
12
onde Z = Z(/[k(k-1)]) obtido na tabela Normal Padro Z.
Exemplos: Verificar diferenas entre tratamentos nos exerccios anteriores do teste de

Kruskal-Wallis.
Exerccio: Trs marcas de lmpadas eltricas so testadas para verificar se elas possuem a
mesma vida mdia. Os dados esto apresentados abaixo. Estabelecer e testar a hiptese
adequada.
A
73
64
67
62
70
65
68
71
Marcas
B
84
80
81
77
82
79
78
83
82
C
82
79
71
75
72
73
75
76
75
Freqentemente estamos interessados em verificar a existncia de associao entre

dois conjuntos de escores e tambm o grau desta associao. O coeficiente de correlao, por
si s, representa o grau de associao. necessrio porm testar a significncia estatstica
deste coeficiente.
No caso paramtrico, a medida usual o coeficiente de correlao r de Pearson que
exige mensurao dos escores no mnimo ao nvel intervalar. Ainda, se estivermos
interessados em comprovar a significncia de um valor observado de r de Pearson deveremos
supor que os escores provenham de uma distribuio normal. Quando estas suposies no
so atendidas podemos utilizar um dos coeficientes de correlao no-paramtricos e suas
respectivas provas de significncia.
7.1 - COEFICIENTE DE CONTINGNCIA C
Este coeficiente mede a associao entre dois conjuntos de atributos quando um ou

ambos os conjuntos so medidos em escala nominal.
Considere uma tabela de contingncia k x r, que representa as freqncias cruzadas
dos escores A (divididos em k categorias) e escores B (divididos em r categorias). O grau de
associao entre dois conjuntos de atributos calculado por:
C=
2
onde 2 a estatstica Qui-quadrado calculada conforme j visto
2
n+
anteriormente. O p-valor associado ao valor da estatstica Qui-quadrado com (r-1) x (k-1)

graus de liberdade a prova de significncia do coeficiente de contingncia C.
O coeficiente C se caracteriza por assumir valor zero quando h inexistncia de
k 1
associao porm nunca ser igual 1. O limite superior do coeficiente dado por
k
(quando k = r). Note que para calcular o coeficiente C, a tabela de contingncia deve
satisfazer as restries do teste Qui-quadrado. (Ver exemplo Siegel, pg. 223)
76
7.2 - COEFICIENTE DE CORRELAO DE SPEARMAN
uma medida de associao que exige que ambas as variveis se apresentem em

escala de mensurao pelo menos ordinal. Basicamente equivale ao coeficiente de correlao
de Pearson aplicado dados ordenados. Assim,
r =
xy
2
x y
= rs
ou seja, o coeficiente de correlao de Spearman se utiliza da expresso do coeficiente

de Pearson porm calculado com postos. Esta expresso equivale
n
6
rs = 1
i =1
3
d
n
2
i
onde di = xi yi a diferena de postos dos escores X e Y.
Para verificar a significncia do valor observado de rs devemos consultar a tbua P

(Siegel) para n entre 4 e 30. Para n maior ou igual a 10 podemos usar a expresso de t de
Student
t = rs
n2
2
1 rs
onde t tem n-2 graus de liberdade. (Ver exemplo Siegel, pg. 231)
Obs: no caso de ocorrncia de um nmero grande de empates deve-se incorporar um fator de

correo ao clculo de rs. (Ver Siegel, pg.233)
Outro coeficiente com a mesma aplicao o coeficiente de Kendall.
77

DISCIPLINA DE ESTATSTICA NO PARAMTRICA
1a LISTA DE EXERCCIOS
1. Pesquisadores realizaram exames de fundo de olho em 20 pacientes diabticos e
encontraram vacolos subcapsulares em 11 deles. possvel afirmar que a
proporo de pacientes na populao com estas caractersticas superior a 0,30? E
para n=45 pacientes e x = 17?
2. Quatro moedas foram lanadas 160 vezes, e os seguintes resultados foram obtidos:
Nmero de caras
freqncia
0
16
1
48
2
55
3
33
4
8
Temos motivos para suspeitar que as moedas no so equilibradas?

3. Em um experimento para avaliar a necessidade de se realizar um recall numa
determinada linha de veculos, avaliou-se a resistncia do material utilizado para
confeco do cinto de segurana O resultado foi o seguinte:
Resistncia (Kgf)
Freqncia
(veculos)
0-5
6
6 - 10
19
11 - 15
15
16 - 20
12
21 - 25
8
Voc aconselharia a distribuio normal com mdia igual a 10 e desvio padro S,

para explicar a resistncia do material? E um modelo normal com mdia (onde
estimada a partir da amostra)?
4. Para testar a hiptese de que os acidentes numa empresa ocorrem com mais
freqncia no comeo e no fim do ms, realizou-se um experimento durante 30 dias
de um certo ms e foram anotados em cada dia se houve ( - ) ou no ( + ) acidentes.
Verifique, a partir dos dados abaixo, se esta hiptese consistente ou se os acidentes
ocorrem de forma aleatria durante o ms.
+ + - + - + + + - - + - - - - + - + - - - + + + - - + + + -
3. A expectativa de vitrias nos jogos olmpicos foi registrada pelo Comit Olmpico
Brasileiro uma semana antes do incio da Olimpada. Terminados os jogos foi
comparada a expectativa com o real desempenho de todos os 212 atletas da delegao.
Com base na tabela abaixo, poderamos afirmar que o desempenho esteve abaixo das
expectativas?
EXPECTATIVA
COM MEDALHA
SEM MEDALHA
TOTAL
DESEMPENHO
COM MEDALHA SEM MEDALHA
33
55
13
111
46
166
TOTAL
88
124
212
Responda a questo acima segundo o procedimento que voc considera mais

adequado. Justifique.
4. Doze pares de gmeos idnticos foram submetidos a testes psicolgicos para

determinar se o primognito tende a ser mais agressivo do que o outro. Os resultados esto
apresentados abaixo e o escore mais alto indica maior agressividade.
Par
1
2
3
4
5
6
7
8
9
10
11
12
a)
b)
c)
d)
Primognito
89
71
77
68
91
72
77
91
70
71
88
87
Outro
88
77
76
64
96
72
65
90
65
80
81
72
Teste a hiptese usando o teste do sinal;

Usando o teste de Wilcoxon;
Usando o Teste de Aleatorizaes;
Compare as respostas comentando as concluses obtidas nos testes.

ESTATSTICA NO PARAMTRICA
2a LISTA DE EXERCCIOS
1. A Oito pessoas foi solicitado montar um quebra-cabea sob condies normais e sob
tenso. Sob esta ltima condio, as pessoas eram avisadas de que soaria uma
campainha 3 minutos depois de iniciado o teste, e a partir da a campainha soaria
novamente de 30 em 30 segundos. Depois dos testes, tirou-se a presso sangnea de
cada pessoa, gerando os seguintes resultados:
Pessoa
1
2
3
4
5
6
7
8
Normal
126
117
115
118
121
128
125
120
Tensa
130
118
125
120
118
125
130
120
Estes dados apresentam evidncias suficientes para indicar que a presso sangnea das
pessoas sob tenso mais alta?
2. Foram considerados 13 casos de irmos gmeos a fim de verificar se vlido admitir
que o primeiro a nascer desenvolve-se mais no primeiro ms. Em cada caso foi anotado
o ganho de peso, em kg, aos 30 dias de idade, obtendo-se os seguintes resultados.
Utilize o Teste de Wilcoxon:
Casos
1
2
3
4
5
6
7
8
9
10
11
12
13
1o
0,72
0,47
0,51
0,59
0,97
0,87
0,36
0,72
0,65
0,48
0,93
0,87
0,81
2o
0,43
0,33
0,49
0,59
0,85
0,80
0,40
0,74
0,62
0,46
0,70
0,78
0,78

ESTATSTICA NO-PARAMTRICA - TERCEIRA LISTA DE EXERCCIOS
1. Uma empresa de seguros resolve oferecer um desconto no prmio do seguro pago por motoristas
no-fumantes, acreditando que esses motoristas se envolvem em menos acidentes de trnsito do que os
fumantes. Uma empresa concorrente, intrigada, resolve fazer uma pesquisa antes de iniciar uma
campanha semelhante e obtm os resultados abaixo. Que deciso tomaria a empresa ?
Condio
Fumante
No-fum.
Nmero de acidentes
1
2
3
4 +4
18 15 12 5
3
24 20 15 4
2
2. Dois grupos de crianas obtiveram os escores na parte de vocabulrio do Teste de Inteligncia

Stanford-binet conforme tabela abaixo. O Grupo I composto de crianas de classe alta e o Grupo II,
de crianas da classe baixa. Estabelecer e testar a hiptese adequada utilizando o teste mais poderoso.
Grupo I
10
18
36
22
28
29
32
15
36
21
27
33
36
26
24
31
13
19
23
25
27
Grupo II
14
18
22
16
38
26
28
12
15
23
3. Em um experimento envolvendo pacientes cardacos divididos em dois grupos: diabticos e nodiabticos, verificou-se que a reao positiva um novo medicamento foi constatada em 3 dos 12
pacientes do primeiro grupo e em 8 dos 21 pacientes do segundo grupo. O pesquisador deseja saber se o
medicamento mais eficaz entre os pacientes no-diabticos.
4. Aos dados do exerccio 2 aplique o teste da Mediana para comparar os dois grupos.
3. Os dados abaixo representam escores de um teste de inteligncia correspondentes a quatro amostras

selecionadas aleatoriamente. Testar a hiptese de que as amostras provm de populaes com a mesma
mediana.
Classe Alta
8
7
14
10
8
6
7
6
8
4
Classe Mdia-Alta
2
4
6
14
10
8
6
2
2
3
4
6
8
5
4
8
Classe Mdia
12
3
10
4
14
11
10
8
12
10
10
9
8
8
9
8
7
11
Classe Baixa
15
12
13
8
9
11
12
13
14
14
12
12
11
10
14
12
4. Uma companhia que efetua testes industriais est interessada em comparar cinco marcas de pneus
com relao aos seus desempenhos durante a frenagem em pista molhada. Para isso, mede-se a
distncia percorrida por um carro, trafegando a uma dada velocidade desde o incio da frenagem at a
completa parada do veculo. As distncias observadas, em metros, so dadas na tabela abaixo.
A
45,8
43,3
48,1
46,0
47,2
B
47,6
47,9
45,4
43,0
42,4
Marca do Pneu
C
40,9
44,2
43,0
39,1
42,1
D
44,5
52,7
54,2
49,4
44,8
50,0
E
44,2
51,8
50,6
43,9
44,5
50,3

DISCIPLINA DE ESTATSTICA NO PARAMTRICA
QUARTA LISTA DE EXERCCIOS
1. Dados de uma pesquisa com crianas com menos de 15 anos de idade, residente na rea central
de uma grande cidade, foram classificados de acordo com o grupo tnico e o nvel de
hemoglobina (g/100ml). Os resultados foram os seguintes:
Grupo tnico
A
B
C
Nvel de Hemoglobina
9,0 a 9,9
Menor do que 9,0
100
20
190
96
30
10
10,0 ou mais
80
99
70
Esses dados fornecem evidncia suficiente para indicar que o grupo tnico e o nvel de hemoglobina
estejam associados?
2. Uma empresa especializada em testes industriais analisou trs marcas de pneumticos segundo
cinco caractersticas, atribuindo notas de 1 (desempenho fraco) a 10 (desempenho excelente).
Pode-se concluir que existe alguma marca melhor do que outras? Os resultados foram os
seguintes:
Caracterstica
Trao lateral
Deslizamento
Alinhamento
Frenagem
Desgaste
A
10
10
6
8
8
Marca
B
8
9
10
7
9
C
7
7
8
6
10
ANEXOS
PROVA BINOMIAL
Exemplo: Testes de Diferenas Sensoriais so comumente utilizados em Controle de
Qualidade e Avaliao da qualidade. O teste triangular (Bradley 1963), teste de
diferenas sensoriais que fornece uma aplicao til do modelo Binomial, dado a
seguir. Para cada um de n painelistas trs amostras-teste so apresentados em ordem
aleatria. sabido que duas das amostras so idnticas; a terceira e diferente. Ao
painelista e ento solicitado que selecione a amostra diferente, com base num atributo
sensorial especifico. Se os painelistas so juizes treinados, homogneos, o experimento
pode ser visto como n tentativas de Bernoulli repetidas e independentes, onde um
sucesso corresponde a uma identificao correta da amostra. (Se os painelistas no so
juizes treinados, homogneos, podemos questionar a validez da suposio de
probabilidade constante ao longo das repeties). Sob a hiptese de que no h
nenhuma base para discriminao, a probabilidade p de sucesso 1/3, considerando que
uma base para discriminao corresponde a valores de p excedendo 1/3.
Byer e Abrams (1953) consideraram um teste triangular de amargor no qual cada
degustador recebeu trs copos, dois contendo a mesma soluo de quinino e o terceiro
uma soluo de quinino diferente. No primeiro teste de amargura, as solues
contiveram 0,0075% e 0,005%, respectivamente, de sulfato de quinina. As seis ordens
de apresentao so: LHH, HLH, HHL, HLL, LHL, LLH (L - denota a mais baixa
concentrao e H - a concentrao mais alta), foram distribudos aleatoriamente entre os
degustadores. Depois de 50 tentativas, houveram 25 selees corretas e 25 selees
incorretas.
Consideramos B como a estatstica do teste Binomial (B o numero de identificaes
corretas).
Considere ainda Ho: p = 1/3 contra a hiptese alternativa p>1/3, e usa-se a
aproximao para grandes amostras. Fixamos = 0,05. Na Tabela da Normal padro
encontramos z = 1,645 assim a aproximao ao nvel de 0,05 de significncia
estabelece a seguinte regra de deciso: Rejeitamos Ho se B1,645; caso contrrio no se
rejeita.
Dos dados, temos n = 50 e B (o nmero de correto de identificaes) = 25. Assim
considerando p0 =1/3, obtemos
B* =
25 50(1 3)
[50(1 3)(2 3)]
= 2,5
2
Sendo B = 2,5 > 1,645, ns rejeitamos Ho:p=1/3 a favor de p>1/3 ao um nvel de 0,05
de significncia. Assim temos evidncias de discriminao do sabor amargo (Na Tabela
da Normal padronizada notamos tambm que o menor nvel de significncia ao qual
rejeitamos Ho em favor p>1/3 seria 0,0062.)
TRABALHO APLICADO: DESCOBRINDO

ERROS
Um mdico me ligou outro dia com algumas dvidas a respeito de
uma anlise estatstica, realizada por um amigo, na sua dissertao de
mestrado. Este mdico estava comparando os resultados de dois exames
realizados em um grupo de 40 pacientes.
Ele me passou poucas informaes por telefone. Disse apenas que no primeiro
exame 10 pacientes apresentaram resultado positivo enquanto que no segundo exame
foram apenas 5 pacientes. Disse ainda que no relatrio constava:
Os resultados apresentaram nvel de concordncia de 82,5%

Qui-quadrado = 35,7
p > 0,0001
Tente reproduzir a anlise estatstica apontando os erros cometidos.
Explique os resultados ao mdico, com linguagem prpria, pois ele est

bastante confuso s vsperas da defesa de sua dissertao.
I ntervalo de Confiana
Para a Probabilidade de Sucesso
( Clopper Pearson)
Aproximao: Grandes Amostras
p z
2
p (1 p )
n
Entretanto, utilizando a aproximao teremos um Intervalo de Confiana

Simtrico, que no corresponde a realidade em geral estes intervalos so simtricos.
proposto ento um procedimento mais adequado.
Intervalo de Confiana de Clopper Pearson

L.I . =
B
B + (n B + 1) f 2, 2 ( n B +1), 2 B
L.S . = 1
( B + 1) f 2, 2( B +1), 2 ( n B )
nB
=
n B + ( B + 1) f 2, 2( B +1), 2 ( n B ) (n B) + ( B + 1) f 2, 2( B +1), 2 ( n B )
B nmero de sucessos em n repeties
em que n nmero de repeties

f valor da distribuio F com g.l. = n e n
1
2
UNI VERSI DADE FEDERAL DO PARAN

ESTATSTICA NO PARAMTRICA
ANLISE DE DADOS REAIS TRABALHO OPTATIVO (GRUPOS

DE NO MXIMO 3 ALUNOS) 2 PONTOS NA PRXIMA PROVA
Elabore um relatrio detalhado baseado nos dados a seguir.
DESCRIO DO ESTUDO
Neste estudo foram acompanhados 21 pacientes obesos, que
passaram por tratamentos para perda de PESO. O primeiro tratamento,
seguido por dez pacientes, era composto simplesmente de uma dieta (grupo
PLACEBO) e o segundo tratamento, seguido por outros 11 pacientes, era
composto de uma dieta e mais a droga XENICAL (grupo XENICAL). No
inicio e no final dos tratamentos (6 meses aps), foram mensuradas nos
pacientes as variveis Peso, ndice de Massa Corprea (IMC) e a taxa de
Leptina. Deseja-se verificar, neste estudo, se h diferena significativa
entre os tratamentos para as variveis mencionadas acima.
METODOLOGIA ESTATSTICA
Inicialmente, para verificao da homogeneidade dos grupos
analisados foram construdas tabelas de contingncia e calculadas algumas
medidas descritivas. Dependendo da varivel em anlise, foi aplicado o
teste estatstico mais adequado (Teste exato de Fisher, Teste t de Student,
Teste de Mann-Whitney).
Observada a homogeneidade dos grupos, verificou-se, em cada
grupo, se no final do tratamento houve variao significativa para as
variveis PESO, IMC e LEPTINA aplicando-se o Teste estatstico noparamtrico de Wilcoxon, dado que a suposio de Normalidade das
observaes no foi comprovada.
Finalmente, os dois tratamentos foram comparados, verificando-se as
diferenas significativas entre as variaes de PESO, IMC e LEPTINA
atravs do Teste estatstico no-paramtrico de Mann-Whitney.
PLACEBO
PACIENTE
733
736
738
741
747
748
750
752
755
758
XENICAL
PACIENTE
734
735
737
740
742
745
751
753
756
757
759
SEXO
PESO
IMC
LEPTINA
INICIAL FINAL INICIAL FINAL INICIAL FINAL
92,6
90,5
39,07
38,16
39
38,83
86,2
79,5
28,16
25,98
2,8
1,95
74,9
74,4
35,66
35,38
22,06
15,41
82,5
81,2
34,8
34,26
36,52
37,41
91,5
77,7
36,16
30,73
16,26
7,05
84,8
81,5
31,64
30,3
5,7
4,07
78,2
80,9
32,55
33,7
17,1
18,94
87,4
84,7
31,43
30,37
8,34
13,6
69,7
68,7
33,15
32,67
29,86
22,14
79,5
73,7
30,69
28,45
7,67
4,92
2
1
2
2
2
1
2
1
2
2
IDADE
35
69
36
50
47
46
57
52
61
29
2
2
1
2
2
2
2
1
2
2
2
PESO
IMC
LEPTINA
IDADE INICIAL FINAL INICIAL FINAL INICIAL FINAL
61
104
97
41,14
38,37
14,72
9,25
45
87
82,3
33,9
32,14
13,69
21,1
43
117,1
117
42,58
42,54
28,85
37,23
56
68,8
65,5
29,4
27,99
13,37
12,27
54
74
71,3
31,62
30,47
28,04
22,36
44
87,6
86,1
35,6
35
11,04
26,39
49
71,3
70,1
31,68
31,15
18,73
17,62
49
104,5
99,4
35,78
33,99
11,33
8,66
64
86
82,6
35,39
33,99
36,98
27,95
59
94,3
90,9
44,27
42,67
65,41
78,39
45
86,8
85,5
32,38
31,79
18,91
22,48
SEXO

Testes Estatísticos Não-Paramétricos

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Testes Estatísticos Não-Paramétricos

Uploaded by

Copyright:

Available Formats

UNIVERSIDADE FEDERAL DO PARAN

Elaborada a partir de notas de aula do prof. Paulo Ricardo B. Guimares

MINISTRIO DA EDUCAO E DO DESPORTO

II - Testes para o Caso de Uma Amostra

V - Testes para K - Amostras Relacionadas

A Estatstica No-Paramtrica pode ser definida como uma coleo de mtodos

1.1 SUAS VANTAGENS E DESVANTAGENS

1.2.5 Hiptese Nula

1.3 DISCUSSO GERAL DOS TESTES ESTATSTICOS

Ao testar a afirmao do fabricante de que a concentrao mdia de pesticida se dar

O que notamos na verdade que o produto parece no ter se espalhado homogeneamente;

1.4 ESCOLHA DO TESTE ESTATSTICO ADEQUADO

1.5 NVEL DE MENSURAO

Perfeito (1), Defeituosa (0)

c) Escala Intervalar (Intervalo de medida)

Exemplo 1 - H 0 : p = 0,5 versus

Concluso: No rejeitamos a hiptese nula.

ou Npq 9 , para este caso utilizamos a

Aproximao pela Normal:

e procede-se como num teste de hiptese convencional

Exemplo 2: Uma empresa lanou recentemente no mercado uma dieta de emagrecimento. E

x = nmero de sucessos =5 e considerando n = 16.

0,3 i 0,7 16 i = 0,551

Primeiramente precisamos saber qual a probabilidade de um degustador distinguir por acaso

0,10 i 0,90 8i = 0,0381

Exerccio - A Lei de Mendel afirma que para 4 genes, 3 so dominantes e 1 recessivo. Em

2.1.3 Discusso do Mtodo

2.2 TESTE DE QUI-QUADRADO ( 2 )

2.2.1 Exigncias do Teste

k = nmero de categorias (classes )

ei = freqncia esperada na categoria i

Quanto maior o valor de 2 maior ser a probabilidade de as freqncias

= k 1 se as freqncias esperadas puderem ser calculadas sem precisar estimar

(29 18)2 + (19 18)2

Um engenheiro afirma que o processo descrito acima segue uma distribuio de

Tabela 2.3 Juno das Categorias em que as freqncias so inferiores ao valor 5.

= 5 1 = 4 ento 42 indica que o valor 0,675 acusa um p-valor = 0,954375.

Concluso: Ao nvel de significncia de 5% no podemos rejeitar H 0 . A distribuio das

Exerccio - O recenseamento de 320 famlias com 5 filhos revelam os dados abaixo:

Teste a hiptese de que o nascimento de homens e mulheres igualmente provvel. Caso H0

2.2.3 - Discusso do Mtodo

2.3 TESTE DE KOLMOGOROV SMIRNOV

2.3.1 Exigncia do Teste

H 0 : Os dados seguem uma distribuio Poisson (1,2) ou F = F0 ( X )

Exerccio: As produes mdias de um experimento envolvendo adubao em milho

2.3.3 Discusso do Mtodo

2.4 TESTE DE LILLIEFORS

Exerccio: Resolva o exerccio anterior estimando os parmetros populacionais.

2.5.1 - Exigncia do Teste

E fazemos uso da tabela da distribuio normal padro.

Exemplo 1: 24 crianas foram avaliadas com relao a um ndice de agressividade e em

Concluso: A Tbua F (Siegel) indica para n1 = n2 = 12 os limites 7 e 19, portanto

Exemplo 2: Deseja-se verificar se a disposio de homens e mulheres numa fila de cinema se

Exerccio: Suponha que um teste de QI tenha sido aplicado a 8 homens e 8 mulheres

2.5.3 - Discusso do mtodo

Muitas vezes estamos interessados na comparao de dois tratamentos. No entanto

A hiptese nula admite que as mudanas ocorridas nos dois sentidos no so

Devemos considerar dois casos:

Exemplo 1: Dois supermercados disputam a preferncia dos consumidores de uma cidade. O

Teste agora a eficincia da campanha.

P(B 3) = 0,0106 (corresponde ao p-valor)

= 12,93 cujo p-valor < 0,001