You are on page 1of 6

PSICOLOGIA ESTATSTICA APLICADA

CORRELAO Nos captulos anteriores, estudamos algumas tcnicas utilizadas para estimar um nico parmetro populacional ou amostral (medidas de tendncia central e medidas de disperso), mas que no diz muito a respeito de uma relao que possa existir entre as variveis do conjunto de dados. A preocupao era apenas descrever a distribuio dos valores de uma nica varivel. Outra anlise importante determinar como uma varivel se relaciona com outras variveis da mesma populao. Considerando observaes de duas ou mais variveis, Neste captulo, apresentaremos uma forma de medir quanto e de que maneira se relacionam duas variveis. A anlise de correlao fornece um valor que resume e mede o grau (ou a fora) de relacionamento entre duas variveis. A presena de uma correlao pode conduzir-nos a um mtodo para estimar uma varivel a partir da outra. Por exemplo:
Suponha que um psiclogo queira verificar se existe relao entre o nmero de horas de sono e o

tempo de reao de uma pessoa. possvel determinar se existe uma relao entre o aumento das vendas e a propaganda de um produto. Determinar se a renda de uma famlia est relacionada com uma maior escolarizao. Nas Instituies de Ensino Superior (IES), h uma relao direta entre a qualidade do ensino e a taxa de inadimplncia. A taxa de inadimplncia das IES que obtiveram conceitos A e B no Provo 12,1%, nas que obtiveram C 16% e nas que obtiveram D e E a inadimplncia de 21,9%. Se o aumento das vendas de medicamentos nas farmcias tem relao com o frio. Idade e altura das crianas. Tempo de prtica de esportes e ritmo cardaco. Taxa de desemprego e taxa de criminalidade. Expectativa de vida e taxa de analfabetismo.

DEFINIO - Uma correlao uma relao entre duas variveis. Os dados podem ser representados por pares ordenados (x, y) onde x a varivel independente (causa) e y a varivel dependente (efeito). DIAGRAMA DE DISPERSO Um diagrama de disperso simplesmente uma representao de pontos de dados no plano cartesiano. O eixo y representa a varivel dependente, que interessa quem toma as decises, enquanto o eixo x representa a varivel independente, que pode ser controlada ou medida por quem toma as decises. Cada ponto (x, y) pode ser representado no plano cartesiano por um ponto. EXEMPLO possvel determinar se existe uma relao entre o tempo de estudo e a nota de um aluno, ou seja, se o tempo de estudo influencia na nota? O quadro abaixo mostra o tempo de estudo x (em horas) e suas respectivas notas y. TEMPO (x) 3,0 7,0 2,0 1,5 12,0 NOTAS (y) 4,5 6,5 3,7 4,0 9,3 Pgina 1

ESTATSTICA APLICADA ADMINISTRAO 1/2011

O grfico de disperso dado abaixo, onde os pontos ( ) representam os pares ordenados (x,y) da tabela cima.

Grfico Diagrama de Disperso O padro geral dos pontos no grfico sugere que pode existir uma relao entre tempo de estudo e notas. Em particular, o padro sugere que, quanto mais tempo de estudo, maior ser a nota. O padro dos pontos forma aproximadamente uma linha reta, indicando que possvel existir uma associao linear entre as variveis x e y. COEFICIENTE DE CORRELAO A interpretao da existncia de uma correlao usando um mapa de disperso, como no grfico acima muito subjetiva. Um mtodo mais preciso e objetivo a anlise de correlao. Anlise de correlao uma tcnica matemtica utilizada para medir a fora de associao entre duas variveis. Esta tcnica leva em considerao o grau de disperso entre os valores dos dados de uma amostra ou populao. Logo, quanto mais dispersos estiverem os dados, mais fraca ser a relao entre as duas variveis. Essa intensidade de associao entre duas variveis medida pelo coeficiente de correlao. O coeficiente de correlao uma medida do grau e da direo de uma relao linear entre duas variveis. A frmula do coeficiente de correlao dada por

r=

n x. y
2

x. y
2

[n x ( x ) ] [n y ( y ) ]
2 2

onde
n o nmero de pares de dados. x . y - Multiplicar cada valor x por seu correspondente y e somar. x - Somar os valores de x. y - Somar os valores de y. x2 - Elevar cada valor de x ao quadrado e somar.

y - Elevar cada valor de y ao quadrado e somar.


2

INTERPRETAO DO COEFICIENTE DE CORRELAO LINEAR


1 1 O valor de r est limitado ao intervalo [-1, 1], ou seja, r . No possui unidade de medida. Quanto mais prximo de 0, menor a correlao linear. Quanto mais prximo de 1 maior a correlao:

OBS.:

r = 1 correlao linear positiva e perfeita. r = -1 correlao linear negativa e perfeita. r = 0 inexistncia de correlao linear.

ESTATSTICA APLICADA ADMINISTRAO 1/2011

Pgina 2

1- Dizer que uma correlao positiva dizer que quando x cresce linearmente, y tambm cresce

linearmente. Exemplo Quanto mais uma emprese investe em marketing, mais ela vende.
2- Da mesma forma, dizer que uma correlao negativa dizer que quando x cresce linearmente, y

tambm decresce linearmente, ou vice-versa. Exemplo Quanto maior a velocidade de um carro pra chegar em algum lugar, menor ser o tempo gasto para se chegar. Os mapas de disperso a seguir, mostram alguns tipos de correlao.

r = 1 : Correlao linear positiva e perfeita

r = -1: Correlao linear negativa perfeita

r = 0: inexistncia de correlao

- OBSERVAO 1- Se o valor absoluto de r for maior que 1 ou menor que -1 h um erro de clculo. 2- Valores de r iguais a 1 ou +1 indicam que os pontos esto sobre a reta, isto a correlao perfeita. 3- Valores de r prximos de 1 ou +1 indicam uma correlao forte e valores de r prximos de zero indicam correlao fraca.
0,7 < r < 0,9 correlao forte 0,4 < r < 0,7 correlao moderada

0,2 < r < 0,4 correlao fraca Esta informao serve para o lado negativo. 4- O sinal de r indica se a correlao positiva ou negativa. EXEMPLO Uma empresa est avaliando se existe uma relao entre o investimento em propaganda (em milhares de reais) e as vendas da empresa. Os dados esto registrados na tabela a seguir. A tabela fornece tambm os valores calculados da frmula de correlao.

Propaganda

Vendas

x. y

x2

y2

ESTATSTICA APLICADA ADMINISTRAO 1/2011

Pgina 3

2,4 1,6 2,0 2,6 1,4 1,6 2,0 2,2 x =15,8

y 1 = 634

225 184 220 240 180 184 186 215

x 3 . y = 289 ,8 x

540 294,4 440 624 252 294,4 372 473

5,76 2,56 4 6,76 1,96 2,56 4 4,84


2

= 2 ,4 3 4

50 625 33 856 48 400 57 600 32 400 33 856 34 596 46 225


2

=33 5 7 58

Substituindo os valores na frmula de correlao, temos:

r=

n x. y x . y

8 (3 289,8) _ (15,8)(1634)
=
2

[n x ( x ) ] . [n y ( y ) ]
2 2 2

[8 (32,44) (15,8) ].[8 (337 558) (1634) ]


2 2

r=

50 12 ,
= 0,913 . Logo, r = 0,913.

9,8 8 3 0508
Como r est prximo de 1, h uma forte correlao linear positiva. medida que aumenta a quantia gasta em propaganda, crescem tambm as vendas da empresa. COEFICIENTE DE DETERMINAO Geralmente, o coeficiente de correlao r o primeiro parmetro para uma avaliao do modelo. Outra medida que ajuda numa interpretao mais profunda o coeficiente de determinao. Ele definido como o quadrado da correlao, ou seja, o coeficiente de determinao igual a r 2 , onde 0 r 2 1 . No Exemplo acima, r = 0,913. Logo, o coeficiente de determinao r 2 = 0,833, pois
r 2 = (0,913 ) 2 0,833

O coeficiente de determinao indica a porcentagem de variao nos dados de y que podem ser atribudos variao nos dados de x, ou seja, indica a porcentagem dos valores de y que vo variar quando os valores de x tambm variarem. No exemplo acima, podemos dizer que 83,3% (0,833 100) dos dados de y vo variar quando os valores de x variarem. Isto quer dizer que 83,3% da variao das vendas devida variao dos gastos em propaganda pela empresa. Para os outros 16,7% (100% - 83,3%) dos dados de y no podemos afirmar nada, so inexplicveis e podem ser resultados de erros amostrais ou outros fatores. Esto dentro de uma extrapolao, enquanto 83,3% dos dados em y esto dentro de uma interpolao. O coeficiente de determinao r 2 a razo entre a variao explicada e a variao total, ou seja, a porcentagem que representa a variao explicada dentro da variao total. Isto ,
Variao Explicada r2 = Variao Total

ESTATSTICA APLICADA ADMINISTRAO 1/2011

Pgina 4

EXERCCIOS 1- Procurando quantificar os efeitos da escassez de sono sobre a capacidade de resoluo de problemas simples, um agente tomou ao acaso 10 sujeitos e os submeteu a experimentao. Deixou-os sem dormir por diferentes nmeros de horas, e depois solicitou que os mesmos resolvessem os itens "contas de adicionar" de um teste. Obteve, assim, os seguintes dados:
HORAS SEM DORMIR (X) N DE ERROS (Y)

8 8 12 12 16 16 20 20 24 24

8 6 6 10 8 14 14 12 16 12

(A) Calcule o coeficiente de correlao linear de Pearson e conclua se existe e que tipo de relao h entre

variveis. (B) Quantos por cento da variao de nmero de erros podem ser explicados pela variao de horas de dormir? 2- Sorteamos 5 pessoas adultas, num centro urbano e a cada uma fizemos as seguintes perguntas: - Durante quantos anos voc freqentou regularmente a escola? - Quantos livros voc tem em sua biblioteca? SUJEITOS ANOS (X) A 5 B 8 C 10 D 12 E 15 TOTAL Que tipo de correlao existe? 3- Uma empresa recolheu informao relativa relao existente entre as notas no teste de admisso (X) e uma certa medida de produtividade (Y). Verifique se existe alguma relao entre estas variveis. TESTE (X) 8 10 14 16 18 20 PRODUTIVIDADE (Y) 21 29 30 43 45 48 Pgina 5 LIVROS (Y) 10 30 45 50 75

ESTATSTICA APLICADA ADMINISTRAO 1/2011

4- Uma agncia da ONU pretendeu verificar se existe uma relao linear entre a despesa per capita em educao e o grau de criminalidade (assassinatos por ms) numa lista de cinco pases PAIS A B C D E TESTE (X) 50 80 120 130 150 PRODUTIVIDADE (Y) 28 22 18 14 8

5- Em certa populao, o coeficiente de correlao entre X e Y 0,80. a) O que isto significa? b) Que percentual da varincia de Y no explicada pelas variaes de X? 6- Um grupo de pesquisa estabeleceu uma escala de quocientes de violncia para programas de televiso. Classificou cada um dos 6 programas e coletou dados sobre o percentual de pessoas que assistem cada programa.
(A) Verifique se existe correlao significativa entre as variveis Quociente de violncia e % que assistem.

(B) Que percentual da varincia de Y no explicada pelas variaes de X? Quociente de % que assistem violncia (X) (Y) 10 15 30 20 40 24 50 30 65 35 70 35 7- A tabela seguinte mostra os resultados de uma pesquisa com 10 famlias de determinada regio. Famlias Renda (u.m.:100) X A B C D E F G H I J 10 15 12 70 80 100 20 30 10 60 Nmero de Filhos Y 8 6 5 1 2 2 3 2 6 1

(A) Calcule o coeficiente de correlao linear de Pearson entre renda e numero de filhos para as dez famlias. (B) Que percentual da varincia de Y explicada pelas variaes de X?

ESTATSTICA APLICADA ADMINISTRAO 1/2011

Pgina 6

You might also like