Professional Documents
Culture Documents
SANDRA RIVERA
RAFAEL GORDILLO
MARCELO PAREDES
DAVID REVELO
FERNANDO RIVERA
OCTUBRE 2010
ESTADISTICA CUALITATIVA O DE ATRIBUTOS
INTRODUCCION
2
Estadística. Por ejemplo, el grupo de los varones mayores de 65 años y
residentes en una provincia que son usuarios de bibliotecas públicas sería una
muestra de la población citada en el párrafo anterior (otra cosa es que la
muestra fuese o no representativa del conjunto de tal población).
3
TIPOS DE VARIABLES.
VARIABLES CUALITATIVAS,
4
1) las variables cualitativas ordinales, que son las que teniendo más de
dos modalidades tienen establecido un orden natural entre las mismas, de
forma que sus modalidades se enuncian siguiendo una cierta ordenación
ascendente o descendente y no de otra manera. Por ejemplo, la variable
“gravedad del pronóstico de lesiones traumáticas” podría tener como orden
natural entre sus modalidades “leve”, “moderado”, “grave”, etc., pero nunca
diríamos “grave”, “leve”, “moderado”, etc. en este orden.
ANALISIS DE DATOS
5
Si los caracteres se pueden ordenar de acuerdo con cierta escala se
puede llegar a unos coeficientes de correlación que mida el grado de
asociación entre ellos.
1
N
∑ ( x i −x )( y i− y )
1 2 1
√ ∑
N i
( x i −x ) ∑ ( y i − y )
N i
2
6
2
6 ∑ di
i
ρ=1− 3
N −N siendo di=xi-yi
A B B1 B2 … B j … B k TOTAL
A1 n11 n12 … n1j ... n1k n1.
A2 n21 n22 … n2j ... n2k n2.
… ... ... ... ... ... ... ...
Ai ni1 ni2 … nij ... nik nj.
… ... ... ... ... ... ... ...
Ah nh1 nh2 … nhj ... nhk nh.
TOTAL n.1 n.2 … n.j ... n.k N
Las distribuciones que se refieren a uno solo de los dos atributos se denominan
marginales. Para el atributo B se encuentra reflejada en la última fila y para el A
en la última columna.
7
A B B1 B2 TOTAL
A1 n11 n12 n1.
A2 n21 n22 n2.
TOTAL n.1 n.2 N
Dos atributos son independientes cuando entre ellos no existe ningún tipo de
influencia mutua. Lo que se reflejará estadísticamente en que la frecuencia
relativa conjunta es igual al producto de las frecuencias marginales respectivas.
Es contrario al de independencia.
Coeficiente de asociación H
n1.
n.1
A1 y B1 son independientes si n 11= N , por lo tanto para medir la
n1.
n.1
asociación podemos estudiar la diferencia n 11 - N , a la que llamaremos
8
H, haciendo las operaciones convenientes llegamos a la siguiente expresión
para H:
Nn11−n1. n. 1
H= N
ni. n . j
Si nij= N para todo i,j entonces A y B son independientes.
9
2
Coeficiente de contingencia χ
ni. n . j
2
que fueran independientes, es decir n ij´= N entonces: χ =
2
h k
( n´ij−nij )
∑∑ ´
i =1 j=1 n ij se le denomina también cuadrado de la contingencia.
h k 2
nij
2 ∑∑ −N
Otra fórmula es χ = i=1 j=1 n´ij .
h k 2
χ2 1 n
ϕ = = ∑ ∑ ij´ −1
2
N N i=1 j=1 n ij
También se utiliza la expresión
denominada cuadrado medio de la contingencia.
Ninguno de los dos coeficientes puede ser negativo.
Si los atributos fueran independientes serían cero.
χ2 ϕ2
Varia entre 0 y 1 .
C= √ N+ χ2 = √ 1+ϕ 2 .
10
Total asociación C=1, lo que no se alcanza nada más que en el caso
ideal de infinitas modalidades.
Coeficiente de Tschuprow
2
coeficiente que depende de χ , del número de filas y columnas, y
del total de elementos, N.
2
ϕ
T2= √( h−1 ) ( k−1 ) .
Varía entre 0 y 1.
GRAFICAS ESTADISTICAS
11
- El diagrama de sectores, que refleja como sectores de un círculo las
frecuencias de cada modalidad. Como el radio es constante en un
círculo, para cumplir la regla fundamental de proporcionalidad basta
hacer al ángulo de cada sector proporcional a la frecuencia, lo que se
consigue multiplicando los 360º del círculo por la frecuencia relativa de
cada modalidad. Este tipo de gráficas es muy útil para comparar los
resultados de una variable cualitativa en dos o más muestras.
Hay otras gráficas menos frecuentes pero igualmente válidas para variables
cualitativas; cabe citar los pictogramas, en los que se representa una
misma figura para cada modalidad pero con tamaño proporcional a las
frecuencias (pictograma por extensión) o una misma figura repetida tantas
veces como sea necesario para reflejar la frecuencia de cada modalidad
(pictograma por repetición), los cartogramas, en los que se representa
cada modalidad sobre puntos o regiones de un mapa, o los diagramas de
superficie, en los que se divide una figura geométrica, generalmente un
rectángulo, en trozos proporcionales a las frecuencias.
12