Professional Documents
Culture Documents
PRIMERAS DEFINICIONES Poblacin (o universo), , de elementos bien definidos, puede ser finito o infinito.
Muestra (subconjunto) Las muestras nos sirven para obtener informacin que posteriormente aplicamos a la poblacin, es decir, nos sirve para poder inferir caractersticas de la poblacin o universo. Cada elemento tiene asociadas caractersticas que denominamos VARIABLES. Ej: x= edad y= ventas Cardinalidad: es la cantidad de elementos o tamao del conjunto. Ej: card ()=105,000
2 x S2
media poblacional (caractersticas) varianza poblacional media muestral (es el estimador de ) varianza muestral
2 S2
A las caractersticas poblacionales se les llama PARMETROS (normalmente denominados con letras griegas). TIPOS DE DATOS
Cuantitativos o numricos finitos (contables) o infinitos o Tienen medidas de tendencia central, de dispersin => se pueden realizar varios tipos de grficas
integracin sumatoria
sobre lo discreto
TABLA DE FRECUENCIAS (base para calcular el HISTOGRAMA) Ej: Tamao de la muestra n=45
15 31 44 56 38 32 48 42 58 29 45 49 38 48 62 46 56 52 47 49 42 52 55 52 69 39 39 58 37 18 68 48 62 64 61 47 69 58 29 55 18 61 48 55 49
Estadstica de orden
15 38 47 52 58 18 39 48 52 61 18 39 48 55 61 29 42 48 55 62 29 42 48 55 62 31 44 49 56 64 32 45 49 56 68 37 46 49 58 69 38 47 52 58 69
frecuencia frecuencia absoluta relativa 3 0.0667 9 0.2000 20 0.4444 13 0.2889 45 es la nica representa independiente porcentajes
ancho 15 15 15 15
HISTOGRAMA Grfica que sintetiza la informacin contenida en una tabla de frecuencias. Se grafica con rectngulos o barras cuya base es el intervalo de clase y la altura es la de la tabla. Tiene la propiedad de que el rea total es igual a 1 (uno) o al 100%. OJIVA
En este grfico se utilizan el punto medio del intervalo contra la frecuencia relativa acumulada. Por lo que esta grfica inicia en cero y termina en uno.
2. tomando las edades del grupo calcular las medidas de tendencia central,
manualmente y con Excel.
MEDIDAS DE DISPERSIN
Son aquellas que nos permiten ver o evaluar qu tan dispersa o variable es una muestra. 1. RANGO= MX MN
( x
X )2 n 1
i
S2 =
2 i
n( X ) 2 n 1
S2 =S
Lo ms prctico es calcular estos valores con una tabla. Ej.: Primero se calcula la media, la tercer columna se eleva al cuadrado para que sea positivo. X(i) 14 8 6 12 13 X(i)-X 3.4 -2.6 -4.6 1.4 2.4 (X(i)-X)2 11.56 6.76 21.16 1.96 5.76 47.2
(ver grficas) REGLA EMPRICA / intervalos de la regla aproximada Representan el porcentaje includo de la poblacin
X S
68%
X 2S
95% 99%
X 3S
Cuando manejamos informacin categrica, los datos ya no se refieren como x1,x2,x3, etc son CONTEOS de qu elemento cae en qu categora. Normalmente se usa el CIRCULOGRAMA (no aplica en datos contnuos). Para datos categricos, no hay medidas de tendencia central, ni de dispersin, porque los datos no tienen orden ni magnitud.
DATOS BIVARIADOS
Xi 2.6 2.2 3.4 2.3 3.1 2.1 3.2 3.8 Yi 74 69 85 63 82 60 79 91
Donde Yi= ventas del mes (variable que no puedo controlar) y Xi=publicidad (s la puedo controlar) n=8 estadsticas de x de y son univariadas, pero necesito saber si hay relacin...... entonces realizo una grfica de dispersin para detectar si hay una curva o funcin lineal. Relacin + Relacin r= +1 r= -1 r= 0
1 r 1
CORR ( xi yi ) = r =
y = a +bx
S xx = (xi2 ) nx 2 S yy = yi2 ny 2
S xy = i yi nx y x
Pendiente
b=
S xy S xx
Ordenada al origen
a = y bx
Yi 74 69 85 63 82 60 79
XiYi 192.4 151.8 289 144.9 254.2 126 252.8 345.8 1756.9