You are on page 1of 6

APUNTE ESTADSTICA

PRIMERAS DEFINICIONES Poblacin (o universo), , de elementos bien definidos, puede ser finito o infinito.

Muestra (subconjunto) Las muestras nos sirven para obtener informacin que posteriormente aplicamos a la poblacin, es decir, nos sirve para poder inferir caractersticas de la poblacin o universo. Cada elemento tiene asociadas caractersticas que denominamos VARIABLES. Ej: x= edad y= ventas Cardinalidad: es la cantidad de elementos o tamao del conjunto. Ej: card ()=105,000

2 x S2

media poblacional (caractersticas) varianza poblacional media muestral (es el estimador de ) varianza muestral

2 S2

A las caractersticas poblacionales se les llama PARMETROS (normalmente denominados con letras griegas). TIPOS DE DATOS

cualitativos o categricos par de tipos de grficas.

no tienen orden ni magnitud, solo hay un

Cuantitativos o numricos finitos (contables) o infinitos o Tienen medidas de tendencia central, de dispersin => se pueden realizar varios tipos de grficas

o Puede ser discreto (no hay valores intermedios)


contnuo (siempre es posible un nmero intermedio entre dos valores) sobre lo continuo se aplica

integracin sumatoria

sobre lo discreto

TABLA DE FRECUENCIAS (base para calcular el HISTOGRAMA) Ej: Tamao de la muestra n=45
15 31 44 56 38 32 48 42 58 29 45 49 38 48 62 46 56 52 47 49 42 52 55 52 69 39 39 58 37 18 68 48 62 64 61 47 69 58 29 55 18 61 48 55 49

Estadstica de orden
15 38 47 52 58 18 39 48 52 61 18 39 48 55 61 29 42 48 55 62 29 42 48 55 62 31 44 49 56 64 32 45 49 56 68 37 46 49 58 69 38 47 52 58 69

Ahora s armo la tabla de frecuencias:


frecuencia relativa acumulada 0.0667 0.2667 0.7111 1.0000 punto medio del intervalo de clase 17.5 32.5 47.5 62.5

intervalo de clase 10 al 25 25+ al 40 40+ al 55 55+ al 70

frecuencia frecuencia absoluta relativa 3 0.0667 9 0.2000 20 0.4444 13 0.2889 45 es la nica representa independiente porcentajes

ancho 15 15 15 15

altura 0.0044 0.0133 0.0296 0.0193 (frec. rel/ ancho)

HISTOGRAMA Grfica que sintetiza la informacin contenida en una tabla de frecuencias. Se grafica con rectngulos o barras cuya base es el intervalo de clase y la altura es la de la tabla. Tiene la propiedad de que el rea total es igual a 1 (uno) o al 100%. OJIVA

En este grfico se utilizan el punto medio del intervalo contra la frecuencia relativa acumulada. Por lo que esta grfica inicia en cero y termina en uno.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NUMRICOS


Sintetiza la informacin de las muestras en grficas o en la tabla de frecuencias Calcula estadsticas muestrales para conocer cul es el centro de la distribucin de los datos. MEDIA: X representa el promedio de la muestra. Es la nica a la que afectan datos extremos o colas pesadas. X= X1+X2+X3+...Xn n MODA: Mo es el dato que ms se repite en la muestra MEDIANA: Md es el dato central de la estadstica de orden (no es nica, no la afectan las observaciones extremas o pesadas en las colas). n non n par X(n+1)/2 X(n/2)+X(n/2)+1 2 **todas dependen de la MUESTRA ORDENADA, menos media y moda MNIMO: X(i) MXIMO: X(n) PRIMER CUARTIL: Q1= Xn(0.25) TERCER CUARTIL: Q3= Xn(0.75) Ejercicio: 1. aplicar las medidas de tendencia central al ejemplo anterior.

2. tomando las edades del grupo calcular las medidas de tendencia central,
manualmente y con Excel.

MEDIDAS DE DISPERSIN
Son aquellas que nos permiten ver o evaluar qu tan dispersa o variable es una muestra. 1. RANGO= MX MN

2. RANGO INTERCUARTIL=Q3-Q1 3. VARIANZA MUESTRAL=


S2 =

( x

X )2 n 1
i

S2 =

2 i

n( X ) 2 n 1

La varianza es un valor nico y siempre es positivo 4. DESVIACIN STANDARD MUESTRAL=

S2 =S

Lo ms prctico es calcular estos valores con una tabla. Ej.: Primero se calcula la media, la tercer columna se eleva al cuadrado para que sea positivo. X(i) 14 8 6 12 13 X(i)-X 3.4 -2.6 -4.6 1.4 2.4 (X(i)-X)2 11.56 6.76 21.16 1.96 5.76 47.2

(ver grficas) REGLA EMPRICA / intervalos de la regla aproximada Representan el porcentaje includo de la poblacin
X S

68%
X 2S

95% 99%

X 3S

Ver grfica de campana con N(0,1)

Cuando manejamos informacin categrica, los datos ya no se refieren como x1,x2,x3, etc son CONTEOS de qu elemento cae en qu categora. Normalmente se usa el CIRCULOGRAMA (no aplica en datos contnuos). Para datos categricos, no hay medidas de tendencia central, ni de dispersin, porque los datos no tienen orden ni magnitud.

DATOS BIVARIADOS
Xi 2.6 2.2 3.4 2.3 3.1 2.1 3.2 3.8 Yi 74 69 85 63 82 60 79 91

Donde Yi= ventas del mes (variable que no puedo controlar) y Xi=publicidad (s la puedo controlar) n=8 estadsticas de x de y son univariadas, pero necesito saber si hay relacin...... entonces realizo una grfica de dispersin para detectar si hay una curva o funcin lineal. Relacin + Relacin r= +1 r= -1 r= 0

1 r 1

No hay relacin o es nula

es necesario buscar la CORRELACIN MUESTRAL, y con ese fin se


aplicar una REGRESIN.
S xy S xx S yy

CORR ( xi yi ) = r =

y = a +bx

S xx = (xi2 ) nx 2 S yy = yi2 ny 2
S xy = i yi nx y x

Pendiente

b=

S xy S xx

Ordenada al origen

a = y bx

Xi 2.6 2.2 3.4 2.3 3.1 2.1 3.2

Yi 74 69 85 63 82 60 79

Xi2 6.76 4.84 11.56 5.29 9.61 4.41 10.24

Yi2 5476 4761 7225 3969 6724 3600 6241

XiYi 192.4 151.8 289 144.9 254.2 126 252.8 345.8 1756.9

3.8 91 14.44 8281 22.7 603 67.15 46277

Entonces, hay una relacin de causalidad, y depende de x.

You might also like