You are on page 1of 11

GIMNASIO FONTANA SUBJET MATH 2007 2008 GRADE: ELEVETH TEACHER: PEDRO EMILIO PREZ ROMERO CONCEPTOS BSICOS1

1 ESTADSTICA DESCRIPTIVA NUMRICA. MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central son valores numricos que localizan, de alguna manera, el centro de un conjunto de datos. El trmino promedio a menudo es asociado con todas las medidas de tendencia central. Las medidas de tendencia central ms conocidas son: MEDIA Promedio que quiz sea el ms conocido. Se representa por x (que se lee como x barra o medid de la muestra). La media se encuentra sumando todos los valores de la variable x ( la suma de los valores de x se simboliza como x ) y dividiendo entre el nmero de estos valores, n. X x = n MEDIANA Valor de los datos que ocupa la posicin central cuando los datos se x ordenan segn su tamao. Se representa por ~ ( se lee como x tilde o mediana de la muestra). Procedimiento para encontrar la mediana. Paso 1: Ordene los datos. Paso 2: Determine la profundidad de la mediana. La profundidad (nmero de posiciones a partir de cualquier extremo), o posicin, se determina con la siguiente formula: n +1 x (d) ~ = , donde n es el nmero de datos de la muestra. 2 Paso 3: Determine la mediana. La mediana ser la misma sin importar a partir de cul extremo de los datos ordenados (mximo o mnimo) se cuente.

MODA
1

Tomado y adaptado de Estadstica Elemental Lo Esencial. Jonson. R, Kuby. P, 2. Edicin. Editorial Thomson. 1999.

Es el valor de x que ocurre ms frecuentemente. Si dos o ms datos estn empatados en cuanto a mayor frecuencia (nmero de ocurrencias), se dice que no hay moda. RANGO MEDIO Nmero que est exactamente a la mitad del camino entre un dato con menor valor Mn y un dato con mayor valor Mx. Se encuentra promediando los valores mnimo y mximo. Mn + Mx Valor medio = 2 MEDIDAS DE DISPERSIN. Una vez se ha localizado el centro con las medidas de tendencia central, la investigacin se dirige ahora a las medidas de dispersin. Las medidas de dispersin incluyen el Rango, la Varianza y la Desviacin Estndar. Estos valores numricos describen la cantidad de dispersin o variabilidad, que se encuentra entre los datos: datos bastante agrupados poseen valores relativamente pequeos, y datos ms dispersos tienen valores ms grandes. El agrupamiento ms estrecho ocurre cuando los datos carecen de dispersin (todos los datos tienen el mismo valor), para los cuales la medida de dispersin es cero. No hay lmite respecto a cun dispersos pueden ser los datos; en consecuencia las medidas de dispersin pueden ser muy grandes. RANGO Es la diferencia en valor entre las porciones de datos mayor (Mx) y de menor valor (Mn): Rango = Mx Mn DESVIACIN CON RESPECTO A LA MEDIA. Una desviacin de la media, x - x , es la diferencia entre el valor de x y la media x . Cada valor individual x se desva de la media por una cantidad igual a (x - x ). Esta desviacin (x - x ) es cero cuando x es igual a la media. La desviacin (x - x ) es positiva si x es mayor que x y negativa en caso contrario. La suma de las desviaciones ( x - x ) , siempre es cero debido al efecto de neutralizacin entre las desviaciones de los valores menores que la media que son negativos y los valores mayores que sta que son positivos; por esta razn no es un estadstico de utilidad. Una manera de eliminar este efecto de neutralizacin es elevar las desviaciones al cuadrado (sern valores positivos o cero), las desviaciones al cuadrado se utilizan para determinar la varianza. VARANZA DE LA MUESTRA.

La varianza de la muestra, s , es la media de las desviaciones al cuadrado, calculada usando como divisor a n 1. 2 2 ( x x) s = n 1 donde n es el tamao de la muestra, es decir, el nmero de datos que hay en la muestra. DESVIACIN ESTNDAR. La desviacin estndar de una muestra, S, es la raz cuadrada positiva de la varianza:

MEDIAY DESVIACIN ESTNDAR DE DISTRIBUCIONES DE FRECUENCIAS. Cuando los datos de la muestra estn en forma de distribucin de frecuencias, podemos utilizar las siguientes frmulas para encontrar la media, la varianza y la desviacin estndar. Para hallar la media: xf x= f Para determinar la varianza:

ILUSTRACIN: Encontrar la media, la varianza y la desviacin estndar de la muestra de 50 puntajes del examen, usando la distribucin de frecuencias agrupadas (del ejemplo ya realizado). No. De Clase 1 2 3 4 5 6 7 Marca de Clase 40 50 60 70 80 90 100 f 2 2 7 13 11 11 4 f = 50 xf 80 100 420 910 880 990 400 xf = 3780

( xf ) x f f s= f 1
2 2

3200 5000 25200 63700 70400 89100 40000 2 x f = 296000

x=

xf f

3780 = 75.6 ; = 50

( xf ) x f f s= f 1
2 2

296600

37802 50 = 10832 = 221.1 50 1 49

s = s 2 = 221.1 = 14.9 MEDIDAS DE POSICIN. Las medidas de posicin se usan para describir la posicin que tiene un valor de datos en relacin con el resto de los datos. Dos de las medidas de posicin ms conocidas son los cuarteles y los porcentiles (percentiles). CUARTILES. Son los valores de la variable que dividen en cuartos a los daos ordenados; cada conjunto de datos posee tres cuarteles. El primer cuartil,
1

Q , es un nmero tal que cuando mucho el 25% de los datos es menor en valor que Q y cuando mucho el 75% de los datos es mayor que Q . El segundo cuartil es la media. El tercer cuartil, Q , es un
1 1 3

nmero tal que cuando mucho el 75% de los datos es menor en valor que

y cuando mucho el 25% de los datos es mayor que Datos clasificados en orden creciente 25% 25%

25% Mn

25%
3

Mx PORCENTILES: Son los valores de la variable que dividen a un conjunto de datos ordenados en 100 subconjuntos iguales; cada conjunto de datos tiene 99 porcentiles. El K-simo porcentil, P k , es el valor tal que cuando mucho K % de los datos son ms pequeos en valor que (100 K)% de los datos es mayor.

y cuando mucho

Datos clasificados en orden creciente A lo ms K % a lo ms (100 K ) % Mn Mx NOTAS

1. El primer cuartil y el 25avo porcentil son iguales;es decir ,tambin

Q =P
1

25

Q =P
3

75

2. La mediana, el segundo cuartil y el 50avoporcentil son iguales, ~= x Q = P50


2

Procedimiento para determinar el valor de cualquier K-simo porcentil (o cuartil). a. Ordenar los datos, del ms chico al ms grande. nk b. Calcular 100 c. Se obtiene un entero A, entonces d ( P k ) = A.5 , P k est a la mitad entre el valor del dato en la A-sima posicin y el valor del siguiente dato. d. Se obtiene un nmero con una fraccin, entonces P k es el valor del dato en la B-sima posicin. CUARTIL MEDIO. Es el valor numrico entre el primer cuartil y el tercer cuartil. Q + Q3 . Cuartil medio = 1 2 RESUMEN DE CINCOPUNTOS El resumen de cinco puntos est integrado por: 1. Mn, el mnimo valor en el conjunto de datos. 2. 4. x 3. ~ , la mediana.
1

Q , el primer cuartil (tambin denominado 25avo porcentil). Q


3

, el tercer cuartil (tambin denominado 75avo porcentil).

5. Mx, el mximo valor en el conjunto de datos. REPRESENTACIN DE CAJA Y BIGOTES. Es la representacin grfica del resumen de 5 puntos. Los cinco valores numricos (el mnimo, el primer cuartil, la mediana, el tercer cuartil y el mximo) se localizan sobre una escala, ya sea vertical u horizontal. La caja se usa para mostrar la mitad central de los datos que estn entre los dos cuartiles. Los bigotes son segmentos de recta que se usan para representar la otra mitad de los datos: un segmento de recta representa la cuarta parte de los datos que son ms pequeos en valor que el primer cuartil, y el segundo segmento de recta representa el cuarto de datos que es de mayor valor que el tercer cuartil. PUNTAJE Z.

Posicin que tiene un valor particular de x con respecto a la media, media en desviaciones estndar. El puntaje Z se calcula con la frmula xx Z= s Ejemplo No. 5 Un estudio de investigacin sobre destreza manual implicaba la determinacin del tiempo necesario para completar una tarea. A continuacin se muestra el tiempo necesario para cada una de las 40 personas con discapacidad.

7.1 7.2 8.3 8.4 9.4 9.6 11 11. 1


Encuentre: a.

7.2 7.6 8.1 8.1 7.6 7.9 8.1 8.3 8.4 9 9.1 9.1 8.9 9 9.1 9.1 9.9 10.110.2 10.5 10.1 10.110.3 10.7 11.2 11.213.6 14.9 11.2 12 14.7 15.5
b.

c.

d.

95

e. El resumen de 5 puntos bigotes.

f. Trace el diagrama de caja y

1. Ordenar los datos en forma creciente.

7.1 8.1 9.1 10.1 11.2 7.2 8.3 9.1 10.1 11.2 7.2 8.3 9.1 10.2 11.2 7.6 8.4 9.1 10.3 12 7.6 8.4 9.4 10.5 13.6 7.9 8.9 9.6 10.7 14.7 8.1 9 9.9 11 14.9 8.1 9 10.1 11.1 15.5
2. Calcular los cuartiles o lo que es igual los porcentiles: nk 40 * 25 Q1 = P 25 = 100 = 100 = 10 , (recordar que este es un valor posicional y no numrico), buscar el valor numrico ubicado en la posicin nmero 10, el cual corresponde a Q = 8.3 .
1

3. De la misma manera se encuentran

=~= x

P ,Q = P
50 3

75

...

4. Con los datos obtenidos se traza el diagrama de caja y bigotes. TEOREMA DE CHEBYSHEV. La porcin de cualquier distribucin que est a menos de k desviaciones 1 estndar de la media es por lo menos 1 2 , donde k es cualquier nmero positivo mayor que 1. Este teorema es vlido para todas las distribuciones de datos. DATOS DE DOS VARIABLES. Estos datos constan de los valores de dos variables respuesta diferentes que se obtienen del mismo elemento de la poblacin. Cada una de las dos variables puede ser de naturaleza cualitativa o cuantitativa. Como resultado, los datos bivariados pueden formarse mediante tres combinaciones de variable: 1. Ambas variables son cualitativas (Atributo). 2. Una variable cualitativa (Atributo) y otra es cuantitativa (Numrica). 3. Ambas variables son cuantitativas (Numrica). Cuando los datos bivariados resultan de dos variables cualitativas (de atributo o categora), a menudo los datos se disponen en una tabla cruzada o de contingencia. 1. ILUSTRACIN. (Ambas variables cualitativas) Treinta estudiantes de una Universidad fueron identificados y clasificados aleatoriamente segn dos variables: 1) Gnero (M/F) y 2) Especializacin (Filosofa y Letras, Administracin de Empresas, Tecnologa), como se muestra en la siguiente tabla:

NOMBR E Adams Argento Baker Bennett

GNER O M F M F

ESPECIALI NOMBRE Z FyL AE FyL FyL Kee Kleeberg Light Linton

GNER O M M M F

ESPECIALI Z AE FyL FyL FyL

Brock Brand Chun Crain Cross Ellis Feeney Flaniga n Hodge Holmes Jopson

M M F M F F M M F M F

AE T FyL T FyL FyL T AE AE T T

Lopez McGowan Mowers Ornt Palmer Pullen Rattan Sherman Small Tate

M M F M F M M F F M

T AE AE T AE T AE AE T AE FyL

Yamamoto M

A. Tabla cruzada de gnero y especializacin por conteo.

Filosofa Letras Gnero Masculin o Femenin o

Especializacin y Administracin Empresas

de Tecnologa

B. Tabla cruzada de gnero y especializacin por frecuencia.

Filosofa Letras

Especializacin y Administracin Empresas

de Tecnolog a

Totales por Rengln

Gnero Totales columnas

Masculin o Femenin o por

C. Tabla cruzada de gnero y especializacin frecuencias relativas; % del gran total.

Filosofa Letras Gnero Totales columnas Masculin o Femenin o por

Especializacin y Administracin Empresas

de Tecnolog a

Totales por Rengln

D. Tabla cruzada de gnero y especializacin; % de los totales por rengln.

Filosofa Letras Gnero Totales columnas Masculin o Femenin o por

Especializacin y Administracin Empresas

de Tecnolog a

Totales por Rengln

E. Tabla cruzada de gnero y especializacin; % de los totales por columna.

Filosofa Letras Gnero Totales columnas Masculin o Femenin o por

Especializacin y Administracin Empresas

de Tecnolog a

Totales por Rengln

2. ILUSTRACIN (Una variable cualitativa y otra cuantitativa). Para comparar la capacidad de frenado de tres diseos de bandas de rodamiento, se midi la distancia necesaria para detener un automvil de 3000 libras que se desplazaba sobre pavimento hmedo. Los neumticos de cada diseo fueron probados en el mismo vehculo que circulaba sobre un pavimento hmedo controlado: Distancia de frenado para los tres diseos de banda de rodamient o

Diseo A (n=6 37 34 38 36 40 32

Diseo B (n=6) 33 34 38 35 42 34

Diseo C (n=6) 40 41 40 39 41 43

El diseo de la banda de rodamiento es una variable cualitativa con tres niveles de respuesta y la distancia de frenado es una variable cuantitativa. DOS VARIABLES CUANTITATIVAS Cuando los datos bivariados son resultado de dos variables cuantitativas, los datos matemticos suelen expresarse como pares ordenados (x,y), donde x es la variable de entrada (algunas veces llamada variable independiente) y y es la variable de salida (algunas veces llamada la variable dependiente). En los problemas en que

intervienen dos variables cuantitativas, los datos de la muestra se representan grficamente en un diagrama de dispersin. DIAGRAMA DE DISPERSIN Es la grfica de todos los pares ordenados de datos de dos variables que estn en un sistema de ejes coordenados. La variable de entrada, x, se grfica en el eje horizontal y la variable de salida, y, se grfica en el eje vertical. ILUSTRACIN. En la clase de educacin fsica del profesor Pretel, se tomaron varios puntajes de condicin fsica. La muestra siguiente es el nmero de lagartijas y sentadillas realizadas por 10 estudiantes elegidos aleatoriamente: (27,30), (22,26), (15,25), (35,42), (30,38), (52,40), (35,32), (55,54), (40,50), (40,43).

You might also like