You are on page 1of 8

UNIVERSIDAD DE LOS LAGOS NOCIONES DE ESTADISTICA

Apuntes preparados por el profesor Francisco Vergara Cubillos


UNIDAD I: RECOLECCION DE DATOS Concepto y tipos de variable : Las variables son las caractersticas que, por su diferente intensidad, interesa estudiar, ya sean stas pertenecientes a los seres vivos u otros acontecimientos de la naturaleza. Como su nombre lo indica las caractersticas son variables dentro de cada individuo, segn las circunstancias, como entre los individuos de la misma especie. Ejemplo: La edad es una caracterstica que vara tanto en el individuo, como entre ellos. No todos los hombres tienen la misma edad, ni tampoco una persona mantiene su edad. La estatura, la presin arterial, la temperatura, el color del pelo o de los ojos, son otras caractersticas con distintas intensidades segn el individuo. Las variables pueden ser de 2 tipos: Cualitativa: Es aquella que se refiere, como su nombre lo indica, a cualidades o atributos no medibles de los individuos. En forma general se dice que atributos son las propiedades de los fenmenos que se pueden describir cualitativamente. No se dispone de instrumentos de medicin para determinar su intensidad. Son de este tipo las variables: sexo, nacionalidad, color de piel, estado de salud, medidas en un individuo. La construccin de una escala de clasificacin para este tipo de variable es simple, puesto que la misma variable genera la escala, siendo en algunos casos solo dicotmica. Cuantitativa: Son aquellas que se pueden medir con algn tipo de instrumento o escala de cierta precisin. Su variacin puede ser dentro de una escala "continua" y en ese caso presentar cualquier valor comprendido entre los extremos de la escala. Ejemplos: edad de una persona, ingreso, ventas de una empresa. Tambin su variacin puede ser en forma "discontinua o discreta", expresndose slo en valores enteros. Ejemplos: nmero de hijos de una familia, nmero de empleados de una empresa. El mtodo de obtencin de datos La encuesta se puede considerar como un mtodo de investigacin que proporciona informacin sobre condiciones sociales, relaciones o conductas de los individuos. Se utiliza tanto para estudios descriptivos como explicativos. Los mtodos para la obtencin de datos pueden clasificarse en directos e indirectos: "Los directos" son aquellos que permiten obtener la informacin a travs del contacto personal con los individuos seleccionados en la muestra. Entre ellos estn: la entrevista y la observacin. "Los indirectos" son aquellos en que el contacto no es personal sino a travs de documentos. Entre ellos estn: las historias clnicas, fichas personales, etc. y los cuestionarios que el informante o encuestado responde por su cuenta. II. PRESENTACION DE LA INFORMACION

La finalidad principal de la recopilacin de datos estadsticos consiste en obtener informacin relacionada con los asuntos investigados, por lo tanto, las labores estadsticas no terminan con la tabulacin de los datos, ya que no es suficiente disponer de estadsticas en archivos o gavetas de escritorios de las oficinas. El proceso cuidadoso y costoso de las operaciones estadsticas, solamente tiene valor, si a los resultados se les da la forma de cuadros estadsticos destinados al usuario. Es necesario buscar los medios que permitan presentar los datos mas importantes dentro del menor nmero posible de cuadros y poder servir mejor al usuario. Las informaciones obtenidas en una investigacin estadstica pueden presentarse en 3 formas diferentes, individualmente consideradas o combinadas: A. Texto : Es aquella que se hace en informes y artculos, en los que las informaciones se intercalan con comentarios que se presentan respecto de ellas. B. Tablas y Cuadros : Son aquellos en que se presenta una o mas variables en forma clasificada. C. Grficos: Los antecedentes se presentan en forma de figuras, de modo que las similitudes y contrastes de stas, permiten formarse una idea rpida de las magnitudes de las informaciones presentadas. Presentacin tabular. Consiste en presentar en dos columnas, las categoras de la variable de observacin y las frecuencias correspondientes, de manera que en una fila se indica la categora y su frecuencia correspondiente Niveles de medicin a) Escala o nivel nominal: En este caso la variable induce sobre la poblacin una particin y por lo tanto la informacin se puede clasificar en "clases" Cada clase debe estar perfectamente definida y diferenciada de las dems. La recopilacin se reduce a contar el nmero de individuos de la muestra que pertenecen a cada clase. Ejemplo: Carcter o variable: tipo de mquina de escribir Clases : manual, elctrica, electrnica b) Escala o nivel ordinal: El carcter en estudio admite grados de calidad u ordenamiento esto significa que existe una relacin de orden total entre las clases. Ejemplo: Carcter o variable: Nivel educacional Clases : Educacin bsica, media, superior. c) Escala o nivel intervalar: La informacin obtenida en este caso es de tipo cuantitativo o numrico y es posible agruparla en intervalos de igual o diferente amplitud. Ejemplo: Carcter o variable: Ingreso en miles de pesos Intervalos (clases): [20 - 40 [ [40 - 60 [ .......... [200- 300[ EJEMPLO DE TABLA Tabla N 1: Lugar de destino de los turistas que llegan en vehculo particular a Puerto Montt, en temporadas alta y baja (Verano 1999) Lugar de destino Turistas Porcentaje

Puerto Montt Chilo Puerto Varas Carretera austral Calbuco Frutillar Maulln Otros Total CUADRO ESTADISTICO

988 173 51 32 12 13 3 16 1.288

76,7 13,4 4,0 2,5 0,9 1,0 0,2 1,3 100,0

El cuadro estadstico a diferencia de una tabla de distribucin de frecuencias, permite la tabulacin de mas de una variable. La construccin de un cuadro estadstico es una labor aparentemente sencilla, pero conviene procurar que ellos sean de fcil, lectura, comprensin e interpretacin. Cada cuadro estadstico tiene su forma propia, pero existen ciertas normas generales que permiten, hasta cierto punto, presentarlos con criterios uniformes.

CUADRO

1: Vehculos particulares que llegan a Puerto Montt por tipo segn fecha de muestreo, temporadas alta y baja (verano 1999) Fecha de muestreo Total Vehculos de vehculos turistas 1.291 101 166 103 109 101 79 124 148 107 97 57 47 22 30 1.135 156 205 260 162 289 263 182 317 314 236 320 194 2.382 1.064 Vehculos de Proporcin no turistas de veh/turistas 3.446 231 176 297 -------0,3042 0,4853 0,2575 0,3471 0,2798 0,3278 0,3002 0,3570 0,3702 0,2343 0,1536 0,1661 0,0643 0,1339

Total 4.737 9 enero 332 11 enero 342 15 enero 400 23 enero 314 (6 ene/24 feb) temporada 27 enero 361 alta 31 enero 241 6 febrero 413 16 febrero 411 19 febrero 289 24 febrero 414 26 febrero 371 27 febrero 283 (25 feb/14 mar) temporada 3 marzo 342 baja 7 marzo 224 Total alta 3.517 Total baja 1.220

Mtodos grficos Un grfico es una representacin pictrica (figuras geomtricas o superficies), utilizada para estudiar los cambios en una sola variable, o bien comparar varias variables similares o relacionadas. Naturalmente que un grfico no tiene la misma precisin de una tabla, dado que no toma en cuenta los detalles. Principales tipos de grficos

Grfico lineal: Es el tipo de grfico empleado con mas frecuencia. Se prefiere su uso a cualquier otro tipo, cuando la variable es continua y existe un nmero considerable de datos. Grfico de barras: Muestran los datos mediante rectngulos paralelos, colocados horizontal o verticalmente, del mismo ancho y de longitud proporcional a la magnitud representada. Se usan para presentar la distribucin de frecuencia de atributos o de variables cuantitativas discretas. Grfico de sectores: Es un crculo cuya rea se divide en sectores circulares representativos de las partes proporcionales de un todo. Constituye un tipo de diagrama de partes componentes y se utiliza para comparar las partes integrantes de un total. Pictogramas: Se utilizan para presentaciones al pblico o para fines propagandsticos, en que el objetivo principal es atraer la atencin. Se puede representar por ejemplo el nmero de alumnos de distintos colegios, dibujando un nio por cada 10 alumnos, de tal manera que mientras mayor sea el nmero de dibujos correspondientes a una determinada escuela, sta indicar que mayor es el nmero de alumnos de dicha escuela. Ejemplo: GRAFICO 1: Vehculos particulares de turistas y no turistas llegados a Puerto Montt Total vehculos
300 .

270 240 No turistas 210 180 . 150 120 Turistas 90 60 30 9 11 15 23 27 Enero 31 8 16 19 24 Febrero 26 27 das muestreo 3 7 Marzo lmite temporada .

GRAFICO 2: Promedio de vehculos particulares llegados a Puerto Montt por

hora en que se realiz la encuesta en temporadas alta y baja. Promedio 16 temporada alta 14 -

12 10 8642 9,30 10,30 11,30 12,30 13,30 14,30 15,30 16,30 17,30 18,30 19,30 hora muestreo temporada baja

III.- MEDIDAS DE RESUMEN III.1.- Estadstica de atributos Atributos son las propiedades de los fenmenos que se pueden describir cualitativamente, como profesin o color de pelo. Cuando en una muestra de "n" elementos se considera slo la presencia o ausencia de una cualidad o atributo, es posible formar dos clases excluyentes. Ejemplo: Atributo: estatura _ _ (A) altos (A) no altos n(A) + n(A) = n En este tipo de caracterstica slo es posible de calcular los estadsticos: razn, tasa y porcentaje. Razn: Es la comparacin entre dos categoras de una distribucin, por lo tanto puede tomar cualquier valor. ni ri = -nj Tasa: Son las nicas que miden riesgo y estn referidas a un perodo determinado de tiempo. Por ejemplo, tasas de mortalidad, de desempleo, de natalidad, etc. Puede tomar cualquier valor positivo o negativo. Se suelen multiplicar por potencias de 10 para darle una mayor facilidad de lectura. Porcentaje: Es la comparacin entre una categora de la distribucin y el total de ella, valor que se acostumbra multiplicar por 100. ni % = -- . 100 n III.2.- ESTADIGRAFOS DE POSICION

Como su nombre lo indica, son estadgrafos que describen la posicin que ocupa una distribucin de frecuencia respecto a un valor de la variable. Estos estadgrafos, son valores que de manera condensada representan en un slo valor, a una serie de datos y adems describen resumidamente al conjunto de observaciones. La experiencia indica que para las escalas ordinales, de intervalos, las observaciones de las distribuciones de frecuencia tienden a concentrarse alrededor de un sector de la variable. Se trata, entonces de aceptar ciertos criterios para representar con un valor o categora de la distribucin esa tendencia de la observaciones, que se llama tendencia central. La aceptacin de esos determinados criterios, da lugar a la creacin de distintos conceptos de medidas de tendencia central, cuales son: Modo, mediana, media aritmtica y otros. Modo: Se define como aquel valor o categora de la variable que representa una mayor frecuencia en la distribucin. En el caso de observaciones medidas con escalas de intervalos, se conviene en que el modo es el punto medio del intervalo normal que presenta una mayor frecuencia. Mediana: Es la categora o valor de la distribucin que posee el orden medio, cuando las observaciones se han ordenado de acuerdo con los valores o categoras de la variable. Es decir, que la mediana nos indica la posicin que tiene la observacin que ocupa el lugar del medio de la serie, con relacin a las categoras o valores de la variable. Que el valor de la mediana divida al total de las "n" observaciones en dos partes de igual tamao, significa que a uno y otro lado de ella se encuentra no mas del 50% del total de las observaciones, es decir, que no mas de la mitad de las observaciones son menores que la mediana y no mas de la mitad son mayores. Media aritmtica: Dada una distribucin de observaciones, denominamos media de la distribucin a un valor x, tal que si todas las observaciones tuvieran ese valor, la suma total de ellas sera igual a la suma de las observaciones de la distribucin original. La media aritmtica se define y calcula dividiendo la suma de los valores de la variable, por el nmero de observaciones o valores. _ x = xi n III.3.- MEDIDAS DE DISPERSION As como los parmetros de tendencia central (media, mediana y moda) describen la caracterstica tpica de una distribucin, otro conjunto de parmetros tales como el recorrido, la desviacin estndar y la desviacin media, miden la disparidad entre las diversas variantes que componen la poblacin. Estos parmetros, llamados medidas de dispersin, son utilizados para indicar el grado de uniformidad (parecido) entre los elementos de una distribucin. Una poblacin de elementos no tiene dispersin cuando todas los datos tienen el mismo valor. Por ejemplo, en la poblacin (3,3,3,3,3), cada dato, as como la media aritmtica, mediana y moda, valen 3 y la poblacin no tiene, por lo tanto, dispersin. En cambio, la poblacin (1,3,3,3,5) tiene una cierta dispersin ya que no todas los datos son iguales. El recorrido: Es la diferencia entre los valores mayor y menor de una distribucin: R = dato mximo - dato mnimo

El recorrido de la poblacin (1,3,3,3,5) es 4 El recorrido, como medida de dispersin, es deficiente ya que considera slo los valores extremos y no toma en cuenta los restantes. Los dos conjuntos de variantes: Conjunto I: 1,3,3,3,5 y Conjunto II: 1,1,4,4,5 tienen el mismo recorrido 4, aunque hay menos dispersin en I que en II. La desviacin estndar La desviacin estndar, designada por sigma, mide la desviacin promedio de cada valor respecto de la media aritmtica. Existen varias frmulas de clculo, la mas comn seala, que la desviacin estndar es la raz cuadrada del promedio de los cuadrados de las diferencias entre los valores de la variable y la media aritmtica. _ (xi - x )2 n

Se entiende que en una distribucin los datos son tanto o mas parecidos, cuando menor sea el valor de la desviacin estndar, lo que sirve para poder comparar distribuciones. Coeficiente de variacin Comparar en forma absoluta estadgrafos de posicin o de dispersin, en algunos casos, slo puede acarrear confusiones, por que, por ejemplo, pueden estar expresada en distintas unidades de medida. Por ejemplo, una distribucin donde el menor ingreso es 1.000 y el mayor 1.100, es mucho mas homognea, que otra distribucin donde el menor ingreso es 100 y el mayor 200. En un caso la diferencia entre el menor y el mayor ingreso es 10%, mientras que en el otro es de 100% Es necesario entonces disponer de un estadgrafo que tome en cuenta la tendencia central de la distribucin. Se define as el coeficiente de variacin (o variabilidad), como la razn entre la desviacin tpica y la media aritmtica: Desviacin media C.V. = -------------------Media aritmtica Veamos el ejemplo siguiente: " el promedio aritmtico de las remesas o embarques semanales de la fbrica A, durante el ao pasado, fue de 220 unidades y la desviacin estndar 31. El mismo promedio de las remesas semanales de la fbrica B fue 340 y su desviacin estndar 41. En qu fbrica fue mayor la variabilidad de semana a semana? 31 41 CVA = --- = 0,14 CVB = --- = 0,12 220 340 En consecuencia la variabilidad fue relativamente mayor en la fbrica A. Tambin se puede decir que, las ventas en la empresa B son ms homogneas, lo que significa, por otra parte, que son mas predecibles. Ejemplo de aplicacin de los estadgrafos compuestos Supongamos que usted es un alumno trabajador, por lo cual una vez obtenido un ttulo ha logrado, acceder a dos posibles nuevos trabajos, en los que se le propone realizar dos tipos de actividades diferentes; una, manteniendo el rol que en la actualidad ya tiene y otro, con un rol diferente, que significa entrar en un escalafn distinto. Se incluye la propuesta de su actual trabajo.

SERVICIO ACTUAL PROPUESTA 1 PROPUESTA 2

ROL ACTUAL Media : M$ 215 Desv. Estndar : 48 C. V. : 0,223 Media : 275 Desv. Estndar : 68 C.V. : 0,247 Media : 300 Desv. Estndar : 110 C.V. : 0,366

NUEVO ROL Media Desv. estndar C.V. Media Desv. Estndar C.V. Media Desv. Estndar C.V.

: M$ 260 : 84 : 0,323 : 290 : 104 : 0,358 : 295 : 78 : 0,264

a) Se pide ordenar las diferentes propuestas, incluyendo la actual, por grado de heterogeneidad.
Seale cual le parece menos conveniente justificando su decisin. AC 2 N1 NA - N2 AC1 ACA 0,366 0,358 0,323 0,264 0,247 0,223 b) Si fuera recomendable para Ud. en orden a haber adquirido una formacin que le impulsa a tomar como nica opcin el Nuevo Rol, cul sera la decisin que tomara y porqu ?. c) Si por el contrario su Rol actual le satisface, cul opcin elegira ?

You might also like