Professional Documents
Culture Documents
ASIGNATURA: PROBALIDADES Y ESTADSTICA CARRERA: ________________________________________________________ MATERI : Estadstica Descriptiva. Poblacin, Muestra, Variable y Medicin. Tipos de Variables, Tablas de Distribucin de Frecuencias y Grficos. PROFESOR: CARLOS FLORES CARVAJAL
ESTADSTICA
La palabra estadstica se emplea en una gran variedad de formas: En plural como sinnimo de datos. En singular tiene muchas definiciones solamente daremos dos. Es una ciencia en si misma, y la vez una metodologa de investigacin. Como la ciencia que nos proporciona un conjunto de mtodos , tcnicas o procedimientos para: - Recopilar, - Organizar ( clasificar, agrupar), - Analizar, Datos con el fin de describirlos o de realizar generalizaciones vlidas. Los conceptos de la estadstica pueden aplicarse en reas como: - Los negocios - La administracin, - La psicologa, - La agricultura etc. Pero cuando nos referimos a las ciencias biolgicas y de la salud, utilizamos el trmino de BIOESTADISTICA. LA ESTADSTICA, SUS APLICACIONES Y MTODO. Estamos en una etapa histrica, en que el uso y creacin de informacin, a partir de informacin inicial, es fundamental, tanto en el mbito de las disciplinas de modelos matemticos como en otras, al parecer desvinculadas de estas instancias. En la lnea de lo primero, distinguimos, la Estadstica Descriptiva, que como su nombre lo indica, ordena informacin, llegando a describir la ocurrencia de fenmenos o eventos, mediante grficos o tablas, adems involucra la obtencin inicial de la informacin deseada, sin pretender explicaciones de orden causal. A estas medidas que resumen al gran conjunto de datos, se les llama Estadsticas o Estadgrafos. En la lnea de lo segundo, existir un conjunto de procedimientos que permitirn obtener nueva informacin, es la Estadstica Inferencial, la que en su desarrollo terico, permanentemente utiliza el concepto de Probabilidad, idea esta, que tambin llega a desarrollar su propia teora, la Estadstica de Probabilidades. La Estadstica proporciona un conjunto de mtodos aplicables en todas las reas cientficas donde se acumulan, se analizan y se interpretan datos: Salud y medicina, Biologa, Economa, Administracin, Contabilidad, Ingeniera etc. y en la Investigacin Cientfica.
( Deductiva ) ( Inductiva)
ESTADSTICA DESCRIPTIVA: Se denomina estadstica descriptiva, al conjunto de mtodos estadsticos que se relacionan con el resumen y descripcin de los datos, como tablas, grficos y el anlisis mediante algunos clculos. INFERENCIA ESTADSTICA: Se denomina inferencia estadstica al conjunto de mtodos con los que se hacen la generalizacin o la inferencia utilizando una muestra. La inferencia puede contener conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario que stas sean dadas con una medida de confiabilidad que es la probabilidad. Estas dos ramas de la estadstica no son mutuamente excluyentes, ya que para utilizar los mtodos de la inferencia estadstica, se requiere conocer los mtodos de la estadstica descriptiva. FENOMENOS DETERMINSTICOS Y NO DETERMINSTICOS En la vida cotidiana nos solemos encontrar con una serie de situaciones cuyas consecuencias conocemos y de antemano podemos predecir, por ejemplo al finalizar el mes de Septiembre, comienza el mes de Octubre, al sumar siete ms cinco, el resultado es doce, los fenmenos como los descritos reciben el nombre de Fenmenos Determinsticos. Sin embargo hay otros fenmenos con distintos resultados posibles, de los que no se pueden efectuar afirmaciones certeras hasta que hayan ocurrido, por ejemplo lanzar un dado y observar su cara superior, conocer los resultados de la polla gol del prximo domingo, estos fenmenos cuyos resultados no pueden asegurarse hasta el momento de su ocurrencia reciben el nombre de fenmenos no determinsticos o aleatorios, no podemos saber cual de los resultados ocurrir la prxima vez que se observe este fenmeno, aunque conozcamos todos los resultados posibles.
ESCALA NOMINAL. En el estudio de la estadstica encontramos distintos tipos de datos numricos, los cuales, a su vez, tienen diferentes grados de estructura en las relaciones entre sus posibles valores. Una de las clases ms simples de datos es la variable nominal, en la cual los valores se registran dentro de categoras o clases desordenadas. Ejemplo N 1 En cierto estudio, los hombres podra asignrseles el valor 1 y las mujeres el 0. Aunque los atributos se indican con nmeros, en lugar de vocablos, tanto el orden como las magnitudes de los nmeros son irrelevantes. Podramos simplemente representar con el 1 a las mujeres y con el cero a los hombres. Los nmeros se utilizan principalmente por razones de conveniencia. Ejemplo N 2 A menudo hay tres o ms posibles categoras dentro de las cuales pueden colocarse las observaciones. Por ejemplo, las personas podran agruparse segn su tipo sanguneo de manera que: 1 represente 0 2 represente el tipo A 3 represente el tipo B 4 represente el tipo AB De nuevo la secuencia de estos valores no tiene importancia. Los nmeros simplemente sirven de etiquetas para los diferentes tipos de sangre, como lo hacen las letras. Si se asignan nmeros a estos valores cualitativos ( modalidades ), con estos no se pueden realizar operaciones aritmticas. Slo son vlidas las relaciones de igualdad ( = ) y no igualdad ( ) ESCALA ORDINAL: Cuando el orden entre las categoras adquiere importancia se denominan escalas ordinales. Ejemplo N 1 Los daos pueden clasificarse de acuerdo con su grado de gravedad, de modo que: 1 represente un dao fatal 2 un dao severo 3 un dao moderado 4 un dao menor.
ESCALA DE INTERVALOS: Una escala de intervalos es una escala ordinal con cuyos valores no slo se pueden verificar igualdad, no igualdad y orden, si no tambin, se puede elegir una unidad de escala y comprobar cuntas veces la diferencia entre dos valores es igual a la diferencia entre otros dos valores de la escala ( es decir , podemos comparar intervalos ). Este tipo de escala tiene un cero relativo y no un cero absoluto. Se miden en escalas de intervalos, por ejemplo, la temperatura, el tiempo que se registra en nuestros calendarios, las calificaciones de una prueba de conocimientos. Estas mediciones tienen un cero elegido arbitrariamente, por ejemplo el agua se congela a 0 grado Celsius ( = 32 grados F). La calificacin cero de un alumno en un examen de matemtica bsica, no quiere decir no sabe nada de tal materia, pues con otra prueba ms fcil podra tener otra calificacin. Con los nmeros de esta escala son vlidas las relaciones de igualdad, de no igualdad y de orden. Tambin son vlidas las operaciones de adicin y sustraccin entre los valores de la escala. Pero no es vlida la multiplicacin y divisin entre los valores mismo de la escala. Escalas de razn: La escala de razn es una escala de intervalo con cuyos valores adems podemos comprobar cuntas veces un valor de la escala es igual a otro valor de la escala. Tiene un cero absoluto. Con los nmeros de esta escala son vlidas las relaciones de igualdad, de no igualdad , de orden y todas las operaciones matemticas. Los valores de esta escala se obtienen en general, por mediciones tipo conteo (discretos) o por mediciones tales como la longitud, peso, volumen, vida til etc.
ESTADSTICA DESCRIPTIVA
EN FORMA DIRECTA (Censo Encuesta Entrevista ) RECOLECCIN DE LOS DATOS EN FORMA INDIRECTA ( I.N.E . REV. ESP. INTERNET )
AIEP DE LA UNIVERSIDAD ANDRES BELLO CUALITATIVOS O ATRIBUTOS ( Sexo Estado civil profesin - Raza etc. )
CLASIFICACIN DE LOS DATOS CUANTITATIVOS O VARIABLES. ( Estatura Peso Sueldos Volumen etc )
DISCRETAS
CONTINUAS
VARIABLE CUALITATIVA, es la caracterstica cuyos valores se expresan en escalas nominal u ordinal, por ejemplo, sexo, profesin, estado civil. Con sus valores, que son cualidades, no se pueden realizar operaciones aritmticas. Variable cuantitativa, es la caracterstica cuyos valores se expresan en escalas de intervalos o de razn, por ejemplo, temperatura, nmero de hijos, ingresoa mensuales, tiempo de vida til, etc. Con sus valores, que son nmeros, se pueden realizar operaciones aritmticas. Las variables cuantitativas, a su vez, se clasifican en : discretas, y continuas. Variable Discreta, es aquella variable cuantitativa que puede tomar slo ciertos valores en un intervalo considerado y no admite ningn valor entre dos valores consecutivos fijos. Generalmente, es una variable cuyos valores se obtienen por conteo (nmeros naturales). Por ejemplo, una familia puede tener 0,1,2,.....hijos, pero no un valor intermedio. Variable Continua, es aquella variable cuantitativa que puede tomar cualquier valor en el intervalo considerado, por ejemplo, salario, tiempo, peso, volumen, longitud, etc.
AIEP DE LA UNIVERSIDAD ANDRES BELLO TABLA DE DISTRIBUCIN DE FRECUENCIA PARA VARIABLE CUALITATIVA.
Ejemplo: En una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por sus colores: Negro (N), blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas. B N N B R N N B B N B N N R B N B R B N Construir la distribucin de frecuencias. Graficar la distribucin. Distribucin de personas por su color preferido de una Marca de bebida gaseosa. Valores de x Negro (N) Blanco (B) Rojo (R) Total Frecuencia Absoluta ni 9 8 3 20 Frecuencia Relativa hi 0.45 0.40 0.15 1.00 Frecuencias Porcentajes. 45 40 15 100
GRFICO CIRCULAR
Preferencias de bebidas
15% 45% Negro Blanco Rojo 40%
AIEP DE LA UNIVERSIDAD ANDRES BELLO TABLA DE DISTRIBUCIN DE FRECUENCIAS PARA VARIABLE CUANTITATIVA DISCRETA.
Ejemplo: Ante la pregunta del nmero de hijos por familia (variable x ) una muestra de 20 hogares, marc las siguientes respuestas: 2 1 2 4 1 3 2 3 2 0 3 2 1 3 2 3 3 1 2 4 Construir una tabla de distribucin de frecuencias. Distribucin de frecuencias, del nmero de hijos por familias N de hijos 0 1 2 3 4 Total Frecuencia Absoluta (ni) 1 4 7 6 2 20 Frec. Abs. Acumulada (NI) 1 5 12 18 20 Frecuencia Relativa (hi) 5 20 35 30 10 100 Frec. Relat. Acumulada (HI) 5 25 60 90 100
GRFICO DE BASTON
AIEP DE LA UNIVERSIDAD ANDRES BELLO TABLAS DE DISTRIBUCIN DE FRECUENCIAS PARA VARIABLE CUANTITATIVA CONTINUA.
PASOS PARA LA CONSTRUCCIN DE LA TABLA. - Calcular el nmero de intervalos. - Calcular la marca de clase. - Obtener las frecuencias absolutas y relativas. - Obtener las frecuencias acumuladas. Para determinar el nmero de intervalos de una distribucin de frecuencias es necesario seguir cuatro pasos. A) B) C) D) Ordenacin. Determinar el campo de variacin (recorrido) de la variable. Seleccionar la amplitud de los intervalos. Fijar el lmite inferior y superior de cada intervalo.
Se definirn estos nuevos conceptos a travs del desarrollo del siguiente ejemplo. Ejemplo: Construir una tabla de distribucin de frecuencias de datos agrupados en intervalos de clase. La duracin en horas de 60 tubos de ensayo, fabricados por un laboratorio, es la siguiente.
295 322 302 301 314 319 319 297 304 312 315 310 319 315 294 300 322 312 317 312 300 290 320 304 318 314 310 319 309 311 323 294 324 301 317 307 310 317 310 319 308 294 304 300 322 313 323 323 295 291 316 314 318 311 306 312 318 307 306 313
Solucin 1.- Calcular el nmero de intervalos. A) Se ordenan los datos de menor a mayor.
290 291 294 294 294 295 295 297 300 300 300 301 301 302 304 304 304 306 306 307 307 308 309 310 310 310 310 311 311 312 312 312 312 313 313 314 314 314 315 315 316 317 317 317 318 318 318 319 319 319 319 319 320 322 322 322 323 323 323 324
B) Campo de variacin (c.v.) = Mayor valor - Menor valor. C.V. = 324 - 290 = 34
DURACION EN HORAS DE 60 TUBOS DE ENSAYOS Duracin en horas 290 295 300 305 310 315 320 Totales 295 300 305 310 315 320 325 Marca de Clase 292.5 297.5 302.5 307.5 312.5 317.5 322.5 Frecuencia absoluta (ni) 5 3 9 6 15 14 8 n = 60 Frecuencia absoluta Acumulada 5 8 17 23 38 52 60 Frecuencia relativa (hi) 8,33 5 15 10 25 23,3 13,3 100 Frecuencia relativa acumulada 8,33 13,33 28,33 38,33 63,33 86.63 100
Interpretacin de la tabla. a) Cuntos tubos de ensayos tienen una duracin mayor o igual a 305 y menor a 310 horas? b) Cuntos tubos de ensayos tienen una duracin menor a 315 horas. c) Qu porcentaje de los tubos de ensayos tienen una duracin mayor o igual a 310 horas y menor a 315 horas? d) Que porcentaje de los tubos de ensayos tiene una duracin menor a 300?
Grficos Histograma.
Tablas de Continencias Una tabla de contingencia permite describir y analizar, el comportamiento de una variable en relacin con otra variable. En el caso de tablas de contingencia de 2x2, veamos los siguientes casos:
Si 11 4 15
No 7 10 17
Total 18 14 32
Si No Total
i) De los que encontraron trabajo Que tanto por ciento tena conocimiento de un determinado idioma?
11 x100 = 73,33% 15
ii) Del total de la muestra. Cuantas personas encontraron trabajo y no tenan conocimiento de un idioma?
7 x100 = 21,9% 32
iii) De los que no encontraron trabajo. Que tanto por ciento tena conocimiento de un idioma?
4 X 100 = 26,67% 15