You are on page 1of 148

METODOS ESTADISTICOS PARA LA INVESTIGACION.

40

30

Porcentaje

20

10

0 Bajo Intermedio Alto

Hbito de estudio

PARTE I

Dr. CLETO DE LA TORRE DUEAS


cletounsaac@gmail.com 2011

1RA EDICION

Hecho el Depsito Legal en la Biblioteca Nacional del Per REGISTRO N : 2009-09684

Todos los derechos reservados. Prohibida la reproduccin total o parcial de este libro en forma idntica o modificada por cualquier medio mecnico o electrnico, incluyendo fotocopia, grabacin o cualquier sistema de almacenamiento y recuperacin de informacin no autorizada por el autor.

Impreso en Per.

CAPITULO I INVESTIGACION CIENTIFICA.

1.1 INVESTIGACIN CIENTFICA La investigacin cientfica, se puede entender como un conjunto de actividades que realizamos para obtener conocimientos nuevos, sobre problemas nuevos que afectan la realidad, pero que sean nuevos, respecto a la ciencia, es decir, respecto al conjunto de conocimientos ya provisionalmente establecidos y sistematizados por la humanidad, conocimientos nuevos que, como aportes, se sumarn a la Ciencia. Qu es investigar? Investigar viene del latn investigare. Es la forma ms adecuada de aproximarse al conocimiento de la verdad mediante verdades parciales. Desarrollar actividades con el objetivo de registrar, indagar o descubrir la verdad. En trminos generales, es agregar algo nuevo a los conocimientos humanos. Es un proceso que, mediante la aplicacin del mtodo cientfico, procura obtener informacin relevante y fidedigna. corregir o aplicar el conocimiento De entender, verificar,

1.2 PROBLEMA DE INVESTIGACIN Es un hecho, fenmeno o situacin que incita a la reflexin o al estudio y es importante puesto que permite conocer la situacin que se va a mostrando sus principales rasgos. estudiar

CRITERIOS BASICOS PARA IDENTIFICAR PROBLEMAS. De manera general se considera que hay un problema cuando lo que DEBERA SER, difiere de lo que ES. El DEBERA SER, es el marco referencial, el patrn comparativo, el ideal, el modelo, el paradigma. Lo que ES, representa la realidad, es la prctica. DEBERA SER diferente a ES, entonces existe Problema

ESQUEMA DEL PROBLEMA DE INVESTIGACION. Para la presentacin del POI, es necesario considerar cuatro momentos: el diagnstico, el pronstico, el control del pronstico y la formulacin de la pregunta o preguntas o la redaccin de un texto a manera de pregunta.

El diagnstico es la descripcin de los sntomas o problemas. El pronstico es la serie consecuencias de los problemas. El control del pronstico es la serie de acciones para superar las consecuencias de los problemas. Formulacin del problema

ELEMENTOS DE DEL TITULO DE UN PROBLEMA Especificidad Situacin problemtica Unidad de estudio Espacio Tiempo

Situacin problemtica Responde a la pregunta Qu investigar? Por ejemplo: Rendimiento acadmico, gestin educativa, desempeo profesional,.. La especificidad

Es el aspecto o los aspectos concretos que se quiere investigar acerca del hecho o situacin problemtica. Por ejemplo: causas, consecuencias, caractersticas, importancia, influencia, tendencia, modalidades, incidencia, prevalencia, implicancias, estructura, funcin, nivel, relacin, evolucin, etc. Unidades de estudio. Son aquella en las se ponen de manifiesto los hechos o situaciones problemticas y constituyen, desde el punto de vista estadstico, la poblacin o muestra a la que se refiere la investigacin. Son: Personas, grupos Espacio Esta referido al lugar en el que ocurre el hecho o situacin problemtica. Puede ser geogrfico o administrativo. Dnde?; Per, Ciudad del Cusco, Zona Franca, Aceros Arequipa, etc. Tiempo Est referido al momento en que ocurre el hecho o situacin problemtica. Cundo?. 1.3 FORMULACION DE OBJETIVOS Son los propsitos o fines que se pretenden lograr al realizar la investigacin. Los objetivos son de dos tipos: El objetivo general (singular) Los objetivos especficos (plural) Los objetivos deben ser verificables Al definir los objetivos, debemos pensar inmediatamente en la manera de verificar si stos se han cumplido o no (pensar en mtodos o herramientas para ello) Lo anterior nos permitir ir dibujando el perfil metodolgico de nuestra investigacin Los objetivos se convierten as en la carta de navegacin de la investigacin a realizar sociales, seres, acontecimientos, instituciones, objetos,

procesos.

Los objetivos deben ser precisos y no muy ambiciosos: deben ser acordes con los recursos disponibles (tiempo) y ello delimitar el nivel de detalle esperable.

Elementos a tomar en cuenta para redactar un objetivo Sujeto : Beneficiario de la propuesta.

Contenido: Expresa el cambio requerido y Accin : Conjunto de actividades que se desarrollan.

Ejemplo 1: Reforzar la capacidad de gestin en los centros de educacin inicial del pas para la atencin de los dominios del aprendizaje de los nios de 4 y 5 aos de edad. Accin : Reforzar la capacidad de gestin en los centros de

educacin inicial del pas. Contenido: La atencin de los dominios del aprendizaje. Sujeto : Nios de 4 a 5 aos de edad

1.4 JUSTIFICACION Y DELIMITACION DE LA INVESTIGACIN Criterios de justificacin. Originalidad Relevancia Inters Factibilidad Criterios para delimitar Espacial - Geogrfica Cronolgica

1.5 MARCO TEORICO En el marco terico se integra con las teoras, enfoque tericos, estudios y antecedentes en general que se refieran al problema de investigacin.

Para elaborar el marco terico es necesario detectar, obtener y consultar la literatura y otros documentos pertinentes para el problema de investigacin, as como extraer y recopilar de ellos la informacin de inters. La revisin de la literatura puede iniciarse manualmente o acudiendo a un banco de datos al que se tenga acceso por computadora. La construccin del marco terico depende de lo que

encontremos en la revisin de la literatura: Marco Terico: Fundamentacin terica dentro de la cual se enmarca la investigacin Marco Conceptual: Definicin de conceptos relevantes utilizados en el estudio Marco Normativo: Normas, leyes referentes al estudio Qu funciones cumple el marco terico? Sirve de gua al Investigador Provee un marco para la interpretacin de resultados 1.6 HIPOTESIS DE INVESTIGACION

Afirmaciones o suposiciones que hace el investigador respecto al problema de investigacin. Es una suposicin que permite establecer relaciones entre hechos. El valor de una hiptesis reside en su capacidad de establecer esas relaciones entre los hechos y de esa manera, explicarnos por qu se produce el fenmeno de estudio.

Qu Funciones cumple? Direccionar el problema objeto de investigacin Identificar variables objeto de anlisis Orientar el uso de mtodos y tcnicas de obtencin de informacin Elementos estructurales de la hiptesis 1. Las unidades de anlisis, que puedan ser los individuos, grupos, viviendas, instituciones, etc.

2. Variables, las caractersticas o propiedades cualitativas o cuantitativas que presentan las unidades de anlisis. 3. Los elementos lgicos, son los que relacionan las unidades de anlisis con las variables y estas entre s. Requisitos para estructurar las hiptesis Las hiptesis deben referirse slo a un mbito determinado de la realidad social. Las hiptesis en las ciencias sociales slo pueden someterse a prueba en un universo y contexto bien definidos. Los conceptos de las hiptesis deben ser claros y precisos. En las hiptesis, los conceptos son las variables y las unidades de anlisis. Los conceptos de las hiptesis deben contar con realidades o referencias empricas observables (verificables). El planteamiento de las hiptesis deben prever las tcnicas para probarlas. Se deben formular hiptesis que estn relacionadas con tcnicas disponibles para su verificacin.

1.7 NIVELES DE INVESTIGACIN.

El nivel de una investigacin viene dado por el grado de profundidad y alcance que se pretende con la misma

INVESTIGACIN DESCRIPTIVA Orientada al descubrimiento de las propiedades particulares del hecho o situacin problemtica y tambin a la determinacin de la frecuencia con que ocurre el hecho o situacin problemtica. Responde a las preguntas Cmo son? Cuntos son? Dnde estn? Se refiere a las caractersticas cualidades internas y externas, propiedades y rasgos de la poblacin de estudio

Ejemplo 2: Nivel de conocimiento de las estrategias cognitivas por los profesores, de la poblacin de la ciudad de Cusco, 2011. INVESTIGACIN EXPLICATIVA Orientada al descubrimiento de las causas o consecuencias o condicionantes de la situacin problemtica Est dirigida a responder a las causas de los eventos fsicos o sociales y su inters se centra en explicar por qu y en qu condiciones ocurre un fenmeno, o por qu dos o ms variables se relacionan. Por qu? La finalidad es determinar por qu un hecho o fenmeno de la realidad tiene tales y cuales caractersticas. Ejemplo 3: Principales causas de la desercin escolar en la regin andina del Per, 2010.

INVESTIGACIN COMPARATIVA Orientada al estudio de las semejanzas o diferencias de un hecho o situacin problemtica en dos circunstancias diferentes. Ejemplo 4: Nivel de aplicacin de metodologas de enseanza por los profesores de las instituciones educativas A y B de Cusco, 2010.

INVESTIGACIN RELACIONAL Orientada al descubrimiento de la influencia de un hecho o situacin problemtica en otro hecho o situacin problemtica.

Ejemplo 5: Influencia de la internet en la lectura de los estudiantes de secundaria de la Ciudad del Cusco, 2011.

INVESTIGACIN CORRELACIONAL Orientada a descubrir la covariacin o correspondencia entre los valores de dos hechos o situaciones problemticas.

Ejemplo 6: Correlacin entre hbitos de estudio y aprendizaje en los estudiantes de la Universidad de Nacional San Antonio Abad del Cusco, 2011. INVESTIGACIN EXPERIMENTAL Orientada a descubrir la validez de un hecho para la modificacin de una situacin problemtica. Qu cambios y modificaciones se han producido? Qu mejoras se han logrado?. Ejemplo 7: Evaluacin del efecto del uso de tres tipos de materiales didcticos en el rendimiento acadmico, en las I.E de la ciudad de Cusco, 2011.

1.8 TIPOS DE INVESTIGACION Los Tipos de investigacin se determinan mediante la aplicacin de distintos criterios, a continuacin se refieren algunos de ellos.

INVESTIGACION BASICA. Solo busca aplicar y profundizar el conocimiento cientfico existente acerca de la realidad.

INVESTIGACION APLICADA.

Se investiga

para transformar, modificar o

producir cambios en un determinado sector de la realidad.

INVESTIGACION SUSTANTIVA. Se orienta a resolver problemas facticos, su propsito es dar respuesta objetiva a interrogantes que se plantea en un determinado fragmento de la realidad y del conocimiento con el objeto de

contribuir en la estructuracin de las teoras cientficas.

INVESTIGACION

TECNOLOGICA.

Se

relaciona

esencial,

objetiva

metodolgicamente con el nivel experimental, se busca cambios mediante la aplicacin de nuevos sistemas.

1.9 DISEOS DE INVESTIGACION. Conjunto de estrategias procedimentales y metodolgicas definidas y elaboradas para el desarrollo del proceso de investigacin.

El diseo de investigacin puede ser pensado como la estructura de la Investigacin. El investigador debe seleccionar un diseo de investigacin. Esto se refiere a la manera prctica y precisa que el investigador adopta para cumplir con los objetivos de su estudio, ya que el diseo de investigacin indica los pasos a seguir para alcanzar dichos objetivos. Es necesario por tanto que previo a la seleccin del diseo de investigacin se tengan claros los objetivos de la investigacin. Las maneras de cmo conseguir respuesta a las interrogantes o hiptesis planteadas dependen de la investigacin. Por esto,

existen diferentes tipos de diseos de investigacin, de los cuales debe elegirse uno o varios para llevar a cabo una investigacin particular (Hernndez, Fernndez y Baptista, 2000; Castillo, 2005). La precisin, la profundidad as como tambin el xito de los resultados de la investigacin dependen de la eleccin adecuada del diseo de investigacin. He aqu un esquema donde se resumen los diferentes tipos de investigacin segn Hernndez, Fernndez y Baptista (2000).

Diseos experimentales Son aquellos en los que se cumple que: Los grupos a ser investigados han sido asignados al azar, por procedimientos aleatorios y los grupos resultantes son equivalentes, de tal manera que se tiene un grupo control equivalente a los grupos experimentales. Diseos cuasi-experimentales. Entendemos por diseos cuasi-experimentales cuando se cumplen las siguientes condiciones: Los grupos sobre los que se lleva a cabo la investigacin no han podido establecerse como equivalentes en las caractersticas fundamentales. Los grupos no han sido asignados al azar, sino que han sido establecidos por algn otro procedimiento de muestreo. Como dice Hernndez et al.En los diseos cuasi-experimentales los sujetos no son asignados al azar a los grupos no emparejados; sino que dichos grupos ya estaban formados antes del experimento, son grupos intacto (la razn por la que surgen y la manera como se formaron fueron independientes o aparte del experimento. Tambin algunos autores denominan CUASI-EXPERIMENTAL, cuando el investigador aplica un tratamiento a un solo grupo de sujetos, sin grupo de control, observndolo antes y despus de aplicar el tratamiento. Diseos no-experimentales. Se establece que un diseo no-experimental es: la que se realiza sin manipular deliberadamente variables. Es decir, se trata de investigacin donde no hacemos variar intencionadamente las variables independientes. Lo que hacemos en la investigacin no experimental es observar fenmenos tal y como se dan en su contexto natural, para despus analizarlos. (Hernndez, 184)

La diferencia con los diseos experimentales y cuasi- experimentales se ve con claridad, porque en estos dos siempre hay algn tipo de intervencin del investigador, que manipula las variables independientes para averiguar su influencia en las variables dependientes.

Mtodo transversal: Es el diseo de investigacin que recolecta datos de un solo momento y en un tiempo nico. El propsito de este mtodo es describir variables y analizar su incidencia e interrelacin en un momento dado.

Diseos transversales descriptivos: son aquellos que tienen como objetivo indagar la incidencia y los valores en que se manifiesta una o ms variables.

Diseos transversales correlacionales: Se encargan de describir relaciones entre dos o ms variables en un momento determinado.

Diseos transversales

explicativos: Son aquellos en los cuales las

causas y efectos ya ocurrieron en la realidad (estaban dados y manifestados) y el investigador los observa y explica.

Diseos longitudinales: Son aquellos que analizan cambios a travs del tiempo (en variables o sus relaciones), dentro de alguna poblacin en general.

1.10 VARIABLES A las caractersticas objeto de estudio en la poblacin se les llama variables, ya que pueden variar de un individuo a otro y se representara por letras maysculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que hay, lo cual nos va a permitir utilizar las herramientas estadsticas apropiadas.

TIPOS DE VARIABLES. Las variables estadsticas pueden ser de dos tipos: Variables cualitativas o atributos: describen cualidades y no toman valores numricos, estas a su vez pueden ser: Nominales.- Las cualidades no presentan ningn orden. Ejemplo Sexo del estudiante (Femenino, Masculino), Procedencia, I.E.

Ordinales.- Este tipo de variables presentan orden Ejemplo: Grado de estudios (Analfabeto, primaria, secundaria, superior), Nivel de

conocimiento de Docentes.

Variables cuantitativas: toman valores numricos. A su vez pueden ser: Discretas.- Solo toman un nmero finito o infinito numerable de valores distintos (generalmente nmeros naturales o enteros). Ejemplos: nmero de estudiantes por secciones, nmero de profesores, nmero de aulas, etc. Continuas.Toman valores en un intervalo. Generalmente

corresponden a medir magnitudes continuas. Ejemplo, Rendimiento acadmico, altura, ingreso del docente, etc.

Una caracterstica esencial de este tipo de variables es que sus valores nunca son observables con exactitud, sino que dependen (las observaciones) de la precisin del instrumento de medida.

Ejemplo 7

Un especialista estudia, el nivel de introversin en nios menores de 4 aos en las instituciones educativas de la ciudad de Cusco. previos para este estudio. Solucin: Poblacin: Nios menores de 4 aos de las I.E de la ciudad de Cusco. Muestra: Nios de 3 aos de las I.E de la ciudad de Cusco. Variable: Nivel de Introversin. Tipo de variable: Cuantitativa Unidad de estudio: Nio menor de 4 aos. Defina los conceptos

1.11 ESCALAS DE MEDICION Se llama medicin Tenemos las al proceso de atribuir nmeros a las caractersticas.

siguientes escalas de medicin: nominales, ordinales,

cuantitativas de intervalo y cuantitativas de razn.

Escala nominal: la clave de estas escalas de medida es que slo informan de la igualdad o desigualdad de los individuos en una caracterstica, pero no de posibles ordenaciones, puesto que la caracterstica a la que se refieren no se tiene en mayor o menor medida, sino que simplemente adopta formas cualitativamente distintas. Los nmeros solo sirven para distinguir valores o categoras diferentes de la variable. Esta escala se emplea para variables cualitativas nominales.

Ejemplo 8: El sexo 1=Masculino y 2=Femenino esto simplemente es un proceso de codificacin pero no significa que la mujer sea mayor que el hombre, ni el doble, ni que existe sexo intermedio.

Escala Ordinal: Los nmeros adems de servir para distinguir reflejan un orden existente sobre los valores de la variable. Se obtiene clasificando objetos o arreglndolos en un orden con respecto a alguna variable comn. La pregunta es simplemente, si el objeto tiene ms o menos de esta variable que algn otro objeto. Esta escala se emplea para variables cualitativas ordinales.

Ejemplo 9: Nivel de conocimientos de estrategias cognitivas por parte de los docentes. Excelente=5, bueno =4, regular =3 y malo = 2. es cierto la relacin de orden 2<3<4<5.

Escala de Intervalo: La ubicacin del punto origen no es fija, puesto que 0 no denota la ausencia del atributo. Aqu los nmeros para clasificar los objetos representan tambin incrementos iguales del atributo que se esta midiendo. Esto significa que los nmeros pueden ser comparados. La diferencia en 1 y 2 es la misma que entre 2 y 3, pero es solo la mitad de la diferencia entre 2 y 4. Las temperaturas Fahrenheit y Centgrados son medidas que tiene diferentes escalas de intervalo y diferentes puntos de 0. Escala de Razn: Medida numricas en las cuales cero es un valor fijo en cualquier escala y la diferencia entre valores es diferente

Adems de la distancia de orden e intervalo, se aade un origen absoluto de forma que no solo cabe hallar distancias (ya en la escala de intervalo), si no tambin mltiplos exactos. En este caso, el valor representado por 4 tiene doble cantidad medida que l representado por un 2. Ejemplo 10: Edad del profesor expresada en aos. 40 aos y 20 aos son edades distintas y 40 aos es superior a 20 aos Entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 30. El 0 tiene sentido. Una persona con 0 aos, realmente no tiene edad todava no ha nacido. En el siguiente cuadro se muestra un resumen de las caractersticas de las escalas de medicin. Resumen de escalas de medicin
Tipo Informacin deducible Relaciones Nominal igual que o distinto que Transform. admisibles Significa Significa orden No Aplicaciones inyectivas Significa distancia Origen No No Ejemplos Procedencia del Profesor, tipo de metodologia Si Relaciones Ordinal mayor que o igual que No No Grado de planificacin, Funciones crecientes Nivel de utilizacin de materiales educativos. Igualdad o Intervalo desigualdad de diferencias Igualdad o Razn desigualdad de razones Si B .x (b 0) Si Si Rendimiento acadmico, Nmero de estudiantes. A + b.x (b 0) Si Si No Temperatura, inteligencia

ESCALAS PARA LA MEDICION DE ACTITUDES La escala de clasificacin por categoras es la que usan ampliamente los investigadores de ciencias de la salud y sociales.

Escala de clasificacin por categoras: Existen cuatro categoras a partir de las cuales los entrevistados pueden elegir para sealar su nivel general de satisfaccin. - Muy satisfecho (+2) - Satisfecho (+1 ) - Algo satisfecho (0) - No del todo satisfecho (-1)

Escala De Comparacin: Es una versin de la escala de categoras, califica a estas categoras como: excelente, muy bueno, bueno, regular y deficiente, eliminando de esta forma la comparacin implcita. El problema con tal escala es que el punto de referencia es poco claro y diferentes entrevistados pueden usar diferentes puntos de referencia o estndares.

Escala de Likert: La escala de Likert requiere que un entrevistado indique un grado de acuerdo o desacuerdo con respecto a una variedad de afirmaciones (reactivos) relacionadas con el objeto de las actitudes.

Es un tipo de instrumento de medicin o de recoleccin de datos que disponemos en la investigacin social. Es una escala para medir las actitudes. Consiste en un conjunto de tems bajo la forma de afirmaciones o juicios ante los cuales se solicita la reaccin (favorable o desfavorable, positiva o negativa) de los individuos.

Alternativas o puntos en la escala de Likert Asignacin Asignacin Numrica I 2 Numrica II 5 Muy de acuerdo Totalmente de acuerdo Definitivamen Completame te s nte verdadero 1 4 De acuerdo De acuerdo Probablemen te s 0 3 Ni de acuerdo, ni en desacuerdo -1 2 En desacuerdo -2 1 Muy en desacuerdo En desacuerdo Totalmente en desacuerdo Probablemen te no Definitivamen Completame te no nte falso Falso Neutral o indiferente Indeciso Ni falso, ni verdadero Verdadero Alternativa A Alternativa B Alternativa C Alternativa D

Para obtener las puntuaciones de la escala de Likert, se suman los valores obtenidos respecto de cada items. El puntaje mnimo resulta de la multiplicacin del nmero de tems por 1. Una puntuacin alta est dada por el nmero de tems o afirmaciones multiplicado por 5.

PM--------------------I----------------------I----------------------I-----------------PA Donde: PM: Puntaje mnimo y PA: Puntaje Mximo.

Ejemplo 11: Ha encontrado en la institucin educativa el apoyo y las facilidades necesarias para que usted desarrolle de modo ptimo su trabajo. ( ) Definitivamente s ( ) Probablemente s

( ) Indeciso ( ) Probablemente no ( ) Definitivamente no

Ejemplo 12: El Director de la UGEL se preocupa por el bienestar del recurso humano. Categoras de Respuesta Frecuencia Porcentaje Asignacin de puntajes Totalmente de acuerdo De acuerdo Indeciso En desacuerdo (5) (4) (3) (2) 2 4 7 9 23 n=45 4.4% 9% 15.6% 20% 51% 100% 2(5) 4(4) 7(3) 9(2) 23(1) Total=88

Totalmente en desacuerdo (1)

Para interpretar el puntaje se ubica en los tramos de la escala de likert. Totalmente En (1) 45*1=45 En Indeciso (3) De acuerdo (4) Totalmente de Acuerdo (5)

desacuerdo desacuerdo (2) 45*2=90

45*3=135 45*4=180

45*5=225

La puntuacin 88 se aproxima a 90, por lo tanto se ubica en la parte que indica en desacuerdo.

1.12 TIPOS DE VARIABLES UTILIZADAS EN LA INVESTIGACION CIENTIFICA.

Variable independiente Es aquella que juega un rol determinante, causal o de influencia en otra u otras variables, supone cierta autonoma con relacin a las dems variables, pero es necesario, sealar que las variables independientes en determinados problemas, pueden cambiar, segn

sea la posicin que ocupen en el enunciado, debido a que la realidad est en movimiento y que todos los hechos estn concatenados. Este tipo de variable se encuentra en las siguientes investigaciones: 1. Explicativa, 2. Relacional 3. Experimental ( en la experimental se le conoce como estmulo)

Variable dependiente Es aquella que juega un rol de consecuencia, al ser determinada, originada o influida por la variable independiente. Esto significa que no pueden existir variables dependientes sin las independientes. Considerando el tiempo, las independientes son ms antiguas que las dependientes. Se encuentran en las siguientes investigaciones: 1. Explicativa 2. Relacional 3. Experimental (La variable dependiente en una investigacin experimental se le conoce como respuesta) Ejemplo 13: En el problema influencia del uso de mapas mentales en el rendimiento acadmico de los estudiantes de las I.E de la regin de Cusco, 2011. Variable independiente: Rendimiento Acadmico Variable dependiente: Uso de mapas mentales

Variable Intermedia Es aquella que juega un rol de factor condicionante, pues su presencia entre la variable independiente y variable dependiente hace que sin tener el carcter de factor causal o determinante, modifique le resultado ms complejas y de mayor profundidad.

Ejemplo 14: En el estudio de formacin acadmica y rol de la experiencia en el desempeo profesional, Quillabamba. 2011. Variable independiente: formacin acadmica. Variable Dependiente: Desempeo profesional Variable Intermedia : Experiencia

Variable interviniente Es aquella que en ciertas medida juega un rol pasivo en el problema, pues permite medir las caractersticas, atributos, estructuras, incidencia, elementos o aspectos que se son inherentes. La variable interviniente, la encontramos en investigaciones: 1. Descriptiva 2. Comparativa.

Ejemplo 15: En el problema: Niveles de desnutricin de los estudiantes de las instituciones educativas de la ciudad de Sicuani, 2011. Variable interviniente : Nivel de desnutricin. Variables Asociadas Son aquellas que no guardan mayor nivel de dependencia, no hay relacin causal entre ellas y considerando el criterio tiempo vienen a ser ms o menos contemporneas, pues para que aparezca el problema surgen de manera simultnea. Este tipo de variables, se encuentra en la investigacin descriptiva multivariable, se trata de dos o ms variables intervinientes, por lo que nunca van acompaadas de algn otro tipo de variables.

Ejemplo 16: En el problema: Rasgos sociales y culturales de los profesores de la ciudad de Cusco , 2011.

Las variables asociadas son rasgos sociales y rasgos

culturales

Variables Interdependientes Son aquellas que indistintamente pueden ser consideradas como causa o como consecuencia una de otra. Corresponden a la investigacin correlacional.

Ejemplo 17: En el problema: Correlacin entre tipo de alimentacin y obesidad de los estudiantes de la ciudad de Cusco, 2010. Las variables interdependientes, son tipo de alimentacin y obesidad

Resumen del tipo de variables segn tipo de investigacin.

Descriptiva Interviniente Asociada

Comparativa Interviniente

Explicativa Independiente(s) Dependiente(s)

Relacional Independiente Dependiente

Correlacional Interdependiente Interdependiente

Experimental Estimulo (Factor) Respuesta

Observaciones: 1. Las variables segn su naturaleza se clasifican en cuantitativas y cualitativas. 2. Las variables segn su relacin casual se clasifican en:

independiente, dependiente, interviniente. En el rea de las ciencias de la salud, se tiene los siguientes tipos de investigacin biomdica.

1.13

RECOPILACIN DE DATOS.

Dentro de un proceso de investigacin una de las actividades que se realizan es la recopilacin de datos, la cual es el acopio de informacin y se incluye

desde elaborar fichas bibliogrficas hasta la aplicacin de cuestionarios con el empleo de tcnicas de muestreo. Para Hernndez et.al. (2006) un instrumento de medicin es un recurso que utiliza el investigador para registrar informacin o datos sobre las variables que tiene en mente. La construccin de instrumento consiste en generar un nmero suficiente de tems para medir todas las variables con todas sus dimensiones.

La recopilacin de datos, se puede realizar mediante: Investigacin documental Investigacin de campo

La investigacin documental. Consiste en el estudio de documentos escritos sobre un objeto determinado, es decir son todos aquellos documentos registrados en diferentes dispositivos fsicos a los que podemos tener acceso en forma directa o indirecta para su consulta y se puede clasificar en: 1.- Documental bibliogrfica 2.- Documental hemerogrfica 3.- Documental escrita 4.- Documental audiogrfica 5.- Documental videogrfica 6.- Documental iconogrfica

La investigacin de campo. Consiste en obtener informacin directa mediante diferentes actividades por contacto directo con el hecho que se quiere investigar as como las personas relacionadas y se puede realizar: a) Por observacin directa b) Por interrogacin

La observacin. Es el procedimiento emprico bsico, el cual consiste en realizar la percepcin intencionada de una actividad determinada

mediante la experimentacin la cual consiste en la obtencin de datos cuantitativos por medio de la medicin del fenmeno que se este observando. Para realizar la observacin se utilizan diversos

instrumentos auxiliares los cuales son:

1.- La ficha de campo

3.- La entrevista

2.- Estudio de Actividades 4.- La encuesta

La Entrevista. Es una de las tcnicas ms comunes y es considerada como la relacin directa entre el investigador y el objeto de estudio a travs de individuos o grupos con el fin de obtener testimonios reales. a) Entrevistas formales b) Entrevistas informales

La Encuesta. Consiste en recopilar informacin sobre una parte de la poblacin. La informacin recopilada puede emplearse para un anlisis cuantitativo con el fin de identificar las magnitudes del problema.

El Cuestionario. Es un eficaz auxiliar en la observacin cientfica que contiene aspectos del fenmeno esenciales, las cuales son preguntas formuladas por escrito y no es necesaria la presencia del investigador. - Cuestionarios por correo - Cuestionario administrado por el entrevistado - Cuestionario administrado por el entrevistador

La Cedula. Tiene carcter de annimo, donde el encuestador es quien llena la cedula de entrevista, adems de que es posible aclara la informacin sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural.

1.14 VALIDACIN DEL INSTRUMENTO

La validacin de los instrumentos se realiza con el fin de conseguir una mayor objetividad al seleccionar los tems en los respectivos cuestionarios.

VALIDEZ DE CONTENIDO El proceso de validacin de contenido es eminentemente lgico, si bien pueden utilizarse jueces expertos en el tema para valorar la congruencia entre los diversos items y los diversos objetivos. Existen procedimientos cuantitativos diversos para que cada experto valore el grado en que un tem sirve para evaluar el objetivo al que corresponde. El procedimiento cuantitativo ms sencillo sera el siguiente: Especificar los diversos objetivos (v.gr. reas diferentes de contenidos) que se Pretenden evaluar. Elaborar varios tems para cada objetivo. Seleccionar una muestra de expertos en el contenido del test. Pedirles que, segn su opinin, asignen cada tem al objetivo que pretende medir. Seleccionar los tems en los que los expertos manifiestan mayor acuerdo en sus clasificaciones.

CRITERIO DE EXPERTOS Mtodo 1: HOJA DE PREGUNTAS PARA LA VALIDACIN PREGUNTAS


1. Considera usted que los tems del instrumento miden lo que se pretende medir? 2. Considera usted que la cantidad de tems registrados en esta versin son suficientes para tener una comprensin de la materia de estudio? 3, Considera usted que los tems contenidos
1 2 3 4 5 1 2 3 4 5

ESCALA DE VALORACION
1 2 3 4 5

en este instrumento, son una muestra representativa del universo materia del estudio? 4. Considera usted que si aplicamos en reiteradas oportunidades este instrumento a muestras similares, obtendramos tambin datos similares? 5. Considera usted que los conceptos utilizados en este instrumento, son todos y cada uno de ellos, propios de las variables del estudio? 6. Considera usted que todos y cada uno de los tems contenidos en este instrumento tienen los mismos objetivos? 7. Considera usted que el lenguaje utilizado en el presente instrumento es claro, sencillo y no da lugar a diversas interpretaciones? 8. Considera usted que la estructura del presente instrumento es adecuada al tipo de usuario a quien se dirige el instrumento? 9. Estima usted que las escalas de medicin utilizadas son pertinentes a los objetos materia de
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

estudio? 10. Que aspectos habra que modificar, que aspectos tendran que incrementarse o que aspectos habra que suprimirse?

PROCEDIMIENTO El mtodo DPP mide la adecuacin de los instrumentos, para medir la variable de inters, en funcin a la valoracin de los expertos. Ejemplo 18. En el presente estudio la valoracin de los expertos es:

EXPERTOS Item 1 2 3 4 5 6 7 8 9 1 5 5 5 5 5 5 4 4 4 2 4 5 4 5 5 5 5 4 4 3 5 5 5 4 5 5 3 5 5 4 5 5 4 4 5 5 4 4 5 Promedio 4.75 5 4.5 4.5 5 5 4 4.25 4.5

2. Con los promedios hallados, se determina la distancia de punto mltiple (DPP), mediante la siguiente ecuacin:
DPP = (X 1 Y1 )2 +(X 2 Y2 )2 + ................(X 9 Y9 )2

Donde: Xi = Valor mximo en la escala para el tem i. Yi = El promedio del tem i.


DPP = ( 5 4.75 )2 +( 5 5 )2 + ................( 5 4.5 )2 1.541

Determinar la distancia mxima (Dmax) del valor obtenido respecto al punto de referencia Cero (0), con la ecuacin:
2 2 2 D x ) (1 x ) . . . . . . . . . . . . . . . . . . . (1 x ) M a x (1 1 2 n

Donde: Xi = Valor mximo en la escala concedido para el tem i. 1 = Valor mnimo de la escala para cada tem.

DMax

(5 1) 2

(5 1) 2

...................(5 1) 2

12

La Dmax hallada fue de 12 La Dmax se divide entre el valor mximo de la escala, lo que nos da un valor de 12/5=2.4 5. Con el valor hallado anteriormente (apartado 4) se construye una nueva escala valorativa a partir de cero, hasta llegar a Dmax. Dividindose en intervalos Iguales entre si, llamndose con las letras A, B, C, D, y E. Siendo: Valoracin Escala 02.4 2.44.8 4.87.2 7.29.6 9.612 E = inadecuacin B = Adecuacin en gran medida C = Adecuacin Promedio D = Escasa Adecuacin A = Adecuacin Total Valoracin de Expertos DPP=1.541

6. El punto DPP debe caer en las zonas A o B; en caso contrario, la encuesta requiere reestructuracin y/o modificacin, luego de las cuales se somete nuevamente a juicio de expertos. El valor hallado del DPP fue de 1.541 cayendo en la zona A, lo que indica la Adecuacin del instrumento y que puede ser aplicado.

Mtodo 2 Cuadro 1. Formato para validar instrumentos a incluir en el instrumento de validacin.

TEM Claridad En la

Criterios a evaluar Coherencia interna Induccin a la Lenguaje Adecuado Con el nivel (sesgo) Del informante Si No Si No Si No Si No Si No Mide lo que pretend e medir redacci n respuesta

observaciones ( si debe o

eliminarse

modificarse un favor indique)

1 .. n Aspectos generales El instrumento contiene instrucciones claras y precisas para responder el cuestionario Los tems permiten el logro del objetivo de la investigacin Los tems estn distribuidos en forma lgica y secuencial El nmero de tems es suficiente para recoger la informacin. En caso de ser negativa su respuesta, sugiera los tems a aadir Validez Aplicable ( ) Validado por: Firma: No aplicable ( ) Si No *************

1.5.10 CONFIABILIDAD del INSTRUMENTO Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario sobre un pequeo grupo de poblacin. Esta prueba piloto ha de garantizar las mismas condiciones de realizacin que el trabajo de campo real. Se recomienda un pequeo grupo de sujetos que no pertenezcan a la muestra seleccionada pero s a la poblacin o un grupo con caractersticas similares a la de la muestra del estudio, aproximadamente entre 14 y 30 personas. De esta manera se estimar la confiabilidad del cuestionario. La confiabilidad responde a la pregunta con cunta exactitud los tems, reactivos o tareas representan al universo de donde fueron seleccionados?. El trmino confiabilidad designa la exactitud con que un conjunto de puntajes de pruebas miden lo que tendran que medir (Ebel, 1977, citado por Fuentes, op. cit., p. 103).

Entre los mtodos para estimar la confiabilidad, se tienen:

Mtodo Test-Retest: una forma de estimar la confiabilidad de un test o cuestionario es administrarlo dos veces al mismo grupo y correlacionar las puntuaciones obtenidas. El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad porque denota la coherencia de las puntuaciones en el tiempo Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 0,95 (Popham, 1980, citado por Fuentes, op. cit.). Se usa la correlacin por el mtodo de los puntajes directos (Correlacin r de Pearson):

rxy n
Donde:

n xi2

xi yi
2

xi

yi yi2 yi
2

xi * n

rxy : es el coeficiente de correlacin


n: nmero de sujetos X: valores de X (1 aplicacin)

Y: valores de Y (2 aplicacin) Mtodo comn de divisin por mitades o Hemitest: este mtodo computa el coeficiente de correlacin entre los puntajes de las dos mitades del test o cuestionario aplicado. Esto supone que las dos test mitades son paralelos, tienen igual longitud y varianza entre s. Se estima a travs del coeficiente de confiabilidad de Spearman-Brown: Se establece la correlacin entre los dos puntajes de las dos mitades del test a travs del mtodo de los puntajes directos, Correlacin r de Pearson:

r12 n
2r12 1 r12

n x12

x1 x2
2

x1

x2
2 x2

x1 * n

x2

Estimacin del test completo (Spearman-Brown) con la frmula:

rtt

Se interpreta la prueba de hemitest como coeficiente de consistencia interna, ya que una sola prueba contiene las dos formas equivalentes y su nfasis lo pone en las puntuaciones de los sujetos, no en los temes.

El mtodo de divisin por mitades de Rulon: utiliza la divisin del test en mitades, pero su mtodo no supone necesariamente varianzas iguales en los sub-tests. coeficiente de consistencia interna.

rtt
Donde:

2 sd 1 2 st

rtt : coeficiente de confiabilidad


2 : varianza de la diferencia entre las puntuaciones de las mitades sd

st2 : varianza de las puntuaciones del test total

El mtodo de divisin por mitades de Guttman: tambin se denomina coeficiente de consistencia interna. Su frmula es:

rtt
Donde:

2 sa sb2 2 1 st2

rtt : coeficiente de confiabilidad


2 : varianza de las puntuaciones de los temes pares sa
2 : varianza de las puntuaciones de los temes impares sb

st2 :varianza de las puntuaciones del test total

ALFA DE CRONBACH

Para evaluar la confiabilidad o la homogeneidad de las preguntas o tems es comn emplear el coeficiente alfa de Cronbach cuando se trata de alternativas de respuestas policotmicas, como las escalas tipo Likert; la cual puede tomar valores entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa confiabilidad total. El coeficiente de Cronbach puede ser calculado por medio de la varianza de los tems y la varianza del puntaje total (Hernndez Sampieri et al, 2003). Para calcular el coeficiente de confiabilidad se us el COEFICIENTE ALFA DE CROMBACH ( ) Crdova (2009), cuya ecuacin es:

donde: : coeficiente de confiabilidad de la prueba o cuestionario nmero de tems del instrumento : Varianza total del instrumento. : Sumatoria de las varianzas de los tems.

Mtodo de Kuder-Richarson 21: permite obtener la confiabilidad a partir de los datos obtenidos en una sola aplicacin del test. La suposicin bsica es considerar que todos los temes presentan igual varianza. Coeficiente de consistencia interna.

KR21
Donde:

n n 1

M n M nst2

n: nmero total de tems M: media aritmtica de las puntuaciones obtenidas por los individuos

st2 : varianza de las puntuaciones totales


Para la interpretacin de la confiabilidad se utiliza el siguiente cuadro:

TABLA DE CATEGORAS ESCALA CATEGORA Confiabilidad muy alta Confiabilidad alta Confiabilidad aceptable Confiabilidad moderada Confiabilidad baja Confiabilidad muy baja Confiabilidad despreciable

Ejemplo 19. Determine la confiabilidad, utilizando alfa de cronbach, para la siguiente informacin

Encuestados 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 3 2 0 1 1 0 0 0 0 0 0 1 0 1 0 0 1 5 3 3 0 1 0 0 1 0 0 0 0 0 1 0 0 0 4 1 1 2 1 1 1 2 0 1 2 1 1 1 2 0 17

Preguntas (tems) 5 1 2 1 1 1 1 1 0 1 2 1 2 2 2 0 18 6 1 1 1 0 1 1 2 1 0 2 1 2 2 0 0 15 7 0 1 0 0 2 0 2 0 0 0 0 0 0 0 0 5 8 0 1 0 1 1 1 1 0 0 2 1 2 0 1 1 12 9 0 2 0 0 0 0 0 0 0 2 2 0 0 0 0 6 10 0 2 0 0 0 0 2 0 0 2 2 1 0 0 0 9

Puntos

3 12 5 3 7 4 10 1 3 13 9 9 5 6 3 93

0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83

varianza del instrumento

Varianza de cada pregunta

El ndice de confiabilidad es alto de conformidad con la tabla de categoras.

BAREMACIN DEL INSTRUMENTO, UTILIZANDO ESCALA DE LIKERT.

Para medir la variable de estudio se aplico una encuesta utilizando la escala de likert, la misma que presenta en cada tems cinco alternativas, a partir de las cuales los entrevistados pueden elegir, con la finalidad de sealar su nivel de acuerdo. - Alternativa a (5) - Alternativa b (4) - Alternativa c (3) - alternativa d (2) -alternativa e (1) Para obtener las puntuaciones de la variable de estudio, se suman los valores obtenidos respecto de cada tem. El puntaje mnimo (PM) resulta de la multiplicacin del nmero de tems (x) por 1. Una puntuacin alta (PA) est dada por el nmero de tems o afirmaciones multiplicado por 5.

PM--------------------I----------------------I----------------------I------------------PA

Para facilitar la interpretar las

puntuaciones

de la variable de estudio se

transforman a una escala cualitativa, segn el siguiente criterio.

Puntaje Obtenido

Categora Deficiente Malo Regular Bueno Muy bueno

Puntaje 1.5x 1.5x Puntaje 2.5x

2.5x 3.5x

Puntaje 3.5x Puntaje 4.5x

Puntaje 4.5x

5.11 MATRIZ DE CONSISTENCIA. Esta referido a la estructura del proyecto de Investigacin desarrollado y que para fines didcticos se presenta en el siguiente esquema: TITULO: PROBLEMA General .? Formulacin de problemas especficos. 1. .? 2. 3. ? Objetivo especfico .. .. . Formulacin de hiptesis operativas. .. .. . .. Variable Dependiente OBJETIVO General HIPOTESIS General VARIABLES Variable independiente

TIPO DE ESTUDIO Nivel de investigacin. Tipo de investigacin. Diseo de investigacin VARIABLES 1 DIMENSIONES 1

POBLACIN Y MUESTRA Poblacin. Muestra INDICADORES . .

RECOLECCIN DE DATOS PRUEBAS ESTADISTICAS

Gua de observacin Cuestionario encuestas Entrevistas Ubicacin de tems ..

MODELO DE TESIS TTULO DE LA TESIS: CAPITULO I: PROBLEMA DE INVESTIGACIN PLANTEAMIENTO DEL PROBLEMA FORMULACIN DEL PROBLEMA DE INVESTIGACIN OBJETIVOS JUSTIFICACIN ORIGINALIDAD: PERTINENCIA: RELEVANCIA: OPORTUNIDAD: FACTIBILIDAD: IMPORTANCIA LIMITACIN REA DE ESTUDIO DELIMITACIN DELIMITACIN ESPACIAL DELIMITACIN TEMPORAL CAPITULO II: MARCO TERICO ANTECEDENTES DE ESTUDIO MARCO CONCEPTUAL MARCO NORMATIVO MARCO TERICO CONCEPTUALIZACIN EN TRMINOS HIPTESIS DE INVESTIGACION. CAPITULO III: DISEO METODOLGICO NIVEL DE INVESTIGACIN TIPO DE NVESTIGACION. DISEO DE INVESTIGACIN POBLACIN Y MUESTRA VARIABLES OPERACIONALIZACIN DE VARIABLES TCNICAS E INSTRUMENTOS DE RECOLECCIN DE DATOS

CLETO DE LA TORRE DUEAS

41

TCNICAS DE ANLISIS DE DATOS.

CAPITULO IV: PRESENTACION DE RESULTADOS CONCLUSIONES RECOMENDACIONES BIBLIOGRAFIA ANEXOS

EJERCICIOS PROPUESTOS.

1.

Influencia del uso de materiales didcticos en el rendimiento acadmico de los estudiantes de la ciudad de Cusco. Especifique. a. La(s) variable(s) de estudio y el tipo de variable. b. La escala de medicin a emplear. c. Nivel de investigacin. d. Tipo de investigacin e. Diseo de investigacin

2.

Se realizo el estudio de la calidad de vida y servicio educativo de los profesores de las I.E de la UGEL Cusco. Especifique a. Proponer un titulo para esta investigacin. b. La(s) variable(s) de estudio y el tipo de variable. c. La escala de medicin a emplear. d. Nivel, tipo y diseo de investigacin.

3.

Se hizo una encuesta a una muestra representativa de profesores de la UGEL La Convencin sobre el nivel de acuerdo con la carrera pblica magisterial propuesta por el gobierno. Carrera publica magisterial. Totalmente de acuerdo De acuerdo Indeciso En desacuerdo Totalmente en desacuerdo Frecuencia 15 40 25 10 6

En base a la informacin, realice el anlisis correspondiente.

42

ESTADISTICA

4.

Clasificar cada una de las siguientes variables : a. b. c. d. e. f. g. h. i. j. k. Rendimiento Acadmico (Bajo, Medio, Alto). Sexo. Edad. Nivel educativo (primario secundario, superior). Aos de estudios completados. Tipo de enseanza (privada o pblica). Estrato social (bajo, medio o alto). Numero Telefnico Numero de DNI de un profesor. Mtodo de enseanza. Nivel de congruencia entre la sumilla y el silabo.

5.

Se aplico un test para medir la competitividad del magisterio a una muestra piloto de 5 profesores, obteniendo los siguientes resultados. Profesor 1 1 2 3 4 5 1 0 1 1 0 2 0 0 0 0 0 3 1 1 0 1 1 tems 4 0 1 1 1 0 5 0 0 1 0 1 6 0 1 1 0 1

Determine la confiabilidad y validez del instrumento.

CLETO DE LA TORRE DUEAS

43

CAPITULO II ORGANIZACIN Y PRESENTACIN DE DATOS 2.1 ESTADISTICA. La Estadstica es la ciencia que se ocupa de los mtodos y procedimientos de coleccin, clasificacin, organizacin, anlisis, sntesis e interpretacin de datos; siendo su caracterstica que la distingue, la de hacer generalizaciones o inferencias en base a una muestra. Se define la estadstica como: Una ciencia que se ocupa de la recoleccin, organizacin, procesamiento y anlisis de la informacin. Una ciencia que permite tomar de decisiones Herramienta de la investigacin cientfica.

En trminos generales la estadstica aborda dos tipos de problemas: Resumir, describir y explorar datos. Utilizar datos de una muestra para inferir la naturaleza del conjunto del cual se selecciono la muestra.

DIVISION DE LA ESTADISTICA La estadstica se divide en dos partes ntimamente relacionadas: Estadstica Descriptiva: Esta es la parte de la estadstica que se dedica a la organizacin, sntesis y descripcin de conjuntos de datos. Esta es importante, ya que antes de que la mente humana pueda interpretar (hacer inferencias) un conjunto de datos, especialmente cuando estos son demasiados, es necesario resumirlos o representarlos de manera clara, simplificada o reducida.

44

ESTADISTICA

Estadstica Inferencial: Esta rama de la estadstica trata el problema de inferir la naturaleza de un conjunto de datos a partir de una muestra de dichos datos.

El problema general de la Estadstica

Poblacin

Muestra

Inferencias

Que tan reales es.

Figura 2.1: Relacin entre poblacin y muestra.

CONCEPTOS BASICOS Poblacin. Es cualquier conjunto de datos, objetivo de nuestro inters, sobre los cuales interesa observar una o ms caractersticas. Esta puede ser finita o infinita. El tamao de la poblacin es el nmero de individuos que esta tiene. Muestra. Una muestra es un conjunto de individuos de la poblacin que refleja las caractersticas de sta lo mejor posible. Si las caractersticas quedan bien reflejadas, se dice que la muestra es representativa. El tamao de una muestra es el nmero de individuos que tiene, lo denotamos por n. Unidad de estudio. Es cada elemento que va a ser estudiado, normalmente se trate de individuos, pero no tiene por qu ser as. Data. Es cualquier medida resultado de haber observado una variable en una unidad de alguna poblacin. Parmetro. Es una propiedad descriptiva de una poblacin. Ejemplo media y varianza poblacional Estadstico. Es una propiedad descriptiva de una muestra. Ejemplo media y varianza muestral. Variable. Cualquier caracterstica de Inters en el estudio. Variable cualitativa: Ordinal y Nominal Variable cuantitativa: Discreta y continua.

Por otra parte, el reporte de las variables medidas requiere de los siguientes conceptos:

CLETO DE LA TORRE DUEAS

45

2.2 ORGANIZACIN DE DATOS La presentacin de datos a travs de tablas estadsticas es una actividad importante dentro de los sistemas de informacin, estas se fortalecen significativamente cuando se la acompaan con grficos descriptivos ilustrativos. En el contexto de los sistemas de informacin, en ms de una oportunidad se encontrara que un buen grafico resume y expresa mucho ms que prrafos completos de comentarios e interpretaciones literales. Resumir los datos es un procedimiento til para conseguirlo y puede hacerse mediante tablas, grficos o valores numricos. A lo largo de este tema veremos las principales tcnicas numricas y grficas que nos permiten describir una caracterstica de inters observada en una poblacin, poniendo en relieve sus rasgos ms importantes.

2.3 TABLA DE FRECUENCIAS. Un primer resumen de la informacin contenida en un conjunto de datos observado se obtiene al organiza los datos, en una tabla de frecuencias. En sta se recogen los distintos valores (nmeros o categoras) que toma la variable junto con sus correspondientes frecuencias de aparicin.

TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS Si en una muestra de n elementos, se observa k categoras diferentes C1, C2,, Ck de una variable cualitativa X. Para resumir la informacin, previamente definimos algunos conceptos:

La frecuencia absoluta de un valor Ci es el nmero de veces que dicho valor aparece en la muestra. Se representa por fi y cumple
k

fi
i 1

f1

f 2 ......

fk

La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta (fi) entre el tamao de la muestra (n), se representa por hi

hi

fi n

, se cumple

hi 1
i 1

46

ESTADISTICA

La frecuencia absoluta acumulada del valor i-simo es la suma de las frecuencias absolutas hasta dicho valor, se denota por Fi

Fi

f1

f 2 ...... fi

La frecuencia relativa acumulada del valor i-simo es la suma de las frecuencias relativas hasta dicho valor, se denota por Fi

Hi
Hi

h1 h2 ...... hi
Fi n

La tabla de frecuencias tiene la siguiente estructura:

Categora de X C1 C2 . Ck Total

fi f1 f2 fk n

hi h1 h2 hk 1.00

pi p1 pi pk 100

Fi F1 F2 Fk=n

Hi H1 H2 Hk=1

GRAFICAS PARA VARIABLES CUALITATIVAS. Las representaciones grficas prcticamente estn orientadas de acuerdo con las necesidades del investigador o estadstico, de todas formas se tienen algunas normas de trabajo y representacin, que tienen por objeto facilitar la lectura de los datos e informacin que se maneja estadsticamente. La calidad de un grfico estadstico consiste en comunicar ideas complejas con precisin, claridad y eficiencia, de tal manera que: Induzca a pensar en el contenido ms que en la apariencia No distorsione la informacin proporcionada por los datos Presente mucha informacin (nmeros) en poco espacio

CLETO DE LA TORRE DUEAS

47

Favorezca la comparacin de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo una secuencia temporal)

La finalidad de los grficos estadsticos es: Organizar los datos. Observar patrones. Observar agrupamientos. Observar relaciones. Comparar distribuciones. Visualizar rpidamente la distribucin de los datos. Visualizar, obtener y comparar medidas estadsticas.

La tabla de frecuencias para variables cualitativas, se puede representar utilizando los siguientes grficos.

Diagrama de barras o rectangulos Es la representacin grfica usual para variables cualitativas. Para el caso de variables cualitativas se construye dibujando sobre la categora correspondiente un rectngulo con altura igual a la frecuencia (absoluta o relativa). Tambin es vlido para variables cuantitativas discretas, considerando en el eje de abscisas los valores de la variable en orden creciente en lugar de las categoras, sobre cada valor levantamos una barra de altura igual a la frecuencia (absoluta o relativa). Este grafico es recomendable, cuando categoras. la variable de estudio tiene muchas

Diagrama de Pareto. Se ordenan las categoras de mayor a menor importancia y se dibujan los rectngulos correspondientes. Este grafico se recomienda para jerarquizar los factores considerados en el estudio.

48

ESTADISTICA

Diagrama de sectores. Es el ms usual en variables cualitativas. Se representan mediante crculos.

A cada valor de la variable se le asocia el sector circular proporcional a su frecuencia. Para hallar el ngulo usamos la siguiente proporcin: al tener una circunferencia 360, el cociente entre la frecuencia absoluta (o relativa) total y la frecuencia absoluta (o relativa) que queramos representar ser igual al cociente entre los 360 de la circunferencia y el ngulo a determinar, as:

n fi
Donde

360

1 hi

360

es el ngulo a determinar.

Este grafico es recomendable, cuando la variable tiene pocas categoras.

Pictogramas. Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. La escala de los dibujos debe ser tal que el rea de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa.

TABLA

DE

FRECUENCIAS

PARA

VARIABLES

CUANTITATIVAS

DISCRETAS Una vez obtenida una muestra de cualquier poblacin y observados los valores que toma la variable en los individuos de la muestra, estos valores se suelen ordenar. Si la variable es cuantitativa la ordenacin ser de menor a mayor.

CLETO DE LA TORRE DUEAS

49

Dada una variable X, consideramos una muestra de tamao n que toma k valores distintos, x1, . . . , xk (x1 < x2 < . . . < xk). La organizacin es en forma similar al caso cualitativo.

Valores de X x1 x2 . xk Total

fi f1 f2 fk n

hi h1 h2 hk 1.00

pi p1 pi pk 100

Fi F1 F2 Fk=n

Hi H1 H2 Hk=1

La grafica para representar esta informacin es Bastones.

Existe otros grficos, tales como:

Diagrama de cajas(box-plot) Presentacin visual que describe al mismo tiempo varias caractersticas importantes de un conjunto de datos, tales como el centro, la dispersin, el alejamiento de la simetra, y la identificacin de valores extremos (puntos atpicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos. Presenta los tres cuartiles, (y los valores mnimos y mximos) alineados sobre una caja vertical u horizontalmente. El procedimiento Para el diagrama de cajas y bigotes es:

1. Dibujar un segmento con extremos en los valores menor y mayor que aparecen en la muestra paralelo a uno de los ejes. 2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos en ella la mediana. 3. Se hallan los lmites interiores (Q1 1.5 IQR y Q3 + 1.5 IQR) y los lmites exteriores (Q1 3 IQR y Q3 + 3 IQR). Donde Qi : Cuartiles que seran desarrollados ms adelante. 4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores adyacentes de la muestra.

50

ESTADISTICA

5. Por ltimo se indican los valores atpicos

Tallos y Hojas (stem & leaf) Procedimiento semigrfico para el que se preparan los datos resumindolos en dos o tres cifras (expresndolos en las unidades adecuadas). A continuacin se disponen en una tabla de dos columnas del siguiente modo:

1. Si los datos son de dos dgitos, a la izquierda (en el tallo) aparece la cifra de las decenas, a la derecha separada por una lnea aparecen las hojas y se escriben ordenadas y todas seguidas. 2. Si hay tres dgitos el tallo est formado por los dos primeros. Las hojas son las unidades.

TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS CONTINUAS A veces se hace necesario trabajar con datos agrupados. Definimos entonces como clase a cada uno de los intervalos en que se agrupan los datos. Las frecuencias harn ahora referencia al nmero de datos que hay en cada intervalo.

Para construir distribucin de frecuencias por intervalos, se tiene los siguientes pasos:

Elegir un nmero de intervalos de clase (K) Puede utilizar la regla de Sturges, Donde k: Nmero de intervalos. n: Nmero de datos.

k 1 3.3log(n)

Determinar el rango.

xmax

xmin

Determinar la amplitud de las clases.

R/k

CLETO DE LA TORRE DUEAS

51

Determinacin de los intervalos i :

I1

xmin , xmin

LI1, LS1

I2

xmin

A, xmin 2 A

LI2 , LS2

Ik

xmin (k 1) A, xmin kA

LI k , LSk

Determinacin de las marcas de clase.

mi

LI i 2

LSi

Donde LI : Limite inferior

LS : Limite superior.

Realizar la clasificacin y el conteo de datos en cada clase construida.

Ii I1 I2 . Ik Total

mi m1 m2 mk

fi f1 f2 fk n

hi h1 h2 hk 1.00

hi h1 h2 hk 1.00

pi p1 pi pk 100

Fi F1 F2 Fk=n

Hi H1 H2 Hk=1

Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polgonos de frecuencias.

52

ESTADISTICA

Histograma de frecuencias Un histograma es la representacin ms frecuente con datos agrupados, se construye a partir de la tabla estadstica, representando sobre cada intervalo, un rectngulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectngulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el rea de los mismos.

Polgono de frecuencias El polgono se construye fcilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lneas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polgono de frecuencias en el primer y ltimo intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una lnea recta los puntos del histograma que corresponden a sus marcas de clase.

Curva de frecuencias. Resulta de suavizar el polgono de frecuencias, en sus puntos angulosos.

Ojivas Es una poligonal construida uniendo los puntos cuyas abscisas son los lmites superiores de clases y las ordenadas son las frecuencias absolutas acumuladas

CLETO DE LA TORRE DUEAS

53

Resumen de grficos. Variable Cualitativa Tipo Nominal Ordinal Grfico Sectores circulares, barras, pictogramas, pareto. Cuantitativa Discreta Bastones, barras, box plots, tallos y hojas Continua Histogramas, polgonos de frecuencia, Ojivas, Grafico de cajas, Boxplots, tallos y hojas.

54

ESTADISTICA

EJERCICIOS DESARROLLADOS

1. En una encuesta de opinin, respecto a las preferencias

del mtodo de

enseanza: Clsico(A), Nuevo enfoque (B), Ambos mtodos(C), 30 docentes dieron las siguientes respuestas: A, B, B, B, C, B, B, B, A, A, B, B, C, A, B, C, B, A, A, B, B, B, C, C, B, B, C, C, C, B Construir la distribucin de frecuencias y represente la informacin mediante un grafico. Solucin. Mtodo Clsico Nuevo Enfoque Ambos mtodos Total n=30 fi 6 16 8 hi 0.2 0.5333 0.2667 1.00 pi 20 53.33 26.67 100.00

Barchart for Metodo 16

12
frequency

0 Ambos metodos Clasico Nuevo enfoque

CLETO DE LA TORRE DUEAS

55

Pie Chart of C1
Category Ambos metodos Clasico Nuevo enfoque

2. En un estudio realizado de los hbitos estudio de los estudiantes de I.E de la ciudad de Cusco, se cuadro siguiente. obtuvo los siguientes resultados que se muestra en el

Hbito de estudio Bajo Intermedio Alto Total

Frecuencia 96 83 71 250

Porcentaje 38,4 33,2 28,4 100,0

Representa la informacin mediante dos grficos adecuados.

40

30

Porcentaje

20

10

0 Bajo Intermedio Alto

Hbito de estudio

56

ESTADISTICA

3. El Director de una institucin educativa desea analizar el nmero de tardanzas presentadas por los estudiantes. Para ello, se toma una muestra aleatoria de 50 estudiantes obtenido los siguientes datos de tardanzas: 2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4 3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1 En base a la informacin: a) Cul es la poblacin objeto de estudio? b) Qu variable estamos estudiando? c) Qu tipo de variable es? d) Construir la tabla de frecuencias? Solucin: a) La poblacin objeto de estudio es el total de estudiantes de la I.E. b) La variable (x) que estamos estudiando es el nmero de tardanzas c) El tipo de variable es discreta ya que el nmero de tardanzas solo puede tomar determinados valores enteros d) Para construir la tabla de frecuencias tenemos que analizar el nmero de tardanzas de los estudiantes. Podemos ver que el nmero de tardanzas, toma los valores existentes entre 0 y 6 hijos: Xi 0 1 2 3 4 5 6 fi 2 4 21 15 6 1 1 n = 50 Fi 2 6 27 42 48 49 50 hi 0.04 0.08 0.42 0.30 0.12 0.02 0.024 1 Hi 0.04 0.12 0.54 0.84 0.96 0.98 1

4. En la UGEL de la regin Cusco, se realizo un estudio sobre el conocimiento de estrategias cognitivas. Los resultados se muestran a continuacin.

CLETO DE LA TORRE DUEAS

57

Conocimiento Frecuencia 26 8 7 41 Porcentaje 63.4 19.5 17.1 100.0

Deficiente Regular Bueno Total

Represente la informacin mediante un grafico. Solucin:

60,0%

Porcentaje

40,0%

20,0%

0,0% Deficiente Regular Bueno

Conocimiento

5. Por encargo del nutricionista, se debe dar la siguiente cantidad de caloras a un grupo de 50 estudiantes de una institucin educativa.

3255 1895 2155 2456 1525 4450 4243 3024 4244 1255

2123 2740 3255 3772 3847 2793 4124 3214 4955 4675

3525 4525 2460 4220 3005 1965 4595 4509 3925 4580

2123 3215 1985 2971 2224 2327 2643 3727 2220 3437

3453 2593 3530 4685 2646 4525 3797 4134 2335 2702

58

ESTADISTICA

a) Organice la informacin en una tabla de frecuencias. b) Represente la informacin utilizando: Histograma de frecuencias porcentuales acumuladas y Ojiva. c) Trace el histograma y polgono de frecuencias porcentuales.

Solucin. a) Construiremos la tabla de frecuencias. Nmero de clases. Usando la relacin de sturges se tiene:

k 1 3.3log(n) 1 3.3log(50) 6,6 7


Determinar la amplitud de los intervalos

xmax

xmin

4955 1255 3700

Determinar el tamao del intervalo de clases (A),

R k

3700 7

528,57

Clase Intervalo mi fi 1 [1255,0 - 1783,57 ) 1519,29 1 2 3 4 5 6 7 Total [1783,57 - 2312,14 ) 2047,86 8

hi 0,0400 0,1600

pi 4% 16% 20% 14% 16% 12% 18% 100%

Pi 4% 20% 40% 54% 70% 82% 1OO%

[2312,14 - 2840,71 ) 2576,43 10 0,2000 [2840,71 - 3369,29 ) 3105,0 7 0,1400 0,1600 0,1200 0,1800

[3369,29 - 3897,86) 3633,57 8 [3897,86 - 4426,43) 4162,14 6 [4426,43 - 4955 ) 4690,71 9

50 1

CLETO DE LA TORRE DUEAS

59

b) La grafica muestra el histograma de frecuencias porcentuales acumuladas y la Histograma ojiva

Frecuencia Porcentual Acumulada

100 80
Ojiva

60
Histograma

40 20 0 0 1 2 Calorias
Histograma

5 (X 1000,0)

20

Frecuencia Porcentual

16 c) En el grafico se muestra, el polgono de frecuencias. 12 8 4 0 0 1 2 Calorias 3 4 5 (X 1000,0)

Polgono de frecuencias

60

ESTADISTICA

6. Un investigador recopila informacin del peso de 50 profesores. Los datos obtenidos fueron los siguientes. 65 63 65 63 69 67 53 64 65 64 72 68 66 55 64 65 64 71 68 66 56 63 65 63 70 67 66 57 64 64 63 69 67 66 58 a. Construya la tabla de distribucin de frecuencias 58 57 59 59 60 60 60 61 61 61 61 62 62 62 62

b. Represente la informacin obtenida, mediante un grafico.

Solucin. a. Para construir una tabla de frecuencia se tiene los siguientes pasos. Elegir el nmero de clases. Usando la relacin de sturges se tiene:
k 1 3.3log(n) 1 3.3log(50) 7

Determinar la amplitud de los intervalos

xmax

xmin

72 53 19

Determinar el tamao del intervalo de clases (A),


A R k 19 7 2, 7

Consideramos A=3 Establecimiento de los lmites y construccin de la tabla:

LI - LS [52 55) [55 58) [58 61) [61 64) [64 67) [67 70) [70 73) TOTAL

fi 2 5 9 15 12 5 2 n=50

mi 53.5 56.5 59.5 62.5 65.5 68.5 71.5

Fi 2 7 16 31 43 48 50

hi= fi/n 0.04 0.1 0.18 0.3 0.24 0.1 0.04 1

pi 4 10 18 30 24 10 4 100

Hi 0,04 0,14 0,32 0,62 0,86 0,96 1,0000

CLETO DE LA TORRE DUEAS

61

b.

Histograma de frecuencias relativas.

Histogram 30 25
percentage

20 15 10 5 0 52 56 60 64 Peso 68 72 76

62

ESTADISTICA

EJERCICIOS PROPUESTOS.

1. Un investigador realiza una investigacin con la finalidad de comparar la eficiencia de los siguientes mtodos de comprensin lectora: A: Enseanza directa. B: Enseanza recproca. C: Combinacin de los mtodos de enseanza directa y enseanza recproca. Si se aplico cada mtodo en forma independiente en tres secciones diferentes de 50 alumnos cada uno, obtenindose, que 30 alumnos con el mtodo de enseanza directa, 20 con mtodo de enseanza reciproca y 35 con la combinacin de estos mtodos presenta una buena comprensin lectora. En base a estos resultados cual es su conclusin del estudio.

2. Se aplico una encuesta a directores de I.E con la finalidad de

evaluar la

influencia de los programas de capacitacin de docentes fomentados por el Estado en la calidad de servicio educativo. Los resultados son los siguientes: I.E 1 2 3 4 5 6 7 Donde X: Programas de capacitacin. Y: Calidad del servicio educativo. M: Mala, R: Regular, B: Buena, MB: Muy buena. Cul es su conclusin del estudio X R M M R B M R Y R M R M B M R I.E 8 9 10 11 12 13 14 X MB R R M M R MB Y MB R M M R R B I.E 15 16 17 18 19 20 21 X R R M M M B B Y R M R M M B R

3. Se ha medido la comprensin lectora de una muestra de 50 profesores de la UGEL A, Los resultados son los siguientes: 30, 35, 34, 38, 40, 42, 43, 43,

CLETO DE LA TORRE DUEAS

63

44,44,45,45,46,46,46, 47, 48, 50, 55, 56, 58, 59, 60, 63, 65, 66, 67, 67, 68, 70, 72, 74, 75, 77,78,78,78,78, 78, 79, 79, 79, 80,82, 82, 83, 88, 90, 96,99 a) Organiza y representa adecuadamente la informacin. b) Redacte sus conclusiones del estudio.

4. Los siguientes datos corresponden a una muestra de 30 estudiantes de un centro educativo de la ciudad de Cusco, en los cuales se midieron tres caractersticas: Peso en libras (X), Nmero de tardanzas en el ao escolar (Y) y Estrato socioeconmico (Z)

X 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 149 168 126 138 176 163 119 154 165

Y 3 5 1 4 3 2 0 1 5 3 4 2 2 4 5 4 4 0 1 2 2 3 5 2

Z MEDIO MEDIO ALTO BAJO MEDIO MEDIO BAJO BAJO MEDIO ALTO BAJO MEDIO MEDIO ALTO BAJO MEDIO MEDIO MEDIO ALTO BAJO MEDIO MEDIO BAJO BAJO

64

ESTADISTICA

146 173 142 147 135 153 I.

3 4 1 1 2 2

BAJO MEDIO BAJO ALTO MEDIO MEDIO

Identifique los siguientes conceptos: a) Poblacin. b) Muestra. c) Unidad de anlisis. d) Variables o caractersticas de inters e) Clasifique las variables definidas anteriormente

II.

Construya una tabla de frecuencias para presentar el estrato socioeconmico de los estudiantes con su correspondiente ttulo y anxele un grfico adecuado.

III.

Construya una tabla de frecuencias para presentar el nmero de tardanzas al ao de los estudiantes con su correspondiente ttulo y anxele un grfico adecuado.

IV.

Construya una tabla de frecuencias de 5 intervalos para presentar el peso de los estudiantes con su correspondiente ttulo y anxele un grfico adecuado.

V.

De las tablas construidas anteriormente responda las siguientes consultas: a) Qu porcentaje de estudiantes corresponde al estrato socioeconmico bajo? b) Cuantos estudiantes realizan, presentaron a lo ms dos tardanzas al ao? c) Qu porcentaje de estudiantes no presento tardanzas en el ao? d) Cuntos estudiantes tienen un peso a lo ms de 167? e) Qu porcentaje de estudiantes tiene un peso mayor a 127 y menor o igual a 159? f) Cuntos estudiantes tienen un peso mayor a 159?

5. Una encuesta realizada en un grupo de profesores sobre el uso de los distintos tipos de estrategias metodolgicas, dio los siguientes resultados

A B D

D A A

B B D

A A C

D C A

D A C

A A C

C D D

D D A

CLETO DE LA TORRE DUEAS

65

B D

A C

D A

B D

A A

B B

C A

C B

A A

Confeccionar una tabla de frecuencias que recoja esta informacin y elabora dos tipos de grficos distintos a partir de ella. Qu porcentaje de profesores utiliza cada estrategia? 6. Los datos siguientes representan el nmero de gestiones realizadas en instituciones pblicas o privadas de 52 Directores de igual nmero de centros educativos en el ao 2009: 0 2 0 1 3 4 0 2 1 3 0 2 2 1 0 5 2 6 1 2 1 4 1 1 0 1 1 2 0 5 2 0 4 3 2 4 3 2 1 6 2 3 3 5 1 3 6 1 3 4 5 0 2 3 a) Identifique los siguientes conceptos: i) Poblacin analizada. ii) Elementos de la poblacin. iii) Caracterstica en estudio. iv) Tipo de dato analizado. b) Construya una tabla de frecuencias completa para estos datos y escrbale un ttulo. c) d) Trazar una grafica adecuada. Con la tabla construida en c) entregue la siguiente informacin al Director de la UGEL: i) Cuntos Directores , realizaron a lo ms 3 gestiones?. ii) Qu porcentaje de Directores, realizo exactamente 5 gestiones?.

7.

Se ha realizado una encuesta a 30 familias en la que se les pregunta el n de integrantes. Las respuestas obtenidas han sido las siguientes: 1, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3. 1. Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. 2. 3. Qu proporcin de familias est compuesta por tres o menos personas? Dibuje el diagrama de barras de frecuencias.

8.

Se le aplico una prueba de inteligencia a los estudiantes de un centro educativo, obteniendo los siguientes datos.

66

ESTADISTICA

87 105 115 89

88 103 114 125 108 107 118 114 129 100 106 113 105 111 82 141 92 132 112 97 135 101 104 130 99 114 91 145

94 95 93

101 115 104

87 108 115 103 132 110 113 102 109 124

98 140 107 94

108 122 117 114 141 116 108 102 101 118 138 118 123 108 131 127 100 91

99 105 112

96 132

a) Agrupe los datos en y confeccione una tabla de frecuencias b) Trace las graficas adecuadas.

9. Represente grficamente la siguiente informacin

Comprensin Literal Malo Regular Bueno Total

Frecuencia 2 18 30 50

Porcentaje 4.0 36.0 60.0 100.0

CLETO DE LA TORRE DUEAS

67

CAPITULO III MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIN DE DATOS.

3.1 INTRODUCCION. Las tcnicas estudiadas anteriormente permiten una descripcin visual de la distribucin de una variable. En muchos casos, el resumen puede hacerse eficazmente de una forma ms sencilla y precisa, utilizando valores numricos que den idea de la ubicacin o del centro de los datos (medidas de posicin). Usando cantidades que informen de la concentracin de las observaciones alrededor de dicho centro (medidas de dispersin) y mediante nmeros que reflejen la forma (asimetra y apuntamiento) de la distribucin (medidas de forma). La conjuncin de tcnicas numricas y grficas permite una buena descripcin de la variable. Los estadsticos resmenes tratan de reflejar numricamente distintos aspectos de la variable en estudio. Podemos distinguir 4 aspectos o caractersticas principales que pueden resumirse en una distribucin. (Ver cuadro siguiente)

68

ESTADISTICA

Media Centralizacin Mediana Moda Percentiles Cuartiles Posicin Deciles Varianza Medidas descriptivas Dispersin Desviacin tpica Coeficiente de variacin Rango

Nos dan un centro de la distribucin de frecuencias Son valores de la distribucin que dividen en partes iguales Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al

Recorrido Intercuartilico Coeficiente de Asimetra Forma

valor central Comparan la forma

Coeficiente de Apuntamiento que tiene la o Curtosis representacin grfica

3.2 MEDIDAS DE TENDENCIA CENTRAL Los promedios o medidas de tendencia central son valores representativos de un conjunto de datos. Pretenden resumir todos los datos en un nico valor. Las medidas de tendencia central son fundamentales ya que permiten localizar cuantitativamente la zona central o de mayor acumulacin de informacin de un conjunto de datos correspondientes a una variable, obtenidos de una muestra seleccionada de una poblacin especfica o de un conjunto de resultados del espacio muestral de un experimento aleatorio.

Definimos tres medidas de tendencia central ms importantes: media, mediana y moda.

CLETO DE LA TORRE DUEAS

69

Media ( x ) Media para datos sin agrupar: Dado un conjunto de observaciones x1, . . . , xn, la media se representa mediante

x,

se obtiene mediante:
n

x1

x2 ..... xn n

xi
i 1

Media para datos agrupados Consideremos el caso en que tenemos una distribucin de frecuencia variables cuantitativas discretas, en este caso la media es: para

f1 x1

f 2 x2 ..... f k xk n

xi hi
i 1

Si los datos estn agrupados por intervalos, para hallar la media tomamos la marca de las clases,

f1m1

f 2 m2 ..... f k mk n

hi mi
i 1

La media se mide en las mismas unidades que la variable, y tiene el inconveniente de verse muy afectada por la presencia de datos que sean extremadamente grandes o pequeos (datos atpicos).

Mediana (Me) Se calcula para variables cuantitativas; es el valor de la serie de datos que se sita justamente en el centro de la muestra una vez se ha ordenado sta, corresponde a un 50% de valores son inferiores y otro 50% son superiores.

70

ESTADISTICA

Mediana para datos sin agrupar La mediana es el valor del dato central y depende del tamao de la muestra.

Me

xn
2

, para n impar

x Me

n 2

x 2

n 1 2

, Si n es par.

Mediana para datos agrupados Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con precisin los valores que toman los datos, ya que esa informacin se ha perdido en privilegio del agrupamiento intervalo. Por lo tanto, en este caso, debemos buscar otro mtodo para determinar el valor de la mediana.

Me LI

n Fi 1 2 A LI fi

0.5 H i 1 A hi

La mediana slo tiene en cuenta la posicin de los valores en la muestra y por lo tanto tiene mejor comportamiento que la media cuando hay observaciones anmalas.

Moda (Mo) Es el valor con mayor frecuencia. Si hay ms de una moda, la variable se dice multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o cualitativas). Si los datos estn agrupados hablamos de clase modal y ser aquella para la que la frecuencia absoluta sea mayor.

Mo

LI
1

1 2

LI

fi fi fi
1

fi

fi

fi

A
1

CLETO DE LA TORRE DUEAS

71

Donde:

fi

fi

fi

fi

Unimodal

Bimodal

Multimodal

Cmo elegir entre las medidas de tendencia central?- En general, la media es la medida de tendencia central ms til y ms empleada. El uso de la media es el ms apropiado cuando y la distribucin de los datos es unimodal y aproximadamente simtrica. Cuando valores extremos distorsionan la distribucin de los datos, el uso de la mediana es ms apropiado pues se ve menos afectada, pero en la prctica esta medida de tendencia central no se utiliza demasiado. Si se trata de una variable ordinal, o slo necesitas una descripcin rpida y aproximada de la tendencia central, puedes utilizar la moda, que tambin es til cuando la distribucin est distorsionada por valores extremos o la distribucin es bimodal.

3.3 CLASES DE DISTRIBUCIONES Distribucin Simtrica: Se presenta si todas las observaciones estn concentradas en un solo valor de la variable, en este caso la media, mediana y moda coincidiran en el mismo.

Me

Mo

Distribucin asimtrica sesgada a la izquierda

72

ESTADISTICA

Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central ms que las observaciones de la parte derecha, generando una distribucin asimtrica hacia la izquierda; en este caso como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones, su valor se correr a la izquierda tambin y por el mismo motivo, la media ser menor que la mediana y ambas menor que la moda, es decir:

Me

Mo

Distribucin asimtrica sesgada a la derecha. En este caso la media, es mayor que la mediana y que la moda.

Mo

Me

3.4

MEDIDAS DE POSICIN. Cuartiles Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se denotan por Qi , i=1,2,3

Qi

LI i

i.n Fk 4 fk

CLETO DE LA TORRE DUEAS

73

Q1, primer cuartil, al menos el 25% de los datos son menores o iguales que l y al menos el 75% de los datos son mayores o iguales que l. Q2, segundo cuartil, es la mediana, Q2 = Me. Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales que l y al menos el 25% de los datos son mayores o iguales que l.

Percentiles Dividen la muestra ordenada en 100 partes iguales.

Pi

LI i

i.n Fk 100 fk

El i-simo percentil, Pi ( 1 i iguales que l.

99 ) es un valor tal que al menos el i% de los datos

son menores o iguales que l y al menos el (100-i) % de los datos son mayores o

A partir de las definiciones de los cuartiles y percentiles, es claro que Q1 = P25, Q2 = P50 =Me y que Q3 = P75. Deciles Dividen el conjunto de datos en 10 partes iguales y se denota con Di , i=1,9

Di

LI i

i.n Fk 10 fk

3.5

MEDIDAS DE DISPERSIN Mientras los estadsticos de tendencia central nos indican los valores alrededor de los cuales se sitan un grupo de observaciones, los estadsticos de variabilidad o dispersin muestran si los valores de las observaciones estn prximos entre s o

74

ESTADISTICA

estn muy separados. Dos conjuntos de datos pueden tener la misma localizacin central y no obstante, ser muy distintos si uno se halla ms disperso que el otro. La dispersin es el grado en que los datos numricos tienden a extenderse alrededor de un valor medio. La dispersin de la distribucin suministra

informacin complementaria que permite juzgar la confiabilidad de nuestra medida de tendencia central. Si los datos estn ampliamente dispersos, la localizacin central ser menos representativa de los datos en su conjunto de lo que sera en el caso de datos que se acumulasen ms alrededor de la media. Adems, si no conviene tener una amplia dispersin de valores respecto al centro o si esa dispersin implica un riesgo inaceptable, deberemos ser capaces de reconocerlo y no escoger las distribuciones que presentan la mxima dispersin. Las medidas ms importantes son: Varianza, desviacin tpica, coeficiente de variacin muestral, rango y rango semiintercuartilico. Las mismas que se desarrolla a continuacin:

Varianza. Slo tienen sentido para variables cuantitativas y se define:


n

xi S2
i 1

xi2
i 1

n
n

n x
2 n

x2 fi xi2

, Para datos no tabulados.

xi S2
i 1

fi
i 1

n
n 2 n

n
f i mi2
i 1

x 2 , Para datos tabulados de variable


discreta

mi S2
i 1

x n

fi

x2,

Para datos tabulados por intervalos,

para variables continuas.

Observaciones sobre la varianza:

CLETO DE LA TORRE DUEAS

75

Las unidades de la varianza son los cuadrados de las unidades de los datos y en muchas ocasiones no son fciles de interpretar. Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto. Si la muestra es pequeo, se recomienda utilizar en el denominador de la ecuacin de la varianza n-1 en reemplazo de n.

Desviacin tpica (S) Es la raz cuadrada positiva de la varianza

s2
.

La desviacin tpica poblacional suele denotarse por

Observaciones sobre la desviacin tpica: Nos permite determinar con mayor grado de precisin dnde se sitan los valores de una distribucin de frecuencia en relacin con la media. Las unidades de la desviacin tpica se expresan en las mismas unidades de los datos. Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto.

Variables tipificadas Los distintos conjuntos de datos estn asociados por lo general a diferentes medias, ya sea porque son de naturaleza diferente (escalas de medidas diferentes). Con el propsito de reducir los datos a un mismo punto de referencia y a una escala comn, se realiza entre ellos una transformacin llamada tipificacin. Se conoce por tipificacin de una variable x a efectuar el cambio de or igen y de escala de la variable:

z z

x x s x-

para muestras para poblacin

76

ESTADISTICA

Esta nueva variable (z), carece de unidades de medida y permite comparar dos o ms cantidades que en un principio no son comparables porque aluden a conceptos diferentes. Tambin es aplicable a casos en que se quieran comparar individuos semejantes de poblaciones diferentes.

Ejemplo 1: Un estudiante obtuvo 84 puntos en el examen final de matemticas, en el que la nota media fue 76, y la desviacin tpica 10. En el examen final de fsica obtuvo 90 puntos, siendo la media 82 y la desviacin tpica 16. En qu examen sobresali ms?.

Examen de matemtica
x = 76

Examen de fsica
x = 82

s = 10 x = 84 z=
84 76 10 0,8

s = 16 x = 90 z=
90 82 16 0,5

Sobresali ms en matemticas.

Coeficiente de variacin Muestral de Pearson Las medidas de dispersin anteriores dependen de las unidades de medida, el coeficiente de variacin es, en cambio, una medida de dispersin relativa y adimensional.

CV

S *100% |X|

CV es apropiado en poblaciones donde los datos son positivos. Si 0<CV<15%, los datos provienen de una poblacin homognea Si CV>15%, los datos provienen de una poblacin heterognea.

El coeficiente de variacin es til, en razn de su carcter adimensional, para comparar muestras con medias desiguales, donde las unidades de medida de las

CLETO DE LA TORRE DUEAS

77

observaciones son diferentes. Tambin para decidir cual muestra es ms homognea o menos variable

Recorrido o rango Es la diferencia entre el mayor y menor valor de una muestra.

R x max

x min

Rango semiintercuartlico y amplitud intercuartil El rango semiintercuartlico es la mitad de la diferencia entre el tercer y primer cuartil, Q = (Q3 Q1)/2. La amplitud intercuartil es el doble del valor anterior, 2Q = IQR = (Q3 Q1). Cmo elegir entre las medidas de dispersin?- La medida de dispersin ms til es la desviacin tpica. Slo debes usar el rango cuando dispones de pocas medidas o cuando todo lo que necesitas conocer es la dispersin general de las medidas. Utiliza el coeficiente de variacin cuando quieras tener una idea de la variabilidad relativa de dos o ms variables cuyas medias son muy diferentes en magnitud. Esto se ve facilitado por su carcter adimensional, es decir, no depende de las unidades en que se mida la media

3.6

MEDIDAS DE FORMA Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda y Hacen referencia a la forma de la distribucin, simtrica, asimetra a la derecha o a la izquierda. En general la mejor manera de verlo es por la representacin grfica, pero si no la tenemos existen coeficientes que nos indican la forma de la distribucin. Los ms utilizados son:

Coeficiente de asimetra de Pearson, El coeficiente de asimetra de una variable mide el grado de asimetra de la distribucin de sus datos en torno a su media, es adimensional y se define como sigue:

78

ESTADISTICA

Ap
Ap

x Mo S

Este coeficiente puede ser:

0 , entonces la media igual que la moda, distribucin simtrica

Ap

0 , entonces la media mayor que la moda, asimetra a la derecha positiva

Ap

0 , entonces la media menor que la moda, asimetra a la izquierda

negativa.

Curtosis El Coeficiente de Curtosis mide el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin.

La curtosis hace referencia al mayor o menor apuntamiento que tiene una distribucin de frecuencias respecto a una distribucin Normal, por lo tanto slo se estudia en comparacin con la campana de Gauss, se determina mediante:

P75 P25 P90 P 10

0.5

Se definen 3 tipos de distribuciones segn su grado de curtosis:

0 , la curva es igual que la normal, se llama Mesocrtica

K K

0 , la curva es ms puntiaguda que la normal se llama Leptocrtica 0 , la curva es ms aplastada que la normal, se llama Platicrtica

CLETO DE LA TORRE DUEAS

79

80

ESTADISTICA

EJERCICIOS DESARROLLADOS

1. La siguiente tabla muestra los coeficientes de inteligencia de 480 nios. C.I fi 70 4 74 9 78 16 82 28 86 45 90 66 94 85 98 72 102 106 110 114 118 122 126 54 38 27 18 11 5 2

Calcule: a) El C.I. medio de los nios. b) Su desviacin tpica. c) Si una madre afirma que exactamente la mitad de los nios del colegio tienen un C.I. superior al de su hijo, qu C.I. tiene el nio? d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de los nios con mayor C.I., pero que el psiclogo solo puede atender al 15% de los nios del centro. Qu C.I. deber tener un nio como mnimo para ser considerado dentro de ese grupo de elegidos? e) Se van a preparar unas clases de apoyo, para un 25% de los nios del centro, precisamente para aquellos que tengan menor C.I. Hasta que nios de qu C.I. deberemos considerar en estas clases? Solucin: La variable de estudio es el cociente intelectual (X) xi 70 74 78 82 86 90 94 98 102 106 110 114 fi 4 9 16 28 45 66 85 72 54 38 27 18 fixi 280 666 1248 2296 3870 5940 7990 7056 5508 4028 2970 2052 fixi2 19600 49284 97344 188272 332820 534600 751060 691488 561816 426968 326700 233928 Fi 4 13 29 57 102 168 253 325 379 417 444 462 Hi 0.0083 0.0271 0.0604 0.1188 0.2125 0.35 0.5271 0.6771 0.7896 0.8688 0.925 0.9625

CLETO DE LA TORRE DUEAS

81

118 122 126 1470

11 5 2 n=480

1298 610 252 46064

153164 74420 31752 4473216

473 478 480

0.9854 0.9958 1

a) Media

f 1x1 f 2 x2 ..... fkxk n


n

46064 95.96 480

b) Varianza y desviacin.

xi S2
i 1

x n

fi
i 1

fi xi2 n x2

4473216 480

95.96

110.88

110.88 10.52

c) Mediana. n=480 ( Par)

xn Me
2

xn
2

x 480
2

x 480
2

x 240 2

x 241

94 94 2

94

d) Percentil 85

P 106 85
e) Percentil 25

P25
2.

90

Un centro educativo particular requiere los servicios de un Profesor. De los expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales renen los requisitos mnimos requeridos. Para decidir cual de los 2 se va a contratar, los miembros del Jurado deciden tomar 7 pruebas a cada uno de ellos.

Los resultados se dan a continuacin:

82

ESTADISTICA

Candidato 1 A B 57 80 2 55 40 3 54 62

Prueba 4 52 72 5 62 46 6 55 80 7 59 40

a) Halle e interprete la media, mediana y moda de los dos candidatos. b) Estadsticamente Cul de los candidatos debe ser contratado? Fundamente su respuesta.

Solucin: XA 57 55 54 52 62 55 59 394 XB 80 40 62 72 46 80 40 420 XA2 3249 3025 2916 2704 3844 3025 3481 22244 xB2 6400 1600 3844 5184 2116 6400 1600 27144

a) Estadsticos de A.
n

xA

x1 x 2 ..... xn n

xi
i 1

394 7

56.28

MeA

xn
2

, para n impar n=7

MeA
MoA

xn
2

x7
2

x4

55

55

CLETO DE LA TORRE DUEAS

83

Estadsticos de B.
n

xB

x1 x 2 ..... xn n

xi
i 1

420 7

60

MeB
MeB
MoB1
MoB 2

xn
2

, para n impar n=7

xn
2

x7
2

x4

62

40
80

b) Calcular la varianza
n

xi
2 SA i 1

xi2
i 1

n
S | XA |
n

n
10.27 56.28 0.057
n

2 xA

22244 (56.28) 2 7

10.27

CVA

xi
2 SB i 1

xi2
i 1

n
S | XB | 277.7 60

n
0.277

2 xB

27144 7

602

277.7

CVB

La informacin se ilustra en el grafico siguiente.

84

ESTADISTICA

Boxplot of Puntaje vs Postulante


80

70

Puntaje

60

50

40 A Postulante B

3. En un examen de matemticas los 30 alumnos de una clase han obtenido las puntuaciones recogidas en la siguiente tabla:

Calificaciones [0, 1> [1, 2> [2, 3> [3, 4> [4, 5> [5, 6> [6, 7> [7, 8> [8, 9>

Alumnos 2 2 3 6 7 1 1 1 1

a) Halla la media, varianza, la desviacin tpica y coeficiente de variacin. b) Mediana c) Moda.

CLETO DE LA TORRE DUEAS

85

Solucin: I [0, 1> [1, 2> [2, 3> [3, 4> [4, 5> [5, 6> [6, 7> [7, 8> 8, 9 Total fi 2 2 3 6 7 1 1 1 1 24 mi 0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 40.5 mifi 1 3 7.5 21 31.5 5.5 6.5 7.5 8.5 92 mi2fi 0.5 4.5 18.75 73.5 141.75 30.25 42.25 56.25 72.25 440 Fi 2 4 7 13 20 21 22 23 24

a) Media, varianza, desviacin y coeficiente de variacin. Media.

fi mi x
Varianza.

n
mi2 fi

92 24

3.83

S2
Desviacin.

x2

440 24

3.83

3.66

s
Coeficiente de Variacin.

3.66 1.91

CV

S |X|

1.91 3.83

0.498

86

ESTADISTICA

Mediana

Me 3
Moda

12 7 *1 3.833 6

Mo

Li
1

1 2

1
2

7 6 1
7 1 6
1 1 6 *1 4.14

Mo

4.

En una institucin educativa, se ha medido el nivel de depresin que presentan los adolescentes en una escala de 0- 20, obteniendo los siguientes resultado.

Nivel de depresin [ 0-5 > [ 5-10 > [ 10-13 > [13-18 > [ 18-20

Nro de adolescentes. 10 15 25 8 2

a) Calcule la media, varianza y la desviacin. b) Determine la mediana y la moda c) Determine e interprete Q1, Q3, P10 y P90 d) Coeficiente de curtosis y de asimetra.

CLETO DE LA TORRE DUEAS

87

Solucin: I [ 0-5 > [ 5-10 > [ 10-13 > [13-18 > [ 18-20 fi. 10 15 25 8 2 60 Fi 10 25 50 58 60 mi 2.5 7.5 11.5 15.5 19 56 mifi 25 112.5 287.5 124 38 587 mi2fi 62.5 843.75 3306.25 1922 722 6856.5

a) Media y varianza Media.

fi mi x n

587 60

9.78

Varianza.

mi2 fi S2 n x2

6856.5 60

9.782

18.63

Desviacin.

s
b) Mediana y moda Mediana

18.63

4.31

Me

Li

n 2

Fk fK

Determinamos

n 2

60 2

30

88

ESTADISTICA

Me Li

n Fk 2 fK

A 10

30 25 3 10.6 25

Moda

Mo
1

Li
1

1 2

25 15 10

25 8 17

Mo Li
1

1 2

A 10

10 3 11.11 10 17

c) Determine e interprete Q1, Q3, P10 y P90 Para obtener los cuarteles se tiene la relacin.

Qi
Cuartil 1

Li

i.n Fk 4 fK

Q1

Li

1.n Fk 4 fK

A 5

15 10 5 6.67 15

El 25% de los adolescentes presentan niveles de depresin menores a 6.67

CLETO DE LA TORRE DUEAS

89

Cuartil 3

Q3

Li

3.n Fk 4 fK

A 10

45 25 3 12.4 25

El nivel de depresin mximo del 75% de los adolescentes es de 12.4.

Para obtener los percentiles se tiene la relacin.

Pi
Percentil 10

Li

i.n Fk 100 fK

P 10

Li

10.n Fk 100 fK

A 0

6 0 5 3 10

El 10% de los adolescentes tienen niveles de depresin entre 0 a 3

Percentil 90

P90

Li

90.n Fk 100 fK

A 13

54 50 5 15.5 8

d) Coeficiente de Asimetra.

Ap

x Mo s

9.78 11.11 -0.308 4.31

90

ESTADISTICA

Puesto que Ap < 0 la distribucin es asimtrica negativa o a izquierdas (desplazada hacia la izquierda).

Coeficiente de curtosis de fisher.

Q3 Q1 P90 P 10

0.5

12.4 6.67 0.5 -0.0416 15.5 3

Si

, entonces la distribucin es platicrtica.

CLETO DE LA TORRE DUEAS

91

EJERCICIOS PROPUESTOS.

1.

Se desea evaluar el efecto de un programa de intervencin educativa en el nivel de conservacin del medio ambiente, para este fin se aplico un instrumento antes y despus de la aplicacin del programa, obtenindose los siguientes resultados:

Estudiante Antes Despus

1 10 13

2 13 18

3 11 14

4 09 15

5 13 13

6 12 17

7 11 13

8 14 16

9 08 12

Cul es su conclusin del estudio. 2. Se realiza un experimento en una I.E, con la finalidad de determinar el efecto de dos mtodos de enseanza (Tradicional y ABP) en el rendimiento acadmico. Tradicional ABP 12 14 14 13 04 12 09 15 13 15 16 14 13 16 05 14 15 16

Cul de los mtodos presenta mayor confianza. Fundamente su respesta

3.

En 20 Unidades de gestin escolar, seleccionados aleatoriamente se contabiliz el nmero de libreta de notas, incorrectamente llenadas durante un ao escolar, obtenindose los siguientes resultados: 3 4 4 2 2 4 3 1 6 4 1 3 4 4 3 4 2 4 6 3

a) Calcule e interprete la media, mediana y moda b) Que tipo de distribucin es?

4.

Las puntuaciones de un test de inteligencia de 198 Profesores dieron los siguientes resultados: Puntuacin N de personas a) Calcula la media, la mediana y la moda. b) Calcule la varianza, desviacin y el coeficiente de variacin c) Calcule el coeficiente de curtosis y de asimetra. [30,40] (40,50] (50,60] (60,70] (70,80] (80,90] 6 17 76 68 22 9

92

ESTADISTICA

5.

El Director de un centro educativo esta interesado en firmar un contrato de larga duracin para el aprovisionamiento de suministros. El encargado de realizar la operacin desea llevarla a cabo con la empresa que menos se retrase en proporcionar dichos suministros por termino medio. Tras un periodo de prueba con dos compaas, se han obtenido los siguientes datos referidos a retrasos en suministros, medidos en hora

Empresa 1 110 15 147 93 104 95 108

Empresa 2 80 41 3 325 19 93 115 23

Asumiendo que el periodo de prueba es representativo del futuro desempeo de la actividad por que empresa debera decidirse?

6.

Se mide la altura en metros de 110 estudiantes, obteniendo la siguiente tabla: Altura [1,55-1,60) [1,60-1,70) [1,70-1,80) [1,80-1,90) [1,90-2,00) a) Construye la tabla de frecuencias. b) Calcule Q1, D7 y P40 , e interprete dichos valores. c) Se consideran bajos aquellos alumnos cuya estatura est sobre el percentil 30. Cul es la altura mxima que pueden alcanzar? d) Se consideran altos aquellos alumnos cuya altura est sobre el percentil 82. Cul ser su altura mnima? e) En qu percentil est un joven cuya altura es 1,78 m.? N de jvenes 18 31 24 20 17

7.

Se registra el tiempo en minutos que utilizan 30 alumnos para ejecutar una tarea, resultando los siguientes:

CLETO DE LA TORRE DUEAS

93

19,15,26,17,11,23,26,22,18,20,11,18,23,25,20,16,9,22,12,23,13,18,12,13,15,20, 21,15,18,22 a) Construir una distribucin de frecuencias de 5 intervalos, de amplitud constante. b) Calcule el tiempo debajo del cual se encuentran el 25% de las tareas.

8.

En un examen final de estadstica, la puntuacin media de un grupo de 150 estudiantes fue de 78 y la desviacin tpica fue de 8 puntos. En lgebra, sin embargo, la media final del grupo fue de 73 y la desviacin tpica 7,6. En qu asignatura hubo mayor dispersin absoluta y en cul mayor dispersin relativa?

9.

En un estudio se anot el nmero de palabras ledas en 15 segundos por un grupo de 120 sujetos que haban recibido previamente un adiestramiento y 120 individuos que no haban recibido dicha instruccin. Los resultados fueron los siguientes:

Nmero de palabras ledas No instruidos Instruidos 25 26 27 28 29 30 Compare la variabilidad en ambos grupos. 56 24 16 12 10 2 1 9 21 29 28 32

10.

En un examen final de microeconoma, la puntuacin media de 150 estudiantes fue 12,8 puntos y la desviacin tpica 2,3 puntos. En estadstica el promedio fue 10,2 puntos y la desviacin tpica 1,6 puntos. a) En qu materia hay mayor dispersin relativa? b) En qu materia destaca ms un alumno que obtuvo 14 puntos en ambas?

11.

La siguiente tabla representa los resultados en la prueba de aptitud acadmica de un grupo de 1000 jvenes que aspiran ingresar a cierta universidad:

94

ESTADISTICA

Calificacin %Hi Hallar:

300-350) 6

350-400) 28

400-450) 45

450-500) 63

500-550) 95

550-600) 100

a) Porcentaje de aspirantes cuya calificacin es superior a 420 puntos pero inferior a 510 b) N de estudiantes que obtuvieron 500 puntos o ms c) La mayor nota del 30% que obtuvo la nota ms baja d) Porcentaje que obtuvo ms de 480 puntos e) Coeficiente de asimetra de Pearson e interprete f) La curtosis e interprete.

12.

Un Especialista de educacin desea comparar

el rendimiento acadmico

generado por dos mtodos de enseanza, A y B. El especialista piensa que el mtodo de enseanza A presenta mayor eficiencia que el mtodo B. Para comprobar esta sospecha se toma una muestra aleatorias de 10 alumnos que utilizaron el mtodo de enseanza A y de 10 con el mtodo B, obtenindose los siguientes rendimientos en una escala vigesimal : Mtodo A Mtodo B 14 12 15 13 13 13 11 14 10 13 17 14 18 14 16 12 15 15 05 14

a)

Estadsticamente. Cul de los mtodos es ms recomendable para el especialista que est interesado en: Mayor rendimiento Acadmico. Mayor nivel de confianza. Fundamente su respuesta.

b)

Cul es su conclusin respecto de la afirmacin del especialista.

13.

Se han tabulado el nivel de gestin de los directores de las instituciones educativas, obteniendo los siguientes resultados. Nivel de gestin Frecuencia 0-20 6 20-40 12 40-60 14 60-80 9 80-100 3

Con la finalidad de una capacitacin de los directores, el ministerio de educacin agrupara los directores segn sus niveles de gestin en tres

categoras: El 25% de los directores con menores niveles de gestin en la

CLETO DE LA TORRE DUEAS

95

categora A, el 30% de los que presentan mayores niveles de gestin en la categora C y el resto en la categora B. Cules son los limites para cada categora.

14.

En cierta evaluacin para optar por una beca, Juan Perez obtuvo una calificacin de 310 puntos en habilidad verbal y 218 puntos en habilidad numrica. Los parmetros de c/u son: Habilidad verbal:

245
s 24

s2

900

Habilidad numrica: x 150

a. En cul de las dos pruebas obtuvo mejor calificacin? b. En cul de las dos pruebas el grupo es ms homogneo?

15.

Una gran compaa llev a cabo un estudio para ubicar las variables que pudieran determinar el sueldo de un egresado universitario dos aos despus de haberse graduado en un rea Administrativa. Los datos recogidos se presentan en la siguiente tabla: (La columna del sueldo es en cientos de miles de soles.)

Edad Sexo E. Civil 1 2 3 4 5 6 7 8 9 10 11 12 13 14 24 25 26 27 27 27 27 25 23 24 26 29 25 31 F M M F M F M F M M F F M F C C S C D C S C S S C D C D

Sueldo 6,75 6,90 6,90 6,80 7,10 6,50 7,25 6,80 6,75 6,80 6,75 7,00 7,15 7,50

96

ESTADISTICA

15 16 17 18 19 20

26 24 26 28 25 29

M F F F M M

S D C S C C

6,20 7,40 6,70 6,95 6,95 7,10

a) Utilice la tcnica de estadstica descriptiva ms apropiada para analizar cada variable individualmente. Interprete lo obtenido. b) Realice diagramas de cajas que le ayuden a visualizar como influye cada una de las variables en el sueldo que gana el individuo.

CLETO DE LA TORRE DUEAS

97

CAPITULO IV DISTRIBUCIONES BIDIMENSIONALES

Si resumir la informacin de una variable es de por si interesante, en investigacin lo es mucho ms el poner de manifiesto la posible relacin entre dos de ellas. El anlisis de la relacin de dos variables, X e Y, depende del tipo de variables y Segn sean los tipos de cada una de ellas se usa tcnicas estadsticas diferentes.

4.1 CUALITATIVA-CUALITATIVA. Cuando las variables de estudio son discretas con poca cualitativas (categricas) o cuantitativas

modalidades, se suele presentar las observaciones de las

variables X e Y, mediante pares ordenados (xi, yi), esta forma de presentaciones se denomina tablas de contingencia. Las tablas de contingencia son de doble entrada organizada por filas y columnas y donde se presenta la distribucin de frecuencias conjuntas de las dos variables. Dada una variable bidimensional ( X, Y ), consideramos una muestra de tamao n en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores distintos, y1, . . , yl, obtenemos, por tanto, observaciones del tipo (xi, yj). La frecuencia absoluta de un valor (xi, yj) es el nmero de veces que dicho valor aparece en la muestra. Se representa por fij , se cumple
k l

fij
i 1 j 1

98

ESTADISTICA

La frecuencia relativa de un valor (xi , yj) es el cociente de la frecuencia absoluta fij entre el tamao de la muestra n, se representa por hij

hij

fij n ,

se cumple:

hij
i 1 j 1

Distribuciones marginales Nos indican el comportamiento aislado de cada una de las variables X e Y que dan lugar a una variable bidimensional. Frecuencia absoluta marginal de xi,

fi.

f i1

f i 2 f il
fi . n

fij
j 1

Frecuencia relativa marginal de xi,

hi .
Frecuencia absoluta marginal de yj,

f. j

f1 j

f 2 j f kj
f. j n

fij
i 1

Frecuencia relativa marginal de yj,

h. j

Una tabla de doble entrada de una variable bidimensional sigue la estructura que se presenta a continuacin, en la que tienen cabida las frecuencias marginales (representadas en la ltima fila y ltima columna). Puede ser de frecuencias absolutas o relativas.

CLETO DE LA TORRE DUEAS

99

Y X y1 x1 x2 .. xk n.j fk1 f.1 f11 F21 .. y2 f12 f22 .. fk2 f.2 ..... ..... ..... ..... ..... ..... yl f1l f2l .. fkl f.l ni. f1. f2. .. fk. n

Ejemplo 1: En una encuesta aplicada a los profesores egresados de una Universidad respecto a la comprensin lectora y hbitos de estudio se obtuvo los siguientes resultados.

Comprensin lectora Habito de estudio Bajo Intermedio. Alto. Interprete la informacin. Solucin.
Compresin Lectora Habitos de Estudio Bajo Intermedio Deficitario 12 80.0% 1 7.1% 3 27.3% 16 40.0% Dependiente 3 20.0% 13 92.9% 3 27.3% 19 47.5% Independiente 0 .0% 0 .0% 5 45.5% 5 12.5% Total 15 100% 14 100% 11 100% 40 100%

Deficitario 12 1 3

Dependiente 3 13 3

Independiente 0 0 5

Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje

Alto Total

Chi-cuadrado=32,805

P-valor=0,000

100

ESTADISTICA

Del 100% de estudiantes con el hbito de estudio bajo, 80% de estos presentan un deficitario nivel de comprensin lectora, en cambio del 100% de estudiantes con un hbito de estudio intermedio, 92.9% de ellos presenta una comprensin lectora dependiente y del 100% de estudiantes con un habito de estudio alto, el 45.5% presenta una comprensin lectora independiente. La informacin se muestra en el siguiente grafico:
Com prension lectora Deficitario Dependiente Independiente

100 90 80 70

Porcentaje

60 50 40 30 20 10 0 Bajo Intermedio Habitos de estudio Alto

4.2 CUALITATIVA-CUANTITATIVA. Supongamos que tenemos datos cuantitativos (numricos) para varias

cualitativas (categoras), por ejemplo en un experimento donde hacemos mediciones numricas en dos o ms grupos. En estos casos, lo que se realiza es un estudio descriptivo de la variable numrica en cada una de las muestras y se comparamos los resultados.

Ejemplo 2: Un investigador esta analizando el efecto que tiene en el rendimiento acadmico el uso de tres mtodos de enseanza, para tal efecto solicito a 30 docentes para que participen en el estudio. En el cuadro siguiente se muestra el rendimiento promedio de los alumnos de cada Docente.

CLETO DE LA TORRE DUEAS

101

Mtodo de enseanza Nuevo Clsico 8 9 10 13 14 5 12 11 9 7 Enfoque 15 16 13 16 17 16 14 13 16 17 Ambos 13 12 17 9 10 11 13 8 9 10

a) Calcule el rendimiento promedio para cada mtodo de enseanza. b) Cual de los mtodos, genera rendimientos ms homogneos. c) Represente la informacin mediante un grafico.

SOLUCION: Mtodo Ambos Clsico Mean 11.200 9.800 S 2.658 2.781 1.494 Variance 7.067 7.733 2.233 CV 23.74 28.38 9.77 Median Kurtosis 10.500 9.500 16.000 1.38 -0.53 -0.99

Nuevo enfoque 15.300

102

ESTADISTICA

Boxplot of Rendimiento vs Metodo


17.5

15.0

Rendimiento

12.5

10.0

7.5

5.0 Ambos Clasico Metodo Nuevo enfoque

4.3 CUANTITATIVA-CUANTITATIVA. Anlisis de dos variables cuantitativas y establecimiento de una relacin entre ellas. La forma ms sencilla de estudiar la posible asociacin entre estas variables es el diagrama de dispersin (Nube de puntos). Si reconocemos una tendencia, entonces el inters ahora ser el anlisis de regresin.

Media y varianza La informacin de las dos variables X e Y se puede resumir usando la media y la varianza como se muestra a continuacin:

Media de la variable X:

fi xi n
fi yi n

Media de la variable Y:

Varianza de la variable X:

CLETO DE LA TORRE DUEAS

103

2 x

fi xi2 n

Varianza de la variable Y:
2 sy

fi yi2 n

La covarianza Es una medida de la asociacin lineal existente entre dos variables. Resume la informacin contenida en el diagrama de dispersin. Presenta la siguiente expresin:

cov( x, y)

sxy

fi xi yi n

x. y

Si la covarianza est muy prxima a cero, no existe relacin entre las variables o si existe es marcadamente no lineal, si es positiva, hay asociacin lineal positiva, y si es negativa, hay asociacin lineal negativa. Sin embargo, como la covarianza depende de las unidades de medida de las variables, no nos permite cuantificar el grado de asociacin lineal ni comparar la asociacin existente entre distintos pares de variables. Para dar solucin a este problema se obtiene el coeficiente de correlacin.

Correlacin. Estudia la relacin o dependencia que existe entre dos variables que intervienen en una distribucin bidimensional.

Coeficiente de correlacin lineal. Es un nmero que mide el grado de dependencia entre las variables X e Y. Se mide mediante la siguiente frmula:

104

ESTADISTICA

s xy s x .s y
Si r = -1 r = 1 todos los valores de la variable bidimensional se encuentran situados sobre una recta. Si 1< r < 0 se dice que las variables X e Y estn tambin en dependencia aleatoria. La correlacin es negativa. Si 0 < r < 1 la correlacin es positiva. Las variables X e Y estn tambin en dependencia aleatoria.

Su valor est comprendido entre 1 y 1.

La correlacin es tanto ms fuerte a medida que r se aproxima a 1 1 y es tanto ms dbil a medida que se aproxima a 0.

4.3.1 Anlisis de Regresin. Regresin: conjunto de tcnicas que son usadas para establecer una relacin entre una variable cuantitativa llamada variable dependiente y una o ms variables independientes, llamadas predictoras. Estas tambin deberan ser cuantitativas, sin embargo algunas de ellas podran ser cualitativas.

Modelo de regresin. Ecuacin que representa la relacin entre las variables

Estimacin de la lnea de regresin usando Mnimos Cuadrados Minimizando el error cuadrtico medio:
n n

,
i 1
n

e
xi yi
i 1 n

2 i i 1
n n

( yi
xi yi
i 1

xi )2

, se tiene:

n n

i 1 n

S xy S xx

xi2 (
i 1 i 1

xi ) 2

CLETO DE LA TORRE DUEAS

105

x
, indica el cambio promedio en la variable de respuesta cuando

La pendiente

la variable predictora aumenta en una unidad adicional. El intercepto

, indica el valor promedio de la variable de respuesta cuando la

variable predictora vale 0. Sin embargo carece de interpretacin prctica si es irrazonable pensar que el rango de valores de x incluye a cero. A partir de la recta

podemos calcular los valores de y conocidos

los de x. La fiabilidad que podemos conceder a los clculos obtenidos viene dada por el coeficiente de correlacin: si r es muy pequeo no tiene sentido realizar ningn tipo de estimaciones. Si r es prximo a 1 1, las estimaciones realizadas estarn cerca de los valores reales. Si r = 1 o r = -1, las estimaciones realizadas coincidirn con los valores reales.

Ejemplo 3: Se aplic un test para medir el conocimiento (X) y la aplicacin (Y) de

estratgicas cognitivas en el proceso de enseanza en una escala de 0- 120. Los datos que se obtuvo fueron los siguientes:

106

ESTADISTICA

X 51.3 49.9 50 49.2 48.5 47.8 47.3 45.1 46.3 42.1 44.2 43.5 42.3 40.2 31.8 34 a) b) c)

Y 102.5 104.5 100.4 95.9 87 95 88.6 89.2 78.9 84.6 81.7 72.2 65.1 68.1 67.3 52.5

Trace un diagrama de dispersin. Ajuste una recta de regresin. Calcule la correlacin lineal e interprete dicho valor.

Solucin:
110

100

90 80

70

60

50 30 35 40 X 45 50

CLETO DE LA TORRE DUEAS

107

X 51.3 49.9 50 49.2 48.5 47.8 47.3 45.1 46.3 42.1 44.2 43.5 42.3 40.2 31.8 34 713.5

Y 102.5 104.5 100.4 95.9 87 95 88.6 89.2 78.9 84.6 81.7 72.2 65.1 68.1 67.3 52.5

X.Y 5258.25 5214.55 5020 4718.28 4219.5 4541 4190.78 4022.92 3653.07 3561.66 3611.14 3140.7 2753.73 2737.62 2140.14 1785

X2 2631.69 2490.01 2500 2420.64 2352.25 2284.84 2237.29 2034.01 2143.69 1772.41 1953.64 1892.25 1789.29 1616.04 1011.24 1156

Y2 10506.25 10920.25 10080.16 9196.81 7569 9025 7849.96 7956.64 6225.21 7157.16 6674.89 5212.84 4238.01 4637.61 4529.29 2756.25

1333.5 60568.34 32285.29 114535.33

xi n

713.5 16

44.59375 ;

y
s
2 x

yi n
xi2 n

1333.5 83.34375 ; 16
x
2

32285.29 44.593752 16
2

29.228

2 y

yi2 n
xi yi n

114535.33 83.343752 16

212.277 ;

sxy

x. y

60568.34 (44.59375).(83.34375) 68.9 16

108

ESTADISTICA

Recta de regresin
n n n

n
i 1

xi yi
n i 1 n

xi
i 1

yi

S xy S x2

n
i 1

xi2 (
i 1

xi )2

68.9 29.228

2.357

Y
r

sxy sx .s y

x
X

83.34375 2.357(44.59375)
21.76 2.357 X
68.9 29.228. 212.277 0.8747

21.76

Ejemplo 4: Las calificaciones de 40 alumnos en psicologa evolutiva y en estadstica han sido las siguientes: X calif. en psicol. 3 4 5 6 6 7 7 8 10 a) b) c) Y calif. en estad. 2 5 5 6 7 6 7 9 10 Nmero de alumnos. 4 6 12 4 5 4 2 1 2

Determina la media y varianza de X e Y. Calcule la covarianza de X e Y Calcule e interprete el coeficiente de correlaciones.

CLETO DE LA TORRE DUEAS

109

Solucin: Disponemos los datos de la siguiente forma: xi 3 4 5 6 6 7 7 8 10 yi 2 5 5 6 7 6 7 9 10 ni 4 6 12 4 5 4 2 1 2 40 nixi 12 24 60 24 30 28 14 8 20 220 niyi 8 30 60 24 35 24 14 9 20 224 nixi2 36 96 300 144 180 196 98 64 200 1314 niyi2 16 150 300 144 245 144 98 81 200 1378 nixiyi 24 120 300 144 210 168 98 72 200 1336

x
2 x

ni xi N

220 5,5 ; 40

ni yi N

224 5,6 40

ni xi2 N
2 sx

x
2,6

1314 (5,6) 2 40
1,61
2

32,85 30,25 2,6

sx

2 y

ni yi2 N

1378 (5,6) 2 40

3,09 ;

sy
s xy

3,09 1,75
ni xi yi N x. y 1336 (5,3).(5,6) 40 33,4 30,8 2,6

El coeficiente de correlacin: r
2,6 (1,61).(1,75)

s xy s x .s y

0,92

La correlacin es positiva, es decir, a medida que aumenta la nota de estadstica aumenta tambin la nota en psicologa. Su valor est prximo a 1 lo que indica que se trata de una correlacin fuerte, las estimaciones realizadas estn cerca de los valores reales.

110

ESTADISTICA

EJERCICIOS PROPUESTOS.

1.

De la evaluacin censal, desarrollado a los docentes de la ciudad de Cusco, se registro la informacin del conocimiento y aplicacin de metodologas de enseanzas de 10 Docentes.

Docentes 1 2 3 4 5 6 7 8 9 10

Conocimiento 16 14 18 15 13,5 17 15 10 15 14

Aplicacin. 16,5 14,5 17 15 14 18 17 10 16 15

a) b) c)

Calcula la covarianza, las varianzas y el coeficiente de correlacin. Existe correlacin entre las dos variables? Calcula la recta de regresin. Interprete adecuadamente los resultados?

2.

En una encuesta realizada a los alumnos de los centros educativos de la ciudad de Cusco, respecto al conocimiento de los docentes de las materias que regenta, proporciona la siguiente informacin:

Recuento El profesor de la asignatura conoce el curso Regular Bien Muy Bien 5 12 7 84 16 1 30 10 10 17 19 32 70 138 35

Total 24 101 50 68 243

Area

Comunicacion Matematica Biologia Educacion fisica

Total

CLETO DE LA TORRE DUEAS

111

a) b)

Analice la informacin de forma adecuada Interprete los resultados obtenidos y redacte algunas conclusiones.

3.

Un especialista en Educacin, desea analizar si la metodologa de los Docentes esta relacionado con su preparacin acadmica, para tal efecto aplica un test, los resultados se muestran a continuacin.

Preparacin Acadmica 50 75 50 75 50 58 66 83 83 66 50 75 75 75 75 Metodologa 50 66 75 25 66 58 66 41 83 41 75 75 41 66 66

a) b) c)

Trace el diagrama de dispersin Que tipo de relacin se observa? Ajuste una recta de regresin Calcula el coeficiente de correlacin. Interprete adecuadamente dicho resultado?

4.

La siguiente tabla muestra las distribuciones de frecuencias de las puntuaciones finales de 100 estudiantes en matemticas y fsica:

112

ESTADISTICA

Fsica 40-49 90-99 80-89 70-79 60-69 50-59 40-49 1 3 3 4 6 5 50-59

Matemticas 60-69 70-79 2 1 5 9 6 4 4 10 5 2 80-89 4 6 8 2 90-99 4 5 1

a) Nmero de alumnos que recibieron puntuacin entre 70 y 79 en matemticas y entre 80 y 89 en fsica. b) Porcentaje de estudiantes con puntuacin en matemticas inferior a 70. c) Porcentaje de que un estudiante obtenga 70 ms puntos en fsica y menos de 80 en matemticas. d) Porcentaje de estudiantes que aprob al menos una de las dos asignaturas, suponiendo 60 la puntuacin mnima para aprobar. e) Porcentaje de que un estudiante tenga aprobadas las dos asignaturas. f) Porcentaje de que un estudiante, que sabemos que tiene aprobada las matemticas, tenga aprobada tambin fsica. g) Porcentaje de estudiantes que tienen aprobada matemticas de entre los que tienen aprobada fsica. h) Sobre qu puntuacin en fsica tendr un estudiante del que sabemos que ha obtenido 86 puntos en matemticas. i) Da una medida de la exactitud del resultado obtenido en h).

5.

Se ha recogidos datos sobre la puntuaciones que en una encuesta dieron los alumnos de cuatro grupos a un profesor. La informacin se muestra en el

cuadro siguiente:

CLETO DE LA TORRE DUEAS

113

NOTA A 2 4 6 8 10 20 30 30 10 10 B 0 30 40 20 10

GRUPO C 10 20 40 10 20 D 30 30 20 20 0

a) En que grupo tuvo el profesor mejor calificacin media. b) En cual de los grupos hubo menos divergencia de opiniones. c) Interprete adecuadamente la tabla. 6. La tabla siguiente muestra el CI (coeficiente intelectual) de un grupo de personas y su capacidad lectora (HL). CI 109 138 86 153 156 40 70 126 68 99 112 138 103 127 63 a) Trace una diagrama de dispersin b) Ajuste los datos a una recta de regresin. c) Predecir la capacidad lectora de una persona con cociente intelectual de 120 d) Calcule la correlacin entre ambas variables. interprete dicho valor. HL 31,8 24,5 11,8 18,8 17,3 11,0 12,2 20,6 10,8 5,3 29,3 8,0 35,8 19,6 21,4

114

ESTADISTICA

CAPITULO V PROBABILIDADES

El Clculo de Probabilidades se ocupa de estudiar ciertos experimentos que se denominan aleatorios, cuya caracterstica fundamental es la incertidumbre del resultado, esto significa que es imposible predecir los resultados porque hay ms de uno posible. En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su calificativo probable, considerando probable a aquellos eventos en los que tenemos alto grado de creencia en su ocurrencia. En esta lnea probabilidad es un concepto asociado a una medida del azar. El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos eventos inciertos.

5.1 EXPERIMENTO ALEATORIO. Es una accin que da lugar a resultados identificables y se caracteriza por: Todos los posibles resultados son conocidos previamente. Repeticiones en situaciones anlogas pueden dar resultados diferentes. No se puede predecir el resultado del mismo antes de realizarlo, es decir, no se sabe cul de los posibles resultados aparecer al final. Los experimentos pueden ser aleatorios o deterministas. Aleatorio significa relativo a todo acontecimiento incierto, por depender de la suerte o del azar, mientras que los deterministas son aquellos que se caracterizan por el hecho de que las mismas causas producen los mismos efectos.

CLETO DE LA TORRE DUEAS

115

Espacio muestral. Es el conjunto de todos los resultados posibles del experimento y se denota por . A cada elemento de se denomina punto muestral w , es decir:

w / w es un punto muestral .
Evento o Suceso Aleatorio. Un evento aleatorio es un subconjunto del espacio muestral y se denota con letras maysculas. El evento seguro El evento imposible , es aquel que ocurre siempre al realizar el experimento. , es aquel que no ocurre nunca.

Los eventos elementales solo tienen un punto muestral. El evento complementario no estn en

Ac , esta dado por todo los puntos muestrales que

5.2 OPERACIONES DE EVENTOS. Unin de eventos: Dados dos eventos A y B de un mismo espacio muestral su unin se representa por A

B y es el evento que contiene los elementos que

estn en A o en B o en ambos. El evento dos eventos ocurre.

ocurre si al menos uno de los

Interseccin de eventos: Dados dos eventos A y B de un mismo espacio muestral su interseccin se representa por

y es el evento que contiene

los elementos que estn en A y B al mismo tiempo. El evento

ocurre cuando ambos eventos ocurren simultneamente.

Evento Complemento: El complemento de un evento A se representa por es el evento que contiene todos los elementos que no estn en A. El evento ocurre si A no ocurre.

Ac y

Ac

116

ESTADISTICA

5.3

DEFINICIN CLSICA DE PROBABILIDAD: La probabilidad de un suceso A se calcula como el nmero de casos favorables al suceso A, dividido por el nmero de casos posibles del experimento aleatorio.

P( A)

casos favorables casos posibles

5.4

DEFINICIN AXIOMTICA DE PROBABILIDAD. La probabilidad es una funcin que asigna a cada suceso A que varia entre 0 a 1. un nmero real

P: A i) ii) P(A)

y que verifica:

P( A) 1

1
P A P B

iii) Si A y B son sucesos incompatibles,

P A B
propiedades: iv) v) vi) vii)

Como consecuencia de estos tres axiomas, se verifican adems las siguientes

P( Ac ) 1 P A
P( ) 0
Si

B,

P( A)

P( B)

P( A \ B)

P( A) P( A

B) ,

A,B

viii) Si A1, A2, ...... , An son incompatibles dos a dos, entonces

P A1
ix) Si A, B

A2

...

An

P A1

P A2

... P An

son dos sucesos cualesquiera, entonces

P A B
x) Si A, B

P A

P B

P A B

son dos sucesos cualesquiera, entonces

CLETO DE LA TORRE DUEAS

117

P( A)
5.5

P A

Bc

P A

PROBABILIDAD CONDICIONADA. Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se conoce que otro evento B ha ocurrido. En este caso habr que redefinir el espacio muestral considerando solamente los elementos de B como posibles resultados.

La probabilidad de A condicionada a B, esta definido como la probabilidad de que ocurra A sabiendo que ha ocurrido B, y se define mediante:

P( A | B)
En consecuencia,

P( A B) , P(B) P( B)
B) =P( A) P( B ) A

0.

P(A

Independencia. Dos sucesos A, B se dicen independientes si:

P( A)
Es decir, se cumplir que:

P( A | B) , o bien P( B)

P( B | A)

P( A

B)

P( B).P( A)

Si A y B son independientes, entonces A y BC son independientes, AC y B son independientes, y AC y BC son independientes.

Observacin. Decimos que n sucesos (Ai, Aj),

A1, A2, An
P( Ai ) P( Aj ) si

son independientes si para cada par


i j , si para cada tro (Ai, Aj, Ak)

P( Ai

Aj )

P( Ai
Si i
j

Aj

Ak )

P( Ai ) P( Aj ) P( Ak )

k y as sucesivamente. En general,

118

ESTADISTICA

P( A1

A2

An)

P( A1) P( A2) P( An)

Teorema de la probabilidad compuesta. Dados n sucesos A1, A2, ......., An se verifica:

P( A1 A2 An) P( A1)P( A2 | A1)P( A3 | A1 A2)P( An | A1 A2 An 1)

5.6 TEOREMA DE LA PROBABILIDAD TOTAL Si suponemos que los eventos A1, A2, A3, ...., An, forman una particin de un espacio muestral su unin es . ; esto es, que los eventos Ai son mutuamente excluyentes y

E
An

A1

A2

A3

La particin A1, A2, ......, An , cumple con las siguientes propiedades: i)

A1 A2
i 1

j ( disjuntos dos a dos)

ii) iii)

Ai

P( Ai ) 0 ,

i 1,....n .

La probabilidad de un suceso B cualquiera es:

P( B)

P( A1 ) P( B

A1

) P( A2 ) P( B

A2

) ....... P( An ) P( B

An

CLETO DE LA TORRE DUEAS

119

P( B)
i 1

P( Ai) P( B | Ai)

5.7 TEOREMA DE BAYES El procedimiento que se utiliza para encontrar probabilidades posteriores, a partir de probabilidades previas, se llama regla Bayesiana. Las probabilidades a priori o previas se conocen antes de obtener informacin alguna del experimento en cuestin. Las probabilidades a posteriori se determinan despus de conocer los resultados del experimento. El teorema de Bayes consiste en un mtodo para encontrar la probabilidad de una causa especfica cuando se observa un efecto particular. Esto es, si el evento B ha ocurrido, Cul es la probabilidad de que fue generado por el evento A1 (que es una causa posible ) o por el A2 (otra causa posible)?.

Si A1, A2, ......., An es una particin del espacio muestral tal que

p( Ai ) 0 ,

i 1,....n , entonces para un suceso B cualquiera se verifica:

P( Ai | B)

P( Ai B) P( B)

P( Ai ) P( B | Ai )
n i

P( Ai ) P( B | Ai) 1

, i = 1, ...., n.

P( Ai | B)

P( Ai ) P( B | Ai) P( A1 ) P( B ) P( A2 ) P( B ) ....... P( An ) P( B ) A1 A2 An

120

ESTADISTICA

EJERCICIOS DESARROLLADOS.

1) Un director de una institucin educativa mixta, tiene 3 vacantes para el quinto ao de secundaria. a) Cual es el espacio muestral. b) Si el inters del director es matricular, exactamente dos estudiantes de sexo masculino Cual es la probabilidad asociado a este evento? c) Cual es la probabilidad de que el primer estudiante aceptado sea de sexo masculino y el ltimo de sexo femenino. d) Cual es la probabilidad de admitir por lo menos un estudiante de sexo masculino e) Cual es la probabilidad de admitir a lo ms 1 estudiantes de sexo femenino.

Solucin. a)

M1M2 F3 , M1M2 M3 , M1F2 F3 , M1F2 M3 , F1M2M3 , F1M2 F3 , F1F2M3 , F1F2 F3

b) Sea el evento A: Estudiantes de sexo masculino

M1M 2 F3 , M1F2 M3 , F1M 2 M3


p( A) n( A) n( ) 3 8

c) Sea el evento B: Primer estudiante aceptado de sexo masculino y el ltimo de sexo femenino.

M1M2 F3 , M1F2 F3
p(C ) n(C ) n( ) 2 8

d) Sea el evento D: Se admite por lo menos un estudiante de sexo masculino.

M1M2 F3 , M1M2 M3 , M1F2 F3 , M1F2 M3 , F1M2 M3 , F1M2 F3 , F1F2 M3


p( D) n( D ) n( ) 7 8

e) Sea el evento E: Se admite a lo ms un estudiante de sexo femenino.

M1M2 F3 , M1M2 M3 , M1F2 M3 , F1M2 M3


p( E ) n( E ) n( ) 4 8 1 2

CLETO DE LA TORRE DUEAS

121

2) La biblioteca municipal de una provincia compra libros de 3 editoriales: el 45% de los libros son compradas del editorial A resultando defectuoso el 1%, la editorial B suministra el 30% de los libros y de ellas es defectuoso el 2%. Las restantes son adquiridas de la editorial C, siendo defectuoso el 3% de las mismas. En un control de recepcin de libros se selecciona un libro al azar cual es la probabilidad: a) b) c) De que sea defectuosa. De que sea defectuosa y haya sido adquirido de la editorial B Calcular la probabilidad de que el libro haya sido adquirido de la editorial C, dado que es defectuoso.

Solucin
Defectuoso 1% 99% A 40% 2% Libro 30% 98% B 3% 30% C 97% Bueno Bueno Bueno Defectuoso

Defectuoso

Sean los eventos. A: Libro adquirido de la editorial A, B: Libro adquirido de la editorial B. C: Libro adquirido de la editorial C, D: Libro defectuoso, E: libro Bueno.

a) p( D)

p( A) p( D ) A

p( B) p( D ) B

p(C ) p( D ) C

p( D) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03)

b) p(B

D) =p( B) p( D ) B
p(B D) =0.3*(0.02)

122

ESTADISTICA

c) p(C | D)

p(C D) p( B)

p( A) p( D | A)

p(C ) p( D | C ) p( B) p( D | B) p(C ) p( D | C )

p(C | D)

0.3*(0.03) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03)

3) En un estante hay 7 libros de historia y 3 de matemticas. De los libros de historia, tres estn empastados de amarillo y el resto de rojo; mientras que de los libros de matemticas, uno est empastado en amarillo y dos en rojo. Suponiendo que del estante se elige un libro al azar, cul es la probabilidad de que sea de : a) Historia b) Color amarillo. c) matemticas y de color rojo d) matemticas o de color rojo d) Historia, dado que es de color amarillo.

Solucin. Historia Amarillo Rojo Total 3 4 7 Matemtica 1 2 3 4 6 10 Total

Sean los eventos: A: Libro de matemticas. B: Libro de historia. C: Color amarillo, D: Color rojo. a) p( B) b) p(C ) c) p( A
n( B ) n( ) n(C ) n( ) D) 7 10 6 10 0.7 0.6 2 10 0.4

n( A D ) n( )

CLETO DE LA TORRE DUEAS

123

d) p( A

D)

p( A)

p ( D)

p( A
p( A

D)
D)

n( A) n( )

n( D ) n( )

n( A D ) n( )
7 10 0.7

3 6 2 10 10 10

e) P ( B | C )

P( B C ) P (C )

n( B C ) n( ) n(C ) n( )

n( B C ) n(C )

4 7

4) En una ciudad se publican los peridicos A, B y C. Una encuesta reciente de lectores indica lo siguiente: 20% lee A, 16% lee B, 14% lee C, 8% lee A y B, 5% lee A y C, 2% lee A, B y C, y 4% lee B y C. Para un adulto escogido al azar, calcular la probabilidad de que: a) No lea ninguno de los peridicos. b) Lea exactamente uno de los peridicos. c) Lea A y B.

Solucin. Sean los eventos A: Lee el peridico A. B: Lee el peridico B. C: Lee el peridico C.
A

9% 6% B 3% 2% 2% 7% 6%

a) p A

p(U ) p A B C
c

p A

100% (9 6 6 3 2 2 7)% 75%

124

ESTADISTICA

b) p(Lea exactamente un peridico)=9%+6%+7%=22% c) p A

6%

5)

En una Universidad, se conoce a travs de una muestra, que en los estudiantes varones: 50 son de aspiraciones elevadas y 20 de aspiraciones modestas. Asimismo, en los estudiantes 60 son de aspiraciones elevadas y 30 de aspiraciones modestas. Si se selecciona seleccionar: Dos estudiantes de aspiraciones elevadas? Un estudiante con aspiraciones elevadas y uno de aspiraciones modestas. El primer seleccionado sea de sexo masculino y el segundo de sexo femenino. dos estudiantes Cual es la probabilidad de

Solucin. Masculino Aspiraciones elevadas Aspiraciones modestas Total 50 20 70 Femenino 60 30 90 Total 110 50 160

Sean los eventos A: Estudiante se sexo masculino. B: Estudiante se sexo femenino. C: Estudiante de aspiraciones elevadas. D: Estudiante de aspiraciones modestas. a) p(C1

C2 )

110 C2 160 C2

b) p(Uno aspiraciones elevadas y uno modestas)

p(C1

D2 ) p(D1
110 C150 * C1 160 C2

C2 )

110 C1 * C150 160 C2

c) p( A1

B2 )

C170 * C190 160 C2

CLETO DE LA TORRE DUEAS

125

126

ESTADISTICA

Problemas Propuestos.

1)

Calcular la probabilidad de que al lanzar un dado se obtenga un nmero que sea mltiplo de dos o tres.

2)

Si se lanzan dos dados, encontrar la probabilidad de obtener un 5 en el primero y 3 en el segundo.

3)

En una encuesta entre alumnos de maestra en administracin se obtuvieron los datos siguientes acerca de el principal motivo del alumno para solicitar su ingreso a la escuela donde est matriculado.

Motivo Tipo est. Tiempo completo Tiempo parcial Totales

Calidad de la escuela 421 400 821

Costo o comodidad 393 593 986

Otros Totales 76 46 122 890 1039 1929

a. Si un alumno es de tiempo completo. Cul es la probabilidad de que la calidad de la institucin sea el principal motivo para elegir su escuela?. b. Si un alumno es de tiempo parcial. Cul es la probabilidad de que la calidad de la escuela sea el motivo para elegirla? c. Sea A el evento en que el alumno es de tiempo completo y sea B el evento que el alumno menciona que la calidad de la escuela es el 1 er motivo de su solicitud. Son independientes los eventos A y B?. Justifique su respuesta.

4)

Antes de que un libro sea lanzado al mercado se recogen las reacciones de un grupo de personas a las que se les permite leer el libro previamente. Posteriormente a las ventas del libro se les asigna el calificativo de altas, moderadas o bajas de acuerdo a las noemas del mercado. Los resultados se muestran en la siguiente tabla:

CLETO DE LA TORRE DUEAS

127

Reacciones Ventas Altas Moderadas Bajas

Favorables

Neutral

Desfavorables

173 88 42

101 211 113

61 70 141

a) Cul es la probabilidad de que las ventas sean altas? b) Cul es la probabilidad de que las reacciones sean favorables? c) Si la reaccin del grupo es favorable?. Cul es la probabilidad de que las ventas sean altas? d) Si las ventas son bajas Cual es la probabilidad de que las opiniones hayan sido desfavorables? e) Cul es la probabilidad de que las opiniones sean favorables y las ventas sean altas? f) Cul es la probabilidad de que las ventas sean favorables o desfavorables?. Son esos sucesos mutuamente excluyentes? Justifique g) Son los sucesos Opiniones desfavorables y Ventas Bajas independientes? Justifique.

5)

Una prueba de seleccin consta de dos preguntas tipo test. Se consideran aptos aquellos individuos que contesten correctamente a la segunda pregunta, independientemente de cmo hayan contestado a la primera. La primera pregunta tiene cuatro posibles respuestas. A los individuos que contestan correctamente a la primera pregunta, se les plantea una segunda pregunta con dos posibles respuestas, mientras que a quienes fallan la primera pregunta les proponen una segunda cuestin con ocho posibles respuestas. Si un individuo que se presenta a la prueba y contesta a las preguntas al azar, a) cul es la probabilidad de que sea considerado apto? b) cul es la probabilidad de que conteste correctamente a la primera pregunta y mal a la segunda?

6) En un instituto hay 320 alumnos de primer curso, 280 de segundo y 200 de tercero. Al final de curso han suspendido 60 alumnos de primero, 48 de segundo y 72 de

128

ESTADISTICA

tercero. Hallar la probabilidad de que al elegir un alumno al azar y resultando que est suspendido, sea de 1, de 2 o de 3.

7) En una clase de 30 alumnos hay 18 que han aprobado matemticas, 16 que han aprobado ingls y 6 que no han aprobado ninguna de las dos. Elegimos al azar un alumno de esa clase: a) Cul es la probabilidad de que haya aprobado ingls y matemticas? b) Sabiendo que ha aprobado matemticas, cul es la probabilidad de que haya aprobado ingls? c) Son independientes los sucesos "Aprobar matemticas" y "Aprobar ingls"?

8) La probabilidad de que un alumno estudie para su examen es 0.75. Si estudia, la probabilidad de que apruebe el examen es 0.80. Si el alumno no estudia la probabilidad de que no apruebe el examen es 0.90. a. Cual es la probabilidad de que el alumno apruebe el examen? b. Si el alumno aprueba el examen Cual es la probabilidad de que haya estudiado?

9) Una direccin departamental de educacin recibe 25 solicitudes para una vacante de director de una UGEL. Entre los solicitantes 10 son hombres. Diecisiete de ellos acreditan titulo de maestra y ocho son licenciados. Adems se sabe que 7 aspirantes son mujeres que tienen grado de magster. Cual es la probabilidad de que sea seleccionado una mujer o una persona con titulo de licenciado? Si el postulante seleccionado es magster Cual es la probabilidad de que sea varn?

10) 200 alumnos de la Facultad de Educacin estn distribuidos de acuerdo a su sexo y lugar de procedencia de la siguiente forma: 70 son mujeres, 110 son de Cusco y 30 son mujeres y de provincias. Si se elige dos alumnos al azar calcular la probabilidad de que: Ambos sean mujeres y de Cusco. Al menos uno de los dos escogidos sea hombre.

CLETO DE LA TORRE DUEAS

129

11) En la entrada de una facultad hay tres fotocopiadoras, A, B y C cuyos porcentajes de fallo son 3%, 5% y 4% respectivamente. Un alumno entra en la facultad y, como las tres fotocopiadoras estn libres, elige una al azar, para realizar su fotocopia. Al llegar a clase observa que la fotocopia es defectuosa. Cul es la probabilidad de que fuera hecha en la mquina B?. 12) En una clase, el 20% de los chicos y el 5% de las chicas juega al tenis. El 60% de la clase son chicos. Se eligi al azar un estudiante de la clase y result ser de los que jugaban al tenis. Cul es la probabilidad de que el estudiante elegido sea chico?. 13) En una asignatura de una carrera el 10% de los alumnos reciben una nota final de sobresaliente. El 70% de los estudiantes que la reciben ya la haban obtenido en un examen realizado a mitad de curso. Adems, el 10% de los alumnos que no reciben sobresaliente al final de curso lo haban obtenido en el examen parcial. Qu porcentaje de alumnos obtiene sobresaliente en el examen parcial?. Cul es la probabilidad de que un alumno que recibe un sobresaliente en el parcial obtenga esa calificacin en el examen final?

130

ESTADISTICA

CAPITULO VI VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD

6.1 VARIABLE ALEATORIA. Definicin.- Una variable aleatoria (v.a) X es cualquier funcin, que transforma cada elemento del espacio muestral , en un nmero real.

X:

X
Al conjunto de posibles valores de X se le llama rango de X (Rx) Si Rx es finito o enumerable (rango discreto), entonces X es una v.a Discreta. Si Rx no es enumerable (rango continuo), entonces X es una v.a Continua.

Funcin de Probabilidad.- Si X es una v.a discreta, la funcin de probabilidad de X viene dada por:

PX x
tal que

P X

/X

PX ( x) 1
x Rx

CLETO DE LA TORRE DUEAS

131

Funcin de densidad.- Si X es una v.a continua, la funcin de densidad de X es


b

una aplicacin

fX : X

0,

tal que

P a

b
a

f X ( x)dx

,tal

que

f X ( x)dx 1

Funcin de distribucin.- La funcin de distribucin de una v.a X esta dada por:

FX ( x)

P( X

x)

P(

/ X( )

x)

Propiedades. F es continua por la derecha y es creciente Si X es una v.a discreta , entonces

P a

F b

F a

P X

Si X es una v.a continua , entonces

P a
F ' ( x)

F b
f ( x)

F a

Si X es una v.a continua , entonces

dF ( x) dx

limx

FX ( x) 0 y lim x

FX ( x) 1

6.2 ESPERANZA Y VARIANZA. Esperanza La esperanza o media de una variable aleatoria X, denotada por

E( X )

se define segn sea la variable discreta o continua, mediante:

x.P X E X
x Rx

x , si X es discreta

x. f ( x)dx, si X es continua
x Rx

Propiedades. El valor esperado de una constante es dicha constante

132

ESTADISTICA

E a bX

a bE X

Varianza La varianza de una variable aleatoria X cuya media o esperanza es como


X

, se define

V X

2 X

E X

2 X

E X

E X

E X

E2 X

Propiedades. La raz cuadrada de la varianza se llama desviacin estndar.


2 X

E X

2 X

V aX b

a2V ( X )

Desigualdad de Chebyshev. Si X es una variable aleatoria, entonces para cualquier

se cumple

P X

1 k2

Ejemplo 1: Sea X la variable aleatoria definida como la suma de los valores que aparecen al lanzar dos dados.

a) Determine la distribucin de probabilidad. b) Calcule la probabilidad P(5<X<8) c) La media y su varianza.

CLETO DE LA TORRE DUEAS

133

Solucin. a) Resultados en Resultados en el segundo dado el primer dado 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12

X: Suma de los valores de los dos dados Rx P(X) 2 3 4 5 6 7 8 9 10 11 12

1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36

b) c)

p(5
Media

8)

p(6)

p(7) 5/ 36 6 / 36 11/ 36
x , si X es discreta
7 6 36 8 5 36 9 4 36 10 3 36 11 2 36 12 1 36

E X
x Rx

x.P X
3 36 5 4 36 6 5 36

E X
E X

1 36 252 36

2 36

Varianza.
2 X

E X
1 36 1974 36 22

E2 X
32 2 36 42 3 36 52 4 36 62 5 36 72 6 36 82 5 36 92 4 36 102 3 36 112 2 36 122 1 36

E X2
E X2

2 X

E X

1974 36

252 36

134

ESTADISTICA

6.3 DISTRIBUCIONES DE PROBABILIDAD. Existen otras variables cuyas funciones de probabilidad o densidad resultan ser modelos de mucha utilidad para una serie de aplicaciones. Se cita brevemente algunos de los modelos de mayor importancia.

6.3.1

Distribuciones discretas.

Un experimento de Bernoulli, es un experimento aleatorio con solo dos posibles resultados: xito y Fracaso. Sea p = P (xito).

Distribucin Binomial. La distribucin binomial aparece cuando se dan las condiciones siguientes: -Tenemos un experimento aleatorio simple, con una situacin dicotmica, es decir xito y Fracaso.

- Repetimos este experimento simple n veces de manera independiente.

X = Nmero de xitos en n experimentos independientes de Bernoulli. Funcin de Probabilidad:

PX x
Valor esperado: Notacin: X

n x Cx p 1 p

n x

, si x

0,1,2,..., n

0
X

, en otro caso.
2 X

np. Varianza:

np 1 p .

B(n, p).

Distribucin de Pascal o Binomial Negativa. Notacin: X

BN(r, p).

X = Nmero de ensayos (experimentos independientes de Bernoulli) hasta conseguir el r-simo xito. Funcin de Probabilidad:

PX x

Crx 11 1 p 0

x r

pr

, si x r , r 1, r 2,... , en otro caso.

CLETO DE LA TORRE DUEAS

135

Valor esperado:

r . Varianza: p

2 X

r1 p p
2

Nota: Si r = 1, X se dice que es una variable aleatoria con distribucin geomtrica de parmetro p, y se le denota por X G(p).

Distribucin Hipergeomtrica. Notacin: X

H(N, M, n).

Considrese una poblacin de N elementos, M de los cuales son de un tipo A, y supongamos se extraen sin reemplazo una muestra de n elementos de esta poblacin. Entonces:

X = Nmero de elementos de tipo A en la muestra. Funcin de Probabilidad:


M N M Cx Cn x

PX x

N Cn

, si x

0,1,2,..., n

0
Valor esperado: Notas: 1. En PX se esta usando la convencin que
X

, en otro caso.
2 X

M . Varianza: N

M M 1 N N

N n . N 1

b Ca

0,

si a > b.

2. Si la eleccin de la muestra fuera con reemplazo, entonces

X B n, p

M . N

Distribucin de Poisson. La distribucin de Poisson aparece en situaciones en las que se cuenta el nmero de apariciones de un determinado suceso o bien en un intervalo de tiempo dado (como el nmero de partculas emitidas en un segundo por un material radioactivo, o el nmero de pacientes que llegan a un servicio en un intervalo de tiempo dado) o bien en un recinto fsico (como el nmero de fallos en un metro de alambre de hierro producido.

136

ESTADISTICA

X = Nmero de eventos en 0, t .

Funcin de Probabilidad:
x

PX x

e x! 0
2 X

, si x

0,1,2,...

, en otro caso.

Valor esperado:

. Varianza:

6.3.2

Distribuciones continuas. U a, b .

Distribucin Uniforme. Notacin: X

Esta distribucin se da cuando la variable aleatoria X puede tomar indistintamente cualquier valor en el intervalo a, b . Funcin de densidad:

1 fX x b a

, si x

a, b

0 , en otro caso.
Valor esperado:

a b . Varianza: 2
N( ,
2

2 X

b a2 . 12

Distribucin Normal. Notacin: X Funcin de densidad:

).

fX x
Valor esperado: Nota: Cuando
X

1 2
2 X

e
2

. Varianza:
2

=0y

= 1, a X se le denota por Z y se le llama una variable N (0, 1). Toda v.a.

aleatoria con distribucin normal estndar; vale decir, Z normal X

N( , 2) puede convertirse con una v.a. normal estndar

(estandarizarse) a travs de la transformacin:

CLETO DE LA TORRE DUEAS

137

1. Teorema del limite central (TLC).

Si

X1 , X 2 ,..., X n son n v.a.s


y 30) se

independientes, donde cada Xi tiene la misma distribucin de valor esperado varianza


2

, entonces para n suficientemente grande (en la prctica n

cumple que aproximadamente

i 1

Xi n n

X / n

N (0, 1)
B (n, p) y n es

2. Aproximacin de la Binomial por la Normal. Si X suficientemente grande, entonces aproximadamente:

X np np 1 p

N (0, 1).

Aqu, para el clculo de probabilidades, se recomienda utilizar la llamada correccin por continuidad: Si a aproximadamente: b son dos nmeros naturales, entonces

Pa

P a

1 2

1 2

Fz

1 2

np

np 1 p

Fz

1 2

np

np 1 p

6.4

OTRAS DISTRIBUCIONES CONTINUAS IMPORTANTES DISTRIBUCION CHI-CUADRADO. Una v.a. X tiene distribucin chi-cuadrado con n grados de libertad, y se le denota por

(n) .

PROPOSICION. 1. Si Z N (0, 1), entonces

Z2

(1)

138

ESTADISTICA

2. Propiedad reproductiva. Si independientes con

2 1

2 2

...

2 k

son k variables aleatorias de respectivamente

distribuciones

chi-cuadrado

n1 , n2 ,..., nk

grados de libertad, entonces


k 2 i 1 2 i

Es tambin una v.a. con distribucin chi-cuadrado de de libertad. 3. Si

k n i 1 i grados

X1 , X 2 ,..., X n

es una m.a de X

N ( , 2), entonces

n 1 S2
2

(n-1)

DISTRIBUCION T DE STUDENT. Una v.a. X tiene distribucin t de Student con n grados de libertad, y se le denota por

X t(n) . X t(n) . Si n es grande, entonces aproximadamente X


N (0, 1) y
2

PROPOSICION. 1. Sea 2. Si Z N (0, 1).

(n) son v.a independientes, entonces

Z
2

t(n). En particular, dada una m.a.

X1 , X 2 ,..., X n

de X,

extrada de una poblacin N ( , 2), se cumple que:

X t (n -1) . S/ n

CLETO DE LA TORRE DUEAS

139

DISTRIBUCION F DE FISHER. Una v.a. X tiene distribucin F de Fisher con n grados de libertad en el numerador y m grados de libertad en el denominador, y se le denota por

X F (n, m) .
PROPOSICION. 1. Si

X F (n, m)
F (m, n).

entonces:

1 X
2 1

2. Si

(n) y

2 2

(m) son v.as independientes, entonces

2 1 2 2

/n F (m, n) . /m

En particular, si

X1 , X 2 ,..., X n

es una v.a. de N ( 2,

X
2 2 ),

N ( 1,

2 1 ),

Y1 , Y2 ,...,Ym

una m.a de una v.a. Y

donde X e Y son

independientes, entonces

S12 2 S2

2 2 2 1

F (n -1, m - 1)

2 2 Siendo S1 y S 2 las varianzas muestrales asociadas a las poblaciones

estadsticas determinadas por X e Y, respectivamente.

Nota: La distribucin normal estndar, t de Student, chi-cuadrado y F de Fisher poseen todas tablas en la que se tabulan algunos valores de su funcin de distribucin.

140

ESTADISTICA

EJERCICIOS DESARROLLADOS

1.

Una prueba de inteligencia est compuesta por 10 preguntas, cada una de las cuales tiene 4 respuestas y solo una de ellas correcta. Un alumno tiene prisa por acabar la prueba y decide contestar aleatoriamente. Se pide a) Probabilidad de acertar exactamente 4 preguntas b) Probabilidad de no acertar ninguna c) Probabilidad de acertar todas d) Probabilidad de acertar al menos 8 e) Probabilidad de acertar a los sumo 6 f) Media y varianza

Solucin Consideremos los sucesos A = Contestar bien P (A) = 0.25


A = No contestar bien P ( A ) = 0.75

Se trata de una distribucin Binomial de parmetros B (10, 0.25 ) Sea X la variable aleatoria que representa el nmero de preguntas contestadas correctamente

a) P(acertar 4) = P X

10 (0.25)4 (0.75)6 4 0

0.1460

b) P (no acertar ninguna) = P X

10 (0.25)0 (0.75)10 0 0

0.0563

c) P(acertar todas) = P X

10

10 (0.25)10 (0.75)0 10

d) P(acertar al menos 8) = P X

PX

PX

PX

10

10 (0.25)8 (0.75)2 8

10 (0.25)9 (0.75) 0 9

0.005

e) P( acertar a lo sumo 3) = P X

PX

PX

PX

PX

CLETO DE LA TORRE DUEAS

141

10 (0.25)0 (0.75)10 0
f) Media y Varianza
np 10 (0.25)
2

10 (0.25)1 (0.75)9 1

10 (0.25)2 (0.75)8 2

10 (0.25)3 (0.75)7 3

0.7759

2.5

np(1 p) 10(0.25)(0.75) 1.875

2.

La probabilidad de que un estudiante obtenga el ttulo de licenciado en Geografa e Historia es de 0.3. Halla la probabilidad de que de un grupo de siete estudiantes matriculados en primer curso. a) Ninguno de los 7 finalice la carrera b) Finalicen todos la carrera c) Al menos 2 acaben la carrera d) Halla la media y la desviacin tpica

Solucin Consideremos los sucesos: A = Finalizar la carrera P(A) = 0.3


A = No finalizar la carrera P ( A ) = 0.7

Por tanto se trata de una distribucin Binomial de parmetros B (7, 0.3) Sea X la variable aleatoria que representa el nmero de estudiantes que obtienen el ttulo de licenciado en Geografa e Historia a)

PX

7 (0.3)0 (0.7)7 0 7 (0.3)7 (0.7)0 7 1 PX 1

0.0824

b)

PX

0.0002 7 (0.3)0 (0.7)7 0 7 (0.3)1 (0.7)6 1

c) P X

1 PX

PX

0.6705

Media y desviacin tpica


np 7(0.3) 2.1

np(1 p)

7(0.3)(0.7)

1.21

142

ESTADISTICA

3) El peso medio de los estudiantes de un colegio es 60 kg y la desviacin tpica es 6 kg. Suponiendo que los pesos estn distribuidos normalmente. a) Cual es la probabilidad de que un estudiante pese menos de 64k g? b) Cual es la probabilidad de que un estudiante pese 57 kg o ms? c) Cual es la probabilidad de que un estudiante pese ms de 63 Kg? d) Cual es la probabilidad de que un estudiante pese entre 57 a 65 kg? e) Cual es la probabilidad de que un estudiante pese menos de 50 Kg? f) Cual es la probabilidad de que un estudiante pese entre 64 a 70 kg? g) Si los estudiantes son 200, .Cuantos cabe esperar que pesen ms de 57 kg y menos de 64k g?. Solucin. X: Peso de los trabajadores.
60 (Media poblacional)
6

(Desviacin)
64) P( X 64 ) P( Z 64 60 ) 6 P( Z 0.67)

a) P( X

(0.67)

z=0.67

0.5

(0.67) 0.5 0.24857=0.74857=74.857%

b) P( X

57)

P(

57

P( Z

57 60 ) 6

P( Z

0.5)

(0.5) 0.5

(0.5)

z= 0.5

0.19146+0.5=0.69146=69.146%

CLETO DE LA TORRE DUEAS

143

c) P( X

63)

P(

63

P( Z

63 60 ) 6

P( Z

0.5)

0.5

(0.5)

(0.5)

z=0.5

0.5 0.19146=0.30854=30.854%

d) P(57

65)
X

P(

57

65

P(

57 60 6

65 60 ) 6

P( 0.50

0.83)

(0.50)

(0.83) 0.19146+0.29373=0.48519=48.519%

(0.5)

(0.83)

e) P( X

50)

P(

50

P( Z

50 60 ) 6

(0.167)

0.5

(0.167) 0.5 0.0675=0.4325=43.25%


X 70 ) P( 64 60 6 Z 70 60 ) 6

f) P(64

70)

P(

64

P(0.67

1.67)

(1.67)

(0.67) 0.45254-0.24857=0.20397=20.397%

z= 0.167

z= 0.50

z=0.83

P( Z

0.167)

144

ESTADISTICA

z=0.67 z=1.67
(0.67) (1.67)

g) P(57

64)

P(

57

64

P( 0.5

0.67)

(0.5)

(0.67) 0.19146+0.24857=0.44003=44.003%

Cabe esperar el 44.003% de estudiantes, es decir 0.44003* 200 88

P(

57 60 6

64 60 ) 6

CLETO DE LA TORRE DUEAS

145

EJERCICIOS PROPUESTOS. 1) En un grupo de 10 alumnos de un centro educativo se ha comprobado que cada uno de ellos falta a clase el 5% de los das. Calcula la probabilidad de que en un da determinado. . a) no se registre ninguna ausencia. b) falten a clase ms de 5 alumnos. c) no asista a clase ningn alumno. d) falte a clase un nico alumno. e) falten a clase menos de 3 alumnos.

2) La probabilidad de que un estudiante obtenga el grado de magster es de 0.3. Calcular la probabilidad de que de un grupo de siete estudiantes matriculados. . . a) los siete obtenga el grado de magster. b) al menos dos obtengan el grado.

3) La probabilidad de que un estudiante de ingeniera fracase en sus estudios es de 0.7. a) De un grupo de 7 estudiantes de ingeniera, calcula la probabilidad de que los 7 fracasen en sus estudios. b) En el mismo caso que en el apartado anterior, calcula la probabilidad de que al menos 2 acaben la carrera. c) Se el grupo se aumenta a 40 estudiantes, calcular la probabilidad de que fracasen entre 20 y 30 de ellos

4) Un examen tipo test tiene 100 preguntas y cada pregunta 4 respuestas diferentes, de las que slo una es correcta. a) Calcular la probabilidad de que un estudiante que responde al azar acierte ms de 20 preguntas. b) Calcular la probabilidad de que de las 20 primeras preguntas acierte a lo sumo 5) Las puntuaciones de un test se distribuye normalmente con media 80 y varianza 49 Cul es la probabilidad de obtener en el test una puntuacin entre 79 y 88 puntos ?.

146

ESTADISTICA

6) Se llama cociente intelectual (C.I.) al cociente entre la edad mental y la edad real. Se sabe que la distribucin del C.I. se distribuye normalmente con media 0.95 y desviacin tpica 0.22. En una poblacin con 2600 personas se desea saber: a) Cuantas tendran un C.I. superior a 1.3? b) Cuantas tendran un C.I. inferior a 0.07? c) Cuantas tendran un C.I. entre 0.8 y 1.15? 7) Tras realizar un test de cultura general entre los habitantes de cierta poblacin, se observa que las puntuaciones siguen una distribucin normal, de media 68 y desviacin tpica 18. Se desea clasificar a los habitantes en tres grupos (de baja cultura general, de cultura general aceptable y de cultura general excelente), de manera que el primer grupo abarque un 20% de la poblacin, el segundo un 65% y el tercero el 15% restante. .Cuales son las puntuaciones que marcan el paso de un grupo a otro? 8) Se ha aplicado un test de fluidez verbal a 500 alumnos de la UNSAAC. Se supone que las puntuaciones obtenidas se distribuyen segn una normal de media 80 y desviacin tpica 12. Se pide: a) .Que puntuacin separa el 25% de los alumnos con menos fluidez verbal? b) .A partir de que puntuacin se encuentra el 25% de los alumnos con mayor fluidez verbal? 9) El peso medio de 500 estudiantes de cierta universidad es 72 Kg y la desviacin tpica es 7. Si los pesos se distribuyen segn una normal, halla: a) El nmero de estudiantes que pesan entre 68 y 75 Kg. b) El nmero de estudiantes que pesan ms de 72 Kg. c) El nmero de estudiantes que pesan menos de 62 Kg. 10) En una clase de Ingeniera Tcnica se sabe que las calificaciones de Estadstica se distribuyen segn una N(4, 2). Si el profesor desea aprobar al 70% de la clase, a partir de qu nota se debe considerar aprobado el examen? 11) La nota media de un examen es 5,25 y la desviacin tpica 2. El 10% de la clase recibir la calificacin de sobresaliente. Cul es la nota mnima para optar a l? Se eligen cinco alumnos al azar, cul es la probabilidad de que dos de ellos hayan Obtenido un sobresaliente?

CLETO DE LA TORRE DUEAS

147

APENDICE TABLA NORMAL ESTNDAR


8,5Z 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 0 0 0.03983 0.07926 0.11781 0.15542 0.19146 0.22575 0.25804 0.28814 0.31594 0.34134 0.36433 0.38493 0.4032 0.41924 0.43319 0.4452 0.45543 0.46407 0.47128 0.47725 0.48214 0.4861 0.48928 0.4918 0.49379 0.49534 0.49653 0.49744 0.49813 0.49865 0.49903 0.49931 0.49952 0.49956 0.49977 0.49984 0.49989 0.49993 0.49995 0.01 0.00399 0.04395 0.08617 0.12172 0.1591 0.19497 0.22907 0.26115 0.29103 0.31859 0.34375 0.3665 0.38686 0.4049 0.42073 0.43448 0.4463 0.45637 0.46485 0.47193 0.47778 0.48257 0.48645 0.48956 0.49202 0.49396 0.49547 0.49664 0.49752 0.49819 0.49869 0.49906 0.49934 0.49953 0.49968 0.49978 0.49985 0.4999 0.49993 0.49995 0.02 0.00798 0.04776 0.08706 0.12552 0.16276 0.19847 0.23237 0.26424 0.29389 0.32124 0.34614 0.36864 0.38877 0.40658 0.4222 0.43574 0.44738 0.45728 0.46562 0.47257 0.47831 0.48299 0.48679 0.48983 0.49224 0.49413 0.4956 0.49674 0.4976 0.49825 0.49874 0.4991 0.49936 0.49955 0.49969 0.49978 0.49985 0.4999 0.49993 0.49996 0.03 0.01197 0.05172 0.09095 0.1293 0.1664 0.20194 0.23565 0.2673 0.29373 0.32381 0.34849 0.37076 0.39065 0.40824 0.42364 0.43699 0.44845 0.45818 0.46637 0.4732 0.47882 0.48341 0.48713 0.49001 0.49245 0.4943 0.49573 0.49683 0.49767 0.4983 0.49878 0.49913 0.49938 0.49957 0.4997 0.49979 0.49986 0.4999 0.49994 0.49996 0.04 0.01595 0.05567 0.09483 0.13307 0.17003 0.2054 0.23891 0.27035 0.29955 0.32639 0.35083 0.37286 0.39251 0.40988 0.42507 0.43822 0.4495 0.45907 0.46712 0.47381 0.47932 0.48382 0.48745 0.49036 0.49266 0.49446 0.49585 0.49693 0.49774 0.49836 0.49882 0.49916 0.4994 0.49958 0.49971 0.4998 0.49986 0.49991 0.49994 0.49996 0.05 0.01994 0.05962 0.09871 0.13683 0.17364 0.20884 0.24215 0.27337 0.30234 0.32894 0.35314 0.37923 0.39435 0.41149 0.42647 0.43943 0.45053 0.45994 0.46784 0.47441 0.47982 0.48422 0.48778 0.49061 0.49286 0.49461 0.49597 0.49702 0.49781 0.49841 0.49886 0.49918 0.49942 0.4996 0.49972 0.49981 0.49987 0.49991 0.49994 0.49996 0.06 0.02392 0.06356 0.10257 0.14058 0.17724 0.21226 0.24537 0.27637 0.3051 0.33147 0.35543 0.37698 0.39616 0.41308 0.42785 0.44062 0.45154 0.46079 0.46856 0.475 0.4803 0.48461 0.48809 0.49086 0.49305 0.49477 0.49609 0.49711 0.49788 0.49846 0.49889 0.49921 0.49944 0.49961 0.49973 0.49981 0.49987 0.49992 0.49994 0.49996 0.07 0.0279 0.0675 0.10642 0.14431 0.18082 0.21566 0.24857 0.27935 0.30785 0.33398 0.35769 0.379 0.39796 0.41466 0.42922 0.44179 0.45254 0.46164 0.46926 0.47558 0.48077 0.485 0.4884 0.4911 0.49324 0.49491 0.49621 0.4972 0.49795 0.49851 0.49893 0.49924 0.49946 0.49962 0.49974 0.49982 0.49988 0.49992 0.49995 0.49996 0.08 0.03188 0.07124 0.11026 0.14803 0.18439 0.21904 0.25175 0.2823 0.31057 0.33646 0.35993 0.381 0.39973 0.41621 0.43056 0.44295 0.45352 0.46246 0.46995 0.47615 0.48124 0.48537 0.4887 0.49134 0.49343 0.49506 0.49632 0.49728 0.49801 0.49856 0.49897 0.49926 0.49948 0.49964 0.49975 0.49983 0.49988 0.49992 0.49995 0.49997 0.09 0.03586 0.07534 0.11409 0.15173 0.18793 0.2224 0.2549 0.28524 0.31327 0.33891 0.36214 0.38298 0.40147 0.41774 0.43189 0.44408 0.45449 0.46327 0.47062 0.4767 0.48169 0.48574 0.48899 0.49158 0.49361 0.4952 0.49643 0.49736 0.49807 0.4986 0.499 0.49929 0.4995 0.49965 0.49976 0.49983 0.49989 0.49992 0.49995 0.49997

148

ESTADISTICA

BIBLIOGRAFIA.

1. Briones, G. (1998). Mtodos y tcnicas de investigacin para las Ciencias Sociales. Mxico: Trillas. 2. Blalock, H. (1994). Estadstica Social. Mxico: Fondo de Cultura Econmica. 3. Carrasco, J. B. y Calderero, J. F: (2000). Aprendo a investigar en educacin. Madrid: Ediciones Rialp, S.A. 4. Cordova, Manuel (2003). Estadstica descriptiva e inferencial. Editorial Mosqueira Lima. 5. Guilford J. P. Y Fruchter B. 1984. Estadstica aplicada a la Psicologa y a la Educacin. Editorial Mc Graw Hill. 6. JESUS AMON, Estadstica para Psiclogos 1, estadstica descriptiva. 7. JESUS AMON, Estadstica para Psiclogos 2, estadstica inferencial. 8. 5PAGANO, Robert, ESTADSTICA PARA LAS CIENCIAS DEL COMPORTAMIENTO, Edit. Thomson, 7ma edicin, 2006, Mxico D.F. 9. Pea D. Y Romo J. 1997. Introduccin a la estadstica para las Ciencias sociales. Editorial Mc Graw Hill. Interamericana de Espaa. 10. Siegel, S. (1956). Non Parametric Statistics for the Behaviral Sciences. New Cork: McGraw Hill Book Company. 11. Valdivieso Serrano Luis (2004) Estadstica aplicada, editorial PUCP.

You might also like