You are on page 1of 65

GEOGEBRA COMO RECURSO PARA

UNAS NUEVAS MATEMTICAS

ESTADSTICA CON GEOGEBRA


Virgilio Gmez Rubio M Jos Haro Delicado
Baeza 2014
1

ESTADSTICA DESCRIPTIVA

Estadstica descriptiva
1. El puntaje de Apgar se usa para evaluar reflejos y
respuestas de recin nacidos. A cada beb un
profesional de la medicina le asigna un puntaje y los
valores posibles son enteros entre cero y diez. Se toma
una muestra de 1000 bebs nacidos en cierto condado
y los resultados han sido los siguientes:
0

25

35

198 367 216 131

10
18

Halla la media de los puntajes de Apgar. Halla la


desviacin tpica de la muestra.
Halla la mediana muestral.
Cules son los cuartiles primero y tercero?
3

Resolviendo con Geogebra


Abrimos la hoja de clculo
Introducimos en la 1 columna los valores de la variable y en la segunda
las frecuencias absolutas
Creamos sendas listas.

Clculo de las medidas de centralizacin y dispersin


Media[ <Lista de Nmeros>, <Lista de Frecuencias> ] media =7.14
Mediana[ <Lista de Nmeros>, <Lista de Frecuencias> ] mediana =7

La moda slo se puede calcular para valores sin agrupar


Varianza poblacional: Varianza[ <Lista de Nmeros>, <Lista de Frecuencias> ]
1.72

Varianza muestral: VarianzaMuestral[ <Lista de Nmeros>, <Lista de Frecuencias>


]
Desviacin tpica poblacional: DE[ <Lista de Nmeros>, <Lista de Frecuencias> ]
Desviacin tpica muestral: DEMuestral[ <Lista de Nmeros>, <Lista de
Frecuencias> ] 1.31
Q1[lista1, lista2] 6

Q3[lista1, lista2] 8

Algunas representaciones grficas


2. En un estudio sobre la amnesia postraumtica tras una lesin
craneal, se estudi el tiempo en das que estuvieron los pacientes en
coma. Se recogieron los datos siguientes:
2 8
9
14
16
6
10
8
7
13 12
11
11
11
13
15
10
11
15 12
20
Construir un diagrama de barras
Construir un diagrama de tallo y hojas para estos datos. Parecen
estar los datos simtricamente distribuidos?
Construir un diagrama de cajas y bigotes para los datos. Da la
misma impresin de simetra que con el diagrama de tallo y hojas?
Existen datos puntuales que puedan considerarse como atpicos?
6

DIAGRAMA DE BARRAS
Barras[ <Lista de Datos en Bruto>, <Ancho de
Barras> ]
Si el ancho de barras es 0, se obtiene una
especie de agujas a diferentes alturas.
Tambin se puede trabajar con frecuencias y con
otras opciones.
En este caso, como los
valores de la variable van
de 1 en 1, es conveniente
que el ancho de las
barras sea de longitud 1

DIAGRAMA DE TALLOS Y HOJAS


DiagramaTalloHojas[ <Lista> ]

DIAGRAMA DE TALLOS Y HOJAS


DiagramaTalloHojas[ <Lista>, <Ajuste -1|0|1> ]
En este caso el valor del ajuste es -1.
Significa que la unidad se divide por
10.
Los valores a cuyo lado no aparece
el cero no corresponden a valores
de la variable.

DIAGRAMA DE CAJAS Y BIGOTES


DiagramaCaja[ <Offset_y>, <Escala_y>, <Lista de
Datos en Bruto> ]

El problema de calcular el diagrama de cajas y bigotes


utilizando la instruccin anterior es que los bigotes se
extienden hasta los valores mximo y mnimo, con lo
cual, no sirve para detectar los valores atpicos.
10

3.Parte de un estudio de control de calidad tuvo como


objetivo mejorar una lnea de produccin. Se midieron los
pesos (en onzas) de 50 barras de jabn. Los resultados
son los siguientes, ordenados de menor a mayor.

a) Construye un diagrama de tallos y hojas para estos


datos.
b) Construye un histograma para estos datos.
c) Construye un diagrama de cajas para estos datos.
Identifica datos atpicos?

11

Usaremos Anlisis de una variable


Seleccionamos nuestros datos en la hoja de
clculo y hacemos clic sobre Anlisis de una
variable y despus en analiza

12

Si pinchamos sobre el botn que


indica la flecha anterior,
podemos agregar la tabla de
frecuencias y el polgono de
frecuencias entre otras cosas.
La tabla de la izquierda en la que
aparecen las medidas de
centralizacin,
posicin
y
dispersin, se obtiene pinchando
sobre el botn en el que aparece
el signo sumatorio.
13

14

Si hay frecuencias absolutas, stas, deben formar parte de una lista y


pinchando sobre la rueda de la esquina superior derecha, podemos
introducirlas. Para hacerlo, seleccionamos la columna que las contenga
y pinchamos sobre la mano que aparece encima de las celdas

15

16

Para el diagrama de cajas, se procede de manera similar. Se nos


da la opcin de que aparezcan los datos atpicos, si los hay.

17

A PRACTICAR

18

ESTADSTICA DESCRIPTIVA
PARA DOS VARIABLES

19

20

Introducimos los datos en dos columnas y usamos la opcin Anlisis regresin


de dos variables. De esta forma, obtenemos tanto el diagrama de dispersin,
como el diagrama de residuos y un resumen estadstico de la relacin entre las
dos variables. Se realizan diversos tipos de ajustes y se pueden usar para predecir
valores de la variable dependiente.
Se pueden intercambiar las variables, pasando la variable dependiente a ser
independiente.

21

Tambin se puede realizar usando comandos seleccionando previamente las dos


columnas de datos y eligiendo la opcin crea lista de puntos
AjusteLineal[ <Lista de Puntos> ]

22

El diagrama de residuos lo podemos obtener con la opcin


DiagramaResidual[ <Lista de Puntos>, <Funcin> ]
introduciendo en la opcin Funcin, la ecuacin de la recta obtenida previamente.

Para obtener el coeficiente de correlacin, usaramos


Spearman[ <Lista de Puntos> ]
Tambin hay opciones para calcular las medias, varianzas y
desviaciones tpicas marginales, as como para calcular la
covarianza.
23

A PRACTICAR

24

VARIABLES Y MODELOS DE
DISTRIBUCIN

25

26

a) Creamos un deslizador para c y representamos grficamente la funcin f(x)=cx. El


deslizador se puede iniciar en 0, ya que una de las condiciones que debe cumplir una
funcin de densidad es el ser positiva, f(x)>0 y, en este caso, x[0,2]
Se calcula el rea en funcin del valor de c con el comando
Integral[ <Funcin>, <Valor Inicial de x>, <Valor Final de x> ]
b) Despus de obtener el valor de c, en este caso de 0.5, calculamos

27

c) Para calcular la media usamos


Integral[x*0.5*x,0,2]. Obtenemos

d) Para hallar la varianza, podemos usar


Integral[x 0.5 x, 0, 2] (Integral[x 0.5 x, 0, 2])^2
e) Para hallar la funcin de distribucin, podemos
crear un nuevo deslizador, k, que tome valores en el
intervalo [0,2]. A continuacin, obtenemos el valor
distribucin=Integral[0.5 x, 0, k].
Para que se visualice la funcin de distribucin
creamos el punto A(k, distribucin) y activamos el
rastro, poniendo el deslizador k en animacin
automtica.

28

h) Para responder a esta pregunta basta con calcular


Integral[0.5*x,0.8,2]

29

A PRACTICAR
2. La lectura de un termmetro calibrado en agua helada
(temperatura real de 0C) representa una variable aleatoria con
funcin de densidad de probabilidad :

k 1 x 2
f ( x)
0

1 x 1
en cualquier otro caso

Determina el valor de k
Cul es la probabilidad de que el termmetro indique una
temperatura mayor a 0C?
Cul es la probabilidad de que la lectura est dentro de los
0.25C de la temperatura real?
Cul es la media de la lectura?
Cul es la mediana de la lectura?
Cul es la desviacin tpica?
30

3. Las puntuaciones de una prueba


estandarizada se distribuyen normalmente con
media de 480 y desviacin tpica de 90.
Cul es la proporcin de puntuaciones
mayores a 700?
Cul es el 25 percentil de las
puntuaciones?
Si la puntuacin de alguien es de 600 En
qu percentil se encuentra?
Qu proporcin de las puntuaciones se
encuentra entre 420 y 520?
31

a) 1 - Normal[480, 90, 700]=0.0073


b) NormalInversa[ <Media>, <Desviacin
Estndar>, <Probabilidad> ]
NormalInversa[480,90,0.25]=419.296.
Consideramos que es el percentil 420
c) Normal[ <Media>, <Desviacin Estndar>,
x, <Booleana Acumulativa> ]
Normal[480, 90, 600, true]=0.909, lo que
implica prcticamente un percentil 91
d) Normal[ 480,90, 520,true]-Normal[480,90,
420,true]=0.419
32

APROXIMACIN DE LA BINOMIAL
MEDIANTE LA NORMAL

33

1. El 45% de los condensadores de una cierta partida presenta deficiencias


a) Cul es la probabilidad de que presenten deficiencias 1, 2, 3, 4,,10 de los
condensadores?
b) Cul es la probabilidad de que de diez condensadores presenten deficiencias un
nmero menor o igual a la mitad.
c) Puede la distribucin aproximarse a la distribucin normal?
Calcula la probabilidad de que de diez condensadores examinados, la mitad
presente dichas deficiencias utilizando la distribucin normal.
a)Distribucin Binomial[ <Nmero de Ensayos>, <Probabilidad de xito>, <Acumulada
Booleana> ]

DistribucinBinomial[10, 0.45, false]

34

b) DistribucinBinomial[ <Nmero de Ensayos>, <Probabilidad de xito>, <Valor


de Variable>, <Acumulada Booleana> ]
DistribucinBinomial[ 10,0.45,5,true]=0.738
c) nq=5.5>5, =np=0.4510=4.5 no es mayor o igual que 5, pero no queda muy
lejos, por lo tanto, aunque muy en el lmite, lo podramos admitir.
2=npq=100.450.55=2.475; =1.57

5.5 4.5
4.5 4.5
P 5 P
Z

1.57
1.57

Normal[ <Media>, <Desviacin Estndar>, x, <Booleana Acumulativa> ]


Normal[4.5, 1.57, 5.5,true]- Normal[4.5, 1.57, 4.5,true]=0.738-0.5=0.238

Si queremos comparar con el valor que se obtiene mediante el modelo binomial


usamos, DistribucinBinomial[ <Nmero de Ensayos>, <Probabilidad de xito>,
<Valor de Variable>, <Acumulada Booleana> ] = DistribucinBinomial[10, 0.45,
5,False ]= 0.234
35

Otra forma de hacer lo mismo:

36

Vamos a hacer un estudio ms exhaustivo de la aproximacin del modelo


binomial por el modelo normal, analizando modelos binomiales con diferentes
medias y desviaciones tpicas y comparndolo con el modelo normal
Vamos a crear dos deslizadores, uno que tomar los valores para n y otro para
p.
El deslizador para n abarcar un rango que vaya, por ejemplo, desde 1 hasta
1000, con pasos de 1 en 1. El deslizador para p ir desde 0 a 1, con pasos de
0.01.
Aunque especifiquemos as los pasos, es difcil que los saltos no sean mayores
y que haya valores que nos saltemos. Para solventar este problema, podemos
crear casillas de control. Les damos los nombres n= y p= y los vinculamos al
deslizador correspondiente. Podemos modificar la longitud de la casilla de
entrada en estilo.
Creamos la distribucin binomial con DistribucinBinomial[n,p] y dos
variables
37

Ajustamos una curva normal de media y desviacin tpica , con


Normal[,,x].
Para que sean los que sean los valores de p y de n la imagen se muestre
siempre en pantalla, iremos a Vista grfica y modificaremos el rango en
los ejes.
Eje X (-3, +3)
Eje Y (-0.1, f()+0.1
Como en las casillas correspondientes de la vista grfica no podemos
introducir directamente los smbolos y , los introducimos en la
entrada, los copiamos (control c) y los pegamos despus (control V).

38

Si queremos calcular las probabilidades de que la variable est en


determinados intervalos, lo podemos hacer con la funcin Integral y
hablar del factor de correccin de Yates. Por ejemplo, si queremos
calcular la probabilidad de que r4, deberamos hacerlo con
Integral[f, -, 4.5].
Para estudiar en qu casos se puede aproximar el modelo binomial por
el modelo normal, podemos fijar los valores de p e ir variando los de n
con la animacin automtica. De esta forma observamos cmo
evoluciona el ajuste de ambos modelos.

39

DISTRIBUCIN DE LA MEDIA MUESTRAL


TEOREMA CENTRAL DEL LMITE

40

MODELO DE DISTRIBUCIN UNIFORME

En la casilla A1 ponemos UniformeAleatoria[0, 1].

Extendemos hacia abajo para generar una muestra, tantas


casillas como tamao queramos para la muestra (tomemos
n=40).
A continuacin, nos movemos hacia la derecha para generar
ms muestras del mismo tamao.
En la casilla A41 escribimos Media[A1:A40], se obtiene la
media y nos movemos hacia la derecha para obtener las
medias de todas las muestras. Creamos una lista con esas
medias (llammosla lista1).
41

Ahora toca representarlas y lo hacemos con la siguiente


instruccin.
Histograma[Clases[lista1, 10], lista1, false].
Hemos utilizado la instruccin Histograma[ <Lista de lmites de
clases>, <Lista de datos brutos>, <Usar densidad o no
(true/false)>, <Factor de escala de densidad (opcional)> ].
Para <lista de lmites de clase> hemos incluido la instruccin
Clases[ <Lista de datos>, <Nmero de clases> ]. <Lista de datos>
es la lista que contiene las medias muestrales, y <Nmero de
clases> contiene el nmero de intervalos que queremos obtener.
<Lista de datos brutos> es de nuevo nuestra lista de medias
muestrales y no usaremos densidades, poniendo false en la zona
correspondiente. Hemos dicho que se genere un histograma con
10 intervalos, con los valores de lista 1.
42

Para que se vea bien el histograma, ponemos en vista grfica


como valores mnimo y mximo de la x, -0.1 y 1.1,
respectivamente.
Ahora representamos la curva normal correspondiente al modelo
de distribucin uniforme [0,1] que tiene una media de:
01 x

x
1
1
dx
1 0
2 0 2
2

y una desviacin tpica igual a


1

x dx
1
0

40

x3
1

3 0 4
40

1 1
1

3 4
12
40
40

43

Lo hacemos con la instruccin Normal[0.5,1/sqrt(12*40),x]


Para representar la curva uniforme usamos Uniforme[0,1,x]

44

Si queremos hacer un estudio de la variable correspondiente a las


medias muestrales, podemos seleccionar la columna y hacer clic
sobre Anlisis de una variable.
Si se pone, histograma
normalizado se superpone una
curva normal de media la
media
de
las
medias
muestrales y desviacin tpica
la de las medias muestrales.
Tambin obtendremos un
resumen de las medidas de
centralizacin y dispersin de
la variable medias muestrales.

45

46

Podemos analizar la normalidad de los datos


escogiendo Grfico Q-Q Cuantil Normal

47

A PRACTICAR

Analizad la media muestral


para muestras procedentes
de un modelo de Poisson

48

INTERVALOS DE CONFIANZA Y
CONTRASTE DE HIPTESIS

49

1. Un atleta efecta seis lanzamientos,


obteniendo distancias de 58, 69, 64, 57, 64 y
66 metros. Halla un intervalo de confianza
para la media del 90%. Contrastar la hiptesis
de que la media poblacional es mayor o igual
que 66.
IntervaloMediaT[ <Lista de datos (muestra)>, <Nivel> ]
En lista 2, geogebra nos
devuelve los extremos del
intervalo
50

Para realizar el contraste de hiptesis, consideramos


como hiptesis alternativa H1: <66, frente a la hiptesis
nula H0: 66
TestMediaT[ <Lista de datos (muestra)>, <Media
(hiptesis)>, <Cola> ]
TestMediaT[ <lista1, 66, < ].

La respuesta es lista2 = {0.09, -1.58}.


El primer valor corresponde al p-valor
El segundo valor, corresponde al estadstico de
contraste.
51

2. En una muestra de tamao


n=16, se mide una media 6 y una
desviacin tpica s=12. Es el valor
de la media significativamente
mayor que 0? Usa un nivel de
confianza de =0.05

52

En este caso no disponemos de los datos en bruto,


podemos usar
TestMediaT[ <Media (muestra)>, <Desviacin estndar (muestra)>, <Tamao
(muestra)>, <Media (hiptesis)>, <Cola> ]

Hay otra forma:

Vamos a calculadora
de probabilidades,
dentro del men que
ofrece la hoja de
clculo
53

O bien, dentro del men de la vista grfica

54

Diferentes tests que se pueden utilizar

55

Si queremos obtener un intervalo T de confianza para la


media

56

A PRACTICAR
3. Se quiere averiguar si ha habido una reduccin
significativa en el porcentaje de votantes a un
determinado partido poltico, en el ltimo ao. Para
ello se eligieron al azar 100 personas y se les pregunt
si votaran al partido en cuestin, obtenindose un
porcentaje de respuestas afirmativas del 39%. Si el
porcentaje de votantes a favor del partido
considerado era del 42% hace un ao, cuando se
pregunt a 150 personas, contrasta a nivel de
significacin =0.05 si la reduccin habida ha sido
significativa.
57

4. En el laboratorio de fsica, dos alumnos realizan varias


medidas sobre la relacin carga-masa (e/m) del
electrn, obteniendo los siguientes resultados:

Es el valor de la relacin carga-masa obtenido por el


segundo alumno significativamente menor que el
valor real: e / m 1.75 1011C / kg ?
Suponiendo varianzas poblacionales iguales, calcula
un intervalo de confianza para la diferencia de
medias Son las medias significativamente diferentes
entre s? Usa =0.05 en todos los casos.
58

ANOVA
59

Para trabajar el anlisis de la varianza, podemos teclear


en la lnea de entrada ANOVA[ <Lista>, <Lista>, ... ]

60

Introducimos los datos utilizando la hoja de clculo y creamos varias


listas, tantas como tratamientos diferentes haya.
Utilizamos la instruccin ANOVA[ <Lista>, <Lista>, ... ]
En una nueva lista aparecen dos valores
El primero corresponde al p-valor
El segundo valor corresponde al estadstico de contraste (cociente de
cuadrados medios).

61

Si queremos realizar un anlisis individual de las variables,


podemos utilizar Anlisis multivariable

62

Tambin podemos realizar el anlisis de la varianza desde el mismo


sitio, e incluso contrastes de hiptesis e intervalos de confianza para
la diferencia de medias

63

A PRACTICAR

64

MUCHAS GRACIAS

65

You might also like