You are on page 1of 38

Estadstica Aplicada.

Tema 1. Estadstica descriptiva de una variable

Juan Vilar
Departamento de Matem
aticas UDC
e-mail: juan.vilar@udc.es

Mster en Asistencia e Investigacin Sanitaria


Especialidad en Investigacin Clnica

Contenidos de la asignatura
1

Estadstica Descriptiva de una variable

Estadstica Descriptiva de una variable

Probabilidad

Variables aleatorias

Distribuciones notables

Inferencia estadstica. Estimaci


on Puntual

Inferencia estadstica. Intervalos de Confianza

Inferencia estadstica. Contrastes de Hip


otesis

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

3/1

Estadstica descriptiva.Conceptos generales.

Dos problemas para pensar

Si tenemos dos colecciones de datos, no necesariamente medidas en


las mismas unidades, c
omo se pueden comparar sus dispersiones?

Como se pueden representar, a traves de un u


nico grafico,
caractersticas de una colecci
on de datos referentes a su posicion,
dispersion, concentraci
on y simetra?

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

5/1

Estadstica descriptiva.Conceptos generales.

Objetivo

La estadstica descriptiva se encarga de organizar y resumir grandes


colecciones de datos. Su finalidad es la extracci
on e interpretacion de la
informacion contenida en ellos.
Este objetivo se alcanza a traves de:
Tablas de distribuciones de frecuencias.
Representaciones graficas.
Medidas que resumen caractersticas de los datos.
Los datos a tratar pueden ser cualitativos o cuantitativos. En este u
ltimo
caso, se clasifican a su vez en discretos o continuos.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

6/1

Estadstica descriptiva.Conceptos generales.

Conceptos generales

El objeto de cualquier investigaci


on estadstica es la toma de
informacion acerca de los individuos de cierto colectivo llamado
poblacion estadstica.
Cada elemento de una poblaci
on se denomina individuo o unidad
estadstica.
Las poblaciones estadsticas se clasifican en poblaciones finitas e
infinitas, de acuerdo con el n
umero de individuos incluidos en las
mismas.
El proceso de toma de informaci
on acerca de los individuos de una
poblacion puede realizarse mediante la elaboraci
on de un censo o
mediante la extracci
on de una muestra.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

7/1

Estadstica descriptiva.Conceptos generales.

Variables estadsticas

Llamaremos variable estadstica a cada una de las caractersticas


consideradas con el prop
osito de describir a cada individuo de la
muestra.
Cada una de las variables estadsticas consideradas para la descripcion
de los individuos de la muestra puede presentar distintas modalidades
o estados.
Atendiendo a la naturaleza de las modalidades de las variables, estas
pueden clasificarse en variables cualitativas y variables cuantitativas.
Estas u
ltimas se clasifican en variables discretas, que son aquellas que
toman un n
umero finito o infinito numerable de valores distintos, y
variables continuas, que son aquellas que pueden tomar cualquier
valor en un intervalo de valores dado.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

8/1

Estadstica descriptiva.Conceptos generales.

Conceptos generales

Si una muestra es representativa de una poblaci


on, se pueden deducir
importantes conclusiones acerca de esta a partir del analisis de la
informacion muestral. La parte de la Estadstica que trata de las
condiciones bajo las cuales tales inferencias son validas se llama
Estadstica Inductiva o Inferencial.
La parte de la Estadstica que trata solamente de describir y analizar
un grupo dado de datos sin sacar conclusiones o inferencias acerca de
la poblacion que los ha generado se llama Estadstica Descriptiva o
Deductiva.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

9/1

Distribuciones de frecuencias

Distribuciones de frecuencias

Se dispone de una muestra de n observaciones de una muestra.


La frecuencia absoluta de cada uno de los valores que puede tomar la
variable es el n
umero de individuos de la muestra, ni , que toman
dicho valor. Ejemplo: en una muestra de 75 individuos hay 35 que no
tienen ninguna lesion, 15 con una s
ola lesi
on y 20 con dos lesiones.
Las frecuencias absolutas de los tres valores posibles (0, 1 y 2), para
la variable n
umero de hermanos, son 35, 15 y 25, respectivamente.
La frecuencia relativa de cada posible valor de una variable es la
proporcion de individuos muestrales que toman dicho valor: fi = ni /n.
En el ejemplo anterior, la frecuencia relativa de cero lessiones es
35/75 = 0.4667 (expresado en porcentaje, un 46.67 % ).

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

10 / 1

Distribuciones de frecuencias

Distribuciones de frecuencias
La frecuencia absoluta acumulada se define como la suma de las
frecuencias absolutas correspondientes a valores menores o iguales
que el valor en cuesti
on: Ni = n1 + n2 + + ni . La frecuencia
absoluta acumulada de una lesi
on es: 35 + 15 = 50 (el n
umero de
individuos en la muestra con una lesi
on o menos).
La frecuencia relativa acumulada se define analogamente pero usando
frecuencias relativas:
Fi = f1 + f2 + + fi =

i
X
j=1

fj =

Ni
.
n

La frecuencia relativa acumulada de 1 lesi


on es
35/75 + 15/75 = 50/75 = 0.6667, es decir un 66.67 %.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

11 / 1

Distribuciones de frecuencias

Distribuciones de frecuencias
Modalidad
c1
c2

Frecuencia
absoluta
n1
n2

Frecuencia
relativa
f1
f2

Fr. absoluta
acumulada
N1
N2

Fr. relativa
acumulada
F1
F2

..
.

..
.

..
.

..
.

..
.

ci
..
.

ni
..
.

fi
..
.

Ni
..
.

Fi
..
.

ck
Total

nk
n

fk
1

Nk

Fk

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

12 / 1

Distribuciones de frecuencias

Ejemplo: Datos cualitativos


variable: Fabricante
Otros
Oracle Cray Inc. SGI
Cray Inc. Cray Inc. Otros
IBM
Otros
Otros
HP
Otros
Otros
Otros
IBM
IBM
Cray Inc. IBM
IBM
HP
Otros
IBM
IBM
IBM
IBM
IBM
Dell
Otros
Cray Inc. IBM
SGI
Otros
IBM
Otros
Dell
Otros
Cray Inc. SGI
Dell
IBM
SGI
Otros
Otros
Oracle
IBM
HP
IBM
Oracle
IBM
SGI
SGI
IBM
Oracle SGI
HP
IBM
Oracle SGI
IBM
IBM
IBM
Dell
Oracle HP
Otros
HP
HP
SGI
Cray Inc. Otros
IBM
HP
Cray Inc. Otros
HP
HP
Cray Inc. Otros
IBM
Otros
Cray Inc. HP
Otros
HP

HP
IBM
IBM
HP
IBM
IBM
IBM
IBM
IBM
IBM
IBM
IBM
HP
HP
HP
HP
Otros
HP
SGI
SGI
HP

Otros
HP
HP
HP
Cray Inc. HP
HP
HP
IBM
IBM
IBM
IBM
IBM
IBM
IBM
HP
Dell
Otros
HP
HP
IBM
HP
IBM
HP
HP
HP
HP
HP
HP
SGI
HP
HP
IBM
HP
IBM
HP
Dell
HP
IBM
HP
IBM
HP

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

HP
IBM
HP
IBM
HP
Otros
Oracle HP
IBM
IBM
IBM
HP
IBM
HP
IBM
HP
IBM
HP
HP
IBM
HP
IBM
Cray Inc. IBM
HP
IBM
IBM
HP
IBM
Otros
IBM
HP
HP
IBM
HP
IBM
HP
IBM
HP
IBM
Dell
IBM

IBM
IBM
IBM
IBM
HP
HP
Dell
Dell
Dell
IBM
IBM
IBM
HP
HP
HP
HP
HP
IBM
IBM
IBM
IBM

2014

13 / 1

Distribuciones de frecuencias

Ejemplo (continuacion)
Tabla de distribuci
on de frecuencias

Fabricante
IBM
HP
Cray Inc.
SGI
Dell
Oracle
Otros
Total

Frec. abs.
200
159
29
22
19
11
60
500

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

Frec. relat.
0.400
0.318
0.058
0.044
0.038
0.022
0.120
1.000

2014

14 / 1

Distribuciones de frecuencias

Ejemplo: Datos cuantitativos discretos


Variable: n
umero de n
ucleos del procesador
6
4
12
2
4
2
6
4
4
4
4
4
6
6
4
2
4
4
6
1
2
4
4
6
12
4
2
4
4
4
8
2
2
2
4
4
9
2
4
4
9
4
6
2
4
4
9
4
4
4
4
4
9
6
8
4
6
4
4
6
4
4
8
4
4
4
2
4
4
4
4
4
4
4
2
2
4
4
4
4
6
6
6
4
4
4
16
6
6
4
4
6
4
6
4
6
4
4
6
4
8
4
8
4
2
4
4
4
12
4
6
12
4
4
12
4
9
8
4
4
Juan Vilar
de Matem
juan.vilar@udc.es
12(Departamento
4
6 aticas UDC
4 e-mail:Estad
4 stica Sanitaria
4 )

4
4
4
4
4
4
4
4
4
4
4
4
4
4
6
4
4
4
4
4
4

6
4
4
4
4
4
4
4
4
4
4
2
4
4
4
4
4
4
6
6
4

4
4
2
6
4
4
4
4
4
4
4
4
4
6
4
4
4
4
4
4
4

2014

4
4
4
4
4
4
4
4
6
4
4
4
4
4
4
4
4
4
4
4
4

15 / 1

Ejemplo

OracleDistribuciones de frecuencias11
Otros
60
(continuaci
on)
Total
500

0.022
0.120
1.000

Tabla de distribuci
on de frecuencias
Cant. de ncleos
1
2
4
6
8
9
12
16
Total

Frec. abs.
2
38
364
62
10
6
15
3
500

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

Frec. relat.
0.004
0.076
0.728
0.124
0.020
0.012
0.030
0.006
1.000

2014

16 / 1

Distribuciones de frecuencias

Ejemplo: Datos cuantitativos continuos


Variable: Frecuencia del procesador (GHz)
2.930
2.930
2.100
1.600
2.530
3.000
2.600
2.300
2.400
2.660
2.530
2.530
2.660
2.800
2.800
4.700
2.530
2.300
2.930
3.200
4.700
2.530
2.267
2.660
2.100
0.850
4.700
3.000
2.530
2.530
2.260
4.700
0.700
4.700
2.530
2.530
3.200
4.700
2.400
2.800
3.200
2.530
2.600
4.700
2.800
2.300
3.200
2.660
0.850
2.500
2.333
2.800
3.200
2.660
2.400
2.800
2.800
2.260
2.530
2.660
3.000
2.930
2.400
2.930
2.530
2.660
0.700
3.000
2.267
2.800
2.267
2.660
0.850
2.930
1.600
4.700
2.500
3.000
2.930
2.930
2.930
2.930
2.260
2.930
2.300
3.000
1.600
2.930
2.260
3.000
0.850
2.800
2.800
2.260
3.000
2.930
2.930
2.667
2.930
2.667
2.000
2.530
2.400
3.000
2.300
3.000
3.000
2.530
2.100
2.300
2.930
2.200
2.800
2.800
2.100
2.300
3.200
2.000
2.800
2.530
Juan Vilar
(Departamento
aticas UDC
e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)
2.200
3.000de Matem
2.930
3.000
3.000
2.530

2.830
2.930
2.660
2.660
2.530
2.666
2.666
2.830
2.100
2.660
2.930
2.930
2.400
2.300
2.660
3.000
2.333
2.333
2.333
2.830
2.200

2.800
2.800
2.830
2.660
2.666
2.666
2.666
2.260
2.530
2.333
2.930
2.600
3.000
2.500
2.260
2.260
2.830
2.000
2.930
2.930
2.333

2.267
2.530
2.267
2.530
2.93
2.530
2.93
2.530
2.666
2.660
3.000
2.667
2.530
2.400
2.500
2.400
2.660
2.800
2.530
2.530
2.530
2.660
2.530
2.267
2.530
2.500
2.600
2.500
2.400
2.500
3.000
2.500
2.530
2.500
2.530
2.267
2.530
2.267
2.530
2.267
17 / 1
2.5302014 2.267

12
16 on)
(continuaci
Total

Distribuciones de frecuencias

Ejemplo

15
3
500

0.030
0.006
1.000

Tabla de distribuci
on de frecuencias
Frec. del procesador
[0.0 , 0.5]
(0.5 , 1.0]
(1.0 , 1.5]
(1.5 , 2.0]
(2.0 , 2.5]
(2.5 , 3.0]
(3.0 , 3.5]
(3.5 , 4.0]
(4.0 , 4.5]
(4.5 , 5.0]
Total

Frec. abs.
2
14
0
13
143
303
7
1
0
17
500

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

Frec. relat.
0.004
0.028
0.000
0.026
0.286
0.606
0.014
0.002
0.000
0.034
1.000

2014

18 / 1

Representaciones gr
aficas

Representaciones graficas

Diagrama de barras. Se usa para variables cualitativas o cuantitativas


discretas.
Diagrama de sectores. Se usa para variables cualitativas.
Diagrama acumulativo de frecuencias. Se usa para variables
cualitativas ordinales o cuantitativas discretas.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

19 / 1

Representaciones gr
aficas

Ejemplo: Datos cualitativos (Fabricante)

100
50
0

Frecuencia absoluta

150

200

Diagrama de barras

IBM

HP

Cray Inc.

SGI

Dell

Oracle

Otros

Fabricante

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

20 / 1

Representaciones gr
aficas

Ejemplo: Datos cuantitativos discretos (Numero de


Nucleos)

200
150
100
50
0

Frecuencia absoluta

250

300

350

Diagrama de barras

12

16

Cantidad de ncleos del procesador

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

21 / 1

Representaciones gr
aficas

Representaciones graficas

Histograma. Es el equivalente continuo del diagrama de barras.


Uniendo, mediante segmentos de recta, los puntos medios de las
bases superiores de cada rectangulo del histograma se obtiene la
representacion grafica llamada polgono de frecuencias.
Tambien se puede considerar el histograma m
ovil.
El polgono acumulativo de frecuencias tambien se usa para variables
continuas.
El diagrama de cajas y bigotes resume la media, la mediana y los
cuartiles.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

22 / 1

Representaciones gr
aficas

Ejemplo: Datos cuantitativos continuos (Frecuencia proc.)

0.6
0.4
0.2
0.0

Densidad

0.8

1.0

1.2

Histograma

Frecuencia del procesador (GHz)

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

23 / 1

Medidas caractersticas

Medidas de posici
on

A partir de ahora supondremos que:


Los datos a estudiar son cuantitativos.
Disponemos de un total de n datos.
Los datos son x1 , x2 , . . . , xn .
El objetivo es resumir, a traves n
umeros, tanto posiciones dentro de la
coleccion de datos como la dispersi
on o variabilidad de estos.
Comenzaremos por las medidas de posici
on.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

24 / 1

Medidas caractersticas

Medidas de posici
on

Media
La media (aritmetica) se define como:
n

x=

1X
x1 + x2 + + xn
=
xi
n
n
i=1

Es un punto de equilibrio dentro de la colecci


on de datos:
(x1 x) + + (xn x) = 0
No es robusta a la presencia de valores atpicos: si en el conjunto de
datos hay un valor (o unos pocos) muy grande o muy peque
no
respecto a los demas, este valor hace que vare mucho el valor de la
media.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

25 / 1

Medidas caractersticas

Medidas de posici
on

Mediana Me
La mediana (muestral) es un n
umero que deja igual cantidad de datos a su
izquierda que a su derecha. La denotaremos por Me.
Si el total de datos (n) es impar, la mediana es el dato que ocupa la
posicion central.
Si el total de datos (n) es par, consideraremos como mediana al
menor de los dos que ocupan las posiciones centrales.
La mediana es robusta a la presencia de valores atpicos.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

26 / 1

Medidas caractersticas

Medidas de posici
on

Moda M0
Se define como el valor mas frecuente de la variable, es decir el que tiene
mayor frecuencia absoluta (o relativa).

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

27 / 1

Medidas caractersticas

Medidas de posici
on

Cuantil de orden p
El cuantil (muestral) de orden p (0 < p < 1) es un n
umero que deja, a lo
sumo, el 100p % de los datos a su izquierda y el 100(1 p) % a su
derecha. Lo denotaremos por qp .
Si varios n
umeros verifican la condici
on de cuantil, consideraremos
como cuantil el menor de los candidatos.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

28 / 1

Medidas caractersticas

Medidas de posici
on

Medidas de posicion. Cuantiles

Cuartiles. Son los cuantiles de


ordenes 1/4 (Q1 ), 1/2 (mediana) y 3/4
(Q3 ).
Deciles. Son los cuantiles de
ordenes 1/10, 2/10, , 9/10 y dividen
el conjunto de observaciones en diez partes de igual frecuencia.
Percentiles. Son los cuantiles de
ordenes 1/100, 2/100, , 99/100.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

29 / 1

Medidas caractersticas

Medidas de posici
on

Ejemplo
Obtencion de varias medidas de posici
on asociadas a la coleccion de
n
umeros: 6, 2, 6, 1, 1, 5, 9, 9, 4, 9.
Media:
x=

6+2+6+1+1+5+9+9+4+9
= 5.2
10

Cuantiles:
Ordenamos los datos de forma creciente: 1, 1, 2, 4, 5, 6, 6, 9, 9, 9.
q0.25
q0.50
q0.70
q0.75
q0.95

=2
= Me = mn{5, 6} = 5
= mn{6, 9} = 6
=9
=9

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

30 / 1

Medidas caractersticas

Medidas de dispersi
on

Medidas caractersticas. Medidas de dispersion


Varianza
La varianza (muestral) se define como:
n

1X
(x1 x)2 + + (xn x)2
=
(xi x)2
s =
n
n
2

i=1

Formula alternativa (requiere menos operaciones):


n

s2 =

x12 + + xn2
1X 2
x2 =
xi x 2
n
n
i=1

Depende de las unidades. Por tanto, no debe ser utilizada para


comparar las dispersiones de varias colecciones de datos.
La varianza de una variable tiene las unidades al cuadrado de la
variable en estudio.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

31 / 1

Medidas caractersticas

Medidas de dispersi
on

Medidas caractersticas. Medidas de dispersion

Desviaci
on tpica
La desviacion tpica es la raz cuadrada (positiva) de la varianza
(muestral). Esto es:
n

(x1 x)2 + + (xn x)2


1X
s =
=
(xi x)2
n
n
2

i=1

La desviacion tpica de una variable tiene las unidades de la variable


en estudio.
En la mayora de los casos en el intervalo: (x 2s; x + 2s) estan el
95 % de los datos del conjunto en estudio

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

32 / 1

Medidas caractersticas

Medidas de dispersi
on

Medidas caractersticas. Medidas de dispersion

Coeficiente de variaci
on
El coeficiente de variacion (muestral) se define como:
CV =

s
x

El coeficiente de variacion:
Compara la dispersion de una colecci
on de datos con su media.
No tiene unidades (es adimensional). Es una medida de dispersion
relativa.
Puede ser utilizado para comparar las dispersiones de colecciones de
datos.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

33 / 1

Medidas caractersticas

Medidas de dispersi
on

Medidas caractersticas. Medidas de dispersion

Otras medidas de dispersion absoluta son:


Recorrido o rango. Es la diferencia entre los valores extremos:
R = max(xi ) mn(xi )
Recorrido intercuartlico. Es la diferencia entre los cuartiles de tercer y
primer ordenes: RI = Q3 Q1

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

34 / 1

Medidas caractersticas

Medidas de dispersi
on

Medidas de dispersion. Ejemplo


Obtencion de varias medidas de dispersi
on asociadas a la coleccion de
n
umeros anterior: 6, 2, 6, 1, 1, 5, 9, 9, 4, 9 (recuerdese que x = 5.2).
Varianza:
s2 =

(6 5.2)2 + (2 5.2)2 + + (9 5.2)2


= 9.16
10

Formula rapida:

s2 =

62 + 2 2 + 6 2 + 1 2 + 1 2 + 5 2 + 9 2 + 9 2 + 4 2 + 9 2
5.22 = 9.16
10

Coeficiente de variaci
on:

CV =

9.16
= 0.58
5.2

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

35 / 1

Medidas caractersticas

Medidas de dispersi
on

Grafico. Diagrama de cajas


Diagrama de cajas
El diagrama de cajas muestra, de una manera rapida y sencilla, diversa
informacion referente a los datos. Se construye de la siguiente forma:
1

Se dibuja una caja limitada por los cuantiles q0.25 y q0.75 , y dividida
en dos partes a traves de la mediana (cuantil q0.50 ).

A partir del cuantil q0.25 se traza un segmento (bigote) hasta el


menor de los datos que superan la cantidad q0.25 1.5(q0.75 q0.25 ).

A partir del cuantil q0.75 se traza un segmento (bigote) hasta el


mayor de los datos que no superan la cantidad
q0.75 + 1.5(q0.75 q0.25 ).

Los datos inferiores a q0.25 1.5(q0.75 q0.25 ) o superiores a


q0.75 + 1.5(q0.75 q0.25 ) se consideran valores atpicos, y se dibujan
en el grafico.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

36 / 1

Medidas caractersticas

Medidas de dispersi
on

Grafico. Diagrama de cajas


Diagrama de cajas: Frecuencia del procesador (GHz)

Frecuencia del procesador (GHz)

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

37 / 1

Medidas caractersticas

Medidas de dispersi
on

Grafico. Diagrama de cajas

El diagrama de cajas muestra, entre otras caractersticas:


Los cuantiles q0.25 , q0.50 y q0.75 .
La dispersion de los datos.
La existencia o no de datos atpicos.
La existencia o no de simetra.
La posible acumulacion de datos.

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

38 / 1

Medidas caractersticas

Medidas de dispersi
on

Grafico. Diagrama de cajas

Oracle

Otros

Diagrama de cajas: Frecuencia del procesador por fabricante

SGI

Cray Inc.

HP
IBM

Fabricante

Dell

Frecuencia del procesador (GHz)

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

2014

39 / 1

Medidas caractersticas

Medidas de dispersi
on

Oracle

Otros

Grafico. Diagrama de cajas

SGI

Cray Inc.

HP

IBM

Fabricante

Dell

Frecuencia del procesador (GHz)

Juan Vilar (Departamento de Matem


aticas UDC e-mail:Estad
juan.vilar@udc.es
stica Sanitaria
)

Frecuencia del procesador (GHz)

2014

40 / 1

You might also like