You are on page 1of 27

TEMA 1

DESCRIPCIN DE DATOS:
ESTADSTICA DESCRIPTIVA

1.1 Introduccin: conceptos bsicos


1.2 Tablas estadsticas y representaciones
grficas
1.3 Caractersticas de variables estadsticas
unidimensionales
1.3.1 Caractersticas de posicin
1.3.2 Caractersticas de dispersin
1.3.3 Caractersticas de forma
1.4 Anlisis exploratorio de datos:
grfico de caja

1.1. Introduccin : conceptos bsicos


ESTADSTICA: Estudio de los mtodos de recogida y

descripcin de datos, as como del anlisis de esta


informacin

Etapas de un estudio estadstico


1
2
3
4

Recogida de datos
Ordenacin, tabulacin y grficos*
Descripcin de caractersticas*
Anlisis formal

* Estadstica descriptiva: parte de la


estadstica que se ocupa de las etapas 2 y 3

Individuo, Poblacin, Muestra


Poblacin: Conjunto de elementos a los que se les

estudia una caracterstica


Individuo: Cada uno de los elementos de la poblacin
Muestra: Subconjunto representativo de la poblacin
2

Variables estadsticas. Modalidades

Variable estadstica (v.e.): Caracterstica propia

del individuo objeto del estudio estadstico


Ejemplos:
- Estatura
- Salario
- Color del pelo
- Nivel de colesterol
- N de hijos de una familia

Modalidad: Cada una de las posibilidades o

estados diferentes de una variable estadstica


Exhaustivas e incompatibles

Ejemplo:
color del pelo:
- castao
- rubio
- negro

Tipos de variables estadsticas


Cualitativas: Las caractersticas no son cuantificables

Ejemplos:
Grupo sanguineo
Profesin
Color del pelo
Cuantitativas: Caractersticas cuantificables o numricas
Discretas: Numricas numerables

Ejemplos:
N de hijos de una familia
N de nidos de procesionarias por rbol
N de virus en un cultivo
Continuas: Numricas no numerables

Ejemplos:
Estatura
Salario
Nivel de colesterol
4

1.2. Tablas estadsticas y representaciones

grficas
Variables discretas
Frecuencias

Absolutas, ni (n individuos modalidad i)

Absolutas acumuladas, Ni n1 n2 ... ni

Relativas, fi ni n (proporcion indiv. modalidad i)

Re lativas acumuladas, F i f1 f 2 ... fi

xi ni

Ni

fi

Fi

x1 n1 N1

f1

F1

... ...
xi ni

...
Ni

...
fi

...
Fi

... ...
xk nk

... ...
Nk fk

...
Fk

Absolutas, ni
Absolutas
acumuladas, Ni

Relativas
fi = n i / n
Relativas
acumuladas
Fi = Ni / n
5

Variables continuas: Intervalos

Intervalo I i x i

n i Ni

fi

Fi
F1

e0 e1

x1

n1 N1 f1

...
e i-1 ei

...
xi

... ...
n i Ni

...
...
e k -1 ek xk

... ...
fi Fi

... ... ... ...


n k N k fk Fk
n

Marca de clase x (punto medio de cada intervalo)


i

Amplitud ai (distancia entre los extremos)


Intervalos cerrados por un extremo y abiertos por otro

Grficos estadsticos

V. E. Cualitativas: Grfico rectangular


Color Plumaje

N de Aves ( n i )

Negro

10

Gris

14

Blanco

20

Rojo

Violeta

4
54

20

10

Negro

Gris

Blanco

Rojo

Violeta
7

V. E. Cualitativas: Grfico de sectores

Grados de un sector = 360 0 x fi


Color
Plumaje

N de Aves
ni

fi

Grados

Negro

10

0,185

66,6

Gris

14

0,259

93,24

Blanco

20

0,37

133,2

Rojo

0,111

39,96

Violeta

0,074

26,64

54

violeta
rojo

blanco

negro

gris

V. E. Discretas: Grfico de barras

N de cras N animales: n
i

fi

Fi

20

0.20

0.20

30

0.30

0.50

25

0.25

0.75

15

0.15

0.90

10

0.10

n = 100

V. E. Continuas: Histograma

Estatura

ni hi = ni / ai

140 160

30

1.5

160 170

22

2.2

170 180

20

180 190

18

1.8

190 200

10

hi

100

2.2

El rea de
cada rectngulo
es proporcional
a la frecuencia

2
1,8
1,5
1

140

160 170 180 190 200


10

1.3. Caractersticas de variables

estadsticas unidimensionales
1.3.1

Caractersticas de Posicin
Media aritmtica
k

ni x i

x fi x i i 1
i 1

Estatura

N Personas M. Clase

ni

xi

ni xi

140 150

20

145

2900

150 160

100

155

15500

160 180

80

170

13600

180 200

10

190

1900

n = 210

33900

ni x i

Media : x i 1

33900
210

161.42
11

Moda

Valor de la variable ms frecuente


Puede haber ms de una moda Plurimodal

Variables discretas

Datos en serie
2, 2, 3, 3, 3, 3, 5, 6, 7 Mo = 3

Datos en tabla

Ejemplo

xi

ni

34

36

45

22

17

Mo = 3

12

Variables continuas

Mo ei 1

h i h i 1

h i h i1 hi h i1

ai

xi

ni

hi = ni / ai

140 160

30

1.5

160 170

22

2,2

170 180

20

180 190

18

1,8

190 200

10

Ejemplo

100
2.2 1.5

Mo 160
10 167.777
2.2 1.5 2.2 2

Observaciones:

1. Puede utilizarse la frecuencia relativa


2. Si las amplitudes son iguales, la moda se puede
obtener directamente con las frecuencias
13

Mediana
Valor de la variable que ocupa el lugar central en una
serie de datos ordenados.
El 50% de los elementos de la poblacin tienen un valor
de la variable menor o igual que la mediana. El 50% de los
elementos de la poblacin tienen un valor de la variable
mayor o igual que la mediana.
Variables discretas

Datos en serie
N impar de observaciones:
2, 2, 2, 3, 5, 6, 7, 7, 8

Me = 5

N par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9

Me = 6 7

xi ni Ni

fi

Indeterminada entre 6 y 7

Fi

xi ni Ni

fi

Fi

0,333 0,333

0,1 0,1

0,111 0,444

0,1 0,2

0,111 0,555

0,3 0,5

0,111 0,666

0,1 0,6

0,222 0,888

0,2 0,8

0,111 0,999

10 0,2

14

Variables discretas

Datos en tabla
Ejemplo

xi

ni

Ni

10

10

20

3
28

fi

Fi

0.142
0.214

0.142
0.357

25

0.357
0.178

0.714
0.892

28

0.107

n /2 = 14
Fi = 0,5

Me = 2

Observacin: Si n / 2 coincide con un N


i

la mediana est indeterminada entre x i y x i+1

15

Variables continuas

50
n N i 1
0,5 Fi 1
Me ei 1
a i e i 1 100
ai
fi
ni
Ejemplo

Estatura

ni

Ni

fi

Fi

140 150

15

15 0.15 0.15

150 160

30

45 0.30 0.45

160 170

25

70 0.25 0.70

170 180

20

90 0.20 0.90

180 200

10 100 0.10

n/2 = 50
Fi = 0,5

100
Me 160

0.5 0.45
10 160 2 162
0.25

Observacin: Si n/2 coincide con un N


i

la mediana es el extremo superior del intervalo que le


corresponde
16

Percentiles
Definicin: Pk , k: 1,2,...,99, percentil k, valor de la
variable que deja por debajo, el k% de los valores de la
variable
Q1 = P25 Cuartil 1
Q2 = P50 Cuartil 2 = Me
Q3 = P75 Cuartil 3
D1 = P10 Decil 1
D2 = P20 Decil 2
.

D9 = P90 Decil 9
Clculo para v.e. discretas:
Igual que la mediana, cambiando:

50
n
100

por

k
n
100

Clculo para v.e. continuas:


k
k
Fi 1
n N i 1
Pk e i 1 100
a i e i 1 100
ai
fi
ni
17

Ejemplos percentiles v.e. discreta

xi

ni

Ni

20

20

30

50

44

94

20

114

10

124

k
40
n
124 49,6
100
100
k
95
n
124 117,8
100
100

124
Percentil 40, P40 = 3

Percentil 95, P95 = 6

n k /100 =
124x25/100 = 31

Percentil 25, P25 = 3 = Q1

n k /100 =
124x50/100 = 62

Percentil 50, P50 = 4 = Me = Q2

n k /100 =
124x75/100 = 93

Percentil 75, P75 = 4 = Q3

18

Ejemplos percentiles v.e. continua

Tallas

ni

Ni

fi

Fi

140-150

15

15 0.15 0.15

150-160

30

45 0.30 0.45

160-170

25

70 0.25 0.70

170-180

20

90 0.20 0.90

180-200

10 100 0.10

P40
P75

100

k
nk
Fi 1
N i 1
Pk ei 1 100
a i ei 1 100
ai
fi
ni

P40 150

0.4 0.15
40 15
10 150
10 158.33
0.30
30

P75 170

0.75 0.70
75 70
10 170
10 172.5 Q 3
0.20
20

19

1.3.2.

Caractersticas de Dispersin

Miden la Homogeneidad de las observaciones

Rango o recorrido

Valor mximo menos valor mnimo de la variable

Recorrido intercuartlico

Q 3 Q1

20

Varianza

ni x i x

2 i 1

2
n
x
ii

i 1

Desviacin tpica

Coeficiente de variacin

C. V .

21

Ejemplo

xi

ni

nixi

nixi2

20

80

320

40

240

1440

44

352

2816

10

36

360

3600

12

22

264

3168

162

1296

11344

ni x i 2

2 Var X i 1

11344 1296
x

162 162
2

6.02

2 6.02 2.4535

22

Momentos centrales (Respecto a la media)

ni x i x

r i 1

ni x i x

r 1 1 i 1

ni x i x

r 2 2 i 1

23

1.3.3

Caractersticas de forma

Coeficiente de Sesgo (Asimetra)

3
3

Si 1 0 Distribucin simtrica

Si 1 0 Distribucin sesgada a la derecha

Si 1 0 Distribucin sesgada a la izquierda

24

Coeficiente de Curtosis (Aplastamiento)

4
4

Distribucin igual de aplastada


que la distribucin Normal

Si

2 0

Si

Distribucin menos aplastada


2 0 que la distribucin Normal

Si

2 0

Distribucin ms aplastada que


la distribucin Normal

25

1.4 Grfico de caja


v.a.i.

mn

F1

f1

v.a.s.

Q1

Me

Q3

f2

F2

mx

f1=Q1-1.5(Q3-Q1) frontera interior inferior


f2=Q3+1.5(Q3-Q1) frontera interior superior
F1=Q1-3(Q3-Q1) frontera exterior inferior
F2=Q3+3(Q3-Q1) frontera exterior superior
V.A.I.= Dato ms prximo, por exceso, a f1
(valor adyacente inferior)
V.A.S.=Dato ms proximo, por defecto, a f2
(valor adyacente superior)
Valores atpicos o anmalos: Datos inferiores a f1
superiores a f2 (distinguindose)

**

anmalos

*
v.a.i.

Q1

Me

Q3

v.a.s

o
anmalos

26

Ejemplo
Sea la variable estadstica n de hijos. Los
datos de 30 familias son los siguientes:

1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4
mn = 0
mx = 10
Datos ordenados:
Q1 = 1
00000011111111222223333444458 10
Q3 = 3
Me = 2
f1 = -2
f2 = 6
F1 = -5
F2 = 9
Vai = 0
Vas = 5
Valores anmalos = 8, 10
0

10

27

You might also like