Professional Documents
Culture Documents
Python (6 libreras!)
Orientacin prctica
Evaluacin
Programa
Mdulo Librera Duracin
Introduccin/
numpy/scipy 2 Semanas
Estadstica
Probabilidad e
- 3 Semanas
Inferencia
scipy Modelado /
networkx Estadstica
nltk
/ Anlisis
numpy
pandas
Machine
Dataset
Learning /
Datos Pre-procesamiento
Predicciones
crudos scikit-learn
Qu habilidades requiere
un Data Scientist?
1 0
2 0
3 0
4 0
5 0
6 0
7 0
Est cargada la moneda?
8 0
9 0 Hiptesis/Modelo
n
X nXm
1 1
p= p k= + p k=
2 2
k=m k=0
1 muestra scipy.stats.ttest_1samp
157 161
t = 1.445, p = 0.199
165
174 Distribucin
Estadstico
conocida
t-test scipy.stats.ttest_1samp
Muestra nica
Alturas (cm)
Sabemos que la altura media de la
161
gente en Noruega es 175 cm.
171 Es distinta nuestra altura?
157
3 10 9 Ms poderoso que el de 2
4 9 10 muestras independientes
5 5 5
Tiene que haber una constante
entre muestras (aqu el alumno)
Alturas (cm)
orden triunfos v
mujeres varones
v 3
162 181 3
v
3
171 187 v
2
m
1
157 161 v
165 m suma
v
174 m U=12, p=0.12
Tests de rank sum, Mann-Whitney U, Wilcoxon
scipy.stats.ranksums
Muestras independientes
scipy.stats.mannwhitneyu
0 = hv hm = 10.27 1 2
Test de Permutaciones
altura etiqueta
162 m
171 m
157 m
181 v
187 v
161 v
165 v
174 v
0 = hv hm = 10.27 p=0.11
Correlacin de Pearson scipy.stats.pearsonr
2 [ 1, 1]
Mide correlacin lineal de los datos, asumidos normales
6 = 0.39 p = 0.24
= 0.98 p < 10
ANOVA scipy.stats.f_oneway
mujeres varones
t = 1.445, p = 0.199, t-test
162 181
plt.show()!