Professional Documents
Culture Documents
a la educacin
1 parte
Introduccin a la minera de datos
27 de junio de 2011
Mercedes Torrado
Departamento Mtodos de Investigacin y
Diagnstico en Educacin (MIDE)
Este trabajo cuenta con licencia de Creative Commons:
Minera de datos aplicados a la educacin est subjecta a una licencia de ReconocimientoNoComercial-SinObraDerivada 3.0 (CC BY-NC-ND 3.0)
Para citar la obra:
Torrado, M. (2011) Minera de datos aplicados a la educacin. Barcelona: Universidad de
Barcelona. Deposito Digital http://hdl.handle.net/2445/19862
Toms Aluja en su artculo La minera de datos, entre la estadstica y la inteligencia artificial publicado en el
2001 en la revista QESTIIO (vol 25, 3, p 479-498) hace todo un repaso de los orgenes de la Minera de datos
en cuanto a los elementos correspondientes de la Estadstica y de la inteligencia artificial
Inteligencia artificial
Estadstica
Red (network)
Modelo
Ejemplos (patterns)
Observaciones, individuos
Variables
Inputs
Variables explicativas
Outputs, targets
Variables de respuesta
Errores
Residuos
Training, learning
Estimacin
Criterio de ajuste
Parmetros
Aprendizaje supervisado
Regresin, discriminacin
Aprendizaje no supervisado
Clasificacin
Triangulacin
estadstica
(Torrado, 2007)
Knowedge Discovery in
Databases
(KDD)
Exploracin y
Fuente de Datos Pre-procesamiento
Fuente de
datos
Muestreo
Seleccin
Bases de
datos
Limpieza de
datos
Datos que no existen
Datos no clasificados
transformacin
Reconocimiento Evaluacin e
interpretacin
de patrones
Transformacin
de datos
Reducir variables /
dimensionalidad
Modelado
Informes
Clasificacin
Regresin
Creacin de
caractersticas
Agrupamiento
Generacin de variables
nuevas
Asociacin
Identificacin de
extremos
Exploracin y
Fuente de Datos Pre-procesamiento
Fuente de
CLASIFICACIN
datos
transformacin
Transformacin
de datos
Bases
de
La
finalidad
es crear un modelo para poder
datos
Reducir variables /
predecir la pertenencia
grupo
Limpieza dea un determinado
dimensionalidad
datos
Creacin de
caractersticas
EJEMPLO:
Datos que no existen
Generacin de variables
Diagnosticar alumnos de xito acadmico
Datos no clasificados
Reconocimiento Evaluacin e
interpretacin
de patrones
Modelado
Informes
Clasificacin /
asociacin
Regresin
Agrupamiento
nuevas
Identificacin de
PRUEBAS:extremos
rboles de decisiones, anlisis discriminantes,
etc..
EXPLOTACIN
Exploracin y
Fuente de Datos Pre-procesamiento
Fuente de
REGRESIN
datos
Muestreo
Seleccin
transformacin
Reconocimiento Evaluacin e
interpretacin
de patrones
Transformacin
de datos
Modelado
Informes
Clasificacin
/asociacin
Regresin
Agrupamiento
extremos
PRUEBAS:
Regresin lineal, redes neuronales, regresin EXPLOTACIN
logstica, etc
Exploracin y
Fuente de Datos Pre-procesamiento
transformacin
Reconocimiento Evaluacin e
interpretacin
de patrones
Fuente de
Muestreo
AGRUPAMIENTO
/ SEGMENTACIN
Transformacin
datos
Seleccin
EJEMPLO:
Datos que no existen
Identificar perfiles de alumnos
Datos no clasificados
Informes
de datos
Bases
de
La
finalidad
es crear un modelo para poder
datos
Reducir variables /
agrupar con caractersticas
similares
Limpieza de
dimensionalidad
datos
Modelado
Clasificacin /
asociacin
Creacin de
caractersticas
Regresin
Generacin de variables
nuevas
Agrupamiento
Identificacin de
PRUEBAS:extremos
K-medias, Bietpico, etc..
EXPLOTACIN
Exploracin y
Fuente de Datos Pre-procesamiento
Fuente de
datos
Bases de
datos
transformacin
Reconocimiento Evaluacin e
interpretacin
de patrones
LOS
DATOS DEBEN SER (Viera et al., 2009)
Muestreo
Seleccin
Transformacin
de datos
Modelado
Informes
Precisin sin
errores de medicin
Reducir variables /
Clasificacin /
Limpieza
de
dimensionalidad
asociacin
Consistencia
datos
coherentes
datos
Creacin de
Regresin
Completos
sin
falta
de
atributos
caractersticas
Agrupamiento
Datos que no existen
Generacin de variables
Relevancia
al problema
Datos no clasificados Concernientes
nuevas
Identificacin
de
No
redundancia
Sin duplicar la misma
extremos
informacin
Medicina y farmacia
Diagnstico de enfermedades y la efectividad de los tratamientos
Astronoma
Identificacin de nuevas estrellas y galaxias
Ciencias ambientales
Identificacin de modelos de funcionamiento de ecosistemas naturales o artificiales
Ciencias sociales
Estudio de los flujos de opinin, identificar barrios con conflicto en funcin de valores sociodemogrgicos
EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)
EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)
EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)
EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)
Bibliografa
PASAMOS A LA SEGUNDA
PARTE ?
O
HACEMOS DESCANSO?