You are on page 1of 9

Cluster (Agrupaciones)

Dentro de cada closter hay afinidad Por qu compra un producto determinado?

Cluster Jerargico
Clster 2 Clster 3
Clster 1

Medidas de las variables


X1, X1, X1, independientes
x2,x3, x2,x3, x2,x3,
x4 x4 x4

Escala: dinero

Xbarra: promedio

4 por las 4 escalas

La variables para hacer un cluster se utilizan las variables independientes


(Escala), se puede utilizar la cantidad de variables deseables. Se utiliza el mtodo
jerrquico(tiene un mtodo grafico denominado Dendograma: permite visualiza como los
usuarios se van agrupando entre ellos, por medio de la distancia. Este determina el nmero de
clster, determina el mtodo de la distancia uclidiana al cuadrado, utiliza el mtodo de WARD
(Varianza(depende del valor de la media(referentes):

Mtodo de Ward: como se van a juntar la distancia,como se van a caracterizar

Segundo mtodo

K-mians

Centroides

1. Etiqueta: nombre que se lle pone a cluster


2. Entregar producto

cobrar

ANALIZAR

LOS CLUSTER SIRVEN PARA CALCULAR LOS CENTROIDES


1,ANALIZAR/ CONGLOMERADO JERARQUICO/

PASO cada una de estas

vENTA DE ARTICULO,VENTA DE VERDURAS/V ABARROTES/VENTA DE BEBIDAS

ESTADISTICOS: RANGO DE SOLUCINES MINIMOS CONGLOMERADO 2, MAX 5

GRAFICOS. SELECCIONAR DENDOGRAMA

METODO: METODO DE WARD

ACEPTAR

ANALIZAR/COMPARAR MEDIAS/MEDIAS

LISTA DEPENDIENTES: PASAR 4 VENTAS

LISTA INDEPENDIENTES: EL UTIMO WARD METHODO (2). ACEPTAR

UN NUEVO DOCUEMTNO COPIO Y PEGO EN UN NUEVO SPPSS LOS 2


CONGLOMERADOS

ANALIZAR / CLASIFICAR/ CONGLOMERADOS K-MEANS

PASAR VENTA

LEER INICIALES ABRIR DOCUMETO CENTROIDES

Cluster 1 (8) Cluster 2 (22)


V. Verduras V.articulos
V. Bebidas V.Abarrotes

VENTA DE ARTICULOS 2,3 2,8

CRM CLIENES FIELES

WEKKA

REMOVE TODAS EXCEPTO LAS DE VENTA (NO SON ESCALA). LUEGO

CLUSTER

CHOSSE/SIMPLE K-MEAS

LUEGO EN BARRA CLIC EN SIMLE KAMIS/ SHOW PROPERTIES


MIRAR QUE DIGA 2 CLUSTER Y UCLIDINAS U OK LUEGO STARR

LUEGO CLICK EN LA VENTANITA ABRIR /VIZUALICE CLUSTER Y APARECE GRAFICA CON PUNTOS

Mirar

http://www.uoc.edu/web/esp/art/uoc/molina1102/molina1102.html

MINERIA DE DATOS DE JOS

KDD: Descubrimiento de bases de datos

Escala de liker

DATOS

. . . . . . . . . .

.. .. .. . . . .

Desempeo de 3 estudiantes

P1 P2 P3 NOTAS
Estudiante 1 3 3 3 3
E2 0 5 4 3
E3 2 3.5 3.5 3

PUNTO: Es la interseccin de 2 rectas.

Cul fue es estudiante con mejor desempeo?

El de mejor desempeo es el 1, luego 3 y luego 2

Para comprobarlo se calcula la varianza

( ) 2
12 =

39
12 = 3 = 0
3
102 + 152 + 142
22 = 32 = 4,6 = 2,1
3
122 + 2(3,5)2
32 = 32 = 0,83 = 0,91
3
0,91; 2,1 es la desviacin, raz de cada una. El de menor varianza es el mejor, por lo tanto 1,3 y
2.

EJERCICIO

El gerente de una empresa debe decidir entre Mara y Alejandra para cubrir el cargo de
gerente comercial. Mara y Alejandra tienen una hoja de vida intachable y las mejores
calificaciones para cubrir el cargo. Que le sugerimos al gerente.

Para ello el gerente cada dia les hace una prueba en una escala de Likert de 1 a 10
Lunes Martes Mircoles Jueves Viernes Promedio
Mara 10 8 6 2 4 6
Alejandra 9 8 2 1 10 6

Se decide a la ms regulas, la que tenga menor varianza


100 + 64 + 36 + 4 + 16
2 = 62 = 8
5
= 2,82
81 + 64 + 4 + 1 + 100
2 = 62 = 8
5
= 3,72
Conseguir set de datos Excel

Anonimizaran de datos

Reconciliacin de datos

CLASE 20/09/2012
ARBOL DE DECISIONES
(weka) Algoritmo j48
10 INSTANCIAS=10 CLIENTES
Entropa de la informacin: desorden de la informacin
Se calcula con Log en base 2
Calcular la entropa de cada uno de los
atributos(moroso,antigudad,Ingresos,traajos)
Si entropa es cerca a uno es el acertado
Entropia General = () = 2
4 4 6 6
() = 2 2
10 10 10 10
() = 0,971
De si se concedio o no el crdito, se cuenta el nmero de si en conceder(4)
- MOROSIDAD
morosos (4) y en conceder(a ninguno le dieron el credito)
0 4
() = 2 0 2 1
4 4
() = 0
No morosos (6) y de esos a 4 le concedieron el crdito
4 4 2 2
() = 2 2
6 6 6 6
() = 0,9182

(0)4 + 6(0,9182)
() =
10
() = 0,55

() = 0,971 0,55
() = ,

- ANTIGEDAD (AOS)

>5 = 3 y en conceder solo 1 le dijeron si


1 1 2 2
()>5 = 2 2
3 3 3 3
()>5 = 0,9182
<1 y en conceder solo 2 en conceder
2 2 1 1
()<1 = 2 2
3 3 3 3
()<1 = 0,9182
1-5 aos (4) en conceder solo 1 que si
1 1 3 3
()15 = 2 2
4 4 4 3
()15 = 0,8112

3(09182) + 3(0,9182) + 4(0,8112)


() =
10
() = 0,8754

() = 0,971 0,55
() = ,
- INGRESOS

600-1200 = 4 y en conceder solo 1 le dijeron si

1 1 3 3
()6001200 = 2 2
4 4 4 4

()6001200 = 0,8112

>1200 = 4 y en conceder solo 3 le dijeron si


3 3 1 1
()>1200 = 2 2
4 4 4 4

()>1200 = 0,8112

<600 = 2 y en conceder solo 0 le dijeron si


0 2 2
()<600 = 2 0 2
2 2 2

()<600 = 0

4(0,8112) + 4(0,8112) + 0(2)


() =
10
() = 0,6489

() = 0,971 0,6489

() = ,

- TRABAJO.FIJO
Si=7 y conceder si=3
3 3 4 4
(. ) = 2 2
7 7 7 7

(. ) =0,9852

No= 3 y conceder si=1


1 1 2 2
(. ) = 2 2
3 3 3 3

(. ) = 0,9182
7(0,9852) + 3(091882))
(. ) =
10
(. ) = 0,9651

(. ) = 0,971 0,9651

(. ) = ,

Morosidad: 0,421 (1)


Antigedad: 0,0956 (3)
Ingresos: 0,3221 (2)
Trabajo fijo: 0,0059 (4)

ANTIGUEDAD
MOROSIDAD INGRESOS

wekka
Clasify/choose/tree/j48 /0k
Using traing/ start
Click izquiz/visualize tree

ARBOL
SODIO Y POTASIO
INSTACIAS 98% INFORME BUENO
MATRIZ
Lo mas importante para generar el frmaco es mirar el nivel de potasio
Eventos:
>5% mirar tensin sangunea
Si es NORMAL, formulas frmaco x hay 26 personas

CHOOSE/Filtros/unsuervised/attribute/addexpresiom
Click al frente de choose
A5 y a6 porque estas son sodio y potasio

Luego appli
Luego clasify/use trainig/ desplegar frmaco
Chosse/tree/J48
Si la porcin de sodio y potasip en el `potasios es menos al 14,64 mirar temsion

You might also like