Professional Documents
Culture Documents
1. Analisis Komponen Utama Analisis komponen utama digunakan untuk menjelaskan struktur matriks varianskovarians dari suatu set variabel melalui kombinasi linier dari variabel-variabel tersebut. Secara umum komponen utama dapat berguna untuk reduksi dan interpretasi variabel-variabel. Misalkan saja terdapat p buah variabel yang terdiri atas n buah objek. Misalkan pula bahwa dari p buah variabel tersebut dibuat sebanyak k buah komponen utama (dengan k <= p yang merupakan kombinasi linier atas p buah variabel tersebut. k komponen utama tersebut dapat menggantikan p buah variabel yang membentuknya tanpa kehilangan banyak in!ormasi mengenai keseluruhan variabel. "mumnya analisis komponen utama merupakan analisis intermediate yang berarti hasil komponen utama dapat digunakan untuk analisis selanjutnya. #alam bentuk matematis$ katakan saja bahwa Y merupakan kombinasi linier dari variabel-variabel X%$ X&$ ' $ Xp yang dapat dinyatakan sebagai
Y = W%X% ( W&X& ( ' ( WpXp dengan Wi Xi Y adalah bobot atau koe!isien untuk variabel ke i adalah variabel ke i adalah kombinasi linier dari variabel X
Secara prinsip pembentukan komponen utama merupakan pembentukan kombinasi linier dari variabel-variabel yang diamati. Dalam analisis komponen utama ditentukan suatu metode untuk mendapatkan nilai-nilai koefisien atau bobot dari kombinasi linier variabel-variabel pembentuknya dengan ketentuan sebagai berikut Bertho antular - %
yang diamati dan memiliki varians terbesar komponen utama kedua (K terbesar komponen utama ketiga (K varians ketiga terbesar $ komponen utama ke p (K yang terkecil. ntuk mendapatkan koefisien komponen utama secara bersamaan dapat menggunakan salah satu cara berikut ini dekomposisi eigen value dan eigen vector dari matriks korelasi atau kovarians dari variabel-variabel yang diamati. Dalam hal ini eigen value merupakan varians setiap komponen utamanya dan eigen vector merupakan koefisien-koefisien komponen utamanya dekomposisi nilai singular dari matriks data yang berukuran n & p. 'nterpretasi dari komponen utama adalah bah(a komponen utama tersebut merupakan suatu sistem sumbu baru dalam ruang vektor berdimensi banyak peubah yang diamati. )elalui komponen utama salib-salib sumbu tersebut telah diubah skalanya dan dirotasi hingga memiliki sifat varians yang terurut semakin kecil dan ortogonal. Bertho antular - &
p # "
maupun K
"
, dan memiliki
,K
"
,%,K
(p-!)
Bertho antular - )
2. Analisis Komponen Utama dalam R (a) Fungsi princomp Analisis Komponen tama dalam soft(are / dapat dianalisis menggunakan fungsi
princomp. *ungsi princomp menganalisis komponen utama dari data berupa matriks numerik dan menghasilkan nilai-nilai berupa suatu objek dalam kelas princomp. 0en,elasan mengenai synta& dan penggunaan fungsi princomp adalah sebagai berikut
+ !it,pca <- princomp(-$ ... atau + !it,pca <- princomp(!ormula$ data = ."//$ subset$ na.action$ ... atau + !it,pca <- princomp(-$ cor = *A/S0$ scores = 12"0$ covmat = ."//$ subset = rep(12"0$ nrow(as.matri-(- $ ...
3eterangan4 !ormula4 data4 adalah !ormula untuk variabel numerik tanpa melibatkan variabel respon data yang digunakan berupa data !rame meliputi variabel-variabel dalam !ormula Sebagai default diambil variabel dari 5environment(!ormula 6. subset4 sebuah vektor yang digunakan untuk memilih baris (pengamatan dari matriks 7 Bertho antular - 8
.ilai-nilai yang dapat ditampilkan hasil analisis !ungsi princomp adalah sebagai berikut
simpangan baku (standard deviation dari komponen utamanya matriks variabel loading yaitu matriks yang kolom-kolomnya berupa eigen center4 rata-rata yang digunakan.
trans!ormasi dari tiapvariabel. banyak pengamatan. nilai-nilai komponen utamanya bila ada penanganan data hilang
Bertho antular - ;
untuk menampilkan nilai varians untuk menampilkan nilai loadings untuk membuat scree plot untuk menampilkan nilai komponen utama
#alam !ungsi princomp analisis komponen utama menggunakan nilai eigen dari matriks korelasi atau matriks varians-kovarians. Analisis komponen utama yang menggunakan dekomposisi nilai singular dari matriks 7 berada dalam !ungsi lain yaitu prcomp. *ungsi print dapat digunakan untuk menampilkan hasil analisis dan !ungsi plot dapat digunakan untuk menampilkan screeplot.
Conto Kas!s "$ 5olicoeur dan )osimann mempela,ari mengenai hubungan antara ukuran dan bentuk se,enis kura-kura. 0ada penelitiannya mereka mengambil sampel sebanyak "6 kura-kura ,antan dan "6 kura-kura betina dan diukur pan,ang, lebar dan tinggi kura-kura tersebut. (data diambil dari 5ohnson 7 8ichern, "99" halaman ##:) Sebelum melakukan analisis dengan definisikan variabel X! ; length, X" ; width, X# ; height dan X6 ; sex kemudian input dulu data tersebut menggunakan soft(are / sebagai berikut
> x$<c( 1, %, &, &, 9#,1!&) ,9$,9#,99,1!$,1!$,1!!,1!$,9 ,99,1!#,1! ,1!',1!',11#,11',11#,1 , &,9!,9!,91,9", 9,9",9#,9",9&,9#, 1 ,1$%,1"$,'%,' , !, %, #, 1, ", ", $, 9,
>
x"<-
4akukan transformasi sederhana terhadap data (&!, &" dan &#) tersebut menggunakan log sebagai berikut
> y1<-log(x1) > y$<-log(x$) > y"<-log(x") > y<-data,frame(y1,y$,y") > -<-y.$#/% ,0
> fit_pca<-princomp(-, cor=)1234) > summary(fit_pca) 5mportance of components/ 6omp,1 3tandard de7iation 6omp,$ 6omp,"
8roportion of 9ariance !,9&!#!'' !,!$%&&!&9 !,!1% "1#' 6umulati7e 8roportion !,9&!#!'' !,9 #1& %" 1,!!!!!!!!
-erlihat dari proporsi varians kumulatif Komponen pertama dapat men,elaskan :<= total varians dan bila ditambahkan komponen kedua men,adi :>=. Artinya apabila kita hanya mengambil satu komponen sa,a yaitu komponen pertama sudah mencukupi. .ilai simpangan baku (standard deviation) pada baris pertama hasil diatas diperoleh dari akar positif nilai eigen (eigen value) matriks kovarians dari log(y!), log(y") dan log(y#). Bertho antular - =
> loadings(fit_pca) 2oadings/ 6omp,1 6omp,$ 6omp," y1 y$ y" !,& " -!,1#9 !,'1"
6omp,1 6omp,$ 6omp," 33 loadings 8roportion 9ar 6umulati7e 9ar 1,!!! !,""" !,""" 1,!!! !,""" !,&&' 1,!!! !,""" 1,!!!
.ilai-nilai loading yang ditampilkan pada hasil di atas adalah nilai vektor eigen dari matriks kovarians log(y!), log(y") dan log(y#). 3ungsi komponen utamanya adalah sebagai berikut
KU! ; 9.<># log(y#) ? 9.@!9 log(y#) ? 9.@"# log(y#) KU" ; -9.!@: log(y#) - 9.@:6 log(y#) ? 9.A>> log(y#) KU# ; 9.A!# log(y#) - 9.<"" log(y#) - 9.#"6 log(y#)
ntuk membuat dan menampilkan scree plot dilakukan dengan cara sebagai berikut
B plot(fit_pca,type="lines")
Dari scree plot tersebut terlihat bah(a kurva mulai landai pada titik comp " artinya bah(a dengan satu komponen sa,a sudah mencukupi untuk me(akili ketiga variabel tersebut )enampilkan nilai (score) komponen utama
> fit_pca$scores 6omp,1 $# -!,$& %'""9! 6omp,$ !,!&1!& #!"' 6omp," !,!!!%!&&1%9 '#
$' -!,$"&!%#'!' -!,!"%1$1!9"# -!,!!'%$'&'" $ -!,1199$"%'& !,!1%1$#1'&9 -!,!"&&9$$$%% -!,!1%9#'$'&! -!,!$ &!%#1"! !,!1&9'9"& #
$9 -!,1$!'$ "
!,!1&#'11&1& -!,!! " $&&#$ !,!1"#"""'"! !,!!#19$9"%% !,!$' #!" &$ 9#!#
"% -!,!!&#'#$#9 -!,!1&'%%1'&# -!,!!'1 "# -!,!!&$& %#$ -!,!11%%9'! "& -!,!119'9#9$ "' !,!&! &9$$ !,!!! !1$$%&
!,!!&1'"9'&# !,!$&'#1&9 9
Bertho antular - ?
!,1!#!!%&$& -!,!$9"#"&&%9 -!,!! #!'#"9% !,1#$%1&&"$ !,1'9%# ##9 !,1'9%'"#9! !,$!&' "9!" !,!"$%9 '' !,!!##$" 1&%
Conto Kas!s 2# Data berikut mengenai rates of return dari lima saham perusahaan yaitu Allied Chemical, du 0ont, nion Carbide, 2&&on dan -e&aco yang berada di pasar saham .e( Dork yang diambil pada periode !:A@ hingga Desember !:A<. +erdasarkan nilai penutupan pada hari 5umEat rates of return didefiniskan sebagai
rates of return=
Harga penutupan Jum ' at ini Harga penutupan Jum ' at se elumnya Harga penutupan Jum ' at se elumnya
Diasumsikan bah(a pengamatan saling bebas dalam hal ini adalah minggu dan saham perusahaan adalah variabelnya yang saling berkorelasi. Dari data sebanyak !99 minggu diperoleh vektor rata-ratanya adalah
Bertho antular - %@
/ merupakan matriks varians-kovarians dari matriks pengamatan yang sudah dibakukan. (5ohnson dan 8ichern, "99") Dalam kasus ini yang diketahui adalah matriks kovarians atau matriks korelasi maka fungsi princomp digunakan dengan cara sebagai berikut
> r<c(1,,#'',,#!9,," ',,%&$,,#'',1,,#99,," 9,,"$$,,#!9,,#99,1,,%"&,,%$&,," ', ," 9,,%"&,1,,#$",,%&$,,"$$,,%$&,,#$",1) > <<-matrix(r, #, #) > <
.,10
.,$0
.,"0
.,%0
.,#0
.1,0 1,!!! !,#'' !,#!9 !," ' !,%&$ .$,0 !,#'' 1,!!! !,#99 !," 9 !,"$$ .",0 !,#!9 !,#99 1,!!! !,%"& !,%$& .%,0 !," ' !," 9 !,%"& 1,!!! !,#$" .#,0 !,%&$ !,"$$ !,%$& !,#$" 1,!!!
Bertho antular - %%
> fit_pca$<-princomp(co7mat=<, cor=?<@4, n,o=s=1!!) > summary(fit_pca$) 5mportance of components/ 6omp,1 3tandard de7iation 1,&9!1 ! 6omp,$ 6omp," 6omp,% 6omp,#
8roportion of 9ariance !,#'1"%$$ !,1&1 "$' !,1!'9"#! !,!9!"!!!$ !,!& # 999 6umulati7e 8roportion !,#'1"%$$ !,'""1'%9 !, %111!! !,9"1%1!!1 1,!!!!!!!!
dari hasil perhitungan tersebut terlihat bah(a proporsi varians untuk komponen ! baru mencapai @A= dan apabila diambil dua komponen proporsi varians mencapai A#=.
> loadings(fit_pca$) 2oadings/ 6omp,1 6omp,$ 6omp," 6omp,% 6omp,# .1,0 -!,%&% .$,0 -!,%#' .",0 -!,%'! !,$%! !,&1$ -!," ' -!,%#1 -!,$!& !,&'&
!,&&$ -!,%!!
.%,0 -!,%$1 -!,#$& -!,#%1 -!,%'$ -!,1'& .#,0 -!,%$1 -!,# $ !,%"# !," $ !," #
.ilai loading yang diperoleh hasilnya sama dengan nilai eigen vektor. .ilai loading ini digunakan sebagai koefisien dari fungsi komponen utamanya.
(2) Fungsi prcomp Selain menggunakan fungsi princomp analisis komponen utama ,uga dapat menggunakan fungsi prcomp. 3ungsi prcomp menganalisis komponen utama menggunakan dekomposisi nilai singular (singular value decomposition atau svd) dari matriks data berbeda dengan fungsi princomp yang menggunakan nilai eigen dari matriks varians-kovarians. 3ungsi print dapat digunakan untuk menampilkan hasil analisis dan fungsi plot dapat digunakan untuk menampilkan screeplot. +erikut pen,elasan synta& dan pengunaannya.
B prcomp(&, ...) atau B prcomp(formula, data ; . 44, subset, na.action, ...) atau B prcomp(&, ret& ; -/ 2, center ; -/ 2, scale. ; 3A4S2, tol ; . 44, ...)
keterangan$ !ormula4 data4 adalah !ormula untuk variabel numerik tanpa melibatkan variabel respon data yang digunakan berupa data !rame meliputi variabel-variabel dalam !ormula Sebagai default diambil variabel dari 5environment(!ormula 6. subset4 sebuah vektor yang digunakan untuk memilih baris (pengamatan dari matriks 7
Bertho antular - %)
.ilai-nilai yang dapat ditampilkan hasil analisis !ungsi princomp adalah sebagai berikut
sdev$
.ilai simpangan baku dari komponen utamanya. Daitu akar dari nilai eigen matriks varians-kovarians atau matriks korelasinya melalui perhitungan nilai singular matriks
data.rotation$ adalah matriks variabel loading. Daitu matriks yang kolom-kolomnya merupakan nilai-nilai eigen matriks varians-kovarians. &$ adalah nilai dari data yang telah dirotasikan. .ilai ini akan ada apabila fungsi Fret&G bernilai -/ 2 . center, scale$ adalah nilai pemusatan dan pembakuan yang digunakan
0enggunaan fungsi prcomp dapat dilakukan pada contoh kasus ! dengan cara sebagai berikut
Bertho antular - %8
8roportion of 9ariance !,9&1 !,!$%' !,!1% 6umulati7e 8roportion !,9&1 !,9 #$ 1,!!!!
$9 -!,1$!'$ "
"! -!,1#$#9$' 1 -!,!! 9! $11$ -!,!1&9'9"& # "1 -!,1!&!"9$9& "$ -!,!9"!$'%"! !,!1&#'11&1& !,!! " $&&#$
"" -!,1!&"'1!%$ -!,!!1$%#$'" "% -!,!!&#'#$#9 -!,!1&'%%1'&# "# -!,!!&$& %#$ -!,!11%%9'! "& -!,!119'9#9$ "' " "9 %! %1 %$ %" %% %# !,!&! &9$$
-!,!!&1'"9'&#
!,!%1 &$9'" -!,!1! '&&"!" -!,!! 9' #&$& !,!%'#!! 1# -!,!1'%%!"&"1 -!,!!$1!&!'9" !,!'!1'1$&% -!,!""!#'$'11 -!,!!!&&%'$'1 !,!%!##"9"$ -!,!$''%'!9&" -!,!%19 $!919 !,11$' ! " !,!$1$ 9%11& !,!1&$'9& &# !,!! #!'#"9% -!,!!##$" 1&% !,!!$9!9%99&
Bertho antular - %;
Dengan cara ini menghasilkan nilai skor komponen utama yang sama dengan cara sebelumnya. .ilai proporsi varians untuk tiap komponen utama ,uga bernilai sama dengan cara sebelumnya. Selain menggunakan fungsi princomp dan prcomp analisis komponen utama ,uga dapat dilakukan dengan fungsi principal. -etapi fungsi principal ini hanya dapat dilakukan apabila telah diinstallkan paket ps$c . 0aket ps$c dapat diunduh secara gratis di C/A. (http$HHcran.rpro,ect.orgH).
Bertho antular - %=
dengan$ #i ; rata-rata variabel asal ke i %i ; spesifik faktor ke i $, ; Common faktor ke &. li, disebut loading dari peubah asal ke i pada faktor ke &. Atau dalam bentuk matriks men,adi
(X I ) (p&!)
Asumsi yang digunakan dalam analisis !aktor adalah4 #ata berasal dari populasi yang berdistribusi normal univariat Dalam set data terdapat multikolinieritas dapat diu,i dengan menggunakan ,i +artlett. 2(F) ; ', 2(e) ; 9
Cov(F) ; 2(FFG) ; I Cov(e) ; 2(e e() ; ; diag('!, %., 'p) F dan saling bebas, Cov (D$ * = 0 (D$ *6 = @
Koefisien li, disebut loading dari variabel asal ke i pada faktor ke &, maka matriks L adalah matriks factor loading dan $!, $",%., $m , %!, %",%. %p adalah tidak terobservasi.
2. Analisis %a&tor dalam R Analisis 3aktor dalam soft(are / dapat dianalisis melalui fungsi ,actanal-.. 3ungsi ,actanal-. adalah analisis ekstraksi faktor menggunakan metode kemungkinan maksimum. Dalam soft(are /, pen,elasan tentang model analisis faktor adalah sebagai berikut
/;0,?e
dengan / adalah vektor berukuran (p & !), K adalah matriks loading berukuran (p & k), , adalah vektor skor faktor berukuran (k & !) dan e adalah galat berukuran (p L !). Dalam model ini tidak ada komponen yang terobservasi kecuali /. Asumsi yang mendasari model ini adalah bah(a faktor tidak saling berkorelasi, dan bah(a galat saling bebas dengan varians phi yang disebut 1uniMuenesses1. Kemudian dalam analisi faktor model bagi matriks varians-kovarians / adalah
1;0E0 23i
Apabila dilakukan rotasi terhadap data maka 0 dapat digantikan dengan 40 untuk setiap Bertho antular - %?
= ' ! X $
dan kemudian menggantikan nilai-nilai parameter dengan penaksirnya. 0rinsip )etode +artlett adalah meminimumkan ,umlah kuadrat galat yang sudah dibakukan atau diboboti. berikut ini adalah pen,elasan synta& dan cara penggunaannya. raian
> factanal(x, factors, data = >@22, co7mat = >@22, n,o=s = >1, su=set, na,action, start = >@22, scores = c("none", "regression", "Aartlett"), rotation = "7arimax", control = >@22, ,,,)
Beterangan/
loadings/ ;e
;ecil =erdasar;an Cumla+ ;uadrat loading,, uniIuenesses/ correlation/ criteria/ menampil;an nilai uniIuenesses, menampil;an matri;s ;orelasi yang diguna;an, +asil dari optimalisasi yaitu nilai -$ log-li;eli+ood dan informasi iterassi yang diguna;an factors/ dof/ ?+e argument DfactorsE, menampil;an nilai deraCat ;e=e=asan model analisis fa;tor
Dalam analisis faktor ada banyak variasi penggunaannya sehingga sulit bagi kita untuk membandingkan output dari program yang berbeda-beda. +agaimanapun metode optimalisasi dalam analisis faktor menggunakan ma&imum likelihood cukup sulit.
> fit <- factanal(data;u, factors=banyak_faktor, rotation="7arimax") > print(fit, digits=$, cutoff=,", sort=?<@4) > load <- fit$loadings > plot(load,type="n") > text(load,la=els=names(mydata),cex=,') : Jutput analisis fa;tor : *enampil;an loading factor : plot fa;tor 1 dan fa;tor $ : menam=a+;an nama 7aria=el
Conto Kas!s " Dalam suatu studi consumer)preference diambil sampel acak dari se,umlah konsumen. Kepada mereka ditanyakan mengenai @ atribut dari sebuah produk baru. /espon dari konsumen menggunakan skala A semantik differensial, yang hasilnya telah dihitung men,adi matriks korelasi berikut ini (5ohnson 7 8ichern, "99" halaman 6>A)
Atribut (Pariabel) -aste Qood buy for money 3lavor Suitable for snack 0rovides lots energy
Sebelum menganalisis data tersebut perlu diinputkan dulu matriks korelasinya dengan cara sebagai berikut
> mc<matrix(c(1,,!$,,9&,,%$,,!1,,!$,1,,1",,'1,, #,,9&,,1",1,,#,,11,,%$,,'1,,#,1,,' 9,,!1,, #,,11,,'9,1), #, #) > mc .,10 .,$0 .,"0 .,%0 .,#0 .1,0 1,!! !,!$ !,9& !,%$ !,!1 .$,0 !,!$ 1,!! !,1" !,'1 !, # .",0 !,9& !,1" 1,!! !,#! !,11 .%,0 !,%$ !,'1 !,#! 1,!! !,'9 .#,0 !,!1 !, # !,11 !,'9 1,!!
)actor1 )actor$ 33 loadings 8roportion 9ar 6umulati7e 9ar $,"9& !,%'9 !,%'9 $,!' !,%1& !, 9#
?+e degrees of freedom for t+e model is 1 and t+e fit Has !,!$""
#ari output diatas terlihat bahwa *aktor % beranggotakan variabel &$ variabel 8 dan variabel ; sedangkan variabel % dan variabel ) berada pada *aktor &.
6. Menent!&an 7an$a& %a&tor Bal yang penting dalam analisis !aktor adalah menentukan berapa banyak !aktor yang mesti diambil. 9eberapa metode dapat digunakan untuk menentukan banyak !aktor$ misalnya menggunakan kriteria nilai eigen$ proporsi varians dan secara gra!is menggunakan screeplot. "ntuk itu dalam so!tware 2 disediakan paket nFactors. *ungsi yang digunakan dalam paket ini adalah nScree$ uraian berikut adalah penjelasan mengenai synta- dan contoh penggunaannya *ungsi nScree dalam so!tware 2 adalah suatu !ungsi untuk menganalisis banyaknya komponen atau !aktor dalam analisis !aktor eksplanatori. *ungsi ini berguna untuk memberikan in!ormasi mengenai banyak !aktor melalui aturan 3aiser dan analisis paralel.
3eterangan4 eig4 adalah parameter berupa eigenvalues yang akan dianalisis Bertho antular - &8
Components
4 berupa data !rame yang berisi banyaknya komponen atau !aktor yang didasarkan atas aturan yang berbeda
ComponentsGnoc ComponentsGna!
4 9anyaknya komponen atau !aktor berdasarkan koordinat optimal (oc 4 9anyaknya komponen atau !aktor berdasarkan a!!eleratoin fa!tor (a!
ComponentsGnpar.analysis 4 9anyaknya komponen atau !aktor berdasarkan koordinat analisis paralel ComponentsGnkaiser 4 9anyaknya komponen atau !aktor berdasarkan aturan 3aiser Analysis 4 9erupa #ata !rame berisi vektor yang berkaitan dengan aturan yang berbeda AnalysisG0igenvalues 4 Menampilkan nilai eigen AnalysisGArop AnalysisGCumu AnalysisGAred.eig AnalysisGHC 4 .ilai proporsi varians yang dihitung dari nilai eigen 4 proporsi kumulati! dari varians yang dihitung dari nilai eigen 4 prediksi nilai eigen dari setiap koordinat garis regresi optimal 4 nilai koordinat optimal (oc
AnalysisGAcc.!actor 4 nilai A!!eleration fa!tor ,a!, AnalysisGA* 4 nilai kritis a!!eleration fa!tor ,a!,
Secara umum contoh penggunaan paket nFactors untuk data pada Contoh kasus % dengan banyak pengamatan adalah &@@ dapat dilihat pada synta- berikut ini
: *enentu;an =anya; fa;tor yang die;stra;si > li=rary(n)actors) > e7 <- eigen(mc) : get eigen7alues > ap <- parallel(su=Cect=$!!,7ar=#,rep=1!!,cent=,!#) > n3 <- n3cree(e7$7alues, ap$eigen$Ie7pea) > plotn3cree(n3)
1,11'1%$9 !,$"9$'"% !,$"9$'"% 1,!"#$%'1 !,$$1'"$' !,%&1!!&$ !,9% ' '# !,$!"$1%# !,&&%$$!' !, % %#$ !,1 1'$%# !, %#9%#$ 1,!!!!!!!
!,'19$&&1 !,1#%!#%
%!n)si Alternati, !nt!& Analisis %a&tor dalam R (1) Fungsi factor.pa dalam Paket psych *ungsi lain untuk analisis !aktor adalah factor.pa( ) yang terdapat pada Aaket psych. #alam !ungsi ini menyertakan analisis !aktor menggunakan prin!ipal a"is. #ari sekian banyak metode analisis !aktor pendekatan konvensional adalah prin!ipal a"es melalui dekomposisi nilai eigen dari matriks korelasi dipeorleh nilai komunalitas dari tiap variabel dan ditaksir n !aktor pertama. .ilai komunalitas ini dimasukkan ke dalam diagonal matriks dan prosedur diulang hingga jumlah diagonal tidak berubah. Metode lain adalah menggunakan Metode kuadrat terkecil untuk memperoleh nilai solusi residual minimum (disebut minres . Iariasi dari minres digunakan dalam kuadrat terkecil diboboti (weighed least s#uares . Metode penaksiran lainnya adalah metode kemungkinan maksimum. Metode ini bisa diperoleh dari !ungsi fa atau factanal yang telah dijelaskan sebelumnya. Bertho antular - &=
+ !a(r$n!actors=%$n.obs = .A$ rotate=EobliminE$ scores=*A/S0$ residuals=*A/S0$ SMC=12"0$ covar=*A/S0$missing=*A/S0$impute=EmedianE$min.err = @.@@%$ ma-.iter = ;@$symmetric=12"0$warnings=12"0$!m=EminresE$alpha=.%$ ...
+ !actor.pa(r$ n!actors=%$ residuals = *A/S0$ rotate = Evarima-E$n.obs = .A$ scores = *A/S0$SMC=12"0$ missing=*A/S0$impute=EmedianE$min.err = @.@@%$ digits = &$ ma-.iter = ;@$symmetric=12"0$warnings=12"0$!m=EpaE Bertho antular - &>
+ !actor.minres(r$ n!actors=%$ residuals = *A/S0$ rotate = Evarima-E$n.obs = .A$ scores = *A/S0$SMC=12"0$ missing=*A/S0$impute=EmedianE$min.err = @.@@%$ digits = &$ ma-.iter = ;@$symmetric=12"0$warnings=12"0$!m=EminresE
+ !actor.wls(r$n!actors=%$residuals=*A/S0$rotate=Evarima-E$n.obs = .A$ scores=*A/S0$SMC=12"0$missing=*A/S0$impute=EmedianE$ min.err = .@@%$ digits=&$ ma-.iter=;@$symmetric=12"0$warnings=12"0$!m=EwlsE 3eterangan4 r .!actors n.obs 4 adalah matriks korelasi atau matriks data mentah. 4 adalah banyak !aktor yang akan diekstrak$ nilai de!aultnya adalah satu 4 banykanya pengamatan yang digunakan. Hpsi ini berlaku apabila input adalah matriks korelasi. #an digunakan untuk mencari statistik goodness of fit statisti!s. 2otate 4 berisi metode rotasi meliputi EnoneE$ Evarima-E$ EMuartima-E$ Ebentler1E$ dan Egeomin1E untuk rotasi ortogonal. Eproma-E$ EobliminE$ Esimplima-E$ EbentlerN$ dan EgeominNE or EclusterE. .ilai de!ault untuk opsi ini adalah oblimin residuals scores SMC covar 4 Matriks residual yang akan ditampilkan 4 bernilai L12"0F untuk menampilkan nilai taksiran fa!tor s!ores 4 benilai L12"0F apabila menggunakan s#uared multiple !orrelations 4 bernilai L12"0F bila yang digunakan matriks kovarians$ bernilai L*A/S0F bila yang digunakan matriks korelasi missing 4 9ernilai L12"0F apabila akan mengganti data hilang dengan rata-rata atau median. Hpsi ini digunakan apabila opsi scores bernilai L12"0F. impute 4 digunakan untuk mengganti data hilang. Hpsi ini bernilai EmedianE untuk mengganti dengan median atau EmeanE untuk mengganti dengan rata-rata. Bertho antular - &?
4 menampilkan nilai eigen dari common !aktor 4 menampilkan nilai eigen dari matriks asli 4 menampilkan nilai taksiran komunalitas setiap item. .ilai ini merupakan jumlah kuadrat loading !aktor untuk item tersebut.
4 menampilkan rotasi yang digunakan 4 menampilkan banyak pengamatan yang digunakan 4 menampilkan nilai loading 4 Bow well does the !actor model reproduce the correlation
matri-. 1his is just (sum(rQ&ij - sum(rRQ&ij Ssum(rQ&ij (See 5ISS6$ 5OC/"S16$ and 5principal6 !or this !it statistic. !it.o!! #o! 4 how well are the o!! diagonal elements reproducedT 4 derajat kebebasan dari model yang digunakan. .ilai ini merupakan Bertho antular - )@
dof =
n n ! ( (! n ( " "
dengan n adalah banyaknya pengamatan # banyaknya !aktor objective S1A1OS1OC 4 menampilkan !ungsi objekti!. 4 .ilai statistik chi kuadrat yang didasarkan atas !ungsi objekti!. Apanila dituliskan dalam rumus matematika adalah sebagai berikut
" =
dengan n adalah banyak pengamatan p adalah banyak variabel # adalah banyak !aktor f adalah !ungsi objekti! Ahi 4 interfa!tor !orrelation.
communality.iterations4 menampilkan taksiran komunalitas dari tiap iterasi (Banya digunakan pada metode principal a-is 2esidual 9OC 2& 4 menampilkan matriks korelasi residual setelah model !aktor digunakan 4 menampilkan nilai Ba&esian Information $riterion 4 .ilai 2& multiple antara !aktor dengan penaksir !actor score. Menggunakan nilai ini dapat diketahui korelasi minimum antara dua !aktor dengan rumus &2& - % r.scores weights 4 nilai korelasi dari penaksir !actor score 4 pembobot yang digunakan Bertho antular - )%
Synta- berikut adalah contoh analisis !aktor menggunakan principal a-is dengan !ungsi !actor.pa(
: 8rincipal 1xis )actor 1nalysis li=rary(psyc+) fit <- factor,pa(data;u, nfactors=", rotation="7arimax") fit : print results
adalah data yang digunakan (raw data atau matriks kovariansSkorelasi . banyak !aktor yang diekstraksi rotasi yang digunakan dalam hal ini Evarima-E or Eproma-E.
(2) Paket FactoMineR 0aket %actoMineR meliputi beragam fungsi tambahan dalam analisis faktor eksploratori. Dalam 0aket ini menyertakan analisis faktor untuk variabel kualitatif maupun kuantitatif. Dalam paket ini ,uga menyertakan grafik untuk analisis faktor secara otomatis. 3ungsi yang digunakan adalah 0CA dan contoh penggunaan paket %actoMineR secara sederhana.
: 861 9aria=le )actor *ap li=rary()acto*ine<) result <- 861(mydata) : grafi; digam=ar;an secara otomatis
0aket n%actors, ps$c dan %actoMineR tidak disertakan secara default dalam soft(are tetapi dapat diunduh secara )ratis pada the Comprehensive / Archive .et(ork (C/A.) di alamat http$HHC/A../-pro,ect.orgH. Bertho antular - )&
2. Korelasi Kanoni& dalam R Analisis Korelasi Kanonik dalam soft(are / dapat dianalisis melalui 0aket CCA yang dapat diunduh pada the Comprehensive / Archive .et(ork (C/A.) di alamat http$HHC/A../pro,ect.orgH. Setelah itu install paket tadi di soft(are / kemudian loading dengan perintah
> li=rary(661)
> cc( K, -)
7 U
adalah set variabel yang pertama berukuran n - p adalah set variabel yang kedua berukuran n - M
Contoh Data berikut mengenai studi nutrisi dari tikus. Data diperoleh dari 0ascal )artin dari the -o&icology and 0harmacology 4aboratory (3rench .ational 'nstitute for Agronomic /esearch). Data ini sudah disertakan dalam paket CCA dengan nama n!trimo!se sehingga kita tinggal Bertho antular - ))
> data(nutrimouse) > K=as,matrix(nutrimouse$gene.,1/1!0) gen > -=as,matrix(nutrimouse$lipid) lipid > res,cc=cc(K,-) > plot(res,cc$cor,type="=") > plt,cc(res,cc)
Bertho antular - )8
S )enampilkan seluruh output S )enampilkan nilai korelasi kanoniknya S )enampilakn penaksir koefisien bagi variabel L S )enampilakn penaksir koefisien bagi variabel D S )enampilkan koordinat bagi variat kanonik
Bertho antular - );
2. Analisis Dis&riminan dalam R Analisis Diskriminan dalam soft(are / dapat dianalisis melalui 0aket MASS. Secara default paket )ASS telah disertakan dalam installasi a(al soft(are / sehingga kita tinggal mengaktifkannya dengan perintah
> li=rary(*133)
0aket MASS telah meliputi fungsi analisis diskriminan linier dan kuadratik. 0enggunaan analisis diskriminan menggunakan soft(are / akan di,elaskan melalui ilustrasi berikut ini$ Dalam rangka mengatur penangkapan 'kan Salmon, sangat diinginkan bisa mengidentifikasi Bertho antular - )<
Des&ripsi Data ntuk menampilkan deskripsi dari data salmon lakukan perintah-perintah berikut$
> salmon<-read.csv("salmon.csv") > str(salmon) 'data.frame': 100 obs. of 4 variables: $ Ikan. almon: !actor "# $ levels "%laska"&"'anada": 1 1 1 1 1 1 1 1 1 1 ... $ %ir(a"ar $ %ir/a0t $ 1' : int 10) 1*1 10+ ), -- ). -4 11. .- -- ... : int *,) *++ 4,- +0, 40$ 4$* 440 4)- 4*$ 40* ... : int $ 1 1 $ 1 $ 1 $ $ 1 ...
> alaska<-c(mean(salmon$%ir(a"ar21:+03)&sd(salmon$%ir(a"ar21:+03) ) > kanada<-c(mean(salmon$%ir(a"ar2+1:1003)&sd(salmon$%ir(a"ar2+1:1003)) > sdes<-data.frame(alaska&kanada) > ro".names(sdes)4c("5ata-rata"&" im6.7ak0") > sdes alaska 5ata-rata im6.7ak0 -).*)000 1,.14**+ kanada 1*..4,000 1).0+.-.
Bertho antular - )=
Secara deskriptif terlihat bah(a rata-rata diameter pertumbuhan ikan salmon di Alaska lebih kecil dibandingkan dengan di Kanada.
$en%u&ian Asumsi 'ormalitas Multi(ariat Secara umum ada dua pendekatan untuk mengu,i distribusi data .ormal )ultivariat yaitu menggunakan metode grafik (U-U 0lot) dan menggunakan pengu,ian hipotesis ( ,i )shapiro). +aris-baris perintah berikut adalah pengu,ian distribusi normal multivariat untuk kedua metode
: *etode Lrafi; MM-8lot > salmon$<-data,frame(salmon$1ir?aHar, salmon$1ir2aut) > K <- as,matrix(salmon$) > center <- col*eans(K) > n <- nroH(K) > p <- ncol(K) > co7 <- co7(K) > d <- ma+alano=is(K,center,co7) O yla=="Nara; *a+alano=is") > a=line(a=!,==1) : *eng+itung Nara; *a+alano=is > IIplot(Ic+isI(ppoints(n),df=p),d,main="MM-8lot untu; Fata 3almon", : mem=entu; matri;s n x p : titi; pusat
Dari grafik data terlihat agak melenceng untuk ,arak data yang cukup besar yang mengindikasikan data tidak berdistribusi normal multivariat.
%!n)si Dis&riminan Linier *ungsi lda() dalam paket MASS dapat digunakan untuk analisis diskriminan linier. *ungsi ini didasarkan pada variabel-variabel yang terpusat tetapi bukan nilai baku. "raian berikut adalah penjelasan mengenai penggunaan !ungsi lda.
+ lda(-$ ...
Bertho antular - )?
atau + lda(-$ grouping$ prior = proportions$ tol = %.@e-8$ method$ CI = *A/S0$ nu$ ...
keterangan4 !ormula 4 adalah model atau !ungsi yang digunakan. Contoh 5K V -% ( -& ( ...6 dalam hal ini K adalah variabel respon berupa data nominal yang menjelaskan kelompok dan -%$ -&$ ' adalah variabelnya. data 4 berupa data !rame dari variabel-variabel yang digunakan dalam !ormula 4 berupa matriks atau data !rame dari variabel-variabel penjelas. Hpsi ini digunakan apabila !ormula tidak dide!inisikan grouping 4 suatu !aktor yang mende!inisikan kelompok dari tiap pengamatan Hpsi ini digunakan apabila !ormula tidak dide!inisikan prior tol 4 adalah !ungsi peluang prior dari keanggotaan kelompok. 4 nilai toleransi yang digunakan apabila diperoleh matriks singular. Iariabel dan kombinasi linier varians unit variabel yang nilainya kurang dari .ilai kuadrat tol berguna akan ditolak atau dikeluarkan. na.action method 4 suatu !ungsi untuk penanganan data hilang 4 bernilai 5EmomentE6 untuk penaksir baku bagi rata-rata dan varianas$ EmleF untuk penaksir kemungkinan maksimum$ 5EmveE6 untuk digunakan dalam 5cov.mve6$ atau EtE untuk penaksir robust berdasarkan distribusi t. CI .u 4 bernilai L12"0F untuk menampilkan cross-validation. 4 derajat bebas untuk metode EtE. Bertho antular - 8@
Basil yang dapat ditampilkan adalah sebagai berikut prior means scaling 4 prior probabilities yang digunakan. 4 rata-rata kelompok. 4 menampilkan matriks yang mentrans!ormasikan pengamatan menjadi !ungsi diskriminan. svd 4 menampilkan dekomposisi nilai singular yaitu ratio simpangan baku antar kelompok dengan simpangan baku dalam kelompok. 3uadrat dari nilai ini adalah nilai statistik *. n call 4 banyak pengamatan yang digunakan. 4 !ungsi yang dihasilkan.
"ntuk analisis diskriminan linier data Okan salmon dapat menggunakan perintah-perintah berikut
> li=rary(*133) > fit <- lda(5;an,3almon Q 1ir?aHar O 1ir2aut, data=salmon, na,action="na,omit") 6all/ lda(5;an,3almon Q 1ir?aHar O 1ir2aut, data = salmon, na,action = "na,omit")
Lroup means/ 1ir?aHar 1ir2aut 1las;a Banada 9 ," 1"',%& %$9,&& "&&,&$
Bertho antular - 8%
Kemudian apabila ingin mengetahui akurasi dari analisis diskriminan yang telah dibuat lakukan prosedur berikut ini
: *enampil;an ta=el ;eanggotaan se=enarnya dan +asil predi;si > fit <- lda(5;an,3almon Q 1ir?aHar O 1ir2aut, data=salmon, na,action="na,omit",69=?) > ct <- ta=le(salmon$5;an,3almon, fit$class) > ct 1las;a Banada 1las;a Banada %% 1 & %9
: *enentu;an persentase ;etepatan ;eanggotaan untu; tiap ;ategori > diag(prop,ta=le(ct, 1)) 1las;a Banada !, !,9
Secara umum kekeliruan dalam klasifikasi sebesar A= cukup kecil. Artinya hanya sekitar A dari !99 ekor 'kan Salmon Alaska yang diklasifikasikan sebagai 'kan Salmon Kanada dan 'kan Salmon Kanada yang diklasifikasikan sebagai 'kan Salmon Alaska. Bertho antular - 8&
%!n)si Dis&riminan K!adrati& "ntuk memperoleh !ungsi diskriminan kuadratik dapat melalui !ungsi )da( ) atau lda( ). *ungsi diskriminan kuadratik tidak mengasumiskan homogenitas matriks varians-kovarians. 3edua !ungsi ini ada didalam paket MASS. "raian berikut adalah penjelasan mengenai penggunaan !ungsi Mda.
+ Mda(-$ ...
atau
atau + lda(-$ grouping$ prior = proportions$ tol = %.@e-8$ method$ CI = *A/S0$ nu$ ...
keterangan4 !ormula 4 adalah model atau !ungsi yang digunakan. Contoh 5K V -% ( -& ( ...6 dalam hal ini K adalah variabel respon berupa data nominal yang menjelaskan kelompok dan -%$ -&$ ' adalah variabelnya. data 4 berupa data !rame dari variabel-variabel yang digunakan dalam !ormula 4 berupa matriks atau data !rame dari variabel-variabel penjelas. Hpsi ini digunakan apabila !ormula tidak dide!inisikan grouping 4 suatu !aktor yang mende!inisikan kelompok dari tiap pengamatan Hpsi ini digunakan apabila !ormula tidak dide!inisikan Bertho antular - 8)
Basil yang dapat ditampilkan adalah sebagai berikut prior means scaling 4 prior probabilities yang digunakan. 4 rata-rata kelompok. 4 menampilkan matriks yang mentrans!ormasikan pengamatan menjadi !ungsi diskriminan. svd 4 menampilkan dekomposisi nilai singular yaitu ratio simpangan baku antar kelompok dengan simpangan baku dalam kelompok. 3uadrat dari nilai ini adalah nilai statistik *. n call /det /ev class posterior 4 banyak pengamatan yang digunakan. 4 !ungsi yang dihasilkan. 4 menampilkan vektor setengah log determinan matriks dispersi. 4 menampilkan tingkatan dari !aktor kelompok 4 menampilkan mapping klasi!ikasi 4 menampilkan distribusi posterior
9erikut contoh penggunaan analisis diskriminan kuadratik dengan banyak kelompok adalah ) dan banyak variabel adalah 8 dan ketiga kelompok mempunyai nilai peluang prior yang sama Bertho antular - 88
> li=rary(*133) > fit <- Ida(L Q x1 O x$ O x" O x%, data=na,omit(mydata), prior=c(1,1,1)R"))
Men))am*ar&an 9asil Semua pengamatan dapat diplot kedalam sebuah gambar dua dimensi dengan mengambil dua !ungsi diskriminan pertama
Menggambarkan scatterplot bagi kedua variabel untuk memperlihatkan keanggotaan kedua kategori. *ungsi partimat( ) dalam paket kla* dapat menggambarkan hasil dari !ungsi Bertho antular - 8;
: Lrafi; 4;splorasi untu; 1nalisis Fis;riminan 2inier > li=rary(;la<) > partimat(5;an,3almon Q 1ir?aHar O 1ir2aut, data=salmon, met+od="lda")
Selain itu juga bisa dibuat scatterplot dengan menggunakan warna untuk masing-masing kategori. "ntuk itu gunakan perintah-perintah berikut ini.
: 3catterplot > pairs(salmon.c("1ir?aHar","1ir2aut")0, main="8lot 1nalisis Fis;riminan 5;an 3almon", pc+=$$, =g=c("red", "=lue").unclass(salmon$5;an,3almon)0)
#ari Kambar diatas menunjukkan perbedaan kelompok Okan Salmon dilihat dari dua variabel diameter ikan pada saat hidup di air tawar dan diameter ikan pada saat hidup di air laut. Jarna merah adalah Okan Salmon yang berasal dari Alaska dan warna biru menunjukkan Okan Salmon yang berasal dari 3anada.
Bertho antular - 8=
2. Analisis Klaster Dalam R Soft(are R memiliki beragam fungsi untuk analisis klaster. Dalam bagian ini akan di,elaskan tiga pendekatan dalam analisis klaster yaitu$ Analisis Klaster hierarki agglomerative dan )etode partitioning (K-means). +eberapa pendekatan dalam penentuan banyak klaster akan di,elaskan pula dalam bagain ini. 'lustrasi berikut merupakan pen,elasan mengenai penggunaan soft(are / untuk analisis klaster hierarki. Data berikut dikumpulkan pada "" perusahaan publik di Amerika Serikat pada tahun !:A@, pada tiap perusahaan diukur variabel-variabel berikut ini$ L! L" L# L6 $ 3i&ed-charge coverage ratio (incomeHdebt) $ /ate of /eturn on capital $ Cost per K8 capacity in place $ Annual load factor Bertho antular - 8>
Sumber $ 5ohnson 7 8ichern "99" halaman <>A Dengan menggunakan data tersebut perusahaan-perusahaan akan dikelompokkan berdasarkan kedelapan variabel yang telah diukur. *al pertama yang harus dilakukan adalah mempersiapkan data agar dapat dianalisis. +aris-baris berikut beberapa hal yang dapat dilakukan untuk mempersiapkan data
2. Analisis Klaster 9ierar&i Analisis Klaster *ierarki merupakan metode pengelompokkan yang didasarkan atas konsep kedekatan antar ob,ek. Rleh karena itu matriks ,arak merupakan input yang diperlukan dalam analisis ini. +eberapa metode dalam Analisis Klaster *ierarki adalah sebagai berikut !. )etode ,gglomerative H )etode 0autan (-inkage .ethod) a) 0autan -unggal (/ingle -inkage) b) 0autan 4engkap (0omplete -inkage) c) 0autan /ata-rata (,verage -inkage) d) )etode 8ard ". )etode +ivisive Dalam Analisis Klaster *ierarki baik metode agglomerative maupun metode Divisive menghasilkan suatu diagram dua dimensi yang disebut sebagai dendo)ram. Dalam / untuk semua metode agglomerative dalam Analisis Klaster *ierarki dapat menggunakan baris-baris perintah berikut ini
Bertho antular - 8?
Dalam hal ini metode diisi dengan ,arak yang digunakan yaitu VeuclideanV, Vma&imumV, VmanhattanV, VcanberraV, VbinaryV atau Vminko(skiV
: 1nalisis Blaster Pierar;i fit <- +clust(d, met+od=,,,,) plot(fit) groups <- cutree(fit, ;=k) Blaster : d adala+ matri;s Cara; : *enggam=ar;an dendogram : *emotong Fendogram untu; ;
Dalam hal ini metode diisi dengan metode klaster yang digunakan yaitu V(ardV, VsingleV, VcompleteV atau VaverageV. Apabila tidak ingin terlihat tahap dalam dendogramnya gunakan perintah berikut
Analisis Klaster untuk data pada ilustrasi diatas menggunakan soft(are / adalah sebagai berikut )enggunakan metode Sin)le Lin)&a)e
> pu=li;<-read,cs7("pu=lic,cs7") > str(pu=li;) Gdata,frameG/ $ x1 $ x$ $ x" $$ o=s, of / num / num / int 7aria=les/
1,!& !, 9 1,%" 1,!$ 1,%9 1,"$ 1,$$ 1,1 1,"% 1,1$ ,,, 9,$ 1!," 1#,% 11,$ 1#1 $!$ 11" 1& , 1",# 1$,$ 9,$ 1" 1$,% ,,, 19' ,,,
Bertho antular - ;@
! $#," ! "%," 1#,& $$,# ! ! ! "9,$ ,,, !,&" 1,#& 1,!& !,' $,!% 1,$% 1,&# !,"1 !, & !,&$ ,,,
> pu=li;1 <- scale(pu=li;) > d <- dist(pu=li;1, met+od ="euclidean") > fit <- +clust(d, met+od="single") > plot(fit)
Bertho antular - ;%
Bertho antular - ;)
Dari keempat metode yang digunakan terlihat menghasilkan Dendogram yang berbedabeda, sehingga kita harus memilih metode yang dapat mengelompokkan data dengan ,elas. Katakan sa,a dalam kasus ini kita akan menggunaka metode 8ard untuk mengelompokkan data kita. Selan,utnya kita akan mengelompokkan data dengan cara memotong dendogram men,adi # klaster menggunakan perintah berikut ini
Bertho antular - ;8
Dari hasil dendogram tersebut terlihat bah(a setiap kotak merupakan sebuah klaster dengan anggotanya adalah setiap bilangan yang ada dalam kotak tersebut yang menyatakan ob,ek atau pengamatan. Klaster ! beranggotakan ob,ek ke ", 6, @, A, !9, !", !#, !@, !A, "9, "! Klaster " beranggotakan ob,ek ke !, #, <, :, !6, !>, "" Klaster # beranggotakan ob,ek ke >, !!, !<, !: Salah satu kelebihan soft(are / dalam Analisis Klaster adalah bisa menampilkan p) value dari Analisis Klaster *ierarki berdasarkan metode bootstrap. 3ungsi p:cl!st- . dalam paket p:cl!st yang digunakan untuk hal tersebut. Klaster-klaster yang sangat didukung oleh data memiliki p)values yang tinggi. -etapi perlu diperhatikan dalam paket p:cl!st yang dikelompokkan adalah kolom bukan baris, sehingga data kita harus ditranspos terlebih dahulu. +erikut perintah yang digunakan untuk fungsi pvclust Bertho antular - ;;
> li=rary(p7clust) > fit <- p7clust(mydata, met+od,+clust="Hard",met+od,dist="euclidean") > plot(fit) > p7rect(fit, alp+a=,9#) : *enggam=ar;an dendogram dengan p 7alues : *enam=a+;an ;ota; diantara ;elompo; yang sangat didu;ung ole+ data
#alam modul ini tidak akan dibahas lebih lanjut mengenai penggunaan !ungsi pvclust( ini.
6. Analisis Klaster Non 9ierar&i Salah satu metode analisis klaster non hierarki atau disebut ,uga metode partioning yang paling populer adalah Analisis Klaster K<means. 0ada metode ini banyaknya klaster secara pasti harus sudah diketahui. Sebuah cara sederhana yang dapat digunakan untuk menentukan banyak klaster yang akan digunakan adalah plot dari ,umlah kuadrat dalam klaster ( within sum of s(uares) dengan banyak klaster yang mana hasilnya mirip dengan screeplot dalam analisis faktor. +erikut adalah perintah-perintah yang digunakan dalam Analisis Klaster K-)eans
: *enentu;an Aanya; Blaster > Hss <- (nroH(data;u)-1)Ssum(apply(data;u,$,7ar)) > for (i in $/1#) Hss.i0 <- sum(;means(data;u, centers=i)$Hit+inss) > plot(1/1#, Hss, type="=", xla=="Aanya; Blaster",yla=="Numla+ Buadrat dalam Blaster")
#ata sebelumnya digunakan untuk contoh penggunaan analisis klaster 3-means. 9erikut Bertho antular - ;<
> Hss <- (nroH(pu=li;1)-1)Ssum(apply(pu=li;1,$,7ar)) > for (i in $/1#) Hss.i0 <- sum(;means(pu=li;1, centers=i)$Hit+inss) > plot(1/1#, Hss, type="=", xla=="Aanya; Blaster",yla=="Numla+ Buadrat dalam Blaster")
Dari gambar diatas banyak klaster yang dapat diambil adalah < yaitu titik pada saat kurva mulai melandai. Sehingga analisis klaster K-means adalah sebagai berikut
> fit <- ;means(pu=li;1, &) > fit B-means clustering Hit+ & clusters of siTes &, 1, %, ", #, "
Bertho antular - ;=
6luster means/ x1 x' 1 !,!%1!# #" -!,%%&9'"% !,%$ #$% !,'% ##!% -!,"'1$$&1 -!, #"&"1' x$ x" x% x# x&
-!,$99'%'" $ -1,919!'#'$ -1,9"$" "" -!,' 1$'&1 -!,$$!"%%1 " -!,1"!#&&1" -!,'1%&$9% % -!,&!!$'#'$ -!, ""1 !! -!,'1%&$9% # -!,!11""$1# 1,#&#!" % & 1,"#! $#&& 1,%"9%9'" -!,91!'#"$ !,1 %%$!# -!,1%1"9&" !,1 !&"$ !,""1" 1# !,$1 9""9 -!,"# !%! !,1&&%& & -!,%!1 '" 1,"" 91!1 -!,% !# !$ !,991'1' 1, #&#$1% !,$ %#91! -1,!%$$#"" -!,'$9!$1# -!,'#!'1$% !,%'%'!'& 1,1!"%&&# 1, %& 9 $ -!,9!1%$#"
6lustering 7ector/ .10 " 1 & # 1 & 1 % & # % 1 # " 1 % $ " " # 1 #
Uit+in cluster sum of sIuares =y cluster/ .10 $",""## !,!!!!!! ',1 $$9& 9,#"%%&# 1!,19!!!' 1!,1#$1''
17aila=le components/
!,'% ##!% -!,"'1$$&1 -!, #"&"1' 1,1!"%&&# 1, %& 9 $ -!,9!1%$#" !,%'%'!'& 1, #&#$1%
!,$ %#91! -1,!%$$#"" -!,'$9!$1# -!,'#!'1$% 1,"" 91!1 -!,% !# !$ !,$1 9""9 -!,"# !%! !,991'1'
% -!,&!!$'#'$ -!, ""1 !! # -!,!11""$1# & 1,"#! $#&& x' x 1,$1"$"#9 1,%&'9 !! !,""1" 1#
1,%"9%9'" -!,91!'#"$
1 -!,$99'%'" $ -!,$$!"%%1
> agt_;laster<- data,frame(pu=li;1, fit$cluster) > agt_;laster x1 1 $ " % # & ' x$ x" x% x# x& !,!%#9!$9!
-!,$9"1#'91 -!,& %&" 9& -!,%1'1$$!!$ -!,#'''1#1& -!,#$&$$'#1 -1,$1%#11"% -!,19%%#"&' 1,'1$1%!'" -!,#!99%&9# !, $1!!$!"'
!,#' $"$&1' -1,$9#!19"# -!,'1 &%"11 -1,# 1%$ "' 199& ! !,&''#&'1& -1,'%% #9&# !,&$""'!$
!,1&##$%&!% 1, &%91!#%!
$," 11&%&! -!,""" 1191 -!,"# "$%$ !,!!#!9%%9 !,'&'$"!19 !,!1 9#!!$ 1,1'%!'&9
9 1!
1,$$%"&#" !,!"$!$#&#
Bertho antular - ;?
1% -!,1"!#&&1"
"99" -!,#9!"&&!#
!,$1"'9!9'
1, %& 9 $$ -!,9!1%$#"1 -!,1'"%&## -1,'1$'9!" !,! "! !,! "! !,"%#"%! & 1,$9"'9# "
!, "!%'9$$ -!,%%1"9 9%% -!,!&$1#$' !,%$9%1 #$ -1,## 1" $'% -!,&&'"' 1 !,%'"9 ! $ -!,% 99#$ $ !, &9###9$! !,&##1#1%1 !,9!1'$%'$
!,%&#&!"'%
!,1%1$%'&&$ -!,&!!1"!9$
!, #$'#!9#
-!,'1%&$9% -!,!' %&&&% 1,"$ !19' -!,'$# 1&" !,$1%" !,&$#"!!' -!,'1%&$9% 1,& "'&"$" !,$%#$! $% !,9 $%&'&'
$,$'%9!"' -1,!"1#!9"$
$1 -!,'1%&$9% $$ !, &9%&#
Men))am*ar&an 9asil #alam so!tware 2 memungkinkan kita untuk menggambarkan hasil analisis klaster 3means. "ntuk itu harus menggunakan paket Cluster dan paket fpc.Aerintah-perintah berikut yang digunakan untuk menggambarkan klaster yang terbentuk
> li=rary(cluster) > clusplot(pu=li;1, fit$cluster, color=?<@4, s+ade=?<@4, la=els=$, lines=!)
Dari gambar terlihat dengan ,elas anggota dari masing-masing klaster dari (arna dan bentuk titik masing-masing klaster.
-erlihat dari gambar keanggotaan tiap klaster dengan menggunakan angka dan (arna untuk masing-masing klaster tetapi ob,ek yang men,adi anggota klasternya tidak terlihat. *ungsi lain yang dapat digunakan untuk analisis klaster adalah metode validasi dari klaster atau lebih tepatnya perbandingan dari dua metode klaster. *ungsi cluster.stats() dalam paket fpc adalah suatu metode membandingkan kesamaan dua hasil klaster menggunakan kriteria validasi 'u(ert)s gamma !oeffi!ient$ the Dunn inde" dan the !orre!ted rand inde". 9aris-basris berikut adalah metode validasi secara umum
dengan d adalah matriks jarak !it% dan !it& adalah hasil dari dua metode klaster yang digunakan untuk data yang sama. Bertho antular - <)
multidimensional scalling adalah * objek yang diukur (baris dalam p variabel numerik
Classical MDS "ntuk classical M#S dapat digunakan !ungsi cmdscale( ) dengan perintah-perintah sebagai berikut4
> d <- dist(dataku) > fit <- cmdscale(d,eig=?<@4, ;=$) > fit
: *enggam=ar;an +asil > x <- fit$points.,10 > y <- fit$points.,$0 > plot(x, y, xla==">ama Boordinat 1", yla==">ama Boordinat $", main="6lassical *F3", type="n") > text(x, y, la=els = roH,names(dataku), cex=,')
#ata mengenai jarak udara antar %& kota terpilih di amerika serikat sebagai ilustrasi penggunaan classical M#S dalam so!tware 2. #ata yang digunakan sebenarnya antar kota. (Wohnson X Jichern &@@&$ halaman =@) Bal pertama yang mesti dilakkukan adalah menginput data berupa matriks simetris kemudian diberi nama misalkan airline.csv (dalam !ormat .csv . 3emudian lanjutkan dengan perintah-perintah berikut ini sehingga keluar output yang diinginkan telah berupa jarak
> airline<-read,cs7("airline,cs7") > names(airline)<c("1tlanta","Aoston","6incinati","6olum=us","Fallas","5ndianapolis","2ittle <oc;","2os 1ngeles","*emp+is","3t,2ouis","3po;ane","?ampa") > d<-as,dist(airline) > d 1tlanta Aoston 6incinati 6olum=us Fallas 5ndianapolis 2ittle <oc; Aoston 6incinati 6olum=us Fallas 5ndianapolis 2ittle <oc; 2os 1ngeles 1'!1 *emp+is 1"' 3t,2ouis "#" 3po;ane 19 ?ampa %&' 1"'9 9$ 9 # 1!'' 9'# $%&' $'%' $!&' $1"1 1 91 19#9 ## 11' "" %!9 &%# $"% "&& 1"## #!$ # & %&% %"& 1!& %&1 #%9 !# #! #!# $19' &' '&9 1 19 9%1 1%9% "!#$ 1!' 9%" 1! &1 $1 & 1!#! 1'$ '$# $$%# $ "$# 1%!" #&$ $! !
> fit <- cmdscale(d,eig=?<@4, ;=$) > fit $points .,10 1tlanta Aoston 6incinati 6olum=us Fallas 5ndianapolis 2ittle <oc; 2os 1ngeles *emp+is 3t,2ouis 3po;ane ?ampa -#"9,##""&9 .,$0 $9#,#91!
-$#%,11#&%% -$"',''"9 ",' $#1# 1'!%,"1199 -11 ,%$'& % $ 9,###! % !,'" $$", 9&&
Rutput diatas adalah koordinat yang diperlukan untuk menggambarkan ke !" kota dalam " dimensi. ntuk menampilkan gambarnya lan,utkan dengan perintah-perintah berikut ini Bertho antular - <<
B y W- fitTpointsN,!O B & W- fitTpointsN,"O B plot(&, y, main;VClassical )DSV, type;VpV, pch;"9) B te&t(&, y, labels ; names(airline), ce&;9.A, pos;#)
Qambar diatas menun,ukkan setiap titik-titik yang berdekatan menun,ukkan lokasi kota yang ,uga berdekatan begitu pula sebaliknya. Dalam ilustrasi ini memperlihatkan kemiripan antar ob,ek adalah kedekatan ,arak sebenarnya secara geografis.
Nonmetric MDS Selain untuk data metrik multidimensional scalling ,uga dapat dilakukan untuk data Bertho antular - <=
,. Analisis Korespondensi Analisis Korespondensi adalah suatu prosedur grafis untuk men,elaskan asosiasi dalam tabel frekuensi terutama pada tabel frekuensi dua arah atau disebut ,uga tabel kontingensi. Dalam tabel kontingensi terdiri atas 1 baris dan J kolom. Analisis korespondensi menghasilkan titik-titik yang diplotkan dalam grafik yang terdiri atas dua set yaitu sebanyak 1 titik pada set pertama yang menyatakan baris dan sebanyak J titik pada set kedua yang menyatakan kolom. 0osisi titik pada grafik menyatakan asosiasi antara keduanya. Analisis 3orespondensi secara umum merupakan metode gra!ik dalam eksplorasi hubungan antara dua variabel dalam tabel kontingensi$ tentunya variabel yang digunakan besi!at kategori. Kra!ik yang dihasilkan dalam analisis korespondensi merupakan gra!ik mdua dimensi. #engan titik-titik merupakan kategori dari masing-masing variabel. #alam so!tware 2 ada beberapa !ungsi yang dapat digunakan untuk analisis korespondensi salah satunya adalah paket ca. Aaket yang dibuat oleh .enadic dan Kreenacre ini menghasilkan nilai-nilai yang diperlukan dalma analisis korespondensi selain itu juga menghasilkan gra!ik yang sesuai. Aaket ca dapat menganalisis multiple correspondence yaitu apabila variabel kategorinya lebih dari dua. 1etapi dalam modul ini hanya dibahas untuk analisis Bertho antular - <>
> situs<-read,cs7(Vsitus,cs7() > ta=el1<-xta=s(yQ3itusO?ipe, data=situs) ;ontingensi > ta=el1 : *em=uat ta=el
?ipe 3itus 8! 81 8$ 8" 8% 8# 8& 1 "! #" '" $! %& %# 1& A 1! % 1 & "& & $ 6 1! 1& %1 1 "' #9 1&9 F "9 $ 1 % 1" 1! #
> prop,ta=le(ta=el1, 1)
?ipe 3itus 1 A 6 F
8! !,""'!' &# !,11$"#9## !,11$"#9## !,%" $!$$# 81 !,'!&&&&&' !,!#"""""" !,$1"""""" !,!$&&&&&'
8" !,&%#1&1$9 !,19"#% "9 !,!"$$# !& !,1$9!"$$& 8% !,"% % % # !,$'$'$'$' !,$ !"!"!" !,!9 % % # 8# !,"'#!!!!! !,!#!!!!!! !,%91&&&&' !,! """""" 8& !,!'""9%#! !,1$ %%!"' !,''#$$9"& !,!$$9"#'
> prop,ta=le(ta=el1, $)
?ipe 3itus 1 A 6 F
8! !,1!&!!'!&' !,1!9 9!11! !,!"!!"!!"! !,#$'!$'!$' 81 !,1 '$'91#$ !,!%"9#&!%% !,!% !% !% !,!$'!$'!$'
8$ !,$#'9#!#"! !,!1!9 9!11 !,1$"1$"1$" !,!1"#1"#1% 8" !,!'!&'1"' !,!	"%!&& !,!!"!!"!!" !,!#%!#%!#%
8% !,1&$#%%1'! !,"9#&!%"9& !,111111111 !,1'#&'#&'& 8# !,1#9!1!&!1 !,!	"%!&& !,1''1''1'' !,1"#1"#1"# 8& !,!#&#"'1!$ !,"!'&9$"! !,#!'#!'#! !,!&'#&'#&
> li=rary(ca) 2oading reIuired pac;age/ rgl > fit <- ca(ta=el1) > fit 8rincipal inertias (eigen7alues)/ 1 9alue !,$ "# $ " : 1nalisis Borespondensi : *enampil;an +asil
8ercentage ##,"%W
Bertho antular - =@
1,'$&&%% !,'1!1!9 !,$# 1!& 1,"1%' % -1, $"''1 1,% $"&# 1,%$!#$
!,#"#9$' -!,"$'&'$
6olumns/ 1 *ass !,"&$"#& A !,11' !,'$'9$% !,!&1'"9 6 !,%$&"'& !,#' $$! !,1%$##% F !,!9%'#! 1,"##&!1 !,1'%11 1,'&&##'
> summary(fit)
8rincipal inertias (eigen7alues)/ dim 1 $ " 7alue !,$ "# !,1'!1!' !,!# ' & W cumW ##," ,# scree plot SSSSSSSSSSSSSSSSSSSSSSSSS SSSSSSSSSSSS
##," "",$
11,# 1!!,!
<oHs/ name 1 X $ X " X % X # X 8! X 81 X 8$ X 8" X 8% X mass 11% Ilt 9## inr "$9 X 9' X 11$ X #! X & X ;=1 cor ctr ;=$ cor ctr
919 #'$ "%! X -'#$ " " "'9 X "' 1"' $'' %9 % X &11 '$" $11 X # & $$1 & "!! X '# '! 11 X 1 X
1! X &9 X
'!! '#& 1% %
1" X -1"#
Bertho antular - =%
6olumns/ name 1 X $ X " X % X 1 X A X 6 X F X mass Ilt inr $&$ X 1$! X $' ;=1 cor ctr %$! %' ! $$& X ;=$ cor ctr %%! #$$ %1$ X $%$ 1% X 11 X % 9 X
! X -"# X -&'
"%! X
> plot(fit)
-itik-titik baris (berbentuk bulat) pada gambar yang berdekatan memiliki profil kolom yang mirip begitupun sebaliknya titik-titik kolom (berbentuk segitiga) pada gambar yang berdekatan memiliki profil baris yang mirip. -etapi kita tidak dapat menginterpretasikan ,arak Bertho antular - =&
: @ntu; menggam=ar;an dengan Harna yang =er=eda antar ;elompo; > plot(fit, mass = ?<@4, contri= = "a=solute", map ="roHgreen")
=. Analisis 7iplot Analisis +iplot adalah representasi grafis mengenai informasi yang ada dalam matriks data berdimensi n & p. Dalam +iplot meliputi dua macam informasi yang ada dala matriks data yaitu informasi mengenai baris yang berarti unit-unit sampling dan informasi mengenai kolom yang berarti variabel-variabel. Apabila hanya dua variabel sa,a maka untuk merepresentasikan kedua informasi ini dapat menggunakan scatter plot. -etapi untuk variabel lebih dari dua diperlukan suatu alat yang dapat memberikan informasi mengenai kedua hal tadi yaitu analisis biplot. Secara umum +iplot dapat menya,ikan posisi relatif n ob,ek pengamatan dengan p Bertho antular - =)
Data ini akan dibakukan karena ukuran dari variabel-variabel berbeda-beda. (5ohnson 7 8ichern "99", halaman A"") Dalam soft(are / penggunaan +iplot bisa menggunakan fungsi *iplot-. atau fungsi *pca-. yang terdapat pada paket *pca.
Pen))!naan %!n)si *iplot-. 'nput data yang digunakan dalam biplot adalah nilai-nilai komponen utama. Sehingga penggunaan fungsi biplot() untuk data diatas adalah sebagai berikut
Bertho antular - =8
Pen))!naan %!n)si *pca-. 'nput data yang digunakan dalam biplot adalah nilai-nilai komponen utama. Sehingga penggunaan fungsi biplot() untuk data diatas adalah sebagai berikut
Bertho antular - =;
Secara umum hasil dari kedua fungsi ini menghasilkan gambar yang mirip, hanya sa,a fungsi *pca-. memperlihatkan gambar yang sedikit lebih ,elas dibandingkan dengan fungsi *iplot-..
DA%TAR PUSTAKA
5ohnsom, /ichard A, 8ichern, Dean 8. ("99") ,pplied .ultivariate /tatistical ,nalysis. 0earson 2ducation 'nternational, .e( 5ersey. )aindonald, 5ohn, +arun, 8 5ohn. ("99<) +ata ,nalysis and 2raphics Using ! 3 an *xample) 4ased ,pproach . Cambridge niversity 0ress. K http$HH(((.statmethods.netHadvstatsH http$HHcran.r-pro,ect.orgHpackagesH
Bertho antular - ==