You are on page 1of 77

Praktikum Analisis Data Multivariat II Menggunakan Software R

MODUL I ANALISIS KOMPONEN UTAMA

1. Analisis Komponen Utama Analisis komponen utama digunakan untuk menjelaskan struktur matriks varianskovarians dari suatu set variabel melalui kombinasi linier dari variabel-variabel tersebut. Secara umum komponen utama dapat berguna untuk reduksi dan interpretasi variabel-variabel. Misalkan saja terdapat p buah variabel yang terdiri atas n buah objek. Misalkan pula bahwa dari p buah variabel tersebut dibuat sebanyak k buah komponen utama (dengan k <= p yang merupakan kombinasi linier atas p buah variabel tersebut. k komponen utama tersebut dapat menggantikan p buah variabel yang membentuknya tanpa kehilangan banyak in!ormasi mengenai keseluruhan variabel. "mumnya analisis komponen utama merupakan analisis intermediate yang berarti hasil komponen utama dapat digunakan untuk analisis selanjutnya. #alam bentuk matematis$ katakan saja bahwa Y merupakan kombinasi linier dari variabel-variabel X%$ X&$ ' $ Xp yang dapat dinyatakan sebagai

Y = W%X% ( W&X& ( ' ( WpXp dengan Wi Xi Y adalah bobot atau koe!isien untuk variabel ke i adalah variabel ke i adalah kombinasi linier dari variabel X

Secara prinsip pembentukan komponen utama merupakan pembentukan kombinasi linier dari variabel-variabel yang diamati. Dalam analisis komponen utama ditentukan suatu metode untuk mendapatkan nilai-nilai koefisien atau bobot dari kombinasi linier variabel-variabel pembentuknya dengan ketentuan sebagai berikut Bertho antular - %

Praktikum Analisis Data Multivariat II Menggunakan Software R


a Ada sebanyak p komponen utama, yaitu sebanyak variabel yang diamati dan setiap komponen utama adalah kombinasi linier dari variabel-variabel tersebut b c Setiap komponen utama saling ortogonal (tegak lurus) dan saling bebas. Komponen utama dibentuk berdasarkan urutan varians dari yang terbesar hingga yang terkecil, dalam arti sebagai berikut komponen utama pertama (K
!

) merupakan kombinasi linier dari seluruh variabel

yang diamati dan memiliki varians terbesar komponen utama kedua (K terbesar komponen utama ketiga (K varians ketiga terbesar $ komponen utama ke p (K yang terkecil. ntuk mendapatkan koefisien komponen utama secara bersamaan dapat menggunakan salah satu cara berikut ini dekomposisi eigen value dan eigen vector dari matriks korelasi atau kovarians dari variabel-variabel yang diamati. Dalam hal ini eigen value merupakan varians setiap komponen utamanya dan eigen vector merupakan koefisien-koefisien komponen utamanya dekomposisi nilai singular dari matriks data yang berukuran n & p. 'nterpretasi dari komponen utama adalah bah(a komponen utama tersebut merupakan suatu sistem sumbu baru dalam ruang vektor berdimensi banyak peubah yang diamati. )elalui komponen utama salib-salib sumbu tersebut telah diubah skalanya dan dirotasi hingga memiliki sifat varians yang terurut semakin kecil dan ortogonal. Bertho antular - &
p # "

) merupakan kombinasi linier dari seluruh variabel


!

yang diamati yang bersifat ortogonal terhadap K

dan memiliki varians kedua

) merupakan kombinasi linier dari seluruh variabel


!

yang diamati yang bersifat ortogonal baik terhadap K

maupun K

"

, dan memiliki

) merupakan kombinasi linier dari seluruh variabel yang


!

diamati yang bersifat ortogonal terhadap K

,K

"

,%,K

(p-!)

dan memiliki varians

Praktikum Analisis Data Multivariat II Menggunakan Software R


Apabila varians dari variabel-variabel yang diamati mempengaruhi besarnya bobot atau koefisien kompomnen utamanya maka analisis komponen utama dapat dilakukan menggunakan matriks varians-kovarians. Secara sederhana varians merupakan suatu informasi dari variabel yang diamati yang berarti apabila sebuah variabel memiliki pengamatan yang semua nilainya sama maka variabel tersebut tidak memiliki informasi yang dapat membedakan antar pengamatan. Komponen utama adalah himpunan variabel baru yang merupakan kombinasi linier dari variabel-variabel yang diamati. Komponen utama memiliki sifat varians yang semakin mengecil, sebagian besar variasi (keragaman atau informasi) dalam himpunan variabel yang diamati cenderung berkumpul pada beberapa komponen utama pertama, dan semakin sedikit informasi dari variabel asal yang terkumpul pada komponen utama terakhir. *al ini berarti bah(a komponen-komponen utama pada urutan terakhir dapat diabaikan tanpa kehilangan banyak informasi. Dengan cara ini analisis komponen utama dapat digunakan untuk mereduksi variabel-variabel. ntuk keperluan reduksi variabel tentu harus ditentukan berapa banyak komponen utama yang mesti diambil. Ada beberapa cara untuk menentukan berapa banyak komponen utama yang harus diambil diantaranya adalah menggunakan scree plot. +anyak komponen yang diambil adalah pada titik kurva tidak lagi menurun ta,am atau mulai melandai. menggunakan proporsi kumulatif varinas terhadap total varians -elah di,elaskan bah(a antar komponen utama bersifat ortogonal yang artinya bah(a setiap komponen utama merupakan (akil dari seluruh variabel asal sehingga komponenkomponen utama tersebut dapat di,adikan pengganti variabel asal apabila analisis terhadap variabel tersebut membutuhkan ortogonalitas, Dalam analisis regresi linier multipel memerlukan suatu syarat tidak adanya multikolinieritas antara variabel-variabel bebasnya. Apabila ternyata dalam data terdapat multikolinieritas maka komponen utama dapat digunakan sebagai pengganti variabel-variabel bebas dalam model regresi tersebut. Dalam analisis komponen utama diperoleh beberapa ukuran-ukuran berikut

Bertho antular - )

Praktikum Analisis Data Multivariat II Menggunakan Software R


%. .ilai total varians merupakan informasi dari seluruh variabel asal yang dapat di,elaskan oleh komponen-komponen utamanya &. proporsi varians komponen utama ke k terhadap total varians menun,ukkan besarnya persentase informasi variabel-variabel asal yang terkandung dalam komponen utama ke-k ). .ilai koefisien korelasi antara komponen utama dengan variabelnya

2. Analisis Komponen Utama dalam R (a) Fungsi princomp Analisis Komponen tama dalam soft(are / dapat dianalisis menggunakan fungsi

princomp. *ungsi princomp menganalisis komponen utama dari data berupa matriks numerik dan menghasilkan nilai-nilai berupa suatu objek dalam kelas princomp. 0en,elasan mengenai synta& dan penggunaan fungsi princomp adalah sebagai berikut

+ !it,pca <- princomp(-$ ... atau + !it,pca <- princomp(!ormula$ data = ."//$ subset$ na.action$ ... atau + !it,pca <- princomp(-$ cor = *A/S0$ scores = 12"0$ covmat = ."//$ subset = rep(12"0$ nrow(as.matri-(- $ ...

3eterangan4 !ormula4 data4 adalah !ormula untuk variabel numerik tanpa melibatkan variabel respon data yang digunakan berupa data !rame meliputi variabel-variabel dalam !ormula Sebagai default diambil variabel dari 5environment(!ormula 6. subset4 sebuah vektor yang digunakan untuk memilih baris (pengamatan dari matriks 7 Bertho antular - 8

Praktikum Analisis Data Multivariat II Menggunakan Software R


na.action4 hilang -4 analisis komponen utama cor4 untuk matriks kovarians (matri- korelasi hanya dapat digunakan apabila tidak ada variabel konstanta scores4 *A/S0 untuk tidak menampilkan setiap nilai komponen utamanya. covmat4 9iasanya bernama 5cov.wt6 atau 5cov.mve6 atau :cov.mcd6 yang diperoleh dari pajet MASS. digunakan apabila inputnya adalah matriks kovarians atau matriks korelasi. bernilai 12"0 untuk menampilkan setiap nilai komponen utamanya dan bernilai bernilai 1-/ 21 apabila yang digunakan matriks korelasi dan bernilai 13A4S21 adalah matriks numerik atau data !rame yang berisi data yang digunakan untuk sebuah !ungsi yang mengindikasikan apa yang akan dilakukan apabila ada data

.ilai-nilai yang dapat ditampilkan hasil analisis !ungsi princomp adalah sebagai berikut

sdev4 loadings4 ve!tor. scale4 n.obs4 scores4 na.action4

simpangan baku (standard deviation dari komponen utamanya matriks variabel loading yaitu matriks yang kolom-kolomnya berupa eigen center4 rata-rata yang digunakan.

trans!ormasi dari tiapvariabel. banyak pengamatan. nilai-nilai komponen utamanya bila ada penanganan data hilang

Bertho antular - ;

Praktikum Analisis Data Multivariat II Menggunakan Software R


0erintah-perintah berikut digunakan untuk menampilkan hasil analisis

summary(fit_pca) loadings(fit_pca) plot(fit_pca,type="lines") fit_pca$scores

untuk menampilkan nilai varians untuk menampilkan nilai loadings untuk membuat scree plot untuk menampilkan nilai komponen utama

#alam !ungsi princomp analisis komponen utama menggunakan nilai eigen dari matriks korelasi atau matriks varians-kovarians. Analisis komponen utama yang menggunakan dekomposisi nilai singular dari matriks 7 berada dalam !ungsi lain yaitu prcomp. *ungsi print dapat digunakan untuk menampilkan hasil analisis dan !ungsi plot dapat digunakan untuk menampilkan screeplot.

Conto Kas!s "$ 5olicoeur dan )osimann mempela,ari mengenai hubungan antara ukuran dan bentuk se,enis kura-kura. 0ada penelitiannya mereka mengambil sampel sebanyak "6 kura-kura ,antan dan "6 kura-kura betina dan diukur pan,ang, lebar dan tinggi kura-kura tersebut. (data diambil dari 5ohnson 7 8ichern, "99" halaman ##:) Sebelum melakukan analisis dengan definisikan variabel X! ; length, X" ; width, X# ; height dan X6 ; sex kemudian input dulu data tersebut menggunakan soft(are / sebagai berikut

> x1<c(9 ,1!",1!",1!#,1!9,1$",1$",1"",1"",1"",1"%,1"&,1" ,1" ,1%1,1%',1%9,1#",1##, 1##,1# ,1#9,1&$,1'',9",9%,9&,1!1,1!$,1!",1!%,1!&,1!',11$,11",11%,11&,11',11', 119,1$!,1$!,1$1,1$#,1$',1$ ,1"1,1"#)

> x$<c( 1, %, &, &, 9#,1!&) ,9$,9#,99,1!$,1!$,1!!,1!$,9 ,99,1!#,1! ,1!',1!',11#,11',11#,1 , &,9!,9!,91,9", 9,9",9#,9",9&,9#, 1 ,1$%,1"$,'%,' , !, %, #, 1, ", ", $, 9,

Bertho antular - <

Praktikum Analisis Data Multivariat II Menggunakan Software R

>

x"<-

c(" ," ,%$,%$,%%,#!,%&,#1,#1,#1,% ,%9,#1,#1,#",#',##,#&,&",&!,&$,&",&1,&',"', "#,"#,"9," ,"',"9,"9," ,%!,%!,%!,%",%1,%1,%1,%!,%%,%$,%#,%#,%#,%&,%') > x%<-rep(c(()(,(*(),eac+=$%)

4akukan transformasi sederhana terhadap data (&!, &" dan &#) tersebut menggunakan log sebagai berikut

> y1<-log(x1) > y$<-log(x$) > y"<-log(x") > y<-data,frame(y1,y$,y") > -<-y.$#/% ,0

Analisis data kura-kura ,antan menggunakan fungsi princom() sebagai berikut

> fit_pca<-princomp(-, cor=)1234) > summary(fit_pca) 5mportance of components/ 6omp,1 3tandard de7iation 6omp,$ 6omp,"

!,1%9%%!$ !,!$"9%#$& !,!1 #&99%

8roportion of 9ariance !,9&!#!'' !,!$%&&!&9 !,!1% "1#' 6umulati7e 8roportion !,9&!#!'' !,9 #1& %" 1,!!!!!!!!

-erlihat dari proporsi varians kumulatif Komponen pertama dapat men,elaskan :<= total varians dan bila ditambahkan komponen kedua men,adi :>=. Artinya apabila kita hanya mengambil satu komponen sa,a yaitu komponen pertama sudah mencukupi. .ilai simpangan baku (standard deviation) pada baris pertama hasil diatas diperoleh dari akar positif nilai eigen (eigen value) matriks kovarians dari log(y!), log(y") dan log(y#). Bertho antular - =

Praktikum Analisis Data Multivariat II Menggunakan Software R

> loadings(fit_pca) 2oadings/ 6omp,1 6omp,$ 6omp," y1 y$ y" !,& " -!,1#9 !,'1"

!,#1! -!,#9% -!,&$$ !,#$" !,' -!,"$%

6omp,1 6omp,$ 6omp," 33 loadings 8roportion 9ar 6umulati7e 9ar 1,!!! !,""" !,""" 1,!!! !,""" !,&&' 1,!!! !,""" 1,!!!

.ilai-nilai loading yang ditampilkan pada hasil di atas adalah nilai vektor eigen dari matriks kovarians log(y!), log(y") dan log(y#). 3ungsi komponen utamanya adalah sebagai berikut

KU! ; 9.<># log(y#) ? 9.@!9 log(y#) ? 9.@"# log(y#) KU" ; -9.!@: log(y#) - 9.@:6 log(y#) ? 9.A>> log(y#) KU# ; 9.A!# log(y#) - 9.<"" log(y#) - 9.#"6 log(y#)

ntuk membuat dan menampilkan scree plot dilakukan dengan cara sebagai berikut

B plot(fit_pca,type="lines")

Bertho antular - >

Praktikum Analisis Data Multivariat II Menggunakan Software R

Dari scree plot tersebut terlihat bah(a kurva mulai landai pada titik comp " artinya bah(a dengan satu komponen sa,a sudah mencukupi untuk me(akili ketiga variabel tersebut )enampilkan nilai (score) komponen utama

> fit_pca$scores 6omp,1 $# -!,$& %'""9! 6omp,$ !,!&1!& #!"' 6omp," !,!!!%!&&1%9 '#

$& -!,$&""%%9 ! -!,!1#'$%%"9! -!,!!&& #

$' -!,$"&!%#'!' -!,!"%1$1!9"# -!,!!'%$'&'" $ -!,1199$"%'& !,!1%1$#1'&9 -!,!"&&9$$$%% -!,!1%9#'$'&! -!,!$ &!%#1"! !,!1&9'9"& #

$9 -!,1$!'$ "

"! -!,1#$#9$' 1 -!,!! 9! $11$ "1 -!,1!&!"9$9& "$ -!,!9"!$'%"!

!,!1&#'11&1& -!,!! " $&&#$ !,!1"#"""'"! !,!!#19$9"%% !,!$' #!" &$ 9#!#

"" -!,1!&"'1!%$ -!,!!1$%#$'"

"% -!,!!&#'#$#9 -!,!1&'%%1'&# -!,!!'1 "# -!,!!&$& %#$ -!,!11%%9'! "& -!,!119'9#9$ "' !,!&! &9$$ !,!!! !1$$%&

!,!!&1'"9'&# !,!$&'#1&9 9

!,!$ !%&#"&$ -!,!1$# 9&#9"

Bertho antular - ?

Praktikum Analisis Data Multivariat II Menggunakan Software R


" "9 %! %1 %$ %" %% %# %& %' % !,!%1 &$9'" -!,!1! '&&"!" !,!%'#!! 1# -!,!1'%%!"&"1 !,!'!1'1$&% -!,!""!#'$'11 !,!%!##"9"$ -!,!$''%'!9&" !,11$' ! " !,!! 9' #&$& !,!!$1!&!'9" !,!!!&&%'$'1 !,!%19 $!919

!,!$1$ 9%11& -!,!1&$'9& &#

!,1!#!!%&$& -!,!$9"#"&&%9 -!,!! #!'#"9% !,1#$%1&&"$ !,1'9%# ##9 !,1'9%'"#9! !,$!&' "9!" !,!"$%9 '' !,!!##$" 1&%

!,!111! $11! -!,!!$9!9%99& !,!1&!''%&"' !,!$9'1$9%9 !,!!919$9'"# !,!1 #'%! '$

!,$9%%& %9% -!,!$"$!'# &" -!,!"#1!9!1 $

Conto Kas!s 2# Data berikut mengenai rates of return dari lima saham perusahaan yaitu Allied Chemical, du 0ont, nion Carbide, 2&&on dan -e&aco yang berada di pasar saham .e( Dork yang diambil pada periode !:A@ hingga Desember !:A<. +erdasarkan nilai penutupan pada hari 5umEat rates of return didefiniskan sebagai

rates of return=

Harga penutupan Jum ' at ini Harga penutupan Jum ' at se elumnya Harga penutupan Jum ' at se elumnya

Diasumsikan bah(a pengamatan saling bebas dalam hal ini adalah minggu dan saham perusahaan adalah variabelnya yang saling berkorelasi. Dari data sebanyak !99 minggu diperoleh vektor rata-ratanya adalah

x ' =[ 9.99@6, 9.996>, 9.99@A, 9.99<#, 9.99#A ]

dan matriks korelasinya adalah

Bertho antular - %@

Praktikum Analisis Data Multivariat II Menggunakan Software R


!.999 9.@AA ! = 9.@9: 9.#>A 9.6<"

9.@AA !.999 9.@:: 9.#>: 9.#""

9.@9: 9.@:: !.999 9.6#< 9.6"<

9.#>A 9.#>: 9.6#< !.999 9.@"#

9.6<" 9.#"" 9.6"< 9.@"# !.999

/ merupakan matriks varians-kovarians dari matriks pengamatan yang sudah dibakukan. (5ohnson dan 8ichern, "99") Dalam kasus ini yang diketahui adalah matriks kovarians atau matriks korelasi maka fungsi princomp digunakan dengan cara sebagai berikut

: 5nput matri;s < dengan cara se=agai =eri;ut

> r<c(1,,#'',,#!9,," ',,%&$,,#'',1,,#99,," 9,,"$$,,#!9,,#99,1,,%"&,,%$&,," ', ," 9,,%"&,1,,#$",,%&$,,"$$,,%$&,,#$",1) > <<-matrix(r, #, #) > <

.,10

.,$0

.,"0

.,%0

.,#0

.1,0 1,!!! !,#'' !,#!9 !," ' !,%&$ .$,0 !,#'' 1,!!! !,#99 !," 9 !,"$$ .",0 !,#!9 !,#99 1,!!! !,%"& !,%$& .%,0 !," ' !," 9 !,%"& 1,!!! !,#$" .#,0 !,%&$ !,"$$ !,%$& !,#$" 1,!!!

: >ilai eigen 7alue dan eigen 7ector dapat diperole+

> eigen(<)$7alue .10 $, #&'11! !, !91&"' !,#"9&'#$ !,%#1#!!1 !,"%$9%99

Bertho antular - %%

Praktikum Analisis Data Multivariat II Menggunakan Software R


> eigen(<)$7ector .,10 .1,0 -!,%&"&!#$ .$,0 -!,%#'1!' .",0 -!,%'!1'#& .%,0 -!,%$1%# .,$0 !,$%!""9! .,"0 .,%0 .,#0

!,&11'!#% -!," &&"%& -!,%#1$&$$ !,&'&$$""

!,#!9"!%' -!,1' 1 9# -!,$!&%'%% !,$&!%% " -!,""#!#&# -!,#$#&&%9 -!,#%!'&$ !,%"#1'##

!,&&$%%%' -!,%!!!!'$ -!,%'$!!&! -!,1'##9 & !," $%" !," #!$%#

.#,0 -!,%$1$$%# -!,# 19&99

: 1nalisis mengguna;an fungsi princomp

> fit_pca$<-princomp(co7mat=<, cor=?<@4, n,o=s=1!!) > summary(fit_pca$) 5mportance of components/ 6omp,1 3tandard de7iation 1,&9!1 ! 6omp,$ 6omp," 6omp,% 6omp,#

!, 99#"#" !,'"%&$#9 !,&'19"'#' !,# #&19$

8roportion of 9ariance !,#'1"%$$ !,1&1 "$' !,1!'9"#! !,!9!"!!!$ !,!& # 999 6umulati7e 8roportion !,#'1"%$$ !,'""1'%9 !, %111!! !,9"1%1!!1 1,!!!!!!!!

dari hasil perhitungan tersebut terlihat bah(a proporsi varians untuk komponen ! baru mencapai @A= dan apabila diambil dua komponen proporsi varians mencapai A#=.

> loadings(fit_pca$) 2oadings/ 6omp,1 6omp,$ 6omp," 6omp,% 6omp,# .1,0 -!,%&% .$,0 -!,%#' .",0 -!,%'! !,$%! !,&1$ -!," ' -!,%#1 -!,$!& !,&'&

!,#!9 -!,1' !,$&! -!,""#

!,&&$ -!,%!!

.%,0 -!,%$1 -!,#$& -!,#%1 -!,%'$ -!,1'& .#,0 -!,%$1 -!,# $ !,%"# !," $ !," #

Bertho antular - %&

Praktikum Analisis Data Multivariat II Menggunakan Software R


6omp,1 6omp,$ 6omp," 6omp,% 6omp,# 33 loadings 8roportion 9ar 6umulati7e 9ar 1,! !,$ !,$ 1,! !,$ !,% 1,! !,$ !,& 1,! !,$ !, 1,! !,$ 1,!

.ilai loading yang diperoleh hasilnya sama dengan nilai eigen vektor. .ilai loading ini digunakan sebagai koefisien dari fungsi komponen utamanya.

(2) Fungsi prcomp Selain menggunakan fungsi princomp analisis komponen utama ,uga dapat menggunakan fungsi prcomp. 3ungsi prcomp menganalisis komponen utama menggunakan dekomposisi nilai singular (singular value decomposition atau svd) dari matriks data berbeda dengan fungsi princomp yang menggunakan nilai eigen dari matriks varians-kovarians. 3ungsi print dapat digunakan untuk menampilkan hasil analisis dan fungsi plot dapat digunakan untuk menampilkan screeplot. +erikut pen,elasan synta& dan pengunaannya.

B prcomp(&, ...) atau B prcomp(formula, data ; . 44, subset, na.action, ...) atau B prcomp(&, ret& ; -/ 2, center ; -/ 2, scale. ; 3A4S2, tol ; . 44, ...)

keterangan$ !ormula4 data4 adalah !ormula untuk variabel numerik tanpa melibatkan variabel respon data yang digunakan berupa data !rame meliputi variabel-variabel dalam !ormula Sebagai default diambil variabel dari 5environment(!ormula 6. subset4 sebuah vektor yang digunakan untuk memilih baris (pengamatan dari matriks 7

Bertho antular - %)

Praktikum Analisis Data Multivariat II Menggunakan Software R


na.action4 sebuah !ungsi yang mengindikasikan apa yang akan dilakukan apabila ada data hilang -4 adalah matriks numerik atau data !rame yang berisi data yang digunakan untuk analisis komponen utama ret&$ berisi nilai logical (-/ 2 atau 3A4S2) yang mengindikasikan rotasi variabel yang akan digunakan center$ berisi nilai logical (-/ 2 atau 3A4S2) yang mengindikasikan pemusatan data terhadap rata-ratanya. scale$ berisi nilai logical (-/ 2 atau 3A4S2) yang mengindikasikan variabel yang dibakukan tol$ berisi nilai yang mengindikasikan batas ba(ah komponen mana yang harus diabaikan. Komponen diabaikan apabila nilai simpangan bakunya kurang dari atau sama dengan nilai 1tol1.

.ilai-nilai yang dapat ditampilkan hasil analisis !ungsi princomp adalah sebagai berikut

sdev$

.ilai simpangan baku dari komponen utamanya. Daitu akar dari nilai eigen matriks varians-kovarians atau matriks korelasinya melalui perhitungan nilai singular matriks

data.rotation$ adalah matriks variabel loading. Daitu matriks yang kolom-kolomnya merupakan nilai-nilai eigen matriks varians-kovarians. &$ adalah nilai dari data yang telah dirotasikan. .ilai ini akan ada apabila fungsi Fret&G bernilai -/ 2 . center, scale$ adalah nilai pemusatan dan pembakuan yang digunakan

0enggunaan fungsi prcomp dapat dilakukan pada contoh kasus ! dengan cara sebagai berikut

Bertho antular - %8

Praktikum Analisis Data Multivariat II Menggunakan Software R


> fit_pca<-prcomp(-, rex=?<@4, tol=!,1) > summary(fit_pca) 5mportance of components/ 861 3tandard de7iation 86$ 86"

!,1#" !,!$%# !,!19!

8roportion of 9ariance !,9&1 !,!$%' !,!1% 6umulati7e 8roportion !,9&1 !,9 #$ 1,!!!!

> fit_pca$x 861 $# -!,$& %'""9! 86$ 86"

!,!&1!& #!"' -!,!!!%!&&1%9 !,!!&& # '#

$& -!,$&""%%9 ! -!,!1#'$%%"9! $' -!,$"&!%#'!' -!,!"%1$1!9"# $ -!,1199$"%'& !,!1%1$#1'&9 -!,!1%9#'$'&!

!,!!'%$'&'" !,!"&&9$$$%% !,!$ &!%#1"!

$9 -!,1$!'$ "

"! -!,1#$#9$' 1 -!,!! 9! $11$ -!,!1&9'9"& # "1 -!,1!&!"9$9& "$ -!,!9"!$'%"! !,!1&#'11&1& !,!! " $&&#$

!,!1"#"""'"! -!,!!#19$9"%% -!,!$' #!" &$ !,!!'1 9#!#

"" -!,1!&"'1!%$ -!,!!1$%#$'" "% -!,!!&#'#$#9 -!,!1&'%%1'&# "# -!,!!&$& %#$ -!,!11%%9'! "& -!,!119'9#9$ "' " "9 %! %1 %$ %" %% %# !,!&! &9$$

-!,!!&1'"9'&#

!,!!! !1$$%& -!,!$&'#1&9 9 !,!$ !%&#"&$ !,!1$# 9&#9"

!,!%1 &$9'" -!,!1! '&&"!" -!,!! 9' #&$& !,!%'#!! 1# -!,!1'%%!"&"1 -!,!!$1!&!'9" !,!'!1'1$&% -!,!""!#'$'11 -!,!!!&&%'$'1 !,!%!##"9"$ -!,!$''%'!9&" -!,!%19 $!919 !,11$' ! " !,!$1$ 9%11& !,!1&$'9& &# !,!! #!'#"9% -!,!!##$" 1&% !,!!$9!9%99&

!,1!#!!%&$& -!,!$9"#"&&%9 !,1#$%1&&"$ !,1'9%# ##9 !,!"$%9 '' !,!111! $11!

Bertho antular - %;

Praktikum Analisis Data Multivariat II Menggunakan Software R


%& %' % !,1'9%'"#9! !,$!&' "9!" !,!1&!''%&"' -!,!!919$9'"# !,!$9'1$9%9 -!,!1 #'%! '$ !,!"#1!9!1 $

!,$9%%& %9% -!,!$"$!'# &"

Dengan cara ini menghasilkan nilai skor komponen utama yang sama dengan cara sebelumnya. .ilai proporsi varians untuk tiap komponen utama ,uga bernilai sama dengan cara sebelumnya. Selain menggunakan fungsi princomp dan prcomp analisis komponen utama ,uga dapat dilakukan dengan fungsi principal. -etapi fungsi principal ini hanya dapat dilakukan apabila telah diinstallkan paket ps$c . 0aket ps$c dapat diunduh secara gratis di C/A. (http$HHcran.rpro,ect.orgH).

Bertho antular - %<

Praktikum Analisis Data Multivariat II Menggunakan Software R

MODUL II ANALISIS %AKTOR


". Analisis %a&tor Analisis *aktor adalah suatu cara menjelaskan suatu set variabel berdasarkan dimensi yang lebih umum. Aada dasarnya analisis !aktor bertujuan untuk memudahkan interpretasi melalui struktur pola hubungan atau untuk mereduksi variabel. Bal ini dilakukan dengan cara mengidenti!ikasi struktur yang terdapat dalam set variabel yang terobservasi. Secara umum ada tiga kegunaan utama dari Analisis *aktor yaitu4 0ksplorasi (disebut Eksploratory factor analysis (EFA) yaitu membentuk variabel baru yang diperoleh melalui reduksi variabel 3on!irmasi (disebut Confirmatory Factor Analysis (CFA) yaitu menguji struktur variabel yang dihipotesiskan berdasarkan banyaknya !aktor yang signi!ikan dan besarnya !aktor loading Alat Aengukur (model measurment) yaitu pembentukan indeks-indeks yang akan digunakan sebagai pengamatan baru dalam analisa selan,utnya )isalkan terdapat satu set variabel dengan banyak variabel adalah p dan ternyata antar variabel tersebut mempunyai tingkat korelasi yang tinggi. Dimungkinkan ada satu atau lebih variabel yang tidak terobservasi (disebut sebagai variabel laten) yang merupakan penyebab p variabel di atas. Keberadaan variabel yang tak terobservasi yang mampu men,elaskan variabel yang teramati merupakan pembahasan dalam Analisis 3aktor. Dengan demikian pada intinya Analisis 3aktor men,elaskan hubungan struktur kovarians dari variabel yang teramati dengan variabel yang tidak teramati. Analisis 3aktor dapat dirumuskan dalam suatu model persamaan linier. )isalkan vektor acak X dengan p komponen memiliki rata-rata dan matriks covariance ". )aka dapat dibentuk model persamaan faktornya adalah

Bertho antular - %=

Praktikum Analisis Data Multivariat II Menggunakan Software R


X! I #! ; l!! $! ? l!" $" ? % ? l!m $m ? %! X" I #" ; l"! $! ? l"" $" ? % ? l"m $m ? %" $ $ $ $

Xp I #p ; lp! $! ? lp" $" ? % ? lpm $m ? %p

dengan$ #i ; rata-rata variabel asal ke i %i ; spesifik faktor ke i $, ; Common faktor ke &. li, disebut loading dari peubah asal ke i pada faktor ke &. Atau dalam bentuk matriks men,adi

(X I ) (p&!)

(p&m) (m&!) (p&!)

Asumsi yang digunakan dalam analisis !aktor adalah4 #ata berasal dari populasi yang berdistribusi normal univariat Dalam set data terdapat multikolinieritas dapat diu,i dengan menggunakan ,i +artlett. 2(F) ; ', 2(e) ; 9

Cov(F) ; 2(FFG) ; I Cov(e) ; 2(e e() ; ; diag('!, %., 'p) F dan saling bebas, Cov (D$ * = 0 (D$ *6 = @

Koefisien li, disebut loading dari variabel asal ke i pada faktor ke &, maka matriks L adalah matriks factor loading dan $!, $",%., $m , %!, %",%. %p adalah tidak terobservasi.

Bertho antular - %>

Praktikum Analisis Data Multivariat II Menggunakan Software R


+erikut adalah hal-hal yang perlu dilakukan dalam analisis faktor )engidentifikasikan struktur )enentukan ,umlah faktor (scree plot, eigen values, proporsi varians) )enduga parameter (factor loading dan sistematik varians) - )etode Komponen tama - )etode Kemungkinan )aksimum - )etode Kuadrat -erkecil /otasi faktor (orto)onal$ varimax, (uartimax, e(uimaxJ o*li+!e$ o limax, (uartimin, o limin) 'nterpretasi faktor (eigen values, explained variances, factor scores, koefisien faktor)

2. Analisis %a&tor dalam R Analisis 3aktor dalam soft(are / dapat dianalisis melalui fungsi ,actanal-.. 3ungsi ,actanal-. adalah analisis ekstraksi faktor menggunakan metode kemungkinan maksimum. Dalam soft(are /, pen,elasan tentang model analisis faktor adalah sebagai berikut

/;0,?e

dengan / adalah vektor berukuran (p & !), K adalah matriks loading berukuran (p & k), , adalah vektor skor faktor berukuran (k & !) dan e adalah galat berukuran (p L !). Dalam model ini tidak ada komponen yang terobservasi kecuali /. Asumsi yang mendasari model ini adalah bah(a faktor tidak saling berkorelasi, dan bah(a galat saling bebas dengan varians phi yang disebut 1uniMuenesses1. Kemudian dalam analisi faktor model bagi matriks varians-kovarians / adalah

1;0E0 23i

Apabila dilakukan rotasi terhadap data maka 0 dapat digantikan dengan 40 untuk setiap Bertho antular - %?

Praktikum Analisis Data Multivariat II Menggunakan Software R


matriks 4 yang ortogonal. 'nput data berupa matriks varians-kovarians dapat digunakan dalam analisis faktor. Selain itu matriks data 5 ,uga dapat digunakan atau berupa formula yang menyatakan model konstruk dalam bentuk matriks sehingga dapat diperoleh dari matriks data tersebut matriks varians-kovariansnya. Dang perlu diperhatikan dalam hal ini adalah bah(a semua nilai-nilai dalam variabel-variabel yang terlibat harus numerik. Dalam analisis menggunakan fungsi ,actanal, matriks varians-kovarians dikonversi men,adi matriks korelasi. )odel fit diperoleh dengan mengoptimasi fungsi log likelihood diba(ah asumsi uniMuenesses berdistribusi multivariat normal. .ilai uniMuenesses secara teknis berada dalam interval N9, !O, tetapi apabila nilainya mendekati nol akan men,adi masalah, dan optimalisasi berakhir dengan batas ba(ah 9.99@. .ilai faktor skor hanya dapat diperoleh apabila yang digunakan adalah matriks data. )etode yang digunakan adalah metode regresi dari -homson (!:@!) dan metode (eighted least sMuares (84S) dari +artlett (!:#A). Kedua metode ini menaksir nilai skor 3. )etode -homson menaksir 3 dengan model sebagai berikut

= ' ! X $

dan kemudian menggantikan nilai-nilai parameter dengan penaksirnya. 0rinsip )etode +artlett adalah meminimumkan ,umlah kuadrat galat yang sudah dibakukan atau diboboti. berikut ini adalah pen,elasan synta& dan cara penggunaannya. raian

> factanal(x, factors, data = >@22, co7mat = >@22, n,o=s = >1, su=set, na,action, start = >@22, scores = c("none", "regression", "Aartlett"), rotation = "7arimax", control = >@22, ,,,)

Beterangan/

Bertho antular - &@

Praktikum Analisis Data Multivariat II Menggunakan Software R


x/ factors/ data/ co7mat/ Cuga termasu; matri;s 7arians-;o7arians, n,o=s/ =anya;nya pengamatan dari data, opsi ini diguna;an apa=ila opsi Dco7matE adala+ matri;s ;o7arians, su=set/ 3pesifi;asi pengamatan yang diguna;an, Figuna;an apa=ila opsi DxE diguna;an se=agai matri;s data atau formula, na,action/ start/ opsi untu; data +ilang, diguna;an apa=ila opsi GxG =erupa formula dengan nilai default D>@22E adala+ matri;s yang =erisi nilai aHal dengan tiap ;olom merupa;an set aHal uniIuenesses, scores/ metode ?+ompson, dan "Aartlett"E =ila mengguna;an metode AartlettGs Heig+ted least-sIuares rotation/ tipe rotasi yang diguna;an, secara default =ernilai "none" nilai s;or, 1da dua tipe yaitu "regression" =ila mengguna;an =erupa formula atau matri;s numeri; dari o=Ce; =anya; fa;tor yang diguna;an, adala+ data frame yang diguna;an apa=ila x =erupa formula, adala+ matri;s 7arians-;o7arians dalam +al ini matri;s ;orelasi

.ilai-nilai hasil analisis faktor menggunakan fungsi ,actanal

loadings/ ;e

menampil;an matri;s loading fa;tor yang terurut dari =esar

;ecil =erdasar;an Cumla+ ;uadrat loading,, uniIuenesses/ correlation/ criteria/ menampil;an nilai uniIuenesses, menampil;an matri;s ;orelasi yang diguna;an, +asil dari optimalisasi yaitu nilai -$ log-li;eli+ood dan informasi iterassi yang diguna;an factors/ dof/ ?+e argument DfactorsE, menampil;an nilai deraCat ;e=e=asan model analisis fa;tor

Bertho antular - &%

Praktikum Analisis Data Multivariat II Menggunakan Software R


met+od/ scores/ n,o=s/ 3?1?53?56, 8912/ metode yang diguna;an (dalam +al ini adala+ "mle"), menampil;an matri;s fa;tor s;or =anya; pengamatan, menampil;an nilai signifi;ansi statisti; uCi dan p-value,

Dalam analisis faktor ada banyak variasi penggunaannya sehingga sulit bagi kita untuk membandingkan output dari program yang berbeda-beda. +agaimanapun metode optimalisasi dalam analisis faktor menggunakan ma&imum likelihood cukup sulit.

Synta& berikut adalah contoh pengunaannya

> fit <- factanal(data;u, factors=banyak_faktor, rotation="7arimax") > print(fit, digits=$, cutoff=,", sort=?<@4) > load <- fit$loadings > plot(load,type="n") > text(load,la=els=names(mydata),cex=,') : Jutput analisis fa;tor : *enampil;an loading factor : plot fa;tor 1 dan fa;tor $ : menam=a+;an nama 7aria=el

Conto Kas!s " Dalam suatu studi consumer)preference diambil sampel acak dari se,umlah konsumen. Kepada mereka ditanyakan mengenai @ atribut dari sebuah produk baru. /espon dari konsumen menggunakan skala A semantik differensial, yang hasilnya telah dihitung men,adi matriks korelasi berikut ini (5ohnson 7 8ichern, "99" halaman 6>A)

Atribut (Pariabel) -aste Qood buy for money 3lavor Suitable for snack 0rovides lots energy

! ! 9.9" 9.:< 9.6" 9.9!

" 9.9" ! 9.!# 9.A! 9.>@

# 9.:< 9.!# ! 9.@ 9.!!

6 9.6" 9.A! 9.@ ! 9.A:

@ 9.9! 9.>@ 9.!! 9.A: ! Bertho antular - &&

Praktikum Analisis Data Multivariat II Menggunakan Software R

4akukan analisis faktor terhadap matriks korelasi dari @ variabel tersebut

Sebelum menganalisis data tersebut perlu diinputkan dulu matriks korelasinya dengan cara sebagai berikut

> mc<matrix(c(1,,!$,,9&,,%$,,!1,,!$,1,,1",,'1,, #,,9&,,1",1,,#,,11,,%$,,'1,,#,1,,' 9,,!1,, #,,11,,'9,1), #, #) > mc .,10 .,$0 .,"0 .,%0 .,#0 .1,0 1,!! !,!$ !,9& !,%$ !,!1 .$,0 !,!$ 1,!! !,1" !,'1 !, # .",0 !,9& !,1" 1,!! !,#! !,11 .%,0 !,%$ !,'1 !,#! 1,!! !,'9 .#,0 !,!1 !, # !,11 !,'9 1,!!

3emudian analisis !aktor menggunakan perintah sebagai berikut

> fit<-factanal(factors=$, co7mat=mc) > fit 6all/ factanal(factors = $, co7mat = mc)

@niIuenesses/ .10 !,!$ !,$"' !,!%! !,1& !,!#$

2oadings/ )actor1 )actor$ .1,0 !,9 #

Bertho antular - &)

Praktikum Analisis Data Multivariat II Menggunakan Software R


.$,0 .",0 .%,0 .#,0 !, '" !,1"1 !, 1' !,9'" !,9'1 !,%!#

)actor1 )actor$ 33 loadings 8roportion 9ar 6umulati7e 9ar $,"9& !,%'9 !,%'9 $,!' !,%1& !, 9#

?+e degrees of freedom for t+e model is 1 and t+e fit Has !,!$""

#ari output diatas terlihat bahwa *aktor % beranggotakan variabel &$ variabel 8 dan variabel ; sedangkan variabel % dan variabel ) berada pada *aktor &.

6. Menent!&an 7an$a& %a&tor Bal yang penting dalam analisis !aktor adalah menentukan berapa banyak !aktor yang mesti diambil. 9eberapa metode dapat digunakan untuk menentukan banyak !aktor$ misalnya menggunakan kriteria nilai eigen$ proporsi varians dan secara gra!is menggunakan screeplot. "ntuk itu dalam so!tware 2 disediakan paket nFactors. *ungsi yang digunakan dalam paket ini adalah nScree$ uraian berikut adalah penjelasan mengenai synta- dan contoh penggunaannya *ungsi nScree dalam so!tware 2 adalah suatu !ungsi untuk menganalisis banyaknya komponen atau !aktor dalam analisis !aktor eksplanatori. *ungsi ini berguna untuk memberikan in!ormasi mengenai banyak !aktor melalui aturan 3aiser dan analisis paralel.

> n3cree(eig=>@22, x=eig, aparallel=>@22, cor=?<@4, model="components", criteria=>@22, ,,,)

3eterangan4 eig4 adalah parameter berupa eigenvalues yang akan dianalisis Bertho antular - &8

Praktikum Analisis Data Multivariat II Menggunakan Software R


-4 adalah input dapat berupa vektor eigenvalues$ atau matriks korelasi atau kovarians dari data (data !rame aparallel4 Cor hasil dari analisis paralel. berniilai 512"06 apabila yang digunakan matriks korelasi dan :*A/S0: apabila yang digunakan matriks kovarians model4 criteria4 bernilai EcomponentsF atau E!actorsE bernilai numerik.

Basil analisis yang dapat ditampilkan dari paket nFactors

Components

4 berupa data !rame yang berisi banyaknya komponen atau !aktor yang didasarkan atas aturan yang berbeda

ComponentsGnoc ComponentsGna!

4 9anyaknya komponen atau !aktor berdasarkan koordinat optimal (oc 4 9anyaknya komponen atau !aktor berdasarkan a!!eleratoin fa!tor (a!

ComponentsGnpar.analysis 4 9anyaknya komponen atau !aktor berdasarkan koordinat analisis paralel ComponentsGnkaiser 4 9anyaknya komponen atau !aktor berdasarkan aturan 3aiser Analysis 4 9erupa #ata !rame berisi vektor yang berkaitan dengan aturan yang berbeda AnalysisG0igenvalues 4 Menampilkan nilai eigen AnalysisGArop AnalysisGCumu AnalysisGAred.eig AnalysisGHC 4 .ilai proporsi varians yang dihitung dari nilai eigen 4 proporsi kumulati! dari varians yang dihitung dari nilai eigen 4 prediksi nilai eigen dari setiap koordinat garis regresi optimal 4 nilai koordinat optimal (oc

AnalysisGAcc.!actor 4 nilai A!!eleration fa!tor ,a!, AnalysisGA* 4 nilai kritis a!!eleration fa!tor ,a!,

Bertho antular - &;

Praktikum Analisis Data Multivariat II Menggunakan Software R

Secara umum contoh penggunaan paket nFactors untuk data pada Contoh kasus % dengan banyak pengamatan adalah &@@ dapat dilihat pada synta- berikut ini

: *enentu;an =anya; fa;tor yang die;stra;si > li=rary(n)actors) > e7 <- eigen(mc) : get eigen7alues > ap <- parallel(su=Cect=$!!,7ar=#,rep=1!!,cent=,!#) > n3 <- n3cree(e7$7alues, ap$eigen$Ie7pea) > plotn3cree(n3)

Bertho antular - &<

Praktikum Analisis Data Multivariat II Menggunakan Software R


Dari gambar diatas diperoleh hasil bah(a banyak faktor yang dapat diambil adalah " berdasarkan analisis paralel. +erdasarkan metode acceleration factor (A3) banyak faktor yang dapat diambil adalah !. *al ini sesuai dengan output yang dapat ditampilkan diantaranya sebagai berikut

> n3$6omponents noc naf nparallel n;aiser 1 ! 1 $ "

> n3$1nalysis 4igen7alues 1 $ " % # 8rop 6umu 8ar,1nalysis 8red,eig J6 1cc,factor 1)

1,11'1%$9 !,$"9$'"% !,$"9$'"% 1,!"#$%'1 !,$$1'"$' !,%&1!!&$ !,9% ' '# !,$!"$1%# !,&&%$$!' !, % %#$ !,1 1'$%# !, %#9%#$ 1,!!!!!!!

1 1,1%!#'%1 1 1,!&"#% $ 1 !,9''&"9& 1 1 >1 >1

>1 (< 1)) -!,!!%#&" !9 -!,!1" '#!%" -!,!$ #$1!" >1

!,'19$&&1 !,1#%!#%

%!n)si Alternati, !nt!& Analisis %a&tor dalam R (1) Fungsi factor.pa dalam Paket psych *ungsi lain untuk analisis !aktor adalah factor.pa( ) yang terdapat pada Aaket psych. #alam !ungsi ini menyertakan analisis !aktor menggunakan prin!ipal a"is. #ari sekian banyak metode analisis !aktor pendekatan konvensional adalah prin!ipal a"es melalui dekomposisi nilai eigen dari matriks korelasi dipeorleh nilai komunalitas dari tiap variabel dan ditaksir n !aktor pertama. .ilai komunalitas ini dimasukkan ke dalam diagonal matriks dan prosedur diulang hingga jumlah diagonal tidak berubah. Metode lain adalah menggunakan Metode kuadrat terkecil untuk memperoleh nilai solusi residual minimum (disebut minres . Iariasi dari minres digunakan dalam kuadrat terkecil diboboti (weighed least s#uares . Metode penaksiran lainnya adalah metode kemungkinan maksimum. Metode ini bisa diperoleh dari !ungsi fa atau factanal yang telah dijelaskan sebelumnya. Bertho antular - &=

Praktikum Analisis Data Multivariat II Menggunakan Software R


Metode Prin!ipal a"es dapat digunakan pada saat metode kemungkinan maksimum tidak mencapai konvergen. Masalah dalam analisis !aktor adalah mencari penaksir terbaik bagi komunalitas. Apabila S#uared Multiple $orrelation (SMC digunakan untuk tiap variabel akan diperoleh nilai komunalitas yang underestimate. Algoritma yang digunakan tidak mencoba untuk menemukan solusi terbaik (seperti dalam kriteria kemungkinan maksimum tetapi cukup dengan mencapai konvergen dengan cepat melalui dekomposisi nilai eigen. Aendekatan yang berbeda adalah solusi yang diperoleh dari minimum residual (minres merupakan metode kuadrat terkecil yang tidak diboboti ( unweighted least s#uares . *ungsi optim digunakan dan disesuaikan dengan elemen-elemen matriks korelasi untuk meminimumkan kuadrat residu. Metode minres dan pa dapat digunakan pada saat metode maksimum likelihood tidak mencapai konvergen dan dapat digunakan apabila matriks input singular. Setidaknya solusi yang diperoleh dari metode minres lebih mirip dengan metode kemungkinan maksimum dibandingkan solusi dari metode pa. Secara umum solusi dari metode minres dan J/S mengikuti ide dari !ungsi factanal. Metode weighted least s#uares (J/S memberikan bobot dari matriks residu dengan % dibagi diagonal invers matriks korelasi. Metode generali%ed least s#uares (K/S memberikan bobotmatriks residual dengan invers matriks korelasi. 9eberapa metode rotasi dalam analisis !aktor yang dapat digunakan adalah varimameliputi LIarima-F$ LMuartima-F$ Lbentler1F dan Lgeomin1F berupa rotasi ortogonal$ dan obliMue meliputi Eproma-E$ EobliminE$ Esimplima-E$ EbentlerN$ dan EgeominNE atau EclusterE. "raian berikut adalah penjelasan mengenai synta- dan contoh penggunaannya

+ !a(r$n!actors=%$n.obs = .A$ rotate=EobliminE$ scores=*A/S0$ residuals=*A/S0$ SMC=12"0$ covar=*A/S0$missing=*A/S0$impute=EmedianE$min.err = @.@@%$ ma-.iter = ;@$symmetric=12"0$warnings=12"0$!m=EminresE$alpha=.%$ ...

+ !actor.pa(r$ n!actors=%$ residuals = *A/S0$ rotate = Evarima-E$n.obs = .A$ scores = *A/S0$SMC=12"0$ missing=*A/S0$impute=EmedianE$min.err = @.@@%$ digits = &$ ma-.iter = ;@$symmetric=12"0$warnings=12"0$!m=EpaE Bertho antular - &>

Praktikum Analisis Data Multivariat II Menggunakan Software R

+ !actor.minres(r$ n!actors=%$ residuals = *A/S0$ rotate = Evarima-E$n.obs = .A$ scores = *A/S0$SMC=12"0$ missing=*A/S0$impute=EmedianE$min.err = @.@@%$ digits = &$ ma-.iter = ;@$symmetric=12"0$warnings=12"0$!m=EminresE

+ !actor.wls(r$n!actors=%$residuals=*A/S0$rotate=Evarima-E$n.obs = .A$ scores=*A/S0$SMC=12"0$missing=*A/S0$impute=EmedianE$ min.err = .@@%$ digits=&$ ma-.iter=;@$symmetric=12"0$warnings=12"0$!m=EwlsE 3eterangan4 r .!actors n.obs 4 adalah matriks korelasi atau matriks data mentah. 4 adalah banyak !aktor yang akan diekstrak$ nilai de!aultnya adalah satu 4 banykanya pengamatan yang digunakan. Hpsi ini berlaku apabila input adalah matriks korelasi. #an digunakan untuk mencari statistik goodness of fit statisti!s. 2otate 4 berisi metode rotasi meliputi EnoneE$ Evarima-E$ EMuartima-E$ Ebentler1E$ dan Egeomin1E untuk rotasi ortogonal. Eproma-E$ EobliminE$ Esimplima-E$ EbentlerN$ dan EgeominNE or EclusterE. .ilai de!ault untuk opsi ini adalah oblimin residuals scores SMC covar 4 Matriks residual yang akan ditampilkan 4 bernilai L12"0F untuk menampilkan nilai taksiran fa!tor s!ores 4 benilai L12"0F apabila menggunakan s#uared multiple !orrelations 4 bernilai L12"0F bila yang digunakan matriks kovarians$ bernilai L*A/S0F bila yang digunakan matriks korelasi missing 4 9ernilai L12"0F apabila akan mengganti data hilang dengan rata-rata atau median. Hpsi ini digunakan apabila opsi scores bernilai L12"0F. impute 4 digunakan untuk mengganti data hilang. Hpsi ini bernilai EmedianE untuk mengganti dengan median atau EmeanE untuk mengganti dengan rata-rata. Bertho antular - &?

Praktikum Analisis Data Multivariat II Menggunakan Software R


min.err 4 adalah nilai batas untuk iterasi. Oterasi berhenti pada saat perubahan komunalitas lebih kecil dari nilai min.err digits ma-.iter symmetric warnings 4 berapa banyak digit output yang digunakan 4 .ilai maksimum iterasi 4 bernilai L12"0F atau L*/AS0F 4 bernilai L12"0F untuk menampilkan peringatan apabila terlalu banyak !aktor yang akan diekstrak !m 4 metode !aktorisasi bernilai EminresE untuk minimum residual (H/S $ bernilai LwlsE untuk weighted least sMuares (J/S $ LglsE untuk generaliPed weighted least sMuares (K/S $ EpaE untuk principal !actor dan EmlE untuk ma-imum likelihood. alpha 4 adalah nilai alpha untuk selang kepercayaan 2MS0A

Basil-hasil yang dapat ditampilkan adalah sebagai berikut4

values e.values communality

4 menampilkan nilai eigen dari common !aktor 4 menampilkan nilai eigen dari matriks asli 4 menampilkan nilai taksiran komunalitas setiap item. .ilai ini merupakan jumlah kuadrat loading !aktor untuk item tersebut.

2otation n.obs loadings !it

4 menampilkan rotasi yang digunakan 4 menampilkan banyak pengamatan yang digunakan 4 menampilkan nilai loading 4 Bow well does the !actor model reproduce the correlation

matri-. 1his is just (sum(rQ&ij - sum(rRQ&ij Ssum(rQ&ij (See 5ISS6$ 5OC/"S16$ and 5principal6 !or this !it statistic. !it.o!! #o! 4 how well are the o!! diagonal elements reproducedT 4 derajat kebebasan dari model yang digunakan. .ilai ini merupakan Bertho antular - )@

Praktikum Analisis Data Multivariat II Menggunakan Software R


banyaknya nilai korelasi pengamatan dikurangi banyaknya parameter. #ituliskan dalam rumus matematika adalah sebagai berikut

dof =

n n ! ( (! n ( " "

dengan n adalah banyaknya pengamatan # banyaknya !aktor objective S1A1OS1OC 4 menampilkan !ungsi objekti!. 4 .ilai statistik chi kuadrat yang didasarkan atas !ungsi objekti!. Apanila dituliskan dalam rumus matematika adalah sebagai berikut

" =

n ! " p @ " ( f < #

dengan n adalah banyak pengamatan p adalah banyak variabel # adalah banyak !aktor f adalah !ungsi objekti! Ahi 4 interfa!tor !orrelation.

communality.iterations4 menampilkan taksiran komunalitas dari tiap iterasi (Banya digunakan pada metode principal a-is 2esidual 9OC 2& 4 menampilkan matriks korelasi residual setelah model !aktor digunakan 4 menampilkan nilai Ba&esian Information $riterion 4 .ilai 2& multiple antara !aktor dengan penaksir !actor score. Menggunakan nilai ini dapat diketahui korelasi minimum antara dua !aktor dengan rumus &2& - % r.scores weights 4 nilai korelasi dari penaksir !actor score 4 pembobot yang digunakan Bertho antular - )%

Praktikum Analisis Data Multivariat II Menggunakan Software R


valid score.cor 4 nilai koe!isien validitas 4 matriks korelasi dari penaksir !aktor score dengan pembobot berdasarkan matriks loading.

Synta- berikut adalah contoh analisis !aktor menggunakan principal a-is dengan !ungsi !actor.pa(

: 8rincipal 1xis )actor 1nalysis li=rary(psyc+) fit <- factor,pa(data;u, nfactors=", rotation="7arimax") fit : print results

dataku r!actors rotation

adalah data yang digunakan (raw data atau matriks kovariansSkorelasi . banyak !aktor yang diekstraksi rotasi yang digunakan dalam hal ini Evarima-E or Eproma-E.

(2) Paket FactoMineR 0aket %actoMineR meliputi beragam fungsi tambahan dalam analisis faktor eksploratori. Dalam 0aket ini menyertakan analisis faktor untuk variabel kualitatif maupun kuantitatif. Dalam paket ini ,uga menyertakan grafik untuk analisis faktor secara otomatis. 3ungsi yang digunakan adalah 0CA dan contoh penggunaan paket %actoMineR secara sederhana.

: 861 9aria=le )actor *ap li=rary()acto*ine<) result <- 861(mydata) : grafi; digam=ar;an secara otomatis

0aket n%actors, ps$c dan %actoMineR tidak disertakan secara default dalam soft(are tetapi dapat diunduh secara )ratis pada the Comprehensive / Archive .et(ork (C/A.) di alamat http$HHC/A../-pro,ect.orgH. Bertho antular - )&

Praktikum Analisis Data Multivariat II Menggunakan Software R

M !U" ### ANALISIS KORELASI KANONIK


". Penda !l!an Analisis korelasi kanonik berguna untuk mengidenti!ikai dan kuanti!ikasi asosiasi antara dua set variabel. Analisis korelasi kanonik tercurah pada korelasi antara kombinasi linier dari suatu set variabel dengan kombinasi linier set variabel lainnya. Aasangan-pasangan kombinasi linier disebut sebagai variabel kanonik sedangakn korelasinya disebut korelasi kanonik. 3orelasi kanonik mengukur kekuatan asosiasi antara dua set variabel.

2. Korelasi Kanoni& dalam R Analisis Korelasi Kanonik dalam soft(are / dapat dianalisis melalui 0aket CCA yang dapat diunduh pada the Comprehensive / Archive .et(ork (C/A.) di alamat http$HHC/A../pro,ect.orgH. Setelah itu install paket tadi di soft(are / kemudian loading dengan perintah

> li=rary(661)

Adapun synta- untuk analisis korelasi kanonik adalah sebagi berikut

> cc( K, -)

7 U

adalah set variabel yang pertama berukuran n - p adalah set variabel yang kedua berukuran n - M

Contoh Data berikut mengenai studi nutrisi dari tikus. Data diperoleh dari 0ascal )artin dari the -o&icology and 0harmacology 4aboratory (3rench .ational 'nstitute for Agronomic /esearch). Data ini sudah disertakan dalam paket CCA dengan nama n!trimo!se sehingga kita tinggal Bertho antular - ))

Praktikum Analisis Data Multivariat II Menggunakan Software R


mempergunakannya sa,a. Dari data nutrimouse ingin dikorelasikan gen dengan lipid dari tikus. +erikut adalah synta& yang digunakan

> data(nutrimouse) > K=as,matrix(nutrimouse$gene.,1/1!0) gen > -=as,matrix(nutrimouse$lipid) lipid > res,cc=cc(K,-) > plot(res,cc$cor,type="=") > plt,cc(res,cc)

: mengguna;an data nutrimouse : set 7aria=el pertama yaitu

: set 7aria=el ;edua yaitu

: ;orelasi ;anoni; : plot ;orelasi

Rutput dari synta& tersebut adalah

Bertho antular - )8

Praktikum Analisis Data Multivariat II Menggunakan Software R

ntuk menampilkan seluruh output gunakan synta& berikut

B res.cc B res.ccTcor B res.ccT&coef B res.ccTycoef B res.ccTscores

S )enampilkan seluruh output S )enampilkan nilai korelasi kanoniknya S )enampilakn penaksir koefisien bagi variabel L S )enampilakn penaksir koefisien bagi variabel D S )enampilkan koordinat bagi variat kanonik

Bertho antular - );

Praktikum Analisis Data Multivariat II Menggunakan Software R

MODUL I8 ANALISIS DISKRIMINAN


". Penda !l!an Analisis Diskriminan adalah suatu teknik mutivariat yang terkonsentrasi pada pemisahan secara tegas suatu set ob,ek atau pengamatan dan menenpatkan suatu ob,ek atau pengamatan baru ke dalam kelompok yang telah didefinisikan sebelumnya. -u,uan analisis diskriminan sendiri adalah untuk menduga keanggotaan ob,ek atu pengamatan dalam suatu kelompok melalui fungsi dari variabel-variabel yang diukur pada ob,ek tersebut. 3ungsi pembentuk kelompok tersebut merupakan sebuah model yang linier terhadap variabel maupun terhadap koefisiennya. )odel linier yang mendasari analisis diskriminan mempunyai setidaknya tiga asumsi yaitu !. antar ob,ek atau pengamatan harus saling bebas ". variabel-variabel pen,elas harus memiliki distribusi normal multivariat #. banyaknya pengamatan harus lebih besar dari banyaknya variabel

2. Analisis Dis&riminan dalam R Analisis Diskriminan dalam soft(are / dapat dianalisis melalui 0aket MASS. Secara default paket )ASS telah disertakan dalam installasi a(al soft(are / sehingga kita tinggal mengaktifkannya dengan perintah

> li=rary(*133)

0aket MASS telah meliputi fungsi analisis diskriminan linier dan kuadratik. 0enggunaan analisis diskriminan menggunakan soft(are / akan di,elaskan melalui ilustrasi berikut ini$ Dalam rangka mengatur penangkapan 'kan Salmon, sangat diinginkan bisa mengidentifikasi Bertho antular - )<

Praktikum Analisis Data Multivariat II Menggunakan Software R


apakah ikan yang tertangkap berasal dari Alaska atau Kanada. 'kan Salmon mempunyai ciri khas dalam perkembangan pertumbuhannya. 'kan salmon lahir di air ta(ar kemudian tumbuh de(asa di air laut. ntuk keperluan tersebut lima puluh 'kan Salmon diambil dari masingmasing tempat, dan pertumbuhan diameternya diukur ketika ikan-ikan itu hidup di air ta(ar dan ketika hidup di air laut, selain itu dibedakan pula terhadap ,enis kelaminnya. -u,uannya adalah untuk mengetahui apakah ikan yang tertangkap di kemudian hari berasal dari Alaska atau dari Kanada. (5ohnson 7 8ichern "99" halaman <9A). ntuk keperluan analisis untuk ,enis kelamin diberi kode ! untuk ikan ,antan dan " untuk ikan betina.

Des&ripsi Data ntuk menampilkan deskripsi dari data salmon lakukan perintah-perintah berikut$

> salmon<-read.csv("salmon.csv") > str(salmon) 'data.frame': 100 obs. of 4 variables: $ Ikan. almon: !actor "# $ levels "%laska"&"'anada": 1 1 1 1 1 1 1 1 1 1 ... $ %ir(a"ar $ %ir/a0t $ 1' : int 10) 1*1 10+ ), -- ). -4 11. .- -- ... : int *,) *++ 4,- +0, 40$ 4$* 440 4)- 4*$ 40* ... : int $ 1 1 $ 1 $ 1 $ $ 1 ...

> alaska<-c(mean(salmon$%ir(a"ar21:+03)&sd(salmon$%ir(a"ar21:+03) ) > kanada<-c(mean(salmon$%ir(a"ar2+1:1003)&sd(salmon$%ir(a"ar2+1:1003)) > sdes<-data.frame(alaska&kanada) > ro".names(sdes)4c("5ata-rata"&" im6.7ak0") > sdes alaska 5ata-rata im6.7ak0 -).*)000 1,.14**+ kanada 1*..4,000 1).0+.-.

> alaska<-c(mean(salmon$%ir/a0t21:+03)&sd(salmon$%ir/a0t21:+03) ) > kanada<-c(mean(salmon$%ir/a0t2+1:1003)&sd(salmon$%ir/a0t2+1:1003))

Bertho antular - )=

Praktikum Analisis Data Multivariat II Menggunakan Software R


> sdes$<-data.frame(alaska&kanada) > ro".names(sdes$)4c("5ata-rata"&" im6.7ak0") > sdes alaska 5ata-rata im6.7ak0 4$-.,,000 *..404*, kanada *,,.,$000 $-.)).4.

Secara deskriptif terlihat bah(a rata-rata diameter pertumbuhan ikan salmon di Alaska lebih kecil dibandingkan dengan di Kanada.

$en%u&ian Asumsi 'ormalitas Multi(ariat Secara umum ada dua pendekatan untuk mengu,i distribusi data .ormal )ultivariat yaitu menggunakan metode grafik (U-U 0lot) dan menggunakan pengu,ian hipotesis ( ,i )shapiro). +aris-baris perintah berikut adalah pengu,ian distribusi normal multivariat untuk kedua metode

: *etode Lrafi; MM-8lot > salmon$<-data,frame(salmon$1ir?aHar, salmon$1ir2aut) > K <- as,matrix(salmon$) > center <- col*eans(K) > n <- nroH(K) > p <- ncol(K) > co7 <- co7(K) > d <- ma+alano=is(K,center,co7) O yla=="Nara; *a+alano=is") > a=line(a=!,==1) : *eng+itung Nara; *a+alano=is > IIplot(Ic+isI(ppoints(n),df=p),d,main="MM-8lot untu; Fata 3almon", : mem=entu; matri;s n x p : titi; pusat

Bertho antular - )>

Praktikum Analisis Data Multivariat II Menggunakan Software R

: 8enguCian Pipotesis 3+apiro li=rary(m7normtest) ms+apiro,test(*) : input * +arus matri;s

Dari grafik data terlihat agak melenceng untuk ,arak data yang cukup besar yang mengindikasikan data tidak berdistribusi normal multivariat.

%!n)si Dis&riminan Linier *ungsi lda() dalam paket MASS dapat digunakan untuk analisis diskriminan linier. *ungsi ini didasarkan pada variabel-variabel yang terpusat tetapi bukan nilai baku. "raian berikut adalah penjelasan mengenai penggunaan !ungsi lda.

+ lda(-$ ...

Bertho antular - )?

Praktikum Analisis Data Multivariat II Menggunakan Software R


atau

+ lda(!ormula$ data$ ...$ subset$ na.action

atau + lda(-$ grouping$ prior = proportions$ tol = %.@e-8$ method$ CI = *A/S0$ nu$ ...

+ lda(-$ grouping$ ...$ subset$ na.action

keterangan4 !ormula 4 adalah model atau !ungsi yang digunakan. Contoh 5K V -% ( -& ( ...6 dalam hal ini K adalah variabel respon berupa data nominal yang menjelaskan kelompok dan -%$ -&$ ' adalah variabelnya. data 4 berupa data !rame dari variabel-variabel yang digunakan dalam !ormula 4 berupa matriks atau data !rame dari variabel-variabel penjelas. Hpsi ini digunakan apabila !ormula tidak dide!inisikan grouping 4 suatu !aktor yang mende!inisikan kelompok dari tiap pengamatan Hpsi ini digunakan apabila !ormula tidak dide!inisikan prior tol 4 adalah !ungsi peluang prior dari keanggotaan kelompok. 4 nilai toleransi yang digunakan apabila diperoleh matriks singular. Iariabel dan kombinasi linier varians unit variabel yang nilainya kurang dari .ilai kuadrat tol berguna akan ditolak atau dikeluarkan. na.action method 4 suatu !ungsi untuk penanganan data hilang 4 bernilai 5EmomentE6 untuk penaksir baku bagi rata-rata dan varianas$ EmleF untuk penaksir kemungkinan maksimum$ 5EmveE6 untuk digunakan dalam 5cov.mve6$ atau EtE untuk penaksir robust berdasarkan distribusi t. CI .u 4 bernilai L12"0F untuk menampilkan cross-validation. 4 derajat bebas untuk metode EtE. Bertho antular - 8@

Praktikum Analisis Data Multivariat II Menggunakan Software R

Basil yang dapat ditampilkan adalah sebagai berikut prior means scaling 4 prior probabilities yang digunakan. 4 rata-rata kelompok. 4 menampilkan matriks yang mentrans!ormasikan pengamatan menjadi !ungsi diskriminan. svd 4 menampilkan dekomposisi nilai singular yaitu ratio simpangan baku antar kelompok dengan simpangan baku dalam kelompok. 3uadrat dari nilai ini adalah nilai statistik *. n call 4 banyak pengamatan yang digunakan. 4 !ungsi yang dihasilkan.

"ntuk analisis diskriminan linier data Okan salmon dapat menggunakan perintah-perintah berikut

> li=rary(*133) > fit <- lda(5;an,3almon Q 1ir?aHar O 1ir2aut, data=salmon, na,action="na,omit") 6all/ lda(5;an,3almon Q 1ir?aHar O 1ir2aut, data = salmon, na,action = "na,omit")

8rior pro=a=ilities of groups/ 1las;a Banada !,# !,#

Lroup means/ 1ir?aHar 1ir2aut 1las;a Banada 9 ," 1"',%& %$9,&& "&&,&$

Bertho antular - 8%

Praktikum Analisis Data Multivariat II Menggunakan Software R


6oefficients of linear discriminants/ 2F1 1ir?aHar 1ir2aut !,!%%# #'$ -!,!1 !" #&

Kemudian apabila ingin mengetahui akurasi dari analisis diskriminan yang telah dibuat lakukan prosedur berikut ini

: *enampil;an ta=el ;eanggotaan se=enarnya dan +asil predi;si > fit <- lda(5;an,3almon Q 1ir?aHar O 1ir2aut, data=salmon, na,action="na,omit",69=?) > ct <- ta=le(salmon$5;an,3almon, fit$class) > ct 1las;a Banada 1las;a Banada %% 1 & %9

: *enentu;an persentase ;etepatan ;eanggotaan untu; tiap ;ategori > diag(prop,ta=le(ct, 1)) 1las;a Banada !, !,9

: *enentu;an ?otal persentase ;etepatan ;eanggotaan > sum(diag(prop,ta=le(ct))) .10 !,9"

Secara umum kekeliruan dalam klasifikasi sebesar A= cukup kecil. Artinya hanya sekitar A dari !99 ekor 'kan Salmon Alaska yang diklasifikasikan sebagai 'kan Salmon Kanada dan 'kan Salmon Kanada yang diklasifikasikan sebagai 'kan Salmon Alaska. Bertho antular - 8&

Praktikum Analisis Data Multivariat II Menggunakan Software R

%!n)si Dis&riminan K!adrati& "ntuk memperoleh !ungsi diskriminan kuadratik dapat melalui !ungsi )da( ) atau lda( ). *ungsi diskriminan kuadratik tidak mengasumiskan homogenitas matriks varians-kovarians. 3edua !ungsi ini ada didalam paket MASS. "raian berikut adalah penjelasan mengenai penggunaan !ungsi Mda.

+ Mda(-$ ...

atau

+ Mda(!ormula$ data$ ...$ subset$ na.action

atau + lda(-$ grouping$ prior = proportions$ tol = %.@e-8$ method$ CI = *A/S0$ nu$ ...

+ Mda(-$ grouping$ ...$ subset$ na.action

keterangan4 !ormula 4 adalah model atau !ungsi yang digunakan. Contoh 5K V -% ( -& ( ...6 dalam hal ini K adalah variabel respon berupa data nominal yang menjelaskan kelompok dan -%$ -&$ ' adalah variabelnya. data 4 berupa data !rame dari variabel-variabel yang digunakan dalam !ormula 4 berupa matriks atau data !rame dari variabel-variabel penjelas. Hpsi ini digunakan apabila !ormula tidak dide!inisikan grouping 4 suatu !aktor yang mende!inisikan kelompok dari tiap pengamatan Hpsi ini digunakan apabila !ormula tidak dide!inisikan Bertho antular - 8)

Praktikum Analisis Data Multivariat II Menggunakan Software R


prior tol 4 adalah !ungsi peluang prior dari keanggotaan kelompok. 4 nilai toleransi yang digunakan apabila diperoleh matriks singular. Iariabel dan kombinasi linier varians unit variabel yang nilainya kurang dari .ilai kuadrat tol berguna akan ditolak atau dikeluarkan. na.action method 4 suatu !ungsi untuk penanganan data hilang 4 bernilai 5EmomentE6 untuk penaksir baku bagi rata-rata dan varianas$ EmleF untuk penaksir kemungkinan maksimum$ 5EmveE6 untuk digunakan dalam 5cov.mve6$ atau EtE untuk penaksir robust berdasarkan distribusi t. CI .u 4 bernilai L12"0F untuk menampilkan cross-validation. 4 derajat bebas untuk metode EtE.

Basil yang dapat ditampilkan adalah sebagai berikut prior means scaling 4 prior probabilities yang digunakan. 4 rata-rata kelompok. 4 menampilkan matriks yang mentrans!ormasikan pengamatan menjadi !ungsi diskriminan. svd 4 menampilkan dekomposisi nilai singular yaitu ratio simpangan baku antar kelompok dengan simpangan baku dalam kelompok. 3uadrat dari nilai ini adalah nilai statistik *. n call /det /ev class posterior 4 banyak pengamatan yang digunakan. 4 !ungsi yang dihasilkan. 4 menampilkan vektor setengah log determinan matriks dispersi. 4 menampilkan tingkatan dari !aktor kelompok 4 menampilkan mapping klasi!ikasi 4 menampilkan distribusi posterior

9erikut contoh penggunaan analisis diskriminan kuadratik dengan banyak kelompok adalah ) dan banyak variabel adalah 8 dan ketiga kelompok mempunyai nilai peluang prior yang sama Bertho antular - 88

Praktikum Analisis Data Multivariat II Menggunakan Software R

> li=rary(*133) > fit <- Ida(L Q x1 O x$ O x" O x%, data=na,omit(mydata), prior=c(1,1,1)R"))

Men))am*ar&an 9asil Semua pengamatan dapat diplot kedalam sebuah gambar dua dimensi dengan mengambil dua !ungsi diskriminan pertama

: *enggam=ar;an Pistogram ;edua ;ategori plot(fit) : fit from Ida

Menggambarkan scatterplot bagi kedua variabel untuk memperlihatkan keanggotaan kedua kategori. *ungsi partimat( ) dalam paket kla* dapat menggambarkan hasil dari !ungsi Bertho antular - 8;

Praktikum Analisis Data Multivariat II Menggunakan Software R


diskriminan linier dua variabel. Aerintah-perintah berikut adalah langkah-langlahnya

: Lrafi; 4;splorasi untu; 1nalisis Fis;riminan 2inier > li=rary(;la<) > partimat(5;an,3almon Q 1ir?aHar O 1ir2aut, data=salmon, met+od="lda")

Selain itu juga bisa dibuat scatterplot dengan menggunakan warna untuk masing-masing kategori. "ntuk itu gunakan perintah-perintah berikut ini.

: 3catterplot > pairs(salmon.c("1ir?aHar","1ir2aut")0, main="8lot 1nalisis Fis;riminan 5;an 3almon", pc+=$$, =g=c("red", "=lue").unclass(salmon$5;an,3almon)0)

Bertho antular - 8<

Praktikum Analisis Data Multivariat II Menggunakan Software R

#ari Kambar diatas menunjukkan perbedaan kelompok Okan Salmon dilihat dari dua variabel diameter ikan pada saat hidup di air tawar dan diameter ikan pada saat hidup di air laut. Jarna merah adalah Okan Salmon yang berasal dari Alaska dan warna biru menunjukkan Okan Salmon yang berasal dari 3anada.

Bertho antular - 8=

Praktikum Analisis Data Multivariat II Menggunakan Software R

MODUL 8 ANALISIS KLASTER


". Penda !l!an Secara sederhana Analisis Klaster digunakan untuk menentukan pengelompokkan ob,ek atau pengamatan yang didasarkan atas kemiripan ob,ek. Rb,ek yang berada dalam satu kelompok merupakan ob,ek yang mirip satu sama lain dan sebaliknya yang berbeda kelompok merupakan ob,ek yang tidak mirip satu sama lain.+erbagai metode digunakan untuk menentukan keanggotaan kelompok dalam analisis klaster. Secara umum analisis klaster dibagi men,adi dua yaitu Analisis Klaster *ierarki dan Analisis Klaster .on-*irarki. Data yang digunakan dalam Analisis Klaster dapat berupa data pengamatan yang berdistribusi )ultivariat atau bisa berupa sebuah matriks simetris proximity yaitu kemiripan antar ob,ek (similarity) atau ketakmiripan antar ob,ek ( dissimilarity). )atriks korelasi bisa digunakan sebagai matriks proximity sebagai ukuran kemiripan sedangakn matriks ,arak (misalnya *uclidian +istance) sebagai ukuran ketakmiripan.

2. Analisis Klaster Dalam R Soft(are R memiliki beragam fungsi untuk analisis klaster. Dalam bagian ini akan di,elaskan tiga pendekatan dalam analisis klaster yaitu$ Analisis Klaster hierarki agglomerative dan )etode partitioning (K-means). +eberapa pendekatan dalam penentuan banyak klaster akan di,elaskan pula dalam bagain ini. 'lustrasi berikut merupakan pen,elasan mengenai penggunaan soft(are / untuk analisis klaster hierarki. Data berikut dikumpulkan pada "" perusahaan publik di Amerika Serikat pada tahun !:A@, pada tiap perusahaan diukur variabel-variabel berikut ini$ L! L" L# L6 $ 3i&ed-charge coverage ratio (incomeHdebt) $ /ate of /eturn on capital $ Cost per K8 capacity in place $ Annual load factor Bertho antular - 8>

Praktikum Analisis Data Multivariat II Menggunakan Software R


L@ L< LA L> $ 0eak k8h demand grouth from !:A6 to !:A@ $ Sales (k8h use per year) $ 0ercent nuclear $ -otal 3uel cost (cents per k8h)

Sumber $ 5ohnson 7 8ichern "99" halaman <>A Dengan menggunakan data tersebut perusahaan-perusahaan akan dikelompokkan berdasarkan kedelapan variabel yang telah diukur. *al pertama yang harus dilakukan adalah mempersiapkan data agar dapat dianalisis. +aris-baris berikut beberapa hal yang dapat dilakukan untuk mempersiapkan data

> data;u <- na,omit(data;u) > data;u <- scale(data;u)

: *eng+ilang;anRmeng+apus data +ilang : mem=a;u;an 7aria=el-7aria=el

2. Analisis Klaster 9ierar&i Analisis Klaster *ierarki merupakan metode pengelompokkan yang didasarkan atas konsep kedekatan antar ob,ek. Rleh karena itu matriks ,arak merupakan input yang diperlukan dalam analisis ini. +eberapa metode dalam Analisis Klaster *ierarki adalah sebagai berikut !. )etode ,gglomerative H )etode 0autan (-inkage .ethod) a) 0autan -unggal (/ingle -inkage) b) 0autan 4engkap (0omplete -inkage) c) 0autan /ata-rata (,verage -inkage) d) )etode 8ard ". )etode +ivisive Dalam Analisis Klaster *ierarki baik metode agglomerative maupun metode Divisive menghasilkan suatu diagram dua dimensi yang disebut sebagai dendo)ram. Dalam / untuk semua metode agglomerative dalam Analisis Klaster *ierarki dapat menggunakan baris-baris perintah berikut ini

Bertho antular - 8?

Praktikum Analisis Data Multivariat II Menggunakan Software R


: *em=uat *atri;s Nara; d <- dist(data;u, met+od =,,,,)

Dalam hal ini metode diisi dengan ,arak yang digunakan yaitu VeuclideanV, Vma&imumV, VmanhattanV, VcanberraV, VbinaryV atau Vminko(skiV

: 1nalisis Blaster Pierar;i fit <- +clust(d, met+od=,,,,) plot(fit) groups <- cutree(fit, ;=k) Blaster : d adala+ matri;s Cara; : *enggam=ar;an dendogram : *emotong Fendogram untu; ;

Dalam hal ini metode diisi dengan metode klaster yang digunakan yaitu V(ardV, VsingleV, VcompleteV atau VaverageV. Apabila tidak ingin terlihat tahap dalam dendogramnya gunakan perintah berikut

> plot(fit, +ang= -1)

S )enggambar;an Fendogram dengan Harna dan =anya; ;laster ditentu;an


rect,+clust(fit, ;=#, =order="red")

Analisis Klaster untuk data pada ilustrasi diatas menggunakan soft(are / adalah sebagai berikut )enggunakan metode Sin)le Lin)&a)e
> pu=li;<-read,cs7("pu=lic,cs7") > str(pu=li;) Gdata,frameG/ $ x1 $ x$ $ x" $$ o=s, of / num / num / int 7aria=les/

1,!& !, 9 1,%" 1,!$ 1,%9 1,"$ 1,$$ 1,1 1,"% 1,1$ ,,, 9,$ 1!," 1#,% 11,$ 1#1 $!$ 11" 1& , 1",# 1$,$ 9,$ 1" 1$,% ,,, 19' ,,,

19$ 111 1'# $%# 1&

Bertho antular - ;@

Praktikum Analisis Data Multivariat II Menggunakan Software R


$ x% $ x# $ x& $ x' $ x / num / num / int / num / num #%,% #',9 #" #& #1,$ &! &',& #' &!,% #" ,,, 1,& $,$ ",% !," 1 -$,$ $,$ "," ',$ $,' ,,, 9!'' #! 9$1$ &%$" ""!! 111$' '&%$ 1"! $ %!& &%## ,,,

! $#," ! "%," 1#,& $$,# ! ! ! "9,$ ,,, !,&" 1,#& 1,!& !,' $,!% 1,$% 1,&# !,"1 !, & !,&$ ,,,

> pu=li;1 <- scale(pu=li;) > d <- dist(pu=li;1, met+od ="euclidean") > fit <- +clust(d, met+od="single") > plot(fit)

Apabila menggunakan metode 0omplete -inkage


> fit$ <- +clust(d, met+od="complete") > plot(fit2)

Bertho antular - ;%

Praktikum Analisis Data Multivariat II Menggunakan Software R

Apabila menggunakan metode A:era)e Lin&a)e


> fit" <- +clust(d, met+od="a7erage") > plot(fit3)

Bertho antular - ;&

Praktikum Analisis Data Multivariat II Menggunakan Software R

Apabila menggunakan metode ;ard


> fit" <- +clust(d, met+od="complete") > plot(fit3)

Bertho antular - ;)

Praktikum Analisis Data Multivariat II Menggunakan Software R

Dari keempat metode yang digunakan terlihat menghasilkan Dendogram yang berbedabeda, sehingga kita harus memilih metode yang dapat mengelompokkan data dengan ,elas. Katakan sa,a dalam kasus ini kita akan menggunaka metode 8ard untuk mengelompokkan data kita. Selan,utnya kita akan mengelompokkan data dengan cara memotong dendogram men,adi # klaster menggunakan perintah berikut ini

> groups<-cutree(fit, ;=") > rect,+clust(fit, ;=", =order=(red()

Bertho antular - ;8

Praktikum Analisis Data Multivariat II Menggunakan Software R

Dari hasil dendogram tersebut terlihat bah(a setiap kotak merupakan sebuah klaster dengan anggotanya adalah setiap bilangan yang ada dalam kotak tersebut yang menyatakan ob,ek atau pengamatan. Klaster ! beranggotakan ob,ek ke ", 6, @, A, !9, !", !#, !@, !A, "9, "! Klaster " beranggotakan ob,ek ke !, #, <, :, !6, !>, "" Klaster # beranggotakan ob,ek ke >, !!, !<, !: Salah satu kelebihan soft(are / dalam Analisis Klaster adalah bisa menampilkan p) value dari Analisis Klaster *ierarki berdasarkan metode bootstrap. 3ungsi p:cl!st- . dalam paket p:cl!st yang digunakan untuk hal tersebut. Klaster-klaster yang sangat didukung oleh data memiliki p)values yang tinggi. -etapi perlu diperhatikan dalam paket p:cl!st yang dikelompokkan adalah kolom bukan baris, sehingga data kita harus ditranspos terlebih dahulu. +erikut perintah yang digunakan untuk fungsi pvclust Bertho antular - ;;

Praktikum Analisis Data Multivariat II Menggunakan Software R

> li=rary(p7clust) > fit <- p7clust(mydata, met+od,+clust="Hard",met+od,dist="euclidean") > plot(fit) > p7rect(fit, alp+a=,9#) : *enggam=ar;an dendogram dengan p 7alues : *enam=a+;an ;ota; diantara ;elompo; yang sangat didu;ung ole+ data

#alam modul ini tidak akan dibahas lebih lanjut mengenai penggunaan !ungsi pvclust( ini.

6. Analisis Klaster Non 9ierar&i Salah satu metode analisis klaster non hierarki atau disebut ,uga metode partioning yang paling populer adalah Analisis Klaster K<means. 0ada metode ini banyaknya klaster secara pasti harus sudah diketahui. Sebuah cara sederhana yang dapat digunakan untuk menentukan banyak klaster yang akan digunakan adalah plot dari ,umlah kuadrat dalam klaster ( within sum of s(uares) dengan banyak klaster yang mana hasilnya mirip dengan screeplot dalam analisis faktor. +erikut adalah perintah-perintah yang digunakan dalam Analisis Klaster K-)eans

: *enentu;an Aanya; Blaster > Hss <- (nroH(data;u)-1)Ssum(apply(data;u,$,7ar)) > for (i in $/1#) Hss.i0 <- sum(;means(data;u, centers=i)$Hit+inss) > plot(1/1#, Hss, type="=", xla=="Aanya; Blaster",yla=="Numla+ Buadrat dalam Blaster")

: 1nalisis Blaster B-*eans > fit <- ;means(data;u, banyak_klaster)

: *enentu;an <ata-rata Blaster > aggregate(data;u,=y=list(fit$cluster),)@>=mean)

: Beanggotaan Blaster > agt_;laster<- data,frame(data;u, fit$cluster)

#ata sebelumnya digunakan untuk contoh penggunaan analisis klaster 3-means. 9erikut Bertho antular - ;<

Praktikum Analisis Data Multivariat II Menggunakan Software R


adalah hasil yang diperoleh dari so!tware 2

> Hss <- (nroH(pu=li;1)-1)Ssum(apply(pu=li;1,$,7ar)) > for (i in $/1#) Hss.i0 <- sum(;means(pu=li;1, centers=i)$Hit+inss) > plot(1/1#, Hss, type="=", xla=="Aanya; Blaster",yla=="Numla+ Buadrat dalam Blaster")

Dari gambar diatas banyak klaster yang dapat diambil adalah < yaitu titik pada saat kurva mulai melandai. Sehingga analisis klaster K-means adalah sebagai berikut

> fit <- ;means(pu=li;1, &) > fit B-means clustering Hit+ & clusters of siTes &, 1, %, ", #, "

Bertho antular - ;=

Praktikum Analisis Data Multivariat II Menggunakan Software R

6luster means/ x1 x' 1 !,!%1!# #" -!,%%&9'"% !,%$ #$% !,'% ##!% -!,"'1$$&1 -!, #"&"1' x$ x" x% x# x&

-!,$99'%'" $ -1,919!'#'$ -1,9"$" "" -!,' 1$'&1 -!,$$!"%%1 " -!,1"!#&&1" -!,'1%&$9% % -!,&!!$'#'$ -!, ""1 !! -!,'1%&$9% # -!,!11""$1# 1,#&#!" % & 1,"#! $#&& 1,%"9%9'" -!,91!'#"$ !,1 %%$!# -!,1%1"9&" !,1 !&"$ !,""1" 1# !,$1 9""9 -!,"# !%! !,1&&%& & -!,%!1 '" 1,"" 91!1 -!,% !# !$ !,991'1' 1, #&#$1% !,$ %#91! -1,!%$$#"" -!,'$9!$1# -!,'#!'1$% !,%'%'!'& 1,1!"%&&# 1, %& 9 $ -!,9!1%$#"

-!,$&'9 &! x 1 $ 1,$1"$"#9 1,%&'9 !!

" -!,&%9"9"$ % -!,9&##'#& # -!,#9&"%&% & -!,!9!%#%&

6lustering 7ector/ .10 " 1 & # 1 & 1 % & # % 1 # " 1 % $ " " # 1 #

Uit+in cluster sum of sIuares =y cluster/ .10 $",""## !,!!!!!! ',1 $$9& 9,#"%%&# 1!,19!!!' 1!,1#$1''

17aila=le components/

Bertho antular - ;>

Praktikum Analisis Data Multivariat II Menggunakan Software R


.10 "cluster" "centers" "Hit+inss" "siTe"

> aggregate(pu=li;1,=y=list(fit$cluster),)@>=mean) Lroup,1 1 $ " % # & 1 x1 x$ x" !,%$ #$% x% x# x&

!,!%1!# #" -!,%%&9'"%

!,'% ##!% -!,"'1$$&1 -!, #"&"1' 1,1!"%&&# 1, %& 9 $ -!,9!1%$#" !,%'%'!'& 1, #&#$1%

$ -1,919!'#'$ -1,9"$" "" -!,' 1$'&1 " -!,1"!#&&1"

!,$ %#91! -1,!%$$#"" -!,'$9!$1# -!,'#!'1$% 1,"" 91!1 -!,% !# !$ !,$1 9""9 -!,"# !%! !,991'1'

% -!,&!!$'#'$ -!, ""1 !! # -!,!11""$1# & 1,"#! $#&& x' x 1,$1"$"#9 1,%&'9 !! !,""1" 1#

!,1&&%& & -!,%!1 '" !,1 !&"$

1,%"9%9'" -!,91!'#"$

!,1 %%$!# -!,1%1"9&"

1 -!,$99'%'" $ -!,$$!"%%1

" -!,'1%&$9% -!,&%9"9"$ % -!,'1%&$9% -!,9&##'#& # 1,#&#!" % -!,#9&"%&%

& -!,$&'9 &! -!,!9!%#%&

> agt_;laster<- data,frame(pu=li;1, fit$cluster) > agt_;laster x1 1 $ " % # & ' x$ x" x% x# x& !,!%#9!$9!

-!,$9"1#'91 -!,& %&" 9& -!,%1'1$$!!$ -!,#'''1#1& -!,#$&$$'#1 -1,$1%#11"% -!,19%%#"&' 1,'1$1%!'" -!,#!99%&9# !, $1!!$!"'

!,$!& "&$9 -!,""" 1191 -1,!'''&%1" !,!#1!19$9 !,! "9"1$% -!,'!1'!&1!

$,!' $$"&! -1,""9&%#'9& -!, 91#"#'%

!,$!&&!'!$ -!,!!%%1"9 9 -!,$19!&"!' -!,9%"1$'9 1&

$,!"'"$%$9 -!, &$ 1,11#9'! & !,#'"99 $& -!,!'&"&

!,#' $"$&1' -1,$9#!19"# -!,'1 &%"11 -1,# 1%$ "' 199& ! !,&''#&'1& -1,'%% #9&# !,&$""'!$

1,$"1#"991 -1," !,&#$$"!!$

!,1&##$%&!% 1, &%91!#%!

$," 11&%&! -!,""" 1191 -!,"# "$%$ !,!!#!9%%9 !,'&'$"!19 !,!1 9#!!$ 1,1'%!'&9

' -!,& %&" 9&

9 1!

1,$$%"&#" !,!"$!$#&#

1,!! '$ %1 -!,!!%%1"9 9 !,'%1"#%&$

1,$&9&#1%$ -!,1%"11$!% -!,&9$&919

!,&99&1'"$' -!, 91#"#'% -!,1'"%&##

Bertho antular - ;?

Praktikum Analisis Data Multivariat II Menggunakan Software R


11 -1,9'"$'$9 1$ 1" !,! &$$$91 !,19%&1'%% -1,%%$19 !# !,!'$9$!1" !, '#!%1#$ !,11&9'!'$! -1,$$'''$! !,$" "##%"! 1,1$# $$ 1,!%#1&&## $,%!19&9 "

!,1%'$$'!9 -!,'''% 1!9 1,!1"!9'$9 -!,% '%'%!

!,'% 1'1$11 -!,'"%&$#%#

1% -!,1"!#&&1"

!,#&"1!#%$ -1,'#$"#" !9 -1,&!

"99" -!,#9!"&&!#

!,$1"'9!9'

1# -!, "#1"!#1 -1,"9'&"#'& -!,1!1#$1'#' 1& !,$% 1%'! -!,"'$'!$ '

1,1'!'1"'9 -1,!'1%!#!# -!,& 9!$999 1,911!"&'& 1,99"#1'$9

$,!"% %91"% -!,$19!&"!' 1,1!"%&&#$

1' -1,919!'#'$ -1,9"$" ""# -!,' 1$'&1"$ 1 19 $! -!,"%'"##1' !,$% 1%'!

1, %& 9 $$ -!,9!1%$#"1 -!,1'"%&## -1,'1$'9!" !,! "! !,! "! !,"%#"%! & 1,$9"'9# "

!, "!%'9$$ -!,%%1"9 9%% -!,!&$1#$' !,%$9%1 #$ -1,## 1" $'% -!,&&'"' 1 !,%'"9 ! $ -!,% 99#$ $ !, &9###9$! !,&##1#1%1 !,9!1'$%'$

!,%&#&!"'%

## -!,%# "$%'" ## -!,&"''&$1# !,""$1!1"'

$1 -!,%!1##$%" -!,9#$!1$'& $$ -!,$" 9&!&# -!,&%!!'&&& x' 1 $ " % # & ' x

!,1%1$%'&&$ -!,&!!1"!9$

!, #$'#!9#

fit,cluster " 1 & # 1 & 1 % & # % 1 # " 1 % $ "

-!,'1%&$9% -!, #1& 99# !,'9$!%'& !, $!&"!$%

-!,'1%&$9% -!,!' %&&&% 1,"$ !19' -!,'$# 1&" !,$1%" !,&$#"!!' -!,'1%&$9% 1,& "'&"$" !,$%#$! $% !,9 $%&'&'

-!,'1%&$9% -1,%$'1119# 9 1! -!,'1%&$9% -!,%" 1!#"9 1,&19 $&' -!, &9&'1

11 -!,'1%&$9% -!,#999%$ $ 1$ -!,'1%&$9% 1" 1,%"$!1&11

$,$'%9!"' -1,!"1#!9"$

1% -!,'1%&$9% -!,9$"&1''! 1# -!,&&1!"$$ !,#"$919$%

1& -!,'1%&$9% -!, &9&'1 1' -!,$$!"%%1 1 -!,'1%&$9% 1,%&'9'999 !,!11%%"!#

Bertho antular - <@

Praktikum Analisis Data Multivariat II Menggunakan Software R


19 -!,'1%&$9% -!, ""'! !1 $! 1,'"$9'&% -!,'$# 1&" 1, $'&1 '" !,"'1! 1 ! " # 1 #

$1 -!,'1%&$9% $$ !, &9%&#

Men))am*ar&an 9asil #alam so!tware 2 memungkinkan kita untuk menggambarkan hasil analisis klaster 3means. "ntuk itu harus menggunakan paket Cluster dan paket fpc.Aerintah-perintah berikut yang digunakan untuk menggambarkan klaster yang terbentuk
> li=rary(cluster) > clusplot(pu=li;1, fit$cluster, color=?<@4, s+ade=?<@4, la=els=$, lines=!)

Bertho antular - <%

Praktikum Analisis Data Multivariat II Menggunakan Software R

Dari gambar terlihat dengan ,elas anggota dari masing-masing klaster dari (arna dan bentuk titik masing-masing klaster.

> li=rary(fpc) > plotcluster(pu=li;1, fit$cluster)

Bertho antular - <&

Praktikum Analisis Data Multivariat II Menggunakan Software R

-erlihat dari gambar keanggotaan tiap klaster dengan menggunakan angka dan (arna untuk masing-masing klaster tetapi ob,ek yang men,adi anggota klasternya tidak terlihat. *ungsi lain yang dapat digunakan untuk analisis klaster adalah metode validasi dari klaster atau lebih tepatnya perbandingan dari dua metode klaster. *ungsi cluster.stats() dalam paket fpc adalah suatu metode membandingkan kesamaan dua hasil klaster menggunakan kriteria validasi 'u(ert)s gamma !oeffi!ient$ the Dunn inde" dan the !orre!ted rand inde". 9aris-basris berikut adalah metode validasi secara umum

: mem=anding;an $ +asil ;laster > li=rary(fpc) > cluster,stats(d, fit1$cluster, fit$$cluster)

dengan d adalah matriks jarak !it% dan !it& adalah hasil dari dua metode klaster yang digunakan untuk data yang sama. Bertho antular - <)

Praktikum Analisis Data Multivariat II Menggunakan Software R


+. Multidimensioal Scallin% )ultidimensional scalling adalh suatu teknik statistika multivariat yang bertu,uan untuk menganalisis kemiripan (similarity) dan ketakmiripan (dissimilarity) antar ob,ek. *asil dari analisis multidimensional scalling adalah berupa gambar titik-titik yang mana ,arak antar titik menun,ukkan kemiripan atau ketakmiripan. Selain itu penggunaan multidimensional scalling ,uga dapat memberikan petun,uk untuk mengidentifikasi peubah yang tidak diketahui atau faktor yang memengaruhi munculnya kemiripan atau ketakmiripan. Dalam soft(are * !ungsi yang digunakan untuk multidimensoinal scalling dibedakan menjadi dua yaitu !lassi!al multidimensional s!alling (Classical M!S multidimensional (kolom . s!aling ('onmetric M!S . Onput data yang dan nonmetri! dalam dibutuhkan

multidimensional scalling adalah * objek yang diukur (baris dalam p variabel numerik

Classical MDS "ntuk classical M#S dapat digunakan !ungsi cmdscale( ) dengan perintah-perintah sebagai berikut4

> d <- dist(dataku) > fit <- cmdscale(d,eig=?<@4, ;=$) > fit

: Cara; euclidean antar =aris : dalam $ dimensi : menampil;an +asil

'nput data adalah dataku dengan . baris dan p kolom

: *enggam=ar;an +asil > x <- fit$points.,10 > y <- fit$points.,$0 > plot(x, y, xla==">ama Boordinat 1", yla==">ama Boordinat $", main="6lassical *F3", type="n") > text(x, y, la=els = roH,names(dataku), cex=,')

Bertho antular - <8

Praktikum Analisis Data Multivariat II Menggunakan Software R

#ata mengenai jarak udara antar %& kota terpilih di amerika serikat sebagai ilustrasi penggunaan classical M#S dalam so!tware 2. #ata yang digunakan sebenarnya antar kota. (Wohnson X Jichern &@@&$ halaman =@) Bal pertama yang mesti dilakkukan adalah menginput data berupa matriks simetris kemudian diberi nama misalkan airline.csv (dalam !ormat .csv . 3emudian lanjutkan dengan perintah-perintah berikut ini sehingga keluar output yang diinginkan telah berupa jarak

> airline<-read,cs7("airline,cs7") > names(airline)<c("1tlanta","Aoston","6incinati","6olum=us","Fallas","5ndianapolis","2ittle <oc;","2os 1ngeles","*emp+is","3t,2ouis","3po;ane","?ampa") > d<-as,dist(airline) > d 1tlanta Aoston 6incinati 6olum=us Fallas 5ndianapolis 2ittle <oc; Aoston 6incinati 6olum=us Fallas 5ndianapolis 2ittle <oc; 2os 1ngeles 1'!1 *emp+is 1"' 3t,2ouis "#" 3po;ane 19 ?ampa %&' 1"'9 9$ 9 # 1!'' 9'# $%&' $'%' $!&' $1"1 1 91 19#9 ## 11' "" %!9 &%# $"% "&& 1"## #!$ # & %&% %"& 1!& %&1 #%9 !# #! #!# $19' &' '&9 1 19 9%1 1%9% "!#$ 1!' 9%" 1! &1 $1 & 1!#! 1'$ '$# $$%# $ "$# 1%!" #&$ $! !

Bertho antular - <;

Praktikum Analisis Data Multivariat II Menggunakan Software R


91$ 2os 1ngeles *emp+is 3t,2ouis 3po;ane Aoston 6incinati 6olum=us Fallas 5ndianapolis 2ittle <oc; 2os 1ngeles *emp+is 3t,2ouis 3po;ane ?ampa 1 "1 1 % 1$$' $% ! $9% $!%$ ''9 1 $! 1!1& $ $1

> fit <- cmdscale(d,eig=?<@4, ;=$) > fit $points .,10 1tlanta Aoston 6incinati 6olum=us Fallas 5ndianapolis 2ittle <oc; 2os 1ngeles *emp+is 3t,2ouis 3po;ane ?ampa -#"9,##""&9 .,$0 $9#,#91!

-111!, 9&19! -'1!,%1"' -"&1,! !9% -$"$,&$"1

-%$!,%1!$#9 -$ ', "# $'#,%1"19" %9!,9#!

-$#%,11#&%% -$"',''"9 ",' $#1# 1'!%,"1199 -11 ,%$'& % $ 9,###! % !,'" $$", 9&&

-##, !"#9% -11!,!1$9 1&#%,!!1# % - 1',%'"! -''',$1%%#& &1#,%!!1

Rutput diatas adalah koordinat yang diperlukan untuk menggambarkan ke !" kota dalam " dimensi. ntuk menampilkan gambarnya lan,utkan dengan perintah-perintah berikut ini Bertho antular - <<

Praktikum Analisis Data Multivariat II Menggunakan Software R

B y W- fitTpointsN,!O B & W- fitTpointsN,"O B plot(&, y, main;VClassical )DSV, type;VpV, pch;"9) B te&t(&, y, labels ; names(airline), ce&;9.A, pos;#)

Qambar diatas menun,ukkan setiap titik-titik yang berdekatan menun,ukkan lokasi kota yang ,uga berdekatan begitu pula sebaliknya. Dalam ilustrasi ini memperlihatkan kemiripan antar ob,ek adalah kedekatan ,arak sebenarnya secara geografis.

Nonmetric MDS Selain untuk data metrik multidimensional scalling ,uga dapat dilakukan untuk data Bertho antular - <=

Praktikum Analisis Data Multivariat II Menggunakan Software R


nonmetrik yang disebut Nonmetric MDS. Dalam soft(are / .onmetrik )DS dapat dianalisis menggunakn fungsi isoMDS- . dalam paket MASS. 9aris perintah berikkut adalah tahapan dalam .onmetric M#S
> li=rary(*133) > d <- dist(dataku) > fit <- iso*F3(d, ;=$) > fit : *enggam=ar;an +asil x <- fit$points.,10 y <- fit$points.,$0 plot(x, y, main=">onmetric *F3", type="p", pc+=$!) text(x, y, la=els = roH,names(mydata), cex=,') : Cara; euclidean antar =aris : *F3 dalam $ dimensi : menampil;an +asil

,. Analisis Korespondensi Analisis Korespondensi adalah suatu prosedur grafis untuk men,elaskan asosiasi dalam tabel frekuensi terutama pada tabel frekuensi dua arah atau disebut ,uga tabel kontingensi. Dalam tabel kontingensi terdiri atas 1 baris dan J kolom. Analisis korespondensi menghasilkan titik-titik yang diplotkan dalam grafik yang terdiri atas dua set yaitu sebanyak 1 titik pada set pertama yang menyatakan baris dan sebanyak J titik pada set kedua yang menyatakan kolom. 0osisi titik pada grafik menyatakan asosiasi antara keduanya. Analisis 3orespondensi secara umum merupakan metode gra!ik dalam eksplorasi hubungan antara dua variabel dalam tabel kontingensi$ tentunya variabel yang digunakan besi!at kategori. Kra!ik yang dihasilkan dalam analisis korespondensi merupakan gra!ik mdua dimensi. #engan titik-titik merupakan kategori dari masing-masing variabel. #alam so!tware 2 ada beberapa !ungsi yang dapat digunakan untuk analisis korespondensi salah satunya adalah paket ca. Aaket yang dibuat oleh .enadic dan Kreenacre ini menghasilkan nilai-nilai yang diperlukan dalma analisis korespondensi selain itu juga menghasilkan gra!ik yang sesuai. Aaket ca dapat menganalisis multiple correspondence yaitu apabila variabel kategorinya lebih dari dua. 1etapi dalam modul ini hanya dibahas untuk analisis Bertho antular - <>

Praktikum Analisis Data Multivariat II Menggunakan Software R


korespondensi sederhana yaitu dua variabel kategori saja. Olustrasi berikut merupakan contoh data yang akan digunakan dalam analisis korespondensi mengunakan so!tware 2. #ata yang digunakan mengenai situs-situs arkeologi yang ada di amerika selatan. Ada = kategori situs (A@$ A%$ A&$ A)$ A8$ A;$ A< yang digunakan dalam penelitian ini dan dibagi dalam 8 tipe potter& (A$ 9$ C$ # yang berbeda. (Wohnson X Jichern &@@&$ halaman =@? . "ntuk menganalisis korespondensi data tersebut menggunakan so!tware 2 pertama-tama input data dan simpan dengan !ormat csv kemusian gunakan perintah-perintah berikut ini

> situs<-read,cs7(Vsitus,cs7() > ta=el1<-xta=s(yQ3itusO?ipe, data=situs) ;ontingensi > ta=el1 : *em=uat ta=el

?ipe 3itus 8! 81 8$ 8" 8% 8# 8& 1 "! #" '" $! %& %# 1& A 1! % 1 & "& & $ 6 1! 1& %1 1 "' #9 1&9 F "9 $ 1 % 1" 1! #

> prop,ta=le(ta=el1, 1)

: *en+itung proporsi tiap =aris

?ipe 3itus 1 A 6 F

8! !,""'!' &# !,11$"#9## !,11$"#9## !,%" $!$$# 81 !,'!&&&&&' !,!#"""""" !,$1"""""" !,!$&&&&&'

Bertho antular - <?

Praktikum Analisis Data Multivariat II Menggunakan Software R


8$ !,&$9"1!"% !,!! &$!&9 !,"#"%% $ !,!! &$!&9

8" !,&%#1&1$9 !,19"#% "9 !,!"$$# !& !,1$9!"$$& 8% !,"% % % # !,$'$'$'$' !,$ !"!"!" !,!9 % % # 8# !,"'#!!!!! !,!#!!!!!! !,%91&&&&' !,! """""" 8& !,!'""9%#! !,1$ %%!"' !,''#$$9"& !,!$$9"#'

> prop,ta=le(ta=el1, $)

: *enampil;an proporsi tiap ;olom

?ipe 3itus 1 A 6 F

8! !,1!&!!'!&' !,1!9 9!11! !,!"!!"!!"! !,#$'!$'!$' 81 !,1 '$'91#$ !,!%"9#&!%% !,!% !% !% !,!$'!$'!$'

8$ !,$#'9#!#"! !,!1!9 9!11 !,1$"1$"1$" !,!1"#1"#1% 8" !,!'!&'1"' !,!&#9"%!&& !,!!"!!"!!" !,!#%!#%!#%

8% !,1&$#%%1'! !,"9#&!%"9& !,111111111 !,1'#&'#&'& 8# !,1#9!1!&!1 !,!&#9"%!&& !,1''1''1'' !,1"#1"#1"# 8& !,!#&#"'1!$ !,"!'&9$"! !,#!'#!'#! !,!&'#&'#&

> li=rary(ca) 2oading reIuired pac;age/ rgl > fit <- ca(ta=el1) > fit 8rincipal inertias (eigen7alues)/ 1 9alue !,$ "# $ " : 1nalisis Borespondensi : *enampil;an +asil

!,1'!1!' !,!# ' & "",19W 11,%'W

8ercentage ##,"%W

<oHs/ 8! *ass 81 8$ 8" !,!"9&9" 8% !,1&9!1% 8# !,1#"&%9 8& !,$'91$9

!,11"9#& !,!9&!"1 !,1% #$

Bertho antular - =@

Praktikum Analisis Data Multivariat II Menggunakan Software R


6+iFist 5nertia Fim, 1 Fim, $ 1,$1#' $ !,'1 !,1& %%$ !,!%9&$ ' !,&$$"'# !, !#$!$ !,!#'#"$ !,!$#'"# !,#1!!%# !,!%"9& !,$$"1"$ !,!!'&#! !,'##9 $ !,1#9#$#

1,'$&&%% !,'1!1!9 !,$# 1!& 1,"1%' % -1, $"''1 1,% $"&# 1,%$!#$

!,$' !19 -!,1%'1%$ -1,"&! &9 !,$!9 %! -!,#1%&1!

!,#"#9$' -!,"$'&'$

6olumns/ 1 *ass !,"&$"#& A !,11&#1' !,'$'9$% !,!&1'"9 6 !,%$&"'& !,#' $$! !,1%$##% F !,!9%'#! 1,"##&!1 !,1'%11 1,'&&##'

6+iFist !,&! $'! 5nertia !,1"%!&9 Fim, 1 Fim, $

!,' 9"9$ -!,!1%9#' -1,!#9"%&

1,!&# %! -!, &9! 1 -!,1&"%9" -$,$'1&&%

> summary(fit)

: *enampil;an +asil lainnya

8rincipal inertias (eigen7alues)/ dim 1 $ " 7alue !,$ "# !,1'!1!' !,!# ' & W cumW ##," ,# scree plot SSSSSSSSSSSSSSSSSSSSSSSSS SSSSSSSSSSSS

##," "",$

11,# 1!!,!

-------- ----?otal/ !,#1$% 1 1!!,!

<oHs/ name 1 X $ X " X % X # X 8! X 81 X 8$ X 8" X 8% X mass 11% Ilt 9## inr "$9 X 9' X 11$ X #! X & X ;=1 cor ctr ;=$ cor ctr

919 #'$ "%! X -'#$ " " "'9 X "' 1"' $'' %9 % X &11 '$" $11 X # & $$1 & "!! X '# '! 11 X 1 X

9& 1!!! 1%9 %! 1&9 9"# "1 1#%

1! X &9 X

'!! '#& 1% %

1" X -1"#

Bertho antular - =%

Praktikum Analisis Data Multivariat II Menggunakan Software R


& X ' X 8# X 8& X 1#% $'9 $'% 99 1# X -' 1$" " X ' 1#! '9 ' X '% X

"11 X -'$# 919 #1' X -$1$

6olumns/ name 1 X $ X " X % X 1 X A X 6 X F X mass Ilt inr $&$ X 1$! X $' ;=1 cor ctr %$! %' ! $$& X ;=$ cor ctr %%! #$$ %1$ X $%$ 1% X 11 X % 9 X

"&$ 1!!! 11' %$& 9# $%" 9&# 9#9

! X -"# X -&'

X -#&% 9#$ %'

"%! X

9%1 % $ $9& X -9"' %'

> plot(fit)

-itik-titik baris (berbentuk bulat) pada gambar yang berdekatan memiliki profil kolom yang mirip begitupun sebaliknya titik-titik kolom (berbentuk segitiga) pada gambar yang berdekatan memiliki profil baris yang mirip. -etapi kita tidak dapat menginterpretasikan ,arak Bertho antular - =&

Praktikum Analisis Data Multivariat II Menggunakan Software R


antar titik-titik kolom dan baris secara langsung.

: @ntu; menggam=ar;an dengan Harna yang =er=eda antar ;elompo; > plot(fit, mass = ?<@4, contri= = "a=solute", map ="roHgreen")

=. Analisis 7iplot Analisis +iplot adalah representasi grafis mengenai informasi yang ada dalam matriks data berdimensi n & p. Dalam +iplot meliputi dua macam informasi yang ada dala matriks data yaitu informasi mengenai baris yang berarti unit-unit sampling dan informasi mengenai kolom yang berarti variabel-variabel. Apabila hanya dua variabel sa,a maka untuk merepresentasikan kedua informasi ini dapat menggunakan scatter plot. -etapi untuk variabel lebih dari dua diperlukan suatu alat yang dapat memberikan informasi mengenai kedua hal tadi yaitu analisis biplot. Secara umum +iplot dapat menya,ikan posisi relatif n ob,ek pengamatan dengan p Bertho antular - =)

Praktikum Analisis Data Multivariat II Menggunakan Software R


variabel secara simultan dalam grafik dua dimensi. Sehingga dari penggambaran tersebut dapat diperoleh informasi mengenai hubungan diantara variabel-variabel, kesamaan relatif dari titiktitik data individu dan posisi relatif antara individu dengan variabel. 'lustrasi berikut akan memberikan gambaran mengenai penggunaan +iplot. Data yang digunakan mengenai "@ sebagai berikut$ X! X" X# X6 X@ X< $ /ata-rata nilai mahasis(a baru $ persentase mahasis(a baru berasal dari S)A favorit (!9 besar) $ 0ersentase pendaftar yang diterima $ rasio mahasis(a-fakultas $ .ilai harapan belan,a tahunan $ -ingkat kelulusan (=) niversitas di Amerika Serikat. Dari "@ universitas tersebut diukur variabel-variabel yang mendukung pada ranking universitas. Pariabel yang digunakan adalah

Data ini akan dibakukan karena ukuran dari variabel-variabel berbeda-beda. (5ohnson 7 8ichern "99", halaman A"") Dalam soft(are / penggunaan +iplot bisa menggunakan fungsi *iplot-. atau fungsi *pca-. yang terdapat pada paket *pca.

Pen))!naan %!n)si *iplot-. 'nput data yang digunakan dalam biplot adalah nilai-nilai komponen utama. Sehingga penggunaan fungsi biplot() untuk data diatas adalah sebagai berikut

B univW-read.csv(Vuniv.csvV) B univ"W-scale(univ) B biplot(prcomp(univ), scale;3A4S2)

S membaca data S )embakukan data S Analisis biplot

Bertho antular - =8

Praktikum Analisis Data Multivariat II Menggunakan Software R

Pen))!naan %!n)si *pca-. 'nput data yang digunakan dalam biplot adalah nilai-nilai komponen utama. Sehingga penggunaan fungsi biplot() untuk data diatas adalah sebagai berikut

B library(bpca) B plot(bpca(univ#, var.scale;-/ 2), var.ce&;!,ob,.ce&;!)

Bertho antular - =;

Praktikum Analisis Data Multivariat II Menggunakan Software R

Secara umum hasil dari kedua fungsi ini menghasilkan gambar yang mirip, hanya sa,a fungsi *pca-. memperlihatkan gambar yang sedikit lebih ,elas dibandingkan dengan fungsi *iplot-..

Bertho antular - =<

Praktikum Analisis Data Multivariat II Menggunakan Software R

DA%TAR PUSTAKA

5ohnsom, /ichard A, 8ichern, Dean 8. ("99") ,pplied .ultivariate /tatistical ,nalysis. 0earson 2ducation 'nternational, .e( 5ersey. )aindonald, 5ohn, +arun, 8 5ohn. ("99<) +ata ,nalysis and 2raphics Using ! 3 an *xample) 4ased ,pproach . Cambridge niversity 0ress. K http$HH(((.statmethods.netHadvstatsH http$HHcran.r-pro,ect.orgHpackagesH

Bertho antular - ==

You might also like