Professional Documents
Culture Documents
Kata Kunci : Bisnis Ritel, Data Mining, Association Rule, Market Basket Analysis,
Algoritma Apriori.
1. Pendahuluan
Kemajuan Teknologi Informasi yang pesat menghadirkan tingkat kompetensi
yang semakin ketat dalam berbagai aspek kehidupan manusia. Misalnya dalam
persaingan pasar, yakni pasar tradisional yang mulai terpinggirkan dengan hadirnya
pasar modern. Perkembangan pasar modern yang semakin maju dapat kita lihat dari
banyaknya pusat perbelanjaan, distributor, grosir, hypermarket, supermarket, dan
minimarket yang dibangun untuk melayani kebutuhan konsumen. Maraknya gedunggedung perbelanjaan modern seperti itu tidak lepas dari peralihan pola pikir
konsumen yang pada mulanya berorientasi pada harga yang murah, kini sudah
memperhatikan aspek keamanan, kebersihan, kenyamanan, keramahan dalam
pelayanan, kelengkapan jenis dan penempatan rak barang.
Terlepas dari jenis pasar yang digeluti, para pelaku pasar pun saling berlomba
untuk memberikan pelayanan yang terbaik, ditinjau dari aspek-aspek vital yang
menjadi bahan penilaian konsumen. Dalam penelitian ini, penulis mengangkat
permasalahan dalam pelayanan yang sering terjadi dalam bisnis ritel (retail), yakni
pemilik minimarket atau toko ritel yang masih cenderung menempatkan posisi rak
tanpa memperhatikan hubungan antar barang, sehingga menyulitkan konsumen dalam
pencarian barang yang diinginkannya (Triyono, 2006). Di samping perlunya
pengetahuan akan penempatan barang yang sesuai dengan selera konsumen,
pengusaha ritel juga harus memperhatikan strategi pemasaran untuk menarik minat
konsumen dan meningkatkan hasil penjualan, misalnya berupa penawaran diskon
untuk jenis barang tertentu jika dibeli secara bersamaan. Karena itu, pemilik toko
memerlukan suatu sistem yang dapat menghasilkan informasi prediktif tentang
kebiasaan dan keinginan konsumen pada umumnya. Sistem tersebut dapat dibentuk
dengan mencatat data penjualan dan diproses dengan menggunakan metode pada data
mining.
Berlatar belakang pada permasalahan tersebut, penulis mengembangkan
sebuah gagasan untuk membuat suatu sistem yang berguna dalam pemodelan
pembelian barang, dengan menggunakan teknik association rules pada data mining.
Association Rules sering juga disebut dengan Market Basket Analysis karena
memudahkan
konsumen
dalam
pencarian
barang
yang
diinginkan,
meningkatkan hasil penjualan barang dengan strategi pemasaran yang tepat serta
menarik minat konsumen.
2. Tinjauan Pustaka
2.1 Konsep Bisnis Ritel
Kata ritel berasal dari kata kerja dalam bahasa perancis : retailer yang
berarti to cut of (bahasa inggris) atau memotong. Bisnis ritel adalah aktivitas bisnis
yang menjual jasa dan barang-barang ke konsumen untuk kegunaan pribadi, keluarga,
atau konsumsi rumah tangga. Bisnis ritel atau eceran merupakan tahap terakhir dalam
suatu rantai saluran distribusi, dimana para pengusaha dan masyarakat terlibat dalam
perpindahan fisik dan kepemilikan jasa serta barang dari produsen ke konsumen.
Pedagang ritel seringkali berperan sebagai pihak penghubung antara pabrik,
tengkulak, dan konsumen. Konsep ritel adalah dengan memborong berbagai jenis
barang dalam jumlah yang banyak dan menjualnya dalam jumlah yang kecil. Kita
dapat mendefenisikan bisnis ritel sebagai suatu industri yang luas, cepat, dan
menyediakan suatu keanekaragaman dalam karakter dan ukuran bisnis yang jarang
ditemui di sektor industri yang lain.
Adapun jenis bisnis ritel secara umum meliputi gerai tradisional seperti
warung dan toko tradisional dan gerai modern seperti minimarket dan supermarket.
Perbedaan antara gerai tradisional dan gerai modern terletak pada tata ruang gerai,
teknologi informasi, dan pelayanan.
Gambar 2.1 berikut merupakan mata rantai dari alur distribusi barang dari
produsen sampai kepada konsumen.
PRODUSEN
SUB DISTRIBUTOR
DISTRIBUTOR
PENGUSAHA RITEL
KONSUMEN
Dari rantai perdagangan pada gambar 2.1, dapat disimpulkan bahwa bisnis
ritel berperan sebagai perantara perdagangan yang memiliki ketergantungan pasokan
barang dan jasa kepada produsen/ pemasok.
Customer Orientation
Coordinated Effort
Value Driven
Retailin
g
Concept
Retailing Strategy
Goal Orientation
Effort
(Usaha
yang
terkoordinir),
pedagang
ritel
yang baik kepada konsumen, apakah itu berupa promosi paket penjualan
yang murah ataupun diskon harga barang.
d. Goal Orientation (berorientasi pada target), pedagang ritel menetapkan
Gambar 2.3 merupakan gambaran proses evolusi dari basis data mulai dari
tahap pembuatannya pada tahun 1960 sampai dengan saat ini.
Aplikasi terorientasi
Gambar 2.3. Evolusi teknologi basis data (Jiawei Han & Micheline Kamber, 2000)
Data mining dapat dipandang sebagai sebuah hasil evolusi alami dari
teknologi informasi (gambar 2.3). Sebuah alur evolusi dapat disaksikan pada
perkembangan kemampuan industri database dalam hal pengumpulan data (data
collection) dan pembuatan basis data (database creation), manajemen data (data
management), serta analisis dan pemahaman data (data analysis and understanding).
Pada saat ini, data dapat disimpan ke dalam beberapa jenis basis data. Salah
satu arsitektur basis data yang muncul adalah gudang data (Data Warehouse), yaitu
sebuah tempat penyimpanan dari suatu sumber data heterogen, yang terorganisir di
bawah sebuah skema gabungan pada lokasi tunggal dengan tujuan mempermudah
manajemen dalam pengambilan keputusan (Jiawei Han & Micheline Kamber, 2000).
Gambar 2.4. Knowledge Discovery in Databases atau Data mining sebagai sebuah
proses dalam penemuan pengetahuan (Jiawei Han & Micheline Kamber, 2000)
Menurut Jiawei Han dan Micheline Kamber (Data Mining : Concept and
Techniques, 2000), data mining dalam perannya sebagai proses penemuan
pengetahuan memiliki langkah terurut (Gambar 2.4) sebagai berikut :
a. Data Cleaning (untuk menghilangkan data yang kabur atau noise dan tidak
relevan)
b. Data Integration (dimana sumber data yang banyak dapat digabungkan)
c. Data Selection (dimana data yang relevan terhadap proses analisis
Gambar 2.5. Kondisi rich of data but poor of information (Jiawei Han & Micheline
Kamber, 2000)
penyimpanan
informasi
(information
repository).
Komponen
ini
dalam sistem data mining dan biasanya terdiri atas sejumlah modul
fungsional yakni dalam karakterisasi (characterization), analisis asosiasi
(association analysis), klasifikasi (classification), analisis penyimpangan
dan evolusi (evolution and deviation analysis).
e. Modul evaluasi pola (pattern evaluation module). Komponen ini secara
hubungan
antar
muka
(graphical
user
interface).
Modul
ini
dikenal.
Objek-objek
dikelompokkan
berdasarkan
prinsip
dalam
Association Rules
Association rules (aturan asosiasi) merupakan salah satu dari pengetahuan
yang paling penting dalam data mining yang dapat diartikan sebagai hubungan dan
ketergantungan antara sejumlah item (itemsets) dengan menentukan nilai support dan
confidence pada basis data. Aturan asosiasi ingin memberikan informasi tersebut
dalam bentuk hubungan if-then atau jika-maka.
Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua
parameter, support (nilai penunjang) yaitu prosentase kombinasi item tersebut dalam
database, dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam
aturan assosiatif. Dalam bidang ekonomi, aturan asosiatif telah dipergunakan secara
luas dalam mengukur pola konsumsi pelanggan berdasarkan data keranjang belanja
(Market basket data), sehingga sering disebut juga dengan analisa keranjang belanja
(Market basket analysis). Penggalian aturan asosiatif (associative rules mining)
berfungsi untuk menemukan aturan asosiasi yang paling penting dari basis data
berukuran besar.
Ada beberapa model aturan asosiasi (association rule) yang sering
dipergunakan selama ini, yakni (Jiawei Han & Micheline Kamber, 2000) :
a. Single level association rule, contoh :
Age (x, 19,..,25), Buys (x, laptop) buys (x, canon printer)
Perbedaan antara interdimensional association rule dan hybrid-dimensional
association rule terdapat pada pengulangan predikat pada sebuah rule, dimana
interdimensional
tidak
memperbolehkan
sementara
hybrid-dimensional
Rumus untuk mencari nilai support dan confidence pada suatu item adalah
sebagai berikut :
a. Support
Support (AB) = jumlah transaksi mengandung A dan B *100
jumlah total transaksi
b. Confidence
Confidence (AB) = jumlah transaksi mengandung A dan B *100
jumlah total A dalam transaksi
Algoritma Apriori
Di antara jenis-jenis algoritma yang ada dalam penggalian aturan asosiasi
Dalam proses ini, setiap item dikombinasikan dengan item yang lainnya
sampai tidak terbentuk kombinasi lagi
b. Prune (pemangkasan)
yang ditentukan dan batasan itu tinggi, maka rule tersebut tergolong strong rules.
Proses penghitungan dalam algoritma berhenti ketika tidak ada lagi frequent itemset
baru yang dihasilkan. Sebagai contoh dapat kita lihat pada gambar 2.6 berikut.
Start
Penjualan
Ambil data dari
penjualan dan detil
penjualan
Detil Penjualan
Masukkan tiap
kode barang dan
jumlah di group
berdasarkan no
transaksi
Proses1
Tampilkan matrik
berisi kode barang
dan jumlahnya
pada tiap transaksi
Matrik
Y
T
Tampilkan support ,
confidence dan gabungan
Kombinasi telah
diproses keseluruhan
Selesai
Kombinasi itemset yang ingin diterapkan dalam aplikasi tugas akhir ini
dibatasi sampai 5 jumlah barang terasosiasi. Gambaran alur tahapan proses dalam
menghasilkan kombinasi itemset pada aplikasi dijelaskan satu persatu dalam gambar
flowchart sebagai berikut.
a. Kombinasi dua barang : jumlah barang yang muncul terkombinasi secara
Start
Hitung $hitbox
(banyaknya barang yang dicari pada
semua transaksi)
Det_jual
Hitung $hitall
(banyaknya transaksi)
Proses1
Tampilkan support ,
confidence dan gabungan
End Loop $j
End Loop $i
Y
Selesai
Start
Hitung $hitbox
(banyaknya barang yang dicari pada
semua transaksi)
Det_jual
Hitung $hitall
(banyaknya transaksi)
Proses1
Tampilkan support ,
confidence dan gabungan
End Loop $k
End Loop $j
Y
End Loop $i
Selesai
Start
Hitung $hitbox
(banyaknya barang yang dicari pada
semua transaksi)
Det_jual
Hitung $hitall
(banyaknya transaksi)
Proses1
Tampilkan support ,
confidence dan gabungan
End Loop $L
Y
End Loop $k
Y
End Loop $j
Y
End Loop $i
Selesai
Start
for ($i = 0 ; $i < $z ;$i++)
Hitung $hitbox
(banyaknya barang yang dicari pada
semua transaksi)
Det_jual
Hitung $hitall
(banyaknya transaksi)
Proses1
T
T
T
T
$z1/$hitbox * 100 = support
Tampilkan support ,
confidence dan gabungan
End Loop $L
Y
End Loop $L
Y
End Loop $k
Y
End Loop $j
End Loop $i
Y
Selesai
3. Metodologi Penelitian
3.1 Desain Penelitian
Desain penelitian adalah tahapan atau gambaran yang akan dilakukan peneliti
dalam melakukan penelitian. Dalam pengerjaan tugas akhir ini, adapun tahapantahapan desain penelitian yang dilakukan oleh peneliti adalah sebagai berikut:
a. Mengumpulkan data yang diperlukan berupa textbook, paper dan karya ilmiah
pada penelitian ini yaitu berupa textbook, paper dan karya ilmiah yang
membahas algoritma apriori.
c. Mempersiapkan alat dan bahan penelitian.
d. Setelah alat dan bahan penelitian disiapkan, langkah selanjutnya membangun
Nama Field
Keterangan
1.
KodeBrg
Field
Varchar (20)
Primary Key
2.
NamaBrg
Varchar (50)
3.
HargaBrg
Big Integer
4.
KodeKat
Varchar (20)
Nama Field
Keterangan
1.
No_Detail
Field
Integer
Primary Key
2.
Kode_Barang
Varchar (20)
3.
No_Jual
Integer
Nama Field
Keterangan
1.
NoJual
Field
Integer
Primary Key
2.
TglJual
Date Time
3.
BiayaJual
Big Integer
Nama Field
Keterangan
1.
No_Urut
Field
Integer
Primary Key
2.
NoJual
Integer
3.
KodeBrg
Varchar (50)
4.
Nilai
Integer
Nama Field
Keterangan
1.
No_Id
Field
Integer
Primary Key
2.
Support
Double Precision
3.
Confidence
Double Precision
4.
Support x Confidence
Double Precision
5.
Keterangan
Varchar (50)
User Name
Password
:
Login
Kode Barang
Nama Barang
Harga Barang :
Kode Kategori :
:
Searching
Cetak
Grafik
Laporan
Barang Terjual
Tgl Awal
:
Tgl Akhir
:
OK
Pengujian aplikasi.
4.2 Pembahasan
Dalam pengujian aplikasi pemodelan pembelian dengan algoritma apriori ini,
peneliti menggunakan tiga item sebagai sampel yaitu Teh Celup cap Bendera, Top
Coffee dan Susu Frisian Flag dengan batasan nilai minimum support dan minimum
confidence yang beragam. Adapun hasil yang ditemukan dalam pengujian aplikasi
adalah berupa kombinasi itemset dengan nilai yang memenuhi batasan nilai minimum
dan minimum support seperti keinginan user.
Pada pengujian dengan sampel Teh celup bendera, peneliti memasukkan
batasan nilai minimum support sebesar 15% dan minimum confidence sebesar 10%.
Dari pengolahan apriori dengan nilai tersebut, hasil yang diperoleh adalah kombinasi
itemset sebanyak 97 rules yang ditampilkan dengan waktu proses selama 8 detik.
Untuk kombinasi itemset dengan 5 item berurut, terdapat 24 rules dengan nilai
minimum support paling tinggi sebesar 16,67% dan minimum confidence sebesar
20%. Untuk mempersempit hasil pengolahan, peneliti menguji kembali sampel item
Teh Celup cap Bendera dengan menaikkan batasan nilai minimum support dan
minimum confidence masing-masing sebesar 30%, dimana hanya terdapat 7 rules
yang memenuhi nilai asosiasi, dan diperlukan 6 detik untuk menampilkan 7 rules
tersebut. Berikut dapat kita lihat hasil rules yang dimaksud :
<Rule>Jika : Teh Celup Cap Bendera 50g maka Top Coffee 10</Rule>
<Support>33.3333333333%</Support>
<Confidence>40%</Confidence>
<Gabungan>13.3333333333%</Gabungan>
<Rule>Jika : Teh Celup Cap Bendera 50g maka Gulaku Gula Premium
250g</Rule>
<Support>75%</Support>
<Confidence>90%</Confidence>
<Gabungan>67.5%</Gabungan>
<Rule>Jika : Teh Celup Cap Bendera 50g maka Frisian Flag Vanilla
250ml</Rule>
<Support>66.6666666667%</Support>
<Confidence>80%</Confidence>
<Gabungan>53.3333333333%</Gabungan>
<Rule>Jika : Teh Celup Cap Bendera 50g maka Top Coffee 10 maka
Gulaku Gula Premium 250g</Rule>
<Support>33.3333333333%</Support>
<Confidence>40%</Confidence>
<Gabungan>13.3333333333%</Gabungan>
<Rule>Jika : Teh Celup Cap Bendera 50g maka Gulaku Gula Premium
250g maka Top Coffee 10</Rule>
<Support>33.3333333333%</Support>
<Confidence>40%</Confidence>
<Gabungan>13.3333333333%</Gabungan>
<Rule>Jika : Teh Celup Cap Bendera 50g maka Gulaku Gula Premium
250g maka Frisian Flag Vanilla 250ml</Rule>
<Support>66.6666666667%</Support>
<Confidence>80%</Confidence>
<Gabungan>53.3333333333%</Gabungan>
<Rule>Jika : Teh Celup Cap Bendera 50g maka Frisian Flag Vanilla
250ml maka Gulaku Gula Premium 250g</Rule>
<Support>66.6666666667%</Support>
<Confidence>80%</Confidence>
<Gabungan>53.3333333333%</Gabungan>
Pada pengujian dengan sampel Top Coffee, adapun nilai yang ditetapkan
peneliti adalah sebesar 20% masing-masing untuk nilai batas minimum support dan
minimum confidence. Jumlah rules yang ditemukan pada pengujian aplikasi dengan
sampel top coffee tersebut lebih sedikit dari pengujian sampel teh celup cap bendera,
yakni hanya terdapat sebanyak 15 rules yang ditampilkan dalam waktu eksekusi
proses selama 6 detik. Sebanyak 6 rules di antaranya adalah kombinasi 4 item dengan
nilai minimum support paling besar 25% dan minimum confidence sebesar 37,5%, 6
rules lainnya adalah kombinasi 3 item dengan nilai paling besar 41,66% untuk
minimum support dan 62,5% untuk nilai minimum confidence, dan kemudian 3 rules
merupakan kombinasi 2 item dengan nilai minimum support tertinggi sebesar 50%
dan minimum confidence sebesar 75%. Adapun rules yang dihasilkan adalah sebagai
berikut :
<Rule>Jika : Top Coffee 10 maka Gulaku Gula Premium 250g</Rule>
<Support>50%</Support>
<Confidence>75%</Confidence>
<Gabungan>37.5%</Gabungan>
merupakan hasil kombinasi 2 item, dan 4 rules lainnya merupakan hasil kombinasi 3
item. Rules Jika Susu Frisian Flag maka Gulaku Premium 250g memiliki nilai
asosiasi yang paling tinggi, yaitu sebesar 91,67% nilai support dan 52,38% nilai
confidence. Rules yang dihasilkan dalam pengujian aplikasi untuk item susu Frisian
flag dengan batasan nilai minimum support dan nilai minimum confidence sebesar
20% dapat kita lihat pada gambar 4.1 dan file dengan format xml sebagai berikut.
Format xml :
<Rule>Jika : Frisian Flag Vanilla 250ml maka Gulaku Gula Premium
250g</Rule>
<Support>91.6666666667%</Support>
<Confidence>52.380952381%</Confidence>
<Gabungan>48.0158730159%</Gabungan>
<Rule>Jika : Frisian Flag Vanilla 250ml maka Teh Celup Cap Bendera
50g</Rule>
<Support>66.6666666667%</Support>
<Confidence>38.0952380952%</Confidence>
<Gabungan>25.3968253968%</Gabungan>
<Rule>Jika : Frisian Flag Vanilla 250ml maka Gulaku Gula Premium 250g
maka Teh Celup Cap Bendera 50g</Rule>
<Support>66.6666666667%</Support>
<Confidence>38.0952380952%</Confidence>
<Gabungan>25.3968253968%</Gabungan>
<Rule>Jika : Frisian Flag Vanilla 250ml maka Teh Celup Cap Bendera 50g
maka Gulaku Gula Premium 250g</Rule>
<Support>66.6666666667%</Support>
<Confidence>38.0952380952%</Confidence>
<Gabungan>25.3968253968%</Gabungan
Gambar 4.1 Tampilan tabel detil hasil asosiasi item susu Frisian flag
= (0,9166667) * 100
= 91,67 %
Confidence (%) = (11/21) * 100
= (0,5238) * 100
= 52,38 %
Gabungan (%) = (91,67 * 52,38) / 100
= 48,015 %
-
= (0,66667) * 100
= 66,67 %
Confidence (%) = (8/21) * 100
= (0,38095) * 100
= 38,095 %
Gabungan (%) = (66,67 * 38,095) / 100
= 25,396 %
-
Susu Frisian Flag dan Gulaku Gula Premium dengan Teh Celup Cap
Bendera
Support (%) = (8/12) * 100
= (0,66667) * 100
= 66,67 %
Confidence (%) = (8/21) * 100
= (0,38095) * 100
= 38,095 %
Gabungan (%) = (66,67 * 38,095) / 100
= 25,396 %
-
Susu Frisian Flag dan Teh Celup Cap Bendera dengan Gulaku Gula
Premium
Support (%) = (8/12) * 100
= (0,66667) * 100
= 66,67 %
Confidence (%) = (8/21) * 100
= (0,38095) * 100
= 38,095 %
Gabungan (%) = (66,67 * 38,095) / 100
= 25,396 %
Dari pengujian yang sudah dilakukan pada 3 sampel item dengan nilai batasan
support dan confidence tersebut, peneliti menemukan bahwa banyak tidaknya data
penjualan sangat berpengaruh pada jumlah hasil data yang ditampilkan pada aplikasi.
Dengan jumlah data yang semakin besar maka alokasi memori yang dibutuhkan
untuk menjalankan proses algoritma apriori pada aplikasi juga semakin besar. Hal ini
dikarenakan pada proses apriori, sistem harus melakukan pemindaian ulang database
pada setiap iterasinya.
Semakin banyak jumlah kombinasi item, maka semakin rendah nilai support
dan nilai confidence yang dimiliki itemset. Nilai asosiasi yang dihasilkan nantinya
juga bergantung pada banyaknya jumlah data penjualan yang dimasukkan pada
database. Persebaran data item pada database penjualan menjadi hal yang perlu
diperhatikan dalam penggunaan aplikasi pemodelan penjualan dengan algoritma
apriori ini. Untuk mendapatkan hasil frequent itemset yang lebih banyak dan
memiliki nilai asosiasi yang tinggi, diperlukan data barang dan data transaksi yang
lebih lengkap dan riil.
Hasil yang paling penting dari pengerjaan tugas akhir ini adalah bahwa
algoritma apriori dapat dipergunakan untuk mendapatkan nilai asosiasi antar barang,
dan data penjualan dapat menjadi gambaran umum kebiasaan belanja konsumen,
sehingga pengusaha dapat menentukan stok barang apa saja yang perlu diperbanyak
dan dalam menentukan tata letak barang yang berdekatan sesuai dengan jenis maupun
kelompok barang yang paling sering dibeli oleh konsumen secara bersamaan.
Aplikasi data mining untuk pemodelan pembelian barang dengan menggunakan
algoritma apriori ini dapat menghasilkan kombinasi itemset sampai sebanyak 5 buah
item dengan nilai asosiasi yang sangat bergantung pada jumlah data barang terjual
pada setiap transaksi.
5. Kesimpulan
Berdasarkan hasil pengerjaan tugas akhir ini, peneliti menarik beberapa
kesimpulan sebagai berikut :
a. Algoritma apriori dapat menghasilkan sejumlah komposisi itemset dengan
nilai asosiasi yang tinggi berdasarkan banyaknya jumlah data penjualan.
b. Semakin banyak data penjualan yang dimasukkan, maka semakin tinggi
dan bervariasi juga nilai support, confidence, dan gabungan yang dapat
dihasilkan.
c. Algoritma apriori dapat dipergunakan dalam kepentingan bisnis (market
Daftar Pustaka
1. Agrawal, Rakesh & Srikant, Ramakrishnan, 1994. Fast Algorithms for Mining
Association Rules. Research Report. IBM Almaden Research Center, San Jose,
California, June 1994.
2. Berry, Michael J.A & Linoff, Gordon S. 2004. Data Mining Techniques For
Jakarta.
12. Wandi, Nugroho dkk, 2012. Pengembangan Sistem Rekomendasi Penelusuran
Buku dengan Penggalian Association Rule menggunakan Algoritma Apriori
(Studi Kasus Badan Perpustakaan dan Kearsipan Provinsi Jawa Timur). Jurnal
Teknik ITS Vol 1, September 2012.