You are on page 1of 3

ABSTRAK The GroupLens penelitian laboratorium memperkenalkan Barang Berbasis kolaboratif filtering [3] sebagai pendekatan untuk memberikan

rekomendasi pribadi unggul penyaringan kolaboratif berbasis Pengguna. Pengguna berbasis penyaringan kolaboratif [5] memberikan rekomendasi pribadi dengan mencari pengguna serupa. Penyaringan kolaboratif Barang Berbasis merekomendasikan item serupa. Kedua pendekatan telah dibandingkan [3]. Namun, prosedur pengujian yang diterapkan tidak menggunakan kondisi yang sama untuk kedua pendekatan tersebut. Tujuan dari laporan ini adalah untuk memberikan evaluasi terhadap kedua pendekatan dengan menggunakan prosedur pengujian wajar pada data yang diberikan oleh Netflix [2]. Hasil tes dan ketergantungan mereka pada algoritma yang digunakan diinterpretasikan

INTRODUCTION Filter Kolaborasi memiliki tugas merekomendasikan item untuk pengguna. Sementara pengguna tingkat item, korelasi antara peringkat pengguna yang berbeda dan peringkat pada item dapat digunakan untuk menghitung peringkat meramalkan bahwa pengguna tertentu akan memberikan pada item yang dia tidak menilai belum. Sebagai contoh, sebuah toko film akan menawarkan di situsnya kemungkinan bagi pengguna untuk menilai film dan kemudian bisa menawarkan pengguna film-film yang memiliki rating tertinggi diprediksi baginya. Item n dengan rating tertinggi diprediksi untuk pengguna tertentu disebut rekomendasi Top-N. Badrul Sarwar dan kelompok penelitiannya diperkenalkan dan dievaluasi pendekatan Barang Berbasis penyaringan kolaboratif [3]. Filter kolaboratif Item-based menghitung kesamaan mereka item satu sama lain. Untuk memprediksi rating, nilai rata-rata dihitung dari item yang paling mirip dengan item tersebut dan yang telah dinilai oleh pengguna sebelumnya. Filter kolaboratif lebih tradisional berbasis Pengguna menghitung kesamaan antara pengguna untuk menemukan pengguna yang paling mirip dan predicat peringkat berdasarkan bagaimana hal ini pengguna yang sama dinilai item. Sarwar juga mengevaluasi langkah-langkah kesamaan. Mereka memainkan peran penting dalam pendekatan mereka. Namun saat membandingkan pendekatan Barang Berbasis mereka ke pendekatan berbasis pengguna, pendekatan Item-Based menggunakan ukuran kemiripan yang mendapatkan skor yang lebih tinggi (disesuaikan kosinus) daripada ukuran kemiripan yang digunakan oleh implementasi berbasis Pengguna mereka (korelasi Pearson). Percobaan diulangi dalam makalah ini, memberikan perhatian khusus pada kondisi yang sama untuk kedua pendekatan dan di bawah penggunaan data publik yang tersedia [2]. Selain itu, jumlah peringkat pengguna harus memberikan dalam rangka untuk sistem untuk memberikan rekomendasi sangat berbeda antara kedua pendekatan tersebut.

=========================== Secara teknis ini berarti bahwa data dari setiap baris adalah skala untuk nilai-nilai kolomnya, dan sebaliknya. Semantik, perbedaan data berarti bahwa mengenai disesuaikan perhitungan kosinus untuk kesamaan Pengguna-pengguna, rating rata-rata keseluruhan dari item (popularitas) diperhitungkan. Tapi untuk Item-Barang kesamaan, rata-rata pengguna rating (sikap umum nya) dianggap. Berbeda dengan ini, Pearson skala korelasi nilai-nilai vektor dengan rata-rata vektor. Jadi mengenai berturut-turut, rata-rata baris dan bukan rata-rata kolom diperhitungkan

Perhitungan matriks kesamaan dengan n adalah jumlah objek yang saling kesamaan harus dihitung. Dalam hal kesamaan Pengguna-pengguna, n akan menjadi 480.186. Dalam kasus Item-Barang kesamaan, n adalah 17.770. Hal ini tidak feasable untuk menghitung matriks lengkap pada peralatan siswa todays dalam jumlah yang cukup waktu. Thats mengapa ukuran matriks kesamaan telah terbatas pada 500 item yang dipilih secara acak atau 500 pengguna yang dipilih secara acak, masing-masing. Ukuran dari matriks kesamaan harus dibatasi dalam rangka untuk melakukan perhitungan. Menghitung kesamaan antara item hanya bergantung pada semua peringkat pengguna pada dua item ini, bagi pengguna itu tergantung hanya pada peringkat mereka pada semua item saling sebagai. Jadi mempertimbangkan hanya subset dari item untuk komputasi item kesamaan / subset dari pengguna untuk komputasi kesamaan pengguna tidak memiliki efek pada kesamaan nilai-nilai sendiri. Nilai rata-rata yang dibutuhkan untuk perhitungan kesamaan diperoleh dari semua item / semua pengguna. Jadi nilai-nilai matriks yang terbatas adalah subset dari mereka yang berasal dari matriks lengkap. Lingkungan berasal dari matriks lengkap memiliki kualitas yang lebih rendah daripada jika itu berasal dari matriks kemiripan lengkap. Yang terbaik - yang berarti paling mirip - item mungkin hilang rom matriks kesamaan. Hal ini juga berdampak pada jumlah prediksi yang bisa dibuat. Karena sejumlah besar pengguna dan sejumlah kecil item, lebih banyak prediksi dapat dilakukan dengan menggunakan pendekatan Item-based, karena itu lebih mungkin, bahwa barang yang dimaksud adalah dalam matriks kesamaan. Sebagai perhitungan predicition yang cepat dibandingkan dengan perhitungan kesamaan, ukuran lingkungan tidak terbatas.

Menimbang bahwa data Netflix bahkan lebih tipis dibandingkan dengan data yang digunakan oleh Sarwar , pernyataan bahwa pendekatan Item- based akan mengungguli pendekatan berbasis Pengguna data jarang tidak berlaku . Namun, pendekatan Item- based mampu menghasilkan hasil prediksi yang lebih ketika jumlah pengguna lebih besar dari jumlah item . Gambar 4 : Perbandingan kualitas prediksi Barang - Barang dan algoritma penyaringan Pengguna Pengguna kolaborasi dari Sarwar . Gambar 4 menunjukkan hasil Sarwar . Mereka jelas menunjukkan bahwa pendekatan berbasis Pengguna yang menggunakan perhitungan kesamaan Pearson mengungguli oleh pendekatan Itembased , yang didorong oleh disesuaikan kosinus ukuran kemiripan . Prediksi perbedaan kualitas

antara percobaan ini dan eksperimen Sarwar kemungkinan disebabkan oleh karena digunakan disesuaikan kosinus sebagai ukuran kesamaan untuk pendekatan berbasis pengguna . Juga , volume data yang digunakan oleh penelitian ini telah lebih besar dari volume data yang digunakan oleh Sarwar . Sarwar tambahan mengusulkan membatasi model ukuran . Ini berarti membatasi ItemItem matriks kemiripan dalam satu dimensi , sehingga setiap item hanya telah disimpan kesamaan untuk sejumlah item . Dia mengusulkan ini untuk menghemat ruang disk . Nethertheless , kompleksitas dalam waktu adalah masalah yang lebih besar saat ini. Perhitungan matriks kemiripan lengkap nasional diperkirakan akan mengambil 96 jam untuk masing-masing pendekatan . Perbedaan dalam kualitas jelas tampaknya disebabkan oleh kesamaan langkah yang berbeda . Apakah benda-benda di matriks kesamaan adalah Produk atau Pengguna kurang penting . Nethertheless , eksperimen harus diulang dengan matrik kemiripan lengkap . Dengan begitu , kedua pendekatan harus dapat memprediksi peringkat untuk setiap wisatawan yang diminta dari set uji. Sayangnya, memiliki Produk dan Pengguna yang dipilih secara acak dapat memiliki menyebabkan kondisi tidak adil juga. Nethertheless , jumlah 1.532 peringkat diprediksi oleh pendekatan berbasis Pengguna dapat dianggap sebagai jumlah yang cukup besar untuk menarik kesimpulan bahwa penggunaan disesuaikan kosinus ukuran kemiripan telah menjadi pendorong melampaui prediksi kualitas yang lebih tinggi .

You might also like