Market Basket Analysis

Ghaitsa Zahira Shafa
4 min readJan 14, 2021

--

Hello, Data Enthusiast! Welcome back..

Kalian tau nggak sih apa itu market basket analysis?

Market basket analysis adalah suatu analisa atas perilaku konsumen secara spesifik dari suatu golongan / kelompok tertentu. Sumber data dari market basket analysis antara lain dapat bersumber dari transaksi kartu kredit, kartu lotere, kupon diskon, panggilan keluhan pelanggan. Market basket analysis umumnya dimanfaatkan sebagai titik awal pencarian pengetahuan dari suatu transaksi data ketika kita tidak mengetahui pola spesifik apa yang kita cari. Kebutuhan market basket analysis berawal dari keakuratan dan manfaat yang dihasilkannya dalam wujud aturan assosiasi (association rules). Yang dimaksud dengan association rules adalah pola-pola keterkaitan data dalam basis data.

Untuk dapat lebih memahami tentang market basket analysis kita perlu membayangkan isi sebuah keranjang belanja seorang pengunjung/pelanggan pada saat berbelanja di supermarket, seperti yang terlukis pada gambar berikut:

Dengan memanfaatkan market basket analysis, kita akan mendapatkan pengetahuan tentang produk apa yang dibeli pelanggan (what), produk apa saja (which) yang sering dibeli secara bersama-sama dan berpeluang untuk dipromosikan, siapakah mereka (who) dan mengapa mereka melakukan suatu pembelian (why).

Hasil market basket analysis akan semakin baik jika item yang dilibatkan memiliki proposi frekuensi yang seimbang. Proposi yang seimbang membantu mencegah aturan yang didominasi oleh produk yang sering muncul. Cara yang dapat digunakan agar seluruh item dalam proposi yang seimbang adalah dengan menaikkan sebagian item yang berfrekuensi rendah ke klasifikasi yang lebih tinggi sehingga frekuensi mereka menjadi meningkat. Meskipun cara tersebut memberikan solusi, namun virtual item yang dihasilkan dapat menjadi penyebab utama redudansi aturan.

Proses market basket analysis dimulai dengan transaksi yang terdiri dari satu/lebih penawaran produk/jasa dan beberapa informasi dasar suatu transaksi. Hasil dari market basket analysis adalah berwujud aturan assosiasi (association rules).

…………..(1)

…………..(2)

Persamaan 1 menjelaskan bahwa nilai support
itemset (group variasi produk) A terhadap itemset B sebesar probabilitas dari gabungan itemset A dan B. Sedangkan Persamaan 2 menjelaskan bahwa persentase keyakinan (confidence) itemset A terhadap itemset B sebesar probabilitas dari gabungan itemset A dan B dibagi probabilitas itemset A.

Pengertian minimum support count adalah nilai minimum transaksi yang terlibat dalam setiap pembelian itemset (group variasi produk). Sedangkan confidence adalah besar nilai keyakinan atau kepastian bahwa suatu itemset lain akan turut dibeli pada saat bersamaan pembelian suatu itemset tertentu.

Pada proses market basket analysis bagian yang paling membutuhkan waktu terbanyak adalah proses pencarian kandidat support count Untuk memperoleh hasil terbaik dalam segi waktu dan kinerja maka proses pencarian kandidat support count dapat dilakukan secara serentak maupun terdistribusi. Serentak artinya proses pencarian dilakukan serentak pada setiap tingkat variasi itemset. Terdistribusi artinya proses pencarian pada setiap tingkat variasi itemset dibagi sejumlah itemset yang dihasilkan dari proses sebelumnya.

Penentuan nilai minimum support count dan persentase minimum confidence sebaiknya tidak terlampau kecil. Untuk itu besar dan kecil nilai / persentase minimum sangat bergantung pada ukuran database yang diolah serta bidang usaha perusahaan tersebut. Terdapat saran lain pengukuran hasil market basket analysis, yaitu peningkatan (improvement). Improvement merepresentasikan seberapa baik sebuah aturan dalam memprediksi hasil daripada sekedar mengasumsikan hasil pada tempat yang utama.

…………..(3)

Persamaan 3 menampilkan perhitungan improvement. Dari persamaan tersebut dijelaskan bahwa besar nilai improvement diperoleh dari probabilititas gabungan penentu (conditional) danhasil (result) dibagi dengan hasil perkalian antara probabilititas penentu dengan probabilititas hasil.

Ketika improvement lebih besar dari 1 maka hasil aturan menjadi lebih baik dari pada kesempatan acak dan merupakan hasil yang berguna. Dari rumus ini dapat disimpulkan bahwa nilai improvement akan semakin besar bila nilai probabilitas penentu (conditional) dan probabilitas hasil (result) semakin kecil. Misalkan nilai probabilitas penentu sebesar 3%, nilai probabilitas hasil sebesar 2 % dan nilai probabilitas gabungan dari penentu dan hasil sebesar 1%. Nilai improvement yang dihasilkan adalah 0,01 / (0,03 x 0,02) = 16,6.

Kelebihan dari proses market basket analysis, adalah sebagai berikut:

  • Hasilnya jelas dan mudah dimengerti sebab hanya merupakan suatu pola “jika-maka”. Misalnya: Jika produk A dan B dibeli secara bersamaan, maka kemungkinan produk C turut dibeli.
  • Market basket analysis sangat berguna untuk undirected data mining, yaitu pencarian awal pola.
  • Market basket analysis dapat memproses transaksi tanpa harus kehilangan informasi sebab dapat memproses banyak variabel tanpa perlu dirangkum (summarization) terlebih dahulu.
  • Proses komputasi yang lebih mudah daripada teknik yang kompleks seperti algoritma genetik & sistem syaraf, meskipun jumlah perhitungan akan meningkat pesat bersamaan dengan peningkatan jumlah transaksi dan jumlah items yang berbeda dalam analisis.

Kekurangan dari proses market basket analysis, adalah sebagai berikut:

  • Tingkat pertumbuhan proses secara eksponensial sebagai akibat pertumbuhan ukuran data.
  • Memiliki keterbatasan untuk atribut data, misalnya hanya berdasarkan tipe produk.
  • Sulit untuk menentukan items yang akan diolah secara tepat, sebab frekuensi dari items tersebut harus diusahakan seimbang.

Market basket analysis memiliki masalah dengan frekuensi items yang tidak merata.

Sekian yang dapat saya sampaikan, Wassalamualaikum..

Referensi

https://medium.com/@yudakhoirulz/market-basket-analysis-mba-3d2a793f8d2e

--

--