Kombinovana primena hijerahijskih i nehijerarhijskih metoda klasterizacije u cilju segmentacije kupaca u jednom trgovinskom lancu

Autori

  • Goran Bjelobaba Narodna banka Srbije, Fakultet organizacionih nauka, Beograd, Srbija
  • Ana Milan Savić Visoka škola elektrotehnike i računarstva, Beograd, Srbija
  • Stefana Janićijević Visoka škola strukovnih studija za IT, Beograd, Srbija
  • Hana Stefanović Visoka škola strukovnih studija za IT, Beograd, Srbija

Ključne reči:

dendrogram, klaster analiza, K-means algoritam, segmentacija tržišta, Silhouette indeks

Apstrakt

U ovom radu primenjene su hijerarhijske i nehijerarhijske metode klaster analize, u cilju utvrđivanja relativno homogenih grupa kupaca u jednom trgovinskom lancu tokom prethodnih pet godina. Nakon izdvajanja objekata i određenih atributa iz SQL Server baze podataka i određivanja skupa relevantnih varijabli koje će reprezentovati obeležja grupe, primenjen je K-means algoritam u MATLAB programskom okruženju, a kao mera sličnosti korišćen je kvadrat Euklidskog rastojanja. Na osnovu analize ukupnog broja kupljenih artikala, frekvencije kupovina, ukupnog prometa po kupcu i broja kontaktiranja kompanije prema kupcu, predložen je broj klastera, koji je tokom izvršavanja algoritma fiksan, a u cilju detekcije razdvojenosti i kompaktnosti klastera, korišćen je Silhouette indeks. Korišćeno je fiksno pet klastera, a takođe je primenjen i hijerarhijski metod, da bi se postavljanjem granice na dendrogramu validirao pretpostavljeni broj klastera, a čime se takođe može eliminisati i problem uticaja slučajnog izbora početnog položaja centroida pri izvršavanju K-means algoritma. Dobijeni rezultati mogu se koristiti u smislu planiranja prodajnih kampanja, optimizacije troškova marketinga, predlaganja novih programa lojalnosti, u cilju boljeg razumevanja potrošačkog ponašanja, kao i pravljenja posebnih planova poslovnih aktivnosti za svaki klaster pojedinačno.

Biografije autora

Ana Milan Savić, Visoka škola elektrotehnike i računarstva, Beograd, Srbija

Informacioni sistemi

Stefana Janićijević, Visoka škola strukovnih studija za IT, Beograd, Srbija

Informacione tehnologije

Hana Stefanović, Visoka škola strukovnih studija za IT, Beograd, Srbija

Informacione tehnologije

Reference

T. Hastie, R. Tibshirani, and J. Friedman, The elements of statistical learning: Data Mining, Inference, and Prediction, 2nd ed., Springer, 2009., A. Agresti, Categorical Data Analysis, 2nd ed., Wiley, New York, 2002. , T. Anderson, An Introduction to Multivariate Statistical Analysis, 3rd ed., Wiley, New York, 2003. , C. Bishop, Pattern Recognition and Machine Learning, Springer, New York, 2006. , A. K. Jain, “Data clustering: 50 years beyond K-means”, Pattern Recogn. Lett. 31, 2010, pp. 651-666. , M. E. Celebi, H. A. Kingravi, and P. A. Vela, “A comparative study of efficient initialization methods for the k-means clustering algorithm”, Expert Syst. Appl., 2013, pp. 200-210. , R. Tibshirani, G. Walther, and T. Hastie, “Estimating the number of clusters in a dataset via the gap statistic”, Journal of the Royal Statistical Society, 2001, Series B. 32(2) pp. 411–423. , H. Stefanović, R. Veselinović, G. Bjelobaba, A. Savić, “An adaptive car number plate image segmentation using K-means clustering”, Proceedings of Int. Scientific Conference on Information Technology and Data Related Research-SINTEZA 2018, 2018, pp. 74-78. , Z. Wang, Z. Xu, S. Liu, and Z. Yao, “Direct clustering analysis based on intuitionistic fuzzy implication”, Applied Soft Computing 23, 2014, pp. 1-8. , T. Kanungo, D. M. Mount, N. S. Netanyahu, C. D. Piatko, R. Silverman, and A. Y. Wu, “An efficient kmeans clustering algorithm: Analysis and implementation”, IEEE Trans. Pattern Anal. Mach. Intell. 24(7), 2002, pp. 881–892. , J. Nayak, D.P. Kanungo, B. Naik, and H.S. Behera, “Evolutionary improved swarm-based hybrid K-means algorithm for cluster analysis”, Proceedings of Int. Conf. on Computer and Communication Technologies, Springer, New Delhi, 2016, pp. 343-352. , C. McDaniel and R. Gates, Marketing Research, 10th ed, John Wiley & Sons, 2014. , C.-H. Cheng and Y.-S. Chen, “Classifying the segmentation of customer value via RFM model and RS theory”, Expert Systems with Applications 36, 2009, pp. 4176–4184. , https://www.mathworks.com/help/stats/silhouette.html , https://www.mathworks.com/help/stats/dendrogram.html

Preuzimanja

Objavljeno

19.07.2019.

Broj časopisa

Sekcija

Poslovna informatika