ارائۀ مدل بهینه‌سازی چندهدفۀ تخصیص خدمت به مشتریان بانک به‌کمک داده‌کاوی و شبیه‌سازی

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشیار گروه مدیریت صنعتی، دانشکدۀ مدیریت و حسابداری، دانشگاه علامه طباطبایی، تهران، ایران

2 دانشجوی دکتری گروه مدیریت صنعتی، دانشکدۀ مدیریت و حسابداری، دانشگاه علامه طباطبایی، تهران، ایران

3 استادیار گروه مدیریت صنعتی، دانشکدۀ مدیریت و حسابداری، دانشگاه علامه طباطبایی، تهران، ایران

چکیده

امروزه شناخت مشتریان، خوشه‌بندی و تخصیص خدمت یا محصول به هرکدام از خوشه‌های مختلف یکی از مهم‌ترین مسائل بانک‌ها محسوب می‌شود. در این پژوهش اطلاعات 31.953 مشتری شامل پنج ویژگی، آخرین زمان مراجعه، تعداد تراکنش، مبلغ سپرده‌گذاری، مبلغ وام‌ و ماندۀ معوقات از پایگاه دادۀ بانک استخراج شده است. سپس به‌کمک الگوریتم کا میانگین مشتریان در 7 خوشه جایگذاری شده است. هدف اصلی این پژوهش تخصیص 9 نوع وام و 4 نوع سپرده به هر خوشه‌ از مشتریان براساس یک مدل ریاضی سه‌هدفه برای افزایش میزان رضایت مشتریان، کاهش هزینه‌ها و ریسک تخصیص خدمات و محصولات است. برای حل این مدل جواب‌های موجه اولیه درقالب سناریو‌های مختلف ازطریق شبیه‌سازی به دست آمده است. سپس به‌کمک الگوریتم تبرید جواب نزدیک به بهینه مشخص شده است. در این پژوهش از نرم‌افزارهای وکا و آر برای داده‌کاوی، ارنا برای شبیه‌سازی و لینگو برای بهینه‌سازی استفاده شده است.

کلیدواژه‌ها


عنوان مقاله [English]

A multi-objective model of service assignment to bank customers by data mining and optimization via simulation

نویسندگان [English]

  • Seyed Mohammad Ali Khatami Firouzabadi 1
  • Mohammad taghi Taghavifard 1
  • Khalil Sajjadi 2
  • Jahanyar BamdadSoufi 3
1 Department of Industrial Management, Faculty of Management and Accounting, Allameh Tabataba’i University, Tehran, Iran
2 Department of Industrial Management, Faculty of Management and Accounting, Allameh Tabataba’i University, Tehran, Iran
3 Department of Industrial Management, Faculty of Management and Accounting, Allameh Tabataba’i University, Tehran, Iran
چکیده [English]

Purpose: The main purpose of this paper is to propose a multi-objective model for assigning service/product to clustered customers. The main practical objectives of this model from the perspective of the bank are reduced cost and risk and increased customer satisfaction.
Design/methodology/approach: In this paper, five indicators of recency, frequency, monetary, loan and deferred have been identified and customers have been clustered, accordingly using K-means approach. Then, a three-objective mathematical model has been designed to assign optimal service/product as response to customer. Finally the model has been solved by simulation based optimization.
Findings: In the case study, all information about five characteristics of customers was extracted from the database, 31953 customers were placed in seven clusters and the validity of these clusters was measured. A three-objective mathematical model was designed based on the characteristics of 13 types of bank products/services. Then, the simulation modeling solutions were improved using the simulated annealing algorithm. In this study, Weka and R-Studio, Arena and Longo were used for data mining, simulation and optimization, respectively.
Research limitations/implications: The limitations of this study include inability of simulation instruments for drawing, solving all probable states (more scenarios) and solving the model for those states. It is recommended to develop the mathematical model with respect to customer, so that after problem solving, the bank would be able to make decision on providing services and products to its customers. Simultaneously, the objective functions would be fitted within their most reasonable states and ultimately, using a model, the parameters related to each product can be set for the new customer referring to the bank.
Practical implications: Products/services were assigned according to customer needs in a way that cost and risk were reduced and   the utility of assignment was increased through the proposed model and simulating the behavior of each cluster of customers.
Social implications: Paradigm shift in the banking industry is changing from e-banking to digital banking. In digital banking, assigning/customizing products/services, regarding the needs of customers, is very difficult .The banking industry is not well equipped to respond to the digital banking expectations of most consumers. One of the most important challenges of banks is recognizing customers, clustering and assigning a service/product to each of the different clusters. The main policy in the banking industry is to increase customer satisfaction and reduce cost and risk in sales service. Therefore, each customer should have a dedicated service/product.
Originality/value: In this paper, authors attempted to use one of the clustering approaches in multi-objective programming. In addition, they proposed an approach for assigning product/service to customer by simulating and analyzing the behavior of each customer cluster.

کلیدواژه‌ها [English]

  • Multi objective assignment model
  • Bank customers
  • Clustering
  • Optimization via simulation

مقدمه

امروزه با گسترش بنگاه‌های مالی و اقتصادی، همچنین افزایش حجم، تنوع فعالیت‌ها و رقابت شدید در جذب مشتریان، نیاز به حفظ رضایت آنها بیش از پیش احساس می‌شود. در پژوهشی با توسعۀ یک مدل ریاضی میزان رضایت مشتریان بانک‌ها در استفاده از خدمات بانکی پیش‌بینی شده است (آبیدان[i]، 2017). یکی از این بنگاه‌های مالی بانک‌ها و مؤسسات اعتباری هستند که در حال‌حاضر نارضایتی گستردۀ مشتریان از نحوۀ ارائۀ خدمات و نوع محصولات ارائه‌شده به آنها مشاهده می‌شود؛ این امر بیشتر به‌لحاظ منطبق‌نبودن خدمات و محصولات بانکی با نیاز‌ و توقعات مشتریان به وجود آمده است (اکبری اصل و بشلی، 2014). از سوی دیگر تعامل مشتریان با بانک‌ها باعث بُروز وقایعی می‌شود که اطلاع از آنها، تجزیه و تحلیل و طبقه‌بندی آنها بسیار حائز اهمیت است. تقسیم‌بندی مشتریان به‌لحاظ رفتار بوجود‌آمده در هر بنگاه اقتصادی عامل اصلی در مدیریت ارتباط با مشتریان و بازاریابی هدفمند به شمار می‌رود. تاکنون روش‌های مختلفی برای تخصیص خدمت به مشتری ارائه شده است که بخش درخور توجهی از آنها به‌صورت تجربی است؛ به‌نحوی‌که بیشتر بانک‌ها با در نظر گرفتن تنها یک یا دو پارامتر مانند ماندۀ میانگین و گردش حساب اقدام به بخش‌بندی مشتریان خود کرده‌اند و آنها را در گروه‌های پلاتینی، طلایی، نقره‌ای و غیره جای می‌دهند. برخلاف این مشکلات و پیچیدگی‌ها، مطالعات نشان می‌دهد بانک‌هایی که از بخش‌بندی مشتریان به‌درستی استفاده کرده‌اند 40% درآمد بیشتری از سایر بانک‌ها داشته‌اند و درآمد مشتریان فعال این بانک‌ها 20% از مشتریان فعال سایر بانک‌ها بیشتر است (کومار و همکاران[ii]، 2012). شناسایی حساب‌های کلیدی[iii] افتتاح شده توسط مشتریان سود‌آور، می‌تواند یکی از مزایای بخش‌بندی صحیح و اصولی مشتریان در بانک باشد. فیشر برای نخستین‌بار سال 1963 ایدۀ متمرکزکردن گروه‌ها را مطرح کرد. سپس دیویددراند در سال 1941 با تفکیک مشتریان به دو گروه خوب و بد به آنها وام اعطا کرد. بعد از آن در سال 1960 کارت‌های اعتباری برای هر گروه از مشتریان وارد بازار شد. در سال 1980 برای نخستین‌بار در آمریکا از اعتبارسنجی هر گروه از مشتریان استفاده شد. در سال 1990 معیار اصلی ارائۀ خدمت به مشتریان منوط به اعتبارسنجی مشتریان شد (توماس[iv]، 2001). سپس در دهۀ 90 میلادی کاتلر برای نخستین‌بار مباحث مربوط به مشتری‌مداری و مدیریت ارتباط با مشتری را مطرح کرد (کاتلر[v]، 1994). در امتداد این مباحث با ورود سیستم‌های کامپیوتری به بانک‌ها و بازارهای مالی، اهمیت استفاده از پایگاه‌های داده و به‌کارگیری آن در برنامه‌ریزی، گزارش‌گیری و شناسایی رفتار مشتریان روز‌به‌روز بیشتر شد (آتاناسوپلاس[vi] و همکاران، 2000). در پژوهشی با تحلیل رفتار مشتریان ازطریق تراکنش‌های تلفن همراه، از وقوع جرم جلوگیری شده است (چن[vii] و همکاران، 2017). واضح است که حفظ یا افزایش رضایت‌مندی مشتریان ارتباط مستقیمی با افزایش کیفیت خدمات و یا افزایش پارامترهای مدنظر مشتری در بهره‌مندی از محصولات بانک دارد و اگر بانک یا هر بنگاه مالی به‌دنبال این هدف باشد، متحمل هزینه خواهد شد. درنهایت این نوع هزینه‌ها باعث کاهش سود بنگاه می‌شود. هدف اصلی این مقاله ارائۀ محصولات و خدمات بانکی ازطریق خوشه‌بندی مناسب مشتریان براساس تحلیل رفتاری پنج ویژگی آنها با در نظر گرفتن هدف افزایش میزان رضایت‌مندی مشتری، کاهش هزینه‌ها و ریسک بانک در‌ حالتی است که بیشترین حد مطلوبیت هر‌یک از اهداف حاصل شود. به‌عبارت دیگر این مقاله با تخصیص بهینۀ خدمات و محصولات به خوشه‌های مشتریان هدف، به‌طور هم‌زمان افزایش رضایت‌مندی مشتریان در بهره‌مندی از خدمات و محصولات بانک و کاهش‌هزینه‌ها و ریسک ناشی از تخصیص مناسب خدمات و محصولات به مشتریان را مدنظر دارد.

در این بخش سعی شده است با مطالعۀ گسترده در حوزۀ ادبیات موضوع، پیشینۀ جامعی گردآوری و توسعه و کاربرد مدل‌های موجود در این حوزه ارائه شود. ازآنجایی‌که شناسایی رفتار مشتریان و تخصیص خدمت به آنان تا حدی ریشه در مدیریت ارتباط با آنها دارد، پیشینۀ مدیریت ارتباط با مشتری همواره رویکردی مهم در کسب و کار است و به دهۀ 1990مربوط است (انگای[viii]، 2005). در تعاریف، امروزه تأکید زیادی بر اهمیت شناخت رفتار مشتری (فرایندی جامع و استراتژیک برای حداکثرسازی ارزش آنان برای سازمان‌ها) شده‌ است (میشار[ix]، 2009). ازآنجاکه سازمان‌ها به مشتری‌محوری توجه زیادی دارند، تعداد مشتریان به‌صورت فزاینده‌ای رشد کرده است؛ اما به‌دنبال آن سازمان‌ها قادر به خدمت‌دهی به‌صورت یکسان به همۀ مشتریان نبوده‌اند؛ بنابراین لازم است مشتریان ارزش‌گذاری شوند و با‌توجه‌به اهمیت و ارزش هرکدام، نوع خدمات متناسب آنها ارائه شود تا تشویقی برای ارتباط مستمر مشتری با سازمان باشد؛ درنتیجه سازمان مشتریان هدف خود را به‌خوبی شناسایی کند و ارتباطی درخور آنان داشته باشد؛ بنابراین مباحثی با عنوان ارزش دورۀ عمر مشتری، حقوق مشتری، سودآوری مشتری، طبقه‌بندی مشتری و بخش‌بندی در مطالعات متعدد بررسی شده است (وانگ[x] و همکاران، 2006). درواقع حرکت به‌سمت بازاریابی مشتری‌محور همراه با افزایش دسترسی به اطلاعات و تراکنش‌های مشتریان موجب علاقه زیاد به اندازه‌گیری ارزش دورۀ عمر مشتری و طبقه‌بندی آنان شده است (صفری کهره، 2012). در پژوهشی ضمن معرفی روش‌های محاسبۀ ارزش طول عمر مشتریان، از مدل پایۀ RFM استفاده شده است و با اضافه‌کردن اندازۀ ریسک مشتریان و شاخص‌های مالی دیگر با رویکردی غیرپارامتریک در فضای پژوهش امتیازدهی و بخش‌بندی مشتریان انجام شده است (سینگ[xi]، 2016). در پژوهش دیگری کاربرد روش RFM برای شناسایی رفتار مشتریان سیستم‌های ارتباطی به کار می‌رود که در آستانۀ ورشکستگی‌ هستند (زابکوسکی[xii]، 2016).

روش‌های زیادی برای تخصیص خدمت به مشتری مبتنی‌بر ارزش دورۀ عمر مشتری (CLV[xiii]) و طبقه‌بندی مشتریان مطرح شده است. اساس برخی از آنها برپایۀ مدل‌های معروفی نظیر ارزش فعلی خالص(NPV[xiv])، روش سهم کیف پول (SOW[xv])، روش زنجیرۀ مارکوف[xvi]، روش ارزش گذشتۀ مشتری(PCV[xvii])، روش بازگشت سرمایه (ROI[xviii]) و روش RFM[xix] است. در میان روش‌های مذکور مدل RFM یکی از پرکاربردترین و متداول‌ترین روش‌هایی است که در تعیین ارزش مشتری سه معیار را بررسی کرده‌اند (باتل[xx]،2004). در پژوهش‌های داخلی و خارجی با به‌کارگیری این مدل ارزش، طبقه‌بندی و بخش‌‌بندی مشتریان محاسبه شده است و نتایج درخور توجهی ارائه شده است؛ به‌طوری‌که در مقاله‌ای با به‌کارگیری این مدل، مشتریان خاص خود را در صنعت ارزشیابی و مدیریت کرده‌اند (کینینگهام[xxi] و همکاران، 2006). در جایی دیگر با به‌کارگیری این مدل و روش آماری[xxii] مشتریان و دسته‌بندی آنان تحلیل شده است (وو[xxiii] و همکاران، 2009). در پایان‌نامه‌ای با عنوان "الگویی برای تعیین ارزش چرخۀ عمر مشتریان" با استفاده از اطلاعات تراکنشی مربوط به 5000 مشتری حقیقی و حقوقی بانک ملت مدلی برای سنجش و اندازه‌گیری ارزش طول عمر مشتری ارائه شده است. هر گروه از مشتریان حقیقی و حقوقی به‌صورت جداگانه به 9 بخش تقسیم شده‌اند. سپس محاسبۀ ارزش طول عمر مشتری برای هر بخش از مشتریان انجام شده است (سهرابی، خانلری و آجرلو، 2011). پایان‌نامه‌ای دیگر درراستای بررسی رفتار مشتریان در میزان استقبال از کانال‌های ارتباطی نوین بانکداری الکترونیک در بانک صادرات ارائه شده است. در این پژوهش رفتار مشتری در استفاده از این ابزارها تحلیل شده است و با استفاده از روش‌های داده‌کاوی، مشتریان بخش‌بندی شده‌اند (تقوی‌فرد و خواجوند، 2013). در مقاله‌ای دیگر با ارائۀ الگویی جامع ارزش چرخۀ عمر مشتری محاسبه شده است. هم‌چنین از عوامل مؤثر بر جریان نقدی حاصل از مشتری در دورۀ معین، نرخ نگهداری و تنزیل و نرخ رشد جریان نقدی مشتری استفاده شده است. درنهایت با استفاده از این مدل و به‌کارگیری روش‌های داده‌کاوی، بخش‌بندی حدود 3000 مشتری در بانک صادرات شعب تهران انجام شده است. درنتیجۀ برای چهار گروه مشتریان تعیین‌شده برنامه‌های بازاریابی و توسعۀ محصول تدوین شده است (تقوی‌فرد و همکاران، 2011). در مقاله‌ای دیگر با استفاده از مدل RFM و شبکۀ عصبی مشتریان اعتباری بانک بخش‌‌بندی و رتبه‌بندی شده‌اند. درنتیجه مشتریان به 10 بخش تقسیم شده‌اند و براساس امتیاز بخش‌‌ها به مشتریان تسهیلات اعطا شده است (افسر، امیر و همکاران، 2014). البرزی و همکاران (2010) در مقالۀ خود با استفاده از روش Simple K-means مشتریان را به دو خوشه تقسیم‌بندی کرده‌اند. سپس با استفاده از الگوریتم ژنتیک ویژگی‌های اعتبارسنجی مهم در مجموعه داده انتخاب شده است و بهترین درخت تصمیم در هر خوشه مبتنی‌بر معیارهای بهینگی در هر خوشه ساخته شده است (البرزی و همکاران، 2010).

در پژوهشی دیگر انتظارات کاربران بانکداری تلفن همراه درقالب 4 عامل خدمات اصلی، خدمات با ارزش افزوده، شرایط کاربرپسند و احساس رضایت در هنگام استفاده از خدمات با رویکردی کیفی و کمی شناسایی شده است. پس از مشخص‌کردن تعداد بهینۀ خوشه‌ها با روش وارد، از فنِ داده‌کاوی کامیانگین برای خوشه‌بندی استفاده شده است (عزیزی و بلاغی، 2016).

در مقالۀ دیگری با عنوان "بخش‌بندی کاربران بانکداری تلفن همراه برمبنای انتظارات با رویکرد خوشه‌بندی"، رویکردی جامع برای بخش‌بندی بازار و طبقه‌بندی مشتریان با استفاده از روش‌های داده‌کاوی و برنامه‌ریزی خطی معرفی شده است. در این پژوهش الگوریتم یکپارچه‌ای برای بخش‌‌‌بندی بازار و طبقه‌بندی مشتریان ارائه شده است که خوشه‌بندی تجمیعی مبنای مقایسۀ عملکرد روش‌های مختلف طبقه‌بندی به‌ویژه برنامه‌ریزی خطی قرار می‌گیرد. این مقایسه نشان می‌دهد روش برنامه‌ریزی خطی عملکرد بهتری ازنظر درصد بیشتر انتساب مشتریان به خوشه‌ها دارد. همچنین برای مواجهه با ناکافی‌بودن داده‌های لازم در پایگاه داده، روش دلفی فازی پیشنهاد شده است (ایزدی و همکاران، 2016).

در مقالۀ‌ دیگری ناظمی و همکارانش(2012) با استفاده از روش‌‌های داده‌کاوی مدلی دومرحله‌ای برای شناسایی ویژگی‌های گروه‌های مختلف مشتریان بانک توسعه داده‌اند و مشتریان مختلف ازنظر میزان سودآوری برای بانک شناسایی شده‌اند (ناظمی و همکاران، 2012). در مقالۀ دیگری تقوی‌فرد و همکاران (2013) با استفاده از تحلیل RFM و به‌کارگیری الگوریتم two step خوشه‌بندی مشتریان را در چهار خوشه انجام داده‌اند و هرکدام را تحلیل کرده‌اند (تقوی‌فرد و همکاران، 2013). در اثر دیگری برادران و فرخی (2013) با استفاده از مدل توسعه‌یافتۀ FRM و به‌کارگیری گام‌های CRISP-DM با به‌کارگیری الگوریتم دومرحله‌ای مشتریان یکی از بانک‌های خصوصی را بخش‌بندی کرده‌اند (برادران و فرخی، 2014). در اثری دیگر قربان‌پور و همکاران (2015) با تلفیق الگوریتم‌های ژنتیک و C-Means در محیط فازی مشتریان بانک رفاه را خوشه‌بندی کرده‌اند (قربان پور و همکاران، 2015). مقایسۀ این پژوهش با سایر پژوهش‌‌های مطالعه‌شده نشان می‌دهد بیشتر مطالعات قبلی پس از انجام خوشه‌بندی مشتریان، با انجام تحلیل‌های موردی وکوتاه به اتمام رسیده‌اند؛ در‌حالی‌که مسئلۀ مدنظر در این پژوهش با انجام فرایند خوشه‌بندی شروع و نتایج آن به‌عنوان ورودی به مدل برای به‌کارگیری در مراحل بعدی استفاده شده است و نیاز اصلی پژوهش را به‌صورت جامع پوشش می‌دهد. همچنین این پژوهش با در نظر گرفتن فرایندی جامع، مدلی را طراحی کرده است که اهداف اساسی بانک در عرصۀ خدمات و محصولات به مشتری را پوشش می‌دهد. درنهایت با استفاده از مفاهیم موجود در روش‌های بهینه‌سازی ازطریق شبیه‌سازی مسئله حل شده است. این فرایند جامع در مطالعات پیشین به‌صورت متمرکز مطرح نشده است. درواقع در بیشتر مطالعات پیشین فقط جنبۀ علمی پژوهش‌ پررنگ‌تر بوده است و بیان مطالعۀ موردی در پژوهش‌های پیشین جنبۀ تأیید روش و مدل حل مسئله است؛ درحالی‌که در این پژوهش، در مرحلۀ نخست از مدل مطرح‌شده برای خوشه‌بندی مشتریان استفاده شده است. درادامه از نتایج مدل چندهدفۀ تخصیص محصول به مشتری برای توسعۀ برنامۀ ‌نرم‌افزاری هوش تجاری برای تسهیل در اتخاذ تصمیم برای ارائۀ خدمت و محصول بانک به مشتری از سوی مدیران و روسای شعب استفاده شده است. این نرم‌افزار که به‌وسیلۀ یک شرکت نرم‌افزای تهیه شده است در یکی از بانک‌های خصوصی کشور پیاده‌سازی و استفاده شده است.

 

مبانی نظری

خوشه‌بندی

خوشه‌بندی، گروه‌بندی یک سری موجودیت در دسته‌های مختلف است؛ این دسته‌ها نشان‌دهندۀ مفهوم یا معنی خاصی هستند؛ به عبارت ساده‌تر به یکدیگر شبیه باشند. از دیدگاه علمی‌تر خوشه‌بندی یعنی گروه‌بندی داده‌ها به k خوشۀ مختلف به‌طوری‌که داده‌هایی که در یک خوشه قرار می‌گیرند به یکدیگر شبیه‌ باشند و داده‌های خوشه‌های مختلف با یکدیگر تفاوت داشته باشند. مدل‌های خوشه‌بندی به سه دسته کلی، سلسله‌ مراتبی، مبتنی بر شبکه و مبتنی بر بخش‌بندی(تابع هدف) تقسیم می‌شوند. هریک از این دسته مدل‌ها ویژگی‌های خاص خود را دارند و ممکن است با‌توجه‌به کاربرد، متفاوت عمل کنند (مومنی، 2012).

 

روش خوشه‌بندی کا میانگین

این الگوریتم یکی از آسان‌ترین الگوریتم‌هایی است که برای حل مسائل مشهور دسته‌بندی طراحی شده است و مک کوئین در سال 1967 نخستین‌بار آن را در دانشگاه کالیفرنیا ارائه داده است. در این روش از معیار حداقل واریانس (یکی از معمول‌ترین روش‌ها برای خوشه‌بندی داده‌ها) استفاده شده است. برای این حداقل‌سازی، الگوهای مختلفی وجود دارد که یکی از عمومی‌ترین آنها روش خوشه‌بندی k-mean است. اگر مجموعه مشاهدات شامل x1, x2, …, xn باشند و هر مشاهده یک بردار حقیقی d بعدی باشد، هدف خوشه‌بندی k-means بخش‌‌بندی این n مشاهده به k زیرمجموعه به‌گونه‌ای است که S = {S1, S2, …, Sk} k≤ n و مجموع مربعات میانگین هر خوشه حداقل شود. در آن μi میانگین نقاط در Si است ( شهرابی و ذوالقدرشجاعی، 2011).

روش پژوهش

روش انجام پژوهش از نقطه نظر هدف، توسعه‌ای-کاربردی و ازنظر اجرایی تحلیلی- توصیفی است. جامعۀ هدف این پژوهش کلیۀ داده‌های ثبت‌شده برای مشتریان حقیقی بانک است. سؤال اصلی این پژوهش عبارت است از "مدل چندهدفۀ تخصیص خدمات و محصولات خاص به مشتریان حقیقی و حقوقی بانک چگونه است؟" به‌دنبال آن سؤالات فرعی عبارتند از 1-خوشه‌بندی مشتریان با استفاده از داده‌کاوی براساس اهداف مدنظر بانک چگونه است؟2- چگونه به‌کمک بهینه‌سازی ازطریق شبیه‌سازی اهداف مدنظر بانک و مشتری تأمین می‌شود؟ 3-سناریوهای پیشنهادی تخصیص خدمت به مشتریان کدام است؟ گردآوری داده‌ها و اطلاعات در این پژوهش ازطریق نرم‌افزار SQLServer روی پایگاه دادۀ بانک انجام شده است. هم‌چنین از برنامه‌ها و نرم‌افزارهای مخصوص در حوزۀ داده‌کاوی ازقبیل نرم افزار3.8.0 wekaو R-Studio استفاده شده است. جامعۀ آماری این پژوهش تمامی 850 هزار مشتری حقیقی بانک است که پس از پاک‌سازی داده‌ها اطلاعات مربوط به 31.953 مشتری حقیقی برای استفاده به کار گرفته شد. با‌توجه‌به تنوع زیاد ویژگی‌های ثبت‌شده از مشتریان و کاربردی‌بودن برخی از این ویژگی‌ها برای تحلیل رفتار ایشان، در این پژوهش مدل RFM توسعه یافته است. درواقع ازطریق اضافه‌کردن دو ویژگی تسهیلات دریافتی و معوقات مشتریان به مدلRFM، ویژگی‌های مدنظر برای انجام فرایند خوشه‌بندی محاسبه شده است.

 

معرفی شاخص‌ها

ازآنجاکه برای هریک از پنج شاخص مدنظر انواع مختلفی وجود دارد، سعی شده است تا با استفاده از روش مجموع سادۀ وزین(SAW) و درادامه با به‌کارگیری روش آنتروپی برای تعیین اوزان، مقدار شاخص مربوطه به‌صورت ذیل محاسبه شود. نکتۀ حائز اهمیت آنکه تمامی شاخص‌ها از عملکرد مالی مشتریان استخراج شده است.

1- تاریخ آخرین مراجعه (R)[xxiv] (تراکنش) مشتری: ازآنجاکه برای بانک انجام تراکنش‌های مالی از طریق کانال‌های مدرن دارای مطلوبیت بیشتری نسبت به مراجعات حضوری به شعبه است، در این مدل فاصلۀ زمانی آخرین تراکنش مشتری از انتهای بازۀ زمانی مدنظر با نماد R و برحسب روز نشان داده می‌شود. هم‌چنین ازآنجاکه در حالت کلی تراکنش‌های مشتری تنها روی دو بستر (کانال) مدرن (خدمات غیرحضوری) و شعبه‌ای (مراجعات حضوری) رخ می‌دهد، برای آخرین تراکنش روی کانال‌های مدرن وزن  و با نماد  و برای مراجعۀ حضوری وزن  و با نماد  نمایش داده می‌شود؛ بنابراین مقدار R مشتری iام برابر است با رابطۀ 1 که به‌صورت زیر نشان داده می‌شود.

رابطه 1

 

2- تعداد تراکنش‌ها در طول بازۀ زمانی(F)[xxv]: مجموع تعداد کل تراکنش‌های مشتری در طول بازۀ زمانی مدنظر به دست می‌آید و با نماد F ، برحسب تعداد بیان می‌شود.

3- مجموع ماندۀ سپرده‌ها (M)[xxvi]: ازآنجاکه تمامی منابع در بانک به دو گروه "قرض‌الحسنه" و "سرمایه‌گذاری" تقسیم می‌شوند، مجموع کل ماندۀ سپرده‌های مشتری iام با نماد  بیان می‌شود. ماندۀ سپرده‌های جاری مشتری iام (منابع قرض‌الحسنه) با ضریب  و با نماد  و مجموع ماندۀ سایر سپرده‌های مشتری iام با هزینۀ زیاد با ضریب  و با نماد  در نظر گرفته می‌شود. بنابراین مقدار M مشتری iام به صورت رابطه2 محاسبه می گردد.

رابطه 2

  

4- مجموع ماندۀ کل تسهیلات جاری(L)[xxvii]: ازآنجاکه تسهیلات فعال (تسویه‌نشده) مشتری ازنظر اهمیت برای بانک متفاوت است، مجموع آن در این پژوهش با نماد L نمایش داده می‌شود. در بانک تمامی تسهیلات و تعهدات درقالب سه بخش قرار می‌گیرد که هرکدام از آنها در ادبیات بانکی معنا و مفهوم خاص خود دارند و برای هر بخش وزن خاصی در نظر گرفته می‌شود. این اوزان به‌شرح رابطۀ 3 است.  

: مجموع تسهیلات مشارکتی مشتری iام با وزن

: مجموع تعهدات (اعتباراسنادی و ضمانت‌نامه) مشتری iام با وزن

: مجموع تسهیلات مبادله‌ای مشتری iام با وزن

رابطه 3

  

5- مجموع کل معوقات (D)[xxviii]: مجموع کل معوقات مشتری در پایان دورۀ درحال بررسی با نماد D نمایش داده و از سه بخش تشکیل می‌‌شود. مجموع کل معوقات در ادبیات بانکی معنا و مفهوم خاص خود را دارند و برای هر بخش وزن خاصی در نظر گرفته شده است که به‌شرح رابطۀ 4 است.

: مجموع ماندۀ مطالبات مشکوک الوصول بانک از مشتری iام با وزن

: مجموع ماندۀ مطالبات معوق بانک از مشتری iام با وزن

: مجموع ماندۀ مطالبات سررسید گذشتۀ بانک از مشتری iام با وزن

رابطه 4

  

 

آماده‌سازی داده‌ها

پس از تعیین نحوۀ محاسبه متغیرها باید آماده‌سازی و پیش‌پردازش داده‌ها برای هریک از متغیرها انجام شود. آماده‌سازی و پیش‌پردازش داده‌ها طی سه گام ذیل است.

گام نخست: حذف داده‌های ناقص، بی‌کیفیت و مغشوش است. در این گام برخی از رکوردهای موجودیی حذف می‌شود که فاقد محتوی هستند؛ یعنی باید برای هریک از مشتری‌های جامعۀ آماری مقدار هر سه ویژگی ‌مدل (R,F,M) مشخص باشد، درغیراین‌صورت داده‌های این مشتری از جامعه آماری خارج می‌شود. لازم به ذکر است شاخص L,D برای مشتری نمونۀ انتخاب‌شده می‌تواند مقدار صفر بگیرد؛ به همین دلیل است که این دو شاخص در مدل به‌صورت جدا از سه معیار دیگر محاسبه می‌‌شود.

گام دوم: استخراج داده و ایجاد انباره داده‌ها است. هدف از این گام ایجاد یک انبارۀ دادۀ یکپارچه از تمامی مشتریان است. در این پژوهش منظور از انبارۀ داده مخزنی از داده‌های جمع‌آوری‌شده در‌خصوص مشتریان بر‌مبنای شاخص‌های ارائه ‌شده است.

گام سوم: این گام نرمال‌سازی داده‌ها است. با‌توجه‌به اینکه داده‌های جمع‌آوری‌شده برای شاخص‌های مدل از یک جنس، مقیاس و جهت نیستند، باید داده‌های مذکور نرمال شوند؛ برای مثال R از جنس زمان و مقیاس روز است و جهت آن کاهشی است، یعنی R کمتر مطلوب‌تر است؛ درحالی‌که M از جنس مالی، مقیاس آن ریال و جهت آن افزایشی است، یعنی M بیشتر مطلوب‌تر است. برای نرمال‌سازی داده‌ها از روش Max-Min مطابق روابط 5 الی 9 برای هر مشتری استفاده شده است.

رابطه 5

 

رابطه 6

 

رابطه 7

 

رابطه 8

 

رابطه 9

 

 

در روابط بالا  ،  ،  ،  و  نشان‌دهندۀ بیشترین مقادیر شاخص‌ها و ،  و  ،  و  بیانگر کمترین مقادیر شاخص‌ها هستند و R، F، M، L و D نیز مقادیر اصلی شاخص‌ها را نشان می‌دهند. درنهایت ، ، ،  و  بیانگر مقادیر نرمال‌شدۀ شاخص‌ها برای مشتری‌i‌ام است.

 

خوشه بندی براساس RFM-LD

باتوجه‌به اینکه در بخش اول پژوهش از داده‌کاوی برای فرایند کشف مدل خوشه‌بندی و ارزش‌های مجموعه داده‌های مدنظر استفاده می‌شود، برای پیاده‌سازی آن یک الگوی مشخص لازم است. یکی از الگوهای قوی در ادبیات موضوع، متدولوژی CRISP[xxix]-DM است. این متدولوژی از گام‌های شناخت داده، آماده‌سازی داده، مدل‌سازی، ارزیابی و توسعه تشکیل شده است. دنبال‌کردن این الگو به داده‌کاوی کمک می‌کند که با نگاه عمیق‌تری از گزارشات معمول داده‌ها به‌صورت منطقی تحلیل شود (چمپن وهمکاران[xxx] ، 2000)؛ بنابراین برای تفکیک مشتریان در گروه‌های همگن براساس ارزش شاخص‌های مدل، از روش خوشه‌بندی کا- میانگین (K-means) استفاده شده است. دستور کلی خوشه‌بندی -Kمیانگین در نرم‌افزار R به‌صورت رابطۀ 10 به کار گرفته شده است.

رابطه 10

  kmeans(x, centers, iter.max = 10, nstart = 1,algorithm = c("Hartigan-Wong", "Lloyd", "Forgy","MacQueen"), trace=FALSE)

المان‌های به‌کاررفته در این روش برای هر بار خوشه‌بندی به‌صورت زیر است.

X: ماتریس عددی از داده‌ها یا همان ماتریس شاخص‌های استاندارد‌شده برای مشتریان (نمونه‌ها) است.

Centers: تعداد خوشه‌ها است که باید به‌صورت پارامتری به دستور اضافه شود.

iter.max: حداکثر تعداد تکرار مجاز برای انجام خوشه‌بندی است (شرط توقف).

nstart: چنانچه centers یک عدد باشد، تعداد مجموعه‌های تصادفی را نشان می‌دهد که باید انتخاب شود.

Algorithm: خوشه‌بندی به این روش برای اجرا از الگوریتم های متفاوتی استفاده می‌کند. این المان برای تابع kmean الگوریتم خاصی را مشخص می‌کند. این تابع به‌طور پیش فرض الگوریتم هارتیگان و ونگ را در خوشه‌بندی پیش می‌گیرد؛ اما ممکن است روش‌های دیگری (الگوریتم مک کویین) استفاده شود که اغلب به سایر الگوریتم‌ها ترجیح داده می‌شود؛ اما به‌طور‌کلی الگوریتم هارتیگان و ونگ نسبت به بقیه بهتر عمل می‌کند.

Trace، تنها در روش هارتیگان و ونگ کاربرد دارد و گویای اعداد صحیح یا منطقی در پیشبرد الگوریتم را درنظر می‌گیرد ( هارتینگ و وانگ[xxxi]، 1975). برای تعیین تعداد خوشه در روش کا-میانگین از روش وارد[xxxii] بهره گرفته شده است. در این روش همانند دیگر روش‌های خوشه‌بندی سلسله مراتبی، نخست هر یک از اشیاء به‌صورت خوشه جداگانه‌ای در نظر گرفته می‌شوند. سپس در هر گام، همۀ ترکیب‌های دوتایی ممکن از ادغام دیده می‌شود و شاخصی به‌نام مجموع توان دوم خطا[xxxiii] محاسبه می‌شود. هر ترکیبی که خطای کمتری داشته باشد، برگزیده می‌شود و برپایۀ آن ادغام انجام می‌‌شود. روشن است که با هر بار مقدار حداقل خطا افزایش می‌یابد. این کار تا زمانی تکرار می‌شود که همۀ اشیاء با هم ادغام شوند و خوشۀ یکتایی حاصل شود (وارد[xxxiv]، 1963). گاهی از این روش به‌نام روش "کمترین واریانس" یاد می‌شود.

 

مدل‌سازی پژوهش

برای ساخت مدل ریاضی در بیان مسئلۀ پژوهش نیازمند ارائه تعاریف و مفاهیم استفاده‌شده در محصولات، مفروضات و فرایند ساخت مدل است که در‌ادامه به‌صورت گام به گام مطرح شده است.

گام1) تعریف محصولات و بیان مفروضات مدل: براساس قانون بانکداری بدون ربا که درسال ۱۳۶۲ به تصویب رسید‌ه است، وظیفۀ اصلی سیستم بانکی کشور تجهیز و تخصیص منابع پولی است. بنابراین تمامی بانک‌ها و مؤسسات اعتباری مجاز هستند خدمات و محصولات خود را در راستای این دو وظیفۀ اصلی تعریف کنند. در وظیفۀ نخست بانک‌ها که امین آحاد جامعه و مشتریان خود هستند در جمع‌آوری و نگهداری پول (تجهیز منابع خود) ازطریق ارائۀ بخشی از محصولات خود با عنوان طرح‌های سپرده‌ای سپرده‌های مشتریان را جذب می‌کنند (بهمند و بهمنی، 2006). وظیفۀ دومِ عملیات بانکی، اعطای تسهیلات بانکی به مشتریان است. در مدل این پژوهش بانک محصولات خود را در دو گروه تسهیلاتی و سپرده‌ای به مشتریان عرضه می‌کند. گروه تسهیلاتی از 9 محصول و گروه سپرده‌ای از 4 محصول تشکیل شده است. ویژگی‌های هرکدام از محصولات ارائه‌شده به مشتریان به‌وسیلۀ بانک در بازۀ زمانی اشاره‌شده در جدول1 آمده است.

 

جدول 1- ویژگی‌های محصولات استفاده‌شده در مدل

 

نوع محصول

نماد

نرخ مؤثر درصد

ریسک درصد

مطلوبیت درصد

هزینه

تسهیلات

مضاربه

y1

27

8/38

01/0

12/0

مشارکت مدنی

y2

6/23

11

3/0

03/0

فروش اقساطی

y3

5/17

9/4

16/0

03/0

اجاره به‌شرط تملیک

y4

3/14

7/1

0

0

جعاله

y5

3/18

5/4

09/0

02/0

خرید دین

y6

8/19

3/7

07/0

02/0

ضمان

y7

0

9/2

0

02/0

قرض‌الحسنه

y8

0

7/2

36/0

02/0

مرابحه

y9

20

0

0

01/0

سپرده‌ها

پس‌انداز

x1

0

0

31/0

0

قرض‌الحسنه جاری

x2

0

0

06/0

0

سپردۀ سرمایه‌گذاری کوتاه‌مدت

x3

20

2/0

61/0

2/1

سرمایه‌گذاری بلندمدت

x4

22

002/0

02/0

22/1

 

در جدول 1 محصولات در گروه تسهیلات و سپرده‌ها تفکیک شده‌اند. مطابق تعاریف به‌کار‌رفته در مجموعه قوانین و مقررات بانک مرکزی، منظور از نرخ مؤثر نرخ واقعی ارائه محصولات به مشتری به‌وسیلۀ بانک، منظور از ریسک در گروه تسهیلات نسبت کل تسهیلات غیرجاری به جاری و در گروه سپرده‌ها نسبت مجموع دارایی‌های نقد به مجموع سپرده‌های مشتریان نزد بانک است. میزان مطلوبیت هر محصول، از مجموع نسبت‌ تعدادی و مبلغی هر محصول در گروه خود حاصل شده و درنهایت هزینۀ هر واحد محصول در گروه تسهیلات ناشی از هزینۀ ذخیره‌گیری هر نوع وام و هزینۀ هر واحد از سپرده‌ها ناشی از هزینۀ سود پرداختی به آنها است.

گام2) ساخت مدل ریاضی: در ساخت مدل ریاضی پژوهش از دو نوع متغیر تصمیم، سه تابع هدف و پنج محدودیت استفاده شده است. متغیرهای تصمیم این مدل ، یعنی تخصیص سپرده jام به خوشۀ iام و ، یعنی تخصیص تسهیلات jام به خوشۀ iام است. در این مدل سه تابع هدف از دیدگاه بانک تعریف شده است. تابع هدف نخست رضایت یا مطلوبیت مشتریان از تخصیص محصولات به آنها بررسی شده است. تابع هدف دوم هزینۀ بانک ناشی از هر واحد تخصیص خدمات و محصولات به هرکدام از خوشه‌های مشتریان و تابع هدف سوم میزان ریسک ناشی از تخصیص هر واحد محصولات به مشتریان است. در تابع هدف نخست، مشتریان به‌دنبال کسب بیشترین مطلوبیت یعنی دریافت سود سپرده‌ای زیاد و تسهیلاتی با نرخ‌های کم هستند؛ درحالی‌که دومین تابع هدف به‌دنبال کاهش هزینۀ ناشی از پرداخت هزینۀ سود سپرده و کاهش هزینۀ ذخیره‌گیری تسهیلات با نرخ‌های زیاد است. درنهایت سومین تابع هدف به‌دنبال کاهش ریسک ناشی از تخصیص محصولات به مشتری برای بانک است. با‌توجه‌به آنکه ضرایب R، F، M، L و D مبین یک تابع توزیع احتمالی مشخص هستند، هرکدام از توابع به صورت امید ریاضی تعریف می‌شوند.

محدودیت نخست براساس قوانین و مقررات بانک مرکزی هر بانک نمی‌تواند بیش از 80 درصد منابع خود را به تسهیلات اختصاص دهد؛ بنابراین در هر خوشه نسبت مجموع تسهیلات اختصاص داده ‌شده به مجموع سپرده‌های مشتریان نباید بیشتر از 80 درصد باشد. به‌دلیل بهره‌مندی حداقل یک نوع سپرده به مشتریان یک خوشه، در محدودیت دوم مجموع سهم درصد هریک از انواع سپرده‌های تخصیص داده شده به هر خوشه بیش از 10 درصد است. هم‌چنین به‌دلیل مشابه در محدودیت سوم مجموع سهم درصد هریک از انواع تسهیلات تخصیص داده شده به هر خوشه بیش از 1 درصد است؛ یعنی مشتریان هر خوشه باید حداقل از یک نوع تسهیلات استفاده کنند. در محدودیت چهارم و پنجم مقدار متغیرهای تصمیم به‌صورت باینری (صفر و یک) است.

 

 

 

s.t

 

 

 

 

 

 

: تعداد مشتریان خوشۀ iام.

: متوسط تعداد تراکنش‌های مشتریان خوشۀ iام.

: متوسط وزنی آخرین زمان‌ مراجعه مشتریان خوشۀ iام.

: متوسط وزنی ماندۀ سپردۀ مشتریان خوشۀ iام.

: متوسط وزنی تسهیلات مشتریان خوشۀ iام.

: مطلوبیت هر واحد تخصیص از محصول jام (اندیس x یعنی سپردۀ jام) به مشتریان خوشۀ iام.

: مطلوبیت هر واحد تخصیص از محصول jام (اندیس y یعنی تسهیلات jام) به مشتریان خوشۀ iام.

: هزینۀ هر واحد تخصیص از محصول jام (اندیس x یعنی سپردۀ jام) به مشتریان خوشۀ iام.

: هزینۀ هر واحد تخصیص از محصول jام (اندیس y یعنی تسهیلات jام) به مشتریان خوشۀ iام.

: ریسک هر واحد تخصیص از محصول jام (اندیس x یعنی سپردۀ jام) به مشتریان خوشۀ iام.

: ریسک هر واحد تخصیص از محصول jام (اندیس y یعنی تسهیلات jام) به مشتریان خوشۀ iام.

  : سهم درصد محصول jام (اندیس x یعنی سپردۀ jام) از کل سپرده‌ها برای مشتریان خوشۀ iام.

 : سهم درصد محصول jام (اندیس y یعنی تسهیلات jام ) از کل تسهیلات برای مشتریان خوشۀ iام.

: تخصیص سپردۀ jام به خوشۀ iام (اگر تخصیص یابد یک در غیر این صورت صفر).

: تخصیص تسهیلات jام به خوشۀ iام (اگر تخصیص یابد یک در غیر این صورت صفر).

گام3) روش تبدیل اهداف چندگانه به یک تابع مطلوبیت: در بسیاری از مسائل چندهدفه، جواب بهینه وجود ندارد؛ زیرا در اکثر مواقع اهداف در تضاد با هم هستند و بهینگی یک هدف باعث دور‌شدن از اهداف دیگر می‌شود.؛ بنابراین جواب بهینه در مدل‌های چند‌هدفه لزوماً مترادف با بهینه‌شدن تمامی هدف‌ها نیست. برای حل مدل‌های چند‌هدفه روش‌های مختلفی وجود دارد که جواب هر روش با روش دیگر لزوماً یکسان نیست؛ زیرا مفروضات هر روش و میزان مشارکت تصمیم‌گیرنده‌ در فرایندهای حل متفاوت است. روش‌هایی ازقبیل تبدیل تابع هدف به محدودیت، وزن‌دهی به اهداف، اولویت مطلق، روش معیار جامع، روش L-P متریک، برنامه‌ریزی آرمانی، برنامه‌ریزی سازشی وغیره در ادبیات موضوع دیده می‌شود (مومنی، 2012). در این پژوهش از روش برنامه‌ریزی سازشی برای تک‌هدفه‌کردن مدل استفاده شده است. در این روش، مدل چن هدفه با در نظر گرفتن هریک از توابع هدف به‌صورت مجزا حل و سپس مدل به‌صورت ت‌ هدفه بازنویسی می‌شود به‌طور‌ی‌که تابع هدف جدید به‌دنبال حداقل‌کردن اختلاف نرمالیزه هر تابع هدف با مقدار بهینۀ آن است. در مدل ارائه‌‌شدۀ این پژوهش سه تابع هدف z1 ،z2 و z3 وجود دارد که قبلا ًمعرفی شده‌اند. مدل با در نظر گرفتن هریک از این توابع به‌صورت مجزا حل شده است و مقادیر بهینه z*1 و z*2 به‌ترتیب برای تابع هدف نخست و دوم به دست می‌آید. سپس تابع هدف جدید به‌صورت زیر بازنویسی می‌شود (w1وw2 بیانگر مقدار ضریب برنامه‌ریزی سازشی است به‌طوری‌که مجموع آنها برابر یک است). در این پژوهش اوزان تابع هدف یکسان لحاظ شده است. برای توابع هدفی که از نوع بیشینه‌سازی است، فرم تبدیل MOLP‌[xxxv] به SOLP[xxxvi] به‌صورت رابطۀ 11 است.

رابطه 11

  

K: اندیس تابع هدف kام است.

Wk: وزن تابع هدف kام است که با‌توجه‌به اهمیت هرکدام از اهداف تعریف‌ می‌شود.

Hk: حداکثر مقدار مطلوب طیف مقادیر تابع هدف kام است.

درنهایت تابع هدف مدل به‌کار‌رفتۀ پژوهش به‌صورت زیر است.

 

: حداکثر میزان مطلوبیت تابع هدف نخست (مطلوبیت).

: حداقل میزان هزینۀ تابع هدف دوم (هزینه).

: حداقل میزان ریسک تابع هدف سوم (ریسک)

تجزیه و تحلیل داده‌ها و حل مدل.

: پارامتر توابع توزیع احتمال است.

در این پژوهش پس از آنکه مشتریان براساس پنج شاخص خوشه‌بندی شدند، توابع توزیع هرکدام از شاخص‌های مدل براساس ویژگی‌های تمامی مشتریان موجود در هر خوشه محاسبه شده است. باتوجه‌به آنکه یکی از مهم‌ترین رویکردهای شبیه‌سازی استفاده از طراحی روش‌های آزمایش و انجام آزمایشات روی مدل مورد مطالعه است. در این رویکرد تمامی شرایط مختلف برای حل مسئله تحت عنوان سناریو در نظر گرفته شده‌، بررسی می‌شود. هم‌چنین در این پژوهش سناریوها (جواب‌ها) به‌کمک طراحی عاملی  تولید می‌‌شود. ازآنجاکه تخصیص یا عدم تخصیص یک محصول به یک خوشه متغیر تصمیم در نظر گرفته شده است از K به‌عنوان تعداد محصولات استفاده می‌شود (13k=)؛ اما به‌دلیل آنکه درعمل تولید  سناریو برای 7 خوشه ممکن نیست از k-p استفاده می‌شود (10p=)؛ بنابراین برای این پژوهش به‌کمک نرم افزارMINITAB 8 سناریو تولید شده است. هرکدام از سناریوها در نرم‌افزار Arena ترسیم شده‌اند و پس از اجرا مقادیر متغیرها و تابع هدف محاسبه شده است تا ورودی‌های الگوریتم تبرید[xxxvii] شبیه‌سازی‌شده برای بهبود جواب حاصل شود.

 

بحث

داده‌های استخراج‌شده از انباره داده‌ای مشتریان یکی از بانک‌های خصوصی کشور طی بازۀ زمانی یک‌ساله 1395 استخراج و شاخص زمان محاسبه و استخراج داده‌های انتخاب‌شده درانتهای سال تنظیم شد (این شاخص در انبار داده با عنوان "تاریخ مؤثر" برای استخراج داده استفاده می‌شود). کل داده‌های درخور استفاده‌ پس از عملیات پاک‌سازی برای تمامی‌ مشتریان حقیقی بانک، 31.953 کد مشتری (حدود 10 درصد) بود و تمامی متغیرهای مربوط به 5 شاخص R، F، M، L و D در جدول2 استخراج شد.

 

جدول 2- اطلاعات آماری داده‌های مرتب با شاخص‌هایRFMLD

مشتریان حقیقی

کمترین مقدار

بیشترین مقدار

میانگین

انحراف معیار

میانه

آخرین زمان مراجعه/ تازگی(R) (روز)

0

362

261

69

285

تعداد تراکنش(F) (عدد)

4

240.224

254

1.642

35

متوسط کمترین مانده سپرده(M)(ریال)

5

153.043.024

4.755.559

13.799.888

189.227

متوسط مانده جاری تسهیلات(L) (ریال)

0

200.000.000.000

23.392.328

1.439.198.534

0

متوسط مطالبات(D) (ریال)

0

6.825.950.685

1.307.458

47.629.447

0

 

پس از بررسی مقدماتیِ نرمال‌بودن متغیرهای پژوهش و اثبات این ادعا که متغیرهای پژوهش نرمال نیستند و همچنین به‌دلیل حجم نمونۀ زیاد (بیشتر از 2000 نمونه) از آزمون کولموگروف-اسمیرنوف[xxxviii] استفاده شد. هنگام بررسی نرمال‌بودن داده‌ها فرض صفر مبتنی‌بر اینکه توزیع داده‌ها نرمال است در سطح خطای 5 درصد تست شد. نتایج مربوطه در جدول3 آمده است.H0 ، فرض توزیع داده‌های مربوط به هریک از متغیرهای نرمال است. در مقابل فرضH1، توزیع داده‌های مربوط به هر‌یک از متغیرهای غیرنرمال است.

 

جدول 3- نتایج آزمون آزمون کولموگروف- اسمیرنوف

متغیرها

آماره آزمون

Df درجه آزادی

Sig. سطح معنی داری

R

187/0

31953

.000

F

439/0

31953

.000

M

365/0

31953

.000

L

494/0

31953

.000

D

489/0

31953

.000

 

بنابراین با توجه به جدول 3 و مقدار سطح معنی‌داری Sig که در آزمون انجام‌شده کمتر از 5درصد است، فرض نرمال بودن داده‌ها(H0) برای تمامی متغیرهای پژوهش رد می‌شود و توزیع داده‌ متغیرها نرمال نیست.

وزن کلیۀ شاخص‌ها به‌روش آنتروپی محاسبه شد و اوزان به‌دست‌آمده برای هر‌کدام از شاخص‌های R، F، M، L و D به‌ترتیب 003/0، 112/0، 115/0، 395/0 و 376/0به دست آمد که نشان‌دهندۀ بالابودن میزان اهمیت متوسط وزنی تسهیلات دریافتی و متوسط وزنی معوقات به‌وسیلۀ مشتریان است. خلاصۀ وضعیت خوشه‌بندی و تعداد اعضای هر خوشه در جدول 4 نشان داده شده است.

با‌توجه‌به منطق روش وارد و با استفاده از شاخص سیلوئت (نیمرخ) تعداد خوشه موردانتظار 7 خوشه به دست آمد که در شکل 1 نمایش وضعیت هرخوشه (7خوشه رنگی) در مختصات هریک از شاخص‌هایR، F، M، L به تصویر کشیده شده است. لازم به ذکر است زمان اجرای الگوریتم برای حل با استفاده از نرم‌افزار آر استودیو نسخۀ 3 روی یک سیستم کامپیوتری 2 هسته‌ای 2 گیگاهرتز دارای 4 گیگابایت حافظه داخلی 2دقیقه و 41 ثانیه محاسبه شده است.

 

جدول 4- تعداد مشتریان در هر بار خوشه‌بندی با تعداد خوشه k

شمارۀ خوشه

k=2

k=3

k=4

k=5

k=6

k=7

k=8

k=9

k=10

1

12,362

11,981

12,339

4,757

208

4,705

1,961

1,024

9,226

2

19,591

1,149

2,014

11,673

2,003

1,000

6,001

1,955

2,355

3

-

18,823

1,033

1,019

11,590

3,376

2,777

6,866

4,465

4

-

-

16,567

2,006

4,744

1,962

5,019

1,994

4,707

5

-

-

-

12,498

12,373

5,919

6,253

4,793

1,232

6

-

-

-

-

1,035

6,431

7,040

207

204

7

-

-

-

-

-

8,560

1,902

5,883

1,940

8

-

-

-

-

-

-

1,000

6,234

759

9

-

-

-

-

-

-

-

2,997

4,266

10

-

-

-

-

-

-

-

-

2,799

جمع

31,953

31,953

31,953

31,953

31,953

31,953

31,953

31,953

31,953

 

2/43

74

5/83

3/85

8/88

1/90

6/90

4/91

7/91

 

 

شکل 1- نمایش وضعیت هر خوشه (7 خوشۀ رنگی) در مختصات هریک ازشاخص‌های R، F، M، L وD

با‌توجه‌به آنکه هرکدام از متغیر‌های R، F،M،L و D متناسب با نوع فعالیت مشتری در زمان‌های مختلف تغییر می‌یابد، از دستور Auto Fit ازطریق اتم ExcelActiveX_Read در نرم‌افزار ED استفاده و تابع توزیع هرکدام از شاخص‌ها برای هر خوشه محاسبه شد و در جدول 5 نشان داده شده است.

 

جدول 5- توابع توزیع شاخص‌های هریک از خوشه‌ها

 

R

F

M

L

D

خوشۀ نخست

Uniform

(0/.830,0/894)

Lognormal

(0/0001212,0/0003037)

Lognormal

(0/012,0/033)

Negexp

(0/0000611)

Logistic

(0/0001852,0/0024956)

خوشۀ دوم

Normal

(0/69,0/14)

Lognormal

(0/002,0/007)

Lognormal

(0/42,0/2)

Negexp

(0/0012)

Negexp

(0/0005)

خوشۀ سوم

Uniform

(0/89,1/00)

Logistic

(0/00006,0/00014)

Lognormal

(0/01,0/02)

Normal

(0/000033,0/000177)

Negexp

(0/0004)

خوشۀ چهارم

Beta

(0/13,0/60,1/20)

Lognormal

(0/01,0/03)

Weibull

(0/06,0/50)

Negexp

(0/0002)

Negexp

(0/000336)

خوشۀ پنجم

Lognormal

(0/69,0/03)

Weibull

(0/0007,0/8)

Weibull

(0/01609,0/50000)

Negexp

(0/0000414)

Negexp

(0/0000985)

خوشۀ ششم

Logistic

(0/61,0/04)

Lognormal

(0/00141,0/00384)

Weibull

(0/027728,0/7)

Negexp

(0/000056)

Logistic

(0/0000456,0/0006003)

خوشۀ هفتم

Normal

(0/81,0/02)

Lognormal

(0/00039,0/00098)

Weibull

(0/01093,0/50000)

Negexp

(0/0001305)

Negexp

(0/000215)

 

   

شکل 2- توابع توزیع شاخص‌هایR و M برای خوشۀ هفتم

 

در شکل2 برای نمونه توابع توزیع شاخص‌هایR و M برای خوشۀ هفتم نمایش داده شده است. باتوجه‌به این شکل تابع توزیع شاخص R برای مشتریان خوشۀ هفتم دارای تابع توزیع نزدیک به نرمال با میانگین 81/0 و واریانس 02/0 است. هم‌چنین برای شاخص M دارای توزیع وایبل با پارامترهای 011093/0 و 5/0 است.

پس از تعیین توابع توزیع متغیرها، مدل ریاضی به‌کمک شبیه‌سازی برای 100 هزار مشتری در 8 سناریو اجرا شد. جواب نزدیک به بهینه در بخش نتیجه‌گیری تشریح می‌شود.

 

نتیجه‌گیری

برای این پژوهش ابتدا براساس مدل تخصیص، تمام 8 سناریو مدل شبیه‌سازی یارانه‌ای به‌کمک نرم‌افزار Arena طراحی‌شده برای هربار اجرا یک جواب موجه برای مسئله تولید می‌‌شود. درحقیقت نقش مدل شبیه‌سازی در این پژوهش تولید جواب‌های موجه به‌صورت تصادفی برای مسئله است؛ زیرا همۀ محدودیت‌های مسئله شبیه‌سازی می‌توانند در برنامۀ شبیع‌سازی کدنویسی شوند. با این کار براساس تابع هدفِ مدل ریاضی پژوهش، تعداد مشخصی از جواب‌های موجه که مناسب‌ترین مقادیر تابع هدف را به خود اختصاص می‌دهند وارد الگوریتم تبرید می‌شوند و از آن به بعد برای الگوریتم تبرید با تولید و بهبود جواب‌های جدید فرایند بهینه‌سازی به اتمام می‌رسد. فرض صحیح در اینکار تولید جواب موجه ابتدایی(جمعیت اولیه) خوب و باکیفیت به‌جای جمعیت اولیۀ تصادفی است که می‌تواند زمان حل الگوریتم را تا حد زیادی کاهش دهد. ضمن آنکه با تولید جواب‌های شبیه‌سازی‌شده احتمال رسیدن به جواب نزدیک به بهینه در میان آنها افزایش می‌یابد. شرط توقف الگوریتم رشد بهبود جواب‌های همسایه کمتر از 001/0 در نظر گرفته شده است. درنهایت نتایج حل مدل ریاضی در جدول 7 نمایش داده شده است.

 

جدول 7- جواب نهایی مسئله

Max HQ

Min HC

Min HR

نوع توابع هدف

مطلوبیت

(Z1)

هزینه

(Z2)

ریسک

(Z3)

توابع هدف

277

2404

477

مقدار بهینه Z‌ برای هرکدام از توابع هدف

661134174/0

مقدار تابع هدف شبیه‌سازی‌شده

جواب مسئله بهینه به‌کمک شبیه سازی

Z3

Xij1

Xij2

Xij3

Xij4

Xij5

Xij6

Xij7

y1

1

0

0

1

1

1

1

y2

0

0

0

1

0

1

1

y3

1

1

1

1

1

1

1

y4

1

1

1

1

1

1

1

y5

1

1

1

1

1

1

1

y6

0

1

0

1

1

1

1

y7

1

1

1

1

1

1

1

y8

1

1

1

1

1

1

1

y9

1

1

1

1

1

1

1

x1

1

1

1

1

1

1

1

x2

1

1

1

1

0

1

1

x3

1

0

0

1

0

1

1

x4

1

1

0

1

1

1

1

 

همان‌طور‌که در حل نهایی مسئله نشان داده شده است، عدد یک برای Xijنشان‌دهندۀ تخصیص محصول تسهیلاتی(y) و یا سپرده‌ای(x) iام به هرکدام از 7 خوشۀ jام بوده است. در مقابل عدد صفر نشان‌دهندۀ تخصیص‌ندادن محصول تسهیلاتی(y) و یا سپرده‌ای(x) iام به هرکدام از 7 خوشۀ jام است. با‌توجه‌به جواب به‌دست‌آمده و در صورت داشتن شرایط قانونی برای هر مشتری نتیجه می‌شود، مشتریان خوشه‌های 6 و7 می‌توانند از کلیۀ وام‌ها و سپرده‌های بانک برخوردار شوند. از طرف دیگر برای مشتریان خوشۀ سوم افتتاح سپرده‌های جاری و قرض‌الحسنه توصیه می‌شود و سپرده‌های کوتاه یا بلندمدت توصیه نمی‌شود. هم‌چنین برای این خوشه از مشتریان پرداخت وام‌های مشارکتی یا مضاربه‌ای توصیه نمی‌شود.

مهم‌ترین نوآوری این پژوهش طراحی و به‌کارگیری مدل ریاضی چند‌هدفه و استفاده از روش خوشه‌بندی در ارائۀ خدمت و محصولات بانک به مشتریان است که در حل آن از بهینه‌سازی ازطریق شبیه‌سازی استفاده شده است.

از محدویت‌های این پژوهش ناتوانایی ابزارهای شبیه‌سازی در ترسیم و حل تمامی‌ حالات محتمل (سناریوهای بیشتر) و حل مدل برای آنها است. پیشنهاد آتی این پژوهش، توسعۀ مدل ریاضی از بُعد مشتری است که پس از حل آن بانک قادر به تصمیم‌گیری برای ارائۀ خدمت و محصول به تک‌تک مشتریان خود است و هم‌زمان توابع هدف در مناسب‌ترین حالات خود قرار می‌گیرند. درنهایت با استفاده از یک مدل بتوان پارامترهای مربوط به هرکدام از محصولات را برای مشتری جدید مراجعه‌کننده به بانک تنظیم کرد. نوآوری و وجه تمایز اصلی این پژوهش با سایر مطالعات به‌شرح ذیل است.

1-اکثر مطالعات انجام‌شده به‌صورت پراکنده تمرکزشان روی روش، مدل حل مسئله، کوتاه‌کردن زمان و ابعاد حل مسئله با به‌کارگیری الگوریتم‌های مختلف است؛ در‌حالی‌که این پژوهش به‌صورت کاربردی و علمی درجهت حل یک مسئله در دنیای واقعی شکل گرفته و تمام تمرکز آن روی ایجاد مدل جامعی است که تا حد زیادی عوامل واقعی موجود در فضای مسئله را پوشش دهد و بتواند آن را حل کند، به‌طوری‌که با اضافه‌کردن دو شاخص تسهیلات دریافتی مشتریان و معوقات ایجاد شده برای بانک به مدل معروف RFM و توسعۀ آن باعث محاسبۀ دقیق‌تر ارزش مشتریان بانک و استفاده از آن در خوشه‌بندی آنها شده‌ است (سجادی و همکاران، 2015).

2- در مطالعات پیشین معمولاً بدون ذکر دلیل با استفاده از روش‌های مختلف مشتریان خوشه‌بندی شده‌اند؛ درحالی‌که در این پژوهش روش‌های خوشه‌بندی و جایگاه آن در داده‌کاوی و دلایل استفاده از روش‌ به‌کاررفته تشریح شده است.

در اکثر مطالعات انجام‌شده پس از انجام خوشه‌بندی مشتریان، مسئله رها شده و تنها با انجام تحلیل‌های موردی وکوتاه به اتمام رسیده است؛ درحالی‌که در این پژوهش مسئله با انجام فرایند خوشه‌بندی شروع و نتایج آن به‌عنوان ورودی به مدل برای به‌کارگیری آن استفاده شده است و توانسته نیاز اصلی پژوهش را به‌صورت جامع پوشش دهد.

3-این پژوهش با در نظر گرفتن فرایندی جامع ابتدا مشتریان بانک را براساس ویژگی‌های اساسی و مهم، خوشه‌بندی کرده است؛ سپس با شناسایی محصولات بانکی قابلِ عرضه به مشتری، مدلی طراحی شده است که اهداف اساسی بانک در عرصۀ خدمات و محصولات را به مشتری پوشش می‌دهد. درنهایت با استفاده از مفاهیم موجود در روش‌های بهینه‌سازی ازطریق شبیه‌سازی مسئله حل شده است؛ درحالی‌که این فرایند جامع در مطالعات پیشین به‌صورت متمرکز مطرح نشده است.

از محدویت‌های این پژوهش ناتوانایی ابزارهای شبیه‌سازی در ترسیم و حل مدل با تمام اجزاء و مفروضات بیشتر موجود در دنیای واقعی است. علاوه بر آن محدودیت در استفاده از نسخه‌های آموزشی نرم‌افزارهای به‌کاررفته در پژوهش و محدودیت کار با استفاده از رایانه به‌کاررفته وجود دارد.

پیشنهاد آتی این پژوهش، توسعۀ مدل ریاضی از بعد مشتری اشاره است. درواقع پس از حل آن بانک قادر به تصمیم‌گیری برای ارائۀ خدمت و محصول به تک‌تک مشتریان خود است و هم‌زمان توابع هدف در مناسب‌ترین حالات خود قرار گیرند. در‌نهایت با استفاده از یک مدل بتوان پارامترهای مربوط به هر‌کدام از محصولات را برای مشتری جدیدی تنظیم کرد که برای نخستین بار به بانک مراجعه می‌کنند. پیشنهاد دیگر برای سایر پژوهشگران آنکه با استفاده از سایر الگوریتم‌های داده‌کاوی برای خوشه‌بندی و الگوریتم‌های فراابتکاری دامنۀ جواب‌های مدل ریاضی کاووش و نتایج آن مقایسه شود. علاوه بر این پیشنهاد می‌شود با استفاده از تکنیک‌های داده‌کاوی، تحلیل رفتار مشتریان در بازه‌‌های زمانی مختلف رصد و تغییر سلایق آنها در استفاده از خدمات و محصولات بانک پایش شود.



[i]- Abiodun

[ii]- Varun Kumar

[iii]- Key Account

[iv]- Thomas

[v]- Kotler

[vi]- Athanassopoulos

[vii]- Chen

[viii]- Ngai

[ix]- Mishar

[x]- Wang

[xi]- Singh

[xii]- Zabkowski

[xiii]- Customer Life time Value

[xiv]- Net Present Value

[xv]- Share of Wallet

[xvi]- Markov Chain

[xvii]- Past Customer Value

[xviii]- Return on Investment

[xix]-Recency, Frequency, Monetary

[xx]- Battel

[xxi]- Keiningham

[xxii]- k-Means

[xxiii]- Wu

[xxiv]- Recency

[xxv]- Frequency

[xxvi]- Monetary

[xxvii]- Loan

[xxviii]- Deferred

[xxix]- Cross Industry Standard Process for Data Mining

[xxx]- Champan

[xxxi]- Hartigan, Wong

[xxxii]- Ward

[xxxiii]- Sum of squares error index

[xxxiv]- Ward

[xxxv]- Malty Objective Linear Programing 

[xxxvi]- Single Objective Linear Programing

[xxxvii]- Simulated Annealing

[xxxviii]- Kolmogorov-Smirnov

Abiodun, R. (2017). “Development of Mathematical Models for Predicting Customers Satisfaction in the Banking System with a Queuing Model Using Regression Method”. American Journal of Operations Management and Information Systems, 2(2), 86-91.

Afsar A, houshdar mahjoub R, minaei B.(2014) “Customer credit clustering for Present appropriate facilities”. Management Research in Iran, 17 (4), 1-24 .

Akbariasl, R., & Bashli, M. (2014) “Banking Services Marketing”, Ettehad Publishing, Tehran, Iran. 81-92.

Alborzi, M., Mohammad Pourzarandi, M. E., Khanbabayi, M. (2010). “Using Genetic Algorithm in optimizing decision trees for credit scoring of banks customers”. Journal of Information Technology Management, 2(4), 23-38.

Athanassopoulos, A. D. (2000). “Customer satisfaction cues to support market segmentation and explain switching behavior”, Journal of Business Research, 47 (3), 191-207.

Azizi, S., Balaghi Inalou, M. (2016). “Segmentation of Mobile Banking Users Based on Expectations: A Clustering Technique”. Journal of Production and Operations Management, 7(2), 217-234. doi: 10.22108/jpom.2016.21103.

Bahmand, M., & Bahmani, M. (2006). “Internal Banking (Supply of Money Resources)”, Iranian Institute of Banking Publisher, Tehran, Iran, 48-50.

Baradara, V., Farokhi, Z. (2014).”Customer Segmentation in Banking Industrial by RFCM Model development”, Journal of Brand Management, 1(2),135-154.

Buttle, F., (2004) “Customer Relationship Management: Concepts and Tools”, Elsevier Butterworth Heinemann.

Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000).”CRISP-DM 1.0: Step-by-step data mining guide”. SPSS Incc.

Chen, Q., Zhang, M., & Zhao, X. (2017). “Analysing customer behaviour in mobile app usage”. Industrial Management & Data Systems, 117, 425-438.

Ghorbanpour A, tallai G, panahi M. (2015) “Clustering Customers of Refah Bank Branches Using Combination of Genetic Algorithm and C- Means in Fuzzy Environment”. Organizational Resources Management Researchs.; 5 (3), 153-168.

Hartigan, J. (1975), “Clustering algorithms”, Wiley, New York.

Izadi, B., Ranjbarian, B., Ketabi, S., Nasiri Mofakham, F. (2016). “A Comprehensive Approach for Market Segmentation and Customer Classification Using Data Mining methods and alternative Linear Programming”. Journal of Production and Operations Management, 7(1), 1-22. doi: 10.22108/jpom.2016.20909

Keiningham,T .and Aksoy,L. and Bejou,D,(2006) “Approaches to measurement and management of customer value”, Journal of relationship marketing, 5) 2( , 37-54.

Kotler, P.,) 1994) “Marketing management:Analysis, planning, implementation, and control”, New Jersey: Prentice-Hall.

Kumar, M., Vishnu Chaitanya, M. and Madhavan, M. (2012) “Segmenting the banking market strategy by clustering” , International Journal of Computer Applications, Vol. 45,No. 17, pp.10–15.

Mishar, A.,(2009) “Customer relationship management: Implementation process perspective”, Acta polytechnic hungarica,. 6(4),83-99.

Momeni, M. (2012). “Data Clustering (Cluster Analysis)”, Danesh Negar Publisher, Tehran, Iran, 37-38

Nazemi, Jamshid., Jafari, Pejman., Hashemi, Hamed.(2012). “Mining the Retail Banking Customers Characteristics Using Data Mining Techniques”. Journal of Marketing Management .2(7), 12, 21-35.

Ngai, E.W.T. ,( 2005) “Customer relationship management research (1992-2002): An academic literature review and classification”, Marketing intelligence Planning, Vol. 23,pp.582-605.

Safari Kahreh, M. and Safari Kahreh, Z.,(2012) “An empirical analysis to design enhanced customer lifetime value based on customer loyalty: evidences from Iranian banking sector”, Iranian journal of management studies, 5(2), 145-167.

Shahrabi, Jamal., Zolghadr, Ali.,(2011) “Advanced data mining :concepts algorithms”, Soroush Gita Publisher. 130:142.

Singh, S., & Singh, S. (2016). “Accounting for risk in the traditional RFM approach”. Management Research Review, 39(2), 215-234.

Sohrabi, Babak., Khanlari, Amir., Ajorlo, Nasibeh.(2011).”A Model to Determine Customer Lifetime Value ‎‎(CLV) in Banking Industry”‎. Management Research in Iran. 15 (1) :224-239

Taghavifard, M., Khajvand, S. & Najafi, E. (2011). “Customer clustering Saderat Bank of Iran by using data mining”. Improvement Management Studies, 67(21), 197-200

Sajjadi, K., Khatami-Firuzabadi, M. A., Amiri, M., Sadaghiani, J. S. (2015).A developing model for clustering and ranking bank customers. InternationalJournal of Electronic Customer Relationship Management, 9(1), 73-86.

Taghavifard, M., Khajvand, S. (2013). “Customer Segmentationof Bank Customers (Case: SaderatBank of Iran)”. Journal of Business Administration Researches, 5(9), 39-64.

Thomas, J. S. (2001). “A methodology for linking customer acquisition to customer retention”, Journal of Marketing Research, 38 (2), 262-268.

Wang, H. F. & Hong, W. K. (2006). “Managing customer profitability in a competitive market by continuous data mining”, Industrial Marketing Management, 35 (6), 715-723.

ward j. h. jr. (1963) “hierarchical grouping to optimize an objective function”, Journal of the American Statistical Association, 58 ( 301), 236-244.

Wu, Hsin-Hung; Chang, En-Chi and Lo, Chiao-Fang,( 2009) “Applying RFM model and K-means method in customer value analysis of an outfitter”, International Conference on Concurrent Engineering, New York.

Zabkowski, T. (2016). “RFM approach for telecom insolvency modeling”. Kybernetes, 45(5), 815-827.