داده کاوی در تجارت الکترونیک به منظور مدیریت ارتباط با مشتریان
چکیده
رونق تجارت الکترونیک و داد و ستدهای آنلاین باعث انباشته شدن حجم عظیمی از دادهها شده است که پردازش و تحلیل این دادهها میتواند در بهبود مدیریت ارتباط با مشتریان مفید باشد، این امر با استفاده از روشهای داده کاوی میسر میشود. داده کاوی در واقع به عملیاتی گفته میشود که موجب استخراج دانش از دادههای وجود است و موجب افزایش آگاهی در رابطه با یک موضوع یا پدیده در شرایط مشخص میشود. این دانش وسیع خود شامل زیرشاخههای گوناگون است که دو زیرشاخهی مهم آن دادهکاوی با نظارت و بدون نظارت است. در واقع دادهکاوی به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ گفته میشود. داده کاوی کمک میکند که دانش بیشتری در مورد نیاز ها و رفتارهای مشتریان حاصل شود و پیرو آن پاسخ بهتر و دقیق تری ارائه شود. این عوامل باعث شده که در این پژوهش به استفاده از داده کاوی در تجارت الکترونیک و مدیریت ارتباط با مشتریان در فروشگاه دیجی کالا بپردازیم تا روشی سودمند و بهبودیافته در این زمینه ارائه دهیم. در این مطالعه، تمرکز بر روی انواع مشتریان فروشگاه دیجی کالا از منظر مشخصات مختلف که میتواند براساس عواملی دسته بندی را صورت داد و سبد خرید مشتریان با استفاده از روش داده کاوی تحلیل کرد.
کلمات کلیدی: دادهکاوی، تجارت الکترونیک، داده کاوی با نظارت، مدیریت ارتباط با مشتریان
مقدمه
امروزه شاخهای از علوم کامپیوتر به نام داده کاوی توجه خیلی از دانشمندان و علاقهمندان به این رشته را به خود اختصاص داده است. داده کاوی درواقع به عملیاتی گفته می شود که موجب استخراج دانش از داده های وجود است و موجب افزایش آگاهی در رابطه با یک موضوع یا پدیده در شرایط مشخص میشود. این دانش وسیع خود شامل زیرشاخههای گوناگون است که دو زیرشاخهی مهم آن دادهکاوی با نظارت و بدون نظارت است. در واقع دادهکاوی به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ گفته میشود.
اگر این داده ها از قبل دارای برچسب بوده باشند و دسته های مشخصی را تشکیل دهند، معمولا داده کاوی با نظارت همراه خواهد بود در غیر اینصورت داده کاوی به صورت آزادانه و بدون نظارت انجام میشود که نتایج آن نسبت به حالت بانظارت کمتر مشخص خواهد بود. در داده کاوی بدون نظارت اطلاعات پرکیفیت، بهطورمعمول از فهم الگوها و گرایشها از طریق تحلیل و بهوسیله یادگیری الگوهای آماری حاصل میشود. در دنیای امروز حجم عظیمی از اطلاعات بهصورت بدون برچسب میباشد. بنابراین تکنیکهای داده کاوی بدون نظارت اهمیت یافتهاند. با این وجود توسعه داده کاوی و اهمیت موجب شده است که راهکارهای زیادی برای برچسب دار کردن داده ها ایجاد شود. راهکارهای بانظارت از درجه اطمینان بالاتری برخوردار بوده و معمولا ساده تر هستند. از طرفی هرچقدر اطلاعات دریافتی با پردازش کمتر و دقت بالاتر بدست بیایند موجب صرفه جویی در زمان و هزینه می شوند و کارایی بالاتری نیز دارند. بنابراین ارائه روشهایی که بتواند این دانش را بهصورت خلاصه و ساختیافته آماده کرده و در اختیار ما قرار دهد حائز اهمیت است.
بیان مساله
داده کاوی در اوایل دهه ۸۰ برای اولین بار مطرح شد اما از اواخر دهه ۹۰ شکل جدی به خود گرفت و ایده اصلی که باعث مطرح شدن این فناوری شد این موضوع بود که داده های انباشته شده ی قدیمی شامل اطلاعات سودمندی است که پردازش آنها برای آینده میتواند مفید باشد.
با توسعه کسب و کار الکترونیک و حجم بالای اطلاعات ذخیره شده در پایگاه داده های مربوطه, نیازمند ابزاری تخصصی هستیم که از طریق آن بتوانیم داده ها را تحلیل و پردازش کنیم وخروجی مناسب که اطلاعات حاصل از این پردازش است را در اختیار کاربران قرار دهیم. داده کاوی امروزه به عنوان یکی از مطرح ترین روشهای موجود در این زمینه شناخته میشود. داده کاوی فرآیندی است که از تکنیک های تجزیه و تحلیل داده ها برای تولید قوانین و الگوهای جدید استفاده میکند، همچنین روابط را در داده هایی که ممکن است برای پیش بینی دقیق برای آینده مورد استفاده قرار گیرند را توصیف میکند. این عملیات با کمترین دخالت کاربر صورت میگیرد.
مدیریت ارتباط با مشتری که به اختصار CRM نوشته می شود، به مجموعه فرآیندها و فناوریهایی گفته میشود که در سازمانها برای شناسایی، ترغیب، توسعه،حفظ مشتریان و همچنین ارائه خدمات بهتر به آنها به کار میرود. مدیریت ارتباط با مشتری،استراتژی جامع کسب و کار و بازاریابی است که فرآیندها و همه فعالیت های کسب و کار را در زمینه ی مشتری یکپارچه می سازد. از زمانی که بازار رقابت بیشتر شده است ارتباط با مشتریان نیز حائز اهمیت بیشتری شده است.
تکنولوژی پایگاه داده جدید این امکان را دارد که اطلاعات و دانش مشتریان را ذخیره کند و مشخص سازد که مشتریان چه چیزی و در چه زمانی خریداری می کنند و حتی پیش بینی بر اساس رفتارهای وراثتی را انجام می دهد .هم اکنون بیشتر از هر زمان توانایی درک و مدیریت یک ارتباط با مشتری ارائه می شود. شرکت های موفق از اطلاعات مشتریان به شکل آگاهانه برای ساختن روابط سودمند با آنها استفاده می کنند.
در حقیقت این سیستمها راهبردی برای جمعآوری نیازها و رفتارهای تجاری مشتریان تا به ایجاد روابطی قویتر با آنها منجر شود. در نهایت رابطه قوی با مشتریان مهمترین رمز موفقیت هر کسب و کار است. CRM از سه بخش اصلی تشکیل شده است: مشتری، روابط و مدیریت؛ منظور از مشتری؛ مصرف کننده نهایی است که در روابط ارزش آفرین، نقش حمایت کننده را دارا می باشد. منظور از روابط ؛ ایجاد مشتریان وفادارتر و سودمندتر از طریق گیرنده می باشد و مدیریت عبارت است از خلاقیت و هدایت یک فرآیند کسب و کار مشتریمدار و قرار دادن مشتری در مرکز فرآیندها و تجارب سازمان. امروزه در سازمانها به CRM اهمیتی استراتژیک داده شده است. در شرایط دشوار رقابت، ارتباط به هنگام و سازمان یافته با مشتریان، مناسبترین راه افزایش رضایت مشتری، افزایش فروش و در عین حال کاهش هزینههاست . باتوجه به این مسائل، مدیریت ارتباط با مشتریان در سازمانها نوعی استراتژی تجاری به شمار می رود.
تجارت الکترونیک کسب و کاری است که عمدتا مبتنی بر مشتری است، بنابراین مدیریت و ارتباط بهتر با مشتریان بازدهی و فروش بیشتری دربر خواهد داشت, شناسایی رفتارهای مشتریان و ارتباط میان اقلام موجود در سبد محصولات خریداری شده از طریق روش ها و الگوریتم های داده کاوی مقدور است و داده کاوی به عنوان ابزاری قدرتمند در این زمینه مطرح است. بنابراین هدف ما در این پایان نامه، استفاده از داده کاوی جهت تحلیل و پردازش رفتار مشتریان و ایجاد ارتباط سودمندتر با آنها است.
فهرست مطالب
فصل اول: کلیات تحقیق
۱-۱- مقدمه. ۳
۱-۲- بیان مساله. ۴
۱-۳- اهمیت و ضرورت تحقیق. ۵
۱-۴- جنبه نوآوری تحقیق. ۶
۱-۵- اهداف.. ۶
۱-۵-۱- اهداف علمی.. ۶
۱-۵-۲- اهداف فرعی.. ۶
۱-۶- سوالات تحقیق. ۷
۱-۷- فرضیهها ۷
۱-۸- روش تحقیق. ۷
۱-۹- جمع بندی و ساختار پایان نامه. ۹
۱-۱۰- تعاریف واژهها ۹
فصل دوم: ادبیات و پیشینه تحقیق
۲-۱- مقدمه. ۱۱
۲-۲- مدیریت ارتباط با مشتریان. ۱۲
۲-۳- مراحل مدیریت ارتباط با مشتریان. ۱۴
۲-۳-۱- شناسایی مشتریان. ۱۴
۲-۳-۲- جذب مشتریان. ۱۴
۲-۳-۳- حفظ مشتریان. ۱۴
۲-۳-۴- ارتقا مشتریان. ۱۴
۲-۴- بررسی مبانی نظری مدیریت ارتباط با مشتری.. ۱۵
۲-۵- دیدگاههای مختلف در مورد CRM.. 16
۲-۶- مزایای CRM.. 19
۲-۷- عوامل مؤثر در موفقیت CRM.. 20
۲-۸- مدیریت ارتباط با مشتری چیست؟. ۲۱
۲-۹- ابعاد وعناصر CRM.. 23
۲-۱۰- انواع CRM.. 25
۲-۱۰-۱- عملیاتی (Operational) 25
۲-۱۰-۲- تحلیلی (Analytical) 25
۲-۱۰-۳- تعاملی (Collaborative) 26
۲-۱۱- مزایای بکارگیری سیستم ارتباط با مشتری.. ۲۶
۲-۱۲- کاربردهای داده کاوی در ارتباط با مشتریان. ۲۶
۲-۱۳- دادهکاوی.. ۲۷
۲-۱۴- کاربردهای داده کاوی.. ۲۸
۲-۱۵- پیشنیازهای داده کاوی.. ۲۹
۲-۱۵-۱- بررسی و جایگزینی داده های مفقود شده ۲۹
۲-۱۵-۲- تشخیص و حذف داده های تکراری و اضافه. ۲۹
۲-۱۵-۳- تصمیمگیری درباره داده های خارج از محدوده ۲۹
۲-۱۵-۴- تبدیل داده های پیوسته به گسسته. ۲۹
۲-۱۵-۵- تصمیمگیری درباره داده های متناقض و ناسازگار. ۳۰
۲-۱۵-۶- تحلیل همبستگی داده ها ۳۰
۲-۱۵-۷- ایجاد فیلد محاسباتی جدید. ۳۰
۲-۱۵-۸- فشردهسازی داده ها ۳۰
۲-۱۶- نرمالسازی داده ها ۳۱
۲-۱۶-۱- کاهش ابعاد داده ها ۳۱
۲-۱۶-۲- نمونهگیری از داده ها ۳۱
۲-۱۷- کاربردهای داده کاوی.. ۳۱
۲-۱۸- دستهبندی.. ۳۳
۲-۱۸-۱- تخمین ۳۳
۲-۱۸-۲- پیشبینی.. ۳۳
۲-۱۸-۳- دستهبندی شباهت یا قوانین وابستگی.. ۳۴
۲-۱۹- خوشهبندی.. ۳۴
۲-۱۹-۱- نقطهی تمایز خوشهبندی با دستهبندی.. ۳۵
۲-۲۰- تحلیل لینک… ۳۵
۲-۲۱- مدلهای پیشبینی دادهها ۳۵
۲-۲۱-۱- طبقهبندی.. ۳۵
۲-۲۱-۲- رگرسیون. ۳۶
۲-۲۱-۳- سریهای زمانی.. ۳۶
۲-۲۲- مهمترین مدلها و الگوریتمهای دادهکاوی.. ۳۶
۲-۲۲-۱- شبکههای عصبی ۳۶
۲-۲۲-۲- درخت تصمیم. ۳۷
۲-۲۲-۳- استنتاج قوانین.. ۳۹
۲-۲۲-۴- چند نزدیکترین همسایه و استدلال مبتنی بر حافظه MBR. 40
۲-۲۲-۵- رگرسیون منطقی.. ۴۱
۲-۲۲-۶- تحلیل تفکیکی.. ۴۱
۲-۲۳- پیشینه تحقیق. ۴۲
۲-۲۴- جمعبندی مطالب.. ۴۵
فصل سوم: روش اجرای تحقیق
۳-۱- مقدمه. ۴۷
۳-۲- داده کاوی و تعیین رفتار مشتریان. ۵۰
۳-۳- پایگاه داده ۵۱
۳-۳-۱- تاریخچه و دلایل استفاده از پایگاه داده ۵۲
۳-۳-۲- مراحل و نحوه ایجاد پایگاه داده در سازمان. ۵۲
۳-۴- پایگاه داده تحقیق. ۵۳
۳-۵- روش داده کاوی.. ۵۴
۳-۵-۱- مرحله اول پیش پردازش… ۵۶
۳-۵-۲- مرحله دوم ردهبندی.. ۵۶
۳-۵-۳- مرحله سوم تحلیل مشتریان و سبد خرید. ۵۶
۳-۵-۴- مرحله چهارم مشخص کردن کارایی روشها ۵۷
۳-۶- نتیجه گیری.. ۵۸
فصل چهارم: تجزیه و تحلیل داده ها
۴-۱- مقدمه. ۶۰
۴-۲- روش تجزیه و تحلیل. ۶۰
۴-۳- انواع روش های ارزیابی مدل. ۶۲
۴-۴- توصیف داده ها ۶۳
۴-۴-۱- بازرسی و بررسی داده ها ۶۴
۴-۴-۲- اعتبار سنجی کیفیت داده ها ۶۴
۴-۴-۳- آماده سازی داده ها ۶۵
۴-۴-۴- برطرف نمودن مقادیر پرت.. ۶۵
۴-۴-۵- انتخاب ویژگی های تاثیرگذار. ۶۶
۴-۵- روشهای طبقه بندی.. ۶۶
۴-۶- تحلیل داده ها و ارزیابی مدل. ۶۹
۴-۶-۱- الگوریتم درخت تصمیم. ۷۱
۴-۶-۲- تحلیل با الگوریتم پیشنهادی در مقاله (چانگ و همکاران، ۲۰۲۰) ۷۲
۴-۶-۳- تحلیل با KNN.. 73
۴-۶-۴- تحلیل با بیز ساده ۷۴
۴-۷- نتیجه گیری.. ۷۵
فصل پنجم: نتیجه گیری و ارائه پیشنهادات
۵-۱- نتیجه گیری.. ۷۶
۵-۲- پیشنهادات آتی.. ۷۷
فهرست منابع و مآخذ. ۷۹
چکیده انگلیسی.. ۸۵
فهرست شکل ها
شکل ۲‑۱ شبکهی عصبی با یکلایهی پنهان. ۳۷
شکل ۲‑۲ درخت تصمیمگیری.. ۳۸
شکل ۲‑۳ محدودهی همسایگی (بیشتر همسایهها در دستهی X قرارگرفتهاند) ۴۰
شکل ۲‑۴ فرایند دادهکاوی.. ۴۲
شکل ۳‑۱ روشهای پیش پردازش… ۴۹
شکل ۳‑۲ مراحل تحلیل در روش تحقیق. ۵۵
شکل ۴‑۱ اجرای الگوریتم درخت تصمیم. ۶۷
شکل ۴‑۲ اجرای الگوریتم KNN.. 67
شکل ۴‑۳ اجرای الگوریتم بیز ساده ۶۸
شکل ۴‑۴ اجرای الگوریتم پیشنهادی خوشه بندی در (چانگ و همکاران، ۲۰۲۰) ۶۹
شکل ۴‑۵ اولویت بندی معیار ها در درخت تصمیم. ۷۲
شکل ۴‑۶ اولویت بندی معیارها در مقاله مبدا ۷۳
هنوز بررسیای ثبت نشده است.