هدف از فصل دوم پایان نامه داده کاوی در بانک با عنوان «مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده از تکنیک های دادهکاوی» می باشد
تعداد صفحات | 105 |
حجم | 630 کیلوبایت |
فرمت فایل اصلی | docx |
دسته بندی | رشته فناوری اطلاعات (IT) |
هدف از فصل دوم پایان نامه داده کاوی در بانک با عنوان «مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده از تکنیک های دادهکاوی» می باشد.
با بکارگیری تکنیک های هوشمند دادهکاوی مشتریان بانک مهر اقتصاد در پنج دسته و با توجه به بیشترین شباهت در الگوی رفتاری گروه بندی شدند.خوشهبندی مشتریان بر مبنای چارچوب ارائه شده در این تحقیق به ما کمک می کند تا مشتریانی که دارای الگوهای رفتاری مشابه بر حسب متغیرهای تراکنشی مشتریان و ممتغیرهای جمعیت آماری هستند را در گروه های واحدی در نظر گرفته و بر مبنای ویژگیهای اکثریت مشتریان هر گروه، سرویس های متناسب با این ویژگی ها را به روشهای متفاوت به مشتریان پیشنهاد نمود.
می توان با بررسی خوشهها، خوشه هایی که بیشترین تعداد مشتریان کلیدی در آن ها قرارگرفتهاند شناسایی نمود. با این امکان مشتریان مستعد کلیدی شدن شناخته می شوند و با خدمت رسانی هر چه بیشتر به این گروه ها منجر به حفظ و ادامه ارتباط مؤثر آن ها با بانک گردید.با بررسی خوشه هایی که بیشترین مشتریان کلیدی را در خود جای داده اند و شناسایی اکثریت مشتریان در این خوشهها از منظر نوع شغل، محل منطقه بانکی و جنسیت و ... و با نظر کارشناسان و خبرگان بانکی می توان خدمات بانکی ویژه و متناسب با این گروه ها را طراحی نموده و از طریق پیامک و یا به طور رودررو به این افراد معرفی نمود.
فهرست مطالب
فصل دوم 18
2 1 مقدمه 18
2 2 مدیریت دانش 21
2 2 1 دانش چیست؟ 21
2 2 2 هرم دانش 22
2 2 3 انواع دانش 23
2 2 3 1 دانش صریح 23
2 2 3 2 دانش ضمنی 24
2 2 4 مدیریت دانش چیست؟ 24
2 2 5 استراتژیهای مدیریت دانش 26
2 2 5 1 استراتژی اجتماعی سازی (تبدیل دانش پنهان به پنهان) 27
2 2 5 2 استراتژی برونی سازی (پنهان به آشکار) 28
2 2 5 3 استراتژی ترکیب سازی (آشکار به آشکار) 28
2 2 5 4 استراتژی درونیسازی (آشکار به پنهان) 29
2 2 6 معایب عدم بهرهگیری از دانش در سازمان 29
2 2 7 اهداف مدیریت دانش 30
2 2 8 مدل های مدیریت دانش 31
2 3 مدیریت دانش مشتری 33
2 3 1 انواع دانش مشتری 35
2 3 2 مدل مدیریت دانش مشتری 40
2 4 مدیریت ارتباط با مشتری 42
2 4 1 مدیریت ارتباط مشتریان در نظام بانکی 46
2 4 2 مدیریت ارتباط با مشتری: اهداف، مزایا و چالشها 48
2 5 مقایسه مفاهیم CKM و KM و CRM 50
2 6 تاریخچهای از بانک و بانکداری 54
2 7 سیر تحول فناوری اطلاعات در صنعت بانکداری 55
2 7 1 دوره اول: اتوماسیون پشت باجه 55
2 7 2 دوره دوم: اتوماسیون جلوی باجه 56
2 7 3 دوره سوم: اتصال مشتریان به حسابهایشان 56
2 7 4 دوره چهارم: یکپارچهسازی سیستمها و مرتبط کردن مشتریان با تمامی عملیات بانکی 57
2 7 5 بانکداری الکترونیک 57
2 8 دادهکاوی 58
2 8 1 مقایسه روشهای آماری و دادهکاوی 59
2 8 2 مفهوم دادهکاوی 61
2 8 3 دادهکاوی و کشف دانش 64
2 8 4 فرایند دادهکاوی 66
2 8 5 معرفی روشهای دادهکاوی 73
2 8 5 1 دستهبندی 75
2 8 5 2 درخت تصمیم 76
2 8 5 3 شبکههای عصبی 77
2 8 5 4 پیش بینی 79
2 8 5 5 خوشهبندی 80
2 8 5 5 انواع خوشهبندی 81
2 8 5 5 2 معیارهای ارزیابی در خوشهبندی 83
2 8 5 6 تحلیل انحراف 85
2 8 5 7 قواعد وابستگی (انجمنی) 86
2 8 5 8 تحلیل توالی 86
2 8 6 نرمافزار دادهکاوی 87
2 8 7 کاربردهای دادهکاوی 88
2 8 7 1 دادهکاوی در صنعت بانکداری 90
2 9 پیشینه تحقیق 91
2 9 1 کاربرد دادهکاوی در بخشبندی و مدلسازی رفتاری مشتریان در صنعت بانکداری 93
2 9 2 کاربرد دادهکاوی در ارزیابی اعتبار مشتریان 96
2 9 3 کاربرد دادهکاوی در زمینه کشف تقلب 98
2 9 4 کاربرد دادهکاوی در تحلیل رویگردانی مشتری 99
2 10 جمعبندی مطالب فصل 106
منابع و مآخذ
فهرست جدولها
جدول 2 1 انواع مختلف تبدیلات دانش 19
جدول 2 2 مقایسه مفاهیم مدیریت دانش، مدیریت ارتباط با مشتری و مدیریت دانش مشتری 35
جدول 2 3 مقایسه روشهای تحلیل آماری و دادهکاوی 41
جدول 2 4 فعالیتهای مربوط به فازهای CRISP DM و خروجی هر فعالیت 50
جدول 2 5 نمونه دادههای مورد نیاز در یک مسئله مدلسازی به روش دستهبندی 54
جدول 2 6 معیارهای محاسبه شباهت در خوشهبندی 59
جدول 2 7 معیارهای محاسبه فاصله در خوشهبندی 60
جدول 2 8 پژوهشهای انجامگرفته در زمینه کاربرد دادهکاوی در صنعت بانکداری 71
فهرست تصاویر و نمودارها
شکل 2 1 سلسلهمراتب دانش 16
شکل 2 2 دانش صریح فقط بخش کوچکی از دانش را تشکیل میدهد. 17
شکل 2 3 مدل مدیریت دانش پروبست و رمهارد 22
شکل 2 4 چارچوب خوشه انگور جهت نوع شناسی دانش مشتری 26
شکل 2 5 مدل مدیریت دانش مشتری 28
شکل 2 7 گامهای فرایند تولید دانش از پایگاه دادهها 44
شکل 2 8 متدولوژی فرآیند استاندارد میان صنعتی دادهکاوی (CRISP DM) 47
شکل 2 9 دستهبندی کلی عملکردهای دادهکاوی 52
شکل 2 11 نیروهای رقابتی پورتر 64
هدف از پایان نامه داده کاوی در بانک با عنوان «مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده از تکنیک های دادهکاوی» می باشد
تعداد صفحات | 185 |
حجم | 973 کیلوبایت |
فرمت فایل اصلی | docx |
دسته بندی | رشته فناوری اطلاعات (IT) |
هدف از پایان نامه داده کاوی در بانک با عنوان «مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده از تکنیک های دادهکاوی» می باشد، بخشبندی مشتریان بانک مهر اقتصاد باهدف کشف ویژگیهای رفتاری مشابه جهت تسهیل اتخاذ استراتژیهای متناسب با هر بخش و در نتیجه حفظ، تقویت و یا توسعه ارتباط با مشتریان این بانک می باشد. دادههای خام مورد نیاز جهت این مطالعه از پایگاه دادههای بانک مهر اقتصاد استخراج شده است.
چارچوب کلی این تحقیق در هفت گام تنظیم شده است. در گام انتخاب متغیرها، با توجه به اهداف تحقیق و به جهت کاهش حجم دادهها، متغیرهای تأثیرگذار بر این مطالعه شناسایی شد و از این میان سه دسته متغیر داده های جمعیت آماری مشتریان، متغیرهای تراکنشهای مالی مشتریان (R، فاصله میان زمان آخرین تراکنش مشتری تا زمان مورد ارزیابی، F، تعداد خریدهای مشتریان در یک بازه زمانی خاص و M، میانگین مبالغ تراکنشهای مشتری در یک بازه زمانی خاص) و متغیر K مربوط به کلیدی بودن مشتری که با نظر خبرگان بانکی تعیین می گردد، انتخاب شده است.
در گام آمادهسازی دادهها عملیات پیش پردازشی نظیر حذف دادههای نامناسب و نرمال سازی، جهت آمادهسازی برای ورود به الگوریتم انجام می گیرد. این دادهها در یک مجموعه با هزار نمونه و در قالب جدول اکسل تنظیم شدند. در ادامه تعداد خوشهها به منظور تفکیک مشتریان با استفاده از نظرات خبرگان بانکی، پنج دسته تعیین گردید. در گام بعد الگوریتمهای خوشهبندی K Means، WK Means و A H Means بر روی پایگاه دادهها اعمال شد. در نهایت با شناسایی خوشه های مشتریانی که بیشترین شباهت را در الگوهای رفتاری خود دارند، دانشی حاصل خواهد شد که می تواند در جهت اتخاذ استراتژی مناسب جهت جذب و نگهداری مشتری و بهبود کارآیی مالی او، توسط مدیران سازمان بکار گرفته شود.
فهرست مطالب
فصل اول 1
1 1 مقدمه 2
1 2 تعریف مسئله 4
1 3 ضرورت انجام تحقیق 10
1 4 مراحل انجام تحقیق 11
1 5 محدوده تحقیق 13
1 6 اهداف تحقیق 13
1 7 ساختار پایاننامه 15
فصل دوم 18
2 1 مقدمه 18
2 2 مدیریت دانش 21
2 2 1 دانش چیست؟ 21
2 2 2 هرم دانش 22
2 2 3 انواع دانش 23
2 2 3 1 دانش صریح 23
2 2 3 2 دانش ضمنی 24
2 2 4 مدیریت دانش چیست؟ 24
2 2 5 استراتژیهای مدیریت دانش 26
2 2 5 1 استراتژی اجتماعی سازی (تبدیل دانش پنهان به پنهان) 27
2 2 5 2 استراتژی برونی سازی (پنهان به آشکار) 28
2 2 5 3 استراتژی ترکیب سازی (آشکار به آشکار) 28
2 2 5 4 استراتژی درونیسازی (آشکار به پنهان) 29
2 2 6 معایب عدم بهرهگیری از دانش در سازمان 29
2 2 7 اهداف مدیریت دانش 30
2 2 8 مدل های مدیریت دانش 31
2 3 مدیریت دانش مشتری 33
2 3 1 انواع دانش مشتری 35
2 3 2 مدل مدیریت دانش مشتری 40
2 4 مدیریت ارتباط با مشتری 42
2 4 1 مدیریت ارتباط مشتریان در نظام بانکی 46
2 4 2 مدیریت ارتباط با مشتری: اهداف، مزایا و چالشها 48
2 5 مقایسه مفاهیم CKM و KM و CRM 50
2 6 تاریخچهای از بانک و بانکداری 54
2 7 سیر تحول فناوری اطلاعات در صنعت بانکداری 55
2 7 1 دوره اول: اتوماسیون پشت باجه 55
2 7 2 دوره دوم: اتوماسیون جلوی باجه 56
2 7 3 دوره سوم: اتصال مشتریان به حسابهایشان 56
2 7 4 دوره چهارم: یکپارچهسازی سیستمها و مرتبط کردن مشتریان با تمامی عملیات بانکی 57
2 7 5 بانکداری الکترونیک 57
2 8 دادهکاوی 58
2 8 1 مقایسه روشهای آماری و دادهکاوی 59
2 8 2 مفهوم دادهکاوی 61
2 8 3 دادهکاوی و کشف دانش 64
2 8 4 فرایند دادهکاوی 66
2 8 5 معرفی روشهای دادهکاوی 73
2 8 5 1 دستهبندی 75
2 8 5 2 درخت تصمیم 76
2 8 5 3 شبکههای عصبی 77
2 8 5 4 پیش بینی 79
2 8 5 5 خوشهبندی 80
2 8 5 5 انواع خوشهبندی 81
2 8 5 5 2 معیارهای ارزیابی در خوشهبندی 83
2 8 5 6 تحلیل انحراف 85
2 8 5 7 قواعد وابستگی (انجمنی) 86
2 8 5 8 تحلیل توالی 86
2 8 6 نرمافزار دادهکاوی 87
2 8 7 کاربردهای دادهکاوی 88
2 8 7 1 دادهکاوی در صنعت بانکداری 90
2 9 پیشینه تحقیق 91
2 10 جمعبندی مطالب فصل 106
فصل سوم 109
3 1 مقدمه 110
3 2 روش پیشنهادی 110
3 2 1 چارچوب تحقیق 111
3 2 2 انتخاب متغیرها 113
3 2 3 آمادهسازی و پیشپردازش دادهها 115
3 2 3 1 نرمال سازی دادهها 115
3 2 4 تعیین تعداد بهینه خوشهها 116
3 2 5 خوشهبندی 117
3 2 5 1 انواع خوشهبندی 118
3 2 5 2 خوشهبندی به روش K Means 120
3 2 5 1 1 مزایای استفاده از الگوریتم خوشهبندی K Means 121
3 2 5 1 2 محدودیتهای الگوریتم K Means 121
3 2 5 2 خوشهبندی به روش WK Means 122
3 2 5 3 خوشهبندی به روش A H Means 124
3 2 6 ارزیابی خوشهها به روش مجموع مربع خطاها و انتخاب بهترین روش 126
3 2 7 بهکارگیری دانش حاصل از خوشهبندی 128
3 3 روشهای جمع آوری اطلاعات 128
3 4 جمعبندی مطالب فصل 129
فصل چهارم 131
4 1 مقدمه 131
4 2 معرفی بانک مهر اقتصاد 132
4 3 موضوع و فعالیت بانک 133
4 4 محاسبات تحقیق 134
4 4 1 گام انتخاب و جمع آوری متغیرهای ورودی 134
4 4 2 گام آمادهسازی و پیشپردازش دادهها 136
4 4 3 گام تعیین تعداد بهینه خوشهها 137
4 4 4 گام خوشهبندی دادهها 138
4 4 4 1 خوشهبندی به روش K Means 139
4 4 4 2 خوشهبندی به روش WK Means 141
4 4 4 3 خوشهبندی به روش A H Means 142
4 4 5 ارزیابی خوشهها به روش مجموع مربع خطاها و انتخاب بهترین روش 142
4 4 6 گام بهکارگیری دانش حاصل از خوشهبندی 144
4 5 نتایج تحقیق 147
4 6 جمعبندی مطالب فصل 149
فصل پنجم 151
5 1 مقدمه 152
5 2 خلاصه تحقیق 152
5 3 نتیجهگیری 154
5 4 زمینههای پیشنهادی، راهکارها و پیشنهادات جهت پژوهشهای آتی 155
منابع و مآخذ 171
فهرست جدولها
جدول 2 1 انواع مختلف تبدیلات دانش 19
جدول 2 2 مقایسه مفاهیم مدیریت دانش، مدیریت ارتباط با مشتری و مدیریت دانش مشتری 35
جدول 2 3 مقایسه روشهای تحلیل آماری و دادهکاوی 41
جدول 2 4 فعالیتهای مربوط به فازهای CRISP DM و خروجی هر فعالیت 50
جدول 2 5 نمونه دادههای مورد نیاز در یک مسئله مدلسازی به روش دستهبندی 54
جدول 2 6 معیارهای محاسبه شباهت در خوشهبندی 59
جدول 2 7 معیارهای محاسبه فاصله در خوشهبندی 60
جدول 2 8 پژوهشهای انجامگرفته در زمینه کاربرد دادهکاوی در صنعت بانکداری 71
جدول 3 1 متغیرهای تحقیق 80
جدول 4 1 نمونه دهتایی از دادههای مربوط به مشتریان بانک مهر اقتصاد 95
جدول 4 2 متغیرهای نرمال شده 96
جدول 4 3 وزن نسبی متغیرهای تحقیق 100
جدول 4 5 مقادیر مجموع مربع خطاها در الگوریتمهای مختلف خوشهبندی 101
جدول 4 6 دستهبندی مشتریان بر مبنای ویژگیهای رفتاری مشابه 103
جدول 4 7 اطلاعات مربوط به خوشهبندی مشتریان بانک مهر اقتصاد به روش K Means 104
فهرست تصاویر و نمودارها
شکل 2 1 سلسلهمراتب دانش 16
شکل 2 2 دانش صریح فقط بخش کوچکی از دانش را تشکیل میدهد. 17
شکل 2 3 مدل مدیریت دانش پروبست و رمهارد 22
شکل 2 4 چارچوب خوشه انگور جهت نوع شناسی دانش مشتری 26
شکل 2 5 مدل مدیریت دانش مشتری 28
شکل 2 7 گامهای فرایند تولید دانش از پایگاه دادهها 44
شکل 2 8 متدولوژی فرآیند استاندارد میان صنعتی دادهکاوی (CRISP DM) 47
شکل 2 9 دستهبندی کلی عملکردهای دادهکاوی 52
شکل 2 11 نیروهای رقابتی پورتر 64
شکل 3 1 چارچوب تحقیق 78
شکل 4 1 خوشه اول، الگوریتم K Means 98
شکل 4 2 خوشه دوم، الگوریتم K Means 98
شکل 4 3 خوشه سوم، الگوریتم K Means 99
شکل 4 4 خوشه چهارم، الگوریتم K Means 99
شکل 4 5 خوشه پنجم، الگوریتم K Means 99
هدف از پایان نامه داده کاوی در سازمان ، کاربرد داده کاوی در کشف دانش پنهان میان داده های سامانه 137 شهرداری تهران می باشد.
تعداد صفحات | 152 |
حجم | 864 کیلوبایت |
فرمت فایل اصلی | docx |
دسته بندی | مدیریت |
هدف از پایان نامه داده کاوی در سازمان ، کاربرد داده کاوی در کشف دانش پنهان میان داده های سامانه 137 شهرداری تهران می باشد. تحقیق حاضر از نوع کاربردی می باشد و به بررسی به کارگیری برخی روشهای داده کاوی در مورد دادههای سامانه 137 شهرداری تهران میپردازد.
سامانه 137 یک مرکز گیرنده پیامهای مردمی جهت رسیدگی به مشکلات و معضلات مشکلات شهری شهروندان تهرانی میباشد. در این راستا کل پیامهای سال 1389 این سامانه در بانک اطلاعاتی2008 SQL Server گردآوری و مورد تحلیل قرار گرفت.سامانه 137 با هدف رفع مشکلات و معضلات شهری و با رویکرد مشارکت بیشتر شهروندان در مدیریت شهری راه اندازی شده است. تعداد کل پیام ها در طول سال مورد بررسی و پس از مرحله آماده سازی داده ها مجموعاً 1.082.195 بوده است که به لحاظ تحلیلهای آماری تعداد قابل توجه و برای تحلیلهای دادهکاوی مناسب میباشد.
رویکرد محقق در این تحقیق به کارگیری تکنیک های مختلف داده کاوی به منظور شناسایی و پیش بینی، نیازها و مشکلات شهری بر اساس داده های بدست آمده از سامانه مدیریت شهری 137 می باشد. تمرکز اصلی در این تحقیق بر استفاده از روشهای داده کاوی و نرم افزار SPSS Clementine میباشد. همان طور که در فصل قبل بیان شد، دلیل استفاده از این نرم افزار، توانایی آن در پردازش مجموعه های داده ای بزرگ و متداول بودن آن در میان کاربران است. در بخش آماده سازی داده ها، رسم نمودارها و جداول از نرم افزارهایی نظیر Sql server 2008، Excel 2007 و Spss 16 استفاده شده است.
در مرحله ی توصیف اطلاعات، ابتدا توزیع فراوانی و درصد فراوانی متغیرهای گوناگون و همینطور برخی از شاخصهای سرانه را مورد بررسی قرار دادیم و در بخش تحلیل داده ها با استفاده از تکنیک های داده کاوی، گروه مدلها و تحلیلهای زیر مورد بررسی قرار گرفته است:
• شناسایی مناطق همگن از منظر سامانه 137
• پیش بینی وضعیت تماس های آب گرفتگی هر یک از مناطق به ازای بارش هر میلمیتر باران
• تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه
• تعیین نواحی مستعدتر درهر منطقه در بروز مشکلات و معضلات شهری
فهرست مطالب
فصل اول: کلیات
مقدمه 1
1-1- بیان مساله 2
1-2- هدف تحقیق 3
1-3- سوالات تحقیق 3
1-4- اهمیت و ضرورت تحقیق 4
1-5- قلمرو تحقیق 5
1-5-1- از منظر سازمانی 5
1-5-2- از منظر زمانی و مکانی 5
1-5-3- از منظر موضوعی 5
1-6- روش تحقیق و جمع آوری اطلاعات 5
1-7- تعریف واژه ها و اصطلاحات فنی 6
1-8- خلاصه فصل اول 6
فصل دوم: ادبیات تحقیق
مقدمه 8
2-1- مبانی نظری 9
2-1-1- تاریخچه داده کاوی 9
2-1-2- تعریف داده کاوی 10
2-1-3- انواع داده کاوی 11
2-1-4- دلایل استفاده از داده کاوی 12
2-1-5- پیش نیازهای یک داده کاوی موفق 12
2-1-6-1شناخت کسب و کار 14
2-1-6-2شناخت داده ها 14
2-1-6-3آماده سازی داده ها 15
2-1-6-4مدل سازی 15
2-1-6-5ارزیابی مدل 15
2-1-6-6توسعه ی مدل 16
2-1-7- قابلیت های اساسی داده کاوی 16
2-1-7-1 طبقه بندی 16
2-1-7-2 پیش بینی 17
2-1-7-3 تحلیل خوشه ای 17
2-1-7-4 تخمین 18
2-1-7-5 گروه بندی شباهت یا قوانین وابستگی 19
2-1-7-6 توصیف و نمایه سازی 20
2-1-9- الگوریتم های خوشه بندی 21
2-1-9-1روش افرازی ( تقسیم بندی) 21
2-1-9-1-1الگوریتم K-MEANS 22
2-1-9-2روش های سلسله مراتبی 22
2-1-9-3روش های مبتنی بر چگالی 23
2-1-10- الگوریتم های وابستگی قواعد 23
2-1-10-1الگوریتم Naïve 23
2-1-10-2 الگوریتم Apriori 24
2-1-11- الگوریتم های طبقه بندی 26
2-1-11-1الگوریتم درخت طبقه بندی و رگرسیون (CART) 26
2-1-11-2الگوریتم درخت تصمیم C4.5 27
2-1-11-3الگوریتم های شبکه های بیزین 29
2-2-1- مدیریت شهری و شهرداری 30
2-2-2- نقش فن آوری اطلاعات در توسعه ی مدیریت شهری 31
2-2-3- معرفی سامانه مدیریت شهری 137 شهرداری تهران 33
2-2-3-1نحوه ی عملکرد سامانه مدیریت شهری 137 36
2-2-3-2ماموریت های مرکز سامانه مدیریت شهری 137 38
2-2-3-3رویکردهای اجرایی مرکز سامانه مدیریت شهری 137 38
2-2-3-4چشم انداز مرکز سامانه مدیریت شهری 137 39
2-2-3-5ساختار سازمانی سامانه مدیریت شهری 137 39
2-2 مدل مفهومی تحقیق 40
2-3- ادبیات یاپیشینه تحقیق 40
2-4- خلاصه فصل دوم 44
فصل سوم: روش تحقیق
مقدمه 46
3-1- نوع تحقیق 46
3-2-1- شناخت کسب و کار 47
3-2-2- شناخت داده ها 48
3-2-3- آماده سازی داده ها 48
3-2-4- مدل سازی 49
3-2-5- ارزیابی مدل 49
3-2-6- توسعه مدل 49
3-3- داده های تحقیق 50
3-4- جامعه آماری, روش نمونه گیری و حجم نمونه 50
3-5- روش گردآوری اطلاعات و ابزار سنجش 50
3-6- نوع داده ها و مقیاس آن ها 51
3-7- ساختار اجرایی تحقیق 51
3-7-1- درک مساله کسب و کار 51
3-7-2- درک داده ها 52
3-7-3- آماده سازی داده ها 53
3-7-4- مدل سازی 55
3-7-5- ارزیابی نتایج 56
3-7-6- به کارگیری مدل 56
3-8- مدل اجرایی تحقیق 56
3-9- خلاصه فصل سوم 58
فصل چهارم: تجزیه و تحلیل داده ها
مقدمه 60
4-1- توصیف داده ها 60
4-2- تحلیل توصیفی داده ها با استفاده از جداول و نمودارهای توصیفی 63
4-2-1- طبقه بندی بر اساس نوع مشکل 63
4-2-2- طبقه بندی بر اساس منطقه بروز مشکل 66
4-2-3- شاخصهای توصیفی سرانه 67
4-3- تحلیل داده ها با استفاده از تکنیک های داده کاوی 70
4-3-1- شناسایی مناطق همگن از منظر سامانه 137 70
4-3-1-1ارزیابی خوشه ها 76
4-3-2- پیش بینی وضعیت تماس های آب گرفتگی در هر یک از مناطق به ازای بارش هر میلیمتر باران 77
4-3-2-1 مدل تعمیم یافته خطی 77
4-3-2-2مدل شبکههای عصبی 82
4-3-3 تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه 84
4-3-4 تعیین نواحی مستعدتر در هر منطقه در بروز مشکلات و معضلات شهری 86
4-4- خلاصه فصل چهارم 87
فصل پنجم: بحث و نتیجه گیری
مقدمه 89
5-1-خلاصه 89
5-2- دلایل با اهمیت بودن نتایج و دستاوردهای تحقیق 90
5-3- جنبه ی نوآوری تحقیق 91
5-4- نتایج تحقیق 91
5-4-1- نتایج تحلیل توصیفی 91
5-4-2- نتایج حاصل از تحلیل داده کاوی و ارائه ی دانش استخراج شده 94
5-4-2-1نتایج حاصل از شناسایی مناطق همگن با استفاده از روش خوشه بندی دو مرحله ای 94
5-4-2-2- نتایج پیش بینی تماس های آب گرفتگی در هر یک از مناطق به ازای بارش هر میلیمتر باران 95
5-4-2-3تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه 96
5-4-2-4نتایج تحلیل قوانین وابستگی برای شناسایی نواحی مستعدتر در هر منطقه در بروز مشکلات و معضلات شهری 97
5-5- پاسخ به سوالات تحقیق 97
5-6- محدودیتهای تحقیق 98
5-7- پیشنهادات تحقیق 99
5-8- پیشنهادات جهت تحقیقات آتی 100
5-9- خلاصه فصل پنجم 101
فهرست منابع 102
چکیده انگلیسی 105
فهرست جداول
جدول 2-1 : نمونه ای از جدول پیام 35
جدول 2-2: تحقیقات خارجی در زمینه کاربرد داده کاوی در مراکز تماس 444
جدول4-1 : فیلد های جدول پیام 61
جدول 4-2: فیلد های جدول اطلاعاتی مربوط به اعتبار مصوب عمرانی مناطق 61
جدول4-3: فیلد های جدول اطلاعاتی مربوط به بارش مناطق 61
جدول4-4: فراوانی گروه های تماس 63
جدول4-5 پراکندگی مشکلات مربوط به گروه جمع آوری و نصب 65
جدول4-6 : طبقه بندی مشکلات بر اساس منطقه 66
جدول 4-7 سرانه تماس و بودجه مناطق بیست و دو گانه تهران 68
جدول4-8: شاخصهای نیکویی برازش 78
جدول4-9: آزمون درستنمایی مدل خطی تعمیم یافته 78
جدول4-10 آزمون عوامل مدل خطی تعمیم یافته 79
جدول4-11 آزمون ضرائب مدل خطی تعمیم یافته 79
جدول4-12 بخشی از ارتباطهای دنبالهای شناسایی شده 85
جدول4-13 قوانین شناسایی شده به روش GRI 86
فهرست شکل ها
شکل 2-1 مراحل فرایند کشف دانش و جایگاه داده کاوی. 11
شکل2-2 مراحل فرایند CRISP-DM 13
شکل 2-1 چرخه گردش پیام- ماخذ: مرکز سامانه 137 36
شکل 2-2ساختار سازمانی سامانه مدیریت شهری سامانه 137-ماخذ: مرکز مدیریت سامانه 137 39
شکل2-3 مدل مفهومی تحقیق 40
شکل3-1وضعیت ایستگاه های پنج گانه هواشناسی مستقر در شهر تهران می باشد. 53
شکل3-2 روش اجرایی تحقیق 57
شکل4-1: درصد فراوانی هر کدام از گروههای تماس 64
شکل 4-2 :سهم مناطق در تماس های از نوع "جمع آوری خاک و نخاله" و "نصب سطل زباله مخزن دار" 66
شکل4-3: رابطه میان تعداد تماس، جمعیت و اعتبار مصوب عمرانی 69
شکل4-4 بررسی نه عامل اول در خوشه بندی 73
شکل4-5 بررسی نه عامل دوم در خوشه بندی 74
.شکل 4-6 بررسی هفت عامل آخر در خوشه بندی 75
شکل 4-7 اعضای خوشه های اول و دوم 76
شکل 4-8 : آنالیز مدل خطی تعمیم یافته 81
شکل 4-9: نمودار صعود 81
شکل 4-10: مدل شبکه عصبی 83
شکل 4-11: آنالیز مدل شبکه عصبی 84
شکل 5-1 : رابطه میان تعداد تماس، جمعیت و اعتبار مصوب عمرانی 93
شکل 5-2 اعضای خوشه اول و دوم 94
هدف از پروپوزال داده کاوی در بانک با عنوان «مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده از تکنیک های دادهکاوی»می باشد
تعداد صفحات | 34 |
حجم | 83 کیلوبایت |
فرمت فایل اصلی | docx |
دسته بندی | رشته فناوری اطلاعات (IT) |
هدف از پروپوزال داده کاوی در بانک با عنوان «مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده از تکنیک های دادهکاوی»می باشد.هرچند ممکن است استخراج دانش از حجم عظیم دادههای برجایمانده از تعاملات سازمان ها و به خصوص تعاملات بانک ها با مشتریانشان، در نگاه اول بسیار سخت و گاهی ناممکن به نظر برسد، اما با بهره گیری از ابزارهای نوین تحلیل دادهها همچون دادهکاوی و استفاده از دانش های روز دنیا همچون مباحث مدیریت دانش و مدیریت ارتباط با مشتری می توان این دادهها را به گنجینهای گرانبها تبدیل نمود.
این گنجینه همان دانش استخراجشده از طریق کند و کاو این داده هاست.می توان فنهای دادهکاوی را ابزارهای پشتیبان تصمیم دانست که مدیران سازمان را قادر می سازد که به جای تأثیرپذیری از محیط، بر بازار و عوامل آن تأثیرگذار باشند.رتبه بندی مشتریان با بخشبندی آن ها سعی در کشف الگوهای رفتاری مشابه حاکم بر آن بخش دارد. کشف این الگوها می تواند در مسیر اتخاذ تصمیمات راهبردی سازمان بکار گرفته شود.
فهرست مطالب
فصل اول 1
1 1 مقدمه 2
1 2 تعریف مسئله 4
1 3 ضرورت انجام تحقیق 10
1 4 مراحل انجام تحقیق 11
1 5 محدوده تحقیق 13
1 6 اهداف تحقیق 13
1 7 ساختار پایاننامه 15
منابع و مآخذ
پایان نامه داده کاوی در بیمه با عنوان ارائه مدلی برای شناسایی عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکتهای بیمه بوسیله روشهای داده کاوی شرکت سهامی بیمه ایران می باشد.
تعداد صفحات | 124 |
حجم | 2637 کیلوبایت |
فرمت فایل اصلی | docx |
دسته بندی | مهندسی نرم افزار |
پایان نامه داده کاوی در بیمه با عنوان ارائه مدلی برای شناسایی عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکتهای بیمه بوسیله روشهای داده کاوی شرکت سهامی بیمه ایران می باشد.در این تحقیق توانستیم اثبات کنیم که با روشهای داده کاوی می توان مدلی هایی ارائه داد که عوامل موثر در احتمال به بار آوردن خسارت یک مشتری را با توجه به میزان تاثیر آن عوامل مشخص کند. این موضوع از طریق الگوریتم های کاهش ویژگی و وزن دهی و شبکه عصبی مهیا شد. همچنین الگوریتم های خوشه بندی نیز نتایج مشابهی را ارائه داده اند. علاوه بر این، الگوریتم های دسته بندی با تشخیص عوامل اثر گذار توانسته اند مدلی را ارائه دهند که با دقت بسیار بالایی احتمال خسارتی بودن یک بیمه نامه را تشخیص می دهد.
الگوریتم های درخت تصمیم نیز با دقت بالایی در تشخیص عوامل موثر در خسارتی بودن یک بیمه نامه و ارائه مدل و قوانین لازم موفق عمل کرده اند. الگوریتم های مبتنی بر قانون اگرچه قوانین بسیار محدودی ارائه داده اند اما درصد تشخیص عوامل اثر گذار و دقت قوانین استخراج شده قابل اطمینان بوده است. عوامل در الگوریتم های مختلف با ضریب تشخیصی متفاوت قید شده است. عوامل اثر گذار استخراج شده عمدتاً به تنهایی موثر نبوده بلکه دارای اثرات وابسته به دیگر عوامل بوده است که این موضوع در درختهای تصمیم و قواعد تلازمی(مبتنی بر قانون) به وضوح مشخص است و بیان شده است.
در این پژوهش از8 الگوریتم دسته بندی شامل KNN, Naïve bayes, Neural Network, SVM Linear, Meta Decision Tree, Wj48, Random Forest و رگرسیون لجستیک استفاده شده است که تعداد 3 الگوریتم آن درخت تصمیم بوده است. همچنین دو الگوریتم مبتنی بر قانون Apriori, Fp Growthو 3 الگوریتم خوشه بندی K-Means، دوگامی و Kohonen نیز مورد استفاده قرار گرفته اند. در این قسمت نتایج الگوریتمهای دسته بند غیر درخت با هم مقایسه می شوند و به ترتیب بهترین مدلها مشخص میگردند. همچنین سه الگوریتم دسته بند درختی با هم دیگر مقایسه شده و بهترین نتایجی که خسارتی بودن یک رکورد را مشخص میکند پس از مشاوره با یک متخصص و کارشناس در امور بیمه از هر درخت استخراج می گردد و به ترتیب دقت نهایی آن الگوریتم اعلام میگردد. در خصوص الگوریتم های مبتنی بر قانون نیز دو الگوریتم با هم دیگر مقایسه شده و بهترین قوانینی که خسارتی بودن یک رکورد را مشخص میکند پس از مشاوره با یک متخصص و کارشناس در امور بیمه از هر الگوریتم استخراج و اعلام میگردد.
فهرست مطالب
فصل اول: مقدمه
1-1 تعریف داده کاوی 4
1-2 تعریف بیمه 4
1-3 هدف پایان نامه 5
1-4 مراحل انجام تحقیق 5
1-5 ساختار پایان نامه 6
فصل دوم: ادبیات موضوع و تحقیقات پیشین
2-1 داده کاوی و یادگیری ماشین 8
2-2 ابزارها و تکنیک های داده کاوی 9
2-3 روشهای داده کاوی 11
2-3-1 روشهای توصیف داده ها 12
2-3-2 روشهای تجزیه و تحلیل وابستگی 12
2-3-3 روشهای دسته بندی و پیشگویی 12
2-3-4 درخت تصمیم 13
2-3-5 شبکه عصبی 14
2-3-6 استدلال مبتنی بر حافظه 14
2-3-7 ماشین های بردار پشتیبانی 15
2-3-8 روشهای خوشه بندی 16
2-3-9 روش K-Means 16
2-3-10 شبکه کوهنن 16
2-3-11 روش دو گام 17
2-3-12 روشهای تجزیه و تحلیل نویز 17
2-4 دسته های نامتعادل]صنیعی آباده 1391[. 18
2-4-1 راهکار مبتنی بر معیار 18
2-4-2 راهکار مبتنی بر نمونه برداری 19
2-5 پیشینه تحقیق 20
2-6 خلاصه فصل 23
فصل سوم: شرح پژوهش
3-1 انتخاب نرم افزار 26
3-1-1 Rapidminer 26
3-1-2 مقایسه RapidMiner با سایر نرم افزار های مشابه 27
3-2 داده ها 31
3-2-1 انتخاب داده 31
3-2-2 فیلدهای مجموعه داده صدور 31
3-2-3 کاهش ابعاد 31
3-2-4 فیلدهای مجموعه داده خسارت 37
3-2-5 پاکسازی داده ها 37
3-2-6 رسیدگی به داده های از دست رفته 37
3-2-7 کشف داده دور افتاده 39
3-2-8 انبوهش داده 41
3-2-9 ایجاد ویژگی دسته 41
3-2-10 تبدیل داده 41
3-2-11 انتقال داده به محیط داده کاوی 42
3-2-12 انواع داده تعیین شده 42
3-2-13 عملیات انتخاب ویژگیهای موثرتر 43
3-3 نتایج اعمال الگوریتم PCA و الگوریتم های وزن دهی 44
3-4 ویژگی های منتخب جهت استفاده در الگوریتمهای حساس به تعداد ویژگی 46
3-5 معیارهای ارزیابی الگوریتمهای دسته بندی 47
3-6 ماتریس درهم ریختگی 47
3-7 معیار AUC 48
3-8 روشهای ارزیابی الگوریتم های دسته بندی 49
3-8-1 روش Holdout 49
3-8-2 روش Random Subsampling 50
3-8-3 روش Cross-Validation 51
3-8-4 روش Bootstrap 51
3-9 الگوریتمهای دسته بندی 52
3-9-1 الگوریتم KNN 53
3-9-2 الگوریتم Naïve Bayes 54
3-9-3 الگوریتم Neural Network 54
3-9-4 الگوریتم SVM خطی 56
3-9-5 الگوریتم رگرسیون لجستیک 58
3-9-6 الگوریتم Meta Decision Tree 59
3-9-7 الگوریتم درخت Wj48 61
3-9-8 الگوریتم درخت Random forest 63
3-10 معیارهای ارزیابی الگوریتم های مبتنی بر قانون(کشف قوانین انجمنی) 65
3-10-1 الگوریتم FPgrowth 66
3-10-2 الگوریتم Weka Apriori 67
3-11 معیارهای ارزیابی الگوریتمهای خوشه بندی 67
3-12 الگوریتم های خوشه بندی 69
3-12-1 الگوریتم K-Means 69
3-12-2 الگوریتم Kohonen 73
3-12-3 الگوریتم دوگامی 77
فصل چهارم: ارزیابی و نتیجه گیری
4-1 مقایسه نتایج 83
4-2 الگوریتمهای دسته بندی 84
4-3 الگوریتم های دسته بندی درخت تصمیم 84
4-4 الگوریتم های خوشه بندی 96
4-5 الگوریتم های قواعد تلازمی(مبتنی بر قانون) 98
4-6 پیشنهادات به شرکت های بیمه 99
4-7 پیشنهادات جهت ادامه کار 101
منابع و مأخذ
فهرست منابع فارسی 102
فهرست منابع انگلیسی 103
فهرست جدولها
جدول شماره 3-1: نتایج رای گیری استفاده از نرم افزارهای داده کاوی 24
جدول شماره 3-2: فیلدهای اولیه داده های صدور 26
جدول شماره 3-3: فیلدهای نهایی داده های صدور 27
جدول شماره 3-4: فیلدهای حذف شده داده های صدور و علت حذف آنها 28
جدول 3-5: فیلدهای استخراج شده از داده های خسارت 28
جدول 3-6: نتایج نمودار boxplot 31
جدول 3-7: انواع داده استفاده شده 33
جدول 3-8: نتایج حاصل از اجتماع فیلدهای با بالاترین وزن در الگوریتمهای مختلف 37
جدول 3-9: ماتریس در هم ریختگی رکوردهای تخمینی(Predicted Records) 38
جدول 3-10: قوانین استخراج شده توسط الگوریتم Fpgrowth 55
جدول 3-11: قوانین استخراج شده توسط الگوریتم Weka Apriori 55
جدول 3-12: تنظیمات پارامترهای الگوریتم K-Means 57
اجرا برای 9 خوشه در الگوریتم K-Means 60
جدول 3-13: تنظیمات پارامترهای الگوریتم Kohonen 64
جدول 3-14: تنظیمات پارامترهای الگوریتم دوگامی 69
جدول 4-1: مقایسه الگوریتم های دسته بند 70
جدول 4-2: مقایسه الگوریتم های دسته بند درخت تصمیم 70
جدول 4-3: ماتریس آشفتگی قانون شماره 1 71
جدول 4-4: ماتریس آشفتگی قانون شماره 2 72
جدول 4-5: ماتریس آشفتگی قانون شماره 3 الف 72
جدول 4-6: ماتریس آشفتگی قانون شماره 3 ب 72
جدول 4-7: ماتریس آشفتگی قانون شماره 3 ج 73
جدول 4-8: ماتریس آشفتگی قانون شماره 3 د 73
جدول 4-9: ماتریس آشفتگی قانون شماره 3 ه 73
جدول 4-10: ماتریس آشفتگی قانون شماره 3 و 74
جدول 4-11: ماتریس آشفتگی قانون شماره 3 ز 76
جدول 4-12: ماتریس آشفتگی قانون شماره 4 76
جدول 4-13: ماتریس آشفتگی قانون شماره 5 77
جدول 4-14: ماتریس آشفتگی قانون شماره 6 الف 77
جدول 4-15: ماتریس آشفتگی قانون شماره 6 ب 78
جدول 4-16: ماتریس آشفتگی قانون شماره7 78
جدول 4-17: ماتریس آشفتگی قانون شماره8 79
جدول 4-18: مقایسه الگوریتم های خوشه بندی 79
جدول 4-19: فیلدهای حاصل از الگوریتم های خوشه بندی 80
جدول 4-20: نتایج الگوریتم های FpGrowth, Weka Apriori 81
فهرست شکلها
شکل شماره3-1: داده از دست رفته فیلد" نوع بیمه " پس از انتقال به محیط داده کاوی 33
شکل 3-2: نتایج الگوریتمPCA 34
شکل 3-3: نتایج الگوریتم SVM Weighting در ارزشدهی به ویژگی ها 35
شکل 3-4: نتایج الگوریتم Weighting Deviation در ارزشدهی به ویژگی ها 35
شکل 3-5: نتایج الگوریتم Weighting Correlation در ارزشدهی به ویژگی ها 36
شکل 3-6: نمای کلی استفاده از روشهای ارزیابی 41
شکل 3-7: نمای کلی استفاده از یک مدل درون یک روش ارزیابی 42
شکل 3-8: نمودار AUC الگوریتم KNN 42
شکل 3-9: نمودار AUC الگوریتم Naïve Bayes 43
شکل 3-10: تبدیل ویژگی های غیر عددی به عدد در الگوریتم شبکه عصبی 44
شکل 3-11: نمودار AUC و ماتریس آشفتگی الگوریتم Neural Net 44
شکل 3-12: تبدیل ویژگی های غیر عددی به عدد در الگوریتم SVM خطی 45
شکل 3-13 : نمودار AUC الگوریتم SVM Linear 46
شکل 3-14 : نمودار AUC الگوریتم رگرسیون لجستیک 47
شکل 3-15 : نمودار AUC الگوریتم Meta Decision Tree 48
شکل 3-16 : قسمتی از نمودارtree الگوریتم Meta Decision Tree 49
شکل 3-17 : نمودار radial الگوریتم Meta Decision Tree 49
شکل 3-18: نمودار AUC الگوریتم Wj48 50
شکل 3-19 : نمودار tree الگوریتم Wj48 51
شکل 3-20 : نمودار AUC الگوریتم Random forest 52
شکل 3-21 : نمودار تولید 20 درخت در الگوریتم Random Forest 53
شکل 3-22 : یک نمونه درخت تولید شده توسط الگوریتم Random Forest 53
شکل 3-23 : رسیدن درصد خطا به صفر پس از 8مرتبه 57
شکل 3-24 : Predictor Importance for K-Means 58
شکل 3-25 : اندازه خوشه ها و نسبت کوچکترین خوشه به بزرگترین خوشه در الگوریتم K-Means 59
شکل 3-26 : کیفیت خوشه ها در الگوریتمMeans K- 60
شکل 3-27 : Predictor Importance for Kohonen 61
شکل 3-28 : اندازه خوشه ها و نسبت کوچکترین خوشه به بزرگترین خوشه در الگوریتم Kohonen 62
شکل 3-29 : کیفیت خوشه ها در الگوریتمMeans K- 63
شکل 3-30 : تعداد نرون های ورودی و خروجی در Kohonen 63
شکل 3-31 : Predictor Importance for دوگامی 64
شکل 3-32 : اندازه خوشه ها و نسبت کوچکترین خوشه به بزرگترین خوشه در الگوریتم دوگامی 65
شکل 3-33 : کیفیت خوشه ها در الگوریتم دوگامی 66
شکل4-1: نمودارنسبت تخفیف عدم خسارت به خسارت 75