هدف از پایان نامه داده کاوی در سازمان ، کاربرد داده کاوی در کشف دانش پنهان میان داده های سامانه 137 شهرداری تهران می باشد.
تعداد صفحات | 152 |
حجم | 864 کیلوبایت |
فرمت فایل اصلی | docx |
دسته بندی | مدیریت |
هدف از پایان نامه داده کاوی در سازمان ، کاربرد داده کاوی در کشف دانش پنهان میان داده های سامانه 137 شهرداری تهران می باشد. تحقیق حاضر از نوع کاربردی می باشد و به بررسی به کارگیری برخی روشهای داده کاوی در مورد دادههای سامانه 137 شهرداری تهران میپردازد.
سامانه 137 یک مرکز گیرنده پیامهای مردمی جهت رسیدگی به مشکلات و معضلات مشکلات شهری شهروندان تهرانی میباشد. در این راستا کل پیامهای سال 1389 این سامانه در بانک اطلاعاتی2008 SQL Server گردآوری و مورد تحلیل قرار گرفت.سامانه 137 با هدف رفع مشکلات و معضلات شهری و با رویکرد مشارکت بیشتر شهروندان در مدیریت شهری راه اندازی شده است. تعداد کل پیام ها در طول سال مورد بررسی و پس از مرحله آماده سازی داده ها مجموعاً 1.082.195 بوده است که به لحاظ تحلیلهای آماری تعداد قابل توجه و برای تحلیلهای دادهکاوی مناسب میباشد.
رویکرد محقق در این تحقیق به کارگیری تکنیک های مختلف داده کاوی به منظور شناسایی و پیش بینی، نیازها و مشکلات شهری بر اساس داده های بدست آمده از سامانه مدیریت شهری 137 می باشد. تمرکز اصلی در این تحقیق بر استفاده از روشهای داده کاوی و نرم افزار SPSS Clementine میباشد. همان طور که در فصل قبل بیان شد، دلیل استفاده از این نرم افزار، توانایی آن در پردازش مجموعه های داده ای بزرگ و متداول بودن آن در میان کاربران است. در بخش آماده سازی داده ها، رسم نمودارها و جداول از نرم افزارهایی نظیر Sql server 2008، Excel 2007 و Spss 16 استفاده شده است.
در مرحله ی توصیف اطلاعات، ابتدا توزیع فراوانی و درصد فراوانی متغیرهای گوناگون و همینطور برخی از شاخصهای سرانه را مورد بررسی قرار دادیم و در بخش تحلیل داده ها با استفاده از تکنیک های داده کاوی، گروه مدلها و تحلیلهای زیر مورد بررسی قرار گرفته است:
• شناسایی مناطق همگن از منظر سامانه 137
• پیش بینی وضعیت تماس های آب گرفتگی هر یک از مناطق به ازای بارش هر میلمیتر باران
• تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه
• تعیین نواحی مستعدتر درهر منطقه در بروز مشکلات و معضلات شهری
فهرست مطالب
فصل اول: کلیات
مقدمه 1
1-1- بیان مساله 2
1-2- هدف تحقیق 3
1-3- سوالات تحقیق 3
1-4- اهمیت و ضرورت تحقیق 4
1-5- قلمرو تحقیق 5
1-5-1- از منظر سازمانی 5
1-5-2- از منظر زمانی و مکانی 5
1-5-3- از منظر موضوعی 5
1-6- روش تحقیق و جمع آوری اطلاعات 5
1-7- تعریف واژه ها و اصطلاحات فنی 6
1-8- خلاصه فصل اول 6
فصل دوم: ادبیات تحقیق
مقدمه 8
2-1- مبانی نظری 9
2-1-1- تاریخچه داده کاوی 9
2-1-2- تعریف داده کاوی 10
2-1-3- انواع داده کاوی 11
2-1-4- دلایل استفاده از داده کاوی 12
2-1-5- پیش نیازهای یک داده کاوی موفق 12
2-1-6-1شناخت کسب و کار 14
2-1-6-2شناخت داده ها 14
2-1-6-3آماده سازی داده ها 15
2-1-6-4مدل سازی 15
2-1-6-5ارزیابی مدل 15
2-1-6-6توسعه ی مدل 16
2-1-7- قابلیت های اساسی داده کاوی 16
2-1-7-1 طبقه بندی 16
2-1-7-2 پیش بینی 17
2-1-7-3 تحلیل خوشه ای 17
2-1-7-4 تخمین 18
2-1-7-5 گروه بندی شباهت یا قوانین وابستگی 19
2-1-7-6 توصیف و نمایه سازی 20
2-1-9- الگوریتم های خوشه بندی 21
2-1-9-1روش افرازی ( تقسیم بندی) 21
2-1-9-1-1الگوریتم K-MEANS 22
2-1-9-2روش های سلسله مراتبی 22
2-1-9-3روش های مبتنی بر چگالی 23
2-1-10- الگوریتم های وابستگی قواعد 23
2-1-10-1الگوریتم Naïve 23
2-1-10-2 الگوریتم Apriori 24
2-1-11- الگوریتم های طبقه بندی 26
2-1-11-1الگوریتم درخت طبقه بندی و رگرسیون (CART) 26
2-1-11-2الگوریتم درخت تصمیم C4.5 27
2-1-11-3الگوریتم های شبکه های بیزین 29
2-2-1- مدیریت شهری و شهرداری 30
2-2-2- نقش فن آوری اطلاعات در توسعه ی مدیریت شهری 31
2-2-3- معرفی سامانه مدیریت شهری 137 شهرداری تهران 33
2-2-3-1نحوه ی عملکرد سامانه مدیریت شهری 137 36
2-2-3-2ماموریت های مرکز سامانه مدیریت شهری 137 38
2-2-3-3رویکردهای اجرایی مرکز سامانه مدیریت شهری 137 38
2-2-3-4چشم انداز مرکز سامانه مدیریت شهری 137 39
2-2-3-5ساختار سازمانی سامانه مدیریت شهری 137 39
2-2 مدل مفهومی تحقیق 40
2-3- ادبیات یاپیشینه تحقیق 40
2-4- خلاصه فصل دوم 44
فصل سوم: روش تحقیق
مقدمه 46
3-1- نوع تحقیق 46
3-2-1- شناخت کسب و کار 47
3-2-2- شناخت داده ها 48
3-2-3- آماده سازی داده ها 48
3-2-4- مدل سازی 49
3-2-5- ارزیابی مدل 49
3-2-6- توسعه مدل 49
3-3- داده های تحقیق 50
3-4- جامعه آماری, روش نمونه گیری و حجم نمونه 50
3-5- روش گردآوری اطلاعات و ابزار سنجش 50
3-6- نوع داده ها و مقیاس آن ها 51
3-7- ساختار اجرایی تحقیق 51
3-7-1- درک مساله کسب و کار 51
3-7-2- درک داده ها 52
3-7-3- آماده سازی داده ها 53
3-7-4- مدل سازی 55
3-7-5- ارزیابی نتایج 56
3-7-6- به کارگیری مدل 56
3-8- مدل اجرایی تحقیق 56
3-9- خلاصه فصل سوم 58
فصل چهارم: تجزیه و تحلیل داده ها
مقدمه 60
4-1- توصیف داده ها 60
4-2- تحلیل توصیفی داده ها با استفاده از جداول و نمودارهای توصیفی 63
4-2-1- طبقه بندی بر اساس نوع مشکل 63
4-2-2- طبقه بندی بر اساس منطقه بروز مشکل 66
4-2-3- شاخصهای توصیفی سرانه 67
4-3- تحلیل داده ها با استفاده از تکنیک های داده کاوی 70
4-3-1- شناسایی مناطق همگن از منظر سامانه 137 70
4-3-1-1ارزیابی خوشه ها 76
4-3-2- پیش بینی وضعیت تماس های آب گرفتگی در هر یک از مناطق به ازای بارش هر میلیمتر باران 77
4-3-2-1 مدل تعمیم یافته خطی 77
4-3-2-2مدل شبکههای عصبی 82
4-3-3 تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه 84
4-3-4 تعیین نواحی مستعدتر در هر منطقه در بروز مشکلات و معضلات شهری 86
4-4- خلاصه فصل چهارم 87
فصل پنجم: بحث و نتیجه گیری
مقدمه 89
5-1-خلاصه 89
5-2- دلایل با اهمیت بودن نتایج و دستاوردهای تحقیق 90
5-3- جنبه ی نوآوری تحقیق 91
5-4- نتایج تحقیق 91
5-4-1- نتایج تحلیل توصیفی 91
5-4-2- نتایج حاصل از تحلیل داده کاوی و ارائه ی دانش استخراج شده 94
5-4-2-1نتایج حاصل از شناسایی مناطق همگن با استفاده از روش خوشه بندی دو مرحله ای 94
5-4-2-2- نتایج پیش بینی تماس های آب گرفتگی در هر یک از مناطق به ازای بارش هر میلیمتر باران 95
5-4-2-3تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه 96
5-4-2-4نتایج تحلیل قوانین وابستگی برای شناسایی نواحی مستعدتر در هر منطقه در بروز مشکلات و معضلات شهری 97
5-5- پاسخ به سوالات تحقیق 97
5-6- محدودیتهای تحقیق 98
5-7- پیشنهادات تحقیق 99
5-8- پیشنهادات جهت تحقیقات آتی 100
5-9- خلاصه فصل پنجم 101
فهرست منابع 102
چکیده انگلیسی 105
فهرست جداول
جدول 2-1 : نمونه ای از جدول پیام 35
جدول 2-2: تحقیقات خارجی در زمینه کاربرد داده کاوی در مراکز تماس 444
جدول4-1 : فیلد های جدول پیام 61
جدول 4-2: فیلد های جدول اطلاعاتی مربوط به اعتبار مصوب عمرانی مناطق 61
جدول4-3: فیلد های جدول اطلاعاتی مربوط به بارش مناطق 61
جدول4-4: فراوانی گروه های تماس 63
جدول4-5 پراکندگی مشکلات مربوط به گروه جمع آوری و نصب 65
جدول4-6 : طبقه بندی مشکلات بر اساس منطقه 66
جدول 4-7 سرانه تماس و بودجه مناطق بیست و دو گانه تهران 68
جدول4-8: شاخصهای نیکویی برازش 78
جدول4-9: آزمون درستنمایی مدل خطی تعمیم یافته 78
جدول4-10 آزمون عوامل مدل خطی تعمیم یافته 79
جدول4-11 آزمون ضرائب مدل خطی تعمیم یافته 79
جدول4-12 بخشی از ارتباطهای دنبالهای شناسایی شده 85
جدول4-13 قوانین شناسایی شده به روش GRI 86
فهرست شکل ها
شکل 2-1 مراحل فرایند کشف دانش و جایگاه داده کاوی. 11
شکل2-2 مراحل فرایند CRISP-DM 13
شکل 2-1 چرخه گردش پیام- ماخذ: مرکز سامانه 137 36
شکل 2-2ساختار سازمانی سامانه مدیریت شهری سامانه 137-ماخذ: مرکز مدیریت سامانه 137 39
شکل2-3 مدل مفهومی تحقیق 40
شکل3-1وضعیت ایستگاه های پنج گانه هواشناسی مستقر در شهر تهران می باشد. 53
شکل3-2 روش اجرایی تحقیق 57
شکل4-1: درصد فراوانی هر کدام از گروههای تماس 64
شکل 4-2 :سهم مناطق در تماس های از نوع "جمع آوری خاک و نخاله" و "نصب سطل زباله مخزن دار" 66
شکل4-3: رابطه میان تعداد تماس، جمعیت و اعتبار مصوب عمرانی 69
شکل4-4 بررسی نه عامل اول در خوشه بندی 73
شکل4-5 بررسی نه عامل دوم در خوشه بندی 74
.شکل 4-6 بررسی هفت عامل آخر در خوشه بندی 75
شکل 4-7 اعضای خوشه های اول و دوم 76
شکل 4-8 : آنالیز مدل خطی تعمیم یافته 81
شکل 4-9: نمودار صعود 81
شکل 4-10: مدل شبکه عصبی 83
شکل 4-11: آنالیز مدل شبکه عصبی 84
شکل 5-1 : رابطه میان تعداد تماس، جمعیت و اعتبار مصوب عمرانی 93
شکل 5-2 اعضای خوشه اول و دوم 94