ارائه مدلی برای شناسایی عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکتهای بیمه بوسیله روشهای داده کاوی مطالعه موردی شرکت سهامی بیمه ایران

استاد راهنما:

دکترغلامحسین دستغیبی فرد

برای رعایت حریم خصوصی نام نگارنده درج نمی گردد

تکه هایی از متن به عنوان نمونه :

فهرست مطالب:

فصل اول: مقدمه

1-1 تعریف داده کاوی……………………………. 3

1-2 تعریف بیمه………………………….. 4

1-3 هدف پایان نامه………………………….. 4

1-4 مراحل انجام پژوهش…………………………… 4

1-5 ساختار پایان نامه………………………….. 5

فصل دوم: ادبیات موضوع و تحقیقات پیشین

2-1 داده کاوی و یادگیری ماشین………………………….. 7

2-2 ابزارها و تکنیک های داده کاوی…………………………… 8

2-3 روشهای داده کاوی…………………………… 9

2-3-1 روشهای توصیف داده ها…………………………. 10

2-3-2 روشهای تجزیه و تحلیل وابستگی…………………………. 10

2-3-3 روشهای دسته بندی و پیشگویی…………………………… 10

2-3-4 درخت تصمیم………………………….. 11

2-3-5 شبکه عصبی…………………………… 12

2-3-6 استدلال مبتنی بر حافظه………………………….. 12

2-3-7 ماشین های بردار پشتیبانی…………………………… 13

2-3-8 روشهای خوشه بندی…………………………. 13

2-3-9 روش K-Means………………………….

2-3-10 شبکه کوهنن…………………………… 14

2-3-11 روش دو گام………………………….. 14

2-3-12 روشهای تجزیه و تحلیل نویز………………………….. 14

2-4 دسته های نامتعادل[صنیعی آباده 1391]…………………………. 15

2-4-1 راهکار مبتنی بر معیار…………………………. 15

2-4-2 راهکار مبتنی بر نمونه برداری…………………………… 15

2-5 پیشینه پژوهش…………………………… 16 جستجو در سایت :   

2-6 اختصار فصل………………………….. 19

فصل سوم: تبیین پژوهش

3-1 انتخاب نرم افزار 21………………………….

3-1-1 Rapidminer………………………….

3-1-2 مقایسه RapidMiner  با سایر نرم افزار های مشابه……………… 21

3-2 داده ها ………………………….25

3-2-1 انتخاب داده…………………………. 25

3-2-2 فیلدهای مجموعه داده صدور ………………………….25

3-2-3 کاهش ابعاد………………………….. 25

3-2-4 فیلدهای مجموعه داده خسارت…………………………… 29

3-2-5 پاکسازی داده ها…………………………. 29

3-2-6 رسیدگی به داده های از دست رفته………………………….. 29

3-2-7 کشف داده دور افتاده ………………………….30

3-2-8 انبوهش داده………………………….32

3-2-9 ایجاد ویژگی دسته………………………….. 32

3-2-10 تبدیل داده ………………………….32

3-2-11 انتقال داده به محیط داده کاوی…………………………… 32

3-2-12 انواع داده تعیین شده ………………………….33

3-2-13 عملیات انتخاب ویژگیهای موثرتر………………………….. 34

3-3 نتایج اعمال الگوریتم PCA و الگوریتم های وزن دهی………….. 34

3-4 ویژگی های منتخب جهت بهره گیری در الگوریتمهای حساس به تعداد ویژگی……. 36

3-5 معیارهای ارزیابی الگوریتمهای دسته بندی…………………………… 37

3-6 ماتریس درهم ریختگی…………………………… 37

3-7 معیار AUC…………………………..

3-8 روشهای ارزیابی الگوریتم های دسته بندی…………………………… 39

3-8-1 روش Holdout………………………….

3-8-2 روش Random Subsampling…………………………..

3-8-3 روش Cross-Validation…………………………..

3-8-4 روش Bootstrap…………………………..

3-9 الگوریتمهای دسته بندی…………………………… 41

3-9-1 الگوریتم KNN……………………………

3-9-2 الگوریتم Naïve Bayes………………………….

3-9-3 الگوریتم Neural Network…………………………..

3-9-4 الگوریتم SVM خطی…………………………… 45

3-9-5 الگوریتم   رگرسیون لجستیک…………………………… 46

3-9-6 الگوریتم   Meta Decision Tree…………………………..

3-9-7 الگوریتم درخت Wj48…………………………..

3-9-8 الگوریتم درخت Random forest………………………….

3-10 معیارهای ارزیابی الگوریتم های مبتنی بر قانون(کشف قوانین انجمنی)…… 54

3-10-1 الگوریتم FPgrowth…………………………..

3-10-2 الگوریتم Weka Apriori………………………….

3-11 معیارهای ارزیابی الگوریتمهای خوشه بندی…….. 55

3-12 الگوریتم های خوشه بندی…………………………… 57

3-12-1 الگوریتم K-Means………………………….

3-12-2 الگوریتم Kohonen…………………………..

3-12-3 الگوریتم دوگامی…………………………… 64

فصل چهارم: ارزیابی و نتیجه گیری

4-1 مقایسه نتایج………………………….. 69

4-2 الگوریتمهای دسته بندی…………………………… 69

4-3 الگوریتم های دسته بندی درخت تصمیم………………………….. 70

4-4 الگوریتم های خوشه بندی…………………………… 79

4-5 الگوریتم های قواعد تلازمی(مبتنی بر قانون)…………………………. 81

4-6 پیشنهادات به شرکت های بیمه………………………….. 81

4-7 پیشنهادات جهت ادامه کار…………………………. 83

منابع و مأخذ

فهرست منابع فارسی…………………………… 84

فهرست منابع انگلیسی…………………………… 85

چکیده:

مطالعه اطلاعات بیمه های اتومبیل نشان داده عواملی زیرا نوع بهره گیری خودرو، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، مبلغ حق بیمه، اندازه تعهدات بیمه نامه، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه، تاخیردرتمدید بیمه نامه، در سود و زیان شرکت های بیمه تاثیر داشته اند.

هدف این پایان نامه شناخت عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکت های بیمه با بهره گیری از روش داده کاوی و سپس انتخاب الگوریتمی که بهترین اندازه دقت پیش بینی برای تشخیص این عوامل را داشته اند می باشد.

نتیجه حاصل از این پژوهش نشان می دهد که روشهای داده کاوی با بهره گیری از الگوریتم های دسته بندی با دقت بالای 91% و الگوریتم های درخت تصمیم با دقت بالای 96% و الگوریتم های خوشه بندی با ایجاد خوشه های قابل قبول قادر به ارائه مدلی برای تشخیص عوامل اثرگذار و تعیین اندازه اثر آنها در سود و زیان بیمه نامه شخص ثالث خودرو خواهند بود.

فصل اول

مقدمه:

شرکتهای تجاری و بازرگانی برای ادامه بقا و حفظ بازار همواره بر سود دهی و کاهش ضرر و زیان خود تاکید دارند از این رو روشهای جذب مشتری و همچنین تکنیکهای جلوگیری یا کاهش زیان در سرلوحه کاری این شرکتها قرار می گیرد.

مانند شرکتهایی که بدلایل مختلف در معرض کاهش سود و یا افزایش زیان قرار می گیرند شرکتهای بیمه ای می باشند. عواملی همچون بازاریابی، وفاداری مشتریان، نرخ حق بیمه، تبلیغات، تقلب، می تواند باعث جذب یا دفع مشتری گردد که در سود و زیان تاثیر مستقیم و غیر مستقیم دارد.

پرداخت خسارت نیز به عنوان تعهد شرکتهای بیمه منجر به کاهش سود و در بعضی موردها موجب زیان یک شرکت بیمه می گردد. خسارت می تواند بدلایل مختلف رخ دهد و یا عملی دیگر به گونه ای خسارت جلوه داده گردد که در واقع اینچنین نیست[Derrig et. al 2006].

عواملی از قبیل فرهنگ رانندگی، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، جاده های بین شهری و خیابانهای داخل شهر که شهرداری ها و ادارات راه را به چالش می کشد، تقلب، وضعیت آب و هوا، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه [Wilson 2003]، روزهای تعطیل، مسافرتها و بسیاری موردها دیگر می توانند موجب خسارت و در نهایت افزایش زیان یک شرکت بیمه ای گردند.

بیمه صنعتی سودمند، ضروری و مؤثر در توسعه اقتصادی می باشد. این صنعت بدلیل «افزایش امنیت در عرصه های مختلف زندگی و فعالیتهای اقتصادی»، «افزایش سرمایه گذاری و اشتغال و رشد اقتصادی» و « ارتقای عدالت اقتصادی و کاهش فقر ناشی از مخاطرات »، حائز جایگاه مهمی در پیشرفت و تعالی یک کشور می باشد.

با وجود تأثیر مهم بیمه در بسترسازی و تأمین شرایط مساعد اقتصادی، وضعیت کنونی این صنعت در اقتصاد ملی با وضعیت مطلوب آن فاصله زیادی دارد. عدم آشنایی عمومی و کم بودن تقاضا برای محصولات بیمه ای، دانش فنی پایین در عرصه خدمات بیمه ای، عدم تطابق ریسک با حق بیمه، تفاوت فاحش در مقایسه معیارهای تشخیص ریسک بیمه شخص ثالث با نوع بیمه معادل در کشورهای توسعه یافته، وجود نارسایی ها در مدیریت واحدهای عرضه بیمه از علت های عدم توسعه مناسب این صنعت در کشور می باشد. از آنجا که بشر در طول تاریخ به کمک علم و تجربه رستگاری ها و توفیقات فراوانی کسب کرده می باشد، نگاه علمی تر به معضلات این صنعت و یافتن راه حل در بستر علم می تواند راه گشا باشد.
دانلود متن کامل در سایت sabzfile.com
امروزه بوسیله روشهای داده کاوی ارتباط بین فاکتورهای مختلف موثر یا غیر موثر در یک موضوع مشخص می گردد و با در نظر داشتن اینکه داده کاوی ابزاری مفید در استخراج دانش از داده های انبوه می باشد که ارتباطات نهفته بین آنها را نشان می دهد، شرکتهای تجاری بازرگانی رو به این تکنیکها آورده اند.

داده کاوی محدود به بهره گیری از فناوری ها نیست و از هرآنچه که برایش مفید واقع گردد بهره گیری خواهد نمود. با این تفاصیل آمار و کامپیوتر پر بهره گیری ترین علوم و فناوری های مورد بهره گیری داده کاوی می باشد.

1-1- تعریف داده کاوی

داده کاوی طریقه کشف قوانین و دانش ناشناخته و مفید از انبوه داده ها و پایگاه داده می باشد[ Liu et. al 2012].

انجام اقدام داده کاوی نیز مانند هر اقدام دیگری مراحل خاص خود را دارد که به تبیین زیر می باشند:

1-جدا سازی داده مفید از داده بیگانه

2-یکپارچه سازی داده های مختلف تحت یک قالب واحد

3-انتخاب داده لازم از میان دیگر داده ها

4- انتقال داده به محیط داده کاوی جهت اکتشاف قوانین

5-ایجاد مدلها و الگوهای مرتبط بوسیله روشهای داده کاوی

6-ارزیابی مدل و الگوهای ایجاد شده جهت تشخیص مفید بودن آنها

7-انتشار دانش استخراج شده به کاربران نهایی

2-1- تعریف بیمه

بیمه: بیمه عقدی می باشد که به موجب آن یک طرف تعهد می کند در ازاء پرداخت وجه یا وجوهی از طرف دیگر در صورت وقوع یا بروز حادثه خسارت وارده بر او را جبران نموده یا وجه معینی بپردازد. متعهد را بیمه گر طرف تعهد را بیمه گذار وجهی را که بیمه گذار به بیمه گر می پردازد حق بیمه و آن چیز که را که بیمه می گردد موضوع بیمه نامند]ماده یک قانون بیمه مصوب 7/2/1316[.

3-1- هدف پایان نامه

در این پژوهش کوشش شده می باشد با بهره گیری از تکنیکهای داده کاوی اقدام به   شناسایی فاکتورهای تاثیر گذار در سود و زیان بیمه شخص ثالث خودرو شرکتهای بیمه نموده و ضریب تاثیر آنها را مطالعه نماییم. الگوریتم های بهره گیری شده در این پژوهش شامل دسته بند ها، خوشه بند ها، درخت های تصمیم و قوانین انجمنی بوده می باشد.

4-1- مراحل انجام پژوهش

در این پایان نامه با بهره گیری از روشهای داده کاوی با بهره گیری از بخشی از داده های صدور و خسارت یک سال شرکت بیمه مدل شده و از روی آنها یک الگو ساخته می گردد. در واقع به این طریق به الگوریتم یاد داده می گردد که ارتباطات بین داده ها، منجر به چه نتایجی می گردد. سپس بخشی از داده ها که در مرحله قبل از آن بهره گیری نشده بود به مدل ایجاد شده داده می گردد ونتایج توسط معیارهای علمی مورد ارزیابی قرار میگیرند. بمنظور آزمایش عملکرد می توان داده های دیگری به مدل داده گردد و نتایج حاصله با نتایج واقعی موجود مقایسه شوند.

5-1- ساختار پایان نامه

این پایان نامه شامل چهارفصل خواهد بود که فصل اول شامل یک مقدمه و ضرورت پژوهش انجام شده و هدف این پژوهش می باشد. در فصل دوم بعضی تکنیک های داده کاوی و روشهای آن مطرح و تحقیقاتی که قبلا در این زمینه انجام شده مورد مطالعه قرار می گیرند. در فصل سوم به تبیین مفصل پژوهش انجام شده و نرم افزار داده کاوی مورد بهره گیری در این پایان نامه می پردازیم  و با کمک تکنیک های داده کاوی مدل هایی ارائه می گردد و مدلهای ارائه شده درهرگروه با یکدیگر مقایسه شده و بهترین مدل از میان آنها انتخاب می گردد. در فصل چهارم مسائل مطرح شده جمع بندی شده و نتایج حاصله مطرح خواهند گردید و سپس تغییراتی که در آینده در این زمینه می توان انجام داد پیشنهاد می شوند.

***ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود می باشد***

متن کامل را می توانید دانلود نمائید

این مطلب رو هم توصیه می کنم بخونین:   دانلود پابان نامه ارشدرشته کامپیوتر:بررسی تجارت الکتزونیک در صنعت بیمه

زیرا فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به گونه نمونه)

اما در فایل دانلودی متن کامل پایان نامه

 با فرمت ورد word که قابل ویرایش و کپی کردن می باشند

موجود می باشد

تعداد صفحه : 106

قیمت : 14700 تومان

 

***

—-

پشتیبانی سایت :       

****         serderehi@gmail.com