پایان نامه کارشناسی ارشد رشته: مهندسی کامپیوتر گرایش:

نرم‌افزار

 

عنوان پایان­نامه

بهینه سازی خوشه ها با بهره گیری از الگوریتم های تکاملی برای شخصی سازی وب

 

استاد راهنما

دکتر محمد کریم سهرابی

 

استاد مشاور

دکتر فرزین یغمایی

برای رعایت حریم خصوصی نام نگارنده درج نمی گردد

تکه هایی از متن به عنوان نمونه :

 

فهرست مطالب

عنوان                                                                                                           صفحه

چکیده…………………………………………………………………………………………………………………….. 1

فصل اول…………………………………………………………………………………………….. 2

1-1-مقدمه………………………………………………………………………………………………………………. 3

1-2-تعریف مسئله………………………………………………………………………………………………………. 4 جستجو در سایت :   

1-3-اهمیت و ضرورت پژوهش…………………………………………………………………………………………. 5

1-4-شیوه پژوهش………………………………………………………………………………………………………. 8

1-5-چارچوب پایان‏نامه……………………………………………………………………………………………….. 8

مراجع…………………………………………………………………………………………………………………….. 10

فصل دوم:………………………………………………………………………………………….. 11

2-1-مقدمه……………………………………………………………………………………………………………… 12

2-2-مروی بر کارهای انجام شده……………………………………………………………………………………. 12

مراجع……………………………………………………………………………………………………………………. 21

فصل سوم:………………………………………………………………………………………… 24

3-1-مقدمه…………………………………………………………………………………………………………….. 25

3-2-مراحل وب کاوی………………………………………………………………………………………………… 26

3-2-1-انواع وب‌کاوی……………………………………………………………………………………………. 27

3-3-شخصی‌سازی وب………………………………………………………………………………………………. 28

3-3-1-علت های نیاز به شخصی‌سازی وب……………………………………………………………………….. 28

3-3-2-مراحل شخصی سازی وب……………………………………………………………………………… 29

3-3-2-1-جمع‌آوری داده…………………………………………………………………………………… 30

3-3-2-2-پردازش داده……………………………………………………………………………………… 31

3-3-2-3-کشف الگو………………………………………………………………………………………… 31

3-3-2-4-تحلیل دانش……………………………………………………………………………………… 31

3-3-3-تکنیک های مدل­سازی کاربر در شخصی‌سازی وب………………………………………………… 31

3-3-3-1-تکنیک tf-idf……………………………………………………………………………………. 32

3-3-3-2-تکنیک متا مدل و ابزار OLAP……………………………………………………………….. 32

3-3-3-3-تکنیک براساس محتوای وب…………………………………………………………………. 33

3-3-3-4-تکنیک براساس فراهم کردن داده‌های موثر (ODP)……………………………………….. 34

3-3-3-5-شخصی­سازی وب با بهره گیری از روش­های ترکیبی………………………………………….. 34

3-3-3-6-شخصی­سازی وب براساس الگوریتم استقرایی و تکنولوژی tf-idf……………………….. 35

3-3-3-7-شخصی­سازی وب با بهره گیری از کندوکاو الگوی ترتیبی و درخت الگو……………………. 35

3-4-خوشه‌بندی برای شخصی‌سازی وب………………………………………………………………………….. 35

3-4-1-خوشه­بندی فازی………………………………………………………………………………………… 36

3-4-1-1-الگوریتم پایه‌ای خوشه‌بندی فازی……………………………………………………………… 36

3-4-1-2-الگوریتم فازی کا-مینز…………………………………………………………………………. 36

3-4-1-3-خوشه­بندی صفحات وب با بهره گیری از خوشه­بندی فازی k-means………………………. 37

3-4-2-الگوریتم ژنتیک…………………………………………………………………………………………. 39

3-4-2-1-بهینه‌سازی خوشه‌بندی فازی با بهره گیری از الگوریتم ژنتیک……………………………….. 40

3-4-3-روش پیشنهادی در این پژوهش……………………………………………………………………….. 42

3-4-4-شمای کلی سیستم پیشنهادی………………………………………………………………………… 42

3-4-5-مثالی از سیستم پیشنهادی…………………………………………………………………………… 43

3-4-6-شبه کد روش پیشنهادی……………………………………………………………………………….. 50

3-5-جمع­بندی……………………………………………………………………………………………………….. 51

مراجع…………………………………………………………………………………………………………………… 53

فصل چهارم:………………………………………………………………………………………. 55

4-1-مقدمه…………………………………………………………………………………………………………….. 56
دانلود متن کامل در سایت sabzfile.com
4-2-مجموعه داده­ها…………………………………………………………………………………………………. 56

4-2-1-دیتاست YANDEX……………………………………………………………………………………. 57

4-2-1-1-پیش پردازش انجام شده با مجموعه داده­های خام قبل از انتشار………………………….. 57

4-3-پارامترهای ارزیابی……………………………………………………………………………………………… 60

4-4-آزمایشات انجام شده…………………………………………………………………………………………… 61

4-4-1-سخت افزار مورد بهره گیری……………………………………………………………………………….. 62

4-4-2-نتایج آزمایشات…………………………………………………………………………………………. 62

4-5-جمع­بندی……………………………………………………………………………………………………….. 64

مراجع:…………………………………………………………………………………………………………………… 65

فصل پنجم:………………………………………………………………………………………… 66

5-1-مقدمه…………………………………………………………………………………………………………….. 67

5-2-نتایج و دستاوردهای پروژه……………………………………………………………………………………. 68

5-3-پیشنهادات……………………………………………………………………………………………………… 68

مراجع……………………………………………………………………………………………………………………. 70

 

 فهرست اشکال

 شکل 3- 1: فرآیند شخصی‌سازی وب.. 29

شکل 3-2: مجموعه داده پروانه‌ای. 38

شکل 3-3:خوشه بندی فازی داده. 39

شکل 3-4:  مراحل اصلی الگوریتم ژنتیک. 40

شکل 3-5: شمای کلی سیستم پیشنهادی.. 42

شکل 3-6: خوشه­بندی داده­های آموزشی.. 47

شکل 3-7: خوشه­بندی داده­های تست.. 49

شکل 4-8: مقایسه روش‌های پیشنهادی با روش ارائه شده در (Varghese, & John, 2012). 64

 

 

فهرست جداول

جدول4-1: نتایج آزمایشات انجام شده بر روی 100 جلسه‌ی تصادفی.. 62

جدول4-2: مقایسه نتایج سیستم پیشنهادی با سایر روش‌ها 62

جدول 4-3: مقایسه نتایج سیستم پیشنهادی با روش ارائه شده در (Varghese, & John, 2012). 63

 

 

چکیده

گرانبار شدن اطلاعات یک مشکل عمده در وب کنونی به شمار می­رود. برای مقابله با این مشکل، سیستم‌های شخصی­سازی وب ارائه شده­اند که محتوا و سرویس­های یک وب­سایت را با افراد براساس علایق و رفتار گردشی آن­ها سازگار می­کنند. یک مؤلفه­ی اساسی در هر سیستم شخصی­سازی وب، مدل کاربر آن می باشد. هدف از شخصی سازی وب، مهیا ساختن محتوا و سرویس­های مورد نیاز کاربران به وسیله دانش به دست آمده از تعاملات قبلی کاربران در صفحات وب می باشد. در حال حاضر، برای شخصی­سازی وب چندین متد خوشه­بندی در دسترس می باشد. روش­هایی که تاکنون ارائه شده­اند، در مورد هایی دارای اشکالاتی بودند. البته تکنیک­های جدیدی در رفع این معضلات و بهبود آنها ارائه شده می باشد. اما در بیشتر این تکنیک­ها، مسائل افزونگی داده و مقیاس­بندی بالا هست. با در نظر داشتن اینکه افزایش کاربران وب منجر به افزایش اندازه‌ی خوشه می‌گرد، نیاز به بهینه‌سازی خوشه‌ها اجتناب‌ناپذیر خواهد بود. در پژوهش، یک متدولوژی بهینه­سازی خوشه بر اساس سیستم فازی ارائه شده می باشد. به مقصود افزایش دقت نهایی خوشه­بندی، برای تنظیم پارامترهای توابع عضویت از الگوریتم ژنتیک بهره گیری شده می باشد. نتایج حاصل از شبیه‌سازی نشان می‌دهد که روش پیشنهادی دقت خوشه­بندی صفحات وب را تا حد قابل توجهی افزایش می­دهد.

این مطلب رو هم توصیه می کنم بخونین:   پایان نامه ارشد نرم افزار کامپیوتر: بهبود مسیریابی داده های حساس به تاخیر در شبکه های حسگر بیسیم

کلید واژه­ها: شخصی­سازی صفحات وب- خوشه­بندی- کاربرد وب­کاوی- الگوریتم فازی سی مینز- پایگاه داده یاندکس.

 

 

 

1-1- مقدمه

با توسعه سیستم‌های اطلاعاتی، داده به یکی از منابع پراهمیت سازمان‌ها مبدل گشته می باشد. پس روش‌ها و تکنیک‌هایی برای دستیابی کارا به داده، اشتراک داده، استخراج اطلاعات از داده و بهره گیری از این اطلاعات، مورد نیاز می‌باشد. با ایجاد و گسترش وب و افزایش چشمگیر حجم اطلاعات، نیاز به این روش‌ها و تکنیک‌ها بیش از پیش احساس می گردد. وب، محیطی وسیع، متنوع و پویا می باشد که کاربران متعدد اسناد خود را در آن منتشر می‌کنند. در حال حاضر بیش از دو بیلیون صفحه در وب موجود می باشد و این تعداد با نرخ 7.3 میلیون صفحه در روز افزایش می‌یابد. با در نظر داشتن حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریباً غیر ممکن می باشد و ابزارها و روش­هایی نو برای مدیریت آن مورد نیاز می باشد. به گونه کلی کاربران وب در بهره گیری از آن با معضلات زیر روبرو هستند:

  1. یافتن اطلاعات مرتبط: یافتن اطلاعات مورد نیاز در وب دشوار می‌باشد. روش‌های سنتی بازیابی اطلاعات که برای جستجوی اطلاعات در پایگاه داده‌ها به کار می‌طریقه، قابل بهره گیری در وب نمی‌باشند و کاربران معمولاً از موتورهای جستجو که مهم­ترین و رایج ترین ابزار برای یافتن اطلاعات در وب می باشند، بهره گیری می‌کنند. این موتورها، یک پرس و جوی مبتنی بر کلمات کلیدی از کاربر دریافت کرده و در پاسخ لیستی از اسناد مرتبط با پرس و جوی وی را که بر اساس اندازه ارتباط با این پرس و جو مرتب شده اند، به وی ارائه می­کنند. اما موتورهای جستجو دارای دو مشکل اصلی هستند (Baeza-Yates, 2004). اولاً دقت موتورهای جستجو پایین می باشد، چراکه این موتورها در پاسخ به یک پرس و جوی کاربر صدها یا هزاران سند را بازیابی می‌کنند، در حالی که بسیاری از اسناد بازیابی شده توسط آنها با نیاز اطلاعاتی کاربر مرتبط نمی‌باشند (Bharat, and et. al., 2001). ثانیاً اندازه فراخوان این موتورها کم می‌باشد، به آن معنی که قادر به بازیابی کلیه اسناد مرتبط با نیاز اطلاعاتی کاربر نیستند. زیرا که حجم اسناد در وب بسیار زیاد می باشد و موتورهای جستجو قادر به نگهداری اطلاعات کلیه اسناد وب، در پایگاه داده‌های خود نمی‌باشند (Chakrabarti, and et. al., 1999).
  2. ایجاد دانش جدید با بهره گیری از اطلاعات موجود در وب: در حال حاضر این سوال مطرح می باشد که چگونه می‌توان داده‌های فراوان موجود در وب را به دانشی قابل بهره گیری تبدیل نمود، به طوری که یافتن اطلاعات مورد نیاز در آن به سادگی صورت بگیرد. همچنین چگونه می‌توان با بهره گیری از داده‌های وب به اطلاعات و دانشی جدید دست پیدا نمود.
  3. خصوصی سازی اطلاعات: از آن جا که کاربران متفاوت هر یک درمورد نوع و چگونگی­ی بازنمایی اطلاعات سلیقه خاصی دارند، این مسئله بایستی توسط تأمین­کنندگان اطلاعات در وب مورد توجه قرار بگیرد. برای این مقصود با در نظر داشتن خواسته‌ها و تمایلات کاربران متفاوت، چگونگی ارائه اطلاعات به آنها بایستی سفارشی گردد.

تکنیک‌های وب کاوی قادر به حل این معضلات می‌باشند (Chakrabarti, 2000).

 

***ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود می باشد***

متن کامل را می توانید دانلود نمائید

زیرا فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به گونه نمونه)

اما در فایل دانلودی متن کامل پایان نامه

 با فرمت ورد word که قابل ویرایش و کپی کردن می باشند

موجود می باشد

تعداد صفحه : 82

قیمت : 14700 تومان

 

 

***

—-

پشتیبانی سایت :       

****         serderehi@gmail.com