(ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل می باشد)

مقدمه

آن چیز که که بین تمام علوم مشترک می باشد، حجم وسیعی از اطلاعات و داده به شکل­های مختلف می باشد، که همراه با پیشرفت و وسعت علوم بزرگتر و ارزشمندتر می­گردد. با رشد سریع علوم کامپیوتر و بهره گیری از آن در چند دهه اخیر، تقریبا همه سازمان­ها در پروژه­های مختلف خود حجم عظیمی داده در پایگاه­های داده ذخیره می­کنند. این سازمان­ها و کسانی که به نوعی در پروژه­ها سهیم هستند به فهم این داده­ها و بهتر بگوییم کشف دانش نهفته در آن نیازمندند. این نیاز، باعث به­وجود آمدن حوزه جدید میان رشته­ای کشف دانش و داده­کاوی[1] شده می باشد، که حوزه­های مختلف همچون پایگاه داده، آمار، یادگیری ماشین را برای کشف دانش ارزشمند نهفته در اطلاعات و داده­ها را با هم تلفیق می­کند. اصطلاح Data­ Mining همان­گونه که از ترجمه آن به معنی داده­کاوی مشخص می گردد، به مفهوم استخراج اطلاعات نهان، و یا الگوها وروابط مشخص در حجم زیادی از داده‌ها در یک یا چند بانک اطلاعاتی بزرگ می باشد.

هر نرم­افزار در طول فرآیند­تولید و پس از آن، انبوهی از اطلاعات ­و مستندات دارد که قابل کاوش و بهره گیری­ مفید می باشد. این داده­ها معمولا در پایگاه­ داده­هایی به­نام مخازن نرم­افزاری[2] ذخیره و نگهداری می­شوند. مخازن نرم­افزاری نمایش دقیقی از مسیر­تولید یک سیستم ­نرم­افزاری ارائه می­دهند]1 .[هدف ازکاوش مخازن نرم­افزاری[3]MSR بهره گیری هوشمند از تحلیل داده­های نهفته در آن­ها برای کمک به تصمیم­گیری های بهتر و سریعتر در پروژه تولید و پشتیبانی آن­ها می باشد. آن­چه که در اینجا مورد توجه این پژوهش می باشد، استخراج اطلاعات مهم برای همه ذینفعان پروژه نرم­افزاری می باشد. این اطلاعات از مجموعه داده­های مرتبط با خطا­های رخ داده در طول تولید و پشتیبانی پروژه استخراج می گردد.

در سال­های گذشته مدل­های مختلفی با بهره گیری از الگوریتم­های داده­کاوی، تشابه متن و دسته­بندی و خوشه­بندی داده­ها ارائه شده. اما از آن­جا که جستجو و استخراج اطلاعات از میان داده­های متنی نیازمند روشی هوشمند برای تطبیق جنبه­های معنایی و دستوری می باشد، نیاز به مدل­هایی که از الگوریتم­ها معنایی بهره گیری­کنند هست.در پژوهش­های مورد مطالعه این نیاز حس می­گردد. دانلود متن کامل در سایت sabzfile.com

 

 

 

کوشش بر این شده که با بهره گیری از الگوریتم معنایی برپایه مجموعه تشابه جملات[4]بر پایه LCS[5]]3[ و تشابه کلمات (SOC-PMI[6] )]3[، روی مستندات ذخیره­ شده در مخازن خطای نرم­افزار، مانند راه­حل­های ارائه ­شده برای خطا­های مشابه مدل­های قبلی را تکمیل­کرده و جوابی بهینه و سریع­تر برای خطای پیش آمده پیدا کنیم. همچنین می­توان زمانی تخمینی نیز برای تصحیح خطا پیش­بینی نمود تا راهنمای تیم توسعه و ذینفعان دیگر نرم­افزار باشد. همچنین دید بهتری نسبت به طریقه پیشرفت و تکامل نرم­افزار مورد نظر ارائه ­گردد.

 

2.1. تعریف مسئله

یکی ­از مراحل مهم و اساسی در مهندسی ­و تولید نرم­افزار مرحله یافتن و رفع خطا­های موجود در نرم­افزار می باشد. این مرحله از تولید نرم­افزار جزء وقت­گیرترین و پرهزینه ­ترین مراحل به­ حساب  می­آید]4[. سال­هاست که دانش داده­کاوی و استخراج دانش به کمک مهندسین نرم­افزار آمده­می باشد. رفع خطا در فرآیند تولید بسته به مدل توسعه نرم­افزار چندین بار انجام می­گیرد. خطا­ها و معضلات برطرف ­شده معمولا به روش­های مختلف تحت عنوان مخازن خطای نرم افزار، مستند­سازی و ذخیره می­گردد. این مخازن منابع عظیم دانش هستند، که کمک بزرگی در تسریع زمان تولید نرم­افزار و پایین­آوردن هزینه­ها خواهد­بود]5[. روش­هایی نیاز­می باشد که این دانش و اطلاعات مفید استخراج گردد. در این پژوهش روشی برای سرعت بخشیدن به رفع­خطای جدید با بهره گیری از اطلاعات موجود در مخازن خطای نرم­افزار، ارائه شده­می باشد. مدل­های زیادی تا به­حال ارائه­شده که یا مکمل هم بوده یا از الگوریتم­های جدید بهره گیری شده­می باشد. مدل­های پیشنهادی با بهره گیری از تشابه متن همگی از الگوریتم­های معمولی و ساده بهره گیری کرده اند. در این مدل ها به این نکته مهم کمتر توجه شده که مخازن حجم بالا و پیچیده­ای از اطلاعات را شامل می­شوند، که بعضاً تشابه بین کلمات و معانی مختلف یک جمله نتیجه­گیری را سخت­تر می­کند. پس نیاز به الگوریتم­های معنایی در مطالعه تشابه متن احساس می­گردد. همچنین بایستی به این نکته مهم توجه نمود که الگوریتم معنایی انتخاب ­شده بهینه می باشد و قادر باشد میان این حجم اطلاعات که از سوی کاربران مختلف ثبت می­گردد، بهترین جواب با تشابه بیشتر را انتخاب کند. اگرچه تا به­حال روش­های بسیاری برای تکمیل مخازن خطا و بهره گیری از دانش نهفته در آن صورت­گرفته اما می­توان گفت که ضرورت اهمیت به تشابه معنایی بین داده­ها در نظر گرفته نشده ­می باشد. در این پژوهش کوشش شده که این اشکال در جستجو و بهره­گیری دانش نهفته در این مخازن داده پوشش داده ­گردد.

این مطلب رو هم توصیه می کنم بخونین:   دانلود پابان نامه ارشدرشته کامپیوتر:بررسی تجارت الکتزونیک در صنعت بیمه

مدل ارائه ­شده در اینجا آغاز لیستی از خطا­های مشابه خطای جدید با بهره گیری ازیک الگوریتم تشابه معنایی مناسب، با در نظر داشتن اطلاعات متنی ذخیره­شده ارائه می­دهد. در مرحله بعد این خطا­ها براساس چرخه ­عمر خطا با بهره گیری از روش خوشه­بندی K-means، خوشه بندی می­شوند.

همچنین میانگین تشابه هر دسته به خطای جدید، گروه منتخب را مشخص می کند. خطاهای موجود در این گروه، راه حل­های پیشنهادی برای هر کدام، کمکی برای تسهیل و تسریع در رفع خطا می باشد و میانگین طول­عمر گروه تخمینی بر پیچیدگی و زمان حل­مشکل خواهد بود.
جستجو در سایت :   


تعداد صفحه : 85

قیمت : 14700 تومان

بلافاصله پس از پرداخت لینک دانلود فایل در اختیار شما قرار می گیرد

و در ضمن فایل خریداری شده به ایمیل شما ارسال می گردد.

پشتیبانی سایت :        ****       serderehi@gmail.com

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

***  *** ***