تکنیک استاندارد پالایش گروهی در عین حال سادگی، بسیار موثر عمل می کند اما دارای نقاط ضعفی نیز هست. پالایش گروهی در واقع نمونه ای از الگوریتم یادگیرنده مبتنی بر نمونه می باشد که این الگوریتمها به لحاظ محاسباتی خصوصا در زمان پرسوجو دارای هزینه بسیار بالایی میباشند زیرا نیازمند این مطلب هستند که پروفایل تمام کاربران را جهت یافتن بهترین همسایگان جستجو نمایند. این مشکل باعث میگردد تا نتوان از این تکنیکها در محیطهایی با میلیونها کاربر و آیتم استفاده کرد، همچنین به دلیل کند بودن این مرحله معمولا نمی توان از این تکنیکها در سیستمهای توصیهگر برخط استفاده نمود و باید در بازه های زمانی به صورت برونخط مورد استفاده قرار گیرند. با توجه به مطلب بیان شده سیستم توصیهگر مبتنی بر تکنیک پالایش گروهی بروز نمی باشد و نظرات جدید کاربران بلافاصله مورد پردازش قرار نمیگیرد و تاثیرات آنها در فازهای بعدی نمایان خواهد شد.
محاسبه تشابه کاربران با یکدیگر بر اساس آیتم های مشترک، یکی دیگر از کارهایی است که دقت کل سیستم با آن وابستگی مستقیم دارد و ضعف در جستجوی همسایگان باعث کاهش کیفیت سیستم توصیهگر می شود اما در اکثر مواقع بخاطر نقص ماتریس امتیازات و عدم تمایل کاربران به امتیاز دهی به هزارها و بلکه میلیونها آیتم، باعث میگردد تا دو کاربر، دارای اشتراک اندکی در امتیازدهی به آیتمهای یکسان و مشابه باشند که این امر محاسبه تشابه کاربران با یکدیگر را با مشکل مواجه می کند. معمولا مشکل بیان شده برای کاربرانی که به تعداد زیادی آیتم امتیاز دادهاند رخ نمیدهد بلکه کاربرانی که دارای تعداد اندکی امتیاز دهی میباشند سیستم توصیهگر مبتنی بر روش پالایش گروهی را با مشکل مواجه می کنند.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
۲-۷- معیارهای ارزیابی[۷۷] سیستمهای توصیهگر
جهت ارزیابی کیفیت یک سیستم توصیهگر میتوان نتایج تولیدی آنرا با نتایج موجود از نظرات کاربران در خصوص آیتمهای مختلف مقایسه نمود و بر اساس خطای موجود میان مقادیر پیش بینی شده و نظرات واقعی کاربران، دقت سیستم را مشخص نمود[۴۸][۳۹][۲۲].
۲-۷-۱- خطای جذر میانگین مربعات (RMSE)[78]
متداولترین روش ارزیابی یک سیستم توصیهگر استفاده از معیار “خطای مطلق میانگین[۷۹]“میباشد که به صورت میانگین قدر مطلق تفاضل امتیاز پیش بینی شده توسط سیستم و امتیاز واقعی در قالب فرمول شماره ۷ محاسبه میگردد.
(۷) |
در فرمول فوق مقدار امتیاز پیش بینی شده توسط سیستم برای کاربر u و آیتم i میباشد و مقدار واقعی امتیاز کاربر u به آیتم i میباشد و N تعداد ردیفهای مجموعه مورد ارزیابی میباشد.
یکی دیگر از معیارهای ارزیابی مرتبط با معیار خطای مطلق میانگین معیار “خطای جذر میانگین مربعات"میباشد[۴۹][۵۰] که درآن تاکید بیشتری بر روی مقادیر بزرگتر خطای مطلق وجود دارد. نحوه محاسبه این نوع خطا مطابق فرمول شماره ۸ میباشد.
(۸) |
در فرمول فوق ، متغیری دوحالته است که نشان دهنده این مطلب است که دردادههای موجود، آیا به آیتم i توسط کاربر u امتیاز داده شده است یا خیر. هرچه که مقدارRMSE کمتر باشد نشان دهنده دقت بالاتر نتایج سیستم توصیهگر میباشد.
۲-۷-۲- معیار درصد پوشش[۸۰]
یکی دیگر از معیارهای ارزیابی سیستمهای توصیهگر معیار “درصد پوشش” میباشد که اندازه آن بیانگر درصد زوجهای<آیتم،کاربر> موجود در داده های مورد ارزیابی که سیستم توصیهگر می تواند برای آنها امتیازی پیش بینی نماید به تعداد کل زوجهای <آیتم،کاربر> موجود در مجموعه داده مورد ارزیابی میباشد .
(۹) |
۲-۷-۳- معیار دقت[۸۱]
این معیار دارای مقادیری در بازه ]۱,۰[ می باشد و بیانگر میزان وجود خطا میباشد. مقدار صفر بیانگر وجود خطای مطلق و مقدار یک بیانگر عدم وجود خطا میباشد لذا با فرض اینکه نتایج خروجی سیستم توصیهگر عددی صحیح در بازه ]۵,۱[ میباشد میتوان مقدار معیار دقت را در قالب فرمول ذیل تعریف نمود[۴۸].
(۱۰) |
عدد ۴ در مخرج کسر فرمول فوق بیانگر حداکثر میزان خطای موجود (۱-۵=۴)میباشد.
۲-۷-۴- معیار F-Measure
برای ترکیب معیارهای درصد پوشش وخطای جذر میانگین مربعات در قالب یک معیار، F-Measure محاسبه میگردد اما برای اینکار باید خطای جذر میانگین مربعات به معیار دقت که در بالا معرفی گردید تبدیل و بر اساس عددی در بازه ]۱,۰[ نمایش داده شود. بنابراین فرمول F-Measure به صورت زیر تعریف میگردد[۲۰] :