پایان نامه : استفاده ازکاربرانی با دقت پیشگویی بالا در سیستمهای فیلترینگ اشتراکی |
سیستمهای پیشنهادگر ابزارهای نرم افزاری و تکنیکهایی هستند که اقلام را مطابق با نیاز کاربر به او معرفی می کنند. روشهای محتوا محور و فیلترینگ اشتراکی از راهکارهای موفق در سیستمهای پیشنهادگر میباشند. روش محتوا محور بر اساس ویژگیهای اقلام تعریف می شود. این روش بررسی می کند که اقلام مورد علاقه کاربر دارای چه ویژگیهایی بوده اند، سپس اقلام دارای ویژگیهای مشابه را به او پیشنهاد می کند. روش فیلترینگ اشتراکی بر اساس تعیین اقلام مشابه یا کاربران مشابه کار می کند که به ترتیب فیلترینگ اشتراکی مبتنی بر اقلام و مبتنی بر کاربران نامیده می شود. در این پایان نامه یک روش تلفیقی از روشهای فیلترینگ اشتراکی و محتوا محور ارائه شده است. این روش می تواند به عنوان روش فیلترینگ اشتراکی مبتنی بر کاربر در نظر گرفته شود. به این صورت که به منظور یافتن کاربرانی با سلیقه مشابه با کاربر فعال به عنوان کاربرانی با دقت پیشگویی بالا از ویژگیهای مربوط به محتوای اقلام برای افزایش تاثیر امتیازهایی که توسط کاربران به اقلام مشابه تخصیص داده شده است استفاده می کند. به بیان دیگر دو کاربر مشابه هستند در صورتی که امتیازهایی که به اقلامی که از نظر محتوا مشابه هستند نسبت دادهاند، همسان باشند. برای این منظور در هنگام سنجیدن شباهت دو کاربر، به امتیاز نسبت داده شده به هر قلم، با توجه به میزان شباهت آن به قلم هدف، وزن تخصیص مییابد.
فهرست مطالب
عنوان صفحه
فصل 1 : مقدمه……………………………………………………………………………………………………………………………1
1-1- پیشگفتار…………………………………………………………………………………………………………………………….2
1-2- موتورهای جستجوگر…………………………………………………………………………………………………………2
1-2-1- موتورهای جستجوگر پیمایشی……………………………………………………………………………………..3
1-2- 2- فهرستهای تکمیل دستی…………………………………………………………………………………………..3
1-2-3- موتورهای جستجوگر ترکیبی………………………………………………………………………………………..4
1-2-4- ابرجستجوگرها……………………………………………………………………………………………………………….4
1-3- سیستمهای پیشنهادگر……………………………………………………………………………………………………..5
1-3-1- سیستم پیشنهادگر بر اساس فیلترینگ اشتراکی…………………………………………………………7
1-3-2- سیستم پیشنهادگر بر اساس محتوا………………………………………………………………………………8
1-3-3- سیستم پیشنهادگر بر اساس آمار گیری……………………………………………………………………….8
1-3-4- سیستم پیشنهادگر بر اساس سود…………………………………………………………………………………9
1-3-5- سیستم پیشنهادگر بر اساس دانش………………………………………………………………………………9
1-3-6- سیستم پیشنهادگر ترکیبی…………………………………………………………………………………………..9
1-4- بررسی سایت MovieLens…………………………………………………………………………………………..10
1-5- اهداف پایان نامه……………………………………………………………………………………………………………..13
1-6- ساختار پایان نامه…………………………………………………………………………………………………………….14
فصل 2 : روش فیلترینگ اشتراکی……………………………………………………………………………………………15
2-1- پیشگفتار………………………………………………………………………………………………………………………….16
2-2- بر کارهای انجام شده در این راستا……………………………………………………………………..16
2-3- مبانی فیلترینگ اشتراکی………………………………………………………………………………………………..21
2-4- وظایف فیلترینگ اشتراکی…………………………………………………………………………………………….22
2-4-1- پیشنهاد……………………………………………………………………………………………………………………….23
2-4-2- پیشبینی…………………………………………………………………………………………………………………….23
2-5- دسته بندی متدهای فیلترینگ اشتراکی……………………………………………………………………….23
2-5-1- فیلترینگ اشتراکی مبتنی بر حافظه…………………………………………………………………………24
2-5-1-1- فیلترینگ اشتراکی مبتنی بر حافظه با پیش بینی بر اساس کاربران…………………….25
2-5-1-2- فیلترینگ اشتراکی مبتنی بر حافظه با پیش بینی بر اساس اقلام…………………………25
2-5-1- 3- تفاوت فیلترینگ اشتراکی بر اساس کاربران و بر اساس اقلام……………………………..26
2-5-2- فیلترینگ اشتراکی مبتنی بر مدل……………………………………………………………………………..26
2-6- نحوه تشخیص علائق کاربران………………………………………………………………………………………….27
2-6-1- تشخیص علائق به صورت صریح…………………………………………………………………………………27
2-6-2- تشخیص علائق به صورت ضمنی……………………………………………………………………………….27
2-7- محاسبه شباهت……………………………………………………………………………………………………………….28
2-7-1- معیار همبستگی پیرسون……………………………………………………………………………………………28
2-7-2- معیار اندازه گیری کسینوس………………………………………………………………………………………..29
2-8- انتخاب همسایه……………………………………………………………………………………………………………….30
2-8-1- استفاده از حد آستانه………………………………………………………………………………………………….30
2-8-2- انتخاب تعداد ثابتی از همسایگان……………………………………………………………………………….30
2-9- پیش بینی و تخمین رتبه…………………………………………………………………………………………………31
2-9-1- استفاده از امتیازهای خام……………………………………………………………………………………………31
2-9-2- استفاده از امتیازهای نرمال شده………………………………………………………………………………..31
2-10- مشکلات فیلترینگ اشتراکی………………………………………………………………………………………..32
2-10-1- پراکنده بودن داده…………………………………………………………………………………………………….32
2-10-2- مقیاس پذیری………………………………………………………………………………………………………….32
2-10-3- اقلام مشابه……………………………………………………………………………………………………………….33
2-10-4- گریشیپ…………………………………………………………………………………………………………………33
2-11- بررسی چگونگی کارکرد سایت آمازون…………………………………………………………………………33
فصل 3 : روش محتوا محور………………………………………………………………………………………………………36
3-1- پیشگفتار………………………………………………………………………………………………………………………….37
3-2- روند کار روش محتوا محور……………………………………………………………………………………………..37
3-2-1- تحلیلگر محتوا…………………………………………………………………………………………………………..38
3-2-2- یادگیرنده نمایه …………………………………………………………………………………………………..39
3-2-3- جزء فیلترینگ…………………………………………………………………………………………………………….42
3-3- مزایای روش محتوا محور………………………………………………………………………………………………..42
3-3-1- استقلال کاربر……………………………………………………………………………………………………………..42
3-3-2- شفافیت……………………………………………………………………………………………………………………….42
3-3-3- قلم جدید…………………………………………………………………………………………………………………….43
3-4- معایب روش محتوا محور…………………………………………………………………………………………………43
3-4-1- کمبود محتوا……………………………………………………………………………………………………………….43
3-4-2- خصوصی سازی افزون…………………………………………………………………………………………………43
3-4-3- کاربر جدید………………………………………………………………………………………………………………….44
فصل 4 : روش پیشنهادی………………………………………………………………………………………………………….45
4-1- پیشگفتار………………………………………………………………………………………………………………………….46
4-2- بر کارهای انجام شده در این راستا……………………………………………………………………..46
4-3- مقدمهای بر روش پیشنهادی…………………………………………………………………………………………..48
4-4- روش پیشنهادی………………………………………………………………………………………………………………48
4-4-1- پیش پردازش………………………………………………………………………………………………………………49
4-4-1-1- پیش پردازش بر روی پایگاه داده MovieLens………………………………………………..49
4-4-1-2- پیش پردازش بر روی پایگاه داده EachMovie………………………………………………..50
4-4-2- وزندهی به اقلام…………………………………………………………………………………………………………51
4-4-3- انتخابهمسایگی…………………………………………………………………………………………………………53
4-4-4- پیشبینی……………………………………………………………………………………………………………………54
فصل 5 : آزمایشها و نتایج……………………………………………………………………………………………………….56
5-1- پایگاه داده های مورد استفاده…………………………………………………………………………………………..57
5-2- نحوه اجرای روش پیشنهادی روی پایگاه داده MovieLens……………………………………….57
5-3- نحوه اجرای روش پیشنهادی روی پایگاه داده ٍEachMovie……………………………………….58
5-4- معیارهایارزیابی………………………………………………………………………………………………………………58
5-4-1- میانگین خطای مطلق…………………………………………………………………………………………………58
5-4-2- دقت و فراخوانی………………………………………………………………………………………………………….59
5-4-3- معیار ارزیابیF1…………………………………………………………………………………………………………60
5-5- ارزیابی روش پیشنهادی توسط معیارهای معرفی شده…………………………………………………..61
فصل 6 : بحث و نتیجه گیری…………………………………………………………………………………………………….66
6-1- بحث…………………………………………………………………………………………………………………………………67
6-2- نتیجهگیری……………………………………………………………………………………………………………………..67
6-4- پیشنهادات……………………………………………………………………………………………………………………….68
مراجع………………………………………………………………………………………………………………………………………..69
فهرست جدول ها
عنوان و شماره صفحه
جدول شماره 1 : نمونههایی از سیستمهای پیشنهادگر و اقلام پیشنهادی آنها…………………………7
جدول شماره 2 : مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر MovieLens……………………………………………………………………………………………………………………………61
جدول شماره 3 : مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر EachMovie……………………………………………………………………………………………………………………………61
جدول شماره 4 : مقایسه معیار دقت روش پایه و روش پیشنهادی، اعمال شده بر
MovieLens……………………………………………………………………………………………………………………………61
جدول شماره 5 : مقایسه معیار دقت روش پایه و روش پیشنهادی، اعمال شده بر
EachMovie …………………………………………………………………………………………………………………………..62
جدول شماره 6 : مقایسه معیار فراخوانی روش پایه و روش پیشنهادی، اعمال شده بر MovieLens……………………………………………………………………………………………………………………………62
جدول شماره 7 : مقایسه معیار فراخوانی روش پایه و روش پیشنهادی، اعمال شده بر EachMovie………………...…………………………………………………………………………………………………………62
جدول شماره 8 : مقایسه معیارF1 روش پایه و روش پیشنهادی، اعمال شده بر MovieLens……………………………………………………………………………………………………………………………62
جدول شماره 9 : مقایسه معیارF1 روش پایه و روش پیشنهادی، اعمال شده بر
EachMovie……………………………………………………………………………………………………………………………62
جدول شماره 10 : مقایسه میانگین خطای مطلق روش پیشنهادی با روشهای[19] و [20]…………………………………………………………………………………………………………………………………………..65
فهرست تصاویر
عنوان و شماره صفحه
شکل شماره 1: نمونههایی از موتورهای جستجوگر………………………………………………………………….5
شکل شماره 2 : نمونه صفحهای از سایت Movielens………………………………………………………….11
شکل شماره 3 : نمونه صفحه درخواست امتیازدهی Movielens از کاربر…………………………….12
شکل شماره 4 : نمونه صفحه فیلمهای پیشنهادی از سوی Movielens به کاربر………………13
شکل شماره 5 : نمونه ماتریس امتیازدهی کاربران – اقلام………………………………………………………22
شکل شماره 6: فیلترینگ اشتراکی مبتنی بر اقلام………………………………………………………………..25
شکل شماره 7 : فیلترینگ اشتراکی مبتنی بر کاربران…………………………………………………………….25
شکل شماره 8 : روند تولید پیشنهاد در آمازون……………………………………………………………………….34
شکل شماره 9 : نمونه صفحهای از سایت آمازون…………………………………………………………………….35
شکل شماره 10 : ارائه پیشنهاد بر اساس کارت خرید مشتری……………………………………………….35
شکل شماره 11 : روند کار روش محتوا محور………………………………………………………………………….38
شکل شماره 12 : نمونه صفحهای از سایت آمازون…………………………………………………………………40
شکل شماره 13 :استفاده از روش محتوا محور در سایت آمازون…………………………………………..41
شکل شماره 14 : نمایش مفاهیم دقت و فراخوانی در حوزه بازیابی اطلاعات………………………..59
شکل شماره 15: رابطه معیار فراخوانی با معیار دقت……………………………………………………………..60
شکل شماره 16: مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر
MovieLens……………………………………………………………………………………………………………………………63شکل شماره 17: مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر
EachMovie…………………………………………………………………………………………………………………………...63
شکل شماره 18: مقایسه معیار دقت، فراخوانی و F روش پایه و روش پیشنهادی، اعمال شده بر EachMovie……………………………………………………………………………………………………………………...64
شکل شماره 19: مقایسه معیار دقت، فراخوانی و F روش پایه و روش پیشنهادی، اعمال شده بر MovieLens………………………………………………………………………………………………………………………..64
مقدمه
1-1- پیشگفتار
پیدایش اینترنت و وب جهان گستر[1] موجب شده است که در رابطه با هر موضوع قابل تصور، حجم بسیار زیادی از اطلاعات وجود داشته باشد که کاربران[2] بتوانند با بهره گرفتن از آن نیاز اطلاعاتی خود را برطرف سازند. افزایش روز افزون اطلاعات باعث شد که مشکل سربار اطلاعات[3] به وجود آید و کاربران به تنهایی قادر به برطرف کردن نیازهای خود نباشند. . زیرا کاربران مجبور بودند به صورت بر خط[4] تمامی صفحات را جستجو کنند تا بتوانند آن قسمتی را که مورد نیازشان است پیدا کنند. به همین دلیل موتورهای جستجوگر[5] به وجود آمدند تا کاربران بتوانند با بهره گرفتن از آنها بدون نیاز به بررسی تعداد زیادی از صفحات به اطلاعات مورد نظرشان دسترسی پیدا کنند.
1-2- موتورهای جستجوگر
به عبارت دیگر یک موتور جستجوگر وب سایتی است که میتوان از آن برای پیدا کردن صفحات وب استفاده کرد. وقتی کاربر درخواست خود را در قالب کلمات کلیدی وارد موتور جستجوگر می کند موتور جستجوگر در بین بیلیونها صفحه وب جستجو کرده و به کاربر کمک می کند اطلاعاتی که به دنبال آن است را بیابد. با بهره گرفتن از این ابزار سرعت و دقت در جستجو بسیار افزایش یافت و کاربران توانستند به سادگی و در کمترین زمان به بهترین نتایج دست یابند.
فرم در حال بارگذاری ...
[دوشنبه 1399-10-01] [ 06:04:00 ب.ظ ]
|