ایجاد یک سیستم توصیهگر در وب با بهرهگیری از نمایههای کاربران و روشهای یادگیری ماشین۹۳۱ |
سیستم های پیشنهاد دهنده اولیه بیشتر با تخمین علاقه کاربر به اشیایی که هنوز دیده نشده بود اقدام به تولید پیشنهاداتی می کردند[۲۷،۵۱].
همان طور که در فصل قبل اشاره شد در موارد بسیاری سیستمهای پیشنهاد دهنده وب از دو مرحلهی برخط و برون خط تشکیل شدهاند. در مرحلهی برون خط، سیستم پیشنهاد دهنده اطلاعات را پردازش میکند و مدلی از رفتار و علایق کاربر به دست میآورد. در مرحلهی بر خط، سیستم با بهره گرفتن از این مدل، میتواند پیشنهاداتی به کاربر جاری ارائه کند که این پیشنهادات با علایق پیشین او مطابقت دارد.
lt="تحقیق - متن کامل - پایان نامه” width="390″ height="390″ />
روشهای تولید پیشنهاد
به طور کلی میتوان روشهای مختلف را در چهار گروه طبقه بندی کرد: روشهای مبتنی بر فیلتر مشارکتی[۳۵]، مبتنی بر محتوا[۳۶]، مبتنی بر دانش[۳۷] و روشهای ترکیبی[۳۸]، در ادامه هر یک از این روش ها به طور مختصر شرح داده میشوند.
روش های مبتنی بر فیلتر مشارکتی
تقریبا میتوان گفت که واژهی فیلتر کنندهی مشارکتی توسط گلدبرگ[۳۹] و همکارانش که سازنده سیستم پیشنهاد دهنده بودند برای اولین بار مورد استفاده قرار گرفت[۲۶].
سیستم های پیشنهادی که با این روش تولید میشوند به دنبال تشابه بین علایق و انتخابهای کاربر جاری با دیگر کاربران میباشند. در حقیقت با محاسبه این تشابه و ارزیابی آن میتوانند پیشنهادهایی را به کاربر جاری ارائه دهند. در واقع این روش علاقه مندی کاربر جاری به اشیا را براساس علایق کاربران پیشین ارزیابی میکند و براساس همین ارزیابی میتواند به کاربر جاری پیشنهاد دهد. این سیستم ها خود میتوانند به دو دسته مبتنی بر حافظه و مبتنی بر مدل تقسیم شوند [۱۷].
سیستم های مبتنی بر مدل سیستم های پرکاربردتری نسبت به سیستم های مبتنی بر حافظه میباشند. همانطور که از نام این دو سیستم پیداست در سیستم های مبتنی بر حافظه اگر حجم داده ها بسیار زیاد باشد با مشکلاتی روبه رو خواهیم بود در حالی که سیستم های مبتنی بر مدل با ایجاد مدل های رفتاری میتوانند حجم دادهی کمتری را ذخیره کنند.
روشهای مبتنی بر محتوا
این روشها برخلاف روشهای مبتنی بر فیلتر مشارکتی فقط با بهره گرفتن از اشیایی که تا کنون از نظر کاربر جالب بوده است به تولید پیشنهادهایی میپردازد.
معمولا این روشها به همراه روشهایی مانند طبقه بندی، خوشه بندی و … به کار میروند. در این روشها از ویژگیهایی برای مدل کردن الگوهای رفتاری کاربران مانند کلمات کلیدی استفاده میشود.
به عنوان نمونه میتوان به سیستم [۱۸] اشاره کرد که در آن از ۱۲۸ کلمه کلیدی که منتقل کنندهی بیشترین اطلاعات میباشند، برای مدل کردن الگوهای رفتاری کاربران استفاده شده است.
معمولا در این سیستم ها از کاربران نیز بازخورد میگیرند و این بازخورد میتواند کمک شایانی به تولید پیشنهاداتی با دقت بالاتر در سیستم نماید. به این صورت که از کاربران خواسته میشود تا صفحات را امتیاز دهی کنند مثلا در دسته های خوب، متوسط و ضعیف و یا با دادن ستاره به صفحات آنها را رتبه بندی میکنند. و سیستم میتواند براساس این امتیازات نمایه کاربران را به صورتی دقیقتر بسازد.
معمولا در این گونه از سیستم ها اگر ویژگیهای متفاوتی در نظر گرفته شود سیستم برای یکپارچه کردن آنها بین تمام ویژگیها میانگین هارمونیک میگیرد. و سپس با بهره گرفتن از روشهای یادگیری مختلف با بهرهگیری ازنمایه های کاربران که با توجه به ویژگیها ساخته شده اند سیستم می تواند لیستی از پیشنهادات را تولید کند. در [۵۳] با بهره گرفتن از این روش ویژگیهایی از پیمایش کاربر درنظر گرفته شده و سپس با بهره گرفتن از روشهای یادگیری ماشین اقدام به تولید پیشنهاد برای کاربر جاری می کند.
روش های مبتنی بر دانش
در این روشها در حقیقت به دنبال کشف دانش نهفته میباشیم. و معمولا به منظور رسیدن به این اهداف از روشهایی نظیر استدلال[۴۰] و استنتاج[۴۱] قوانین بهره برده میشود. برخلاف روشهای پیشین در این دسته از روشها قوانین تولید پیشنهادها به صورت خودکار تولید نمیشوند و نیازمند دانش انسانی و افراد خبره میباشند. در حقیقت سیسیتم شامل پایگاه داده وسیعی از اطلاعات مرتبط با اقلام و اشیا موجود میباشد و در ابتدا کاربر نیازها و علایق خود را اعلام میکند و سیستم با بهره گرفتن از پایگاه دانش خود با توجه به نیازهای کاربر استدلال کرده و پیشنهاداتی را به وی ارائه میکند.
سیستم های پیشنهاد دهنده ترکیبی
این سیستمها از میان روشهای تولید پیشنهاد چندین روش را با یکدیگر ترکیب میکنند و سیستم جدیدی را تولید میکنند [۳۶]. به عنوان نمونه میتوان سیستمی را مثال زد که از ترکیب پیشنهادهای سیستم های مختلف برای تولید لیست پیشنهادات استفاده میکند.
یکی دیگر از روشها برای سیستمهای ترکیبی در نظر گرفتن مجموعه ای از روشها و الگوریتم ها در سیستم میباشد که با توجه به شرایط مختلف در هر مورد یکی از آن مجموعه روشها انتخاب شود.
مقایسه روشهای تولید پیشنهاد
در این بخش به مقایسهای میان روش های عنوان شده در بخشهای قبل میپردازیم. در ادامه مقایسهای بین روشهای تولید پیشنهاد آورده شده است.
میتوان گفت که روش فیلتر مشارکتی جزء روشهای پر کاربرد در سیستم های توصیهگر میباشد. این روش در زمینه پیشنهاد گزینههایی مانند کتاب و کالا و فیلم در دستهی روشهای موفق قرار دارد. روشهای تولید پیشنهاد فیلتر مشارکتی دارای نقاط ضعفی نیز هستند:
الف) گزینههای جدید: منظور از گزینهی جدید، گزینه ای است که به تازگی به سایت اضافه شده و هنوز کاربران از آن استفاده نکرده و در نتیجه معمولا در لیست پیشنهادی قرار نمی گیرد چرا که در مجموعه پروفایلهای کاربران هنوز وجود ندارد مانند کالا و یا کتاب جدید که به لیست گزینههای جدید سایت اضافه شده و یا حتی صفحه جدیدی که به سایت اضافه شده است. این مشکل هنگامی بیشتر خود را نشان خواهد داد که در مواجه با سایتهایی باشیم که به سرعت تغییر میکنند و بسیار پویایی میباشند در این موارد استفاده از روشهای فیلتر مشارکتی منجر به تولید پیشنهاداتی دقیق نخواهد شد.
ب) پراکندگی ماتریس امتیازدهی: این ماتریس در واقع امتیازی است که کاربران به گزینه های سایت میدهند. و اگر این ماتریس تبدیل به ماتریس خلوتی شود در نتیجه بدیهی است که از دقت و صحت پیشنهادات کاسته خواهد شد. ابعاد این ماتریس معمولا تعداد کاربران و تعداد گزینه ها میباشد بدین صورت که ماتریس امتیازدهی ماتریس است n×m که n تعداد کاربران و m تعداد آیتم ها می باشد و هر عنصر i×j در این ماتریس بیانگر امتیازی است که کاربر i برای گزینه j در نظر گرفته است. در سیستمهای فیلتر مشارکتی به دلیل اینکه براساس میزان تشابه در امتیازات کاربران به گزینهها تصمیم گیری میشود و پیشنهادات تولید میشود در نتیجه دقت پیشنهادات کاهش خواهد یافت. معمولا وب سایت ها دارای گزینه های بسیاری هستند اما تقریبا میتوان گفت که کاربران با تمامی این گزینه ها سرو کار ندارند در نتیجه در بسیاری از موارد با ماتریسهای بسیار بزرگ و پراکنده مواجه هستیم. البته این مسئله با ترکیب با روشهای دیگر تولید پیشنهاد قابل حل میباشد.
ج) مقیاس پذیری: بدین معنا که سیستم قابلیت گسترش داشته باشد و با افزایش تعداد کاربران و گزینه ها از دقت و کیفیت پیشنهادات کاسته نشود. همانطور که پیش تر عنوان شد در روشهای فیلتر مشارکتی مبتنی بر حافظه در مرحله برخط و تولید پیشنهاد نمایه کاربر جاری با نمایه تمام کاربران دیگر مقایسه میشود واین موضوع هنگامی که بردارهای نمایه کاربران دارای طول زیادی هستند سیستم را با مشکل مواجه خواهد کرد.
روشهای مبتنی بر فیلتر محتوا نیز نقاط ضعفی دارند که در ادامه به آن اشاره خواهد شد.
الف) کاربر جدید: برای کاربران جدیدی که هیچ گونه نمایهای ندارند و اطلاعاتی در مورد علایق آنها وجود ندارد نمی توان پیشنهاداتی با کیفیت و دقت بالا ارائه کرد.
ب) کمبود اطلاعات: فایل های ثبت معمولا دارای فرمت مشخصی هستند و یکسری اطلاعات اولیه را در خود ثبت میکنند و این اطلاعات کلیه علایق کاربر را به درستی نشان نمیدهد.
ج) اطلاعات نادرست: شاید مسیر پیموده شده توسط کاربر واقعا مسیر مورد علاقه وی نباشد و این به دلیل طراحی نامناسب سایت اتفاق افتد که این موضوع باعث ایجاد الگوهای نامناسب و در نتیجه پیشنهادتی با دقت پایین خواهد شد.
به منظور کاستن از این معایب و پر رنگ کردن مزایای این دو روش روشهای ترکیبی ارائه شدند. در انتهای این بخش خلاصهی مقایسه روشهای تولید پیشنهاد در جدول ۳-۱ آورده شده است.
جدول ۳‑۱: مقایسه روش های تولید پیشنهاد
مشکلات روشها |
فرم در حال بارگذاری ...
[جمعه 1400-03-21] [ 03:03:00 ب.ظ ]
|