دانلود مطالب در مورد خوشهبندی مبتنی بر انتخاب بر اساس نظریه خرد جمعی- فایل ۱۵ |
- روش تحقیق
۳-۱. مقدمه
در این فصل ابتدا به بررسی نظریه خرد جمعی بر اساس تعاریف کتاب سورویکی میپردازیم. در این راستای ابتدا شرایط چهارگانه جامعه خردمند را بررسی میکنیم و سپس به بررسی استثناها در این نظریه خواهیم پرداخت. پس از تشریح نظریه خرد جمعی، روش پیشنهادی اول این تحقیق را شرح میدهیم. این روش را ما با عنوان “خوشهبندی خردمند با بهره گرفتن از آستانهگیری” میشناسیم که در آن مطابق با ادبیات مطرحشده در خوشهبندی ترکیبی، ابتدا به بیان چهارچوب کلی آن پرداخته و سپس برای شرایط چهارگانه خرد جمعی تعریفی متناسب و جدید ارائه میدهیم. آنگاه بر اساس این تعاریف الگوریتم پیشنهادی روش اول را بیان میکنیم. در این روش پس از تولید نتایج اولیه با بهره گرفتن از چهارچوب پیشنهادی غیرمتمرکز به آستانهگیری از نتایج به دست آمده از ارزیابی درجه استقلال الگوریتمها و پراکندگی نتایج اولیه میپردازیم و در پایان بر اساس نتایج انتخابشده (افرازهای خردمند) نتیجه نهایی را تولید میکنیم. در این روش دو الگوریتم پایه غیر هم نام کاملاً مستقل و درجه استقلال الگوریتمهای هم نام بر اساس پارامترهای اساسی آن ها محاسبه میشود.
در ادامه، روش پیشنهادی دوم این تحقیق بیان میشود. این روش که ما آن را با عنوان ” خوشهبندی خردمند مبتنی بر گراف استقلال الگوریتم “میشناسیم به بهبود دو بخش از روش اول میپردازد. این روش در ابتدا این ایده را بررسی میکند که الگوریتمهای غیر هم نام کاملاً مستقل نیستند. در این راستای برای محاسبه درجه استقلال دو الگوریتم با بهره گرفتن از ایده تبدیل کد به گراف در تست نرمافزار به ارائه روشی با عنوان مدلسازی گراف استقلال الگوریتم میپردازیم. با مقایسه گرافهای به دست آمده (درجه استقلال) در این روش میتوان یک وزن برای احتمال صحت جوابهای به دست آمده پیشنهاد داد. از این روی در این روش به جای ارزیابی و آستانهگیری از استقلال الگوریتمها، آن ها را به عنوان وزنی برای ترکیب نتایج در نظر میگیریم که این کار نیاز به تعیین آستانه برای استقلال را از بین میبرد. در روش دوم پیشنهادی این تحقیق رابطهای جدید بر اساس رابطه ۲-۵۶ برای ترکیب نتایج اولیه به صورت وزندار با عنوان روش انباشت مدارک وزندار یا [۱۵۲]WEAC معرفی میشود.
۳-۲. نظریه خرد جمعی
“فرانسیس گالتون” فیلسوف و دانشمند علم آمار از انگلستان بود که مفاهیم اصلی انحراف استاندارد و همبستگی را معرفی کرد. یک روز که او از نمایشگاه دام بازدید میکرد، به جایی رسید که در آن مسابقهای ترتیب داده شده بود. یک گاو نر فربه انتخابشده و در معرض دید عموم قرار گرفته بود. هر کس که تمایل شرکت در مسابقه را داشت باید شش پنس میپرداخت و ورقهای مهرشده را تحویل میگرفت. در آن ورقه باید تخمین خود را از وزن گاو نر مینوشت. نزدیکترین تخمین به واقعیت برنده مسابقه بود و جوایزی به صاحب آن تعلق میگرفت. مجموعاً ٧٨٧ نفر در مسابقه شرکت کردند تا شانس خود را بیازمایند. افراد از همه تیپ و طبقهای آمده بودند. از قصاب گرفته که قاعدتاً باید بهترین و نزدیکترین نظر را به واقعیت میداد تا کشاورز و مردم عامی بی تخصص. گالتون میخواست دریابد عقل جمعی مردم پلیموت چگونه قضاوت کرده است. بدون شک تصور او این بود که عدد مزبور فرسنگها از عدد واقعی فاصله خواهد داشت چرا که از دید وی افراد کمهوش و عقبمانده در آن جمع اکثریت قاطع را تشکیل میدادند. برخلاف نظر گالتون، متوسط نظرات جمعیت این بود که گاو نر ١١٩٧ پوند وزندارد و وزن واقعی گاو که در روز مسابقه وزنکشی شد ١١٩٨ پوند بود. گالتون اشتباه میکرد. نظر جمع تقریباً به طور کامل با واقعیت تطابق داشت گالتون در مقالهای که در مجله علمی “طبیعت” منتشر نمود نوشت نتایج نشان میدهد که قضاوتهای جمعی و دموکراتیک از اعتبار بیشتری نسبت به آنچه که من انتظار داشتم برخوردارند [۴۴]. نظریه هیئتمنصفه که اولین بار توسط کندورست بیان شد نیز این نتیجه گالتون را تأیید میکند. این نظریه در علوم سیاسی، احتمال نسبی درستی نظر گروهی از افراد (رأی اکثریت) را بررسی میکند. نظریه خرد جمعی که اولین بار توسط سورویکی در کتابی با همان عنوان انتشار یافته است، تأیید میکند که یک جمع میتواند مسئله را بهتر از اکثر اعضای گروه حل کند. مطابق تعریف این کتاب، یک جمعیت به هر گروهی از افراد اطلاق میشود که میتوانند به طور جمعی تصمیمی بگیرند یا مسئلهای را حل کنند [۵۵].
۳-۲-۱. شرایط جامعه خردمند
خرد جمعی روشی نوین برای تصمیمگیریهای اجتماعی میباشد. کارایی این روش نه تنها در نظریه بلکه در عمل نیز در مسایل مختلف اثبات شده است که پیشتر به آن اشاره شده است. این روش تأیید میکند که یک جمع میتواند مسئله را بهتر از اکثر اعضای گروه حل کند مطابق تعریف این خرد جمعی، یک جمعیت به هر گروهی از افراد اطلاق میشود که میتوانند به طور جمعی تصمیمی بگیرند یا مسئلهای را حل کنند. مطابق تحقیقات مککی، همه جمعیتها (گروهها) خردمند نیستند. یک مثال روشن از این قضیه بازار سهام است که جمعیت به سمت حباب بازار هدایت میشود. بنابراین ابتدا باید فهمید که تحت چه شرایطی خرد جمعی میتواند اثرگذار باشد [۴۴]. از این روی در این روش چهارچوبی جهت تعریف جامعه خردمند ارائه شده است. سورویکی چهار شرط اساسی زیر را برای تمایز جمعیت خردمند از یک جمعیت غیر عاقل پیشنهاد میدهد: [۵۵]
- تنوع (پراکندگی[۱۵۳]) آراء
- استقلال[۱۵۴]آراء
- عدم تمرکز[۱۵۵]آراء
- روش ترکیب[۱۵۶]مناسب
۳-۲-۱-۱. تعریف معیار پراکندگی
در خرد جمعی معیار تنوع یا پراکندگی به صورت زیر تعریف میشود:
“هر فرد باید به طور جداگانه اطلاعی از موضوع مورد نظر داشته باشد حتی اگر اطلاعات مزبور غلط و مخدوش باشد.” [۵۵]
یکی از دلایلی که سورویکی در خصوص چرایی کارکرد نظریه خرد جمعی مطرح میکند این است که نظر هر فرد دو عنصر را در درون خود دارد اطلاعات صحیح و غلط. اطلاعات صحیح (از آن رو که صحیحاند) هم جهتاند و بر روی یکدیگر انباشته میشوند اما خطاها در جهات مختلف و غیر همسو عمل میکنند لذا تمایل به حذف یکدیگر دارند. نتیجه این میشود که پس از جمع نظرات آنچه که میماند اطلاعات صحیح است. از این روی معیار پراکندگی یکی از مهمترین اصلها در خرد جمعی است زیرا به طور مستقیم بر روی میزان هم جهت سازی آرای تأثیر دارد [۵۵].
۳-۲-۱-۲. تعریف معیار استقلال
استقلال یکی دیگر از اصلهای خرد جمعی است. در صورت وابستگی افراد به گروه یا فرد خاصی اصل هم جهتی در آرای از بین می رود. به عبارت دیگر در صورت نبود استقلال مقدار انحراف معیار آرای جامعه آماری ما واقعی نخواهد بود و نظریه خرد جمعی در اینگونه جوامع که ما آن را در با عنوان جامعههای دیکتاتوری میشناسیم درست عمل نمیکند. در خرد جمعی معیار استقلال به صورت زیر تعریف میشود:
“نظر افراد باید به طور مستقل و بدون تأثیر گرفتن از یک فرد یا گروه مشخص شکل گیرد.” [۵۵]
۳-۲-۱-۳. تعریف معیار عدم تمرکز
در خرد جمعی معیار عدم تمرکز به صورت زیر تعریف میشود:
” افراد باید توانایی شخصی سازی و نتیجهگیری مبتنی بر دانش محلی خود را داشته باشند.” [۵۵]
با توجه به مثالهایی که سورویکی در مورد عدم تمرکز در آژانس اطلاعات مرکزی آمریکا ([۱۵۷]CIA) یا سیستمعامل لینوکس ذکر میکند، باید گفت که این معیاری کیفی است. همچنین فاجعه شاتل کلمبیا یکی از مثالهای مهمی است که در کتاب خرد جمعی در مورد مشکلات بالقوه تمرکز به آن اشاره شده است. سورویکی این مشکل را اینگونه توجیه میکند، به علت بوروکراسی در مدیریت سلسله مراتبی ناسا این فاجعه کاملاً به آگاهی مهندسین سطح پایین (اجرایی) وابسته شده بود (امکان ردیابی آن در سطوح بالاتر وجود نداشت) وی همچنین اشاره میکند که چون تمامی مهندسان ناسا به صورت متمرکز برای این پروژه آموزشدیده بودند از این رو هیچ کس مشکل را درک نکرد که این منجر به آن فاجعه شد [۵۵].
۳-۲-۱-۴. روش ترکیب مناسب
یکی دیگر از اصلهای بسیار مهم در خرد جمعی روش ترکیب مناسب میباشد. سورویکی آن را اینگونه تعریف میکند:
“باید مکانیزمی وجود داشته باشد که بتوان توسط آن نظرات افراد را با یکدیگر ترکیب کرده و به یک نظر جمعی تبدیل نمود“ [۵۵]
آن چیز که در اینجا بدهی است آن است که روش ترکیب باید طوری انتخاب شود که متناسب با دادههای ورودی (رأی افراد) باشد و خروجی مناسب را تولید کند (یک نظر واحد و کامل) و در ادغام دادههای ورودی کمترین خطا را داشته باشد (به طور ایدهآل صفر) و پاسخگوی انواع مسائل خرد جمعی باشد. از این روی نمیتوان یک روش واحد برای ترکیب نتایج اولیه تمامی مسائل خرد جمعی پیدا کرد و باید متناسب باهر مسئله روشی را اتخاذ کرد برای مثال در مسئله فروشگاه دام که گالتون آن را با ایده ابتدایی خرد جمعی حل کرد مکانیزم ترکیب “میانگین” بود.
۳-۲-۲. اهمیت و رابطه استقلال و پراکندگی در خرد جمعی
در سالهای نخستین قرن بیستم طبیعی دان آمریکائی “ویلیام بیب[۱۵۸]” در حین مطالعات خود در جنگلهای جزایر گویان با منظره عجیبی برخورد کرد. لشگر بزرگی از مورچهها در پیرامون یک دایره بزرگ که محیطی در حدود ۴٠٠ متر داشت بیوقفه در حال حرکت بودند. آنان هر ۵/٢ ساعت یکبار به دور این دایره میگشتند. این گردش آن قدر ادامه یافت که پس از ٢ روز اکثر آن ها جان خود را از دست دادند. آنچه که بیب مشاهده کرده بود بیولوژیستهای امروزی آن را “دایره آسیاب[۱۵۹]” مینامند. این دایره زمانی شکل میگیرد که گروهی از مورچگان از “جمع[۱۶۰]” خود به دور میافتند. وقتی که چنین امری اتفاق میافتد آنان از یک قانون ساده پیروی میکنند. از مورچه جلوی خود تبعیت کن. این دایره زمانی میشکند که به طور تصادفی یکی از مورچهها به دلیلی نامعلوم دایره را ترک میکند و مورچه بعدی به دنبال او به راه میافتد.
جانسون در کتاب خود بنام ظهور میگوید: “کلنی مورچگان معمولاً بسیار خوب کار میکند. هیچ کس گروه را ترک نمیکند، هیچ کس فرمان نمیدهد و هیچ کس اطاعت نمیکند. هیچ مورچهای به تنهایی نمیداند چه میکند و هیچ نوع اطلاعاتی در اختیار ندارد اما جمع آن ها غذا را پیدا میکند، ذخیره میکند، کارهای مربوط به جمع را به بهترین شکل انجام میدهد و تولیدمثل نیز میکند". اما همین اصل تبعیت کورکورانه، باعث مرگ آنان در دایره آسیاب میشود. یک مورچه هیچ استقلال رأیی ندارد و به همین دلیل هم زمانی که در دایره مرگ گرفتار میآید راه خلاصی به بیرون را نمییابد [۳۶]. انسانها اما به خلاف مورچگان میتوانند مستقل فکر کرده و مستقل عمل کنند. مفهوم استقلال این است که به طور نسبی و به میزانی فرد قادر است مستقل از جمع عمل نماید. این تفاوت مهم و چشمگیری است که جمع ما را از مورچگان متمایز میکند.
استقلال به دو دلیل از اهمیت بسیاری در ارتقاء هوش جمعی برخوردار است. اول اینکه از تکرار یک نوع خطا جلوگیری میکند. خطای یک فرد بر قضاوت یک جمع یک تأثیر خردکننده ندارد، اما اگر همان خطا به طور سامانمند در تعداد زیادی از افراد جمع گسترش یابد آن وقت است که رأی جمع را به طور منفی تحت تأثیر قرار میدهد. دوم آن که افکار مستقل اطلاعات تازه و متنوع را وارد جمع میکند درحالیکه اگر افکار مستقل نباشند همان نوع اطلاعات در جمع تکرار میشود و چیز تازهای به خرد جمع اضافه نمیشود. بنابراین هوشمندترین گروهها آنهایی هستند که افراد آن از تنوع بالا و استقلال رأی هرچه بیشتر برخوردار باشند. مفهوم مخالف آن این است که جمعی که افرادش به لحاظ فکری به هم نزدیک و نزدیکتر شوند از درجه هوش چندان بالایی برخوردار نیست.
آنچه که ما میخواهیم به عنوان یک اصل مهم از آن یاد کنیم این است که هر چقدر افراد یک جمع به یکدیگر نزدیکتر باشند و بتوانند با یکدیگر روابط فردی برقرار کنند تصمیم جمع از عقلانیت بیشتر به دور خواهد بود. هر چقدر ما به یکدیگر نزدیکتر باشیم باورهایمان به یکدیگر نزدیک شده و امکان تصحیح خطاهایمان کاهش مییابد. ممکن است به لحاظ فردی در اثر این هم نشینی خود به هوش و دانش بالاتری دست یابیم اما قطعاً جمع را به بیخردی و بلاهت نزدیک میکنیم.
۳-۲-۳. استثناءها در خرد جمعی
سه مسئله مجزایی که مشخص شده است که در آن ها جمعیتها ممکن است از تکتک اعضا هوشمندانهتر عمل کنند عبارتاند از: الف) مسئله سوزن در انبار کاه که بعضی از افراد جمعیت ممکن است جواب را بدانند درحالیکه خیلیها نمیدانند. ب) مسئله تخمین حالت که بعضی افراد جمعیت ممکن است با خوششانسی جواب دقیق را بدهند (درحالیکه خودشان از قبل از میزان دقت جوابشان آگاه نباشند)، اما گروه اینطور نباشد. ج) مسئله پیشگویی که جواب هنوز باید کشف (آشکار) شود [۴۹, ۵۳]. برای مسئله پیشگویی، جواب کشف نشده هم میتواند ثابت باشد (به عنوان مثال پیشگویی برنده بعدی جایزه اسکار[۱۶۱]، خود جواب را تغییر نمیدهد)، هم اینکه جواب میتواند شناور باشد یعنی عمل بعدی شما جواب را تغییر میدهد (مثل برگشت سرمایهگذاری شما که خود در جواب نهایی موثر است) [۳۲].
۳-۳. خوشهبندی خردمند با بهره گرفتن از آستانهگیری
شکل۳-۱. چهارچوب الگوریتم خوشهبندی خردمند با بهره گرفتن از آستانهگیری
شکل ۳-۱ چهارچوب الگوریتم خوشهبندی خردمند با بهره گرفتن از آستانهگیری را نشان میدهد. در این روش کل داده به صورت مستقیم در اختیار تمام الگوریتمهای پایه قرار میگیرد. روند اجرای الگوریتم بدین گونه است که ابتدا اولین الگوریتم پایه اجراشده و نتیجه آن پس از ارزیابی پراکندگی (باید توجه داشت چون اولین الگوریتم است هیچ الگوریتمی جهت ارزیابی درجه استقلال در بخش الگوریتمهای انتخابشده وجود ندارد و نتیجه ارزیابی استقلال کاملاً مستقل خواهد بود) به بخش الگوریتمهای انتخابشده که ما آن را با عنوان جامعه خردمند میشناسیم اضافه میشود. سپس نوبت الگوریتم بعدی است که پس از تولید نتیجهی به ارزیابی درجه استقلال و میزان پراکندگی آن میپردازیم و در صورتی که نتایج ارزیابی از میزان آستانه تعیینشده بیشتر باشد افراز تولیدشده به داخل جامعه خردمند اضافه خواهد شد. در این روش در صورت رد نتیجه به دست آمده در هر بخش فرایند ارزیابی نتیجه الگوریتم متوقفشده و به سراغ الگوریتم پایه بعدی خواهیم رفت. در این تحقیق بر خلاف روشهای پیشین خوشهبندی ترکیبی، کل افراز به دست آمده از یک الگوریتم خوشهبندی پایه را در صورت داشتن شرایط لازم وارد مجمع میکنیم و اینگونه اصالت جواب حفظ میشود. مهمترین تفاوت این روش با روشهای قبلی را میتوان موارد زیر دانست:
اولین تفاوت این روش نحوه ارزیابی الگوریتم خوشهبندی است که در این روش پس از اجرای هر الگوریتم پایه، استقلال و پراکندگی آن نسبت به سایر الگوریتمهای داخل مجمع محاسبه میشود و در صورت داشتن شرایط وارد مجمع میشود.
دوم اینکه در اینجا به طور غیرمتمرکز الگوریتمها عمل میکنند و الگوریتمی که بدون کیفیت، پراکندگی و استقلال باشد قادر به ورود در مجمع نیست. لذا خطاهای غیر هم جهت به وجود آمده در این روش حذفشده، و آثار جوابهای هم جهت در مجمع بر روی هم افزوده خواهند شد که این کاملاً منطبق بر اصول حاکم بر خرد جمعی میباشد.
سوم اینکه چون بعد از رسیدن جمعیت مجمع به تعداد مورد نظر ما، هیچ گزینش دیگری برای تولید جواب نهایی نیاز نیست کیفیت نتایج نهایی حفظ میشود.
ادعاهای مطرحشده در این بخش پس از توضیح روش کار الگوریتم به صورت کامل و واضح در بخش بررسی مکانیزم بازخورد مورد مطالعه قرار میگیرد. در ادامه به تشریح تعاریف چهارگانه خرد جمعی مطابق با ادبیات خوشهبندی ترکیبی خواهیم پرداخت.
۳-۳-۱. روش ارزیابی پراکندگی نتایج
در مورد پراکندگی آراء باید گفت چون ما در خوشهبندی ترکیبی با دادهها و نتایج خوشهبندی اولیه سر و کارداریم از واژه پراکندگی نتایج اولیه استفاده میکنیم و بر اساس این فرض و تعریف سورویکی از تنوع آراء آن را به صورت زیر بازنویسی میکنیم:
هر الگوریتم خوشهبندی پایه باید به طور جداگانه و بدون واسطه به دادههای مسئله دسترسی داشته و آن را تحلیل و خوشهبندی کند حتی اگر نتایج آن غلط باشد.
در اینجا نتایج غلط موجب کشف عدم تنوع و جلوگیری از تکرار یک جواب خاص خواهد شد. ما در این تحقیق بر اساس معیار APMM (رابطه ۲-۲۹) معیاری جدید جهت سنجش پراکندگی نتیجه هر الگوریتم خوشهبندی پایه ارائه میدهیم. در این تحقیق برای محاسبه مقدار پراکندگی یک خوشه از AAPMM (رابطه ۲-۳۰) استفاده میکنیم چون این معیار هم از لحاظ پیچیدگی زمانی سریعتر از NMI میباشد و هم مشکل تقارن آن را ندارد. معیاری که این تحقیق جهت سنجش پراکندگی نتیجه افراز یک خوشهبندی پایه معرفی کرده است A3 نام دارد که میانگین وزندار AAPMM میباشد که به شرح زیر است:
(۳-۱)
فرم در حال بارگذاری ...
[جمعه 1400-07-23] [ 04:40:00 ق.ظ ]
|