تحلیل مقایسه ای کارآمدی مدل های رگرسیون بردار پشتیبان، شبکه عصبی و۹۳ ARIMA ... |
سپس با بهره گرفتن از شبکه عصبی و SVR، بخش غیرخطی به صورت زیر محاسبه میگردد:
f: تابع غیرخطی برازش شده توسط شبکه عصبی
: جزء اخلال
در نهایت با افزودن پیشبینی شبکه عصبی به پیش بینی مدل خطی خودرگرسیو میانگین متحرک انباشته، پیش بینی مدل ترکیبی خودرگرسیو میانگین متحرک انباشته و شبکه عصبی و با افزودن پیشبینی رگرسیون بردار پشتیبان به پیش بینی مدل خطی خودرگرسیو میانگین متحرک انباشته مدل ترکیبی رگرسیون بردار پشتیبان و خودرگرسیو میانگین متحرک انباشته برای سری زمانی حاصل خواهد شد. در واقع داریم:
: پیشبینی مدل ترکیبی
: پیشبینی پسماندها توسط شبکه
۳-۷-۲) برازش مدل ترکیبی
بعد از برازش مدل خودرگرسیو میانگین متحرک انباشته (ARIMA) برای مشاهدات ۱ تا ۱۱۹۱ برای سری بازده لگاریتمی شاخص پسماندهای حاصل از مدل خودرگرسیو میانگین متحرک انباشتهی بهینه به صورت ایستا محاسبه شده است، در واقع داریم:
: پیشبینی بازده لگایتمی شاخص توسط خودرگرسیو میانگین متحرک انباشته
سپس به منظور مدلسازی الگوی غیرخطی در سریهای زمانی این سری زمانی در ابتدا به شبکه عصبی داده شده و مانند روش به کار رفته در برازش مدل شبکه عصبی، بهترین شبکه عصبی معین و مقادر ، بوسیلهی آن پیش بینی گردیده، آنگاه این مقادیر، به پیش بینی مدل خودرگرسیو میانگین متحرک انباشته برای مشاهده ۱۱۹۲ام از سری زمانی ، اضافه شده است در واقع داریم:
: پیشبینی بازده لگاریتمی شاخص
پیش بینی ناشی از این مدل در واقع پیش بینی مدل ترکیبی آریما و شبکه عصبی است. بنابراین پسماندهای حاصله از مدل آریما که به شبکه عصبی داده شد در این مرحله به SVR می شود و سپس پیش بینی ناشی از این مدل ( ) به پیش بینی مدل خودرگرسیو میانگین متحرک انباشته اضافه می گردد تا پیش بینی مدل ترکیبی خودرگرسیو میانگین متحرک انباشته و رگرسیون بردار پشتیبان ساخته شود.
بعد از پیش بینی مدل های ترکیبی این مقادیر با مقادیر واقعی برای مشاهده ی ۱۱۹۲ام از سری زمانی شاخص کل به منظور محاسبهی دو تابع زیان قدر مطلق خطا (AE) و درصد قدر مطلق خطا (APE) مقایسه گردیده است.
با اضافه کردن مشاهده ۱۱۹۲ام واقعی به سری زمانی ، به منظور برازش مجدد مدل خودرگرسیو میانگین متحرک انباشته، فرایند فوق برای پیش بینی سری زمانی شاخص و دو تابع زیان مذکور برای مشاهده ی ۱۱۹۳ام مجدداً تکرار خواهد شد.
* لازم به ذکر است مراحل فوق برای مدل ترکیبی همانند دو مدل قبل برای ۳۰ مرتبه تکرار شده است.
۳-۸) مقایسه عملکرد و آزمون فرضیه
به منظور بررسی و مقایسه عملکرد مدل ترکیبی خودرگرسیو میانگین متحرک انباشته وشبکه عصبی نسبت به هر یک از مدلهای خودرگرسیو میانگین متحرک انباشته و شبکه عصبی، مدل ترکیبی رگرسیون بردار پشتیبان و خودرگرسیو میانگین متحرک انباشته نسبت به هر یک از مدلهای رگرسیون بردار پشتیبان و خودرگرسیو میانگین متحرک انباشته ، مقایسه مدلهای ترکیبی با یکدیگر و انجام آزمون فرضیه های تحقیق مبنی بر افزایش دقت پیش بینی، از آزمون مقایسه زوجی[۱۵۸] و نرم افزار SPSS بهره جسته شده است. در صورت معنادار بودن آزمون فرضیه مدلی که میانگین تابع زیان کمتری را دارا باشد دقیقتر است.
۳-۹) آزمون دایبولد- ماریانو
برای مقایسه دقت پیش بینی مدلهای مذکور از آزمون دایبولد – ماریانو[۱۵۹] نیز استفاده نمود. با در نظر گرفتن به عنوان یک سریزمانی، اگر ، پیش بینی سری زمانی با مدل تلفیقی و ، پیش بینی سریزمانی با بهره گرفتن از هر یک از مدلهای خودرگرسیو میانگین متحرک انباشته و یا شبکه عصبی و یا رگرسیون بردار پشتیبان برای H مرحله پیشرو باشد، خطای پیش بینی به صورت زیر بدست می آید:
از انجا که در پیش بینی های سری زمانی برای H مرحله پیشرو از داده های روی هم افتاده استفاده می نماییم، خطای پیش بینی و به صورت سریالی همبستگی خواهد داشت. دقت هر پیش بینی بوسیله تابع زیان خاص[۱۶۰] اندازه گرفته می شود:
تابعهای زیان خاص که معمولاً مورد استفاده قرار میگیرند عبارتند از :
مجذور خطا :
قدر مطلق خطا :
برای تعیین اینکه آیا یک مدل بهتر از مدل دیگر پیش بینی می نماید می توانیم از فرضیه صفر ذیل استفاده نماییم:
و فرضیه جایگزین برابر خواهد بود با:
آزمون دایبولد – ماریانو براساس تفاضل این دو تابع است:
آماره دایبولد – ماریانو به صورت زیر بدست می آید:
، تخمین سازگاری از واریانس مجانبی است. دایبولد و ماریانو (۱۹۹۵) نشان می دهند که تحت فرضیه قدرت پیش بینی کنندگی یکسان داریم:
بنابراین فرضیه قدرت پیش بینی یکسان را در سطح ۹۵% زمانی رد می کنیم که داشته باشیم:
اما این آماره سالهای بعدها توسط هاروی – لیبورن- نیوبولد برای نمونههای کوچک و تابع زیان خاص مجذور خطا به صورت زیر اصلاح گردید:
×
آمارهی دارای توزیع t-student از درجه آزادی N-1 میباشد.
در این تحقیق علاوه بر آزمون مقایسه زوجی از آمارهی دایبولد-ماریانو و آمارهی تعدیل شده آنها بوسیلهی هاروی-لیبورن-نیوبولد به منظور انجام آرمونهای فرضیه تحقیق استفاده شده است.
۳-۱۰) جمع بندی
بعد از مانا کردن سری زمانی شاخص، ابتدا با ۱۱۹۱ مشاهده از سری مربوطه مدل خودرگرسیو میانگین متحرک انباشته برازش شده و تابع زیان قدر مطلق خطا و درصد قدر مطلق خطا برای مشاهده ۱۱۹۲ام محاسبه گردیده است. سپس مشاهده ۱۱۹۲ام واقعی از سری زمانی مربوطه، به منظور برازش مجدد مدل خودرگرسیو میانگین متحرک انباشته و توابع زیان مذکور برای مشاهده ۱۱۹۳ام به مدل اضافه شده و فرایند فوق برای ۳۰ مرتبه انجام پذیرفته است.
بعد از برازش هر مرتبه از مدل خودرگرسیو میانگین متحرک انباشته (ARIMA)، با بهره گرفتن از شبکه عصبی و رگرسیون بردار پشتیبان الگوی غیرخطیِ پسماندهای حاصل از خودرگرسیو میانگین متحرک انباشته مدلسازی گردیده، آنگاه پیش بینی پسماندها برای یک مرحله پیشرو به پیش بینی مدل خطی خودرگرسیو میانگین متحرک انباشته (ARIMA) به منظور بررسی دقت پیش بینی مدل ترکیبی آریما و شبکه عصبی و مدل ترکیبی آریما و رگرسیون بردار پشتیبان ، اضافه شده است.
به منظور بررسی دقت مدل ترکیبی میانگین متحرک انباشته و شبکه عصبی نسبت به دو مدل خودرگرسیو میانگین متحرک انباشته (ARIMA) و شبکه عصبی و مدل ترکیبی آریما و رگرسیون بردار پشتیبان نسبت به دو مدل آریما و رگرسیون بردار پشتیبان بعد از برازش هر مرتبه از مدل میانگین متحرک انباشته، بوسیلهی بهترین شبکه عصبی برازش شده و بهترین رگرسیون بردار پشتیبان برازش شده، دقت پیش بینی مدل شبکه عصبی پیشخور و مدل رگرسون بردار پشتیبان مورد ارزیابی قرار داده شده است.
در نهایت بعد برازش مدل های ترکیبی فرضیه های تحقیق بر مبنای دو روش مقایسه زوجی و آزمون دایبولد ماریانو و آماره تعدیل شده هاروی-نیوبولد-لیبورن مورد آزمون قرار میگیرند.
فصل چهارم:
تجزیه و تحلیل داده ها
مقدمه ۴-۱)
فرم در حال بارگذاری ...
[جمعه 1400-07-23] [ 02:26:00 ق.ظ ]
|