میزان موفقیت فیلتر نوسان سهام چقدر است؟

ساخت وبلاگ

این موضوع نحوه صاف کردن داده های پاسخ را با استفاده از این عملکرد توضیح می دهد. با عملکرد صاف ، می توانید از روشهای اختیاری برای حرکت به طور متوسط ، فیلترهای Savitzky-Golay و رگرسیون محلی با و بدون وزن و استحکام استفاده کنید (Lowess ، Loess ، Rlowess و Rloess). برای عملکرد بیشتر ، از جمله پشتیبانی از ماتریس ، جداول و جدول زمانی ، و همچنین روشهای حرکت متوسط و گاوسی ، به SmoothData مراجعه کنید.

در حال حرکت فیلتر متوسط

یک فیلتر متوسط در حال حرکت با جایگزین کردن هر نقطه داده با میانگین نقاط داده همسایه تعریف شده در دهانه ، داده ها را صاف می کند. این فرآیند معادل فیلتر Lowpass با پاسخ صافی است که توسط معادله تفاوت داده شده است

y s (i) = 1 2 n + 1 (y (i + n) + y (i + n - 1) +. + y (i - n))

جایی کهs(i) مقدار صاف شده برای نقطه داده اول است ، n تعداد نقاط داده همسایه در هر دو طرف y استs(i) ، و 2 n +1 دهانه است.

روش هموار سازی متوسط در حال حرکت که توسط جعبه ابزار متناسب با منحنی استفاده می شود ™ این قوانین را دنبال می کند:

  • دهانه باید عجیب باشد.
  • نقطه داده برای صاف شدن باید در مرکز دهانه باشد.
  • این دهانه برای نقاط داده تنظیم شده است که نمی توانند تعداد مشخصی از همسایگان از هر طرف را در خود جای دهند.
  • نقاط پایانی صاف نمی شوند زیرا یک دهانه نمی تواند تعریف شود.

توجه داشته باشید که می توانید از عملکرد فیلتر برای اجرای معادلات تفاوت مانند نمونه نشان داده شده در بالا استفاده کنید. با این حال ، به دلیل روشی که نقاط پایانی درمان می شوند ، نتیجه متوسط حرکت جعبه ابزار با نتیجه برگشتی توسط فیلتر متفاوت خواهد بود. برای اطلاعات بیشتر به معادلات و فیلتر کردن مراجعه کنید.

به عنوان مثال ، فرض کنید داده های صاف را با استفاده از یک فیلتر متوسط در حال حرکت با دهانه 5. با استفاده از قوانین توضیح داده شده در بالا ، چهار عنصر اول Ysتوسط

ys(1) = y (1) ys(2) = (y (1)+y (2)+y (3))/3 ys(3) = (y (1)+y (2)+y (3)+y (4)+y (5))/5 ys(4) = (y (2)+y (3)+y (4)+y (5)+y (6))/5

توجه داشته باشید که ys(1) ، ys(2) ،.، ys(پایان) پس از مرتب سازی به ترتیب داده ها مراجعه کنید و نه لزوماً نظم اصلی.

مقادیر صاف و دهانه برای چهار نقطه داده اول یک مجموعه داده تولید شده در زیر نشان داده شده است.

طرح (الف) نشان می دهد که اولین نقطه داده صاف نشده است زیرا نمی توان یک دهانه ساخته شد. طرح (ب) نشان می دهد که نقطه داده دوم با استفاده از دهانه سه صاف می شود. توطئه (ج) و (د) نشان می دهد که از دهانه پنج برای محاسبه مقدار صاف استفاده می شود.

فیلتر Savitzky-Golay

فیلتر Savitzky-Golay را می توان به عنوان یک میانگین متحرک عمومی تصور کرد. شما ضرایب فیلتر را با انجام یک مربع حداقل مربعات خطی بدون وزنی با استفاده از چند جمله ای از یک درجه خاص ، به دست می آورید. به همین دلیل ، یک فیلتر Savitzky-Golay نیز یک فیلتر چند جمله ای هموار سازی دیجیتال یا فیلتر صاف کننده حداقل مربعات نامیده می شود. توجه داشته باشید که یک چند جمله ای درجه بالاتری امکان دستیابی به سطح بالایی از هموار سازی را بدون میرایی از ویژگی های داده فراهم می کند.

روش فیلتر Savitzky-Golay اغلب با داده های فرکانس یا با داده های طیف سنجی (Peak) استفاده می شود. برای داده های فرکانس ، این روش در حفظ اجزای با فرکانس بالا سیگنال مؤثر است. برای داده های طیف سنجی ، این روش در حفظ لحظه های بالاتر اوج مانند عرض خط مؤثر است. در مقایسه ، فیلتر متوسط در حال حرکت تمایل به فیلتر کردن بخش قابل توجهی از محتوای با فرکانس بالا سیگنال دارد و فقط می تواند لحظات پایین اوج مانند سانتروئید را حفظ کند. با این حال ، فیلتر Savitzky-Golay می تواند کمتر از یک فیلتر متوسط متحرک در رد نویز باشد.

روش هموار سازی Savitzky-Golay که توسط نرم افزار جعبه ابزار متناسب با منحنی استفاده می شود ، این قوانین را دنبال می کند:

  • دهانه باید عجیب باشد.
  • درجه چند جمله ای باید کمتر از طول باشد.
  • نقاط داده برای داشتن فاصله یکنواخت لازم نیست. به طور معمول ، فیلتر Savitzky-Golay نیاز به فاصله یکنواخت داده های پیش بینی کننده دارد. با این حال ، الگوریتم جعبه ابزار متناسب با منحنی از فاصله غیر یکنواخت پشتیبانی می کند. بنابراین ، شما برای ایجاد داده ها با فاصله یکنواخت ، نیازی به انجام یک مرحله فیلتر اضافی ندارید.

طرح نشان داده شده در زیر نمایش داده های گاوسی و چندین تلاش برای هموار سازی با استفاده از روش Savitzky-Golay. داده ها بسیار پر سر و صدا هستند و عرض اوج از گسترده تا باریک متفاوت است. طول آن برابر با 5 ٪ از تعداد نقاط داده است.

طرح (الف) داده های پر سر و صدا را نشان می دهد. برای مقایسه راحت تر نتایج صاف ، توطئه ها (B) و (c) داده ها را بدون سر و صدای اضافه شده نشان می دهند.

طرح (ب) نتیجه صافی را با یک چند جمله ای درجه دوم نشان می دهد. توجه کنید که این روش برای قله های باریک عملکرد ضعیفی دارد. طرح (ج) نتیجه صافی را با چند جمله ای کوارتیک نشان می دهد. به طور کلی ، چند جملهای درجه بالاتر می توانند با دقت بیشتری ارتفاعات و عرض قله های باریک را ضبط کنند ، اما می توانند در صاف کردن قله های وسیع تر عمل کنند.

هموار سازی رگرسیون محلی

  • کم و لوس
  • روش رگرسیون محلی
  • رگرسیون محلی قوی

کم و لوس

نام های "Lowess" و "Loess" از اصطلاح "طرح پراکندگی محلی با وزن محلی صاف" گرفته شده است ، زیرا هر دو روش از رگرسیون خطی وزنی محلی برای صاف کردن داده ها استفاده می کنند.

فرآیند هموار سازی محلی در نظر گرفته می شود زیرا ، مانند روش متوسط در حال حرکت ، هر مقدار صاف شده توسط نقاط داده همسایه تعریف شده در دهانه تعیین می شود. این روند وزن می شود زیرا یک عملکرد وزن رگرسیون برای نقاط داده موجود در دهانه تعریف شده است. علاوه بر عملکرد وزن رگرسیون ، می توانید از یک عملکرد وزن قوی استفاده کنید ، که باعث می شود این روند در برابر Outliers مقاوم باشد. سرانجام ، روشها با مدل مورد استفاده در رگرسیون متمایز می شوند: Lowess از یک چند جمله ای خطی استفاده می کند ، در حالی که Loess از یک چند جمله ای درجه دوم استفاده می کند.

روشهای هموار سازی رگرسیون محلی که توسط نرم افزار جعبه ابزار متناسب با منحنی استفاده می شود ، این قوانین را رعایت می کنند:

  • دهانه می تواند یکنواخت یا عجیب باشد.
  • می توانید دهانه را به عنوان درصدی از تعداد کل نقاط داده در مجموعه داده ها مشخص کنید. به عنوان مثال ، دهانه 0. 1 از 10 ٪ از نقاط داده استفاده می کند.

روش رگرسیون محلی

فرآیند هموار سازی رگرسیون محلی این مراحل را برای هر نقطه داده دنبال می کند:

  1. وزن رگرسیون را برای هر نقطه داده در دهانه محاسبه کنید. وزن توسط عملکرد Tricube نشان داده شده در زیر داده می شود.

w i = (1 - | x - x i d (x) | 3) 3

x مقدار پیش بینی کننده مرتبط با مقدار پاسخ برای صاف شدن است ، xiنزدیکترین همسایگان X است که توسط دهانه تعریف شده است ، و D (x) فاصله در طول آبسیسا از x تا دورترین مقدار پیش بینی کننده در طول طول است. وزنه ها این خصوصیات را دارند:

  • نقطه داده برای صاف شدن بیشترین وزن و بیشترین تأثیر را در تناسب دارد.
  • نقاط داده خارج از دهانه وزن صفر دارند و هیچ تاثیری در تناسب ندارند.

اگر محاسبه صاف شامل همان تعداد داده های همسایه در هر دو طرف نقطه داده صاف باشد ، عملکرد وزن متقارن است. با این حال ، اگر تعداد نقاط همسایه در مورد نقطه داده صاف متقارن نباشد ، عملکرد وزن متقارن نیست. توجه داشته باشید که برخلاف روند صاف کننده متوسط در حال حرکت ، دهانه هرگز تغییر نمی کند. به عنوان مثال ، هنگامی که نقطه داده را با کوچکترین مقدار پیش بینی کننده صاف می کنید ، شکل عملکرد وزن توسط یک نیمی کوتاه می شود ، سمت چپ ترین نقطه داده در دهانه دارای بیشترین وزن است و تمام نقاط همسایه در سمت راست قرار دارندمقدار صاف

عملکرد وزن برای یک نقطه پایانی و برای یک نقطه داخلی برای مدت 31 نقطه داده در زیر نشان داده شده است.

با استفاده از روش Lowess با دهانه پنج ، مقادیر صاف و رگرسیون مرتبط برای چهار نقطه داده اول یک مجموعه داده تولید شده در زیر نشان داده شده است.

توجه کنید که با پیشرفت فرآیند هموار سازی از نقطه داده به نقطه داده ، دهانه تغییر نمی کند. با این حال ، بسته به تعداد نزدیکترین همسایگان ، عملکرد وزن رگرسیون ممکن است متقارن در مورد نقطه داده برای صاف شدن نباشد. به طور خاص ، توطئه ها (a) و (b) از یک عملکرد وزن نامتقارن استفاده می کنند ، در حالی که توطئه ها (c) و (d) از یک عملکرد وزن متقارن استفاده می کنند.

برای روش Loess ، نمودارها به همان جز مقدار صاف شده توسط یک چند جمله ای درجه دوم تولید می شوند.

رگرسیون محلی قوی

اگر داده های شما حاوی Outliers باشد ، مقادیر صاف شده می توانند تحریف شوند و رفتار بخش عمده ای از نقاط داده همسایه را منعکس نکنند. برای غلبه بر این مشکل ، می توانید داده ها را با استفاده از یک روش قوی که تحت تأثیر بخش کوچکی از مسافت ها قرار نمی گیرد ، صاف کنید. برای توضیحات دور از ذهن ، به تجزیه و تحلیل باقیمانده مراجعه کنید.

نرم افزار جعبه ابزار متناسب با منحنی نسخه ای قوی را برای هر دو روش صاف کننده Lowess و Loess فراهم می کند. این روشهای قوی شامل محاسبه اضافی از وزن های قوی است که در برابر Outliers مقاوم است. روش صاف کننده قوی از این مراحل پیروی می کند:

  1. باقیمانده ها را از روش هموار سازی شرح داده شده در بخش قبلی محاسبه کنید.
  2. وزن های قوی را برای هر نقطه داده در دهانه محاسبه کنید. وزن توسط عملکرد Bisquare داده می شود ،

W I =<( 1 − ( r i / 6 M A D ) 2 ) 2 , | r i | <6 M A D , 0 , | r i | ≥ 6 M A D ,

جایی که riآیا باقیمانده نقطه داده اول تولید شده توسط روش هموار سازی رگرسیون است ، و دیوانه انحراف مطلق متوسط باقیمانده ها است.

m a d = median (| r |).

نتایج هموار سازی روش Lowess در زیر با نتایج روش کم کم برای یک مجموعه داده تولید شده که حاوی یک دور واحد است ، مقایسه می شود. دهانه برای هر دو روش 11 نقطه داده است.

طرح (الف) نشان می دهد که دورتر بر ارزش صاف شده برای چند نزدیکترین همسایه تأثیر می گذارد. طرح (ب) نشان می دهد که باقیمانده از دورتر از شش انحراف مطلق متوسط است. بنابراین ، وزن قوی برای این نقطه داده صفر است. طرح (ج) نشان می دهد که مقادیر هموار همسایه که در همسایگی قرار دارد ، بخش عمده ای از داده ها را منعکس می کند.

مثال: صاف کردن داده ها

بارگیری داده ها در COUNT. DAT:

count. dat را بارگیری کنید

تعداد آرایه 24 در 3 شامل تعداد ترافیک در سه تقاطع برای هر ساعت از روز است.

ابتدا از یک فیلتر متوسط در حال حرکت با یک دهانه 5 ساعته استفاده کنید تا تمام داده ها را به طور همزمان صاف کنید (توسط شاخص خطی):

c = صاف (تعداد (:)) ؛C1 = تغییر شکل (C ، 24،3) ؛

داده های اصلی و داده های صاف را ترسیم کنید:

Subplot (3،1،1) طرح (تعداد ، ':') ؛نگه داشتن طرح (c1 ، '-') ؛عنوان ('صاف C1 (همه داده ها) ")

دوم ، از همان فیلتر برای صاف کردن هر ستون از داده ها به طور جداگانه استفاده کنید:

C2 = صفر (24،3) ؛برای i = 1: 3 ، c2 (: ، i) = صاف (تعداد (: ، i)) ؛پایان

باز هم ، داده های اصلی و داده های صاف را ترسیم کنید:

Subplot (3،1،2) طرح (تعداد ، ':') ؛نگه داشتن طرح (C2 ، '-') ؛عنوان ('صاف C2 (هر ستون) ")

تفاوت بین دو مجموعه داده صاف را ترسیم کنید:

Subplot (3،1،3) طرح (C2 - C1 ، 'O-') عنوان ('اختلاف C2 - C1')

به اثرات انتهایی اضافی از صاف 3 ستونی توجه کنید.

مثال: هموار سازی داده ها با استفاده از Loess و Loess قوی

داده های پر سر و صدا با Outliers ایجاد کنید:

x = 15*رند (150،1) ؛y = sin (x) + 0. 5*(rand (size (x))-0. 5) ؛y (سقف (طول (x)*رند (2،1))) = 3 ؛

داده ها را با استفاده از روش های Loess و Rloess با دهانه 10 ٪ صاف کنید:

yy1 = صاف (x ، y ، 0. 1 ، 'loess') ؛yy2 = صاف (x ، y ، 0. 1 ، 'rloess') ؛

داده های اصلی و داده های صاف را ترسیم کنید.

[xx ، ind] = مرتب سازی (x) ؛Subplot (2،1،1) طرح (xx ، y (ind) ، 'b.' ، xx ، yy1 (ind) ، 'r-') مجموعه (gca ، 'ylim' ، [-1. 5 3. 5]) افسانه ("داده های اصلی" ، "داده های صاف با استفاده از" "loess" "". "مکان" ، "NW") Subplot (2،1،2) طرح (xx ، y (ind) ، 'b.' ، xx ، yy2 (ind) ، "r-") مجموعه (GCA ، "ylim" ، [-1. 5 3. 5]) افسانه ("داده های اصلی" ، "داده های صاف با استفاده از" rloess "" "." مکان "،" NW ")

توجه داشته باشید که خارج از کشور تأثیر کمتری در روش قوی دارد.

همچنین ببینید

مطالب مرتبط

  • اتصالات غیر پارامتری
  • صاف کردن اسپلین ها
  • صافی
دوره ی فارکس...
ما را در سایت دوره ی فارکس دنبال می کنید

برچسب : نویسنده : مهناز افشار بازدید : 28 تاريخ : شنبه 21 مرداد 1402 ساعت: 20:58