جستجو در سایت

تماس با ما: 09361509687  ایمیل: royalproje.ir[ at ]gmail.com

Get Started

خوشه بندی یک تکنیک داده کاوی میباشد که در آن مشابه در گروه های هم گن و مرتبط قرار میگیرد به صورتی که هیچ گونه دانش قبلی از تعریف گروه موجود باشد[1] به صورت جزیی خوشه ها به وسیله گروه بندی اشیایی کخ حداکثر شباهت با دیگر اعضای گروه خودشان دارا هستند و همچنین دارای کمترین شباهت با دیگر اشیا در گروه های دیگر هستند. این یک رویکرد مفید برای آنالیز اکتشافی داده میباشد به گونه ای که آن ساختارهای را یک پایگاه  داده ای که بدون بر جسب گزاریست تعریف می کند و این کار توسط سازمان یابی هدفمند داده ها در گروه های مشابه صورت میپذیرد. علاوه به این خوشه بندی برای آنالیز اکتشافی داده ها برای خلاصه سازی و همچنین یک مرحله پیش پردازش برای دیگر کارهای داده کاوی یا همچنین یک قسمت از یک سیستم پیچیده مورد استفاده قرار می گیرد.

 

با افزایش توانایی پردازنده ها و ذخیره کننده ها، کاربردهای دنیای واقعی شانس برای ذخیره ونگهداری  داده ها برای مدت طولانی را یافته اند . بنابراین داده در بسیاری از کاربردها به صورت داده های سری زمانی ذخیره می شوند برای مثال داده های فروش، قیمت سهام بوری نرخ مبادله در بازهای مالی، داده های آب و هوایی اندازه گیریهای پزشکی و ... مطابق با این کارهایی مختلفی در دامنه های مختلفی با بایوانفرماتیک ژنتیک، چندرسانه ای [2تا4] و مالی یافت شده است. این میزان از تست زمانی فرصتی را برای تحیلی سری های زمانی توسط تعداد زیادی از محققان در جواهمع داده کاوی را در دهه کذشته را فراهم کرده است. در نتیجه بسیاری از محققان و پروژه های وابسته به سری های زمانی در زمینه های گوناگونی مانند تطبیق زیردنباله، ناهنجاری [5]. ایندکس گذاری، کلاسبندی [6] تجسم [7] قطعه بندی [8]، خلاصه سازی [9]، و پیش بینی در حال انجام است. علاوه بر این تحقیقات فراوانی در حال انجام هستند که هدفشان بهبود تکنیک های موجود است[10]. در دهیه اخیر تغغیران ومیران قابل توجهی از خوشه بندی سری های زمانی در حال انجام هستند که خود موجب ظهور مفاهیمی همچون دادگان بزرگ و محاسبه ابری شده اند. که این توسعه ها موجب افزایش اندازه دیتاست ها  بصورت نمایی شده است. برای مثال  یک ساعت از دادگان نوار قلبی یک گیگابایت حافظه نیاز دارد، وبلاگ نیازمند 5 گیگابایت در هفته است. یک دیتابیس شاتل فضایی نیازمند 200 گیگابایت و 2 گیگابایت در هر روز است[12]. درنتیجه خوشه بندی یک اشتیاق برای بهبود در سال اخیر را برای رسیدگی به این میزان حجیم داده های را برای نگهداری شهرتش با عنوان یک ابزار مفید داده کاوی برای استخراج الگوهای مفید ایجاد کرده است. این مرور یک مرور بجا و مناسب است. چون علارغم تغیران قابل توجه بر روی آناتمی و ساختار خوشه بندی ساختار زمانی وجود ندارد و چندین مرور و مطالعه مختلف ک هتمرکز بر جنبه های مقایسه ای خوشه بندی سری زمانی دارد[13 و 17] انجام شده است. اما هیچ کدام از آنها گرایشی به جامع بودن همچنان که ما داریم نداشته اند. این تحقیق هدفش نمایش یک بازرسی بر گرایش بهبودها در کارایی، کیفیت و پیچدگی رویکردهای سری زمانی است. که در طی دهه اخیر انجام شده است و روشنی بخش مسیر های جدید برای کارهای آینده است.

اشتراک برای
آپ دیت ودریافت خبرها