جستجو در سایت

تماس با ما: 09361509687  ایمیل: royalproje.ir[ at ]gmail.com

Get Started

یک نوع خاص از خوشه بندی در داده کاوی، خوشه بندی سری های زمانی است. یک دنباله ترکیبی از سری ها از نماد های اسمی است که از یک الفبای خاص که معمولا دنباله موقتی نامیده میشود تشکیل شده است این دنباله همچنین میتواند دنباله ای از عناصر حقیقی و پیوسته باشد که بعنوان سری های زمانی شناخته میشود. یک سری زمانی به صورت یک داده دینامیک کلاس بندی میشوند، به دلیل آنکه ارزش ویژگی ها به صورت تابعی از زمان تعییر میکند این بدان معنی است که ارزش هر نقطه از یک سری زمانی ب اساس مشاهداتی است که در طول زمان انجام میشود . داده سری زمانی نوعی از داد های موقتی هستند که به صورت طبیعی دارای ابعاد بسیار بالا و حجم بسیار زیاد می باشند [6 17 18]. داد های سری زمانی بسیار مورد توجه هستند چون در همه جا و در همه حوضه های دانش وجود دارند شامل مهندسی، تجارت، بحث های زمانی، اقتصاد، سلامت تا دولت [16]. مادام اینکه هر سری زمانی شامل یک تعداد زیادی از نقاط داده ای است که آنها میتوانند همچنین به عنوان یک شی تنها دیده شوند [19]. خوشه یندی چنین شی پیچیده ای دارای مزیت خاصی است برای اینکه منجر به کشف الگو های مورد نظر در دیتاست های سری های زمانی شود.

همجنان که این الکو ها در داده کاوی میتواند الکوهای کمیاب و یا مکرری باشند چندین تحقیق بر این اساس انجام شده اند که شامل توسعه متد هایی برای تشخیص تغییرات دینامیک در سری های زمانی، تشخیص آنومالی و نفوذ، فرایند کنترل و تشخیص کاراکتر[20 تا 22] می باشند.

بیشتر کاربرد های سری های زمانی در بخش 1-2 توضیح داده میشود.برای برجسته سازی اهمیت احتیاج به خوشه بندی پایگاه داده هیا سری زمانی هدف های هم پوشان برای خوشه بندی سزی های زمانی در ادامه بخث خواهند شد:

  1. دیتاست های سری هایزمانی محتوی اطلاعات ارزمندی هشتند که میتوانند در زمان استخراج الگو داده کاوی بدست آیند، خوشه بندی یک راه حل رایج برای  استخراح الگوها از این داده های زمانی است.د
  2. دیتاست های سری زمانی بسیار بزرگ هستن و نمیتوانند به خوبی توسط بازرس زمانی ادازه شوند. بنابراین یسیازی ازکاربران ترجیه میدهند که باداده های ساختار یافته کار کنند تا دیتاست های بسیاتر بزرگ. به عنوان نتیجه داده های سری زمانی به عنوان یک مجموعه از گروه های همانند نمایش داده میشوند که از جمع آوری داده ها در خوشه های غیر هم پوشان یا به وسیله یک دسته از مفاهیم انتزاعی و سلسه مراتبی به وجود می آیند.
  3. خوشه بندی سری زمانی یک رویکرد بسیار مورد استفاده است ک به عنوان یک تکنیک اکتشفای می باشد هم چنین به عنوان یک زیر روال در بیشتر الگوریتم های داده کاوی پیچیده همچون کشف قوانین، ایندکس گذاری، کلاسبندی و تشخیص ناهنجاری بکار می روند[22].
  4. نمایش ساختارهای خوشه های سری زمانی همچون تصاویر بصری میتواند به کاربران کمک کند که به سرعت ساختار های داده، خوشه ها، ناهنچاری و دیگر قوانین را در دیتاست ها بفهمد.

مشکل خوشه بندی داده های سری زمانی به صورت رسمی در دامه تعریف میشود

1-    خوشه بندی سری زمانی داده کاوی: یک دیتاست معین از n داده سری زمانی  فرایند پارتیشن کردن بدون ناظری از D به  می باشد که درآن سری های زمانی همگن با یکدیگر بر اساس یک معیار شباهت خاص در گروه هایی قرار میگیرند که به عنوان خوشه بندی سری های زمانی مشخص میشوند. سپس Ci یک کلاستر نامیده میشود در حالی که  و .

خوشه بندی سری زمای یک موضوع چالش زا است به دلیل اینکه اولا داده های سری زمانی اغلب بسیار بزرگتر از حافظه دردسترس است و درنتیجه آنها بر روی دیسک ذخیره میشوند . این کار منجر به یک کاهش نمایی در سرعت فرایند خوشه بندی میشود. چالش دوم این است که داده های سری زمانی اغلب دارای ابعاد بسیار بالا میب اشند[23 24] که مدیرت این داده ها را برای الگوریتم های داده کاوی خوشه بندی بسیار سخت میکد[25] و همچنین فرایند خوشه بندی را کند میکند در نهایت سومین چالش معیار شباهتی ایت که برای خوشه هااستفاده میکردد برای انجام این کار سری های زمانی مشابه بایستی پیدا شوند که نیاز به تطبیق معیار شباهت سری های زمانی دارند که این فراِیند تطبیق از محاسبه شباهت در میان تمام سری های زمانی با استفاده از معیار شباهت بدست می اید. این فرایند همچنین به عنوان ، تطبیق دنیاله ای کلی ، شناخته میشود که تمامی طوی سری های زمانی در طول محاسبه فاصله . اگرجه فایند پیچیده است. بدلیل اینکه داده هیا سری زمانی به صورت طبیعی نویزی هستند و شامل داده های پرت و انتقال می باشند [18]. همچنین طول سری های زمانی متفاوت است و فاصله میان آن ها احتیاج به مجاسبه دارد. این موضوعات رایج معیار شباهت را یک چالش عمده برای داده کاو میکند.

اشتراک برای
آپ دیت ودریافت خبرها