جستجو در سایت

تماس با ما: 09361509687  ایمیل: royalproje.ir[ at ]gmail.com

Get Started

الگوریتمهای پیش بینی را می توان به دو گروه اصلی بر اساس نوع اطلاعات استفاده شده برای ایجاد پیش بینی تقسیم کرد (3). اولین گروه شامل الگوریتم هایی می شود که دسترسی های آتی را بر مبنای الگوهای دسترسی قبلی پیش بینی می کنند. دو زیر گروه را می توان مشخص کرد : اول زیرگروهی تشکیل شده از الگوریتم هایی که از مدل مارکف استفاده می کنند (1و2و4و10) و دیگری الگوریتمهای مبتنی برمدلهای مارکف که می توان در پیشینه یافت و برخی از انها پیش بینی های بسیار دقیقی را فراهم می کنند، اما با هزینه محاسباتی و مصرف منابع بالا. مصرف منابع الگوریتم های مبتنی بر داده کاوی حتی بیشتر هم هست. دومین گروه شامل الگوریتمهایی هستند که بافت وب را برای ایجاد پیش بینی ها تحلیل می کنند. برخی نویسندگان پیشنهاد می کنند که تحلیل بافت را با استفاده پروفایلها ترکیب کنیم (14)، برخی دیگر شبکه های طبیعی را برای کلمات کلیدی استخراج شده از بافت HTML اعمال می کنند(15)، و تعدادی هم شباهتهایی را در کلمات زمینه ای در محدوده ارتباطات در بافت HTML را شناسایی کرده اند (16). طرحهای (15 و 16) مبتنی بر شهرت شئ و لینکهای فوق العاده ی مرتبط می باشد، اما رابطه میان اشیا را در نظر نگرفته است.
در خصوص الگوریتم های مبتنی بر مدل های مارکف، یکی از پراستفاده ترین الگوریتم در پیشینه گراف وابستگی DG است که توسط پادمانابان و موگال (1) پیشنهاد شده است. DG یک گراف وابستگی را می سازد که الگوی دسترسی را برای اشیا تصویر می کند، که در آن گره ای در گراف برای هر شئ وجود دارد که قبلا مورد دسترسی واقع شده است. سایر الگوریتم های شناخته شده پیش بینی توسط سازگاری بخشی (PPM) ، است که توسط پالپانز و مدلزون (2) پیشنهاد شده است، و آن نیز از مدل مارکف برای ذخیره سازی بافت دسترسی استفاده می کند. هر دو الگوریتم به دقت بالایی در پیش بینی ها رسیده اند، اما متاسفانه این واقعیت به طور مستقیم مربوط به صرف جویی های زمان تاخیر بالا برای کاربران وب نیست، چون الگوریتمها ساختار وبسایتهای جاری را بررسی نکرده اند(4).
الگوریتم گراف وابستگی دوگانه(DDG) ، که توسط دمنش و همکاران (4) پیشنهاد شد، مبتنی بر DG می باشد، اما ساختار وبسایتهای جاری را با تمایز بین صفحات و اشیاء تعبیه شده بررسی می کند. DDG پیش بینی های مفیدی را برای کاهش موثر زمان تاخیر درک شده کاربر در زمان دانلود صفحات فراهم می کند. الگوریتمهای پیشنهادی اشاره شده در بالا به دنبال فراگیری الگوهای کاربر از توالی دسترسی هستند. این الگوریتم ها فرض می کنند که دو شی زمانی مرتبط هستند که توسط کاربر مشابه دقیقا در یک زمان درخواست شده باشند.
سایر الگوریتمهای مارکف الگوهای کاربری را از ساختار سایت فرا می گیرند. زاکرمن و همکاران (8) مدلهای پیش بینی مختلف را مقایسه کرده است، برخی از آنها ترتیبی را در نظر گرفته بودند که در آن اسناد درخواست می شوند، و سایر ساختارهای سایت سرور . اما این مطالعه هیچ الگوریتمی را به صورت مشروح نشان نداده و هیچ نتیجه ای درباره صرفه جویی واقعی زمان کاربر ارائه نکرده است. زو و همکاران (10) پیشنهاد ساخت یک مدل مارکف را از فایلهای ورودی وب و استفاده آن برای ایجاد پیش بینی ها پیشنهاد کرده است. این کار در اصل روی مقایسه ماتریس احتمال تبادل تمرکز کرده است. این کار هیچ الگوریتمی را به صورت مشروح نشان نداده است ، و عملکرد الگوریتم پیشنهادی را نیز مطالعه نکرده است. استفاده از الگوریتمهای پیش بینی جاری در دنیای واقعی مشکلاتی را با مصرف منابع نشان می دهد. بسیاری از کارها این موضوع را برای کاهش پیچیدگی مدلهای پیش بینی و در نتیجه هزینه حافظه و محاسبه آنها بررسی کرده اند. در این زمینه، دشپاند و همکاران (17) بر مدلهای هرس مارکف مربوط به الگوریتمهای پیش بینی وب تمرکز کرده اند. آنها شیوه های زیادی را برای ترکیب مدلهای مارکف از درجات مختلف برای کاهش پیچیدگی حالت فضایی با حفظ دقت پیش بینی ارائه کرده اند. آنها همچنین سه طرح را برای حالتهای هرس پیشنهاد کرده اند: حالتهایی با فراوانی پایین رویداد، حالتهایی با اطمینان پایین روی حالت تراکنش در حال خروج، و حالتهایی با خطای بالای مربوط به حالت . آنها نتیجه گرفتند که مدلهای مارکف پس از هرس به دقت مشابه یا بهتری از مدلهای اصلی می رسند.
3- گراف ارجاع

اشتراک برای
آپ دیت ودریافت خبرها