جستجو در سایت

تماس با ما: 09361509687  ایمیل: royalproje.ir[ at ]gmail.com

Get Started

این روش از آماره مربع کای دو برای شناسایی تقسیم‌های بهینه استفاده می‌کند‌. بر خلاف روش ساخت درخت تصمیم CART انشعابات این روش دودویی نیستند و می‌تواند درخت‌های تصمیمی با بیش از دو شاخه در هر گره تولید نماید. در این تکنیک فیلدهای هدف و پیش بینی کننده می تواند پیوسته و یا گسسته باشند. تکنیک ) (exhaustive CHAID نیز یک روش تغییر یافته از تکنیک CHAID است که در آن تلاش بیشتری برای یافتن تمامی تقسیم های ممکن انجام می شود و طبعاً به زمان بیشتری برای مدلسازی نیز نیاز دارد (Larose، 2005).
در این روش ابتدا جداول احتمالی برای هر متغیر با توجه به متغیر هدف تشکیل می‌گردد و طبق آن آماره کای دو محاسبه می‌گردد و بهترین انشعاب بدست می‌آید. طریقه محاسبه آماره کای دو طبق زیر می‌باشد:

که در آن که در آن O فراوانیهای مشاهده شده و E فراوانیهای مورد انتظار می‌باشد.
• تکنیک 5.0 C
روش این تکنیک ارتقاء یافته روش C4.5 است. این تکنیک با هدف بیشینه کردن سود اطلاعات در هر سطح درخت تصمیم‌، به رده‌بندی مجموعه داده‌ها می‌پردازد. در این تکنیک می‌توان هر گره را بیش از دو انشعاب گروه بندی نمود . فیلد هدف در این روش نیز باید بصورت گسسته تعریف شود و به همین علت این روش توانایی ساخت درخت تصمیم با استفاده از متغیرهای هدف پیوسته (پیش‌بینی) را ندارد.
این درخت تصمیم از شاخص آنتروپی و سود اطلاعاتی به منظور کشف بهترین انشعاب استفاده می‌نماید(Larose،2005). در این روش ابتدا آنتروپی رده‌های موجود به عنوان آنتروپی کل محاسبه می‌شود سپس این مقدار از مقدار آنتروپی به وجود آمده توسط هر انشعاب در درخت تصمیم کم می‌شود و سود اطلاعاتی حاصل می‌گردد. فرمول محاسبه آنتروپی عبارت است از:

و سود اطلاعاتی عبارت است از:

اشتراک برای
آپ دیت ودریافت خبرها