:: دوره 25، شماره 2 - ( 12-1393 ) ::
جلد 25 شماره 2 صفحات 148-115 برگشت به فهرست نسخه ها
درخت تصمیم داده‌های نامطمئن (مطالعه‌ی موردی داده‌های نامطمئن طرح اطلاعات اقتصادی خانوار)
مهسا قائمی* ، میرمحسن پدرام ، عادل آذر
چکیده:   (5029 مشاهده)

درخت تصمیم یکی از تکنیک‌های بسیار رایج در طبقه‌بندی داده‌ها است. در این مقاله درخت تصمیم داده‌های نامطمئن مورد بررسی قرار گرفته است. از عواملی که سبب عدم اطمینان در داده‌ها می‌شوند می‌توان به محدودیت در دقت اندازه‌گیری، منابع قدیمی، اظهار نشدن اطلاعات و مسائلی که در انتقال داده‌ها بوجود می‌آید اشاره نمود. در داده‌های نامطمئن، مقدار داده با یک مقدار مشخص، نشان داده نمی‌شود و با چند مقدار به شکل توزیع احتمالی نشان داده می‌شود. داده‌های طرح اطلاعات اقتصادی خانوار نیز به‌دلیل کم‌گویی یا نبود برخی از داده‌ها، در دسته‌ی داده‌های نامطمئن قرار می‌گیرند، بنابراین لازم است که از الگوریتمی استفاده شود که بتواند با داده‌های نامطمئن کار کرده و با دقت قابل قبولی طبقه‌بندی داده‌ها را انجام دهد. در این مقاله، الگوریتم درخت تصمیم نامطمئن پیشین تعمیم داده‌ شده است. این الگوریتم از روش‌های پیش‌بینی مثل نرخ بهره و آنتروپی و همچنین داده‌های نامطمئن بازه‌ای استفاده می‌کند و توانسته است با استفاده از توابع چگالی احتمال متفاوت سبب کاهش اثر داده‌های نامتوازن در خروجی الگوریتم شود. این الگوریتم برای هر دو مجموعه داده‌های مطمئن و نامطمئن کار می‌کند و نتایج این مقاله نشان می‌دهد که الگوریتم پیشنهادی، دقت پیش‌بینی رضایت بخشی دارد. ساخت درخت تصمیم داده‌های نامطمئن، حجم پردازش بیش‌تری را در پردازنده نسبت به ساخت درخت روی داده‌های مطمئن اشغال می‌کند، بنابراین در الگوریتم پیشنهادی از تکنیک ماکسیمم

سطح استفاده می‌شود که مصرف پردازنده را بهینه خواهد کرد.

واژه‌های کلیدی: داده‌ی نامطمئن، درخت تصمیم، طبقه‌بندی، داده‌کاوی.
متن کامل [PDF 429 kb]   (1261 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: عمومى
دریافت: 1392/12/6 | پذیرش: 1394/6/24 | انتشار: 1394/10/21


XML   English Abstract   Print



بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.
دوره 25، شماره 2 - ( 12-1393 ) برگشت به فهرست نسخه ها