درخت تصمیم یکی از تکنیکهای بسیار رایج در طبقهبندی دادهها است. در این مقاله درخت تصمیم دادههای نامطمئن مورد بررسی قرار گرفته است. از عواملی که سبب عدم اطمینان در دادهها میشوند میتوان به محدودیت در دقت اندازهگیری، منابع قدیمی، اظهار نشدن اطلاعات و مسائلی که در انتقال دادهها بوجود میآید اشاره نمود. در دادههای نامطمئن، مقدار داده با یک مقدار مشخص، نشان داده نمیشود و با چند مقدار به شکل توزیع احتمالی نشان داده میشود. دادههای طرح اطلاعات اقتصادی خانوار نیز بهدلیل کمگویی یا نبود برخی از دادهها، در دستهی دادههای نامطمئن قرار میگیرند، بنابراین لازم است که از الگوریتمی استفاده شود که بتواند با دادههای نامطمئن کار کرده و با دقت قابل قبولی طبقهبندی دادهها را انجام دهد. در این مقاله، الگوریتم درخت تصمیم نامطمئن پیشین تعمیم داده شده است. این الگوریتم از روشهای پیشبینی مثل نرخ بهره و آنتروپی و همچنین دادههای نامطمئن بازهای استفاده میکند و توانسته است با استفاده از توابع چگالی احتمال متفاوت سبب کاهش اثر دادههای نامتوازن در خروجی الگوریتم شود. این الگوریتم برای هر دو مجموعه دادههای مطمئن و نامطمئن کار میکند و نتایج این مقاله نشان میدهد که الگوریتم پیشنهادی، دقت پیشبینی رضایت بخشی دارد. ساخت درخت تصمیم دادههای نامطمئن، حجم پردازش بیشتری را در پردازنده نسبت به ساخت درخت روی دادههای مطمئن اشغال میکند، بنابراین در الگوریتم پیشنهادی از تکنیک ماکسیمم
سطح استفاده میشود که مصرف پردازنده را بهینه خواهد کرد.