در طول 2۵ سال گذشته پیشرفتهای روششناسانهای در زمینهی تیمار دادههای گمشده صورت گرفته است. بیشتر مطالعههای انتشاریافته روی دادههای گمشده در متغیرهای وابسته تحت شرایط گوناگون تمرکز داشتهاند. مطالعهی حاضر در پی آن است که این خلأ را با مقایسهی دو رهیافت برای برخورد با دادههای گمشده در متغیرهای کمکی رستهای در رگرسیون لوژستیک پر کند: روش امید ریاضی- ماکسیممسازی (EM) وزنها و جانهی چندگانه (MI). دادههای نمونه بهصورت تصادفی از جامعهای با مشخصههای معلوم انتخاب شدهاند. دادههای گمشدهی مربوط به متغیرهای کمکی تحت دو حالت شبیهسازی شدهاند: گمشدهی کاملاً تصادفی و گمشدهی تصادفی با نرخهای گمشدگی متفاوت. یک مدل رگرسیونی لوژستیک با استفاده از یکی از دو رهیافت EM یا MI بر هر نمونه برازش داده شده است. عملکرد این دو رهیافت با چهار معیار مورد مقایسه قرار گرفته است. اریبی، کارایی، پوشش و نرخ عدم پذیرش. نتیجهها بهطور کلی MI را بر EM ترجیح میدادند. مسائل عملی از جمله اجرا، گنجاندن متغیرهای کمکی پیوسته و اثر متقابل بین متغیرهای کمکی مورد بحث قرار گرفتهاند.
Golchi S, Mohandesi S. Comparison of Two Approaches for Handling Missing Covariates in Logistic Regression. مجلهی بررسیها 2010; 21 (1) :109-136 URL: http://ijoss.srtc.ac.ir/article-1-70-fa.html
گلچی شیرین، مهندسی ساناز. مقایسهی دو رهیافت برای برخورد با متغیرهای کمکی گمشده در رگرسیون لوژستیک. مجلهی بررسیهای آمار رسمی ایران. 1389; 21 (1) :109-136