نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشیار دانشکده اقتصاد علامه طباطبائی
2 کارشناس ارشد اقتصاد- دانشگاه علامه طباطبائی
3 عضو هیات علمی گروه اقتصاد نظری، دانشکده اقتصاد ،دانشگاه علامه طباطبائی
چکیده
در این پژوهش، 56,965 فقره تسهیلات اعطایی طی سالهای 1398 تا 1403 در شعب شمال تهران بانک ملی ایران، بهمنظور برآورد احتمال نکول وام مورد بررسی قرار گرفتند. برای پیشبینی رفتار اعتباری مشتریان، سه مدل شامل رگرسیون لجستیک، جنگل تصادفی و تقویت گرادیان حداکثری بهکار گرفته شده است. متغیرهای ورودی شامل 29 متغیر در سه دستهی اصلی بودند: مشخصات قرارداد تسهیلات (مبلغ، دوره بازپرداخت، نوع وثیقه و ...)، ویژگیهای فردی تسهیلاتگیرنده (سن، شغل، سابقه اعتباری و ...) و مشخصات شعبه (استان، نوع شعبه و ...). همچنین پیشپردازشهایی مانند حذف مقادیر پرت، دستهبندی متون، استخراج سن و دوره تنفس از دادههای موجود انجام شده است و مدلها در دو حالت پایه و بهینهسازیشده (با تنظیم ابرپارامترها) ارزیابی شدند. نتایج نشان داد که مدلهای یادگیری ماشین عملکرد بهتری نسبت به روش سنتی دارند. شاخص ROC-AUC برای مدل تقویت گرادیان حداکثری معادل 73/99 و برای جنگل تصادفی نیز 68/99 درصد برآورد شد، درحالیکه این مقدار برای رگرسیون لجستیک تنها 34/75 درصد بود. اختلاف میانگین AUC بین مدلهای یادگیری ماشین و رگرسیون لجستیک حدود 243/0 بود و در همه موارد، آزمونهای آماری و فاصله اطمینان 95 درصد، بر معناداری این اختلاف تأکید داشتند. یافتهها برتری قابل اتکای روشهای یادگیری ماشین در پیشبینی نکول تسهیلات را تأیید میکند.
کلیدواژهها
موضوعات