نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشیار دانشکده اقتصاد علامه طباطبائی

2 کارشناس ارشد اقتصاد- دانشگاه علامه طباطبائی

3 عضو هیات علمی گروه اقتصاد نظری، دانشکده اقتصاد ،دانشگاه علامه طباطبائی

10.22054/ijer.2025.84878.1350

چکیده

در این پژوهش، 56,965 فقره تسهیلات اعطایی طی سال‌های 1398 تا 1403 در شعب شمال تهران بانک ملی ایران، به‌منظور برآورد احتمال نکول وام مورد بررسی قرار گرفتند. برای پیش‌بینی رفتار اعتباری مشتریان، سه مدل شامل رگرسیون لجستیک، جنگل تصادفی و تقویت گرادیان حداکثری به‌کار گرفته شده است. متغیرهای ورودی شامل 29 متغیر در سه دسته‌ی اصلی بودند: مشخصات قرارداد تسهیلات (مبلغ، دوره بازپرداخت، نوع وثیقه و ...)، ویژگی‌های فردی تسهیلات‌گیرنده (سن، شغل، سابقه اعتباری و ...) و مشخصات شعبه (استان، نوع شعبه و ...). همچنین پیش‌پردازش‌هایی مانند حذف مقادیر پرت، دسته‌بندی متون، استخراج سن و دوره تنفس از داده‌های موجود انجام شده است و مدل‌ها در دو حالت پایه و بهینه‌سازی‌شده (با تنظیم ابرپارامترها) ارزیابی شدند. نتایج نشان داد که مدل‌های یادگیری ماشین عملکرد بهتری نسبت به روش سنتی دارند. شاخص ROC-AUC برای مدل تقویت گرادیان حداکثری معادل 73/99 و برای جنگل تصادفی نیز 68/99 درصد برآورد شد، درحالی‌که این مقدار برای رگرسیون لجستیک تنها 34/75 درصد بود. اختلاف میانگین AUC بین مدل‌های یادگیری ماشین و رگرسیون لجستیک حدود 243/0 بود و در همه موارد، آزمون‌های آماری و فاصله اطمینان 95 درصد، بر معناداری این اختلاف تأکید داشتند. یافته‌ها برتری قابل اتکای روش‌های یادگیری ماشین در پیش‌بینی نکول تسهیلات را تأیید می‌کند.

کلیدواژه‌ها

موضوعات