AI Driven Early Warnings of Defaults on Performing Credit: A Machine Learning Case Study of the Greek Lending Market

dc.contributor.advisorΖαβιτσάνος, Ηλίας
dc.contributor.advisorΜπουγατιώτης, Κωνσταντίνος
dc.contributor.authorΚανελλόπουλος, Αναστάσιος
dc.contributor.committeeΖαβιτσάνος, Ηλίας
dc.contributor.committeeΚριθαρά, Αναστασία
dc.contributor.committeeΣκιαδόπουλος, Σπύρος
dc.contributor.departmentΤμήμα Πληροφορικής και Τηλεπικοινωνιώνel
dc.contributor.facultyΣχολή Οικονομίας και Τεχνολογίαςel
dc.contributor.masterΕπιστήμη Δεδομένωνel
dc.date.accessioned2025-03-07T13:29:44Z
dc.date.available2025-03-07T13:29:44Z
dc.date.issued2024-12-20
dc.descriptionΜ.Δ.Ε. 127el
dc.description.abstractThis thesis aims to apply machine learning (ML) models to predict loan defaults on current accounts in the context of the Greek lending market. Using a unique data set from Qualco, a leading supplier of financial risk management software, the study aims to identify current accounts that have a high disposition to default in the near future. The research contacted follows a systematic approach which involves, data preprocessing, feature engineering, and the application, tuning and statistical testing of various ML models on the given task. Models used for this proccess include but are not limited to Logistic Regression and ensemble models such as Random Forest, XGBoost, LightGBM, and CatBoost. The final results obtained from a 10 fold cross validation, show that all fully featured trained models outperform Logistic Regression, which is the baseline model used in the experiments, and the difference in performance based on pairwise comparisons of classifiers is statistically significant. However, among the fully featured trained models there was no single model that exhibits a statistically significant performance when compared with the rest. The fully featured CatBoost, XGBoost and LightGBM models achieved the best performance in this study yet, in pairwise comparisons of performance between these three models, no difference in performance was found statistically significant. Finally, the feature importance analysis, based on a final Catboost model trained on both the train and validation datasets, revealed some of the most important factors that lead to load default perdition in the given dataset. These include but are not limited to, the risk level achieved at the the previous time step, the installments due next month and the city of the customer linked to each account all of which are intuitive and align with the factors deemed as important in the research. The results of this study, act as a useful initial point to further explore the predictive power of complex ML models in the context of loan defaults, especially in the Greek lending market.el
dc.description.abstracttranslatedΣκοπός αυτής της εργασίας είναι διερεύνηση και εφαρμογή της μηχανικής μάθησης (ΜΜ) για την πρόβλεψη αθέτησης δανείων σε ενήμερους λογαριασμούς δανείων της ελληνικής αγοράς δανεισμού και χρέους. Χρησιμοποιώντας ένα μοναδικό σύνολο δεδομένων που παρέχεται από την Qualco, έναν κορυφαίο πάροχο λύσεων διαχείρισης χρηματοοικονομικού κινδύνου, η έρευνα εστιάζει στην αναγνώριση δανειοληπτών που πληρούν τις τρέχουσες υποχρεώσεις πληρωμής τους, αλλά παρουσιάζουν υψηλό κίν- δυνο αθέτησης στο μέλλον. Η μελέτη χρησιμοποιεί μια ολοκληρωμένη μεθοδολογία, που περιλαμβάνει την επεξεργασία και το καθάρισμα των δεδομένων, τη δημιουργε- ία νέων χαρακτηριστικών (Feature Engineering) και την εκπαίδευση και αξιολόγηση διαφόρων μοντέλων ΜΜ, συμπεριλαμβανομένης της λογιστικής παλινδρόμησης (Logistic Regression) αλλα και προηγμένων αλγορίθμων όπως Random Forest, XGBoost, LightGBM και CatBoost. Τα αποτελέσματα δείχνουν ότι οι προηγμένοι αλγορίθμοι που αναφέρονται, ξεπερνούν το βασικό μοντέλο λογιστικής παλινδρόμησης (84%), με το μοντελό CatBoost να επιτυγχάνει την υψηλότερη ακρίβεια (95%) στη συγκριτική μελέτη. Η ανάλυση σημαντικότητας χαρακτηριστικών αποκαλύπτει μεταξύ άλλων, ως βασικούς παράγοντες που οδηγούν σε κίνδυνο αθέτησης το ποσό των δόσεων του ε- πόμενου μήνα, το επίπεδο ρίσκου που κατηγοριοποιήθηκε ένας λογαριασμός καθώς και την πόλη που έχει δηλώσει, ο σχετιζόμενος με το λογαριασμό, πελάτης. Τα ευρήματα συμβάλλουν σε μια βαθύτερη κατανόηση της πρόβλεψης αθέτησης δανείων στην ελ- ληνική επικράτεια και συνηγορούν στην ανάπτυξη πιο αποτελεσματικών στρατηγικών διαχείρισης πιστωτικού κινδύνου. -el
dc.format.extent104el
dc.identifier.urihttps://amitos.library.uop.gr/xmlui/handle/123456789/8636
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πελοποννήσουel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.subjectArtificial Intelligenceel
dc.subjectMachine Learningel
dc.subjectLoans (Greek law)el
dc.subjectFinancial risk managementel
dc.subjectAlgorithmsel
dc.subjectΜηχανική Μάθησηel
dc.subjectΔάνειαel
dc.subjectΑλγόριθμοιel
dc.subjectΤεχνητή νοημοσύνηel
dc.subject.keywordCredit riskel
dc.subject.keywordMachine learningel
dc.subject.keywordFinancial analysisel
dc.subject.keywordBanking -- Greeceel
dc.titleAI Driven Early Warnings of Defaults on Performing Credit: A Machine Learning Case Study of the Greek Lending Marketel
dc.typeΜεταπτυχιακή διπλωματική εργασίαel

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
kanellopoulos_2022202104007.pdf
Size:
1.03 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
933 B
Format:
Item-specific license agreed upon to submission
Description: