ANALISIS PREDIKSI CUSTOMER CHURN NASABAH BANK DENGAN ALGORITMA RANDOM FOREST

Prayogi, Anindita Puspa Ayu (2025) ANALISIS PREDIKSI CUSTOMER CHURN NASABAH BANK DENGAN ALGORITMA RANDOM FOREST. Undergraduate thesis, Universitas Nusantara PGRI Kediri.

[img] Text (Full text)
RAMA_57201_2113030045.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (3MB) | Request a copy
[img] Text (Similarity)
RAMA_57201_2113030045_SIMILARITY.pdf - Accepted Version
Available under License Creative Commons Public Domain Dedication.

Download (964kB)
[img] Text (Cover sd BAB 1 + References)
RAMA_57201_2113030045_0721029101_0712108103_01_front_ref.pdf - Accepted Version
Available under License Creative Commons Public Domain Dedication.

Download (1MB)
[img] Text (BAB 2)
RAMA_57201_2113030045_0721029101_0712108103_02.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (363kB) | Request a copy
[img] Text (BAB 3)
RAMA_57201_2113030045_0721029101_0712108103_03.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (382kB) | Request a copy
[img] Text (BAB 4)
RAMA_57201_2113030045_0721029101_0712108103_04.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (931kB) | Request a copy
[img] Text (BAB 5)
RAMA_57201_2113030045_0721029101_0712108103_05.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (218kB) | Request a copy
[img] Text (References)
RAMA_57201_2113030045_0721029101_0712108103_06_ref.pdf - Bibliography
Available under License Creative Commons Public Domain Dedication.

Download (188kB)
[img] Text (Lampiran)
RAMA_57201_2113030045_0721029101_0712108103_07_lamp.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (1MB) | Request a copy

Abstract

Churn atau berpindahnya nasabah ke bank lain merupakan permasalahan serius dalam dunia perbankan yang kompetitif, karena berdampak langsung terhadap pendapatan dan loyalitas jangka panjang nasabah. Oleh karena itu, penting bagi perusahaan untuk memiliki strategi prediktif yang mampu mengidentifikasi potensi churn sejak dini. Berbagai penelitian sebelumnya telah menerapkan algoritma klasifikasi seperti Naive Bayes dan ID3, namun masih terdapat ruang untuk meningkatkan akurasi prediksi dalam konteks data yang lebih kompleks. Penelitian ini bertujuan untuk meningkatkan akurasi model prediksi churn nasabah bank dengan menerapkan algoritma Random Forest dalam tiga konfigurasi berbeda: model default, model dengan tuning parameter, dan model dengan tuning serta feature selection berdasarkan nilai feature importance. Dataset yang digunakan berasal dari sumber publik di Kaggle yang memuat 10.000 data nasabah dengan 13 fitur. Penelitian ini menggunakan pendekatan CRISP-DM yang mencakup eksplorasi data, preprocessing, pembangunan model, hingga evaluasi performa menggunakan metrik akurasi, precision, recall, F1-score, dan confusion matrix. Hasil penelitian menunjukkan bahwa model Random Forest dengan tuning parameter menghasilkan performa terbaik dengan akurasi sebesar 86,7% dan nilai F1-score yang lebih seimbang antara kelas churn dan non-churn dibandingkan dua konfigurasi lainnya. Selain itu, hasil analisis feature importance mengidentifikasi beberapa fitur utama yang paling berpengaruh terhadap churn, yaitu usia (Age), jumlah produk (NumOfProducts), saldo (Balance), estimasi gaji (EstimatedSalary), dan skor kredit (CreditScore). Kesimpulan dari penelitian ini menunjukkan bahwa optimasi parameter dapat meningkatkan performa model klasifikasi churn menggunakan Random Forest. Meskipun demikian, penelitian ini memiliki keterbatasan karena hanya menggunakan satu jenis algoritma, sehingga belum dapat dibandingkan dengan metode lain secara langsung. Selain itu, pendekatan penanganan data tidak seimbang yang digunakan masih terbatas dan belum mengeksplorasi metode balancing yang lebih optimal tanpa mengorbankan akurasi. Penelitian selanjutnya disarankan untuk membandingkan beberapa algoritma klasifikasi serta menerapkan teknik penyeimbangan data yang lebih canggih agar model dapat lebih andal dan generalisasi pada data dari berbagai sumber.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: customer churn, Random Forest, klasifikasi, feature importance, prediksi nasabah, data mining
Subjects: 410 Engineering science > 457 Computer engineering
410 Engineering science > 459 Computer science
410 Engineering science > 461 Information systems
Divisions: Fakultas Teknik dan Ilmu Komputer > S1-Sistem Informasi
Depositing User: Anindita Puspa Ayu Prayogi
Last Modified: 31 Jul 2025 05:23
URI: http://repository.unpkediri.ac.id/id/eprint/18154

Actions (login required)

View Item View Item