Meningkatkan Kinerja Decision Tree C4.5 dengan Seleksi Fitur Korelasi Pearson pada Deteksi Penyakit Diabetes

Authors

  • Mohammad Burhan Hanif Universitas Semarang
  • Galet Guntoro Setiaji Universitas Semarang

Abstract

Diabetes sebuah penyakit yang menjadi momok seluruh dunia. Kerugianya tidak hanya pada penderita sendiri tetapi juga merambah ke banyak sektor. Baik di sektor pelayanan kesehatan dan sektor financial yang sangat menjadi beban tinggi yang perlu ditangani dengan baik dengan jalan pendeteksian penyakit diabetes sejak dini. Salah satu pendeteksian dini penyakit diabetes dapat memanfaatkan algoritma machine learning pada bidang data mining. Algoritma C4.5 merupakan algoritma machine learning yang memiliki tingkat akurasi dan kecepatan perhitungan tinggi dalam klasifikasi. Namun demikian algoritma C4.5 terganggu dengan data tak seimbang dan fitur data berdimensi tinggi. Pemanfaatan seleksi fitur menjadi salah satu penyelesain masalah data berdimensi tinggi. Algoritma Korelasi Pearson memiliki kemampuan dalam mengukur informasi antar fitur dan diterapkan dalam penelitian ini. Penggunaan Korelasi Pearson dianggap berhasil dalam meningkatkan kinerja algoritma C4.5 dalam deteksi awal penyakit diabetes. Keberhasilan ini terlihat pada hasil akurasi sebesar 95.31% tanpa korelasi pearson menjadi 96.16% dengan pemanfaatan korelasi pearson.

Downloads

Published

28-08-2022