Reduksi Dimensi pada Klasifikasi Data Microarray Menggunakan Minimum Redundancy Maximum Relevance dan Random Forest

The Dimensional Reduction in Microarray Data Classification Using Minimum Redundancy Maximum Relevance and Random Forest

Authors

  • Lailan Harahap Universitas Sumatera Utara, Fakultas Ilmu Komputer dan Teknologi Informasi
  • Erna Budhiarti Nababan Universitas Sumatera Utara
  • Syahril Efendi Universitas Sumatera Utara

DOI:

https://doi.org/10.33022/ijcs.v12i1.3133

Keywords:

MRMR, Random Forest, feature selection, Microarray, Reduksi Dimensi, klasifikasi

Abstract

Di Indonesia prevalensi kanker pada data Riskesdes tahun 2018 terdapat 1,79 per 1.000 penduduk mengidap penyakit kanker. Akibat tingginya prevalensi kanker maka diperlukan pendeteksian kanker sejak dini. Salah satu cara mendeteksi kanker yaitu dengan teknologi microarray dimana teknologi ini dapat memantau ribuan ekpresi gen secara bersamaan dalam satu percobaan. Namun, data microarray memiliki dimensi yang besar sehingga diperlukan proses reduksi dimensi data microarray pada penyakit prostate cancer da gastric cancer agar dapat menghilangkan atribut yang redundansi dan meningkatkan akurasi pada klasifikasi. Reduksi dilakukan menggunakan MRMR (FCQ dan FCD) dengan k 10,20,30,40,50,60,70,80,90 dan 100. Klasifikasi dilakukan menggunakan RF dengan membentuk 100 tree. Hasil akurasi terbaik pada klasifikasi data prostate cancer yaitu dengan FCQ 100% pada k=10, tanpa reduksi 95% dan akurasi terendah dengan FCD 52% pada k=90. Sedangkan hasil akurasi terbaik klasifikasi data gastric cancer yaitu dengan FCQ dan FCD 100% pada semua k dan akurasi terendah yaitu tanpa reduksi 83%.

Downloads

Published

28-02-2023