Perbandingan K-Nearest Neighbors, Support Vector Dan Random Forest Pada Prediksi Medical Cost

Authors

  • Anggista Oktavia Praneswara Universitas Amikom Yogyakarta

DOI:

https://doi.org/10.33022/ijcs.v12i4.3298

Abstract

Asuransi kesehatan adalah kontrak yang mengharuskan membayar sebagian atau seluruh biaya perawatan terkait masalah kesehatan yang dialami. Pengguna asuransi harus membayar premi dengan membayar iuran dalam periode yang telah ditentukan. Dalam praktiknya, pembayaran premi asuransi kesehatan bisa langsung dipotong dari gaji bulanan yang didapat. Maka dari itu, penelitian ini dilakukan dengan mengimplementasikan sebuah algoritma prediksi biaya medis yang dikeluarkan per individu dengan menggunakan perbandingan 3 algoritma yaitu K-Nearest Neighbor, Support Vector Machine dan Random Forest dengan dataset yang diambil kaggle dengan nama insurance.csv berdasarkan kolom usia, jenis kelamin, indeks Massa Tubuh ( BMI ), jumlah anak dalam satu keluarga, individu perokok atau tidak, wilayah tempat tinggal penerima asuransi kesehatan dan biaya medis yang ditanggung oleh asuransi kesehatan. Metode penelitian dilakukan dengan pemeriksaan data dengan melakukan analisi pada dataset serta membagi data menjadi data training dan data test. Hasil penelitian pada algoritma KNN memiliki nilai prediksi MSE sebesar 9651.5, algoritma Random Forest memiliki nilai prediksi MSE sebesar 9755.4, sedangkan algoritma SVM memiliki nilai prediksi MSE sebesar 9312.6.

Downloads

Published

30-08-2023