Studi Empiris Model BERT dan DistilBERT Analisis Sentimen pada Pemilihan Presiden Indonesia

Authors

  • Mahira Putri State Islamic University Syarif Hidayatullah Jakarta
  • Taufik Edy Sutanto State Islamic University Syarif Hidayatullah Jakarta
  • Suma Inna State Islamic University Syarif Hidayatullah Jakarta

DOI:

https://doi.org/10.33022/ijcs.v12i5.3445

Abstract

Peningkatan jumlah pengguna media sosial di Indonesia sejak tahun 2014 menyebabkan data yang dihasilkan semakin besar dan kompleks, sehingga komputasi yang  diperlukan untuk mengolahnya juga semakin besar. Untuk melakukan komputasi pada data yang besar diperlukan model yang kompatibel, efektif, dan efisien. Penelitian ini adalah kajian numerik dari dua model terbaik Deep Learning saat paper ini ditulis, yaitu BERT dan DistilBERT pada kasus analisis sentimen menggunakan ratusan ribu tweet terkait pemilihan presiden Indonesia tahun 2014 dan 2019. Analisis yang dilakukan meliputi waktu eksekusi dan konsumsi memori. Pada model dengan nilai hyperparameter optimal, tercatat bahwa DistilBERT melakukan proses pelatihan dan prediksi 84% lebih cepat dengan penggunaan memori GPU 79% lebih efisien dengan nilai akurasi tidak terpaut jauh, yaitu 0.89 dan 0.85 untuk BERT dan DistilBERT. Hasil kajian ini dapat digunakan untuk memperkirakan besarnya sumberdaya komputasi atau biaya yang dibutuhkan ketika menggunakan model BERT atau DistilBERT pada data yang besar.

Downloads

Published

30-10-2023