Pengenalan Wajah 3D dengan menggunakan PointNet

Penulis

  • Arif Hidayah Politeknik Elektronika Negeri Surabaya
  • Bima Sena bayu Dewantara Politeknik Elektronika Negeri Surabaya (PENS)
  • Dadet Pramadihanto Politeknik Elektronika Negeri Surabaya (PENS)

DOI:

https://doi.org/10.33022/ijcs.v12i4.3294

Kata Kunci:

Pengenalan wajah 3D, PointNet, Point Cloud, Kamera Time-of-Flight, 3D Face Recognition

Abstrak

Pengenalan wajah tiga dimensi (3D) telah menjadi topik penelitian yang menarik karena mampu mengatasi keterbatasan pengenalan wajah dua dimensi (2D) dalam menghadapi perubahan pose, pencahayaan, dan pemalsuan. Penelitian ini mengusulkan sebuah pipeline pengenalan wajah 3D yang invarian terhadap perubahan cahaya, dengan menggunakan teknik segmentasi euclidean clustering dan Convolutional Neural Network (CNN) PointNet. Data wajah diambil menggunakan kamera Time-of-Flight yang menghasilkan titik awan (point cloud). Proses segmentasi euclidean clustering berhasil memisahkan area wajah dengan akurat, membantu dalam pengenalan wajah 3D. Melalui pelatihan dengan 217 dataset dan 2048 titik per wajah, sistem mencapai akurasi pelatihan sebesar 99% dan akurasi validasi sebesar 84,4%, dengan loss pelatihan sebesar 1% dan loss validasi sebesar 15,6%. Evaluasi pada tiap kelas menunjukkan rata-rata akurasi 0.9887471867966992, presisi 0.8255813953488372, recall 0.8255813953488372, dan F1-score 0.8255813953488372. Hasil menunjukkan bahwa pipeline pengenalan wajah 3D ini memiliki potensi besar dalam aplikasi keamanan, pengawasan, dan pengenalan objek di lingkungan yang kompleks.

 

Three-dimensional (3D) face recognition has emerged as an intriguing research topic, addressing the limitations of two-dimensional (2D) face recognition in handling pose variations, lighting changes, and spoofing. This study proposes an illumination-invariant pipeline for 3D face recognition, utilizing the euclidean clustering segmentation technique and Convolutional Neural Network (CNN) PointNet. Facial data is captured using a Time-of-Flight camera, generating point clouds. The euclidean clustering segmentation effectively isolates facial regions, aiding in 3D face recognition. After training with 217 datasets and 2048 points per face, the system achieved 99% training accuracy and 84.4% validation accuracy, with 1% training loss and 15.6% validation loss. Class-wise evaluation yielded an average accuracy of 0.9887471867966992, precision of 0.8255813953488372, recall of 0.8255813953488372, and F1-score of 0.8255813953488372. The results highlight the significant potential of this 3D face recognition pipeline in security, surveillance, and object recognition in complex environments.

Diterbitkan

2023-08-30