Implementasi Algoritma Naïve Bayes Menggunakan Pemilihan Atribut Information Gain Pada Penyakit Diabetes

Edwin Arizal Mandalika, Moh. Dasuki, Reni Umilasari

Abstract


Diabetes adalah penyakit kronis yang menimbulkan gangguan metabolisme dan dikenali melalui kadar gula darah yang tinggi. Dengan memanfaatkan teknologi informasi dan komunikasi maka saat ini proses diagnosis secara dini penyakit diabetes dapat dilakukan dengan cara mengolah dataset rekam medis. Tujuan dari klasifikasi adalah untuk mengidentifikasi pola atau hubungan di antara data yang ada sehingga dapat dikategorikan ke dalam kelas yang tepat. Algoritma Naïve Bayes merupakan salah satu algoritma yang biasa diterapkan dalam klasifikasi untuk menentukan kelas data. Algoritma ini melakukan klasifikasi probabilistik yang digunakan untuk menentukan kelas suatu item berdasarkan beberapa Atribut. Optimasi algoritma Naïve Bayes dengan teknik pemilihan atribut agar tingkat akurasi pemodelan yang didapatkan dapat lebih maksimal. Salah satu teknik pemilihan atribut yang terbukti meningkatkan akurasi adalah Information Gain. Data yang digunakan yaitu dataset penyakit diabetes yang berasal dari Kaggle berjumlah 70.692 data meliputi 35.346 record orang yang terkena diabetes dan 35.346 record orang tidak terkena diabetes. Hasil dari penelitian dengan menggunakan metode Naïve Bayes dengan k-fold cross validation menunjukkan hasil yang cukup baik dengan akurasi tertinggi sebesar 73% pada data uji. Dengan pemilihan atribut Information Gain menghasilkan akurasi tertinggi sebesar 74% pada uji.

Kata Kunci: Diabetes, Naïve Bayes, Information Gain

Full Text:

PDF

References


Aini, S. H. A., Sari, Y. A., & Arwan, A. (2018). Seleksi Fitur Information Gain untuk Klasifikasi Penyakit Jantung Menggunakan Kombinasi Metode K-Nearest Neighbor dan Naïve Bayes. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(9), 2546–2554. http://j-ptiik.ub.ac.id

Ainurrohmah. (2021). Akurasi Algoritma Klasifikasi pada Software Rapidminer dan Weka. PRISMA, Prosiding Seminar Nasional Matematika, 4, 493–499.

Al Karomi, M. A., & Ivandari. (2019). Optimasi algoritma Naïve Bayes dengan Information Gain ratio untuk menangani dataset berdimensi tinggi. IC-Tech Journal of Informatic and Computer Technology, 14(2), 18–24.

Arifin, T., & Ariesta, D. (2019). Prediksi Penyakit Ginjal Kronis Menggunakan Algoritma Naïve Bayes Classifier Berbasis Particle Swarm Optimization. Jurnal Tekno Insentif, 13(1), 26–30. https://doi.org/10.36787/jti.v13i1.97

Fauzi, F. A., Furqon, M. T., & Yudistira, N. (2021). Klasifikasi Jenis Tanaman Tembakau di Indonesia menggunakan Naïve Bayes dengan Seleksi Fitur Information Gain. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 5(2), 698–703. http://j-ptiik.ub.ac.id

Febriani, S., & Sulistiani, H. (2021). Analisis Data Hasil Diagnosa Untuk Klasifikasi Gangguan Kepribadian Menggunakan Algoritma C4.5. 89Jurnal Teknologi Dan Sistem Informasi (JTSI), 2(4), 89–95.

Hartati, S., Ramdhan, N. A., & SAN3, H. A. (2022). Prediksi Kelulusan Mahasiswa Dengan Naïve Bayes dan Feature Selection Information Gain Student Graduation Prediction With Naïve Bayes and Feature. 4(02), 223–235.

Hasanah, R. L., Hasan, M., Pangesti, W. E., Wati, F. F., & Gata, W. (2019). Klasifikasi Penerima Dana Bantuan Desa Menggunakan Metode Knn (K-Nearest Neighbor). Jurnal Techno Nusa Mandiri, 16(1), 1–6. https://doi.org/10.33480/techno.v16i1.25

Hayuningtyas, R. Y. (2019). Penerapan Algoritma Naïve Bayes untuk Rekomendasi Pakaian Wanita. 6(1), 18–22.

Marcoulides, G. A. (2005). Discovering Knowledge in Data: an Introduction to Data Mining. In Journal of the American Statistical Association (Vol. 100, Issue 472). https://doi.org/10.1198/jasa.2005.s61

Muqorobin, M., Kusrini, K., & Luthfi, E. T. (2019). Optimasi Metode Naïve Bayes Dengan Feature Selection Information Gain Untuk Prediksi Keterlambatan Pembayaran Spp Sekolah. Jurnal Ilmiah SINUS, 17(1), 1. https://doi.org/10.30646/sinus.v17i1.378

Mustafa, M. S., & Simpen, I. W. (2019). Implementasi Algoritma K-Nearest Neighbor ( KNN ) Untuk Memprediksi Pasien Terkena Penyakit Diabetes Pada Puskesmas Manyampa Kabupaten Bulukumba. Prosiding Seminar Ilmiah Sistem Informasi Dan Teknologi Informasi, VIII(1), 1–10. https://ejurnal.dipanegara.ac.id/index.php/sisiti/article/view/1 -10

Nikmatun, I. A., & Waspada, I. (2019). Implementasi Data Mining untuk Klasifikasi Masa Studi Mahasiswa Menggunakan Algoritma K-Nearest Neighbor. Jurnal SIMETRIS, 10(2), 421–432.

Nurjanah, W. E., Perdana, R. S., & Fauzi, M. A. (2017). Analisis Sentimen Terhadap Tayangan Televisi Berdasarkan Opini Masyarakat pada Media Sosial Twitter menggunakan Metode K-Nearest Neighbor dan Pembobotan Jumlah Retweet. 1(12), 1750–1757.

Pratikaningtyas, R., Soeleman, M. A., Sarjana, P., Informatika, T., & Dian, U. (2019). Klasifikasi Penerbitan Surat Keputusan Tunjangan Profesi Guru Menggunakan Naïve Bayes Berbasis Information Gain. Jurnal Teknologi Informasi, 15(2), 93–102. http://research.pps.dinus.ac.id/index.php/Cyberku/article/view/88

Rahayuningsih, P. A. (2019). Analisis Komparasi Algoritma Klasifikasi Data Mining. Jurnal Teknik Informatika Kaputama (JTIK), 3(1).

Setio, P. B. N., Saputro, D. R. S., & Bowo Winarno. (2020). Klasifikasi Dengan Pohon Keputusan Berbasis Algoritme C4.5. PRISMA, Prosiding Seminar Nasional Matematika, 3, 64–71.

Setiyorini, T., & Asmono, R. T. (2019). Penerapan Metode K-Nearest Neighbor Dan Information Gain Pada Klasifikasi Kinerja Siswa. JITK (Jurnal Ilmu Pengetahuan Dan Teknologi Komputer), 5(1), 7–14. https://doi.org/10.33480/jitk.v5i1.613

Siallagan, R. A., & Fitriyani. (2021). Prediksi Penyakit Diabetes Mellitus. Jurnal Responsif, 3(1), 45–46.

Wijaya, H. D., & Dwiasnati, S. (2020). Implementasi Data Mining dengan Algoritma Naïve Bayes pada Penjualan Obat. Jurnal Informatika, 7(1), 1–7. https://doi.org/10.31311/ji.v7i1.6203

Saputra, V. W. (2019). Klasifikasi Jenis Makanan menggunakan Neighbor Weighted K-Nearest Neighbor dengan Seleksi Fitur Information Gain.

Rizaldy, A., & Santoso, H. A. (2017). Performance Improvement Of Support Vector Machine (SVM) With Information Gain On Categorization Of Indonesian News Documents.

Dewi, Rulita Kumala, dan Moh Dasuki. “Pengadaan Papan Nama Jalan Dusun dalam Meningkatkan Tata Desa Jatisari.” JIWAKERTA: Jurnal Ilmiah Wawasan Kuliah Kerja Nyata, no. 2, 2023, http://jurnal.unmuhjember.ac.id/index.php/jiwakerta.

Saifudin, Ilham, dan Reni Umilasari. Automatic Aircraft Navigation Using Star Metric Dimension Theory in Fire Protected Forest Areas. no. 2, 2021, hal. 294–304, https://doi.org/10.31764/jtam.v5i2.4331.

Umilasari, R., et al. “Local irregularity chromatic number of vertex shackle product of graphs.” IOP Conference Series: Materials Science and Engineering, vol. 821, no. 1, Institute of Physics Publishing, 2020, https://doi.org/10.1088/1757-899X/821/1/012038.

Umilasari, Reni. “Dominating number of distance two of corona product of graphs.” Indonesian Journal of Combinatorics, vol. 1, no. 1, 2016, www.ijc.or.id.

---. “Star metric dimension of complete, bipartite, complete bipartite and fan graphs.” International Journal of Trends in Mathematics Education Research, vol. 5, no. 2, Juni 2022, hal. 199–205, https://doi.org/10.33122/ijtmer.v5i2.137.


Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.