Penerapan Algoritma Random Forest dalam Prediksi Kelayakan Air Minum

Penulis

  • Khairul Abdi Prodi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan, Indonesia
  • Angga Warjaya Prodi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan, Indonesia
  • Inna Muthmainnah Prodi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan, Indonesia
  • Padli Husaini Pahutar Prodi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan, Indonesia

DOI:

https://doi.org/10.54082/jiki.81

Kata Kunci:

Kualitas Air, Klasifikasi, Potabilitas, Random Forest

Abstrak

Tantangan meningkatnya kebutuhan akan air bersih di tengah ketersediaan yang terbatas mendorong penelitian ini. Pencemaran air, terutama oleh limbah rumah tangga, menyebabkan penurunan kualitas air dan kelangkaan sumber air bersih. Dampak buruknya terhadap kesehatan masyarakat, terutama diare, menunjukkan urgensi identifikasi dini kualitas air yang tidak layak konsumsi. Oleh karena itu, penelitian ini menerapkan algoritma Random Forest untuk klasifikasi kualitas air dan prediksi kelayakan air minum. Penggunaan teknik data mining, khususnya Random Forest, diharapkan dapat mengidentifikasi pola kompleks dalam data dan faktor-faktor yang mempengaruhi kualitas air. Menggunakan dataset Water Quality dari Kaggle, hasil penelitian menunjukkan akurasi sebesar 69%. Analisis Feature Importance Score memperlihatkan kontribusi relatif fitur terhadap prediksi. Kurva ROC menggambarkan optimalitas klasifikasi, sementara Confusion Matrix memberikan gambaran kinerja model. Confusion Matrix yang merinci hasil klasifikasi model Random Forest Classifier. Diagonal utama menunjukkan jumlah instance yang benar-benar diprediksi dengan benar untuk kategori "Potabel" dan "Tidak Potabel", masing-masing 370 dan 84. Namun, terdapat 160 instance yang salah diklasifikasikan sebagai "Potabel" dan 42 sebagai "Tidak Potabel".

Referensi

M. Sofiana, A. Kadarsah, dan D. Sofarini, “Kualitas Air Terdampak Limbah Sebagai Indikator Pembangunan Berkelanjutan Di Sub DAS Martapura Kabupaten Banjar,” Jukung (Jurnal Tek. Lingkungan), vol. 8, no. 1, hal. 18–31, 2022, doi: http://dx.doi.org/10.20527/jukung.v8i1.12966.

D. Mulyanti, “Kearifan Lokal Masyarakat Terhadap Sumber Mata Air Sebagai Upaya Konservasi Dan Pengelolaan Sumber Daya Lingkungan,” Bina Huk. Lingkung., vol. 6, no. 3, hal. 410–424, 2022, doi: https://doi.org/10.24970/bhl.v6i3.286.

H. Said, N. Matondang, dan H. N. Irmanda, “Penerapan Algoritma K-Nearest Neighbor Untuk Memprediksi Kualitas Air Yang Dapat Dikonsumsi,” Techno.Com, vol. 21, no. 2, hal. 256–267, 2022, doi: https://doi.org/10.33633/tc.v21i2.5901.

M. A. Fadilah, H. D. L. Damanik, dan Yulianto, “Kejadian Diare Pada Balita Berdasarkan Perilaku Cuci Tangan Pakai Sabun dan Sarana Air Minum di Wilayah Kerja Puskesmas Kabupaten Ogan Ilir,” J. Sanitasi Lingkung., vol. 2, no. 1, hal. 60–65, 2022, doi: https://doi.org/10.36086/jsl.v2i1.878.

R. F. Putra et al., Data Mining : Algoritma dan Penerapannya. Jambi: PT. Sonpedia Publishing Indonesia, 2023. [Daring]. Tersedia pada: https://books.google.co.id/books?hl=en&lr=&id=zLHGEAAAQBAJ&oi=fnd&pg=PA22&dq=Putra,+R.+F.,+Zebua,+R.+S.+Y.,+Budiman,+B.,+Rahayu,+P.+W.,+Bangsa,+M.+T.+A.,+Zulfadhilah,+M.,+...+%26+Andiyan,+A.+(2023).+DATA+MINING:+Algoritma+dan+Penerapannya.+PT.+Sonpedia+Publishing+Indonesia.&ots=tzLeatVPK5&sig=JL_Vj7a1s0IG02rgKWcCmlXuCJM&redir_esc=y#v=onepage&q&f=false

A. F. Nugraha, R. F. A. Aziza, dan Y. Pristyanto, “Penerapan metode Stacking dan Random Forest untuk Meningkatkan Kinerja Klasifikasi pada Proses Deteksi Web Phishing,” J. Infomedia Tek. Inform. Multimed. Jar., vol. 7, no. 1, hal. 39–44, 2022, doi: https://dx.doi.org/10.30811/jim.v7i1.2959.

I. Werdiningsih et al., “Identifikasi Penipuan Kartu Kredit Pada Transaksi Ilegal Menggunakan Algoritma Random Forest dan Decision Tree,” J. Sisfokom (Sistem Inf. dan Komputer), vol. 12, no. 3, hal. 477–484, 2023, doi: https://doi.org/10.32736/sisfokom.v12i3.1730.

M. M. Mutoffar, M. Naseer, dan A. Fadillah, “Klasifikasi Kualitas Air Sumur Menggunakan Algoritma Random Forest,” Naratif J. Nas. Riset, Apl. dan Tek. Inform., vol. 4, no. 2, hal. 138–146, 2022, doi: https://doi.org/10.53580/naratif.v4i2.160.

L. Savitri dan R. Nursalim, “Klasifikasi Kualitas Air Minum menggunakan Penerapan Algoritma Machine Learning dengan Pendekatan Supervised Learning,” Diophantine J. Math. Its Appl., vol. 2, no. 01, hal. 30–36, 2023, doi: https://doi.org/10.33369/diophantine.v2i01.28260.

Y. Christian, Jacky, P. A. Winata, Ricky, dan N. Jeonanto, “Prediksi Kualitas Air Menggunakan Algoritma Naïve Bayes Dan Random Forest,” Komputek, vol. 6, no. 2, hal. 42–48, 2022, doi: 10.24269/jkt.v6i2.1313.

O. W. Yuda, D. Tuti, L. S. Yee, dan Susanti, “Penerapan Penerapan Data Mining Untuk Klasifikasi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Random Forest,” SATIN - Sains dan Teknol. Inf., vol. 8, no. 2, hal. 122–131, 2022, doi: https://doi.org/10.33372/stn.v8i2.885.

A. Putri et al., “Comparison of K-NN, Naive Bayes and SVM Algorithms for Final-Year Student Graduation Prediction,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 1, hal. 20–26, 2023, doi: https://doi.org/10.57152/malcom.v3i1.610.

Athifaturrofifah, R. Goejantoro, dan D. Yuniarti, “Perbandingan Pengelompokan K-Means dan K-Medoids Pada Data Potensi Kebakaran Hutan/Lahan Berdasarkan Persebaran Titik Panas (Studi Kasus : Data Titik Panas Di Indonesia Pada 28 April 2018),” J. EKSPONENSIAL, vol. 10, no. 2, hal. 143–152, 2019.

D. Alita dan A. Rahman, “Pendeteksian Sarkasme pada Proses Analisis Sentimen Menggunakan Random Forest Classifier,” J. Komputasi, vol. 8, no. 2, hal. 50–58, 2020, doi: http://dx.doi.org/10.23960%2Fkomputasi.v8i2.2615.

L. J. Muhammad, A. A. Haruna, I. A. Mohammed, M. Abubakar, B. G. Badamasi, dan J. M. Amshi, “Performance Evaluation of Classification Data Mining Algorithms on Coronary Artery Disease Dataset,” in International eConference on Computer and Knowledge Engineering (ICCKE), 2019, hal. 1–5. doi: 10.1109/ICCKE48569.2019.8964703.

Yuyun, N. Hidayah, dan S. Sahibu, “Algoritma Multinomial Naïve Bayes Untuk Klasifikasi Sentimen Pemerintah Terhadap Penanganan Covid-19 Menggunakan Data Twitter,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 4, hal. 820–826, 2021, doi: https://doi.org/10.29207/resti.v5i4.3146.

Diterbitkan

10-01-2024

Cara Mengutip

Abdi, K., Warjaya, A., Muthmainnah, I., & Pahutar, P. H. (2024). Penerapan Algoritma Random Forest dalam Prediksi Kelayakan Air Minum. Jurnal Ilmu Komputer Dan Informatika, 3(2), 81–88. https://doi.org/10.54082/jiki.81