Application of XGB Classifier for Obesity Rate Prediction

Authors

  • Duwi Cahya Putri Buani Universitas Nusa Mandiri
  • Nia Nuraeni Universitas Nusa Mandiri
(*) Corresponding Author

DOI:

https://doi.org/10.34288/jri.v6i1.260

Keywords:

Obesity, XGB Classifier, CRIPS-DM

Abstract

According to the Ministry of Health, the percentage of the population in Indonesia who are overweight is 13.5% for adults aged 18 years and over, while 28.7% are obese with BMI>=25 and obese with BMI>=27 as much as 15.4%. Meanwhile, at the age of children 5-12 years, 18.8% were overweight and 10.8% were obese. From these data, early detection of obesity levels is needed. From these data, prevention is needed so that the percentage of the population who experience obsediness can decrease, one of the efforts that can be done is to do early detection of obesity, to do early detection of obesity can be done using Machine Learning. In this study, it was discussed about the prediction of obestias levels using 7 (seven) models, namely Naive Bayes (NB), Random Forest (RF), K-NN, Decision Tree Classifier (DTC), SVM, XGB Classifier (XGB), Logistic Regression (LR) from the seven models used to predict the obesity level of XGB Classifier (XGB) which has the highest accuracy, namely Accurasy 0.96, with an f1-score of 0.96,  Precission and recall 0.96.

Downloads

Download data is not yet available.

References

Cholil, S. R., Handayani, T., Prathivi, R., & Ardianita, T. (2021). Implementasi Algoritma Klasifikasi K-Nearest Neighbor (KNN) Untuk Klasifikasi Seleksi Penerima Beasiswa. IJCIT (Indonesian Journal on Computer and Information Technology), 6(2), 118–127. https://ejournal.bsi.ac.id/ejurnal/index.php/ijcit/article/view/10438

Dasmasela, R., Tomasouw, B. P., & Leleury, Z. A. (2022). Penerapan Metode Support Vector Machine (SVM) Untuk Mendeteksi Penyalahgunaan Narkoba. Jurnal Matematika, Statistik Dan Terapannya. https://ojs3.unpatti.ac.id/index.php/parameter/article/view/3630/2847

Fadillah, A. P. (2015). Penerapan Metode CRISP-DM untuk Prediksi Kelulusan Studi Mahasiswa Menempuh Mata Kuliah (Studi Kasus Universitas XYZ). Jurnal Teknik Informatika Dan Sistem Informasi, 1(3), 2443–2229. https://media.neliti.com/media/publications/133327-ID-penerapan-metode-crisp-dm-untuk-prediksi.pdf

Fuadi, D. F., & Meidian, A. C. (2017). Pengaruh Obesitas Terhadap Kebugaran Anak Sekolah Dasar Usia 10-12 Tahun. Fisioterapi : Jurnal Ilmiah Fisioterapi, 17(2), 78–83. https://doi.org/10.47007/FISIO.V17I2.2216

Hananto, V. R. (2017). Analisis Penentuan Metode Data Mining Untuk Prediksi Kelulusan Mahasiswa Sebagai Penunjang Angka Efisiensi Edukasi.

Hasanah, U., & Nurhopipah, A. (2023). Prediksi Persentase Body Fat Menggunakan Algoritma CART dan M5’. JTIM : Jurnal Teknologi Informasi Dan Multimedia, 4(4), 351–363. https://doi.org/10.35746/JTIM.V4I4.316

James, S. L., Castle, C. D., Dingels, Z. V., Fox, J. T., Hamilton, E. B., Liu, Z., Roberts, N. L. S., Sylte, D. O., Bertolacci, G. J., Cunningham, M., Henry, N. J., Legrand, K. E., Abdelalim, A., Abdollahpour, I., Abdulkader, R. S., Abedi, A., Abegaz, K. H., Abosetugn, A. E., Abushouk, A. I., … Vos, T. (2020). Estimating global injuries morbidity and mortality: methods and data used in the Global Burden of Disease 2017 study. Injury Prevention : Journal of the International Society for Child and Adolescent Injury Prevention, 26(Supp 1), I125–I153. https://doi.org/10.1136/INJURYPREV-2019-043531

Jiang, S. Z., Lu, W., Zong, X. F., Ruan, H. Y., & Liu, Y. (2016). Obesity and hypertension. Experimental and Therapeutic Medicine, 12(4), 2395. https://doi.org/10.3892/ETM.2016.3667

Kemenkeu. (2022). CRISP DM Sebagai Salah Satu Standard untuk Menghasilkan Data Driven Decision Making yang Berkualitas. https://www.djkn.kemenkeu.go.id/artikel/baca/15134/CRISP-DM-Sebagai-Salah-Satu-Standard-untuk-Menghasilkan-Data-Driven-Decision-Making-yang-Berkualitas.html

Kurniawan, I., Buani, D. C. P., Abdussomad, A., Apriliah, W., & Saputra, R. A. (2023). Implementasi Algoritma Random Forest Untuk Menentukan Penerima Bantuan Raskin. Jurnal Teknologi Informasi Dan Ilmu Komputer, 10(2), 421–428. https://doi.org/10.25126/JTIIK.20231026225

Muslehatin, W., & Ibnu, M. (2017). Penerapan Naïve Bayes Classification untuk Klasifikasi Tingkat Kemungkinan Obesitas Mahasiswa Sistem Informasi UIN Suska Riau. 2579–5406. https://ejournal.uin-suska.ac.id/index.php/SNTIKI/article/view/3276

Nasrullah, A. H. (2021). Implementasi Algoritma Decision Tree Untuk Klasifikasi Produk Laris. 7(2). http://ejournal.fikom-unasman.ac.id

Nusrang, M. (2022). Penerapan Metode Random Forest Untuk Klasifikasi Varian Minuman Kopi Di Kedai Kopi Konijiwa Bantaeng. VARIANSI: Journal of Statistics and Its Application on Teaching and Research, 4(3), 121–127. https://doi.org/10.35580/VARIANSIUNM31

Palechor, F. M., & Manotas, A. de la H. (2019). Dataset for estimation of obesity levels based on eating habits and physical condition in individuals from Colombia, Peru and Mexico. Data in Brief, 25, 104344. https://doi.org/10.1016/J.DIB.2019.104344

Rizky Mubarok, M., Herteno, R., Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lambung Mangkurat Jalan Ahmad Yani Km, I., & Selatan, K. (2022). Hyper-Parameter Tuning Pada Xgboost Untuk Prediksi Keberlangsungan Hidup Pasien Gagal Jantung. KLIK - KUMPULAN JURNAL ILMU KOMPUTER, 9(2), 391–401. http://klik.ulm.ac.id/index.php/klik/article/view/484

Roihan, A., Abas Sunarya, P., & Rafika, A. S. (2019). IJCIT (Indonesian Journal on Computer and Information Technology) Pemanfaatan Machine Learning dalam Berbagai Bidang: Review paper. In IJCIT (Indonesian Journal on Computer and Information Technology) (Vol. 5, Issue 1). http://ejournal.bsi.ac.id/ejurnal/index.php/ijcit

Setiyani, L., Indahsari, A. N., Roestam, R., Setiyani, L., Indahsari, A. N., & Roestam, R. (2023). Analisis Prediksi Level Obesitas Menggunakan Perbandingan Algoritma Machine Learning dan Deep Learning. JTERA (Jurnal Teknologi Rekayasa), 8(1), 139–146. https://doi.org/10.31544/JTERA.V8.I1.2022.139-146

Setiyo Nugroho, P., Catur Wijayanti, A., Studi Kesehatan Masyarakat, P., & Kapuas Raya, Stik. (2018). Body Mass Index Dan Kaitannya Dengan Diabetes Melitus Pada Umur > 15 Tahun Di Indonesia, Studi Data Indonesian Family Life Survey V. An-Nadaa: Jurnal Kesehatan Masyarakat (e-Journal), 5(1), 7–10. https://doi.org/10.31602/ANN.V5I1.1643

Sherly, & Sitanggang, D. (2022). Model Prediksi Obesitas dengan Menggunakan Support Vector Machine. http://jurnal.unprimdn.ac.id/index.php/JUSIKOM/article/view/2443/1497

Sibi, S. Y., & Widiarti, A. R. (2005). Klasifikasi Tingkat Obesitas Mempergunakan Algoritma KNN.

Silvana, M., Akbar, R., Syahnum, A., & Informasi, J. S. (2020). Pemanfaatan Metode Naïve Bayes dalam Implementasi Sistem Pakar Untuk Menganalisis Gangguan Perkembangan Anak. Jurnal Nasional Teknologi Dan Sistem Informasi, 6(2), 74–81. https://doi.org/10.25077/TEKNOSI.v6i2.2020.74-81

Sitanggang, D., & Sherly, S. (2022). Model Prediksi Obesitas dengan Menggunakan Support Vector Machine. Jurnal Sistem Informasi Dan Ilmu Komputer Prima(JUSIKOM PRIMA), 5(2), 172–175. https://doi.org/10.34012/JURNALSISTEMINFORMASIDANILMUKOMPUTER.V5I2.2443

Supriyadi, R., Gata, W., Maulidah, N., Fauzi, A., Komputer, I., & Nusa Mandiri Jalan Margonda Raya No, S. (2020). Penerapan Algoritma Random Forest Untuk Menentukan Kualitas Anggur Merah. 13(2), 67–75. http://journal.stekom.ac.id/index.php/E-Bisnis■page67

Tampil, Y., Hanny, K., & Langi, Y. (2017). Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado. https://ejournal.unsrat.ac.id/index.php/decartesian/article/view/17023/16560

WHO. (2023). Obesity. https://www.who.int/health-topics/obesity#tab=tab_1

Wurijanto, T., Setiawan, H. B., & Tjandrarini, A. B. (2022). Penerapan Model CRISP-DM pada Prediksi Nasabah Kredit yang Berisiko Menggunakan Algoritma Support Vector Machine. Jurnal Ilmiah Scroll (Jendela Teknologi Informasi), 10(1), 1–6. https://doi.org/10.30640/EJOURNALSCROLL.V10I1.291

Yudha, M. A. (2021). CRISP-DM, Pendekatan Proses dalam Data Mining | by Muhammad Andi Yudha | Medium. Medium.Com. https://andiyudha.medium.com/crisp-dm-pendekatan-proses-dalam-data-mining-68bf8c2dc908

Yudiana, Y., Yulia Agustina, A., & Nur Khofifah, dan. (2023). Prediksi Customer Churn Menggunakan Metode CRISP-DM Pada Industri Telekomunikasi Sebagai Implementasi Mempertahankan Pelanggan. 8(1), 1–20. http://e-journal.lp2m.uinjambi.ac.id/ojp/index.php/ijoieb

Yulianti, E. H., Soesanto, O., & Sukmawaty, Y. (2022). Penerapan Metode Extreme Gradient Boosting (XGBOOST) pada Klasifikasi Nasabah Kartu Kredit. JOMTA Journal of Mathematics: Theory and Applications, 4(1), 21–26.

Yusa, M., & Sindu, W. (2017). Evaluasi Model Decision Tree C4.5 Guna Prediksi Posibilitas Resiko Obesitas. Seminar Nasional Informatika (SNIf), 1(1), 147–152. https://e-journal.potensi-utama.ac.id/ojs/index.php/SNIf/article/view/257

Downloads

Published

2023-12-21

How to Cite

Cahya Putri Buani, D., & Nuraeni, N. (2023). Application of XGB Classifier for Obesity Rate Prediction. Jurnal Riset Informatika, 6(1), 1–6. https://doi.org/10.34288/jri.v6i1.260