Prediksi Risiko Stunting pada Balita menggunakan Algoritma Logistic Regression dan Decision Tree berbasis Data Terbuka

Authors

  • Diana Yusuf Program Studi Sistem Informasi, ITB Ahmad Dahlan
  • Fahrul Razi Program Studi Teknologi Informasi, ITB Ahmad Dahlan
  • Shevti Arbekti Arman Program Studi Teknologi Informasi, ITB Ahmad Dahlan
  • Vany Terisia Program Studi Teknologi Informasi, ITB Ahmad Dahlan
  • Revi Nurjayanti Program Studi Sistem Informasi, ITB Ahmad Dahlan

Keywords:

Stunting, Logistic Regression, Decision Tree, Prediksi Risiko, Machine Learning

Abstract

Stunting masih menjadi tantangan kesehatan utama yang berdampak pada pertumbuhan dan perkembangan anak di Indonesia. Upaya deteksi dini risiko stunting memerlukan pendekatan berbasis data yang akurat dan praktis. Penelitian ini bertujuan mengembangkan dan membandingkan dua model klasifikasi, yaitu Logistic Regression dan Decision Tree, untuk memprediksi risiko stunting pada balita dengan memanfaatkan data kesehatan terbuka. Dataset yang digunakan mencakup variabel usia, berat lahir, berat badan, panjang badan, dan jenis kelamin. Proses penelitian meliputi preprocessing data, pemabagian data menjadi data latih dan data uji, penerapan model, serta evaluasi performa menggunakan metrik akurasi, precision, recall, dan F1-Score. Hasil penelitian menunjukkan bahwa Logistic Regression memberikan performa lebih stabil dengan akurasi 84,4% pada data latih dan uji. Decision Tree memiliki akurasi lebih tinggi pada data latih (96,5%) namun menurun pada data uji (78,7%), menunjukkan kecenderungan overfitting. Visualisasi Decision Tree mengungkapkan bahwa usia dan berat badan menjadi fitur paling dominan dalam klasifikasi risiko stunting. Berdasarkan hasil tersebut, Logistic Regression direkomendasikan sebagai model yang lebih andal untuk implementasi prediski stunting di tingkat layanan kesehatan masyarakat. Temuan ini diharapkan dapat memberikan kontribusi bagi pengembangan sistem pendukung keputusan berbasis data dalam mitigasi stunting.

References

Angriani, S., Jalil, N., Aminah, S., & Salim, N. A. (2023). Classification of Big Data Stunting Using Support Vector Regression and Voting Classifier. Indonesian Journal of Artificial Intelligence and Data Mining, 6(1), 1-10.

Aini, N., Hastomo, W., & Yulika Go, R. (2023). Prediction of Anthropogenic Greenhouse Gas Emissions via Manure Management in Indonesia and Alternative Policies for Indonesian Livestock Development. Journal of Renewable Energy and Environment, 10(3), 99–106. https://doi.org/10.30501/jree.2022.354796.1423

Fitriani, D., Sutrisno, R., & Lestari, S. (2023). Prediksi Stunting Menggunakan Algoritma Logistic Regression Berbasis Data Kesehatan Balita di Sumatera Barat. Jurnal Kesehatan Masyarakat Nasional, 18(1), 87-95.

Han, J., Kamber, M., & Pei, J. (2022). Data Mining: Concepts and Techniques. Morgan Kaufmann.

Hastomo, W., Aini, N., Karno, A. S. B., & Rere, L. M. R. (2022). Machine Learning Methods for Predicting Manure Management Emissions. Jurnal Nasional Teknik Elektro Dan Teknologi Informasi, 11(2 SE-Articles). https://doi.org/10.22146/jnteti.v11i2.2586

Hastomo, W., Bayangkari Karno, A. S., Kalbuana, N., Meiriki, A., & Sutarno. (2021). Characteristic Parameters of Epoch Deep Learning to Predict Covid-19 Data in Indonesia. Journal of Physics: Conference Series, 1933(1), 012050. https://doi.org/10.1088/1742-6596/1933/1/012050

Kemenkes RI. (2021). Profil Kesehatan Indonesia 2021. Kementerian Kesehatan Republik Indonesia.

Kumaidi. 2005. Pengukuran Bekal Awal Belajar dan Pengembangan Tesnya. Jurnal Ilmu Pendidikan. Jilid 5, No. 4,

Kusnadi, B., Setiawan, R., & Dewi, M. (2022). Implementasi Logistic Regression untuk Prediksi Risiko Stunting pada Balita. Jurnal Teknologi Informasi Kesehatan, 10(2), 145-153.

Nurhayati, N., & Rahmawati, E. (2022). Pemodelan Prediksi Stunting Menggunakan Pendekatan Machine Learning Berbasis Data Terbuka. Jurnal Data Science Indonesia, 5(2), 112-120.

Purwati, N., & Sulistyo, G. B. (2023). Stunting Early Warning Application Using KNN Machine Learning Method. Jurnal Riset Informatika, 5(3), 373-380

Rao, B., Rashid, M., Hasan, M. G., & Thunga, G. (2025). Machine Learning in Predicting Child Malnutrition: A Meta-Analysis of Demographic and Health Surveys Data. International Journal of Environmental Research and Public Health, 22(3), 449.

Wulandari, S., & Putra, Y. (2023). Decision Tree untuk Identifikasi Faktor Risiko Stunting pada Balita. Jurnal Informatika dan Sistem Kesehatan, 7(3), 221-230.

Yusuf, D., Setri, E. (2020). Metode Decision Tree Dalam Klasifikasi Kredit Pada Nasabah PT Bank Perkreditan Rakyat (Studi Kasus : PT BPR Lubuk Raya Mandiri). Jurnal Sistem Informasi (JUSIN), 1(1), 21-28.

Yulianto, R., Faqihudin, Rusli, M. S., Karno, A. S. B., Hastomo, W., Kardian, A. R., Terisia, V., & Surawan, T. (2023). Innovative UNET-Based Steel Defect Detection Using 5 Pretrained Models. Evergreen, 10(4), 2365–2378. https://doi.org/10.5109/7160923

Zemariam, A. B., Yimer, A., Abebe, G. K., Wondie, W. T., Abate, B. B., & Alamaw, A. W. (2025). Prediction of Stunting and Its Socioeconomic Determinants Among Adolescent Girls in Ethiopia Using Machine Learning Algorithms. PLOS ONE, 20(1), e0316452.

Downloads

Published

2025-07-09

Issue

Section

Articles