Modelos predictivos en la clasificación de nacidos vivos y mortinatos: un estudio comparativo entre técnicas de machine learning y regresión logística en función de variables sociodemográficas y clínicas

Predictive models in the classification of live births and stillbirths: a comparative study between machine learning and logistic regression techniques as a function of sociodemographic and clinical variables

Contenido principal del artículo

Resumen

Introducción: La mortalidad fetal continúa siendo un problema de salud pública en Colombia, que afecta significativamente el bienestar familiar y social. Es fundamental identificar los factores asociados y predecir el riesgo para implementar intervenciones efectivas. Objetivo: Desarrollar un modelo estadístico para clasificar a las gestantes en riesgo de mortalidad fetal en Colombia durante el año 2022. Métodos: Se realizó un estudio de casos y controles utilizando datos de nacidos vivos y defunciones fetales reportados por el Departamento Administrativo Nacional de Estadística. Se aplicaron técnicas de imputación de datos faltantes y balanceo de clases mediante el método SMOTE. Se evaluaron cuatro modelos de clasificación: regresión logística, K-Nearest Neighbors (KNN), árbol de decisión y máquina de soporte vectorial. El rendimiento de los modelos se comparó utilizando métricas de exactitud, sensibilidad, especificidad, puntaje F1 y precisión. Resultados: El conjunto de datos final incluyó 566.806 registros, con 562.828 nacidos vivos y 3.978 muertes fetales. El modelo KNN presentó el mejor rendimiento, con una exactitud de 0,988, sensibilidad de 0,989, especificidad de 0,986 y puntaje F1 de 0,988. Los factores asociados significativamente con la probabilidad de nacer vivo incluyeron el número de hijos, el sexo, el área de residencia, el régimen de afiliación, las semanas de gestación, el peso al nacer, la edad y el nivel educativo de la madre. Conclusión: El modelo KNN demostró ser efectivo en la predicción del riesgo de mortalidad fetal. Los resultados resaltan la importancia de factores socioeconómicos y clínicos en la supervivencia neonatal, sugiriendo la necesidad de intervenciones focalizadas para reducir las muertes fetales en Colombia.

Descargas

Los datos de descargas todavía no están disponibles.

Datos de publicación

Metric
Este artículo
Otros artículos
Revisores/as por pares 
1
2.4

Perfil evaluadores/as  N/D

Declaraciones de autoría

Declaraciones de autoría
Este artículo
Otros artículos
Disponibilidad de datos 
N/D
16%
Financiación externa 
No
32%
Conflictos de intereses 
N/D
11%
Metric
Esta revista
Otras revistas
Artículos aceptados 
10%
33%
Días para la publicación 
30
145

Indexado en

Editor y equipo editorial
Perfiles
Sociedad académica 
Universidad de Cartagena
Editorial 
Universidad de Cartagena

Detalles del artículo

Referencias (VER)

Goldenberg RL, McClure EM, Belizán JM. Commentary: Reducing the world’s stillbirths. Vol. 9, BMC Pregnancy and Childbirth. 2009. DOI: https://doi.org/10.1186/1471-2393-9-S1-S1

García MV, Cuberos MA, Vera MÁ, Vivas García M, Cuberos MA, Vera MÁ. Mortalidad fetal en madres adolescentes y adultas, un problema de salud pública TT - Fetal mortality in adolescent and adult mothers: a public health problem. Salud(i)Ciencia. 2019;23 (5).

Lawn JE, Blencowe H, Pattinson R, Cousens S, Kumar R, Ibiebele I, et al. Stillbirths: Where? When? Why? How to make the data count? Vol. 377, The Lancet. 2011. DOI: https://doi.org/10.1016/S0140-6736(10)62187-3

Departamento Administrativo Nacional de Estadisticas. Boletín técnico Estadísticas Vitales (EEVV) [Internet]. Bogotá D.C.; 2024 Mar [cited 2024 Sep 20]. Available from: https://www.dane.gov.co/files/operaciones/EEVV/bol-EEVV-Defunciones-IVtrim2023.pdf

Winkler AM, Ridgway GR, Webster MA, Smith SM, Nichols TE. Permutation inference for the general linear model. Neuroimage. 2014 May 15;92:381–97. DOI: https://doi.org/10.1016/j.neuroimage.2014.01.060

Casella G, Fienberg S, Olkin I. Springer Texts in Statistics [Internet]. Available from: www.springer.com/series/417

Chartier S, Faulkner A. General Linear Models: An Integrated Approach to Statistics. Tutor Quant Methods Psychol. 2008 Sep 1;4(2):65–78. DOI: https://doi.org/10.20982/tqmp.04.2.p065

Helwig NE. Robust nonparametric tests of general linear model coefficients: A comparison of permutation methods and test statistics. Neuroimage. 2019 Nov 1;201. DOI: https://doi.org/10.1016/j.neuroimage.2019.116030

Aizerman MA, Braverman EM, Rozonoer LI. Theoretical Foundatiosn of the Potential Function Method in Pattern Recognition Learning. Telemekhanika. 1964;25(6):971–936.

Huang S, Nianguang CAI, Penzuti Pacheco P, Narandes S, Wang Y, Wayne XU. Applications of support vector machine (SVM) learning in cancer genomics. Vol. 15, Cancer Genomics and Proteomics. International Institute of Anticancer Research; 2018. p. 41–51. DOI: https://doi.org/10.21873/cgp.20063

Noble WS. What is a support vector machine? [Internet]. Vol. 24, NATURE BIOTECHNOLOGY. 2006. Available from: http://www.nature.com/naturebiotechnology DOI: https://doi.org/10.1038/nbt1206-1565

Hu LY, Huang MW, Ke SW, Tsai CF. The distance function effect on k-nearest neighbor classification for medical datasets. Springerplus. 2016;5(1). DOI: https://doi.org/10.1186/s40064-016-2941-7

Ehsani R, Drabløs F. Robust Distance Measures for kNN Classification of Cancer Data. Cancer Inform. 2020;19. DOI: https://doi.org/10.1177/1176935120965542

Hu J, Szymczak S. A review on longitudinal data analysis with random forest. Vol. 24, Briefings in Bioinformatics. 2023. DOI: https://doi.org/10.1093/bib/bbad002

Breiman L. Random Forests. Vol. 45. 2001. DOI: https://doi.org/10.1023/A:1010933404324

Cutler DR, Edwards TC, Beard KH, Cutler A, Hess KT, Gibson J, et al. Random forests for classification in ecology. Ecology. 2007;88 (11). DOI: https://doi.org/10.1890/07-0539.1

Graham SE, Clarke SL, Wu KHH, Kanoni S, Zajac GJM, Ramdas S, et al. The power of genetic diversity in genome-wide association studies of lipids. Nature. 2021;600 (7890).

Powers DMW. Evaluation: from precision, recall and F-measure to ROC, informedness, markedness and correlation. International Journal of Machine Learning Technology. 2011;2 (1):37–63.

Fawcett T. An introduction to ROC analysis. Pattern Recognit Lett. 2006 Jun;27 (8):861–74. DOI: https://doi.org/10.1016/j.patrec.2005.10.010

He H, Garcia EA. Learning from Imbalanced Data. IEEE Trans Knowl Data Eng. 2009;21 (9):1263–84. DOI: https://doi.org/10.1109/TKDE.2008.239

Sokolova M, Lapalme G. A systematic analysis of performance measures for classification tasks. Inf Process Manag. 2009 Jul;45 (4):427–37. DOI: https://doi.org/10.1016/j.ipm.2009.03.002

Van Rijsbergen CJ. Information retrievial. 1979.

Manning C, Raghavan P, Schütze H. An introduction to information retrieval. Cambridge; 2009. DOI: https://doi.org/10.1017/CBO9780511809071

Japkowicz N, Stephen S. The class imbalance problem: A systematic study. Intell Data Anal. 2002 Oct;6(5):429–49. DOI: https://doi.org/10.3233/IDA-2002-6504

Departamento Administrativo Nacional de Estadistica DANE. Boletín Técnico Estadísticas Vitales (EEVV) Nacidos Vivos. Bogotá, DC; 2023 Mar.

Departamento Administrativo Nacional de Estadistica. Boletín técnico Estadísticas Vitales (EEVV) Defunciones. Bogotá, DC; 2023 Mar.

McClure EM, Saleem S, Goudar SS, Garces A, Whitworth R, Esamai F, et al. Stillbirth 2010–2018: a prospective, population-based, multi-country study from the Global Network. Reprod Health. 2020 Nov 30;17 (S2):146. DOI: https://doi.org/10.1186/s12978-020-00991-y

Mgaya AH, Massawe SN, Kidanto HL, Mgaya HN. Grand multiparity: is it still a risk in pregnancy? BMC Pregnancy Childbirth. 2013 Dec 23;13(1):241. DOI: https://doi.org/10.1186/1471-2393-13-241

Galvis-Aponte L, Rico J. Desigualdades regionales en la salud en Colombia. 2023 Jun. DOI: https://doi.org/10.32468/dtseru.316

Ministerio S y PS. Informe Nacional de Calidad de la Atención en Salud 2015 [Internet]. Bogotá, DC; 2015 Dec [cited 2024 Nov 10]. Available from: https://www.minsalud.gov.co/sites/rid/Lists/BibliotecaDigital/RIDE/DE/DIJ/informe-nal-calidad-atencion-salud-2015.pdf

Cáceres-Manrique F de M, Molina-Marín G. Inequidades sociales en atención materna. Rev Colomb Obstet Ginecol. 2010 Sep 30;61 (3):231–8. DOI: https://doi.org/10.18597/rcog.269

Merlano Porras C, Gorbanev I. Health system in Colombia: A systematic review of literature. Revista Gerencia y Políticas de Salud. 2013 Jun 1;12:74–86.

Kramer MS. Determinants of low birth weight: methodological assessment and meta-analysis. Bull World Health Organ. 1987;65 (5):663–737.

Blencowe H, Cousens S, Chou D, Oestergaard M, Say L, Moller AB, et al. Born Too Soon: The global epidemiology of 15 million preterm births. Reprod Health. 2013 Nov 15;10 (S1):S2. DOI: https://doi.org/10.1186/1742-4755-10-S1-S2

Liu L, Oza S, Hogan D, Chu Y, Perin J, Zhu J, et al. Global, regional, and national causes of under-5 mortality in 2000–15: an updated systematic analysis with implications for the Sustainable Development Goals. The Lancet. 2016 Dec;388 (10063):3027–35. DOI: https://doi.org/10.1016/S0140-6736(16)31593-8

Ganchimeg T, Ota E, Morisaki N, Laopaiboon M, Lumbiganon P, Zhang J, et al. Pregnancy and childbirth outcomes among adolescent mothers: a World Health Organization multicountry study. BJOG. 2014 Mar 18;121 (s1):40–8. DOI: https://doi.org/10.1111/1471-0528.12630

Jolly M, Sebire N, Harris J, Robinson S, Regan L. The risks associated with pregnancy in women aged 35 years or older. Human Reproduction. 2000 Nov 1;15 (11):2433–7. DOI: https://doi.org/10.1093/humrep/15.11.2433

D’Ascoli PT, Alexander GR, Petersen DJ, Kogan MD. Parental factors influencing patterns of prenatal care utilization. J Perinatol. 1997;17(4):283–7.

Victora CG, Aquino EM, do Carmo Leal M, Monteiro CA, Barros FC, Szwarcwald CL. Maternal and child health in Brazil: progress and challenges. The Lancet. 2011 May;377 (9780):1863–76. DOI: https://doi.org/10.1016/S0140-6736(11)60138-4

Gakidou E, Cowling K, Lozano R, Murray CJ. Increased educational attainment and its effect on child mortality in 175 countries between 1970 and 2009: a systematic analysis. The Lancet. 2010 Sep;376 (9745):959–74. DOI: https://doi.org/10.1016/S0140-6736(10)61257-3

Fuchs R, Pamuk E, Lutz W. Education or wealth: Which matters more for reducing child mortality in developing countries? Vienna Yearb Popul Res. 2010 Nov;8:175–99. DOI: https://doi.org/10.1553/populationyearbook2010s175

Güneş PM. The role of maternal education in child health: Evidence from a compulsory schooling law. Econ Educ Rev. 2015 Aug;47:1–16. DOI: https://doi.org/10.1016/j.econedurev.2015.02.008

Cover T, Hart P. Nearest neighbor pattern classification. IEEE Trans Inf Theory. 1967 Jan;13 (1):21–7. DOI: https://doi.org/10.1109/TIT.1967.1053964