La importancia de las bases de datos en la ciencia forense: el caso de la comparación forense de voz y la población de referencia en el cálculo del LR
Contenido principal del artículo
Resumen
Las ciencias forenses atraviesan un cambio de paradigma impulsado por la transición desde métodos basados en juicio subjetivo hacia enfoques sustentados en mediciones cuantitativas y modelos estadísticos. En este contexto, el enfoque bayesiano se consolida como marco lógico para la interpretación de la evidencia, al contrastar la hipótesis de la defensa (diferente origen de las muestras) frente a la del Ministerio Público (mismo origen) mediante la razón de verosimilitud (RV).
La construcción de la RV exige información sobre la similitud y la tipicidad de las características comparadas. En particular, la estimación de la tipicidad requiere conocer la distribución de dichas características en la población de referencia de la cual proviene la muestra de origen desconocido. En este punto, las bases de datos adquieren un papel central.
Este trabajo destaca su importancia en la comparación forense de voz y muestra cómo el Corpus de Lengua Oral del Español de México, recopilado en la Escuela Nacional de Ciencias Forenses de la UNAM, representa un avance al integrar grabaciones que reflejan la diversidad sociodemográfica y lingüística de hablantes de la Ciudad de México. A partir de un caso práctico, se evidencia que una adecuada selección de la población de referencia mejora la capacidad discriminativa de la RV, mientras que elecciones inadecuadas distorsionan las conclusiones. En consecuencia, el desarrollo de corpus orales estandarizados y representativos constituye una condición indispensable para consolidar la comparación forense de voz.
Métricas
Detalles del artículo
Dimensions citation

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Citas
Morrison GS, Enzinger E, Hughes V, Jessen M, Meuwly D, Neumann C, et al. Consensus on validation of forensic voice comparison. Science & Justice. 2021;61(3):299–309.
Bali AS, Edmond G, Ballantyne KN, Kemp RI, Martire KA. Communicating forensic science opinion: An examination of expert reporting practices. Science & Justice [Internet]. 2020;60(3):216–24. Disponible en: https://www.sciencedirect.com/science/article/pii/S1355030619302102
Balding DJ, Nichols RA. DNA profile match probability calculation: how to allow for population stratification, relatedness, database selection and single bands. Forensic Sci Int [Internet]. 1994;64(2):125–40. Disponible en: https://www.sciencedirect.com/science/article/pii/0379073894902224
Budowle B, Moretti TR, Baumstark AL, Defenbaugh DA, Keys KM. Population Data on the Thirteen CODIS Core Short Tandem Repeat Loci in African Americans, U.S. Caucasians, Hispanics, Bahamians, Jamaicans, and Trinidadians. Journal of Forensic Sciences 1972-2005 [Internet]. el 1 de noviembre de 1999;44(6):1277–86. Disponible en: https://doi.org/10.1520/JFS14601J
Budowle B, Shea B, Niezgoda S, Chakraborty R. CODIS STR Loci Data from 41 Sample Populations. Journal of Forensic Sciences 1972-2005 [Internet]. el 1 de mayo de 2001;46(3):453–89. Disponible en: https://doi.org/10.1520/JFS14996J
Steele CD, Balding DJ. Choice of population database for forensic DNA profile analysis. Science & Justice [Internet]. 2014;54(6):487–93. Disponible en: https://www.sciencedirect.com/science/article/pii/S1355030614001336
President’s Council of Advisors on Science, (PCAST) T. Forensic Science in Criminal Courts: Ensuring Scientific Validity of Feature-Comparison Methods [Internet]. 2016 sep. Disponible en: https://obamawhitehouse.archives.gov/sites/default/files/microsites/ostp/PCAST/pcast_forensic_science_report_final.pdf
Champod C, Evett IW, Jackson G. Establishing the most appropriate databases for addressing source level propositions. Science & Justice [Internet]. 2004;44(3):153–64. Disponible en: https://www.sciencedirect.com/science/article/pii/S1355030604717086
Morrison G. Response to the Forensic Science Questions Posed by the President’s Council of Advisors on Science and Technology. 2015.
Koehler JJ, Mnookin JL, Saks MJ. The scientific reinvention of forensic science. Proceedings of the National Academy of Sciences [Internet]. el 10 de octubre de 2023;120(41):e2301840120. Disponible en: https://doi.org/10.1073/pnas.2301840120
Morrison GS. Advancing a paradigm shift in evaluation of forensic evidence: The rise of forensic data science. Forensic Sci Int [Internet]. 2022;5:100270. Disponible en: https://www.sciencedirect.com/science/article/pii/S2589871X22000559
Morrison GS, Enzinger E. Introduction to forensic voice comparison. 2019;
Evett IW. Towards a uniform framework for reporting opinions in forensic science casework. Science & Justice. 1998;3(38):198–202.
Morrison GS. Measuring the validity and reliability of forensic likelihood-ratio systems. Science & Justice. 2011;51(3):91–8.
R Core Team. R: A Language and Environment for Statistical Computing [Internet]. Vienna, Austria; 2025. Disponible en: https://www.R-project.org/
Morrison GS. A comparison of procedures for the calculation of forensic likelihood ratios from acoustic–phonetic data: Multivariate kernel density (MVKD) versus Gaussian mixture model–universal background model (GMM–UBM). Speech Commun. 2011;53(2):242–56.
Wang J, Liu Y, Li P, Lin Z, Sindakis S, Aggarwal S. Overview of Data Quality: Examining the Dimensions, Antecedents, and Impacts of Data Quality. Journal of the Knowledge Economy [Internet]. 2024;15(1):1159–78. Disponible en: https://doi.org/10.1007/s13132-022-01096-6
Enders CK. Applied missing data analysis. Guilford Publications; 2022.
Hughes V, Foulkes P. What is the relevant population? Considerations for the computation of likelihood ratios in forensic voice comparison. En: Proceedings of Interspeech 2017. 2017.
Nakamura M, Iwano K, Furui S. Differences between acoustic characteristics of spontaneous and read speech and their effects on speech recognition performance. Comput Speech Lang [Internet]. 2008;22(2):171–84. Disponible en: https://www.sciencedirect.com/science/article/pii/S0885230807000459
Bottalico P, Codino J, Cantor-Cutiva LC, Marks K, Nudelman CJ, Skeffington J, et al. Reproducibility of Voice Parameters: The Effect of Room Acoustics and Microphones. Journal of Voice [Internet]. 2020;34(3):320–34. Disponible en: https://www.sciencedirect.com/science/article/pii/S0892199718304338
Van Rossum G, Drake FL. Python 3 reference manual [Internet]. CreateSpace; 2009. Disponible en: https://dl.acm.org/doi/book/10.5555/1593511
Reynolds DA, Quatieri TF, Dunn RB. Speaker Verification Using Adapted Gaussian Mixture Models. Digit Signal Process [Internet]. 2000;10(1):19–41. Disponible en: https://www.sciencedirect.com/science/article/pii/S1051200499903615
Canavos GC, Medal EGU. Probabilidad y estadística. McGraw Hill México; 1987.