Alternativas para el análisis de correlación cuando no se cumple el supuesto de normalidad bivariante: Simulación y ejemplos en R
Resumen
En este trabajo se realiza un análisis crítico sobre el uso del coeficiente de correlación, ya que, en muchos casos, se emplea de manera inadecuada, lo que puede generar conclusiones e interpretaciones sesgadas, basadas en comportamientos diferentes a los supuestos considerados. En primer lugar, se realiza una estimación de muestras bivariantes, tanto de tendencia como de presencia de datos atípicos, y se argumenta por qué, bajo estos escenarios, es inapropiado utilizar el coeficiente de correlación lineal de Pearson. Posteriormente, se presentan alternativas para evaluar intervalos de confianza sobre los coeficientes de correlación de Spearman, Kendall y Kappa de Cohen. Finalmente, se presenta un ejemplo utilizando los datos de cobertura educativa en primaria y secundaria en Colombia, ya que estos no cumplen con el supuesto de normalidad bivariante.
Descargas
Citas
Bastías, J. M., Cuadra, M., Muñoz, O., & Quevedo, R. (2013). Correlación entre las buenas prácticas de manufactura y el cumplimiento de los criterios microbiológicos en la fabricación de helados en Chile. Revista chilena de nutrición, 40(2), 161-168.
Santabárbara, J. (2019). Cálculo del intervalo de confianza para los coeficientes de correlación mediante sintaxis en SPSS. REIRE Revista d'Innovació i Recerca en Educació, 12(2), 1-14.
Schober, P., Boer, C., & Schwarte, L. A. (2018). Correlation coefficients: appropriate use and interpretation. Anesthesia & analgesia, 126(5), 1763-1768.
https://doi.org/10.1213/ane.0000000000002864
Bishara, A. J., & Hittner, J. B. (2012). Testing the significance of a correlation with nonnormal data: comparison of Pearson, Spearman, transformation, and resampling approaches. Psychological methods, 17(3), 399.
Zientek, L. R., & Thompson, B. (2007). Applying the bootstrap to the multivariate case: Bootstrap component/factor analysis. Behavior research methods, 39(2), 318-325.
https://doi.org/10.3758/BF03193163
Fleiss, J. L., Cohen, J., & Everitt, B. S. (1969). Large sample standard errors of kappa and weighted kappa. Psychological Bulletin, 72(5), 323–327. https://doi.org/10.1037/h0028106
Serna-Morales, J. K., Elorza, M. C. J., & Lopera-Gómez, C. M. (2024). Comparación de algunas estimaciones del t de Kendall para datos bivariados con censura a intervalo. Ciencia En Desarrollo, 15(1), 130–140. https://doi.org/10.19053/01217488.v15.n1.2024.15586
Smania, G., & Jonsson, E. N. (2021). Conditional distribution modeling as an alternative method for covariates simulation: comparison with joint multivariate normal and bootstrap techniques. CPT: pharmacometrics & systems pharmacology, 10(4), 330-339.
https://doi.org/10.1002/psp4.12613
Gutiérrez, J. S. R. (2024). Ventajas del uso de las ecuaciones diferenciales estocásticas: puente browniano y movimiento browniano geométrico. Multidisciplinary & Health Education Journal, 6(1), 830-838.
Gutierrez, J. S. R. (2024). Métodos inferenciales sobre cadenas de Markov en tiempo discreto con espacio de estados finito. In Actas del II Congreso Internacional de Innovación, Ciencia y Tecnología INUDI–UH, 2024 (pp. 277-288). Instituto Universitario de Innovación Ciencia y Tecnología Inudi Perú. https://doi.org/10.35622/inudi.c.02.15
Azzalini, A., & Capitanio, A. (2003). Distributions generated by perturbation of symmetry with emphasis on a multivariate skew t-distribution. Journal of the Royal Statistical Society Series B: Statistical Methodology, 65(2), 367-389.
https://doi.org/10.1111/1467-9868.00391
Chen, A., Bengtsson, T., & Ho, T. K. (2009). A regression paradox for linear models: Sufficient conditions and relation to Simpson’s paradox. The American Statistician, 63(3), 218-225.
https://doi.org/10.1198/tast.2009.08220
Wulandari, D., Sutrisno, S., & Nirwana, M. B. (2021). Mardia’s skewness and kurtosis for assessing normality assumption in multivariate regression. Enthusiastic: International Journal of Applied Statistics and Data Science, 1-6.
https://doi.org/10.20885/enthusiastic.vol1.iss1.art1
Shi, X., Jiang, Y., Du, J., & Miao, Z. (2024). An adaptive test based on Kendall's tau for independence in high dimensions. Journal of Nonparametric Statistics, 36(4), 1064-1087.
https://doi.org/10.1080/10485252.2023.2296521
Derechos de autor 2025 Jhonier Rangel , Liliana Andrea Ahumada Suárez, Ulpiano Lara-Cristancho, José Alazate, Pitter Javier Cabezas-Chacón

Esta obra está bajo licencia internacional Creative Commons Reconocimiento 4.0.