MODELOS DEEP LEARNING PARA
DIAGNÓSTICO DE COVID-19 CON
TOMOGRAFÍAS COMPUTARIZADAS
DE KAGGLE
DEEP LEARNING MODELS FOR DIAGNOSIS OF COVID-19
WITH KAGGLE COMPUTED TOMOGRAPHS
M.Sc. Richard Fernando Fernández Vásquez
Universidad Nacional del Santa, Perú
pág. 552
DOI: https://doi.org/10.37811/cl_rcm.v8i3.11264
Modelos Deep Learning para Diagnóstico de Covid-19 con Tomografías
Computarizadas de Kaggle
M.Sc. Richard Fernando Fernández Vásquez1
2020822010@uns.edu.pe
https://orcid.org/0000-0003-1721-8527
Doctorado en Estadística Matemática
Escuela de Posgrado
Universidad Nacional del Santa
Perú
RESUMEN
Las estadísticas de covid-19 reflejaron una gran preocupación a nivel mundial y sobre todo en el Perú.
Desde marzo del 2020, el brote de la enfermedad por coronavirus empezó a causar muertes en el Perú
frente a un sistema de salud poco preparado para este tipo de situaciones, eso se vio reflejado en la
limitación de camas UCI disponibles. Por lo tanto, el objetivo de la presente investigación fue hacer uso
de modelos de Deep Learning para diagnóstico de Covid-19 haciendo uso de tomografías
computarizadas de Kaggle. A nivel internacional se han desarrollado diversas investigaciones haciendo
uso de Deep Learning para identificar a las personas que tienen Covid-19 mediante el uso de imágenes
médicas, por lo que es importante aprovechar estas aplicaciones para ayudar a las instituciones de salud
en el Perú y de esta manera facilitar su trabajo. En la investigación se usaron tomografías
computarizadas para diagnosticar el Covid-19 recogidos de la plataforma de datos abiertos de kaggle
obteniéndose que el modelo de Deep Learning más adecuado para el diagnóstico de Covid-19 con
tomografías computarizadas del tórax de kaggle fue el modelo de Convolutional Neural Network
GoogleNet, el cual obtuvo un accuracy superior al 90%.
Palabras clave: covid-19, aprendizaje profundo, red neuronal convolucional, googlenet, precisión
1
Autor principal.
Correspondencia: 2020822010@uns.edu.pe
pág. 553
Deep Learning Models For Diagnosis Of Covid-19 With Kaggle Computed
Tomographs
ABSTRACT
The covid-19 statistics reflected great concern worldwide and especially in Peru. Since March 2020,
the outbreak of the coronavirus disease began to cause deaths in Peru in the face of a health system that
was poorly prepared for this type of situation; this was reflected in the limitation of ICU beds that were
available. Therefore, the object of this research was to use Deep Learning models for the diagnosis of
Covid-19 using Kaggle computed tomography scans. At an international level, various investigations
have been developed using Deep Learning to identify people who have Covid-19 through the use of
medical images, so it is important to take advantage of these applications to help health institutions in
Peru and This way make your work easier. In the research, CT scans were used to diagnose Covid-19
collected from the Kaggle open data platform, resulting in the most appropriate Deep Learning model
for diagnosing Covid-19 with Kaggle chest CT scans is the Convolutional model. Neural Network
GoogleNet, which obtained an accuracy greater than 90%.
Keywords: covid-19, deep learning, convolutional neural network,. googlenet; accuracy
Artículo recibido 20 marzo 2024
Aceptado para publicación: 25 abril 2024
pág. 554
INTRODUCCIÓN
Desde marzo del 2020, las estadísticas de covid-19 en el Perú empezaron a mostrar muertes en el Perú
frente a un sistema de salud poco preparado y la limitación de camas UCI. Jesús Valverde, quién es
presidente de la Asociación Peruana de Medicina Intensiva comentó que existen 1,400 camas UCI
operativas en todo el Perú, las cuales, en diciembre de 2020, 1,350 camas UCI se encontraban ocupadas,
es decir, más del 90%.
A nivel internacional se han desarrollado diversas investigaciones haciendo uso de modelos Deep
Learning para identificar a las personas que tienen covid-19 mediante el uso de imágenes médicas, por
lo que es importante aprovechar estas aplicaciones para ayudar a las instituciones de salud en el Perú y
de esta manera facilitar su trabajo.
Por otro lado, la escasez de tener un modelo para detectar de manera fiable el covid-19 a partir del uso
de tomografías computarizadas del tórax hace que sea de importancia la realización de este tipo de
estudios. Esto puede ayudar a los radiólogos a aumentar la precisión de su diagnóstico, expertos en
cuidados intensivos, expertos en cuidados pulmonares y aumentar la eficiencia en la gestión del covid-
19.
Bhattacharya et.al. (2021), mencionaron que las técnicas de Deep Learning aplicadas al procesamiento
de imágenes han ganado un gran impulso en la salud. Apostolopoulos y Mpesiana (2020), haciendo uso
de un conjunto de datos de imágenes de rayos X de GitHub, Cohen, Radiology Society of North
America (RSNA), y la Sociedad Italiana de Radiología Médica e Intervencionista (SIRM) se asociaron
y utilizaron Convolutional Neural Networks para detectar pacientes con COVID-19.
Nur-A-Alam et.al. (2021), mencionaron que un diagnóstico preciso del Covid-19 puede disminuir la
tasa de muerte de los pacientes. Para ello, usaron las imágenes de radiografía del tórax de un grupo de
pacientes y haciendo uso de Deep Learning mediante el entrenamiento de un modelo Convolutional
Neural Networks logró alcanzar un accuracy del 99.49%.
Chaddad et.al. (2020), haciendo uso de tomografías y rayos X de pacientes usaron Deep Learning y
entrenaron diferentes arquitecturas de Convolutional Neural Networks, entre las cuales fueron AlexNet,
DenseNet, GoogleNet, NASNet-Mobile, ResNet18 y DarkNet. Al hacer uso de imágenes de rayos X,
obtuvieron un AUC del 97% y al combinar los rayos X con las imágenes computarizadas del tórax el
pág. 555
modelo de DarkNet alcanzó un accuracy del 99.09% con un AUC de 99.89%.
Minaee et.al. (2020), aplicaron modelos de Deep Learning para detectar pacientes con Covid-19 a partir
de sus imágenes de radiografía de tórax haciendo uso de 5000 radiografías de tórax, quienes entrenaron
modelos de Deep Learning con la arquitectura de Convolutional, la mayoría de los modelos obtuvo una
sensibilidad cercana al 98%.
Yang et.al. (2021), haciendo uso de imágenes médicas de rayos X y tomografías computarizadas para
la detección de Covid-19, emplearon cuatro modelos de Deep Learning y entrenaron diferentes
arquitecturas de Convolutional Neural Networks. Los modelos obtuvieron un accuracy por encima del
96% en la detección de Covid-19.
Akter et.al. (2021), haciendo uso de un conjunto de datos de 3616 imágenes de rayos X del tórax con
Covid-19 y 10192 sin Covid-19, emplearon once modelos de Deep Learning y entrenaron diferentes
arquitecturas de Convolutional Neural Networks, obteniendo un mayor accuracy con un valor del 98%
en la identificación de pacientes con Covid-19.
Siendo el objetivo de la investigación hacer uso de modelos de Deep Learning para diagnóstico de
Covid-19 haciendo uso de tomografías computarizadas de Kaggle la hipótesis planteada fue que el
modelo de Deep Learning GoogleNet para la identificación de pacientes con Covid-19 haciendo uso de
tomografías computarizadas de kaggle, tiene una precisión superior al 90%.
METODOLOGÍA
En la investigación se analizaron las tomografías computarizadas del tórax, los cuales ayudaron a
construir un modelo de Deep Learning para diagnóstico de covid-19 como complemento a los diferentes
estudios que se les realiza a los pacientes. A continuación, se detalla la metodología y los datos más
importantes de la investigación.
Definición de variables
Las variables usadas fueron:
Y: Identifica si la tomografía computarizada pertenece a un paciente diagnosticado con covid-19
(1: si tiene covid-19, 0: no tiene covid-19). Un ejemplo se puede apreciar en la figura 1.
X: Es la imagen de la tomografía computarizada del tórax, la cual es representada mediante una
matriz de pixeles.
pág. 556
Figura 1: Imágenes de rayos X de tórax de personas sin y con Covid-19
Método y diseño de investigación
La investigación fue del tipo cuantitativa, pues fue necesaria información numérica para poder proceder
el análisis estadístico. El diseño de la investigación fue no experimental, transversal, descriptivo y
retrospectivo.
Población y muestra
La población son las tomografías computarizadas como parte de las pruebas para diagnosticar el Covid-
19 recogidos de la plataforma de datos abiertos de kaggle. La muestra fue la parte de la población que
se sirvió para el entrenamiento y validación del modelo de Deep Learning.
Técnicas e instrumentos de recolección de datos
La plataforma de datos abierto de kaggle es una subsidiaria de Google, la cual permite encontrar y
publicar base de datos a toda la comunidad de científicos de datos a nivel mundial. Esta plataforma se
usó para descargar la base de datos que se usó en el desarrollo de la investigación.
Modelos de Deep Learning
Voulodimos et.al. (2017), se menciona que Deep Learning permite modelos computacionales de
múltiples capas de procesamiento para aprender y representar datos con múltiples niveles de abstracción
que imitan cómo el cerebro percibe y comprende información multimodal, capturando implícitamente
estructuras de datos a gran escala. Esto va muy de la mano con el empoderamiento de la computación
GPU paralela, lo cual permitió la migración del entrenamiento de CPU a GPU. Deep Learning ha
avanzado en diferentes aplicaciones, por ejemplo, la detección de objetos, seguimiento de movimientos,
pág. 557
reconocimiento de acciones y segmentación semántica. Uno de los tipos de modelos más usados en
Deep Learning son los modelos de Convolutional Neural Networks.
Arquitectura de Convolutional Neural Networks
Hubel y Wiesel (1962), mencionaron que Convolutional Neural Networks se inspiraron en la estructura
del sistema visual. Por otro lado, Fukurishima (1980), resalta la importancia de los primeros modelos
de redes neuronales. Es así que, LeCun et.al. (1989, 1998 y 2016) diseñaron posteriormente
Convolutional Neural Networks que emplean el gradiente de error alcanzando buenos resultados en
tareas de reconocimiento de patrones y éxito en aplicaciones como reconocimiento facial y autos
autónomos.
En Voulodimos et.al. (2017), presenta que la arquitectura de Convolutional Neural Networks emplea
tres ideas concretas: campos receptivos locales, pesos vinculados y submuestreo espacial. Basado en el
campo receptivo local, cada unidad en la capa convolucional recibe entradas de un conjunto de unidades
vecinas pertenecientes a la capa anterior. De esta manera, las neuronas son capaces de extraer
características visuales elementales como bordes o esquinas. Luego, estas características se combinan
mediante las siguientes capas convolucionales para detectar un orden superior de características. Las
unidades de una capa convolucional se organizan en planos, por lo que cada plano es responsable para
construir una característica específica. Las salidas de los planos se denominan mapas de características.
Cada convolución consta de varios planos, de modo que pueden construirse en cada lugar.
En la figura 2, se muestra una arquitectura de Convolutional Neural Networks para la detección de
objetos.
Figura 2: Arquitectura de Convolutional Neural Networks para la detección de objetos
pág. 558
Modelo de GoogleNet
En Szegedy et.al. (2015), se menciona que una red neuronal convolucional fue desarrollada por los
ingenieros de Google permitiendo un ahorro computacional. Este tipo de red neuronal profunda
presenta 22 capas que es una variante de Inception Network. Se usa en tareas de computer visión,
detección y reconocimiento de rostros, etc.
GoogLeNet presenta tres secciones:
La primera sección llamada convolucional, se caracteriza por presentar dos capas convolucionales
seguidas por una capa de max-pooling.
La segunda sección se presentan sucesivamente tres bloques de dos, cinco y dos módulos de
incepción. Estos tres bloques vienen separados entre sí a través de una capa de max-pooling, tal y
como se muestra en la imagen.
La tecera sección y última capa d e incepción presenta 1.024 mapas/canales de dimensiones 7×7,
además que en todas las capas de convolución, las neuronas son unidades ReLU.
Figura 3: Arquitectura del modelo GoogleNet
Tabla de clasificación
La tabla de clasificación muestra la distribución de valores observados y estimados. Los valores
observados son los valores reales y los valores estimados se obtienen a partir del modelo de Deep
Learning mediante el uso de la arquitectura de Convolutional Neural Networks. Por otro lado, la
capacidad de que el modelo estime el suceso de interés de cuyo valor es 1, se denomina sensibilidad.
Por el contrario, la capacidad de que nuestro modelo no estime el suceso de interés cuyo valor es 0, se
pág. 559
denomina especificidad. Para la presente investigación se usará la sensibilidad como medida de
precisión del modelo de Deep Learning.
Cuadro 1: Tabla de Clasificación
La sensibilidad, especificidad y accuracy, se calcula de la siguiente manera:
Sensibilidad = a/(a+b), indica la capacidad que tiene un modelo para clasificar correctamente la
categoría de interés de la variable dependiente.
Especificidad = d/(c+d), indica la capacidad que tiene un modelo para clasificar correctamente la
categoría que no es de interés de la variable dependiente.
Accuracy = (a+d)/(a+b+c+d), indica la precisión o capacidad que tiene un modelo para clasificar
correctamente de manera global la variable dependiente. El modelo que presente mayor accuracy
es el modelo más adecuado.
RESULTADOS Y DISCUSIÓN
En la investigación se usaron tomografías computarizadas para diagnosticar el Covid-19, las cuales
fueron recogidas de la plataforma de datos abiertos de kaggle obteniéndose que el modelo de Deep
Learning para el diagnóstico de covid-19 con tomografías computarizadas del tórax de kaggle es el
modelo de Convolutional Neural Network GoogleNet, el cual obtuvo un accuracy superior al 90% en
la muestra de validación, con lo cual se puede mencionar que por cada 100 imágenes de pacientes que
presentan o no presentan Covid-19, el modelo puede identificar a 97 de manera correcta. Estos
resultados se pueden apreciar en el cuadro 2.
Cuadro 2: Indicadores del Modelo de Deep Learning Google Net
1 0
1 a b a/(a+b)
0 c d d/(c+d)
A
Porcentaje Global
Pronosticado
A
Observado
pág. 560
Asimismo, en el cuadro 2, se muestras los valores de sensibilidad y especificidad cuyos valores también
son superiores al 90%. En el caso de la sensibilidad, por cada 100 pacientes que realmente fueron
diagnosticados con Covid-19, el modelo puede identificar a 99 de manera correcta. Para el caso de la
especificidad, por cada 100 pacientes que no fueron diagnosticados con Covid-19, el modelo puede
identificar a 94 pacientes.
Con los resultados de este modelo, se puede comentar el aporte para los Hospitales de Latinoamérica,
del Perú y sus pacientes serán los principales beneficiarios. Asimismo, la investigación ayudará a otros
investigadores como referencia bibliográfica y caso de aplicación de Deep Learning en la salud para
que puedan hacer uso en otras aplicaciones.
CONCLUSIONES
Mediante el uso del modelo de Deep Learning aplicado al diagnóstico de covid-19 haciendo uso de
tomografías computarizadas del tórax de la plataforma de datos abiertos de kaggle, se pudo obtener que
el modelo de Convolutional Neural Network GoogleNet obtuvo un accuracy superior al 90%. Con los
resultados de este modelo, ayudará a los radiólogos a aumentar la precisión de sus diagnósticos, a
expertos en cuidados pulmonares intensivos a aumentar la eficiencia en la predicción, en general a
profesionales de la salud a identificar pacientes con covid-19 mucho más rápido que pasar por un
escaneo de imágenes uno por uno.
REFERENCIAS BIBLIOGRÁFICAS
A. Chaddad, L. Hassan and C. Desrosiers (2020). Deep CNN models for predicting COVID-19 in CT
and x-ray images. Journal of Medical Imaging.
A. Krizhevsky, I. Sutskever and G. E.Hinton (2012). Image net classification with deep convolutional
neural networks. Proceedings of the 26th Annual Conference on Neural Information Processing
Systems, NIPS 2012, pp. 10971105.
A. Voulodimos, N. Doulamis, A. Doulamis and E. Protopapadakis (2017). Deep Learning for Computer
Vision: A Brief Review. Department of Informatics, Technological Educational Institute of
Athens.
C. Szegedy, W. Liu, Y. Jia et al. (2015). Going deeper with convolutions. Proceedings of the IEEE
Conference on Computer Vision and Pattern Recognition, CVPR 2015, pp. 19.
pág. 561
D. H. Hubel and T. N. Wiesel (1962). Receptive fields, binocular interaction, and functional architecture
in the cat’s visual cortex. The Journal of Physiology, vol. 160, pp. 106–154.
D. Yang, C. Martínez, L. Visuña et al. (2021). Detection and analysis of COVID-19 in medical images
using deep learning techniques. Scientific Reports. Springer Nature.
I. Soriano, A. Ezponda, F. Mendoza, A. Igual, A. Paternain, J. Pueyo, and G. Bastarrika (2021).
Hallazgos en la tomografía computarizada de tórax en las fases evolutivas de la infección por
SARS-Cov-2. Radiología, vol. 63, no. 3, pp. 218227.
K. Fukushima (1980). Neocognitron: a self-organizing neural network model for a mechanism of
pattern recognition unaffected by shift in position. Biological Cybernetics, vol. 36, no. 4, pp. 193
202.
M. Oquab, L. Bottou, I. Laptev, and J. Sivic (2015). Is object localization for free? - Weakly-supervised
learning with convolutional neural networks. Proceedings of the IEEE Conference on Computer
Vision and Pattern Recognition, CVPR 2015, pp. 685694.
M. Tygert, J. Bruna, S. Chintala, Y. LeCun, S. Piantino, and A. Szlam (2016). A mathematical
motivation for complex-valued convolutional networks. Neural Computation, vol. 28, no. 5, pp.
815825.
N. Alam, M. Ahsan, M. Based, J. Haider and M. Kowalski (2021). COVID-19 Detection from Chest
X-ray Images Using Feature Fusion and Deep Learning. Sensors, vol. 21, pp. 1480.
R. Girshick, J. Donahue, T. Darrell and J. Malik (2014). Rich feature hierarchies for accurate object
detection and semantic segmentation. Proceedings of the 27th IEEE Conference on Computer
Vision and Pattern Recognition, CVPR 2014, pp. 580587.
S. Bhattacharya, P. Kumar, Q. Pham, T. Reddy, S. Rama, C. Lal and M. Alazab (2020). Deep Learning
and medical image processing for coronavirus (COVID-19) pandemic: A survey. Elsevier.
S. Minaee, R. Kafieh, M. Sonka, S. Yazdani and G. Jamalipour (2020). Deep-COVID: Predicting
COVID-19 from chest X-ray images using deep transfer learning. Elsevier.
Y. L. Boureau, J. Ponce and Y. LeCun (2010). A theoretical analysis of feature pooling in visual
recognition. Proceedings of the ICML.
Y. LeCun, L. Bottou, Y. Bengio and P. Haffner (1998). Gradient-based learning applied to document
pág. 562
recognition. Proceedings of the IEEE, vol. 86, no. 11, pp. 22782323.
Y. LeCun, B. Boser, J. S. Denker et al. (1989). Backpropagation applied to handwritten zip code
recognition. Neural Computation, vol. 1, no. 4, pp. 541551.