EL RENDIMIENTO ACADÉMICO DE LOS ESTUDIANTES
DE LA UNIVERSIDAD NACIONAL DEL SANTA SEGÚN
LOS FACTORES SOCIOECONÓMICOS DETERMINADOS
MEDIANTE UNA RED NEURONAL SUPERVISADA
ACADEMIC PERFORMANCE OF STUDENTS OF THE NATIONAL
UNIVERSITY OF SANTA CRUZ ACCORDING TO SOCIOECONOMIC
FACTORS DETERMINED BY A SUPERVISED NEURAL NETWORK
Luzbeth Karin Navarrete Leal
Universidad Nacional del Santa, Perú
Herón Juan Morales Marchena
Universidad Nacional del Santa, Perú
Manuel Abelardo Alcántara Ramírez
Universidad Nacional del Santa, Perú

pág. 7394
DOI: https://doi.org/10.37811/cl_rcm.v9i1.16415
El Rendimiento Académico de los Estudiantes de la Universidad Nacional
del Santa según los Factores Socioeconómicos Determinados Mediante una
Red Neuronal Supervisada
Luzbeth Karin Navarrete Leal1
lux.krn.n.leal@gmail.com
https://orcid.org/0009-0007-3403-5358
Universidad Nacional del Santa
Chimbote
Perú
Herón Juan Morales Marchena
hmorales@uns.edu.pe
https://orcid.org/0000-0002-5394-0958
Universidad Nacional del Santa
Chimbote
Perú
Manuel Abelardo Alcántara Ramírez
malcantara@untels.edu.pe
https://orcid.org/0000-0001-9490-8447
Universidad Nacional Tecnológica de Lima Sur
Lima
Perú
RESUMEN
La investigación tuvo como objetivo desarrollar una red neuronal supervisada para predecir el
rendimiento académico de los estudiantes de la Universidad Nacional del Santa, considerando factores
socioeconómicos. Utilizando un enfoque cuantitativo y un diseño no experimental, se analizó la relación
entre las variables socioeconómicas y los resultados académicos. Se empleó una red neuronal
BackPropagation implementada en la herramienta nntool de MATLAB, con funciones de activación
Tansig y el algoritmo de optimización Levenberg-Marquardt. El modelo de la red fue entrenado con el
60% de los datos históricos obtenidos de fichas socioeconómicas, mientras que el 40% restante se utilizó
para la evaluación. Los resultados mostraron que el modelo era eficaz, aunque se observó que los errores
no eran significativos y podrían reducirse mediante la adición de más capas y neuronas en la red. La
investigación concluye que la red neuronal desarrollada es una herramienta útil para predecir el
rendimiento académico en función de factores socioeconómicos, destacando la importancia de estos
factores en el rendimiento de los estudiantes.
Palabras clave: rendimiento académico, factores socioeconómicos, ficha socioeconómica, red neuronal
artificial, función de activación
1 Autor principal.
Correspondencia: lux.krn.n.leal@gmail.com

pág. 7395
Academic Performance of Students of the National University of Santa
Cruz according to Socioeconomic Factors Determined by a Supervised
Neural Network
ABSTRACT
The research aimed to develop a supervised neural network to predict the academic performance of
students at the Universidad Nacional del Santa, considering socioeconomic factors. Using a quantitative
approach and a non-experimental design, the relationship between socioeconomic variables and
academic results was analyzed. A BackPropagation neural network implemented in the MATLAB
nntool tool was used, with Tansig activation functions and the Levenberg-Marquardt optimization
algorithm. The network model was trained with 60% of the historical data obtained from socioeconomic
records, while the remaining 40% was used for evaluation. The results showed that the model was
effective, although it was observed that the errors were not significant and could be reduced by adding
more layers and neurons in the network. The research concludes that the developed neural network is a
useful tool to predict academic performance based on socioeconomic factors, highlighting the
importance of these factors in student performance.
Keywords: academic performance, socioeconomic factors, socioeconomic record, artificial neural
network, activation function
Artículo recibido 10 diciembre 2024
Aceptado para publicación: 30 enero 2025

pág. 7396
INTRODUCCIÓN
El rendimiento académico de los estudiantes ha sido objeto de estudio durante décadas, dada su
relevancia en el desarrollo personal y profesional de los individuos y en el progreso social y económico
de las comunidades. Entre los diversos factores que influyen en el rendimiento académico, los
socioeconómicos juegan un papel fundamental. Variables como el nivel educativo de los padres, el
acceso a recursos educativos y las condiciones del entorno familiar afectan directamente el desempeño
de los estudiantes. En este contexto, la presente investigación se enfoca en cómo estos factores
socioeconómicos pueden predecir el rendimiento académico, utilizando redes neuronales supervisadas,
un enfoque avanzado en análisis de datos. Las redes neuronales, inspiradas en el cerebro humano, son
capaces de identificar patrones complejos en grandes volúmenes de información, superando las
limitaciones de los métodos estadísticos tradicionales. Esta investigación busca integrar la neurociencia
artificial con la sociología educativa, para mejorar la comprensión y el apoyo a los estudiantes en
función de su contexto socioeconómico.
METODOLOGÍA
La presente investigación presenta un enfoque cuantitativo por la naturaleza de las variables de estudio,
es no experimental en su diseño y al hacer uso de las redes neuronales artificiales para el cálculo y
predicción del rendimiento académico en función de los factores socioeconómicos es del tipo aplicada,
utiliza un proceso inductivo para determinar los pesos y bias adecuadas de la red y así obtener el valor
de salida correspondiente en cada caso, utilizando el 60% de datos históricos recopilados en fichas
socioeconómicas para su entrenamiento y 40% para su evaluación.
Figura N° 1: Metodología de investigación

pág. 7397
La investigación utiliza el método inductivo - deductivo, al partir de un conjunto de datos históricos de
las variables que intervienen en el cálculo del rendimiento académico de los estudiantes, y es a través
de una red neuronal backpropagation se obtiene un modelo que generaliza esta información para cada
estudiante, y el aspecto deductivo corresponde al predecir el cálculo del rendimiento académico de los
estudiantes que no fueron considerados en estos datos históricos.
La investigación es del tipo aplicada, donde se desarrolla la herramienta de las redes neuronales
artificiales para determinar la incidencia de los factores socioeconómicos en el rendimiento académico
de los estudiantes. Su diseño corresponde al tipo no experimental, dado a que se cuenta con una Red
neuronal backpropagation que va a predecir los resultados y a comparar con los obtenidos en los datos
históricos.
La población está conformada por 6022 estudiantes de los ciclos: 2020 – I y 2020 – II. El tamaño de la
muestra fue 2979 estudiantes del ciclo 2020 – I y 2020 – II.
Se emplearon técnicas de observación, análisis documental y encuestas.
Observación, estuvo presente en algunas encuestas realizadas por el personal encargado de la aplicación
de las fichas socioeconómicas. Encuestas online, mediante los registros de fichas virtuales permitirá
recolectar información para los datos de entrada de la Red Neuronal permitiendo contar con una gran
cantidad de datos para la construcción de la base de datos y el entrenamiento. Análisis documental, por
medio del registro de consolidados de notas, facilitará el entrenamiento y evaluación de resultados
esperados.
El procedimiento para la recolección de datos de la presente investigación será:
1. Se solicitó a las oficinas pertinentes las fichas socioeconómicas virtuales y los consolidados de
notas de todos los estudiantes los ciclos 2020-I, 2020-II.
2. Se construyó la base de datos a partir de las fichas y consolidados de los estudiantes en los ciclos
2020-I, 2020-II.
3. Se depuró la base de datos buscando la dependencia de los mismos
4. Se desarrolló un algoritmo de aprendizaje profundo por medio de una red neuronal supervisada que
nos va permitir evaluar el grado de aproximación con los valores deseados.

pág. 7398
5. Se entrenó la red neuronal con el registro de datos de los estudiantes en las fichas socioeconómicas
y los datos de promedios globales por ciclo de los consolidados de notas.
6. Se realizó la evaluación de la red neuronal.
RESULTADOS
El propósito de la investigación fue calcular el rendimiento académico de los estudiantes, mediante la
determinación de los factores influyentes en dicha variable, para lo cual se construyó una red neuronal
artificial supervisada que nos permitió evaluar el grado de aproximación de los valores obtenidos con
los valores deseados, esto fue posible a partir del entrenamiento de la red neuronal con el registro de
datos de los estudiantes en las fichas socioeconómicas y los datos de promedios globales por ciclo de
los consolidados de notas, donde el algoritmo ajustó sus pesos y conexiones internas mediante un
proceso iterativo, con el objetivo de minimizar el error entre las predicciones de la red y las etiquetas
correctas.
Figura N° 2: Diagrama de la Red Neuronal Artificial Supervisada
Fuente: Elaboración Propia
El teorema de Kolmogorov (1957), junto con otros resultados como el teorema de aproximación
universal (1991), fundamenta la idea de que las redes neuronales son aproximadores universales. Es
decir, que una red neuronal suficientemente grande con capas ocultas adecuadas puede aproximar
cualquier función continua con la precisión deseada.

pág. 7399
El algoritmo de retropropagación (backpropagation) en su trabajo seminal de Rumelhart, Hinton y
Williams (1986), logra que una red neuronal aprenda a partir de un conjunto de datos supervisados. Esto
es, ajusta los pesos de las conexiones en la red para que pueda predecir las salidas correctas,
minimizando el error.
En el entrenamiento de la red se consideró como base de datos las fichas socioeconómicas y los registros
de notas de los estudiantes correspondientes a los semestres 2020-I y II. Tras la normalización y
depuración de los datos recopilados, se utilizó un 60% de ellos para el entrenamiento y el 40% restante
para la validación, el algoritmo comienza con la propagación hacia adelante, en la cual los datos de
entrada pasan por la red hasta llegar a la capa de salida, produciendo una predicción. Luego, se calcula
el error (o diferencia) entre la predicción y la salida deseada. Después de eso, la retropropagación ocurre.
Se calcula cómo los errores de la salida afectan a cada una de las neuronas en las capas ocultas,
comenzando desde la capa de salida hacia atrás a las capas anteriores (de ahí el nombre
"retropropagación"). La idea es distribuir este error hacia atrás a través de la red, ajustando los pesos y
las bias en cada capa para reducir el error en futuras iteraciones.
La arquitectura básica de una red neuronal supervisada consiste en capas de neuronas (o nodos)
organizadas en una capa de entrada, una o más capas ocultas y una capa de salida. Las neuronas están
conectadas entre sí por medio de pesos y bias, y en cada neurona se aplica una función de activación
para determinar su salida.
El diseño de la red neuronal supervisada para determinar la incidencia de los factores socioeconómicos
en el rendimiento académico de los estudiantes es del tipo Feed-forward backpropagation, con 6
variables de entrada que representan a los factores socioeconómicos, 2 capas ocultas con 6 y 3 neuronas
respectivamente, y una capa de salida con 1 neurona que muestra el rendimiento académico de los
estudiantes.
Como se observa a continuación:
Matrices de entrada, de pesos y bías en la primera capa oculta.

pág. 7400
𝑋 =
[
𝑥1
𝑥2
𝑥3
𝑥4
𝑥5
𝑥6]6𝑥1
; 𝑊1 =
[
𝑤1,1
(1) 𝑤1,2
(1) 𝑤1,3
(1) 𝑤1,4
(1) 𝑤1,5
(1) 𝑤1,6
(1)
𝑤2,1
(1) 𝑤2,2
(1) 𝑤2,3
(1) 𝑤2,4
(1) 𝑤2,5
(1) 𝑤2,6
(1)
𝑤3,1
(1) 𝑤3,2
(1) 𝑤3,3
(1) 𝑤3,4
(1) 𝑤3,5
(1) 𝑤3,6
(1)
𝑤4,1
(1) 𝑤4,2
(1) 𝑤4,3
(1) 𝑤4,4
(1) 𝑤4,5
(1) 𝑤4,6
(1)
𝑤5,1
(1) 𝑤5,2
(1) 𝑤5,3
(1) 𝑤5,4
(1) 𝑤5,5
(1) 𝑤5,6
(1)
𝑤6,1
(1) 𝑤6,2
(1) 𝑤6,3
(1) 𝑤6,4
(1) 𝑤6,5
(1) 𝑤6,6
(1)]6𝑥6
; 𝑏1 =
[
𝑏1
(1)
𝑏2
(1)
𝑏3
(1)
𝑏4
(1)
𝑏5
(1)
𝑏6
(1)]6𝑥1
; 𝑎1 =
[
𝑎1
(1)
𝑎2
(1)
𝑎3
(1)
𝑎4
(1)
𝑎5
(1)
𝑎6
(1)]6𝑥1
Aplicación de la función de activación en la primera capa oculta, propagación hacia adelante.
𝑣1 = 𝑊1 ∗ 𝑋 + 𝑏1 ; 𝑎1 = 𝜑(𝑣1) 𝑠𝑎𝑙𝑖𝑑𝑎
𝑎𝑖
(1) = 𝜑 (𝑤𝑖1
(1)𝑥1 + 𝑤𝑖2
(1)𝑥2 + 𝑤𝑖3
(1)𝑥3 + 𝑤𝑖4
(1)𝑥4 + 𝑤𝑖5
(1)𝑥5 + 𝑤𝑖6
(1)𝑥6 + 𝑏𝑖
(1) )
𝑃𝑎𝑟𝑎 𝑖 = 1, 2, 3, 4, 5, 6
𝐹𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑎𝑐𝑡𝑖𝑣𝑎𝑐𝑖ó𝑛
𝜑(𝑥) = 2
1 + 𝑒(−2𝑥) − 1
Matrices de entrada, de pesos y bías en la segunda capa oculta.
𝑎1 =
[
𝑎1
(1)
𝑎2
(1)
𝑎3
(1)
𝑎4
(1)
𝑎5
(1)
𝑎6
(1)]6𝑥1
; 𝑊2 =
[
𝑤1,1
(2) 𝑤1,2
(2) 𝑤1,3
(2) 𝑤1,4
(2) 𝑤1,5
(2) 𝑤1,6
(2)
𝑤2,1
(2) 𝑤2,2
(2) 𝑤2,3
(2) 𝑤2,4
(2) 𝑤2,5
(2) 𝑤2,6
(2)
𝑤3,1
(2) 𝑤3,2
(2) 𝑤3,3
(2) 𝑤3,4
(2) 𝑤3,5
(2) 𝑤3,6
(2) ]3𝑥6
; 𝑏2 = [
𝑏1
(2)
𝑏2
(2)
𝑏3
(2)
]
3𝑥1
; 𝑎2 = [
𝑎1
(2)
𝑎2
(2)
𝑎3
(2)
]
3𝑥1
Aplicación de la función de activación en la segunda capa oculta, propagación hacia adelante.
𝑣2 = 𝑊2 ∗ 𝑎1 + 𝑏2 ; 𝑎2 = 𝜑(𝑣2) 𝑠𝑎𝑙𝑖𝑑𝑎
𝑎𝑖
(2) = 𝜑 (𝑤𝑖1
(2)𝑎1
(1) + 𝑤𝑖2
(2)𝑎2
(1) + 𝑤𝑖3
(2)𝑎3
(1) + 𝑤𝑖4
(2)𝑎4
(1) + 𝑤𝑖5
(2)𝑎5
(1) + 𝑤𝑖6
(2)𝑎6
(1) + 𝑏𝑖
(2) )
𝑃𝑎𝑟𝑎 𝑖 = 1, 2, 3
𝐹𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑎𝑐𝑡𝑖𝑣𝑎𝑐𝑖ó𝑛
𝜑(𝑥) = 2
1 + 𝑒(−2𝑥) − 1

pág. 7401
Matrices de entrada, de pesos y bías en la capa de salida.
𝑎2 = [
𝑎1
(2)
𝑎2
(2)
𝑎3
(2)
]
3𝑥1
; 𝑊3 = [𝑤1,1
(3) 𝑤1,2
(3) 𝑤1,3
(3)]1𝑥3; 𝑏3 = [𝑏1
(3)]1𝑥1; 𝑦 = [𝑎1
(3)]1𝑥1
Aplicación de la función de activación en la capa de salida, propagación hacia adelante.
𝑣3 = 𝑊3 ∗ 𝑎2 + 𝑏3 ; 𝑦 = 𝜑(𝑣3) 𝑠𝑎𝑙𝑖𝑑𝑎(𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜)
𝑦 = 𝑎1
(3) = 𝜑 (𝑤11
(3)𝑎1
(2) + 𝑤12
(3)𝑎2
(2) + 𝑤13
(3)𝑎3
(2) + 𝑏1
(3) )
𝐹𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑎𝑐𝑡𝑖𝑣𝑎𝑐𝑖ó𝑛
𝜑(𝑥) = 2
1 + 𝑒(−2𝑥) − 1
El aprendizaje en la Red Neuronal se dá en la modificación de los pesos y bías iniciales, mediante el
incremento de la razón de cambio de la función error respecto a cada peso y bía, este proceso recibe el
nombre de propagación hacía atrás.
𝐹𝑢𝑛𝑐𝑖ó𝑛 𝑒𝑟𝑟𝑜𝑟(𝐸) 𝑦 𝑒𝑟𝑟𝑜𝑟 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑜(𝑒)
𝐸 = 1
2 (𝑠1 − 𝑦 )2 ; 𝑒 = 𝑠1 − 𝑦
𝐷𝑜𝑛𝑑𝑒 𝒔𝟏 𝑒𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜 𝑦 𝒚 𝑒𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑜𝑏𝑡𝑒𝑛𝑖𝑑𝑜
𝑃𝑟𝑜𝑝𝑎𝑔𝑎𝑐𝑖ó𝑛 ℎ𝑎𝑐í𝑎 𝑎𝑡𝑟á𝑠 𝑒𝑛 𝑙𝑜𝑠 𝑝𝑒𝑠𝑜𝑠 𝑦 𝑏í𝑎𝑠
𝑊𝑖 = 𝑊𝑖 + 𝛼. 𝑒. 𝜕𝑦
𝜕𝑊𝑖
i = 1,2,3, 𝛼 : 𝑡𝑎𝑠𝑎 𝑑𝑒 𝑎𝑝𝑟𝑒𝑛𝑑𝑖𝑧𝑎𝑗𝑒
El algoritmo para ajustar los pesos y bias de la red, utiliza el método de
Levenberg-Marquardt implementada en la herramienta nntool de Matlab. Es decir, calcula el gradiente
del error respecto a cada peso, y luego ajustar los pesos en la dirección opuesta a ese gradiente para
reducir el error.
pág. 7402
Figura N° 3: Diagrama de la Red Neuronal Artificial Supervisada
Fuente: Elaboración Propia
Figura N° 4: Evaluación del Sistema de la Red Neuronal Artificial Supervisada
Fuente: Elaboración Propia
Los componentes de la interfaz gráfica están compuestos por diversos componentes: etiquetas que
muestran los nombres, cuadros de texto que aceptan únicamente datos normalizados en el rango de [0
– 1], y una imagen que ilustra las capas de entrada, oculta y salida, además de cómo funciona
internamente cada neurona.