USO DE GEMINI IA PARA LA COMPRENSIÓN
DE OPERACIONES MATEMÁTICAS EN
EDUCACIÓN GENERAL SUPERIOR:
DESEMPEÑO, RETROALIMENTACIÓN
AUTOMATIZADY EVIDENCIAS SAMR
USE OF GEMINI AI FOR UNDERSTANDING MATHEMATICAL
OPERATIONS IN HIGHER GENERAL EDUCATION: PERFORMANCE,
AUTOMATED FEEDBACK AND SAMR EVIDENCE
Rubio Rubio Sandra Sorayda
Unidad Educativa Belisario Quevedo, Ecuador
Herrera Zapata Efrén Bolívar
Unidad Educativa Belisario Quevedo, Ecuador
Herrera Zapata Cristian René
Unidad Educativa del Milenio Sigchos, Ecuador
Vinicio Chasiluisa Marco
Unidad Educativa Belisario Quevedo, Ecuador
Ortiz Ortíz María Fernanda
Unidad Educativa Carlos Bayardo Limaico Bassantes, Ecuador

pág. 161
DOI: https://doi.org/10.37811/cl_rcm.v9i6.20808
Uso de Gemini IA Para la Comprensión de Operaciones Matemáticas en
Educación General Superior: Desempeño, Retroalimentación Automatizady
Evidencias SAMR
RESUMEN
El estudio analizó el uso de Gemini IA como mediador pedagógico en la comprensión de operaciones
matemáticas en Educación General Superior en la provincia del Guayas, con cuatro propósitos: (1)
estimar el efecto del uso de IA en el desempeño matemático; (2) evaluar el papel de la retroalimentación
automatizada en la mejora del rendimiento; (3) describir cómo la generación de recursos didácticos por
IA, las evidencias de aprendizaje según el modelo SAMR (sustitución, aumento, modificación,
redefinición); y (4) documentar percepciones docentes y estudiantiles para orientar lineamientos de uso
ético. Se aplicó un diseño mixto con componente cuasi-experimental (pretest–postest, grupos no
equivalentes) y componente cualitativo interpretativo (entrevistas, grupos focales, análisis de
portafolios). La muestra incluyó 217 estudiantes y 80 docentes. Los resultados mostraron que el grupo
asistido por IA, obtuvo mejoras significativamente superiores en la resolución de operaciones básicas
frente al grupo control, y que la frecuencia de retroalimentación inmediata, explicó una proporción
relevante de la ganancia de desempeño. Además, las evidencias pasaron de tareas de repetición
procedimental, a productos con mayor nivel de explicación y autorregulación (niveles modificación y
redefinición del modelo SAMR). Docentes y estudiantes reconocieron utilidad pedagógica, pero
exigieron criterios de integridad académica y acceso equitativo.
Palabras clave: inteligencia artificial; operaciones matemáticas; retroalimentación automatizada;
educación general superior
1 Autor principal
Correspondencia: cristian.herrera@educacion.gob.ec
Rubio Rubio Sandra Sorayda1
sandras.rubio@educacion.gob.ec
https://orcid.org/0009-0000-3307-4602
Unidad Educativa Belisario Quevedo
Ecuador
Herrera Zapata Efrén Bolívar
efren.herrera@educacion.gob.ec
https://orcid.org/0009-0003-8464-5833
Unidad Educativa Belisario Quevedo
Ecuador
Herrera Zapata Cristian René
cristian.herrera@educacion.gob.ec
https://orcid.org/0009-0001-9357-3830
Unidad Educativa del Milenio Sigchos
Ecuador
Ortiz Ortíz María Fernanda
mariaf.ortiz@educacion.gob.ec
https://orcid.org/0009-0006-9398-6447
Unidad Educativa Carlos Bayardo Limaico
Bassantes, Ecuador
Vinicio Chasiluisa Marco
vinicio.chasiluisa@educacion.gob.ec
https://orcid.org/0009-0004-1896-5238
Unidad Educativa Belisario Quevedo
Ecuador

pág. 162
Use of Gemini AI for Understanding Mathematical Operations in Higher
General Education: Performance, Automated Feedback and Samr
Evidence
ABSTRACT
The study analyzed the use of Gemini AI as a pedagogical mediator for understanding mathematical
operations in Upper General Education in the province of Guayas, pursuing four aims: (1) to estimate
the effect of AI use on mathematics performance; (2) to assess the role of automated feedback in
improving achievement; (3) to describe how AI-generated instructional resources and learning evidence
align with the SAMR model (substitution, augmentation, modification, redefinition); and (4) to
document teacher and student perceptions to inform guidelines for ethical use. A mixed-methods design
was applied, with a quasi-experimental component (pretest–posttest, nonequivalent groups) and an
interpretive qualitative component (interviews, focus groups, portfolio analysis). The sample comprised
217 students and 80 teachers. Results showed that the AI-assisted group achieved significantly greater
improvements in solving basic operations compared to the control group, and that the frequency of
immediate feedback accounted for a relevant share of the performance gains. Moreover, the evidence
progressed from procedural drill tasks to products with a higher level of explanation and self-regulation
(SAMR model levels of modification and redefinition). Teachers and students acknowledged
pedagogical utility but called for standards of academic integrity and equitable access.
Keywords: artificial intelligence; automated feedback; mathematics operations; SAMR; higher
secondary education
Artículo recibido 14 octubre 2025
Aceptado para publicación: 15 noviembre 2025

pág. 163
INTRODUCCIÓN
Durante la última década, la inteligencia artificial (IA) transformó la conversación educativa desde la
promesa técnica hacia la reorganización efectiva de la enseñanza y el aprendizaje. En ese tránsito, los
modelos multimodales de gran escala y, en particular, Gemini se consolidaron como asistentes
cognitivos capaces de integrar texto, imagen y código, en flujos pedagógicos con retroalimentación
inmediata, generación de materiales y soporte a la evaluación formativa (Opesemowo, 2024). En
educación superior, este giro no se entendió solamente como una adición tecnológica, sino como una
reconfiguración del trabajo docente: menos carga operativa y más mediación crítica, diseño
instruccional y validación de fuentes. Al mismo tiempo, la literatura señaló tensiones persistentes:
desigualdades de acceso, brechas de formación docente y dilemas éticos sobre autoría, sesgo y
privacidad. En ese marco, este estudio se enfocó en cómo el uso de Gemini IA, impactó la comprensión
de operaciones matemáticas en Educación General Superior (EGS), y bajo qué condiciones pedagógicas
y éticas dicho impacto se sostuvo en contextos reales de aula (Hormaza & Rejas de la Peña, 2025).
A escala internacional, organismos de referencia habían insistido en la doble obligación de innovar con
IA y resguardar principios de equidad, transparencia y protección de datos (UNESCO, 2019). Esa
orientación se tradujo en agendas que priorizaron la personalización con responsabilidad, la evaluación
auténtica y la formación docente continua. La investigación reciente complementó ese marco con
evidencia empírica: los sistemas de tutoría inteligente, el repaso automatizado y los generadores de
recursos didácticos, mostraron efectos positivos sobre la comprensión conceptual y el desempeño
procedimental, siempre que el uso se integrara a diseños didácticos explícitos y a criterios de uso ético
(Rivas & Cevallos, 2024). La retroalimentación inmediata emergió como mediador central del
aprendizaje autorregulado y de la corrección temprana de errores; la generación de materiales favoreció
la diferenciación y la accesibilidad; y los modelos de integración tecnológica, en particular, SAMR,
ofrecieron un lenguaje común para describir si la tecnología solo sustituyó prácticas previas o habilitó
tareas pedagógicas imposibles sin IA (Silgado, 2025).
En América Latina, la adopción de IA educativa avanzó en paralelo a desafíos estructurales. La literatura
regional documentó avances puntuales en universidades públicas y privadas, junto con brechas de

pág. 164
infraestructura y heterogeneidad en las competencias digitales docentes. Estudios cuantitativos
reportaron incrementos percibidos en comprensión y motivación, cuando se usaron asistentes de IA para
problemas matemáticos básicos, y trabajos cualitativos subrayaron que el mayor valor pedagógico
apareció cuando la IA se articuló con estrategias de evaluación formativa, andamiaje metacognitivo y
diseño de tareas auténticas. Persistieron, sin embargo, vacíos sobre cómo los docentes reconfiguraron
sus roles, qué evidencias de aprendizaje se generaron y en qué medida la innovación trascendió la
“sustitución” para alcanzar modificación o redefinición según SAMR (Tóala & Giler, 2024).
En Ecuador, la discusión se ancló en prioridades de calidad y pertinencia en educación superior, con
especial énfasis en la mejora de aprendizajes en áreas STEM. Mientras las universidades ampliaron su
ecosistema digital, la integración de IA en cursos de matemáticas mantuvo una adopción desigual:
coexistieron experiencias de exploración avanzada con otras centradas en prácticas de sustitución.
En la provincia del Guayas, el dinamismo demográfico y la concentración de matrícula universitaria
ofrecieron un escenario idóneo para estudiar la validez pedagógica, la aceptabilidad ética y la
factibilidad operativa del uso de Gemini en la comprensión de operaciones matemáticas, un dominio
que condiciona la progresión hacia cursos de estadística, álgebra lineal y métodos cuantitativos
aplicados (Son, 2024).
Desde el punto de vista teórico, este trabajo se enmarcó en cuatro pilares. Primero, la teoría del
andamiaje y el aprendizaje autorregulado, que postuló que la retroalimentación específica, inmediata y
orientada a proceso, potencia la construcción de conocimiento y la transferencia a tareas nuevas.
Segundo, los modelos de tutoría inteligente y de IA generativa, que describieron mecanismos de
diagnóstico, generación de pistas y adaptación de rutas de práctica centradas en evidencias (Li &
Manzari, 2025). Tercero, el modelo SAMR (sustitución, aumentación, modificación, redefinición),
empleado como lente para caracterizar la naturaleza de las tareas y valorar si Gemini operó como simple
sustituto o habilitó transformaciones curriculares (Noster & Gerber, 2024). Cuarto, los marcos de ética
de la IA en educación (equidad, transparencia, protección de datos, trazabilidad), que guiaron criterios
de diseño, consentimiento y resguardo de información.Con base en ese fenómeno, el problema de
investigación se formuló en dos planos. En el plano pedagógico, se observó la ausencia de evidencia
local robusta sobre el efecto de Gemini en la comprensión de operaciones, más allá de percepciones de

pág. 165
utilidad o motivación (Saud Alhazzani, 2024). En el plano de diseño instruccional, faltó documentación
sistemática sobre qué tipo de evidencias de aprendizaje produjeron estudiantes y docentes con Gemini
y cómo esas evidencias se mapearon en niveles SAMR en aulas reales. A ello se añadieron preguntas
operativas: ¿qué rasgos del repaso automatizado estuvieron asociados a mejoras de desempeño? ¿qué
patrones de apropiación docente emergieron y cómo se alinearon con lineamientos de uso ético?
La relevancia del estudio se sostuvo en tres razones. Primero, contribuyó con evidencia empírica sobre
resultados de aprendizaje en un dominio basal (operaciones) que afecta la retención y la progresión
curricular. Segundo, ofreció criterios prácticos para docencia con IA: qué repaso priorizar, cómo diseñar
tareas que alcancen modificación o redefinición, qué resguardos éticos asegurar. Tercero, añadió
insumos de política institucional para formación docente y evaluación, con foco en pertinencia y
escalabilidad en contextos de recursos heterogéneos. (Ko-Wai, 2025)
En consecuencia, este trabajo se propuso estimar el impacto pedagógico de Gemini y describir su
integración didáctica y ética en una institución de EGS en la provincia de Guayas- Ecuador. El objetivo
general se definió como analizar de manera integral el uso de Gemini IA para la comprensión de
operaciones matemáticas en estudiantes de educación superior, considerando desempeño, procesos de
retroalimentación, evidencias SAMR y percepciones de actores. De este propósito se derivaron cuatro
objetivos específicos: (1) estimar el efecto de la IA sobre la comprensión de operaciones matemáticas;
(2) evaluar el papel de la retroalimentación automatizada en la mejora del desempeño; (3) describir
cómo la generación de recursos didácticos por la IA reconfiguró las evidencias de aprendizaje según el
modelo SAMR; y (4) documentar percepciones docentes y estudiantiles para orientar lineamientos de
implementación ética.
Las hipótesis de trabajo quedaron alineadas con esos objetivos. H1: el uso de Gemini se asoció con
mejoras significativas en la comprensión de operaciones frente a condiciones de enseñanza tradicional
equivalente. H2: la retroalimentación automatizada con foco en errores de proceso (no solo en la
respuesta final) se vinculó con incrementos mayores de desempeño que retroalimentaciones genéricas
o exclusivamente sumativas. H3: la generación de recursos con Gemini permitió desplazar evidencias
desde niveles de sustitución/aumentación hacia modificación/redefinición, particularmente cuando las
tareas exigieron explicación de procedimientos, comparación de rutas de solución y construcción de

pág. 166
rúbricas compartidas. H4: las percepciones de docentes y estudiantes valoraron la utilidad pedagógica
de Gemini, condicionada por criterios éticos explícitos (transparencia del rol de la IA, declaración de
uso en productos evaluables, resguardo de datos y equidad de acceso).
El contexto del estudio se caracterizó por cohortes diversas de EGS en el Guayas, con variabilidad en
la experiencia previa con IA, acceso a conectividad y trayectorias académicas que confluyeron en cursos
de matemáticas de primero y segundo año. En ese entorno, la intervención con Gemini se integró a
clases regulares, con dispositivos institucionales y protocolos de consentimiento y anonimización
(Bazurto-Mendoza & Maliza-Muñoz, 2025). Se acompañó a los docentes en el diseño de tareas con IA,
en la calibración del repaso y en la documentación de evidencias para su análisis según SAMR. La
perspectiva adoptada reconoció que la tecnología no operó en el vacío: su efecto dependió de las
decisiones didácticas, del andamiaje y de los resguardos éticos.
METODOLOGÍA
El estudio aplicado fue de tipo mixto, con integración concurrente y diseño convergente-paralelo, de
manera que los componentes cuantitativo y cualitativo se desarrollaron en simultáneo y sus resultados
se integraron por triangulación al cierre. En la vertiente cuantitativa, de carácter aplicado y explicativo,
se implementó un cuasi-experimento pretest–postest con grupos no equivalentes, para estimar el efecto
del uso de Gemini sobre la comprensión de operaciones matemáticas y modelar el papel de la
retroalimentación automatizada como mecanismo explicativo. La vertiente cualitativa se enmarcó en
un enfoque interpretativo (fenomenológico-hermenéutico) con el propósito de recuperar significados,
documentar percepciones docentes y estudiantiles sobre la utilidad y la ética de uso de la IA, y describir
cómo la generación de recursos didácticos con Gemini reconfiguró las evidencias de aprendizaje
conforme al modelo SAMR.
El dispositivo empírico se implementó durante cuatro semanas. A nivel de curso/sección, la condición
de intervención utilizó Gemini (versión estable del semestre, modo conversacional con historial
desactivado y registro de actividad habilitado) para acceder a explicaciones paso a paso, generar
representaciones (tablas, esquemas y visualizaciones simples) y recibir retroalimentación inmediata; la
condición control trabajó con práctica isométrica en contenidos mediante hojas de ejercicios y
retroalimentación diferida del docente.

pág. 167
Para evitar ambigüedades sobre el “tratamiento”, se estandarizó una biblioteca de prompts pedagógicos
(pistas graduadas, solicitudes de explicación, verificación de procedimientos y metacognición) y se
instruyó a los estudiantes de la condición IA para copiar-pegar esos guiones en Gemini durante las
sesiones. Ambos grupos rindieron un pretest y un postest, equivalentes centrados en números naturales
y fracciones. Para minimizar contaminación entre condiciones, la asignación fue por secciones
completas, se aparearon cursos por puntaje de pretest y desempeño histórico, y se establecieron
acuerdos de integridad académica: el grupo control no podía utilizar herramientas de IA durante las
sesiones ni en las tareas evaluadas; el grupo de intervención debía declarar el uso de Gemini en todo
producto mediado por IA. La infraestructura se homogeneizó (dispositivo institucional, conexión de
aula y navegador único) y se registraron métricas técnicas básicas (latencia y errores de llamada) para
evaluar la factibilidad operativa.
La población total estuvo integrada por 500 estudiantes de Educación General Superior y 100 docentes
de Matemáticas, de instituciones fiscales y fiscomisionales urbanas y periurbanas del Guayas. Con
corrección por población finita (95 % de confianza, 5 % de error), la muestra estudiantil resultó en 217
participantes mediante muestreo aleatorio estratificado proporcional por institución y nivel, y la muestra
docente en 80 participantes con muestreo aleatorio estratificado por institución y tramos de experiencia.
Para el componente cualitativo se aplicó muestreo intencional de máxima variación hasta saturación
teórica, incorporando ~24 estudiantes (equilibrando sexo, condición experimental y desempeño) y 12
docentes (mitad intervención y mitad control).
La comprensión de operaciones se operacionalizó en dos planos: procedimental (exactitud y eficiencia
en cómputo) y conceptual (justificación del procedimiento, equivalencias y estimación). Se construyó
una prueba de 40 ítems alineada al currículo (24 de selección múltiple y 16 de respuesta corta con
justificación), sometida a juicio de tres expertos y piloto independiente; se reportó KR-20/α ≥ 0,80 y
evidencia de validez de contenido y de estructura interna diferenciando los dos factores. Además, se
incluyó un módulo de transferencia cercana (variaciones de contexto y números) para distinguir
ganancia por memorización de ganancia conceptual. La retroalimentación automatizada se extrajo de
los registros de Gemini (capturas de chat y metadatos), contabilizando la frecuencia de ciclos por tarea,
la naturaleza del repaso (correctivo, explicativo, metacognitivo) y la latencia entre solicitud y respuesta;

pág. 168
se definieron reglas de anonimización previas al análisis (Pepin & Buchholtz, 2025). La reconfiguración
de evidencias se evaluó mediante una rúbrica SAMR ad hoc aplicada al diseño de tarea y a su producto
final (dos dimensiones; cuatro niveles), con doble codificación ciega y acuerdo interevaluador κ ≥ 0,75.
Las percepciones se recogieron mediante entrevistas semiestructuradas y grupos focales guiados por
protocolos sobre utilidad, carga cognitiva, control de calidad de respuestas de la IA, transparencia y
equidad de acceso; adicionalmente, se aplicaron escalas Likert de actitudes hacia IA y autoeficacia
matemática (α ≥ 0,80).
El procedimiento consistió en cinco momentos. En la semana 0 se validaron instrumentos, se realizó
un piloto con 30 estudiantes para ajustar ítems y tiempos, y se desarrolló una capacitación breve a
docentes de la condición IA en diseño de prompts, verificación de respuestas y manejo de alucinaciones,
enfatizando que Gemini complementa, no sustituye, el juicio docente. En la semana 1 se administró el
pretest y una línea base de familiaridad con IA. Entre las semanas 1 y 4 se realizaron ocho sesiones de
90 minutos: el grupo IA trabajó problemas con andamiaje automatizado y recursos generados por
Gemini (pistas graduadas, tablas comparativas, organizadores gráficos), mientras que el control resolvió
tareas análogas con apoyo tradicional; observadores no participantes registraron fidelidad de
implementación con una lista de cotejo estandarizada. En la semana 4 se aplicó el postest equivalente
y se consolidaron los portafolios; en la semana 5 se condujeron entrevistas, grupos focales y la
codificación SAMR.
El plan analítico combinó estadísticas y análisis cualitativo. En lo cuantitativo, se describieron variables,
se verificaron supuestos y se estimó el efecto de Gemini mediante ANCOVA (postest como dependiente,
grupo como factor, pretest como covariable), reportando η² parcial y g de Hedges. Dado el anidamiento
por curso, se emplearon modelos lineales mixtos con grupos aleatorios para aulas cuando correspondía.
El rol del repaso se examinó con regresiones (o modelos mixtos) incorporando frecuencia, tipo y
latencia, controlando covariables (pretest, sexo, autoeficacia, familiaridad con IA). La reconfiguración
SAMR se analizó comparando niveles entre condiciones (pruebas no paramétricas para ordinales) y
correlacionando el nivel alcanzado con el desempeño. Se realizaron análisis de subgrupos por sexo,
nivel y quintiles de pretest, y se aplicaron correcciones por multiplicidad en contrastes secundarios. Los

pág. 169
datos faltantes se trataron con imputación múltiple cuando el mecanismo fue presumiblemente MAR;
se reportaron análisis de sensibilidad con casos completos.
El análisis cualitativo siguió una tabulación axial asistida por software estadístico, generando mapas
temáticos sobre utilidad pedagógica, aparición de carga extrínseca, confianza en las respuestas de la IA
y condiciones de implementación ética. Se construyeron matrices de convergencia para conectar
patrones cualitativos con efectos cuantitativos (por ejemplo, cursos con mayor proporción de repaso
explicativo tendieron a presentar mayores ganancias en comprensión conceptual).
El estudio observó principios éticos de respeto, beneficencia y justicia. Se obtuvo autorización
institucional, consentimiento informado y asentimiento estudiantil, se garantizó el derecho a retirarse
sin consecuencias académicas y se anonimizaron los datos mediante códigos alfanuméricos con
resguardo cifrado. Se instruyó a docentes y estudiantes en integridad académica con IA (declaración de
uso, verificación de fuentes, prohibición de suplantación de autoría) y se dejó explícito en las consignas
cuándo el apoyo de Gemini estaba permitido y cómo debía citarse. Para el grupo control, se reforzaron
reglas de no-uso de IA durante las sesiones y evaluaciones; se monitoreó el cumplimiento mediante
observación y revisión aleatoria de trazas digitales.
Finalmente, se reconocieron limitaciones: la ausencia de aleatorización individual, la variabilidad en la
pericia docente con tecnología, la heterogeneidad de competencias digitales y la brevedad de la
intervención, lo que restringe inferencias causales de largo plazo. Para mitigar sesgos, se aparearon
secciones por pretest, los correctores del postest estuvieron parcialmente cegados a la condición, se
emplearon errores estándar robustos a clúster, y se documentó la versión de Gemini, el catálogo de
prompts y las métricas de uso para asegurar replicabilidad.
RESULTADOS Y DISCUSIÓN
El análisis combinó inferencia estadística y contraste teórico para responder a los cuatro objetivos. Para
evitar duplicidad de formatos, cada hallazgo se presenta una sola vez con su figura correspondiente (una
por objetivo). Las estimaciones reportan medias ajustadas, tamaños de efecto y, cuando corresponde,
pendientes de regresión y varianza explicada; los supuestos de los modelos (normalidad,
homocedasticidad y homogeneidad de pendientes) fueron verificados antes de cada contraste.

pág. 170
Objetivo 1. Estimar el efecto de Gemini sobre la comprensión de operaciones matemáticas. En la
comparación intergrupal, la condición Gemini presentó una ganancia ajustada superior en el postest de
operaciones aritméticas respecto del control. La Figura 1 muestra medias ajustadas por puntaje basal
mediante ANCOVA: el grupo Gemini alcanzó un incremento medio de ≈ 12,9 puntos y el control ≈ 6,2
puntos (diferencia ajustada ≈ 6,7). El tamaño de efecto estandarizado (g de Hedges) se ubicó en el rango
moderado-alto; al incorporar interceptos aleatorios por aula, la significancia del efecto se mantuvo. Este
patrón reproduce lo descrito en la literatura sobre tutores inteligentes y asistentes de IA, cuando la
intervención se alinea con objetivos curriculares y el repaso es inmediato y específico.
La interpretación sustantiva se ancló en el ajuste instruccional: al proveer andamiajes adaptativos,
Gemini redujo tiempo en zonas de frustración y aumentó práctica productiva. La diferencia entre grupos
persistió tras ajustar por institución, turno y dispositivo, lo que sugiere robustez del efecto más allá de
factores contextuales.
Figura 1. Efecto de Gemini en la comprensión de operaciones matemáticas (medias ajustadas por
pretest).
Objetivo 2. Evaluar el papel de la retroalimentación automatizada en la mejora del desempeño. Se
observó una relación dosis-respuesta entre ciclos de retroalimentación y ganancia individual (Δ
posprueba–preprueba ajustado): la pendiente fue ≈ 0,45 con R² ≈ 0,31 (Figura 2), indicando que cerca
de un tercio de la varianza en la mejora se explicó por la frecuencia de ciclos (intento →
pista/explicación → revisión). El efecto fue mayor cuando predominó repaso explicativo/metacognitivo
frente al puramente correctivo.
Dos mecanismos sustentan el hallazgo: (a) detección temprana de errores y (b) autorregulación
mediante criterios de corrección explícitos. En el decil con sobreuso de pistas y latencias muy bajas

pág. 171
entre intentos se observó atenuación del beneficio, coherente con dependencia de ayudas cuando no
media una consigna que obligue a explicar antes de revelar soluciones.
Figura 2. Relación entre retroalimentación automatizada (ciclos por tarea) y ganancia en puntaje de
operaciones.
Objetivo 3. Describir cómo la generación de recursos didácticos con Gemini reconfigura las evidencias
de aprendizaje según SAMR. La reconfiguración se evaluó clasificando tareas y productos en los
niveles SAMR mediante una rúbrica de dos dimensiones; la codificación fue doble ciega, con κ de
Cohen ≥ 0,75. En el control, el 90 % de evidencias se concentró en Sustitución/Aumento, propio de
tareas tradicionales mejoradas (hojas de ejercicio, práctica cronometrada). Con Gemini, la distribución
se desplazó hacia Modificación (≈ 45 %) y Redefinición (≈ 20 %), incorporando explicaciones
coevaluadas con rúbrica, prompts para contraejemplos y proyectos breves con visualizaciones y
justificaciones interdisciplinarias (Figura 3).
El corrimiento indica un cambio cualitativo de la reproducción procedimental a la producción
conceptual y metacognitiva. En clave de evaluación para el aprendizaje, Gemini operó como coautor
de materiales (bancos de problemas isomorfos, organizadores, simulaciones ligeras), habilitando tareas
difícilmente viables sin tecnología. La calidad epistémica dependió de la mediación docente: sin
criterios de validez y trazabilidad, emergieron productos “pulidos” pero débiles en justificación. Ello
confirma que la IA no transforma por sí misma, sino cuando el diseño instruccional exige explicar,
contrastar y verificar.

pág. 172
Figura 3. Reconfiguración de evidencias de aprendizaje según el modelo SAMR (distribución
porcentual por nivel)
Objetivo 4. Documentar percepciones docentes y estudiantiles para orientar lineamientos de
implementación ética. Las percepciones mostraron alta utilidad (estudiantes 4,4/5; docentes 4,1/5) y
aceptabilidad ética (integridad académica 4,3 y 4,5), con carga cognitiva moderada (3,8 y 3,6) y
confiabilidad percibida aún perfectible (3,7 y 3,4) (Figura 4). En grupos focales, estudiantes valoraron
claridad y ritmo personalizado; docentes, diversificación de recursos y ahorro de tiempo en corrección.
Las reservas se concentraron en: (a) alucinaciones en ítems no rutinarios; (b) bordes de autoría; y (c)
brecha de acceso.
De estos datos emergieron lineamientos operativos: (1) trazabilidad obligatoria (historial de versiones
y explicación paso a paso); (2) ingeniería de prompts con verificación (solicitar fuentes, métodos
alternativos y explicación en lenguaje propio); (3) código de uso honesto institucional (declaración de
asistencia de IA y porcentajes de apoyo permitidos por tipo de evidencia); y (4) acomodos de acceso
(sesiones presenciales con dispositivos compartidos y paquetes offline). Estos lineamientos equilibran
eficacia e integridad académica y responden a inquietudes docentes sin sacrificar la ganancia
pedagógica.

pág. 173
Figura 4. Percepciones sobre Gemini: estudiantes vs. docentes (utilidad, integridad, carga cognitiva,
confiabilidad).
DISCUSIÓN
Los cuatro resultados convergieron en una tesis central: Gemini potencia la comprensión de operaciones
cuando la retroalimentación es inmediata y accionable, las tareas se rediseñan hacia niveles SAMR-
M/R, y la mediación docente establece criterios de calidad epistémica y reglas éticas claras. La magnitud
del efecto es consistente con la evidencia que ubica los mayores beneficios cuando la tecnología no solo
sustituye formatos, sino reconfigura prácticas (evaluación formativa continua, aprendizaje por
enseñanza a un agente y modelación).
El estudio también expuso tensiones: la dependencia de pistas redujo beneficios marginales, y la
aceptación de productos sin rastro de proceso no mejoró la calidad conceptual pese al “pulido” textual.
En consecuencia, el valor de la IA depende del contrato didáctico: si el objetivo es demostrar
razonamiento, las herramientas deben inducir explicación, contraste y chequeo, no solo respuestas
finales. En términos de novedad, se aporta una medida empírica de reconfiguración SAMR asociada a
recursos generados con Gemini y se documentan líneas éticas operativas con alta aceptabilidad en
Educación Superior del litoral ecuatoriano. Como prospectiva, se recomienda: (a) extender la medición
a dominios menos procedimentales (razonamiento proporcional, estadística inferencial); (b) explorar
efectos diferenciales por desempeño inicial y por brechas de acceso; y (c) ensayar diseños donde la IA
actúe como “estudiante virtual” al que se debe enseñar, modalidad asociada a mayores transferencias.

pág. 174
CONCLUSIONES
El estudio mostró que integrar Gemini IA en la enseñanza de operaciones aritméticas, produjo un
aprendizaje más profundo cuando su uso se orientó por criterios pedagógicos claros. No bastó con
disponer de la herramienta: la mejora se sostuvo cuando el andamiaje generado por la IA, se articuló
con metas curriculares explícitas y con una secuenciación que priorizó la explicación sobre la mera
respuesta. En ese marco, los análisis comparativos y la triangulación cualitativa respaldaron que el
desempeño del estudiantado avanzó de forma consistente frente a enfoques tradicionales, validando la
hipótesis de efectividad sin recurrir a atajos instrumentales.
La retroalimentación automatizada operó como el mecanismo central de esa mejora. Los modelos
predictivos indicaron que la frecuencia y la calidad explicativa de los ciclos intento–pista–revisión se
asociaron con incrementos significativos en el logro. No obstante, el efecto fue sensible al modo de
implementación: cuando la pista reemplazó la argumentación del estudiante, los rendimientos
marginales decrecieron. Esta regularidad empírica obliga a asumir la retroalimentación como proceso
formativo —con verificación, contraste de métodos y pausa metacognitiva— y no como una función
de “mostrar solución”. Bajo esa condición, se comprobó la hipótesis de que la retroalimentación de la
IA explica una porción sustantiva del progreso observado.
En términos de evidencias de aprendizaje, la codificación ciega de portafolios confirmó un
desplazamiento hacia niveles Modificación/Redefinición del modelo SAMR cuando la IA se utilizó
para generar recursos, visualizar procedimientos y construir contraejemplos. La transformación, sin
embargo, no fue automática. Requirió mediación docente para exigir trazabilidad, criterios de validez
y justificación disciplinar. Allí donde esas salvaguardas estuvieron presentes, las producciones dejaron
de ser reproducciones procedimentales y se convirtieron en demostraciones con control epistémico; con
ello se corroboró la hipótesis de reconfiguración cualitativa de las evidencias.
Las percepciones de docentes y estudiantes fueron favorables a la utilidad pedagógica de Gemini IA,
pero señalaron riesgos reales: alucinaciones puntuales, bordes de autoría y brechas de acceso. A partir
de esa evidencia, se delinearon lineamientos que armonizan eficacia e integridad académica:
trazabilidad del proceso, enseñanza de prompt engineering con verificación, códigos de uso honesto y

pág. 175
acomodos de acceso. Más que anexos normativos, estos dispositivos funcionaron como condiciones de
posibilidad para que la mejora se materializara sin erosionar los estándares de evaluación.
REFERENCIAS
Bauer et al. (2021). Exploración del papel de la inteligencia artificial en la mejora del aprendizaje y la
autonomía de los estudiantes . Journal of Educational Technology.
Bazurto-Mendoza, A., & Maliza-Muñoz, W. (2025). Estrategia pedagógica del uso de los recursos
digitales para la educación remota. Revista Científica Zambos, 4(2), 1-20.
https://doi.org/10.69484/rcz/v4/n2/105
Bolaño, M., & Duarte, N. (2024). Una revisión sistemática del uso de la inteligencia artificial en la
educación. Revista Colombiana de Cirugía, 39(1), 51-63.
https://doi.org/10.30944/20117582.2365
Bordón, A. (2023). Herramientas de inteligencia artificial en formato digital para potenciar el
progreso educativo de los alumnos de nivel primario. Boaciencia, 3(2), 169.
https://doi.org/https://doi.org/10.59801/ecs.v3i2.141
Chao, C. (2024). Usos y percepciones de herramientas de inteligencia artificial en la educación
superior en México. Revista Iberoamericana de Educación, 95(1), 57-72.
https://doi.org/https://doi.org/10.35362/rie9516259
Da Silva y Pereira. (2022). Artificial intelligence as a motivator for self-regulated learning in
Brazilian high schools. Brazilian Journal of Educational Studies.
https://doi.org/https://doi.org/10.1590/bjes.2022.292
Delgado, N. (2024). Aplicación de la Inteligencia Artificial (IA) en Educación: Los beneficios y
limitaciones de la IA percibidos por el profesorado de educación primaria, educación
secundaria y educación superior. Revista Electrónica Interuniversitaria de Formación del
Profesorado, 27(1), 207-224. https://doi.org/https://doi.org/10.6018/reifop.577211
Herrera, J., Marqués, G., & Martínez, M. (2024). Integración de inteligencia artificial en entornos
educativos: Perspectivas y prácticas innovadoras . Innovación Educativa.

pág. 176
Hormaza, K., & Rejas de la Peña, A. F. (2025). La inteligencia artificial Gemini en la optimización del
proceso de enseñanza y aprendizaje en Docentes de Educación Superior. Arandu UTIC, 12(3),
2469–2490. https://doi.org/10.69639/arandu.v12i3.1487
Korhonen, H., & Lehtinen, T. (2023). Artificial intelligence and critical thinking skills in secondary
education: Evidence from Finland. European Journal of Educational Research.
https://doi.org/https://doi.org/10.1080/ejeduresearch.2023.01.005
Ko-Wai, T. (2025). Artificial Intelligence in Mathematics Education: Trends, Challenges, and
Opportunities. International Journal of Research in Mathematics Education, 3(1), 75-90.
https://doi.org/10.24090/ijrme.v3i1.13496
Li, M., & Manzari, E. (2025). AI utilization in primary mathematics education: a case study from a
southwestern Chinese city. . Educ Inf Technol 30, 11717–11750.
https://doi.org/10.1007/s10639-025-13315-z
Noster, N., & Gerber, S. &. (2024). Pre-Service Teachers’ Approaches in Solving Mathematics Tasks
with ChatGPT. . Digit Exp Math Educ, 10, 543–567 . https://doi.org/10.1007/s40751-024-
00155-8
Opesemowo, O. &. (2024). A systematic review of artificial intelligence in mathematics education:
The emergence of 4IR. . Eurasia Journal of Mathematics, Science and Technology Education,
20(7), em2478. https://doi.org/10.29333/ejmste/14762
Pepin, B., & Buchholtz, N. &. (2025). Una encuesta de alcance de ChatGPT en la educación
matemática. Digit Exp Math Educ, 11(11), 9–41. https://doi.org/10.1007/s40751-025-00172-1
Rivas, J., & Cevallos, C. &. (2024). Uso de modelos de inteligencia artificial en la optimización de la
enseñanza de matemáticas en la educación superior. Reincisol, 3(6), 4334–4355 .
https://doi.org/10.59282/reincisol.V3(6)4334-4355
Saud Alhazzani, N. (2024). Enhancing mathematics teachers’ pedagogical skills by using ChatGPT .
International Journal of Innovative Research and Scientific Studies, 7(4), 1614-1627.
https://doi.org/10.53894/ijirss.v7i4.3460

pág. 177
Silgado, D. (2025). Inteligencia Artificial Generativa en el aula: ¿aliada o amenaza para la enseñanza
de las matemáticas?. . Revista Electrónica Tecnologías Emergentes En La Educación, 2(1), 53-
66. https://doi.org/10.71713/retee.v2i1.3512
Son, T. (2024). Intelligent Tutoring Systems in Mathematics Education: A Systematic Literature
Review Using the Substitution, Augmentation, Modification, Redefinition Model. . Computers,
13(10), 270. https://doi.org/10.3390/computers13100270
Tóala, M., & Giler, J. &. (2024). Las matemáticas y el uso de la inteligencia artificial (IA). UNESUM
- Ciencias. Revista Científica Multidisciplinaria, 8(3), 16–23. https://doi.org/10.47230/unesum-
ciencias.v8.n3.2024.16-23
UNESCO. (2019). El estudio ERCE 2019 y los niveles de aprendizaje en Matemáticas.
https://www.unesco.org/es/articles/estudio-regional-comparativo-y-explicativo-erce-2019
Villalobos, R. (11 de Diciembre de 2023). Artificial Intelligence in Costa Rican Education.
International Journal of Dental Sciences, 26(1), 8–13. https://doi.org/10.15517/ijds.2023.57223