CONDICIONES DEL USO SOCRÁTICO DE LA
INTELIGENCIA ARTIFICIAL GENERATIVA
Y MODELO HÍBRIDO DOCENTE EN
MATEMÁTICA UNIVERSITARIA
SMOKING EXPERIENCES IN STUDENTS IN SCHOOL,
SOCIAL, FAMILY AND PERSONAL ENVIRONMENTS
Melvin Ramírez Bogantes
Escuela de Matemática Tecnológico de Costa Rica
Esteban Quesada Ávila
Escuela de Matemática Tecnológico de Costa Rica
Francine Araya López
Escuela de Matemática Tecnológico de Costa Rica

pág. 8485
DOI: https://doi.org/10.37811/cl_rcm.v10i2.23830
Condiciones del Uso Socrático de la Inteligencia Artificial Generativa y
Modelo Híbrido Docente en Matemática Universitaria
Melvin Ramírez Bogantes1
mramirez@itcr.ac.cr
https://orcid.org/0000-0001-5516-0085
Escuela de Matemática
Tecnológico de Costa Rica
Cartago – Costa Rica
Esteban Quesada Ávila
teo021097@estudiantec.cr
https://orcid.org/0009-0009-3847-036X
Licenciatura en la Enseñanza de la Matemática
Tecnológico de Costa Rica
Cartago – Costa Rica
Francine Araya López
caaraya@estudianteccr.onmicrosoft.com
https://orcid.org/0009-0008-3789-5510
Licenciatura en la Enseñanza de la Matemática
Tecnológico de Costa Rica
Cartago – Costa Rica
RESUMEN
El uso instrumental de la inteligencia artificial generativa por parte de estudiantes universitarios
constituye un patrón documentado que limita el aprovechamiento pedagógico de la herramienta. Este
artículo examina cómo se reconfigura la interacción estudiante–IA tras una intervención didáctica que
enseña explícitamente el uso del prompt de tutor socrático, y cómo se relaciona esa apropiación con la
mediación docente efectivamente desplegada. Se trabajó con un diseño cualitativo dominante con apoyo
conductual, en el componente cualitativo de un diseño mixto convergente paralelo. Las fuentes fueron
238 interacciones estudiante–IA registradas durante cuatro sesiones, observación estructurada externa,
entrevistas semiestructuradas a tres estudiantes seleccionados por máxima variación y entrevista al
docente-tutor. El análisis combinó codificación temática reflexiva, análisis transversal por dimensiones
y conglomerados k-medias. Los hallazgos muestran que los tres estudiantes apropiaron el prompt como
objeto de aprendizaje y que el uso genuinamente tutorial de la IA emergió en condiciones específicas:
contenido conceptualmente exigente, prompt que invita a explicar y respuesta inicial incompleta. La
consigna textual no basta. Paralelamente, el docente reconfiguró el dispositivo introduciendo
explicaciones magistrales no prescritas, configurando un modelo híbrido que sostuvo los resultados. Se
discuten implicaciones para el diseño de materiales mediados por inteligencia artificial generativa en
educación matemática.
Palabras clave: prompt socrático, inteligencia artificial generativa, apropiación pedagógica, modelo
híbrido docente, educación matemática
1Autor principal
Correspondencia: mramirez@itcr.ac.cr

pág. 8486
Conditions for the Socratic use of Generative Artificial Intelligence and
Hybrid Teaching Model in University Mathematics
ABSTRACT
The instrumental use of generative artificial intelligence by university students is a documented pattern
that limits its pedagogical benefits. This article examines how the student–AI interaction is reconfigured
after a didactic intervention that explicitly teaches the use of the socratic tutor prompt, and how that
appropriation relates to the teaching mediation actually deployed. A predominantly qualitative design
with behavioral support was used, within the qualitative component of a convergent parallel mixed-
methods design. The sources were 238 student–AI interactions recorded during four sessions, external
structured observation, semi-structured interviews with three students selected for maximum variation,
and an interview with the teaching tutor. The analysis combined reflexive thematic coding, cross-
sectional analysis by dimensions, and k-means clustering. The findings show that the three students
appropriated the prompt as a learning object, and that the genuinely tutorial use of AI emerged under
specific conditions: conceptually demanding content, a prompt inviting explanation, and an incomplete
initial answer. The textual instruction alone is not enough. In parallel, the teacher reconfigured the
design by introducing unprescribed direct explanations, configuring a hybrid model that sustained the
results. Implications are discussed for the design of materials mediated by generative artificial
intelligence in mathematics education.
Keywords: socratic prompt, generative artificial intelligence, pedagogical appropriation, hybrid
teaching model, mathematics education
Artículo recibido 02 abril 2026
Aceptado para publicación: 30 abril 2026

pág. 8487
INTRODUCCIÓN
La brecha de competencias matemáticas con que los estudiantes ingresan a la universidad constituye un
problema estructural ampliamente documentado en el contexto latinoamericano. Frente a esa brecha,
las instituciones de educación superior han desarrollado dispositivos de nivelación previos al inicio del
semestre, con la finalidad de homogeneizar conocimientos básicos antes del primer curso. Estos talleres
operan con tiempos breves y grupos numerosos, lo que limita el alcance de las intervenciones
tradicionales basadas exclusivamente en la exposición magistral. La irrupción de la inteligencia
artificial generativa (IAGen) en los entornos formativos universitarios abre un campo de oportunidad
y, al mismo tiempo, de riesgo pedagógico que merece análisis empírico cuidadoso.
La oportunidad se sustenta en la capacidad de las herramientas de IA generativa para personalizar la
atención, ofrecer múltiples representaciones de un mismo contenido y proporcionar retroalimentación
inmediata a un costo marginal bajo (Kasneci et al., 2023; Tapia-Molina et al., 2024). El riesgo, en
cambio, ha sido caracterizado como un patrón de uso instrumental u oracular: el estudiante consulta a
la herramienta esperando una respuesta directa, sin involucrar el razonamiento propio, lo que reproduce
y amplifica las debilidades del aprendizaje superficial (Chan y Hu, 2023). Este patrón es particularmente
problemático en educación matemática, donde el desarrollo conceptual depende de procesos de
elaboración cognitiva que la entrega directa de soluciones tiende a cortocircuitar.
Una propuesta didáctica para reorientar ese patrón consiste en enseñar a los estudiantes a interactuar
con la IAGen mediante prompts deliberadamente construidos, entre los cuales destaca el llamado
prompt de tutor socrático: una instrucción que convierte a la herramienta en un guía que acompaña el
razonamiento mediante preguntas, sin proveer la solución. El supuesto subyacente es que la consigna,
al ser apropiada por el estudiante, transforma cualitativamente la interacción y la convierte en un
dispositivo formativo. Sin embargo, hasta dónde basta una consigna explícita para producir esa
transformación, en qué condiciones efectivamente emerge un uso tutorial de la herramienta y cómo se
articula con la mediación docente en aula presencial son preguntas que la literatura empírica reciente
apenas comienza a explorar.

pág. 8488
Este artículo aborda esas preguntas a partir del análisis cualitativo y conductual de un taller de
nivelación de Matemática General implementado con mediación de IAGen y prompt de tutor socrático
en el Tecnológico de Costa Rica. Se formulan tres preguntas de investigación: ¿cómo se reconfigura la
interacción estudiante–IA tras una intervención didáctica con prompt socrático?, ¿en qué condiciones
emerge un uso genuinamente tutorial frente al uso verificador dominante?, y ¿cómo se relaciona la
apropiación estudiantil del prompt con la mediación docente efectivamente desplegada? Las respuestas
a estas preguntas permiten identificar tres condiciones empíricas para el uso tutorial de la IA y proponer
la categoría de modelo híbrido docente como clave interpretativa de los resultados de la intervención.
MARCO TEÓRICO
Análisis temático reflexivo y técnica del incidente crítico
El análisis cualitativo de la experiencia educativa requiere procedimientos sistemáticos que permitan
identificar patrones de significado sin reducirlos a frecuencias numéricas. El análisis temático reflexivo
propuesto por Braun y Clarke (2006, 2019) ofrece un procedimiento de seis fases —familiarización,
codificación inicial, búsqueda de temas, revisión, definición y producción del informe— que ha sido
validado en investigación educativa por su flexibilidad teórica y su rigor procedimental. La técnica
resulta particularmente adecuada para corpus pequeños y densos, en los que la profundidad
interpretativa prima sobre la saturación estadística (Patton, 2015).
Complementariamente, la técnica del incidente crítico (Flanagan, 1954; Tripp, 1993) permite anclar la
reflexión en eventos concretos identificados como significativos por los propios participantes. En
contextos de implementación de innovaciones didácticas, los incidentes críticos —episodios en los que
el dispositivo encuentra resistencia, fricción o validación inesperada— funcionan como ventanas
privilegiadas a los procesos pedagógicos que los formatos descriptivos suelen invisibilizar.
Adaptación mutua entre diseño curricular y práctica de aula
La distancia entre el diseño curricular prescrito y la implementación efectivamente desplegada en el
aula constituye uno de los objetos clásicos de la investigación curricular. Stenhouse (1975) advirtió que
ningún material curricular se ejecuta automáticamente: su puesta en operación implica un proceso de
interpretación, apropiación y traducción por parte del docente que altera, en mayor o menor medida, la
propuesta original.

pág. 8489
Fullan y Pomfret (1977) sistematizaron esta observación bajo la categoría de adaptación mutua: ni el
material moldea unidireccionalmente la práctica, ni la práctica reproduce mecánicamente el material;
ambos se transforman en el acto mismo de la implementación.
Esta perspectiva resulta especialmente productiva para analizar intervenciones con tecnologías
emergentes, donde el docente enfrenta dispositivos novedosos que requieren decisiones pedagógicas no
anticipadas por el diseño. Lo que desde una mirada normativa podría leerse como infidelidad de
implementación, desde la lógica de la adaptación mutua se reconoce como evidencia del trabajo
profesional docente, que ajusta el dispositivo a las condiciones reales del aula. La categoría es central
para interpretar los datos del presente estudio, en el que el docente-tutor introdujo modificaciones
sistemáticas al diseño original.
TPACK y AI-TPACK
El marco del Conocimiento Tecnológico Pedagógico del Contenido (TPACK) propuesto por Mishra y
Koehler (2006), extensión del Conocimiento Pedagógico del Contenido de Shulman (1986),
conceptualiza la integración tecnológica efectiva como la intersección entre tres dominios de
conocimiento docente: el disciplinar, el pedagógico y el tecnológico. La integración exitosa no se
produce por la simple yuxtaposición de los tres componentes, sino por su articulación reflexiva en
función de las características del contenido y del estudiantado.
La emergencia de la IAGen ha motivado el desarrollo de extensiones específicas del marco. Celik
(2023) y Celik et al. (2022) proponen el AI-TPACK, que incorpora competencias específicas de
alfabetización en IA: conciencia sobre la formulación de prompts, detección crítica de alucinaciones,
uso de la herramienta como apoyo al razonamiento sin sustituirlo, y reflexión ética sobre los límites del
dispositivo. Estos componentes resultan operacionalizables como indicadores observables y orientan
tanto el diseño didáctico como su evaluación. La Recomendación sobre la Ética de la Inteligencia
Artificial (UNESCO, 2022) proporciona, complementariamente, un marco normativo internacional que
respalda esta operacionalización.
Génesis instrumental, prompt como artefacto y orquestación con tecnología
La perspectiva de la génesis instrumental (Trouche, 2024) distingue entre el artefacto —el dispositivo
material o simbólico— y el instrumento —el artefacto integrado al repertorio cognitivo del usuario

pág. 8490
mediante un proceso de apropiación—. Aplicada a la IAGen, la perspectiva permite tratar al prompt no
como una instrucción técnica sino como un artefacto pedagógico apropiable, que el estudiante puede
integrar progresivamente a sus estrategias de estudio. La transformación de un artefacto en instrumento
exige tiempo, mediación didáctica explícita y oportunidades de uso situado.
Por su parte, la noción de orquestación instrumental (Drijvers, 2023) describe el trabajo del docente que
articula múltiples recursos —artefactos físicos, digitales, lenguaje, gestos— para sostener procesos de
aprendizaje en aula con tecnología. La orquestación implica decisiones sobre cuándo y cómo introducir
cada recurso, cómo gestionar la heterogeneidad del grupo y cómo sostener la coherencia conceptual a
lo largo de la sesión. Esta categoría resulta indispensable para analizar la mediación del docente-tutor
en el aula con IAGen, donde la sola disposición de la herramienta no garantiza su funcionamiento
pedagógico.
METODOLOGÍA
Enfoque y diseño de la investigación
El estudio adoptó un diseño cualitativo dominante con apoyo conductual, ubicado en el componente
cualitativo de un diseño mixto convergente paralelo (Creswell y Plano Clark, 2018). Esta elección
responde a las características del fenómeno indagado: una intervención didáctica innovadora cuya
comprensión requiere acceder a la experiencia subjetiva de los actores y, simultáneamente, a la conducta
observable de su interacción con la tecnología. El componente cuantitativo del estudio mayor —que
evalúa los efectos cognitivos y actitudinales de la intervención— se reporta en publicación
complementaria.
Participantes
La intervención se implementó durante la semana del 9 al 13 de febrero de 2026, en el marco del taller
de nivelación de Matemática General del Programa Éxito Académico del Tecnológico de Costa Rica,
en el Campus Tecnológico Central de Cartago. El taller se distribuyó en cinco sesiones consecutivas de
2 horas y 30 minutos cada una, dirigidas a estudiantes de primer ingreso con desempeño insuficiente en
la prueba diagnóstica. Los contenidos abordados correspondieron al concepto de función y sus
elementos básicos.

pág. 8491
Tres conjuntos de participantes contribuyeron a las distintas fuentes de datos. Para el análisis de las
interacciones estudiante–IA, se incluyeron los registros de los 32 estudiantes inscritos al taller. Para las
entrevistas estudiantiles, se seleccionaron tres participantes por muestreo intencional estratificado según
su desempeño en la prueba diagnóstica previa, garantizando la presencia de los niveles bajo, medio y
alto, en una lógica de máxima variación. El docente-tutor entrevistado fue el responsable de la
implementación: estudiante avanzado de la carrera de Enseñanza de la Matemática del Tecnológico de
Costa Rica, con experiencia previa en el Programa Éxito Académico y en la implementación de
actividades mediadas por IA en tutorías. La observación estructurada estuvo a cargo de una profesional
externa al equipo investigador, capacitada específicamente en el uso del instrumento.
Instrumentos de recolección de datos
Se utilizaron cuatro fuentes de datos complementarias, cuya estructura se sintetiza en la Tabla 1.
Tabla 1 Fuentes de datos del estudio cualitativo
Fuente Procedimiento de registro Volumen y alcance
Interacciones
estudiante–IA
Codificación de las guías entregadas por
los estudiantes al cierre de cada sesión, en
ocho dimensiones categóricas.
238 registros, 32 estudiantes, 4 sesiones,
8 ejercicios.
Observación
estructurada
Aplicación de instrumento con cuatro
dimensiones (desempeño tutor,
engagement, fidelidad, uso ético) más
sección cualitativa, por observadora
externa capacitada.
Cuatro sesiones analizadas; sesión 5
excluida por concentrar actividades de
cierre del estudio; sesión 4 con registro
parcial declarado.
Entrevistas a
estudiantes
Entrevistas semiestructuradas
individuales con guía en cinco ejes:
contexto vocacional, percepción del
taller, uso previo de IA, transformación
con prompt socrático, autonomía y
proyección.
Tres participantes seleccionados por
máxima variación según desempeño en
prueba diagnóstica (niveles bajo, medio,
alto).
Entrevista al
docente-tutor
Entrevista semiestructurada con guía en
cuatro ejes: apropiación del material,
implementación, evaluación crítica,
transferencia y recomendaciones.
Un informante clave; doble codificación
interna por contraste con otras secciones
del corpus.
Nota. Elaboración propia.
El instrumento de observación se fundamentó teóricamente en el Framework for Teaching de Danielson
(2013) para la dimensión de desempeño docente, en el Classroom Assessment Scoring System de
Pianta, La Paro y Hamre (2008) para la dimensión de engagement, en la noción de fidelidad de
implementación de Century, Rudnick y Freeman (2010) y O'Donnell (2008) para la dimensión de

pág. 8492
adherencia al diseño, y en el AI-TPACK de Celik (2023) para la dimensión de uso ético de la IA. Las
guías de entrevista a estudiantes y docente fueron diseñadas siguiendo los principios de la entrevista
semiestructurada (Kvale y Brinkmann, 2009; DiCicco-Bloom y Crabtree, 2006; Galletta, 2013), e
incluyeron preguntas detonantes basadas en incidentes críticos.
Procedimiento
Las interacciones estudiante–IA se registraron al cierre de cada sesión mediante guías estructuradas que
cada estudiante completaba al finalizar los ejercicios mediados con la herramienta. La observación
estructurada se aplicó durante cuatro de las cinco sesiones del taller (la sesión 5 se excluyó por
concentrar actividades de cierre del estudio que escapan al objeto de la observación didáctica). Las
entrevistas a los tres estudiantes y al docente-tutor se realizaron al término del taller, en un formato
individual cara a cara, con duración aproximada de 45 a 60 minutos cada una. Todas las entrevistas
fueron grabadas en audio y transcritas textualmente, preservando expresiones coloquiales y marcadores
discursivos.
Análisis de datos
Las interacciones estudiante–IA se analizaron en dos planos. En primer lugar, se realizó un análisis
descriptivo por ejercicio —no por sesión, decisión justificada por la heterogeneidad temática interna de
cada sesión—, calculando las distribuciones de cada dimensión codificada. En segundo lugar, se aplicó
un análisis de conglomerados k-medias con tres grupos sobre cuatro indicadores agregados por
estudiante (porcentaje de respuestas correctas, porcentaje de justificación suficiente, porcentaje de uso
tutorial y porcentaje de errores corregidos por la IA), previa estandarización.
El análisis de la observación estructurada combinó un análisis transversal por dimensión —que
documenta la trayectoria de cada indicador a lo largo de las cuatro sesiones analizables— con un análisis
cualitativo de la sección de notas abiertas del instrumento, organizado en torno a momentos críticos,
dificultades técnicas y clima de aula.
Las entrevistas se analizaron mediante el procedimiento de seis fases del análisis temático reflexivo de
Braun y Clarke (2006). En el caso del docente como informante único, se trabajó con doble codificación
interna: cada categoría se validó contrastándola con otras secciones de la propia transcripción, buscando

pág. 8493
coherencia interna y ausencia de contradicciones no resueltas. La triangulación entre las cuatro fuentes
se realizó mediante una matriz de convergencias y divergencias, organizada por categoría temática.
Consideraciones éticas
El estudio contó con consentimiento informado de todos los participantes. Las transcripciones se
anonimizaron con códigos alfanuméricos (E01 a E32 para estudiantes; Docente-tutor para el
implementador). El instrumento de observación fue aplicado por una profesional externa al equipo
investigador, decisión metodológica que reduce el sesgo de autoobservación. Las entrevistas fueron
grabadas en audio y transcritas textualmente, preservando expresiones coloquiales y marcadores
discursivos. Los datos primarios se almacenan bajo acceso restringido al equipo investigador y se
destruirán al cabo del periodo de retención previsto.
RESULTADOS Y DISCUSIÓN
Línea base: el uso instrumental de la IA
Las entrevistas a los tres estudiantes seleccionados por máxima variación documentan una línea base
homogénea: con anterioridad al taller, los participantes utilizaban la IA bajo una lógica de entrega
directa de respuesta. Esta homogeneidad es notable porque atraviesa los tres niveles de desempeño
inicial. El estudiante de nivel bajo describe la lógica con una metáfora elocuente que recoge la lógica
del motor de búsqueda:
"Uno normalmente espera que nada más le dé la respuesta, porque uno normalmente cuando
lo pide, lo pide muy como Google, o sea que uno pone y ya le llega." (Estudiante 01)
El estudiante de nivel medio reconoce un uso previo más amplio, vinculado al diseño y a la búsqueda
de información, pero igualmente orientado a obtener una solución sin intervención del proceso de
razonamiento:
"Sí, ya las había utilizado, pero nunca la usé en sí para un ejercicio, solo si lo necesitaba
rápido que lo resolviera, que me explicara, pero nunca lo hice; nunca le dije como que fuera
como una guía, como un tutor socrático." (Estudiante 02)
El estudiante de nivel alto, por su parte, sitúa el uso previo en el contexto escolar y articula una crítica
pedagógica explícita sobre esa práctica generalizada entre compañeros:

pág. 8494
"Normalmente en la escuela era tipo tienen ChatGPT y que les dé la respuesta y no les
explicaba nada; alguien que medio le cuesta y que ocupan que le expliquen y no que le tiren la
respuesta." (Estudiante 03)
La convergencia de los tres relatos confirma la pertinencia de la línea base reportada en la literatura
internacional (Chan y Hu, 2023): los estudiantes universitarios sin formación específica en IA
generativa tienden a usarla de manera instrumental, lo que justifica una intervención pedagógica
explícitamente orientada a reorientar ese patrón.
Apropiación del prompt como objeto de aprendizaje
Los tres estudiantes identifican, con lenguaje propio, un antes y un después en su forma de dialogar con
la IA. El elemento detonante de ese cambio es la enseñanza explícita del prompt de tutor socrático,
descrito por los participantes como una instrucción estructurada que convierte a la herramienta en un
guía que acompaña el razonamiento sin entregar la solución. La transformación se manifiesta en tres
rasgos compartidos.
El primer rasgo es la metacognición estratégica: los participantes dejan de ver a la IA como receptora
de preguntas fácticas y la reconocen como un interlocutor al que pueden dirigir instrucciones
pedagógicas específicas. El estudiante de nivel bajo describe la transformación en términos vivenciales
mediante una metáfora que se aproxima al andamiaje vygotskiano:
"De acá en este curso ya nos explicaron que uno también puede ir como paso a paso y así en
realidad lo aprende, y es como un profesor te va llevando de la mano a la respuesta."
(Estudiante 01)
El segundo rasgo es la apropiación del vocabulario pedagógico: el término “tutor socrático” aparece
espontáneamente en los tres relatos, lo que sugiere que el concepto se integró al lenguaje propio de los
estudiantes y no se limita a una etiqueta externa. El estudiante de nivel alto enuncia el prompt como
objeto concreto de aprendizaje:
"Antes y después del curso pedía explicación, pero ahora más explicándole con el prompt, que
sea como más tutor socrático." (Estudiante 03)
El tercer rasgo es la diferenciación contextual del uso: los participantes identifican que distintos
propósitos requieren distintos modos de usar la IA, lo que corresponde a un uso reflexivo y no

pág. 8495
automatizado de la herramienta. El estudiante de nivel medio articula esa diferenciación con notable
claridad estratégica:
"Las seguiría usando así, dependiendo del caso. Si es un caso de estos que necesito resolver
algo en clase, la usaría con el método de tutor socrático. Más si fuera un tema más cotidiano,
sí le pediría que me diera una respuesta explicada." (Estudiante 02)
La observación estructurada externa converge con esta apropiación: los indicadores de definición del
perfil socrático y de calidad del prompt fueron valorados como logrados durante las tres sesiones
analizables (sesiones 1 a 3), lo que confirma desde una fuente independiente la presencia consistente de
la práctica reportada por los estudiantes en el plano subjetivo.
Cuándo emerge el uso tutorial: el hallazgo del ejercicio S4-E1
El análisis de las 238 interacciones estudiante–IA revela que, en el agregado, el 87 % corresponde a un
uso verificador de la herramienta —el estudiante consulta para confirmar una respuesta ya alcanzada—
y solo el 13 % a un uso tutorial. Sin embargo, esta distribución agregada oculta un patrón
cualitativamente significativo cuando se analiza por ejercicio. La Tabla 2 sintetiza los principales
indicadores por cada uno de los ocho ejercicios del taller.
Tabla 2 Indicadores de interacción estudiante–IA por ejercicio
Ejercicio n % Correcta % Justif. suf. % Tutoría % Corrige % Concep.
S1-E1 31 96,8 83,9 3,2 0,0 100,0
S1-E2 31 100,0 54,8 0,0 0,0 100,0
S1-E3 31 87,1 61,3 3,2 12,9 100,0
S2-E1 31 83,9 77,4 0,0 16,1 0,0
S3-E1 28 82,1 85,7 3,6 28,6 92,9
S3-E2 28 96,4 67,9 0,0 3,6 3,6
S4-E1 29 79,3 51,7 96,6 20,7 100,0
S4-E2 29 89,7 62,1 0,0 13,8 0,0
Nota. La fila de S4-E1 está resaltada porque concentra el uso tutorial del taller. Elaboración propia.
El hallazgo central es que de los 31 casos de uso tutorial registrados en el taller completo, 28 (90,3 %)
corresponden a un único ejercicio: S4-E1. En los siete ejercicios restantes el uso tutorial agregado es de
apenas 2,3 %.

pág. 8496
El uso socrático no es, por tanto, un fenómeno temporal de la cuarta sesión, sino un fenómeno localizado
en este ejercicio específico. La interpretación más sólida es que en S4-E1 confluyen tres condiciones
que ningún otro ejercicio reúne simultáneamente: contenido conceptualmente exigente —preimágenes
cuadráticas y rango de la función—, prompt sugerido que invita explícitamente a explicar (“explícame
por qué algunos valores pueden no tener preimagen real”), y la tasa de respuestas correctas iniciales
más baja del taller (79,3 %) junto con la menor proporción de justificaciones suficientes (51,7 %).
El contraste con el ejercicio S1-E1 es revelador. Este ejercicio inaugural contenía la consigna socrática
más explícita del taller —“No me des la respuesta directa, guíame con preguntas”— y, sin embargo,
fue seguida por solo el 3,2 % de los estudiantes. La explicación más plausible es que en S1-E1 el 96,8
% de los estudiantes ya había alcanzado la respuesta correcta de manera autónoma, por lo que la
dinámica natural de contraste subordinó la consigna y convirtió a la IA en confirmador, no en tutor. La
consigna textual, por sí sola, no basta: requiere una situación cognitiva en la que el estudiante necesite
genuinamente la mediación.
Figura 1 Distribución del uso de la IA por ejercicio. El uso tutorial se concentra casi exclusivamente
en S4-E1.
Nota. Elaboración propia.
Tres perfiles de uso estudiantil
El análisis de conglomerados k-medias aplicado a los cuatro indicadores agregados por estudiante
identifica tres perfiles bien diferenciados, cuya caracterización se presenta en la Tabla 3.

pág. 8497
Tabla 3 Perfiles de uso estudiantil de la IA en el taller (n = 32)
Perfil n % Correctas % Justif. suf. % Tutoría % Errores corr.
Autónomo-
verificador
16 (50,0 %) 100,0 79,9 9,6 0,0
Usuario
dialógico
12 (37,5 %) 85,1 61,5 16,0 17,4
En
construcción
4 (12,5 %) 60,0 35,0 14,4 43,1
Nota. Análisis de conglomerados k-medias sobre cuatro indicadores estandarizados por estudiante. Elaboración propia.
El perfil Autónomo-verificador, que agrupa al 50 % del grupo, está conformado por estudiantes que
alcanzan la respuesta correcta en todos sus ejercicios y la justifican suficientemente en la mayoría; usan
la IA casi exclusivamente para confirmar y en ningún caso reciben corrección de errores. El perfil
Usuario dialógico, con el 37,5 % del grupo, presenta un desempeño intermedio y un uso más variado,
con la proporción más alta de uso tutorial. El perfil En construcción, minoritario (12,5 %), corresponde
a estudiantes con menor desempeño que reciben la mayor proporción de correcciones por parte de la
IA (43,1 %), lo que sugiere que la herramienta está cumpliendo en este subgrupo un rol diagnóstico
genuino.
Esta tipología es relevante en términos pedagógicos porque permite anticipar que el rediseño de la
intervención debe atender de manera diferenciada a cada perfil. Los estudiantes del perfil En
construcción se beneficiarían desproporcionadamente de ejercicios diseñados con las tres condiciones
identificadas en S4-E1, en los que la IA puede operar como instancia correctiva y explicativa.
El modelo híbrido docente
El análisis paralelo de la entrevista al docente-tutor y de la observación estructurada documenta un
proceso de implementación que se aleja del diseño puramente centrado en la IA propuesto por la guía
didáctica. La trayectoria del indicador de modelado del prompt en la observación es ilustrativa: durante
la sesión inaugural, fue valorado como No Logrado, con la nota explícita de la observadora de que se
utilizó un prompt base copiado directamente de la guía sin proceso de modelado. A partir de la segunda
sesión, sin embargo, el indicador se valoró consistentemente como Logrado, lo que evidencia una curva
de aprendizaje docente corta y efectiva ante el dispositivo novedoso.

pág. 8498
La adaptación más significativa del docente, sin embargo, no es esa apropiación del modelado sino la
introducción sistemática de explicaciones magistrales después de cada actividad mediada por IA,
decisión no prescrita por la guía. El docente articula con notable lucidez el supuesto pedagógico que
esa adaptación cuestiona:
"¿Dónde queda la explicación del tema? Porque seamos honestos, como trabajo independiente
puede funcionar que las 2h y 30 min estén dedicadas exclusivamente a las actividades, ya que
el estudiante se tendría que apoyar exclusivamente de la IA para comprender, pero en una
clase con un grupo donde todos van trabajando lo mismo resulta necesario explicar algunas
cosas como propiedades, temas, que aunque lo hablen con IA no a todos les llega a quedar
claro a la primera vez, y para avanzar sin que los temas queden bien claros como que no
funciona." (Docente-tutor)
El extracto distingue dos contextos pedagógicos diferenciados —el trabajo independiente y la clase
grupal— e identifica que la guía fue diseñada como si ambos contextos fueran equivalentes, cuando no
lo son. La adaptación introducida por el docente puede leerse, en términos de Fullan y Pomfret (1977),
como un caso paradigmático de adaptación mutua: el implementador transforma el diseño en el acto
mismo de ejecutarlo, en respuesta a las condiciones reales del aula.
La observación externa registra un episodio que ilustra cómo esa hibridación se naturalizó como
estrategia. Durante la segunda sesión se produjo un corte eléctrico inesperado, ante el cual el docente
“aprovechó el momento para hacer aclaraciones en la pizarra”. La flexibilidad con la que se gestionó
esta contingencia sugiere que la articulación entre mediación con IA y explicación magistral ya estaba
operando como dispositivo regular, no solo como respuesta puntual a un imprevisto.
El docente reconoce, además, una tensión estructural entre el volumen de actividades propuesto por la
guía y el tiempo disponible:
"Definitivamente reduciría la cantidad de actividades o trataría de combinarlas, para 2h y 30
min que duraba cada clase no daba tiempo de implementar todas las propuestas." (Docente-
tutor)
Esta tensión es absorbida por el docente mediante adaptaciones tácitas que los estudiantes no perciben
como tales, lo que produce una divergencia interpretativa que se aborda en el siguiente apartado.

pág. 8499
Triangulación entre voces y tensión interpretativa central
La articulación de las cuatro fuentes permite identificar convergencias robustas y divergencias
reveladoras. Entre las convergencias destacan tres. Primero, la valoración positiva de la dinámica del
taller: las tres voces coinciden en que el dispositivo funcionó adecuadamente y las actividades
cumplieron su función pedagógica. Segundo, la ausencia de uso oráculo: los estudiantes describen un
uso selectivo y estratégico, el docente no detecta casos de saltos al prompt, y el indicador de persistencia
sin recurrir al “oráculo” en la observación se valora como logrado durante las tres sesiones analizables.
Tercero, la centralidad del prompt socrático: nombrado espontáneamente por los estudiantes,
distribuido sistemáticamente por el docente y registrado en la observación como definición consistente
del perfil de la herramienta.
Las divergencias son igualmente informativas. La sobrecarga del volumen de actividades es percibida
solo por el docente; los estudiantes no la experimentan directamente porque el implementador absorbió
la sobrecarga mediante reducción tácita y combinación de actividades. La redundancia de la verificación
con IA respecto de la verificación gráfica es notada solo por el docente; los estudiantes carecen aún del
nivel metacognitivo necesario para discriminar la función específica de cada verificación. La
explicación magistral es vivida por el estudiante de nivel bajo como parte natural de la dinámica (“luego
te explicaba el profe”), mientras que el docente la formula explícitamente como adaptación propia, no
prescrita por la guía.
De este contraste emerge la tensión interpretativa central del estudio. La experiencia positiva reportada
por los estudiantes no se produjo gracias a la implementación fiel del diseño, sino gracias al modelo
híbrido que el docente configuró al introducir explicaciones magistrales no previstas por la guía. Lo que
funcionó no fue el diseño prescrito, sino el diseño vivido, producto de la adaptación mutua entre
material curricular y contexto de aula. Esta proposición tiene consecuencias significativas para la
interpretación de los efectos cognitivos y actitudinales reportados en publicación complementaria: no
pueden atribuirse exclusivamente al dispositivo IA + prompt socrático, sino al dispositivo operado por
un docente que interviene pedagógicamente en el momento adecuado.

pág. 8500
El prompt como artefacto pedagógico apropiable
Los hallazgos sobre la apropiación del prompt por parte de los estudiantes son consistentes con la
perspectiva de la génesis instrumental (Trouche, 2024), según la cual la transformación de un artefacto
en instrumento exige un proceso de integración cognitiva mediado por la práctica situada. Los tres
rasgos identificados —metacognición estratégica, apropiación del vocabulario pedagógico y
diferenciación contextual del uso— corresponden a indicadores avanzados de esa apropiación.
Particularmente significativo es que el término “tutor socrático” aparezca espontáneamente en los tres
relatos, sin ser sugerido por la entrevistadora: la integración al lenguaje propio constituye una marca
robusta de internalización conceptual.
Esta apropiación es probablemente el aporte didáctico más transferible de la intervención. A diferencia
de los efectos cognitivos sobre contenidos específicos, que dependen del diseño de actividades y del
tiempo disponible, la apropiación del prompt como artefacto se proyecta hacia otros contextos
académicos. Los tres estudiantes manifiestan, en efecto, intención de continuar utilizando la IA bajo la
nueva lógica en contextos diferentes al curso inmediato, lo que sugiere que la intervención instala una
herramienta de trabajo intelectual que trasciende la Matemática General.
Conviene matizar, sin embargo, el alcance de la apropiación reportada. Los tres estudiantes
entrevistados pertenecen a un mismo taller con un docente experimentado y una mediación cuidadosa;
la transferibilidad del hallazgo a contextos sin esas condiciones no está garantizada. Investigaciones
futuras con muestras más amplias y diseños de seguimiento permitirán evaluar la durabilidad y la
profundidad de la apropiación más allá del entorno inmediato de la intervención.
Las tres condiciones del uso tutorial
El hallazgo de que el uso socrático de la IA se concentra en un único ejercicio del taller (S4-E1) y que
ese ejercicio no contiene la consigna socrática más explícita constituye una contribución novedosa al
diseño didáctico con IAGen. La aparición del uso tutorial en S4-E1 y su ausencia en S1-E1 desafía la
lectura ingenua de que basta con prescribir la consigna para producir el cambio de patrón. La consigna
actúa cuando confluye con dos condiciones adicionales: dificultad genuina del contenido y un prompt
que invita a explicar.

pág. 8501
La primera condición es estructural. Cuando el contenido es accesible y el estudiante alcanza la
respuesta correcta de manera autónoma, la dinámica natural de contraste con la herramienta subordina
cualquier consigna y la convierte en confirmador. Esta dinámica no es indeseable —la verificación es
una función legítima de la IA—, pero no produce el aprendizaje socrático esperado. Solo cuando el
contenido genera una brecha cognitiva real, la mediación tutorial encuentra un espacio funcional.
La segunda condición es lingüística. Los prompts que incluyen formulaciones del tipo “explícame por
qué” parecen activar en la IA un modo de respuesta más explicativo y desplegado, en contraste con los
prompts orientados al cálculo (“resuelve”, “calcula”). Esta hipótesis merece confirmación con
investigaciones específicamente diseñadas para aislar el efecto del fraseo del prompt, pero los datos
disponibles sugieren que se trata de una intervención didáctica de bajo costo y alto impacto: rediseñar
las consignas no requiere infraestructura adicional ni capacitación tecnológica avanzada.
La tercera condición es cognitiva. Los estudiantes solicitan tutoría cuando llegan al ejercicio con
respuestas incompletas o incorrectas, no cuando la respuesta ya está construida. Esto sugiere que el
diseño de actividades para producir uso socrático debe garantizar que el estudiante atraviese una zona
de incertidumbre: la mediación tutorial es solicitada en función de la necesidad real, no del
cumplimiento normativo de una consigna.
La síntesis pedagógica de las tres condiciones es directa: para producir uso socrático de la IA en un aula
universitaria, los ejercicios deben combinar (a) contenido conceptualmente exigente que genere brecha
real entre el conocimiento previo del estudiante y la solución, (b) un prompt que invite a explicar más
que a calcular, y (c) un diseño que permita el surgimiento de respuestas incompletas como punto de
partida para la interacción. La consigna explícita “guíame con preguntas”, aunque útil, no es suficiente.
Adaptación mutua y modelo híbrido docente
La proposición central de que los resultados positivos de la intervención no son atribuibles al diseño
puro sino al diseño vivido se alinea con la tradición de investigación sobre adaptación mutua (Fullan y
Pomfret, 1977; Stenhouse, 1975) y con los marcos TPACK y AI-TPACK (Mishra y Koehler, 2006;
Celik, 2023). La integración tecnológica efectiva no emerge de la simple disposición de la herramienta
sino de la articulación reflexiva entre material curricular, conocimiento disciplinar y conocimiento
pedagógico del docente.

pág. 8502
El modelo híbrido configurado por el docente —que alterna mediación con IA y explicación
magistral— funciona porque distribuye las funciones cognitivas entre los dispositivos según sus aportes
diferenciales. La IA opera bien para ejercitación mediada y verificación de procedimientos; la
explicación docente sostiene la igualación conceptual del grupo y resuelve los puntos donde la
mediación individual con IA encuentra sus límites. La separación rígida entre ambos modos, que el
diseño original del taller asumía implícitamente, no se sostiene en el aula presencial con grupos
numerosos y heterogéneos.
Implicaciones
Las implicaciones para el diseño de materiales formativos mediados por IAGen son tres. Primera, los
materiales deben explicitar los momentos de explicación docente como componente integral, no como
adaptación opcional. Segunda, los ejercicios deben diseñarse atendiendo las tres condiciones del uso
socrático identificadas, especialmente cuando el objetivo formativo es trasladar a los estudiantes hacia
la mediación dialógica con la herramienta. Tercera, la formación de docentes implementadores debe
incluir lineamientos sobre orquestación instrumental con IAGen, anticipando tanto el comportamiento
del estudiante como el comportamiento de la herramienta. Lo que en el presente estudio ocurrió por
iniciativa de un docente con experiencia previa puede no ocurrir con un implementador neófito que
asuma fielmente el diseño prescrito.
Limitaciones
Cinco limitaciones acotan el alcance de los hallazgos. Primero, las entrevistas estudiantiles cubrieron
tres participantes seleccionados por máxima variación, lógica adecuada para profundidad interpretativa
pero no para saturación temática estricta. Segundo, la entrevista al docente fue aplicada a un único
informante con perfil específico —estudiante avanzado de Enseñanza de la Matemática con experiencia
previa en implementación con IA—, lo que limita la transferibilidad del modelo híbrido a docentes
neófitos. Tercero, el registro de observación de la sesión 4 fue parcial, lo que reduce la robustez del
análisis transversal de las dimensiones de engagement, fidelidad y uso ético en ese día. Cuarto, la
observación estuvo a cargo de una única observadora externa, lo que impide estimar coeficientes de
acuerdo interobservador. Quinto, el análisis de las interacciones se basa en la codificación de las guías
estudiantiles, no en las transcripciones textuales de las consultas a la IA; análisis futuros con esos

pág. 8503
registros permitirán validar las categorías codificadas y profundizar especialmente en el caso de S4-E1,
donde la categoría de “preguntas guía” adquirió protagonismo por primera vez.
RECOMENDACIONES
Futuras líneas de investigación deberían considerar: (a) ampliar la muestra de estudiantes entrevistados
para evaluar la generalizabilidad de los rasgos de apropiación identificados; (b) incluir múltiples
docentes implementadores con perfiles heterogéneos para distinguir lo que corresponde al diseño
didáctico de lo que corresponde al perfil profesional del implementador; (c) analizar las transcripciones
textuales de las consultas a la IA, particularmente en el ejercicio S4-E1, para validar las categorías de
codificación y explorar el papel concreto del fraseo del prompt; (d) replicar el estudio en otros
contenidos matemáticos universitarios, evaluando si las tres condiciones del uso tutorial se mantienen
como criterio de diseño didáctico transferible.
CONCLUSIONES
El estudio responde a las tres preguntas de investigación formuladas inicialmente con conclusiones
empíricas claras. En primer lugar, la interacción estudiante–IA se reconfiguró tras la intervención
didáctica con prompt socrático: los tres estudiantes entrevistados, con independencia de su nivel inicial,
transitaron de un uso instrumental a un uso reflexivo de la herramienta, apropiando el prompt como
objeto de aprendizaje y diferenciando estratégicamente sus modos de interacción según el propósito.
En segundo lugar, el uso genuinamente tutorial de la IA emergió en condiciones específicas que la
consigna textual por sí sola no garantiza. La concentración del 90,3 % de los casos de uso tutorial en
un único ejercicio del taller, en el que confluyeron contenido conceptualmente exigente, prompt que
invita a explicar y respuesta inicial incompleta, sostiene la propuesta analítica de las tres condiciones
del uso socrático como criterio de diseño didáctico.
En tercer lugar, la apropiación estudiantil del prompt no opera de manera autónoma respecto de la
mediación docente. El docente-tutor configuró un modelo híbrido al introducir explicaciones
magistrales no prescritas por la guía, modelo que sostuvo la experiencia positiva reportada por los
estudiantes. Los efectos atribuibles a la intervención no provienen del dispositivo IA + prompt
aisladamente considerado, sino del dispositivo operado por un docente que articula la mediación
tecnológica con la mediación humana en función de las condiciones del aula.

pág. 8504
Estos hallazgos contribuyen al campo emergente de la mediación con IAGen en educación matemática
universitaria al ofrecer un criterio operativo de diseño didáctico —las tres condiciones del uso
socrático— y una clave interpretativa de los resultados de implementación —el modelo híbrido
docente—. Ambos aportes son susceptibles de confirmación, refinamiento o refutación con
investigaciones de mayor escala, y están llamados a orientar el rediseño de futuras intervenciones
formativas que integren herramientas de IAGen en contextos universitarios.
REFERENCIAS BIBLIOGRAFICAS
Braun, V., y Clarke, V. (2006). Using thematic analysis in psychology. Qualitative Research in
Psychology, 3(2), 77–101. https://doi.org/10.1191/1478088706qp063oa
Braun, V., y Clarke, V. (2019). Reflecting on reflexive thematic analysis. Qualitative Research in Sport,
Exercise and Health, 11(4), 589–597. https://doi.org/10.1080/2159676X.2019.1628806
Celik, I. (2023). Towards Intelligent-TPACK: An empirical study on teachers' professional knowledge
to ethically integrate artificial intelligence (AI)-based tools into education. Computers in Human
Behavior, 138, 107468. https://doi.org/10.1016/j.chb.2022.107468
Celik, I., Dindar, M., Muukkonen, H., y Järvelä, S. (2022). The promises and challenges of artificial
intelligence for teachers: A systematic review of research. TechTrends, 66(4), 616–630.
https://doi.org/10.1007/s11528-022-00715-y
Century, J., Rudnick, M., y Freeman, C. (2010). A framework for measuring fidelity of implementation:
A foundation for shared language and accumulation of knowledge. American Journal of
Evaluation, 31(2), 199–218. https://doi.org/10.1177/1098214010366173
Chan, C. K. Y., y Hu, W. (2023). Students' voices on generative AI: Perceptions, benefits, and
challenges in higher education. International Journal of Educational Technology in Higher
Education, 20, 43. https://doi.org/10.1186/s41239-023-00411-8
Creswell, J. W., y Plano Clark, V. L. (2018). Designing and conducting mixed methods research (3.ª
ed.). SAGE Publications.
Danielson, C. (2013). The framework for teaching evaluation instrument (2013 ed.). The Danielson
Group.

pág. 8505
DiCicco-Bloom, B., y Crabtree, B. F. (2006). The qualitative research interview. Medical Education,
40(4), 314–321. https://doi.org/10.1111/j.1365-2929.2006.02418.x
Drijvers, P. (2023). The teacher and digital technology: Orchestrating learning processes. ZDM
Mathematics Education, 55(5), 853–867. https://doi.org/10.1007/s11858-023-01531-2
Flanagan, J. C. (1954). The critical incident technique. Psychological Bulletin, 51(4), 327–358.
https://doi.org/10.1037/h0061470
Fullan, M., y Pomfret, A. (1977). Research on curriculum and instruction implementation. Review of
Educational Research, 47(2), 335–397. https://doi.org/10.3102/00346543047002335
Galletta, A. (2013). Mastering the semi-structured interview and beyond: From research design to
analysis and publication. New York University Press.
Kasneci, E., Sessler, K., Küchemann, S., Bannert, M., Dementieva, D., Fischer, F., Gasser, U., Groh,
G., Günnemann, S., Hüllermeier, E., Krusche, S., Kutyniok, G., Michaeli, T., Nerdel, C., Pfeffer,
J., Poquet, O., Sailer, M., Schmidt, A., Seidel, T., … Kasneci, G. (2023). ChatGPT for good? On
opportunities and challenges of large language models for education. Learning and Individual
Differences, 103, 102274. https://doi.org/10.1016/j.lindif.2023.102274
Kvale, S., y Brinkmann, S. (2009). InterViews: Learning the craft of qualitative research interviewing
(2.ª ed.). SAGE Publications.
Mishra, P., y Koehler, M. J. (2006). Technological pedagogical content knowledge: A framework for
teacher knowledge. Teachers College Record, 108(6), 1017–1054.
https://doi.org/10.1111/j.1467-9620.2006.00684.x
O'Donnell, C. L. (2008). Defining, conceptualizing, and measuring fidelity of implementation and its
relationship to outcomes in K–12 curriculum intervention research. Review of Educational
Research, 78(1), 33–84. https://doi.org/10.3102/0034654307313793
Patton, M. Q. (2015). Qualitative research and evaluation methods (4.ª ed.). SAGE Publications.
Pianta, R. C., La Paro, K. M., y Hamre, B. K. (2008). Classroom Assessment Scoring System (CLASS)
manual, K–3. Paul H. Brookes Publishing.
Shulman, L. S. (1986). Those who understand: Knowledge growth in teaching. Educational Researcher,
15(2), 4–14. https://doi.org/10.3102/0013189X015002004
pág. 8506
Stenhouse, L. (1975). An introduction to curriculum research and development. Heinemann.
Tapia-Molina, M., Salgado-Soto, M. C., y Rocha-Bautista, F. (2024). Inteligencia artificial generativa
en la enseñanza de la matemática: una revisión sistemática. Revista Iberoamericana de
Educación, 95(1), 89–107.
Tripp, D. (1993). Critical incidents in teaching: Developing professional judgement. Routledge.
Trouche, L. (2024). Instrumental genesis revisited: Towards a comprehensive theoretical framework
for the integration of digital tools in mathematics education. Educational Studies in Mathematics,
115(1), 5–32. https://doi.org/10.1007/s10649-023-10238-9
UNESCO. (2022). Recomendación sobre la ética de la inteligencia artificial. Organización de las
Naciones Unidas para la Educación, la Ciencia y la Cultura.
https://unesdoc.unesco.org/ark:/48223/pf0000381137