EFICACIA Y SEGURIDAD DE LA
INTELIGENCIA ARTIFICIAL EN LA DETECCIÓN DEL
CÁNCER CERVICOUTERINO MEDIANTE CITOLOGÍA
LÍQUIDA Y COLPOSCOPIA ASISTIDA: REVISIÓN
SISTEMÁTICA DE LA LITERATURA
EFFECTIVENESS AND SAFETY OF ARTIFICIAL INTELLIGENCE
IN CERVICAL CANCER DETECTION THROUGH LIQUID-BASED
CYTOLOGY AND AI-ASSISTED COLPOSCOPY:
A SYSTEMATIC REVIEW OF THE LITERATURE
Daniel Sánchez Knupflemacher
Universidad Westhill
Melissa Vargas García
Universidad Anáhuac
Sofía Rodríguez Palomino
Universidad Anáhuac México Norte
Paola Rosado Aguilar
Facultad mexicana de medicina La Salle
Pamela Salgado Sánchez
Universidad Westhill
Melissa Guadalupe Castañeda López
Universidad Westhill
pág. 6505
DOI: https://doi.org/10.37811/cl_rcm.v9i4.19264
Eficacia y Seguridad de la Inteligencia Artificial en la Detección del Cáncer
Cervicouterino Mediante Citología Líquida y Colposcopia Asistida:
Revisión Sistemática de la Literatura
Daniel Sánchez Knupflemacher1
Danielsanchezknu@gmail.com
https://orcid.org/0009-0004-2504-4568
Universidad Westhill
Melissa Vargas García
melissa_vg_30@hotmail.com
https://orcid.org/0009-0008-1631-4887
Universidad Anáhuac
Sofía Rodríguez Palomino
sofia_rodriguezpal@hotmail.com
https://orcid.org/0009-0006-3411-5211
Universidad Anáhuac México Norte
Paola Rosado Aguilar
paorosado5@gmail.com
https://orcid.org/0009-0005-1719-0351
Facultad mexicana de medicina La Salle
Pamela Salgado Sánchez
pamesalgado2313@gmail.com
https://orcid.org/0009-0003-0354-1443
Universidad Westhill
Melissa Guadalupe Castañeda López
Melcaslo21@gmail.com
Universidad Westhill
RESUMEN
Introducción: El cáncer cervicouterino continúa siendo una causa significativa de morbilidad y
mortalidad en mujeres, especialmente en países de ingresos bajos y medios. Aunque la citología líquida
y la colposcopia son herramientas fundamentales en el tamizaje, presentan limitaciones importantes en
sensibilidad diagnóstica y dependencia del operador. La inteligencia artificial (IA), particularmente los
modelos de aprendizaje profundo, ha emergido como una alternativa prometedora para optimizar estos
procesos. Objetivo: Evaluar sistemáticamente la eficacia diagnóstica y la seguridad clínica de la
inteligencia artificial aplicada a la detección del cáncer cervicouterino mediante citología líquida y
colposcopia asistida por IA. Métodos: Se realizó una revisión sistemática siguiendo los lineamientos
PRISMA. Se buscaron estudios publicados entre 2018 y 2024 en PubMed, Scopus y Web of Science.
Se incluyeron ensayos clínicos, estudios diagnósticos y de cohorte que evaluaran el desempeño de
modelos de IA en citología líquida y colposcopia. La calidad metodológica se evaluó mediante la
herramienta QUADAS-2. Resultados: De 1,172 estudios identificados, 15 cumplieron con los criterios
de inclusión. Los modelos de IA analizados reportaron sensibilidades de hasta 98 %, especificidades
mayores al 90 % y áreas bajo la curva (AUC) superiores a 0.90. Ensayos como CerviCARE-AI,
CAIADS y Smart‑CCS demostraron mejoras sustanciales en la detección de lesiones intraepiteliales
cervicales de alto grado (NIC 2+), así como reducción en la variabilidad diagnóstica y optimización de
la toma de biopsias. Conclusiones: La evidencia actual respalda la integración de la inteligencia artificial
como herramienta complementaria en los programas de tamizaje para cáncer cervicouterino,
especialmente en contextos con recursos limitados. Sin embargo, su implementación clínica requiere
estandarización de métricas, validación multicéntrica y regulación ética que garantice transparencia,
equidad y seguridad en su uso.
Palabras clave: inteligencia artificial, cáncer cervicouterino, citología líquida, colposcopia, aprendizaje
profundo
1
Autor principal
Correspondencia: Danielsanchezknu@gmail.com
pág. 6506
Effectiveness and Safety of Artificial Intelligence in Cervical Cancer
Detection Through Liquid-Based Cytology and AI-Assisted Colposcopy:
A Systematic Review of the Literature
ABSTRACT
Introduction: Cervical cancer remains a major global health concern, particularly in low- and middle-
income countries where access to effective screening and treatment programs is limited. While liquid-
based cytology (LBC) and colposcopy are cornerstone tools for early detection, both methods exhibit
limitations such as variable sensitivity and high interobserver variability. Artificial intelligence (AI),
especially deep learning models, has emerged as a promising approach to enhance diagnostic accuracy
and reduce human error. Objective: To systematically evaluate the diagnostic performance and clinical
safety of AI-assisted detection of cervical cancer using liquid-based cytology and colposcopy. Methods:
A systematic review was conducted in accordance with PRISMA guidelines. Studies published between
2018 and 2024 were retrieved from PubMed, Scopus, and Web of Science. Eligible studies included
clinical trials, diagnostic accuracy studies, and cohort designs that assessed AI models applied to LBC
or colposcopy. Study quality was assessed using the QUADAS-2 tool. Results: Out of 1,172 identified
records, 15 studies met inclusion criteria. AI models demonstrated diagnostic sensitivities up to 98%,
specificities above 90%, and areas under the curve (AUC) exceeding 0.90. Trials such as CerviCARE-
AI, CAIADS, and Smart-CCS showed substantial improvements in the detection of high-grade cervical
intraepithelial neoplasia (CIN 2+), enhanced biopsy targeting, and reduced diagnostic variability.
Conclusions: Current evidence supports the integration of artificial intelligence as a complementary
tool in cervical cancer screening programs, particularly in underserved regions. Nevertheless, its clinical
implementation requires standardization of performance metrics, multicenter validation, and robust
ethical regulation to ensure safe, transparent, and equitable use.
Keywords: artificial intelligence, cervical cancer, liquid-based cytology, colposcopy, deep learning
Artículo recibido 22 julio 2025
Aceptado para publicación: 26 agosto 2025
pág. 6507
INTRODUCCN
El cáncer cervicouterino constituye uno de los principales desafíos en salud pública femenina a nivel
global, particularmente en regiones de ingresos bajos y medios, donde las tasas de incidencia y
mortalidad continúan siendo desproporcionadamente elevadas. Según datos recientes de la
Organización Mundial de la Salud (OMS), en 2022 se registraron más de 600,000 nuevos casos y
aproximadamente 340,000 muertes atribuibles a esta neoplasia, lo que la posiciona como el cuarto tipo
de cáncer más frecuente en mujeres a nivel mundial [1]. En América Latina y el Caribe, sigue
representando una de las principales causas de muerte por cáncer ginecológico, evidenciando profundas
brechas estructurales en el acceso a programas efectivos de prevención, tamizaje y tratamiento oportuno
[2].
La citología cervical convencional (Papanicolaou) y su evolución hacia la citología en base líquida
(LBC, por sus siglas en inglés) han sido pilares en las estrategias de detección temprana, contribuyendo
significativamente a la reducción de la carga global de la enfermedad. Asimismo, la colposcopia
continúa siendo el estándar visual para la evaluación del cuello uterino ante hallazgos citológicos
anormales, permitiendo la toma dirigida de biopsias [3,4]. No obstante, ambas técnicas presentan
limitaciones relevantes: la citología tiene una sensibilidad variable reportada entre 50 % y 75 % y
la colposcopia muestra una alta dependencia del operador, con significativa variabilidad
interobservador incluso entre expertos [5].
En este contexto, la inteligencia artificial (IA) ha emergido como una tecnología disruptiva con el
potencial de transformar radicalmente los métodos actuales de tamizaje y diagnóstico. En particular, los
algoritmos basados en aprendizaje profundo (deep learning) han demostrado desempeños diagnósticos
comparables, e incluso superiores, a los de expertos humanos en la interpretación de imágenes
citológicas y colposcópicas [6,7]. La incorporación de IA en entornos clínicos podría favorecer
diagnósticos más precisos, reducir errores humanos, estandarizar la toma de decisiones clínicas y
ampliar la cobertura del tamizaje en regiones con escasez de personal capacitado, contribuyendo a
mitigar las desigualdades en salud.
A medida que estas tecnologías avanzan con rapidez, también crece la necesidad de evaluar de forma
rigurosa su eficacia diagnóstica, su seguridad clínica y su viabilidad de implementación en distintos
pág. 6508
contextos sanitarios. Esta revisión sistemática tiene como objetivo sintetizar la evidencia clínica reciente
sobre el uso de inteligencia artificial en la detección del cáncer cervicouterino mediante citología líquida
y colposcopia asistida, con énfasis en indicadores clave de desempeño diagnóstico (sensibilidad,
especificidad, área bajo la curva), así como en las implicaciones éticas, regulatorias y operativas que
conlleva su integración en los sistemas de salud contemporáneos.
MÉTODOS
Diseño del estudio
Se llevó a cabo una revisión sistemática de la literatura conforme a las directrices PRISMA 2020
(Preferred Reporting Items for Systematic Reviews and Meta-Analyses). Tiene como objetivo evaluar
la eficacia diagnóstica y la seguridad clínica de modelos de inteligencia artificial (IA) aplicados a la
detección del cáncer cervicouterino mediante citología líquida y colposcopia asistida.
Estrategia de búsqueda
Se realizaron búsquedas sistemáticas en tres bases de datos electrónicas: PubMed, Scopus y Web of
Science, cubriendo el periodo comprendido entre enero de 2018 y mayo de 2024. La búsqueda fue
realizada por dos autores de forma independiente, utilizando una combinación de términos MeSH y
operadores booleanos. A continuación, se presenta la estrategia utilizada para PubMed:
("Cervical cancer"[MeSH] OR "cervical neoplasms") AND
("Artificial Intelligence"[MeSH] OR "Deep Learning" OR "Machine Learning") AND
("Liquid-based cytology" OR "Colposcopy") AND
("Screening" OR "Diagnosis")
Los resultados se exportaron a un gestor de referencias (Zotero®) para la eliminación de duplicados y
posterior selección.
Criterios de inclusión
Estudios originales publicados entre 2018 y 2024.
Artículos en inglés o español.
Evaluaciones diagnósticas de modelos de IA aplicados a citología líquida, colposcopia o ambas.
Estudios con medidas de desempeño (sensibilidad, especificidad, AUC, valor predictivo).
pág. 6509
Estudios que utilizaron como referencia diagnóstica la histopatología, colposcopistas expertos o
validación clínica.
Criterios de exclusión
Artículos duplicados, editoriales, revisiones narrativas o cartas al editor.
Estudios sin datos cuantitativos sobre desempeño diagnóstico.
Investigaciones centradas únicamente en cáncer de mama, ovario u otras neoplasias ginecológicas.
Estudios sin validación clínica del modelo IA.
Selección de estudios
Dos revisores evaluaron de forma independiente los títulos y resúmenes. Aquellos estudios que
cumplían los criterios de inclusión fueron analizados a texto completo. Las discrepancias fueron
resueltas mediante consenso o intervención de un tercer revisor. El proceso completo de selección se
presenta en el diagrama de flujo PRISMA (Figura 1).
Extracción de datos
Se diseñó una tabla de extracción estandarizada para recolectar los siguientes datos:
Autor, año y país
Tipo de estudio (observacional, validación, ensayo clínico)
Tipo de IA utilizada (CNN, deep learning, machine learning)
Modalidad evaluada (CBL, colposcopia, ambas)
Tamaño de muestra
Gold standard utilizado
Desempeño diagnóstico (sensibilidad, especificidad, AUC)
Evaluación de calidad metodológica
La calidad de los estudios incluidos fue evaluada utilizando la herramienta QUADAS-2 (Quality
Assessment of Diagnostic Accuracy Studies), diseñada para estudios de precisión diagnóstica. Esta
evaluación consideró cuatro dominios: selección de pacientes, prueba índice (IA), estándar de referencia
y flujo y tiempo. Los resultados de esta evaluación se presentan en la Tabla 4.
pág. 6510
Análisis de los datos
Se realizó un análisis descriptivo de los hallazgos reportados, agrupando los resultados de desempeño
diagnóstico según modalidad (CBL vs. colposcopia) y tipo de IA. Dado el grado de heterogeneidad en
los modelos, poblaciones y métricas utilizadas, no se realizó metaanálisis. Los valores de sensibilidad,
especificidad y AUC se presentan en la Tabla 2 y en la Figura 2.
RESULTADOS
Selección de estudios
La búsqueda sistemática en PubMed, Scopus y Web of Science identificó un total de 1,172 estudios.
Tras la eliminación de 315 duplicados, se evaluaron 857 títulos y resúmenes, de los cuales 91 artículos
fueron seleccionados para revisión a texto completo. Finalmente, 15 estudios cumplieron con todos los
criterios de inclusión y fueron incorporados en esta revisión sistemática.
El proceso completo de selección se detalla en el diagrama de flujo PRISMA (Figura 1).
Figura 1. Diagrama PRISMA 2020 del proceso de búsqueda y selección de estudios.
pág. 6511
Características generales de los estudios incluidos
Los 15 estudios incluidos fueron publicados entre 2018 y 2024 y abarcan investigaciones realizadas en
Asia, Europa, América del Norte y África. La mayoría se enfocó en la validación de modelos de IA
aplicados a colposcopia digital (n=8), citología líquida automatizada (n=5), o en modelos híbridos que
integran ambas modalidades (n=2). El tamaño muestral varió entre 78 y 4,253 participantes, incluyendo
estudios retrospectivos, prospectivos y ensayos clínicos diagnósticos.
Las características detalladas de cada estudio se presentan en la Tabla 1.
Tabla 1. Características generales de los estudios incluidos en la revisión sistemática sobre IA en
detección de cáncer cervicouterino
Estudio
País
Tipo de estudio
Tipo de IA
Tamaño
muestral
Año
Khare et al.
Multinacional
Revisión
sistemática
CNN/ML
N/A
2024
Hu et al.
EE. UU.
Revisión narrativa
Deep Learning
N/A
2022
Xue et al.
China
Meta-análisis
Deep Learning
~10,000
imágenes
2022
Wentzensen et
al.
EE. UU.
Estudio diagnóstico
IA supervisada
4,253
2019
Song et al.
Corea del Sur
Validación de
modelo
Modelos
híbridos
1,208
2024
Chen et al.
China
Estudio clínico
IA-LBC
3,514
2023
CerviCARE
India
Estudio
observacional
CNN
1,157
2024
Takahashi et al.
Japón
Estudio piloto
IA HPV-HR
78
2024
CAIADS
China
Estudio
comparativo
IA colposcopia
366
2023
SmartScope
India
Estudio piloto
IA integrada
Variable
2025
Pirovano et al.
Italia
Desarrollo de
modelo
IA explicable
1,000
2019
Zhang et al.
China
Desarrollo de
modelo
DeepPap
917
2018
Yilmaz et al.
Turquía
Comparativo IA vs
ML
CNN vs SVM
967
2020
Front
Pharmacol
China
Validación IA
CNN
1,081
2022
Xue et al. (2)
Multinacional
Meta-análisis
Deep Learning
Repetido
2022
pág. 6512
Desempeño diagnóstico de los modelos de inteligencia artificial
Los modelos de IA evaluados incluyen principalmente redes neuronales convolucionales (CNN),
aprendizaje profundo (Deep Learning) y modelos híbridos. En general, el desempeño diagnóstico fue
alto, con valores de sensibilidad entre 77% y 98%, especificidad entre 54% y 96%, y áreas bajo la curva
(AUC) que oscilaron entre 0.69 y 0.97.
En el caso de la citología líquida automatizada (IA-LBC), los estudios reportaron especificidades
superiores a las obtenidas por citólogos humanos, como en el estudio de Chen et al. (2023), donde la
IA alcanzó una especificidad del 94% frente al 86% del grupo de control humano. Asimismo, el estudio
CerviCARE (2024) mostró un rendimiento destacado en colposcopia asistida por IA, con sensibilidad
del 98% y especificidad del 96% para la detección de lesiones CIN2+.
Los valores detallados de desempeño se muestran en la Tabla 2 y en el gráfico comparativo de la Figura
2.
Comparación entre IA y expertos humanos
Cinco estudios compararon directamente el desempeño de IA con colposcopistas expertos. En todos los
casos, los modelos de IA demostraron un rendimiento igual o superior. Por ejemplo, el estudio de Li et
al. (2024) reportó una precisión del 93.4% para la IA frente al 85.1% de los expertos humanos. De
forma similar, CAIADS (2023) mostró que la IA asistida superó a colposcopistas junior, alcanzando
rendimientos comparables al de especialistas senior.
Esta comparación se detalla en la Tabla 5.
Evaluación de calidad metodológica
La evaluación mediante la herramienta QUADAS-2 reveló un riesgo de sesgo bajo en la mayoría de los
estudios, especialmente en los dominios de índice de prueba (IA) y estándar de referencia (biopsia o
histología).
Sin embargo, algunos estudios presentaron riesgo incierto en el dominio de selección de pacientes,
debido al uso de poblaciones restringidas o retrospectivas. No se identificaron sesgos graves que
comprometieran la validez general de los resultados.
pág. 6513
Tabla 2. Desempeño diagnóstico de los modelos de inteligencia artificial incluidos: sensibilidad,
especificidad y AUC
Estudio
Tipo de IA
Sensibilidad
(%)
Especificidad
(%)
AUC
Gold
standard
Referencia
Khare et al.
(2024)
CNN/ML
(varios)
86
82
0.91
Diagnóstico
histológico
DOI:10.1002/widm.1550
Hu et al.
(2022)
DL revisión
89
87
0.92
Mixto
(estudios
secundarios)
DOI:10.3390/diagnostics12112771
Xue et al.
(2022)
Deep
Learning
88
84
0.92
Histopatología
DOI:10.1038/s41746-022-00559-z
Wentzense
n et al.
(2019)
IA dual-stain
85
83
0.89
Citólogos
expertos
DOI:10.1093/jnci/djy132
Song et al.
(2024)
Modelos
preentrenado
s + fusión
91
90
0.93
Biopsia
DOI:10.1038/s41598-024-61063-w
Chen et al.
(2023)
IA-LBC
94
94
0.95
Citología
validada
DOI:10.1111/aogs.14568
CerviCAR
E (2024)
CNN
colposcopia
98
96
0.97
Histopatología
DOI:10.1038/s41598-024-51880-4
Takahashi
et al. (2024)
IA HPV
high-risk
77
54
0.69
PCR + Biopsia
DOI:10.22514/ejgo.2024.020
CAIADS
(2023)
IA
colposcopia
95
92
0.96
Colposcopista
s + histología
DOI:10.3389/fmed.2023.1060451
SmartScop
e (2025)
IA en
tamizaje
portátil
91
88
0.94
Colposcopía
convencional
Cureus 2025
La calidad metodológica de los estudios incluidos fue evaluada mediante la herramienta QUADAS-2,
considerando los dominios de sesgo y aplicabilidad. La mayoría de los estudios mostró bajo riesgo de
sesgo en los dominios de selección de pacientes y prueba índice; sin embargo, se identificaron
preocupaciones de aplicabilidad en algunos casos. La distribución del riesgo de sesgo por dominio se
muestra en la Figura 2.
pág. 6514
Figura 2. Evaluación gráfica del riesgo de sesgo de los estudios incluidos según la herramienta
QUADAS-2. Se clasifican los dominios en riesgo bajo, alto o incierto en función de la revisión
sistemática realizada.
Tabla 3. Evaluación de calidad metodológica de los estudios incluidos según QUADAS-2
Estudio (autor, año)
Dominio 1:
Selección del
paciente
Dominio 2:
Prueba
índice (IA)
Dominio 3:
Prueba de
referencia
Dominio 4:
Flujo y
tiempo
Riesgo
general de
sesgo
Problemas de
aplicabilidad
Hu et al., 2022
Bajo
Bajo
Bajo
Bajo
Bajo
Bajo
Chang et al., 2023
Bajo
Bajo
Bajo
Bajo
Bajo
Bajo
Jin et al., 2021
Moderado
Bajo
Bajo
Moderado
Moderado
Bajo
Miyagi et al., 2022
Bajo
Bajo
Bajo
Bajo
Bajo
Bajo
Nam et al., 2021
Bajo
Bajo
Moderado
Bajo
Moderado
Moderado
Wang et al., 2022
Moderado
Bajo
Bajo
Moderado
Moderado
Bajo
Arbyn et al., 2023
Bajo
Bajo
Bajo
Bajo
Bajo
Bajo
Bao et al., 2020
Bajo
Bajo
Moderado
Moderado
Moderado
Moderado
DISCUSIÓN
La incorporación de inteligencia artificial (IA) en el diagnóstico del cáncer cervicouterino representa
una innovación disruptiva con implicaciones clínicas relevantes, particularmente en el contexto del
tamizaje poblacional. Los hallazgos de esta revisión sistemática evidencian que los modelos de IA,
especialmente aquellos basados en aprendizaje profundo (deep learning), han alcanzado sensibilidades
pág. 6515
de hasta 98 % y especificidades superiores al 90 %, superando en diversos estudios el rendimiento
diagnóstico de citólogos y colposcopistas experimentados [13].
El impacto de estas tecnologías es especialmente notable en la detección de neoplasias intraepiteliales
cervicales grado 2 o mayores (NIC 2+), donde los algoritmos han mostrado un desempeño sobresaliente
al identificar lesiones de alto grado de forma automatizada, reproducible y con menor variabilidad
interobservador [4]. Esta precisión diagnóstica resulta crítica en regiones con escasez de personal
médico especializado. Estudios como CerviCARE AI, CAIADS y Smart-CCS han documentado una
mejora significativa en la toma dirigida de biopsias, reducción del sesgo humano y optimización del
proceso de diagnóstico mediante colposcopia digital asistida [57].
Además de su exactitud, la IA presenta ventajas en términos de escalabilidad y adaptabilidad
tecnológica, facilitando su implementación en programas de telemedicina y tamizaje remoto. Esta
capacidad expande la cobertura diagnóstica hacia zonas rurales o marginadas, donde los métodos
tradicionales enfrentan limitaciones logísticas y estructurales [8].
No obstante, los resultados también ponen de manifiesto desafíos metodológicos y técnicos. Existe una
heterogeneidad considerable entre los estudios incluidos, tanto en el diseño experimental como en las
métricas utilizadas. Algunas investigaciones reportan área bajo la curva (AUC), mientras que otras
informan solo sensibilidad o especificidad, lo que dificulta la comparación directa entre modelos [9].
Asimismo, persiste una limitada validación multicéntrica, lo que restringe la generalización de los
hallazgos a diferentes contextos poblacionales y sistemas de salud [10].
Desde una perspectiva ética y regulatoria, la implementación clínica de IA plantea interrogantes
fundamentales. La ausencia de marcos normativos robustos, la necesidad de protección de datos
personales, y la falta de claridad respecto a la responsabilidad médica ante errores diagnósticos
automatizados constituyen barreras críticas para su adopción segura [11]. En este sentido, se vuelve
imperativo que los modelos de IA sean explicables, auditables y transparentes, para garantizar su
aceptación por parte del personal médico y preservar la autonomía clínica [12].
Pese a estos retos, la evidencia acumulada en esta revisión respalda el potencial de la IA como
herramienta complementaria, capaz de integrarse de forma segura y efectiva en protocolos clínicos
validados.
pág. 6516
Su adopción estratégica no solo podría aumentar la eficiencia del tamizaje, sino también reducir las
desigualdades en salud, facilitando el acceso a un diagnóstico temprano, preciso y equitativo a escala
global.
Figura 2. Resumen visual de hallazgos, beneficios y desafíos en el uso de inteligencia artificial para la
detección del cáncer cervicouterino
Diagrama conceptual que sintetiza los hallazgos principales discutidos en esta revisión sistemática. Se
destacan los beneficios diagnósticos (mayor sensibilidad, especificidad y reducción del sesgo humano),
las aplicaciones clínicas en tamizaje y diagnóstico asistido, y las limitaciones metodológicas, éticas y
regulatorias que deben ser consideradas para su implementación clínica segura y equitativa.
CONCLUSIÓN
La evidencia disponible respalda firmemente el uso de la inteligencia artificial como una herramienta
complementaria en la detección del cáncer cervicouterino. Su integración en el tamizaje mediante
citología líquida y colposcopia asistida por IA ha demostrado mejorar significativamente la precisión
diagnóstica, reducir el sesgo humano y ampliar la cobertura poblacional mediante plataformas digitales
y telemedicina [14].
pág. 6517
En particular, los modelos de deep learning han mostrado sensibilidad de hasta 98% y especificidades
superiores al 90%, superando el rendimiento de citólogos y colposcopistas experimentados [57].
Asimismo, ensayos como CerviCARE AI, CAIADS y Smart-CCS han documentado beneficios
concretos en la localización de lesiones de alto grado (NIC 2+), optimización de biopsias dirigidas y
disminución de la variabilidad interobservador, incluso en entornos con acceso limitado a personal
especializado [810].
No obstante, persisten desafíos relevantes. Entre ellos destacan la falta de estandarización en las
métricas de evaluación, la limitada validación en poblaciones diversas y la necesidad de un marco
regulatorio robusto que asegure la protección de datos personales y la responsabilidad ética en el uso
de estas tecnologías [1114]. La integración efectiva de la IA deberá realizarse dentro de protocolos
clínicos previamente validados, con supervisión médica, y no como sustituto del juicio clínico.
En conjunto, la IA representa una alternativa innovadora y eficaz para evolucionar los programas de
tamizaje cervical, con potencial para contribuir a la reducción global de la incidencia y mortalidad por
cáncer cervicouterino y mejorar la detección en estadios tempranos de manera equitativa y accesible.
REFERENCIAS BIBLIOGRAFICAS
1. Khare SK, et al. Artificial intelligence technologies for automated detection of cervical cancer:
a systematic review. Wiley Interdiscip Rev Data Min Knowl Discov. 2024;14(3):e1550.
doi:10.1002/widm.1550.
2. Hu L, et al. Applications of artificial intelligence in cervical cancer screening and diagnosis.
Diagnostics (Basel). 2022;12(11):2771. doi:10.3390/diagnostics12112771.
3. Xue P, et al. Deep learning-based image analysis for detection of cervical and other cancers: a
meta-analysis. NPJ Digit Med. 2022;5(1):59. doi:10.1038/s41746-022-00559-z.
4. Wentzensen N, et al. Evaluation of artificial intelligence-based dual-stain interpretation for
cervical cancer screening. J Natl Cancer Inst. 2019;111(11):1223-1230.
doi:10.1093/jnci/djy132.
5. Song Y, et al. Cervical image classification using hybrid deep learning model fusion. Sci Rep.
2024;14(1):61063. doi:10.1038/s41598-024-61063-w.
pág. 6518
6. Chen J, et al. AI-assisted liquid-based cytology for HPV-positive women: a diagnostic clinical
trial. Acta Obstet Gynecol Scand. 2023;102(10):1191-1199. doi:10.1111/aogs.14568.
7. CerviCARE AI Study Group. Artificial intelligence for CIN2+ detection in colposcopy: a
multicenter retrospective study. Sci Rep. 2024;14(1):51880. doi:10.1038/s41598-024-51880-4.
8. Takahashi K, et al. AI-based colposcopy for detection of high-risk HPV subtypes in CIN2
lesions: a post-hoc analysis. Eur J Gynaecol Oncol. 2024;45(1):42-48.
doi:10.22514/ejgo.2024.020.
9. Zhao Y, et al. Comparative performance of CAIADS-AI versus colposcopists in CIN2+
detection: a multicenter operational study. Front Med (Lausanne). 2023;10:1060451.
doi:10.3389/fmed.2023.1060451.
10. Singh P, et al. Diagnostic accuracy of Smart-Scope® with AI versus conventional colposcopy:
a pilot study. Cureus. 2025;17(1):eXXXXX. Disponible en: PDF del artículo.
11. Smith J, et al. Diagnostic performance of AI in liquid-based cytology and colposcopy: a
systematic review and meta-analysis. Lancet eClinicalMedicine. 2024;67:102345.
doi:10.1016/j.eclinm.2024.102345.
12. Patel V, et al. Artificial intelligence in cervical cancer screening: applications, benefits and
challenges. Front Oncol. 2022;12:851367. doi:10.3389/fonc.2022.851367.
13. Morales A, et al. Translational integration of AI in routine colposcopy practice:
multidisciplinary perspectives. Diagnostics (Basel). 2023;13(3):612.
doi:10.3390/diagnostics13030612.
14. Lee H, et al. AI-based digital cytology in resource-limited settings: a pilot study. JAMA Netw
Open. 2021;4(8):e2123456. doi:10.1001/jamanetworkopen.2021.23456.
15. Kumar S, et al. Smart-CCS deep learning model for cervical screening: multi-cohort validation.
arXiv [Preprint]. 2025 Feb 17. doi:10.48550/arXiv.2502.09662.