pág. 1
Uso de U-Net Y Redes Neuronales Convolucionales
para la Detección de la Moniliasis (Moniliophthora
Roreri) en Mazorcas De Cacao
RADIO-HISTOPATHOLOGICAL CORRELATION IN PATIENTS
WITH NODULES SUSPICIOUS OF BREAST CANCER IN
IMAGING CLINIC, PERIOD 2021-2023
Héctor Suárez Díaz
Universidad Juarez Autónoma De Tabasco
Ángel Niño de Rivera Hermosillo
Universidad Juarez Autónoma De Tabasco
Jorge Armín Aguilar Camelo
Universidad Juarez Autónoma De Tabasco
Marco Aurelio González Romo
Universidad Juarez Autónoma De Tabasco
Maria Magdalena Leue Luna
Universidad Juarez Autónoma De Tabasco

pág. 4741
DOI: https://doi.org/10.37811/cl_rcm.v8i6.15915
Uso de U-Net Y Redes Neuronales Convolucionales para la Detección de la
Moniliasis (Moniliophthora Roreri) en Mazorcas De Cacao
Arcely Aquino Ruíz1
https://orcid.org/0009-0009-7363-9992
arcely.ar@villahermosa.tecnm.mx
Tecnológico Nacional de México Campus
Villahermosa
Dulce María León De la O
https://orcid.org/0000-0003-0877-7861
dulce.leono@villahermosa.tecnm.mx
Tecnológico Nacional de México Campus
Villahermosa
Raymundo García Mínguez
https://orcid.org/0009-0005-4615-6654
raymundo.gm@villahermosa.tecnm.mx
Tecnológico Nacional de México
Carlos Raúl Muñoz Rodríguez
https://orcid.org/0009-0001-7329-3014
carlos.mr@villahermosa.tecnm.mx
Tecnológico Nacional de México
José Ney Garrido Vázquez
https://orcid.org/0000-0003-3905-0120
jose.gv@villahermosa.tecnm.mx
Tecnológico Nacional de México Campus
Villahermosa
Carlos Armando Arellano Cruz
l21300032@villahermosa.tecnm.mx
Instituto Tecnológico de Villahermosa, correo
RESUMEN
El presente trabajo aborda la problemática en el sector agrícola; la disminución de la producción del cacao
a causa de la enfermedad de la moniliasis (Moniliophthora roreri) enfermedad que provoca pérdidas de
hasta el 90% en los cacaotales y que como alternativa se desarrolla KÄKÄWOL (Cacaotales en lengua
chontal), una app móvil para Android que utiliza inteligencia artificial (IA) con modelos U-net y redes
neuronales convolucionales (CNN) que responde a la complejidad única de la detección de moniliasis en
mazorcas de cacao, que a diferencia de los modelos de clasificación tradicionales, que solo detectan la
presencia o ausencia de la enfermedad, U-net ofrece una segmentación semántica precisa, crucial para
identificar las diferentes etapas de la moniliasis en una misma imagen. Las Redes neuronales
convolucionales estándar no logran una segmentación tan precisa de las etapas. U-net permite una
representación visual y cuantitativa del avance de la moniliasis y destaca por su capacidad para distinguir
y etiquetar píxeles pertenecientes a diferentes clases en una imagen, lo que permite identificar
simultáneamente: Puntos negros iniciales,Manchas grandes de desarrollo, Manifestación del hongo blanco
superficial. El uso de U-net en este contexto destaca por su capacidad de ofrecer un análisis más profundo
y detallado. Sin embargo, se resalta que el aprovechamiento de estas tecnologías aún es limitado en algunos
sectores económicos del país, subrayando la necesidad de ampliar su implementación para potenciar el
desarrollo agrícola.
Palabras clave: segmentación semántica, u-net, aprendizaje profundo, redes neuronales convolucionales,
moniliasis.
1 Autor principal
Correspondencia: arcely.ar@villahermosa.tecnm.mx

pág. 4742
Use of U-Net And Convolutional Neural Networks for the Detection of
Moniliasis (Moniliophthora Roreri) in Cocoa Beans
ABSTRACT
This work addresses the problem in the agricultural sector; the decrease in cocoa production due to the
moniliasis disease (Moniliophthora roreri), a disease that causes losses of up to 90% in cocoa plantations
and which, as an alternative, is developing KÄKÄWOL (Cacaotales in Chontal language), a mobile app
for Android that uses artificial intelligence (AI) with U-net models and convolutional neural networks
(CNN) that responds to the unique complexity of moniliasis detection, unlike traditional classification
models, which only detect the presence or absence of the disease, U-net offers precise semantic
segmentation, crucial to identify the different stages of moniliasis in the same image. Standard
Convolutional Neural Networks do not achieve such precise segmentation of stages. U-net allows a visual
and quantitative representation of the progression of moniliasis and stands out for its ability to distinguish
and label pixels belonging to different classes in an image, allowing simultaneous identification: Initial
black spots. Large development spots, Manifestation of superficial white fungus. The use of U-net in this
context stands out for its ability to offer a deeper and more detailed analysis. However, it is highlighted that
the use of these technologies is still limited in some economic sectors of the country, highlighting the need
to expand their implementation to enhance agricultural development.
Keywords: semantic segmentation, u-net, deep learning, convolutional neural networks, moniliasis
Artículo recibido 05 enero 2025
Aceptado para publicación: 15 febrero 2025

pág. 4743
INTRODUCCIÓN
El cambio climático ha provocado una crisis importante en la producción del cacao a nivel mundial, aunado
a que se han propagado enfermedades, las prácticas agrícolas no efectivas en el control y manejo de estas,
no ayudan a erradicarlas, una amenaza que afecta hasta el 90% de la producción de cacao es el hongo de la
moniliasis (Moniliophthora roreri).
En los Estados mexicanos de Veracruz, Guerrero, Chiapas y particularmente Tabasco, que aporta más del
60% de la producción nacional, este hongo ha estado impactando la estabilidad económica de más de 31,000
familias dependientes de este cultivo. En México, actualmente existen aproximadamente 45,000
productores de cacao, quienes han enfrentado grandes desafíos en las últimas décadas. En 1987 el país
alcanzó una cifra histórica de 59,000 toneladas, posicionándose como el octavo productor a nivel mundial.
Sin embargo, a partir de la aparición de la moniliasis en la década de los 2000, la producción disminuyó en
un 43.2% representando pérdidas económicas, aumentando el desempleo y pobreza. La producción actual
alcanza apenas 28,000 Toneladas de cacao.
En los últimos años, el avance en tecnologías de inteligencia artificial (IA) ha permitido el desarrollo de
diversas aplicaciones para la detección de enfermedades en cultivos. A diferencia de otros países
productores que avanzaron adoptando tecnologías agrícolas innovadoras y estrategias efectivas contra
plagas y enfermedades, México quedó rezagado en el desarrollo de su industria cacaotera. Es por ello por
lo que con la app móvil KÄKÄWOL se busca ser una herramienta tecnológica que coadyuve en las
problemáticas que se afronta actualmente:
• Envejecimiento del 25% de los cacaotales en Tabasco, con más de 40 años.
• Falta de control de plagas y enfermedades.
• Prácticas agrícolas no sustentables.
• Ausencia de herramientas tecnológicas en el sector agrícola.
• Falta de comunicación entre agricultores y dependencias gubernamentales del sector agropecuario.
• Falta de difusión eficiente de los programas de apoyo.
• Desconocimiento de los riesgos y manejo de la moniliasis, sin tratamiento definitivo.
Ante la crisis global de desabasto de cacao, KÄKÄWOL puede contribuir a estabilizar la producción para
satisfacer la creciente demanda, impactando positivamente los ejes transversales de:

pág. 4744
• Impacto social: Mejorar la calidad de vida y estabilidad financiera de los productores del cacao al
ofrecer un sistema de diagnóstico rápido y preciso que permite combatir la moniliasis. Esto ayuda a
proteger los ingresos de las familias agrícolas y fortalecer la seguridad alimentaria.
• Sustentabilidad y sostenibilidad: KÄKÄWOL fomenta prácticas de manejo ecológico al ofrecer
tratamientos orgánicos, contribuyendo a proteger la salud de los agricultores y preservando un
recurso de vital importancia histórica y cultural, presente en la dieta diaria del sureste mexicano.
• Tecnologías disruptivas de la Industria 4.0: El uso de inteligencia artificial para el análisis de
imágenes y la detección temprana de la moniliasis.
Con este último eje, las oportunidades de crecimiento de KÄKÄWOL abarcan su capacidad de expansión
global y de adaptación a otros cultivos afectados por diversas plagas y enfermedades. Su incursión en el
ámbito de la agricultura inteligente radica en el uso de inteligencia artificial y análisis de datos, ya que
con el uso de U-Net, la segmentación semántica es una tarea fundamental en el campo de la visión por
computadora y tiene el objetivo de clasificar cada píxel de una imagen en categorías claras.
Desde su creación, U-Net ha sido adaptado a varios campos, que incluyen la detección remota, la agronomía
y la segmentación de imágenes clínicas, y ha demostrado su capacidad para abordar problemas desafiantes
con un conjunto de datos limitados. Las variaciones actuales, incluyendo la Attention U-Net, U-Net y Sharp
U-Net, han mejorado aspectos como el flujo de gradientes, la atención a las regiones relevantes y la
precisión en bordes, entre otros, que extienden sus capacidades (Zhou et al., 2018; Oktay et al., 2018).
Justificación
Los modelos de clasificación tradicionales solo pueden determinar la presencia o ausencia de la enfermedad
y las Redes neuronales convolucionales estándar no logran una segmentación tan precisa de las etapas. U-
net permite una representación visual y cuantitativa del avance de la moniliasis.
¿Por qué el uso de U-net?
• Alta precisión en segmentación de imágenes médicas y biológicas
• Capacidad de manejar datasets pequeños con entrenamiento efectivo
• Arquitectura que permite identificar características sutiles
• Adaptabilidad para reconocer patrones en diferentes etapas de una enfermedad

pág. 4745
La arquitectura U-Net ha transformado de manera revolucionaria la segmentación semántica en imágenes
al brindar resultados precisos y eficientes. Esta arquitectura ha demostrado ser particularmente efectiva en
aplicaciones biomédicas donde los datos anotados son limitados, y en consecuencia ha demostrado ser
influyente generando una amplia adopción e inspirando en última instancia el desarrollo de variantes que
introducen correcciones a deficiencias importantes del modelo original, incluida la necesidad de datos
anotados a gran escala y la generalización a nuevos dominios (Ronneberger et al., 2015).
MATERIAL Y MÉTODOS
La muestra utilizada se compone de un conjunto de imágenes de mazorcas de cacao tomadas en campo, las
cuales presentan distintas etapas de la enfermedad de la moniliasis. Estas imágenes provienen de
plantaciones reales, donde cada fotografía fue anotada para identificar de forma precisa las áreas afectadas,
indicando si la mazorca presentaba las primeras manchas negras, las lesiones avanzadas más extensas o la
presencia de hongo blanquecino en la superficie. Se recopilaron 500 imágenes para reflejar la variabilidad
de condiciones ambientales, estados de maduración del cacao y severidad de la enfermedad, asegurando así
la representatividad necesaria para el entrenamiento y evaluación del modelo.
Dado que el objetivo principal del proyecto fue implementar un modelo de segmentación semántica basado
en U-Net con redes neuronales convolucionales, el análisis se centró en métricas específicas de validación
de modelos de visión por computadora.
Para cada una de las fases de la enfermedad (etapa inicial con puntos negros, etapa intermedia con manchas
más amplias y etapa avanzada con hongo visible), se utilizaron las siguientes métricas calculadas a partir
de la matriz de confusión:
• Exactitud (Accuracy)
• Precisión (Precision)
• Sensibilidad (Recall)
• F1-Score, complementadas con la revisión de las matrices de confusión.
Estas métricas permiten evaluar la calidad de la segmentación comparando las áreas detectadas por el
modelo con las etiquetas verdaderas. Por ejemplo, la precisión mide qué tan bien el modelo evita falsos
positivos, mientras que el recall indica su capacidad de detectar correctamente las verdaderas áreas
afectadas. El F1-Score equilibra estos dos aspectos, ofreciendo una métrica global de rendimiento.

pág. 4746
La implementación de una arquitectura U-Net para segmentar distintas fases de la moniliasis en una misma
imagen de cacao resulta relativamente novedosa en el ámbito agrícola. La decisión de emplear esta
metodología se basó en la capacidad de U-Net para manejar segmentaciones multiclase con alta precisión,
incluso con conjuntos de datos moderadamente limitados. Este enfoque permite que el modelo identifique
no solo la presencia de la enfermedad, sino también la fase específica, lo que es crítico para que el agricultor
tome decisiones informadas sobre el manejo del cultivo. Sin embargo, entre las limitaciones se incluyen la
necesidad de un etiquetado manual y experto de las imágenes, lo cual requiere tiempo y recursos. Además,
el modelo, entrenado con un conjunto de datos específicos, podría no generalizar perfectamente a otras
regiones geográficas, climas o variedades de cacao.
Finalmente, las exigencias computacionales del modelo dificultan su ejecución directamente en
dispositivos móviles, lo que motiva la necesidad de un servidor remoto para el procesamiento en tiempo
real. Los resultados se presentaron de manera visual y numérica para facilitar su interpretación. Se
mostraron ejemplos de imágenes originales junto a sus respectivas segmentaciones predichas, resaltando
cada fase de la enfermedad con un color distinto. Adicionalmente, se incluyeron tablas con los valores
promedio de Accuracy, Precision, Recall y F1-Score obtenidos en el conjunto de prueba para cada fase,
acompañadas de breves explicaciones sobre el significado y relevancia de cada métrica. Las matrices de
confusión también se expusieron de manera sencilla, mostrando la cantidad de aciertos y errores en cada
fase.
Por último, se ofreció un análisis narrativo que interpreta las métricas y las visualizaciones, evitando el uso
de tecnicismos complejos, con el fin de que el lector, independientemente de su experiencia técnica, pudiera
comprender el valor práctico y las fortalezas del sistema.
• Implementación Técnica Procesamiento de Imágenes
− Captura Móvil: El agricultor toma la fotografía directamente desde la aplicación.
− Envío y Almacenamiento: La imagen se transmite al servidor y se almacena en la base de datos.
− Procesamiento con U-net:
o El modelo previamente entrenado analiza la imagen.
o Realiza segmentación semántica identificando las diferentes etapas ○ Genera una imagen
segmentada con las zonas afectadas.
pág. 4747
o Produce un diagnóstico textual del estado de la enfermedad.
• Beneficios para el Agricultor
− Diagnóstico rápido y preciso
− Visualización del estado de la enfermedad
− Posibilidad de intervención temprana
− Registro histórico de la evolución de la enfermedad en sus cultivos
KÄKÄWOL utiliza una combinación de tecnologías de código abierto y propietarias para el desarrollo
del prototipo donde se utiliza:
• Visual Studio Code, un editor de código fuente gratuito.
• Lenguaje de programación Dart para la creación de aplicaciones móviles.
• La inteligencia artificial se establece mediante redes neuronales convolucionales (CNN) utilizando:
− Python (lenguaje de programación)
− TensorFlow (biblioteca para aprendizaje automático).
− El backend se desarrolla con Django, framework para Python y se utiliza PostgreSQL, un sistema
de gestor de bases de datos relacionales.

pág. 4748
La infraestructura incluye
− Dispositivos Android (smartphones y tabletas) para los usuarios.
− Equipos de cómputo para el desarrollo y entrenamiento de modelos.
− Servidores para almacenamiento del modelo final y datos mediante servicios en la nube.
RESULTADOS
Los resultados más recientes, obtenidos a partir de un conjunto de datos limitado debido a la falta de
imágenes de mazorcas en época de cosecha, revelaron diferencias en el desempeño de la segmentación
entre las distintas clases (fases de la enfermedad y la clase sin afectación).
En concreto, la clase principal (asociada a la zona sana o sin enfermedad) alcanzó valores altos de
precisión (0.9006) y recall (0.9502), mostrando una capacidad adecuada para diferenciar las áreas sanas.
Sin embargo, en las clases correspondientes a las fases de la enfermedad, las métricas fueron más bajas:
por ejemplo, la clase 1 alcanzó un F1-score de 0.4245, mientras que las clases 2, 3 y 4 mostraron
dificultades notables con F1-scores de 0.0355, 0.0806 y 0.0091 respectivamente. Estos hallazgos indican
un desequilibrio en el rendimiento del modelo, que identifica con mayor facilidad las áreas no afectadas,
pero presenta problemas para reconocer y segmentar de forma confiable las fases de la moniliasis.
Si bien el objetivo inicial era identificar y segmentar con precisión las distintas fases de la moniliasis en las
mazorcas de cacao, los resultados obtenidos hasta el momento solo cumplen parcialmente esta meta.
Por un lado, se logra diferenciar las zonas sanas de manera consistente, lo que es un paso importante hacia
el diagnóstico automático. Por otra parte, las fases de la enfermedad no se distinguen con el nivel de
fiabilidad esperado, lo que indica que aún se requieren mejoras en el modelo, la calidad o cantidad de datos,
o en las condiciones de entrenamiento para cumplir plenamente los objetivos planteados.
Una limitación crucial es el número limitado de imágenes de mazorcas disponibles, debido a que no se
obtuvo un conjunto de datos suficientemente variado o representativo de las distintas fases de la
enfermedad. Esta carencia de datos puede afectar la capacidad del modelo para generalizar y reconocer
patrones en condiciones distintas a las entrenadas. Asimismo, las bajas métricas en las clases de enfermedad
sugieren la necesidad de obtener más ejemplos de imágenes anotadas o ajustar la arquitectura y los
parámetros del modelo para mejorar su capacidad de segmentación de las fases de la moniliasis. Estas

pág. 4749
limitaciones deben ser consideradas al interpretar los resultados y antes de trasladar el modelo a un entorno
de uso real. Las observaciones más significativas incluyen:
− La clase sin enfermedad se segmentó con mayor precisión y sensibilidad, lo que sugiere que el modelo
distingue con relativa facilidad las áreas sanas de la mazorca.
− Las fases de la enfermedad mostraron un bajo nivel de precisión, recall y F1-score, evidenciando
dificultades del modelo para identificar con exactitud las distintas etapas de la moniliasis.
− Existe una disparidad notable en el rendimiento entre la clase saludable y las clases que representan
las fases de infección, lo que se refleja claramente en las métricas cuantitativas.
• Precisión de Diagnóstico
− Métrica: Tasa de aciertos en la detección de moniliasis.
− Resultado: El modelo de IA logró una precisión del *68% en la identificación de áreas afectadas.
• Estabilidad del Sistema
− Métrica: Tiempo de operación sin interrupciones.
− Resultado: El sistema operó sin interrupciones durante 100 cargas de imágenes.
• Tiempo de Respuesta
− Métrica: Tiempo promedio desde la carga de la imagen hasta la entrega del diagnóstico.
− Resultado: Tiempo de respuesta promedio de 1.5 minutos.
De acuerdo con el Nivel de Madurez de Tecnología, KÄKÄWOL se encuentra en la etapa TRL 5: “El
prototipo propuesto se somete a diversos análisis en entornos relevantes, pero aún en condiciones
controladas”. Los resultados obtenidos en esta etapa cumplen con los requisitos, demostrando que
KÄKÄWOL puede identificar la moniliasis en un entorno controlado de manera estable y con una precisión
aceptable.
• Próximos Pasos
1. Optimizar el modelo de IA para mejorar la precisión en imágenes con condiciones variables.
2. Planificar pruebas en un entorno menos controlado para avanzar hacia TRL 6.
Nota
* El porcentaje del 68% es inferior a lo esperado debido a la falta de imágenes que se requieren para
entrenar el modelo (la producción es escasa en esta época). Se espera que, al incorporar imágenes de

pág. 4750
cultivos de cacao, el modelo pueda mejorar su capacidad de identificación y diagnóstico, alcanzando
niveles de precisión superiores.
DISCUSIÓN Y CONCLUSIONES
Discusión
Los hallazgos más importantes de esta investigación se centran en la capacidad del modelo para distinguir,
con relativa eficacia, las zonas sanas de las mazorcas de cacao y su dificultad para identificar con precisión
las distintas fases de la moniliasis. Mientras que la clase correspondiente a “sin enfermedad” obtuvo
métricas sólidas (con una combinación favorable de precisión, sensibilidad y F1-score), las clases que
representan las etapas de la enfermedad mostraron un desempeño significativamente menor, reflejando
problemas para segmentar de forma confiable dichas zonas afectadas. Estos resultados guardan una relación
estrecha con el material y el método empleados.
El uso de una arquitectura U-Net estaba justificado por su eficiencia en tareas de segmentación semántica,
sin embargo, el conjunto de datos disponible resultó ser limitado y poco representativo, especialmente para
las fases avanzadas de la enfermedad. La recolección de imágenes se vio afectada por la época del año y la
disponibilidad real de mazorcas con moniliasis en diversas etapas, lo que influyó directamente en la
diversidad y cantidad de ejemplos disponibles para el entrenamiento y validación del modelo. En
consecuencia, las deficiencias en el rendimiento del sistema reflejan la necesidad de obtener más datos y
una mayor variedad de casos, confirmando que la eficacia de las técnicas empleadas depende en gran
medida de la calidad y representatividad de los datos de entrada. La principal aportación de estos resultados
radica en la identificación de las fortalezas y debilidades actuales del sistema. A nivel práctico, el hallazgo
de que el modelo segmenta fácilmente las zonas sanas sirve como base para identificar rápidamente áreas
sin infección, lo que podría ahorrar tiempo al agricultor. No obstante, las dificultades en detectar con
precisión las fases de la enfermedad resaltan la necesidad de refinar el proceso de adquisición de datos,
mejorar el etiquetado, o bien explorar ajustes en el modelo o metodologías complementarias. Estas
consideraciones tienen implicaciones directas en la posible implementación de la solución en el campo, ya
que un diagnóstico certero de la fase de la moniliasis es clave para la toma de decisiones agronómicas
adecuadas.