DOI: https://doi.org/10.37811/cl_rcm.v6i6.3830
Geocercas Inteligentes
Rosa de Guadalupe Cano Anguiano
https://orcid.org/0000-0001-7787-9058
M.C., Depto. De Sistemas y Computación,
Tecnológico Nacional de México/I.T. Colima
Carolina Palma Preciado
https://orcid.org/0000-0003-3253-4464
Estudiante de Ingeniería en Sistemas Computacionales,
Depto. De Sistemas y Computación,
Tecnológico Nacional de México/I.T. Colima
Ariel Lira Obando
https://orcid.org/0000-0002-6703-3697
M.C., Depto. De Sistemas y Computación,
Tecnológico Nacional de México/I.T. Colima
María Elena Martínez Durán
https://orcid.org/0000-0003-1615-5130
M.C., Depto. De Sistemas y Computación,
Tecnológico Nacional de México/I.T. Colima
Lindalva Ponce Ibarra
https://orcid.org/0000-0002-7495-5200
M.C., Depto. De Sistemas y Computación,
Tecnológico Nacional de México/I.T. Colima
Correspondencia: [email protected]
Artículo recibido 11 octubre 2022 Aceptado para publicación: 11 noviembre 2022
Conflictos de Interés: Ninguna que declarar
Todo el contenido de Ciencia Latina Revista Científica Multidisciplinar, publicados en este sitio están disponibles bajo Licencia Creative Commons .
Cómo citar: Cano Anguiano, R. de G., Palma Preciado, C., Lira Obando, A., Martínez Durán , M. E., & Ponce Ibarra, L. (2022). Geocercas Inteligentes. Ciencia Latina Revista Científica Multidisciplinar, 6(6), 5588-5607. https://doi.org/10.37811/cl_rcm.v6i6.3830
RESUMEN
El estar a la vanguardia en la tecnología es de vital importancia sobre todo si se habla de una plataforma gubernamental como lo es el caso de Cartografía - Catastro Colima. Es por ello que se actualizó la aplicación web para que permita generar consultas dinámicas mediante dibujo de geocercas, ya que se trabaja con datos de carácter georeferencial, esto debido a que se quiere generar información relevante a partir de los datos. La metodología usada para desarrollarlo fue una enfocada a la exploración de datos (KDD).
La importancia del proyecto no solo radica en la actualización de la aplicación sino la implementación de minería de datos por medio de la plataforma Weka mediante el uso de algoritmos de clasificación, los cuales se encargan de emparejar o agrupar un conjunto de datos. Si bien los resultados recabados no fueron favorecedores para la interpretación de patrones permitió detectar los posibles campos a mejorar para una futura implementación.
Palabras clave: catastro; consultas dinámicas; datos geoespaciales; etl, geocercas; georeferencia; minería de datos; weka.
Smart Geofences
Being at the forefront of technology is of vital importance, especially when talking about a government platform such as Cartografía - Catastro Colima. That is why the web application was updated so that it can generate dynamic queries through the drawing of geofences since it works with georeferential data, this is because we want to generate relevant information from the data. The methodology used to develop it was focused on the exploration of data (KDD).
The importance of the project not only lies in the update of the application but also in the implementation of data mining through the Weka platform by using classification algorithms which are responsible for matching or grouping a set of data. Although the results obtained were not favorable for the interpretation of detected patterns, it allowef to detect possible fields to improve for future implementation.
INTRODUCCIÓN
En el gobierno de México se genera una gran cantidad de datos los cuales de ser públicos se ponen al alcance de la población, a este tipo de datos se les conoce como Datos Abiertos, aunque para poder llamarse así deben de cumplir con ciertas reglas antes de ser puestos a disposición pública. Los Datos Abiertos se definen por ser gratuitos, no discriminatorios, de libre uso, legibles por máquinas, integrales, primarios, oportunos y permanentes. (Pizzuto, 2019)
Algunos Datos Abiertos son geoespaciales esto significa que pueden ser georreferenciados en un mapa. La georreferencia se maneja cuando se tiene un sistema de coordenadas terreno, como ubicación de un negocio, casa, cultivo, entre otros.
En la actualidad existen diversas instituciones gubernamentales que han tomado la iniciativa de presentar los datos no solo de forma estándar referente a tablas o texto plano si no que lo presentan de forma cartográfica, siempre y cuando los datos permitan este tipo de visualizaciones, un claro ejemplo de esto es la página creada por el INEGI con su plataforma de Mapa Digital de México.
Este tipo de herramientas se han hecho cada vez más solicitadas por la población ya que son una forma fácil, rápida y concisa de consultar información de manera confiable. Por esta razón se realiza el análisis de datos recuperados por el departamento de catastro del municipio de Colima del estado de Colima para llevar a producción la primera etapa de actualización y uso de minería de datos, con ayuda del software Weka y el prototipo realizado anteriormente por Osorio Amezcua el 2018 (Consultas dinámicas en el mapa digital de Catastro Colima) (Cano, Osorio, Lira, & Matínez, 2018), completando las capas restantes ya que solo se manejaron algunas de las capas de catastro como: Comercio, Catastro, Deportes, Generales, INAH, entre otras.
MATERIAL
Para el desarrollo del proyecto se utilizaron una variedad de herramientas, aplicaciones y librerías todas estas con la característica de ser de código abierto o mediante uso de licencias gratuitas. La herramienta utiliza para la extracción del proceso ETL fue MyGeodata Converter la cual permite convertir archivos SHP a XLSX, también se utilizó la herramienta Kutools de Excel para la transformación de datos.
En el caso del desarrollo de la aplicación web el frontend se realizó mediante el uso de HTML5, CSS, Bootstrap 4 y OpenStreetMap para la visualización de mapas. El backend se desarrolló en PHP 7.2 con el framework de CodeIgniter en su versión 3.1.10 el cual está hecho bajo una arquitectura MVC (Modelo Vista Controlador) que permite realizar proyectos de manera ordenada, segura y rápida, el SGBD utilizado fue MariaDB 10.2.
También se hicieron uso de librerías JavaScript como jQuery 3.3.1 con DataTables, proj4 para la conversión de coordenadas y OpenLayers para la creación de mapas interactivos.
Finalmente, para la presentación de resultados y aplicación de minería de datos se utilizó la plataforma de minería de datos Weka en su versión 3.8.3.
METODOLOGÍA
Debido al enfoque del proyecto se utilizó como base la metodología de descubrimiento de conocimiento en bases de datos (KDD), realizando así a partir de esta un proceso de trabajo para el desarrollo de la plataforma conforme a sus 8 fases principales: comprensión del estudio, selección de datos, limpieza y pre-procesamiento, transformación de los datos, selección de algoritmos de minería de datos, desarrollo, pruebas y uso del conocimiento descubierto (resultados) (Rokach & Maimon, 2010), (Errecalde, 2007), ver figura 1.
El primer paso fue realizar el análisis de datos de los archivos SHP otorgados por el departamento de Catastro del municipio de Colima, se detectaron de manera general errores de duplicación de datos, de ortografía y congruencia, datos numéricos negativos, vacíos y sin una estandarización de campos.
Una vez terminado este paso se realizó el proceso ETL (Extracción Transformación y Carga por sus siglas en inglés) este fue revisado y aprobado antes de pasar a la siguiente etapa de Filtros donde se separaron por campos y valores los datos para crear las consultas dinámicas.
Estos pueden ser clasificados de 4 formas: filtro de tabla, significa que los valores provienen de los datos encontrados directamente en la tabla a consultar y no de un catálogo u origen externo, el segundo es filtro de catálogo, como su nombre lo dice requiere de una conexión al catálogo especifico, el tercero es de conexión externa la cual puede requerir de relacionar campos con otras tablas, detalles o catálogos y por último el filtro numérico que se utiliza únicamente en las capas de INEGI y Accidentes (Vialidad), se activa al comprobar si el dato es mayor a 0.
Una vez detectado y clasificado los filtros se comprobó su relevancia si esta era significativa se agregaba a la lista, de no ser así era eliminada, esto sin modificar los datos de las tablas.
Después se procedió con el desarrollo de la aplicación web, primero se actualizó el diseño de la vista, se cambió la distribución y color de los elementos para contrastar con el sector gubernamental, la aplicación está basada en tener todo en una vista con cambio de secciones para presentar una forma rápida y fácil de realizar consultas al público.
El menú se posicionó al costado izquierdo de la pantalla con las opciones de capa, campo y valor, para la selección de filtros se generó la opción de área de influencia para generar las geocercas donde permite el dibujo de dichas áreas mediante el trazo de un polígono irregular o la selección un polígono regular como cuadrado o rectángulo también se agregó la opción de crear un círculo o en su defecto ninguno el cual trae todos los resultados encontrados sin distinción del lugar que se encuentre, ver figura 2.
Figura 2. Actualización de diseño, funcionalidades y procesos de consulta.
Una vez seleccionados los campos se agrega la consulta dinámica a la tabla búsqueda quedando a la espera el resultado total y los marcadores del mapa, que aparecerán una vez el usuario seleccione el botón de consultar. Los marcadores a su vez también pueden ser seleccionados para mostrar toda la información correspondiente al punto elegido como se puede ver en la figura 3.
Figura 3. Despliegue de información de un punto del mapa.
La aplicación permite realizar otras actividades extra al funcionamiento principal como editar o eliminar una consulta, limpiar los resultados del mapa, limpiar toda la página y el apartado ayuda para brindar asistencia de conceptos y funcionamiento de la aplicación al usuario.
Al terminar la vista principal se agregaron nuevas funcionalidades a las propuestas en el prototipo, de representación de resultados como tabla de datos y exportación de datos a CSV. La tabla funciona al igual que las consultas, de manera dinámica puesto que trata de agrupar los campos de las diferentes campas de resultados.
La opción de exportación de datos a CSV descarga los datos presentados en la tabla de datos. Para poder activar estas opciones es necesario primero crear y obtener al menos un resultado en la consulta creada de lo contrario la función no se activará debido a que no tendrá datos disponibles que mostrar.
Figura 4. Nuevas funcionalidades (Creación de tabla de datos por agrupación de valores y descarga de resultados).
Por último, en la parte del desarrollo web se sometió la aplicación a pruebas de modularidad, integridad y usabilidad que al ser aprobatorias se continuó con la siguiente etapa, de lo contrario se revisan y corrigen los puntos no aprobados.
Así, se inicia con la etapa de minería de datos donde se decide crear un cuadrante del municipio de Colima y una zona centro (ver figura 5) para la generación de geocercas, las consultas fueron hechas directamente a la plataforma creada anteriormente y se establecieron así 5 zonas de interés las cuales fueron divididas en 4 áreas de interés: social, económico, turístico y cultural.
Figura 5. Geocerca Zona Centro del municipio de Colima.
La tabla 1 muestra la clasificación dada a cada capa según su área de interés para generar las consultas y los archivos según corresponda. Cabe destacar que no todas las capas fueron usadas ya que algunas no entraban en alguna de estas categorías, pero si están implementadas en la aplicación web.
Tabla 1. Resultados de clasificación de datas aceptadas para la minería de datos según su área de interés.
Área de interés |
Capa general |
Capa |
Social
Social |
Deportes |
Activación física |
Infraestructura deportiva |
||
Generales |
Luminarias |
|
Postes |
||
Teléfonos públicos |
||
INEGI |
Características educativas |
|
Hogares censales |
||
Población con discapacidad |
||
Población total |
||
Religión |
||
Servicios de salud |
||
Situación conyugal |
||
Viviendas |
||
Patrimonio |
Áreas verdes |
|
Escuelas |
||
Parques y jardines |
||
Protección civil |
Refugios temporales |
|
Urbano |
Antenas de telecomunicación |
|
Vialidad |
Semáforos |
|
Topes |
||
Ecología |
Árboles |
|
Económico |
Comercio |
Giros comerciales |
Giros comerciales licencias |
||
Mercados |
||
Locatarios mercados |
||
Tianguis |
||
Tianguistas |
||
Características económicas |
||
INEGI |
Características económicas |
|
Turístico |
- |
- |
Cultural |
Patrimonio |
Esculturas |
Registro civil |
Panteón municipal |
Al delimitar y crear las diferentes geocercas se descargó la información para iniciar el pre-procesamiento en Weka, La figura 6 muestra un ejemplo de los datos obtenidos para la zona centro en el área de interés económico.
Figura 6. Datos Zona Centro área de interés económico.
El pre-procesamiento para minería de datos, consiste en convertir el archivo CSV obtenido a formato ARFF para determina el atributo de los campos ya que Weka requiere la definición de cada uno. Los tipos de datos que se pueden definir son: reales, enteros, fecha delimitada, y detección de cadenas con opciones predefinidas, la opción más viable para este último tipo es declarar como string el campo y usar la opción de StringToNominal incorporada en Weka para detectar los valores. A continuación, se presenta un ejemplo del formato tipo ARFF y sus pasos para crearlo, ver figura 7.
Para aplicar el filtro es necesario ejecutar Weka e ingresar al apartado Explorer -> Preprocess -> Open file para cargar el archivo y después seleccionar Choose -> Weka -> filters -> unsupervised -> atribute --> StringToNominal, una vez seleccionado el atributo se debe definir que fila será la procesada para dar clic al botón Apply el cual traerá los resultados obtenidos, ver figura 8.
Después de aplicar filtros se guardan los cambios realizados de otra forma estos no serán almacenados y se perderán al salir la aplicación.
Una vez guardado el archivo se pasa a la sección Classify la cual permite usar algoritmos de clasificación en los datos de los archivos generados, aunque anteriormente se ha mencionado la importancia de analizar los datos antes de aplicar minería de datos, Weka también cuenta con detección de atributos donde de no ser posible bloquea los algoritmos no compatibles con los datos.
Antes de realizar un procesamiento extenso de los archivos ARFF se utilizó el formato de prueba de índice de error obtenido de Taller con Weka para detectar si es o no favorable el aplicar algoritmos de clasificación. (Gutiérrez, Albarrán, & Rico, 2017)
Los rangos de simplicidad de la tabla 2 defienden el Rango del margen de éxito si este obtiene un rango entre 90%-100% es bueno y significa que es bastante para la implementación final, de obtener un porcentaje menor a 70% indica que los resultados no son fiables y no cumplen con la relación o formato suficiente para descubrir información.
Tabla 2. Rangos de simplicidad propuestos para calificación de aceptación de algoritmo tomando en cuenta el índice de clasificación correcto.
Simplicidad |
Rango |
Bueno |
90% - 100% |
Regular |
70% - 89% |
Malo |
0% - 69% |
Los algoritmos establecidos en el formato de prácticas predefinen casi todos los algoritmos de la tabla 3 a excepción de uno NaiveBayesMultinominalText que fue agregado debido a que en algunos casos la mayoría de datos eran descriptivos.
Tabla 3. Formato de registro para resultados de Weka al aplicar algoritmos.
Clasificador |
Instancias clasificadas correctamente |
% índice correcto de clasificación |
NaiveBayes |
|
|
NaiveBayesMultinominalText |
|
|
OneR |
|
|
PART |
|
|
J48 |
|
|
RandomTree |
|
|
La tabla 4 recaba los datos obtenidos de índice de error, el tiempo que tarda Weka en procesar la información con cada algoritmo, el tipo de algoritmo y si califica usando la Tabla 2.
Tabla 4. Formato de registro de índice de error y calificación de simplicidad.
Clasificador |
Tasa de error |
Rapidez |
Interpretabilidad |
Simplicidad |
NaiveBayes |
|
|
Bayes |
|
NaiveBayesMultinominalText |
|
|
Bayes |
|
OneR |
|
|
Reglas |
|
PART |
|
|
Reglas |
|
J48 |
|
|
Árbol |
|
RandomTree |
|
|
Árbol |
|
Tomando los formatos expuestos anteriormente se puede continuar con la aplicación de algoritmos en la plataforma de Weka, para eso es necesario ir al apartado Explorer –> open file para subir el archivo a procesar, ver figura 9.
Figura 9. Pantalla inicial al subir un archivo a procesar con Weka.
Después se debe seleccionar la pestaña classify –> Choose, para elegir el algoritmo deseado la figura 10 muestra un ejemplo usando el algoritmo NaiveBayes.
Figura 10. Resultados al aplicar el algoritmo NaiveBayes.
Así estos pasos se repiten en cada zona con cada área de interés y algoritmo. Finalmente, al ser completados se pasa a la presentación de resultados que se verá en la siguiente sección.
RESULTADOS
Como se expresó al inicio del artículo se realizó la aplicación web para producción esto significa que al terminar seria subida a un servidor y entregada al departamento a catastro municipal de Colima, este último aun no sido realizado.
La plataforma fue terminada en su totalidad por lo que las capas agregadas suman un total de 53, cada una con sus respectivos campos y filtros.
A continuación, se muestran las capturas de pantalla obtenidas de la vista del proyecto en su versión final. La figura 11 muestra la implementación de opciones de las capas, campos, valores y área de influencia para consulta, pero también funciones como limpiar mapa o limpiar todo de forma extra que ayuden al usuario cuando realiza una gran cantidad de consultas.
Figura 11. Vista de consultas en mapa.
Los resultados son presentados de cinco formas diferentes: contador en la tabla búsqueda, marcadores en el mapa, individual en ventana emergente, grupal en tabla de datos y archivo en CSV, ver figura 12.
Figura 11. Representación de resultados usando la tabla de datos
Por último, se tienen los resultados del archivo dependiente a los resultados de las consultas del usuario, cabe mencionar que el archivo solo se descarga si es indicado seleccionando el botón Exportar datos a CVS, ver figura 13.
Figura 12. Resultados obtenidos al exportar los datos a formato CSV.
Los resultados obtenidos con uso de Weka serán expuestos usando el formato definido anteriormente en la sección de minería de datos encontrada en proceso. Se usaron cuatro áreas de influencia: Social, Económica, Turística y Cultural para evaluar, ya que son un punto de importancia para el sector gubernamental.
Social
Después de realizar el pre procesamiento de los datos para Weka, no fue posible aplicar algún algoritmo, debido a que automáticamente se detectó la falta de relación.
Económico
El sector económico presentó mayor relación que cualquier otro sector, aun así, no fue posible obtener resultados positivos. A continuación, se muestran los resultados de las zonas procesadas: Zona Centro, Zona 1, Zona 2 y Zona 4; la Zona 3 fue omitida por falta de resultados a causa de no tener los datos adecuados para aplicar un algoritmo.
Zona Centro (ZC)
Los resultados de la zona centro son menores a lo esperado, el porcentaje de clasificación de forma correcta es 53.4057 % con 1623 instancias clasificadas y el menor de 14.1823 con 431 instancias clasificadas, ver tabla 5.
Tabla 5. Resultados de instancias clasificadas en economía Zona Centro
Clasificador |
Instancias clasificadas correctamente |
% índice correcto de clasificación |
NaiveBayes |
431 |
14.1823 |
NaiveBayesMultinominalText |
1623 |
53.4057 |
OneR |
1559 |
51.9667 |
PART |
1460 |
48.6667 |
J48 |
1580 |
52.6667 |
RandomTree |
929 |
30.9667 |
Tomando en cuenta lo anterior y los resultados de la tabla 6 no se recomida proseguir con la implementación de minería de datos, de ser necesario se deberá hacer uso del clasificador NaiveBayesMultinominalText perteneciente a Bayes, puesto que tiene la tasa de error más baja.
Tabla 6. Resultados de rapidez y simplicidad en economía zona centro
Clasificador |
Tasa de error |
Rapidez |
Interpretabilidad |
Simplicidad |
NaiveBayes |
85.8177 |
0 s |
Bayes |
Malo |
NaiveBayesMultinominalText |
46.5943 |
0 s |
Bayes |
Malo |
OneR |
48.0333 |
0.01 s |
Reglas |
Malo |
PART |
51.3333 |
0.07 s |
Reglas |
Malo |
J48 |
47.333 |
0.03 s |
Árbol |
Malo |
RandomTree |
69.0333 |
0.01 s |
Árbol |
Malo |
Zona 1 (Z1)
La zona 1 generó resultados parecidos de la zona centro, la mejor clasificación de estancias ocurrió con la aplicación del algoritmo de clasificación J48 quedando PART a solo 2.1337%, ver tabla 7.
Tabla 7. Resultados de instancias clasificadas en economía Zona 1
Clasificador |
Instancias clasificadas correctamente |
% índice correcto de clasificación |
NaiveBayes |
1261 |
42.0333 |
NaiveBayesMultinominalText |
1099 |
36.6333 |
OneR |
1076 |
35.8667 |
PART |
1345 |
44.8333 |
J48 |
1409 |
46.9667 |
RandomTree |
929 |
30.9667 |
Todos los algoritmos aplicados a economía Zona 1 dieron una tasa de error alto por lo que su simplicidad y eficiencia es mala, esto indica que su implementación no es favorable para obtención de información relevante, ver tabla 8.
Tabla 8. Resultados de rapidez y simplicidad en economía Zona 1
Clasificador |
Tasa de error |
Rapidez |
Interpretabilidad |
Simplicidad |
NaiveBayes |
63.3667 |
0 s |
Bayes |
Malo |
NaiveBayesMultinominalText |
64.2509 |
0 s |
Bayes |
Malo |
OneR |
64.1333 |
0.01 s |
Reglas |
Malo |
PART |
55.1667 |
0.6 s |
Reglas |
Malo |
J48 |
53.0333 |
0.06 s |
Árbol |
Malo |
RandomTree |
72.9 |
3.32 |
Árbol |
Malo |
Zona 2 (Z2)
La Zona 2 obtuvo entre 37 y 49 instancias correctamente clasificadas con un índice de simplicidad entre 51.32% y 68.05%, si se comparar con tablas de otras zonas fue la que mejor resultados obtuvo en general, ver tabla 9.
Tabla 9. Resultados de instancias clasificadas en economía Zona 2.
Clasificador |
Instancias clasificadas correctamente |
% índice correcto de clasificación |
NaiveBayes |
49 |
68.0556 |
NaiveBayesMultinominalText |
37 |
51.3889 |
OneR |
39 |
54.1667 |
PART |
48 |
66.6667 |
J48 |
48 |
66.6667 |
RandomTree |
45 |
62.5 |
Si tomamos en cuenta los datos anteriores y en relación a la Tabla 10 podemos observar que, aunque los índices de clasificación no son favorecedores solo se encuentra a 1.94% de obtener una simplicidad media y ser considerados para pasar a la etapa de interpretación.
Tabla 10. Resultados de rapidez y simplicidad en economía Zona 2
Clasificador |
Tasa de error |
Rapidez |
Interpretabilidad |
Simplicidad |
NaiveBayes |
31.9444 |
0 s |
Bayes |
Malo |
NaiveBayesMultinominalText |
48.6111 |
0 s |
Bayes |
Malo |
OneR |
45.8333 |
0 s |
Reglas |
Malo |
PART |
33.3333 |
0.01 s |
Reglas |
Malo |
J48 |
33.3333 |
0 s |
Árbol |
Malo |
RandomTree |
37.5 |
0 s |
Árbol |
Malo |
Zona 4 (Z4)
La Tabla 11 muestra rangos positivos de clasificación sin ser suficientes para interpretación ya que debido a los datos obtenidos de la zona solo se maneja la tabla giros comerciales que por sí sola no genera información relevante.
Tabla 11. Resultados de instancias clasificadas en economía Zona 4.
Clasificador |
Instancias clasificadas correctamente |
% índice correcto de clasificación |
NaiveBayes |
47 |
92.1569 |
NaiveBayesMultinominalText |
46 |
90.1961 |
OneR |
46 |
90.1961 |
PART |
48 |
94.1176 |
J48 |
46 |
90.1961 |
RandomTree |
46 |
90.1961 |
La tasa de error para esta zona es muy baja, con 9.8039% como la mayor; esto ocurre cuando todos los campos tienen registros y correlación entre sí, ver tabla 12.
Tabla 12. Resultados de rapidez y simplicidad en economía Zona 4.
Clasificador |
Tasa de error |
Rapidez |
Interpretabilidad |
Simplicidad |
NaiveBayes |
7.8431 |
0 s |
Bayes |
Bueno |
NaiveBayesMultinominalText |
9.8039 |
0 s |
Bayes |
Bueno |
OneR |
9.8039 |
0 s |
Reglas |
Bueno |
PART |
5.8824 |
0.02 s |
Reglas |
Bueno |
J48 |
9.8039 |
0 s |
Árbol |
Bueno |
RandomTree |
9.8039 |
0 s |
Árbol |
Bueno |
Turístico
Los datos obtenidos para este rubro son insuficientes, por tal motivo la información no fue usada, los detalles de los campos se pueden ver en la sección de análisis de tablas de Catastro en la sección de tablas no utilizadas.
Cultural
EL sector cultural suele estar relacionado a bienes culturales, mercados de la cultura, industrias y empresas culturales los cuales no pueden ser obtenidos de la actual base de datos; para esto se usaron las capas enfocadas a la cultura del lugar sin incluir el aspecto económico, las tablas utilizadas fueron esculturas y panteón municipal.
Zona Centro (ZC)
Los resultados conseguidos durante la implementación de algoritmos de minería de datos en la zona centro fue muy variada ya que los rangos de clasificación rondan desde 12.82% al 61.53% de éxito en instancias clasificadas correctamente, estos índices no son suficientemente buenos para proseguir, pero ayudan a determinar cuál algoritmo será mejor opción de tener más datos o tablas, ver tabla 13.
Tabla 13. Resultados de instancias clasificadas en cultura Zona Centro.
Clasificador |
Instancias clasificadas correctamente |
% índice correcto de clasificación |
NaiveBayes |
11 |
28.2051 |
NaiveBayesMultinominalText |
23 |
58.9744 |
OneR |
5 |
12.8205 |
PART |
18 |
46.1538 |
J48 |
24 |
61.5385 |
RandomTree |
21 |
53.8462 |
Los resultados de simplicidad de la tabla 14 indican que cualquier uso de los algoritmos expuestos obtendrán altos índices de error, por lo que son clasificados como malo, refiriendo a su poca recomendación de uso.
Tabla 14 Resultados rapidez y simplicidad en cultura Zona Centro.
Clasificador |
Tasa de error |
Rapidez |
Interpretabilidad |
Simplicidad |
NaiveBayes |
71.7949 |
0 s |
Bayes |
Malo |
NaiveBayesMultinominalText |
41.0256 |
0 s |
Bayes |
Malo |
OneR |
87.1795 |
0 s |
Reglas |
Malo |
PART |
53.8462 |
1.02 s |
Reglas |
Malo |
J48 |
46.1538 |
0 s |
Árbol |
Malo |
RandomTree |
38.4615 |
0 s |
Árbol |
Malo |
Zona 1 (Z1)
Los últimos datos procesados pertenecen a la zona 1, si se comparan con los obtenidos en la zona centro son bastante diferentes aun cuando se hace uso de la misma, lo cual indica que existían pocos datos a clasificar, ver tabla 15.
Tabla 15. Resultados de instancias clasificadas en cultura Zona 1.
Clasificador |
Instancias clasificadas correctamente |
% índice correcto de clasificación |
NaiveBayes |
33 |
42.8571 |
NaiveBayesMultinominalText |
35 |
45.4545 |
OneR |
1 |
1.2987 |
PART |
34 |
44.1558 |
J48 |
34 |
44.1558 |
RandomTree |
21 |
53.8462 |
Al igual que los demás resultados obtenidos, la tabla 16 presenta una tasa de error elevada incluso se obtiene la tasa de error más alta registrada con 98.70% de error, es de esperarse que tampoco pueda ser posible la clasificación.
Tabla 16. Resultados de rapidez y simplicidad en cultura Zona 1.
Clasificador |
Tasa de error |
Rapidez |
Interpretabilidad |
Simplicidad |
NaiveBayes |
57.1429 |
0 s |
Bayes |
Malo |
NaiveBayesMultinominalText |
54.5455 |
0 s |
Bayes |
Malo |
OneR |
98.7013 |
0.01 s |
Reglas |
Malo |
PART |
55.8442 |
0.04 s |
Reglas |
Malo |
J48 |
55.8442 |
0 s |
Árbol |
Malo |
RandomTree |
59.7403 |
0.02 s |
Árbol |
Malo |
CONCLUSIONES
El desarrollo de una plataforma web para la generación de consultas dinámica por medio de trazo de geocercas significó una solución a las necesidades del departamento de catastro del municipio de Colima, se establecieron estándares de manejo de datos como de desarrollo para agregar filtros para que en dado el caso de realizar una actualización se pueda hacer de manera fácil y rápida.
Al inicio del proyecto se planteó la implementación e interpretación de resultados a partir de la aplicación de minería de datos, si bien los resultados de este último no fueron los esperados sirve como base de aprendizaje para futuros planteamientos que desee realizar Catastro del municipio de Colima.
De querer en un futuro el departamento de catastro implementar algoritmos de minería de datos se tendrá que replantear su forma de recolección, actualización y relación de datos, ya que la forma actual no es suficiente para generar algún tipo de resultado.
Cano, R., Osorio, J., Lira, A., & Matínez, M. (diciembre de 2018). Búsquedas dinámicas en fuentes de datos abiertos, caso: catastro digital Colima. Recuperado el 23 de febrero de 2019, de http://citt.itsm.edu.mx/ingeniantes/pdfversion/ingeniantes5no2vol1.pdf
Bautista, O., Elizabeth, J., Rosero Reinoso, M. A., & Cueva, L. Implementación de un prototipo de geoposicionamiento con tecnología Sigfox, aplicado a paradas inteligentes y rastreo de niños.
Betancourt Rodríguez, L. E. (2018). Sistema de geolocalización móvil para la optimización del transporte público brindado por la Cooperativa Flecha Verde-Ruta 55 en la ciudad de Guayaquil (Doctoral dissertation, Universidad de Guayaquil. Facultad de Ingeniería Industrial. Carrera de Ingeniería en Teleinformática.).
Errecalde, M. L. (Diciembre de 2007). Preparación de los datos en el proceso KDD. (https://www.researchgate.net/) Recuperado el 5 de Abril de 2019, de https://www.researchgate.net/publication/266445601_Preparacion_de_los_datos_en_el_proceso_KDD
Farr, J. V., Merino, D. N., & Gandhi, S. J. (2016). The Engineering Management Handbook (2nd Edition ed.). American Society for Engineering Management.
Fonseca Duarte, R. F., Lizarazo Cifuentes, C. A., & Pérez Hernández, L. G. (2015). Sistema inteligente de monitoreo y rastreo para equipos de alta gama.“Caso de estudio empresa Colvatel SA ESP”.
Gutiérrez, D., Albarrán, Y. A., & Rico, R. (2017). Manual para prácticas del laboratorio de cómputo. Universidad autónoma del estado de México.
Halpin, A. L., & Kurthakot, R. (2015). Can Systemic Thinking Be Measured? Introducing the Systemic Thinking Scale (STS). Developments in Business Simulation and Experiential Learning, vol. 42, 153.
Hernandez, R., Fernandez, C., & Baptista, P. (2010). Metodologia de la Investigación. Mexico, DF: McGrawHill.
Keating, C., Calida, B., Souza-Poza, A., & Kovacic, S. (2016). Systems Thinking. Engineering Management Handbook, American Society for Engineering, 245-297.
Krathwohl, D. R. (2002). A Revision of Bloom’s Taxonomy: An Overview. Theory into Practice, 212-218.
OSORIO, M. A. F., LÓPEZ, M. P. M., & GIRALDO, J. F. S. 07. Transporte inteligente. Coloquio de Investigación Formativa, 36.
Pizzuto, R. (20 de febrero de 2019). ¿Qué son los Datos Abiertos? Obtenido de https://datos.gob.mx/blog/que-son-los-datos-abiertos
Quispe Perez, J. A. (2022). Eficacia de un sistema de monitoreo y control de vehículos con el uso de aplicativos móviles y geocercas para reducir los indicadores de accidentabilidad durante el transporte de GLP en la ruta Cusco-Quillabamba por el operador logístico Mogrovejo.
Rokach, L., & Maimon, O. (2010). Data Mining and Knowledge Discovery Handbook. Israel: Springer US.
Zárate, K. L. A. GENERACIÓN Z: Nuevos Paradigmas para la Interacción en el Desarrollo de Aplicaciones.