DOI: https://doi.org/10.37811/cl_rcm.v6i6.3830

Geocercas Inteligentes

 

Rosa de Guadalupe Cano Anguiano

 [email protected]

https://orcid.org/0000-0001-7787-9058   

M.C., Depto. De Sistemas y Computación,

Tecnológico Nacional de México/I.T. Colima

 

Carolina Palma Preciado

[email protected]

https://orcid.org/0000-0003-3253-4464

Estudiante de Ingeniería en Sistemas Computacionales,

Depto. De Sistemas y Computación,

Tecnológico Nacional de México/I.T. Colima

 

Ariel Lira Obando

[email protected]

https://orcid.org/0000-0002-6703-3697  

M.C., Depto. De Sistemas y Computación,

 Tecnológico Nacional de México/I.T. Colima

 

María Elena Martínez Durán

[email protected]

https://orcid.org/0000-0003-1615-5130  

M.C., Depto. De Sistemas y Computación,

Tecnológico Nacional de México/I.T. Colima

 

Lindalva Ponce Ibarra

[email protected]

https://orcid.org/0000-0002-7495-5200  

M.C., Depto. De Sistemas y Computación,

 Tecnológico Nacional de México/I.T. Colima

 

 

 

 

 

 

Correspondencia: [email protected]

Artículo recibido 11 octubre 2022 Aceptado para publicación: 11 noviembre 2022

Conflictos de Interés: Ninguna que declarar

Todo el contenido de Ciencia Latina Revista Científica Multidisciplinar, publicados en este sitio están disponibles bajo Licencia Creative Commons https://revistacientifica.uamericana.edu.py/public/site/images/aduarte/cc2.png.

Cómo citar: Cano Anguiano, R. de G., Palma Preciado, C., Lira Obando, A., Martínez Durán , M. E., & Ponce Ibarra, L. (2022). Geocercas Inteligentes. Ciencia Latina Revista Científica Multidisciplinar, 6(6), 5588-5607. https://doi.org/10.37811/cl_rcm.v6i6.3830


 

RESUMEN

El estar a la vanguardia en la tecnología es de vital importancia sobre todo si se habla de una plataforma gubernamental como lo es el caso de Cartografía - Catastro Colima. Es por ello que se actualizó la aplicación web para que permita generar consultas dinámicas mediante dibujo de geocercas, ya que se trabaja con datos de carácter georeferencial, esto debido a que se quiere generar información relevante a partir de los datos. La metodología usada para desarrollarlo fue una enfocada a la exploración de datos (KDD).

La importancia del proyecto no solo radica en la actualización de la aplicación sino la implementación de minería de datos por medio de la plataforma Weka mediante el uso de algoritmos de clasificación, los cuales se encargan de emparejar o agrupar un conjunto de datos. Si bien los resultados recabados no fueron favorecedores para la interpretación de patrones permitió detectar los posibles campos a mejorar para una futura implementación.

 

Palabras clave: catastro; consultas dinámicas; datos geoespaciales; etl, geocercas; georeferencia; minería de datos; weka.


Smart Geofences

 

ABSTRACT

Being at the forefront of technology is of vital importance, especially when talking about a government platform such as Cartografía - Catastro Colima. That is why the web application was updated so that it can generate dynamic queries through the drawing of geofences since it works with georeferential data, this is because we want to generate relevant information from the data. The methodology used to develop it was focused on the exploration of data (KDD).

The importance of the project not only lies in the update of the application but also in the implementation of data mining through the Weka platform by using classification algorithms which are responsible for matching or grouping a set of data. Although the results obtained were not favorable for the interpretation of detected patterns, it allowef to detect possible fields to improve for future implementation.

 

Keywords: cadastre; data mining; dynamic consultations; etl; geofences; georeferenced; geospatial data; weka.


 

INTRODUCCIÓN

En el gobierno de México se genera una gran cantidad de datos los cuales de ser públicos se ponen al alcance de la población, a este tipo de datos se les conoce como Datos Abiertos, aunque para poder llamarse así deben de cumplir con ciertas reglas antes de ser puestos a disposición pública. Los Datos Abiertos se definen por ser gratuitos, no discriminatorios, de libre uso, legibles por máquinas, integrales, primarios, oportunos y permanentes. (Pizzuto, 2019)

Algunos Datos Abiertos son geoespaciales esto significa que pueden ser georreferenciados en un mapa. La georreferencia se maneja cuando se tiene un sistema de coordenadas terreno, como ubicación de un negocio, casa, cultivo, entre otros.

En la actualidad existen diversas instituciones gubernamentales que han tomado la iniciativa de presentar los datos no solo de forma estándar referente a tablas o texto plano si no que lo presentan de forma cartográfica, siempre y cuando los datos permitan este tipo de visualizaciones, un claro ejemplo de esto es la página creada por el INEGI con su plataforma de Mapa Digital de México.

Este tipo de herramientas se han hecho cada vez más solicitadas por la población ya que son una forma fácil, rápida y concisa de consultar información de manera confiable. Por esta razón se realiza el análisis de datos recuperados por el departamento de catastro del municipio de Colima del estado de Colima para llevar a producción la primera etapa de actualización y uso de minería de datos, con ayuda del software Weka y el prototipo realizado anteriormente por Osorio Amezcua el 2018 (Consultas dinámicas en el mapa digital de Catastro Colima) (Cano, Osorio, Lira, & Matínez, 2018), completando las capas restantes ya que solo se manejaron algunas de las capas de catastro como: Comercio, Catastro, Deportes, Generales, INAH, entre otras.

MATERIAL

Para el desarrollo del proyecto se utilizaron una variedad de herramientas, aplicaciones y librerías todas estas con la característica de ser de código abierto o mediante uso de licencias gratuitas. La herramienta utiliza para la extracción del proceso ETL fue MyGeodata Converter la cual permite convertir archivos SHP a XLSX, también se utilizó la herramienta Kutools de Excel para la transformación de datos.

En el caso del desarrollo de la aplicación web el frontend se realizó mediante el uso de HTML5, CSS, Bootstrap 4 y OpenStreetMap para la visualización de mapas. El backend se desarrolló en PHP 7.2 con el framework de CodeIgniter en su versión 3.1.10 el cual está hecho bajo una arquitectura MVC (Modelo Vista Controlador) que permite realizar proyectos de manera ordenada, segura y rápida, el SGBD utilizado fue MariaDB 10.2.

También se hicieron uso de librerías JavaScript como jQuery 3.3.1 con DataTables, proj4 para la conversión de coordenadas y OpenLayers para la creación de mapas interactivos.

Finalmente, para la presentación de resultados y aplicación de minería de datos se utilizó la plataforma de minería de datos Weka en su versión 3.8.3.

 METODOLOGÍA

Debido al enfoque del proyecto se utilizó como base la metodología de descubrimiento de conocimiento en bases de datos (KDD), realizando así a partir de esta un proceso de trabajo para el desarrollo de la plataforma conforme a sus 8 fases principales: comprensión del estudio, selección de datos, limpieza y pre-procesamiento, transformación de los datos, selección de algoritmos de minería de datos, desarrollo, pruebas y uso del conocimiento descubierto (resultados) (Rokach & Maimon, 2010), (Errecalde, 2007), ver figura 1.

Figura 1.
Diagrama de flujo utilizado para el desarrollo del proyecto siguiendo las etapas KDD.
El primer paso fue realizar el análisis de datos de los archivos SHP otorgados por el departamento de Catastro del municipio de Colima, se detectaron de manera general errores de duplicación de datos, de ortografía y congruencia, datos numéricos negativos, vacíos y sin una estandarización de campos.

Una vez terminado este paso se realizó el proceso ETL (Extracción Transformación y Carga por sus siglas en inglés) este fue revisado y aprobado antes de pasar a la siguiente etapa de Filtros donde se separaron por campos y valores los datos para crear las consultas dinámicas.

Estos pueden ser clasificados de 4 formas: filtro de tabla, significa que los valores provienen de los datos encontrados directamente en la tabla a consultar y no de un catálogo u origen externo, el segundo es filtro de catálogo, como su nombre lo dice requiere de una conexión al catálogo especifico, el tercero es de conexión externa la cual puede requerir de relacionar campos con otras tablas, detalles o catálogos y por último el filtro numérico que se utiliza únicamente en las capas de INEGI y Accidentes (Vialidad), se activa al comprobar si el dato es mayor a 0.

Una vez detectado y clasificado los filtros se comprobó su relevancia si esta era significativa se agregaba a la lista, de no ser así era eliminada, esto sin modificar los datos de las tablas.

Después se procedió con el desarrollo de la aplicación web, primero se actualizó el diseño de la vista, se cambió la distribución y color de los elementos para contrastar con el sector gubernamental, la aplicación está basada en tener todo en una vista con cambio de secciones para presentar una forma rápida y fácil de realizar consultas al público.

El menú se posicionó al costado izquierdo de la pantalla con las opciones de capa, campo y valor, para la selección de filtros se generó la opción de área de influencia para generar las geocercas donde permite el dibujo de dichas áreas mediante el trazo de un polígono irregular o la selección un polígono regular como cuadrado o rectángulo también se agregó la opción de crear un círculo o en su defecto ninguno el cual trae todos los resultados encontrados sin distinción del lugar que se encuentre, ver figura 2.

Figura 2. Actualización de diseño, funcionalidades y procesos de consulta.

 

Una vez seleccionados los campos se agrega la consulta dinámica a la tabla búsqueda quedando a la espera el resultado total y los marcadores del mapa, que aparecerán una vez el usuario seleccione el botón de consultar. Los marcadores a su vez también pueden ser seleccionados para mostrar toda la información correspondiente al punto elegido como se puede ver en la figura 3.

Figura 3. Despliegue de información de un punto del mapa.

 

La aplicación permite realizar otras actividades extra al funcionamiento principal como editar o eliminar una consulta, limpiar los resultados del mapa, limpiar toda la página y el apartado ayuda para brindar asistencia de conceptos y funcionamiento de la aplicación al usuario.

Al terminar la vista principal se agregaron nuevas funcionalidades a las propuestas en el prototipo, de representación de resultados como tabla de datos y exportación de datos a CSV. La tabla funciona al igual que las consultas, de manera dinámica puesto que trata de agrupar los campos de las diferentes campas de resultados.

La opción de exportación de datos a CSV descarga los datos presentados en la tabla de datos. Para poder activar estas opciones es necesario primero crear y obtener al menos un resultado en la consulta creada de lo contrario la función no se activará debido a que no tendrá datos disponibles que mostrar.

Figura 4. Nuevas funcionalidades (Creación de tabla de datos por agrupación de valores y descarga de resultados).

 

 

 

 

 

 

Por último, en la parte del desarrollo web se sometió la aplicación a pruebas de modularidad, integridad y usabilidad que al ser aprobatorias se continuó con la siguiente etapa, de lo contrario se revisan y corrigen los puntos no aprobados.

Así, se inicia con la etapa de minería de datos donde se decide crear un cuadrante del municipio de Colima y una zona centro (ver figura 5) para la generación de geocercas, las consultas fueron hechas directamente a la plataforma creada anteriormente y se establecieron así 5 zonas de interés las cuales fueron divididas en 4 áreas de interés: social, económico, turístico y cultural.

Figura 5. Geocerca Zona Centro del municipio de Colima.

 

 

 

 

 

 

 

 

 

 


La tabla 1 muestra la clasificación dada a cada capa según su área de interés para generar las consultas y los archivos según corresponda. Cabe destacar que no todas las capas fueron usadas ya que algunas no entraban en alguna de estas categorías, pero si están implementadas en la aplicación web.

Tabla 1. Resultados de clasificación de datas aceptadas para la minería de datos según su área de interés.

Área de interés

Capa general

Capa

Social

 

 

 

 

 

 

 

 

 

 

 

Social

Deportes

Activación física

Infraestructura deportiva

Generales

Luminarias

Postes

Teléfonos públicos

INEGI

Características educativas

Hogares censales

Población con discapacidad

Población total

Religión

Servicios de salud

Situación conyugal

Viviendas

Patrimonio

Áreas verdes

Escuelas

Parques y jardines

Protección civil

Refugios temporales

Urbano

Antenas de telecomunicación

Vialidad

Semáforos

Topes

Ecología

Árboles

Económico

Comercio

Giros comerciales

Giros comerciales licencias

Mercados

Locatarios mercados

Tianguis

Tianguistas

Características económicas

INEGI

Características económicas

Turístico

-

-

Cultural

Patrimonio

Esculturas

Registro civil

Panteón municipal

 

Al delimitar y crear las diferentes geocercas se descargó la información para iniciar el pre-procesamiento en Weka, La figura 6 muestra un ejemplo de los datos obtenidos para la zona centro en el área de interés económico.

Figura 6. Datos Zona Centro área de interés económico.

El pre-procesamiento para minería de datos, consiste en convertir el archivo CSV obtenido a formato ARFF para determina el atributo de los campos ya que Weka requiere la definición de cada uno. Los tipos de datos que se pueden definir son: reales, enteros, fecha delimitada, y detección de cadenas con opciones predefinidas, la opción más viable para este último tipo es declarar como string el campo y usar la opción de StringToNominal incorporada en Weka para detectar los valores. A continuación, se presenta un ejemplo del formato tipo ARFF y sus pasos para crearlo, ver figura 7.

 


Figura 7. Creación de archivos ARFF y declaración de atributos.

 

Para aplicar el filtro es necesario ejecutar Weka e ingresar al apartado Explorer -> Preprocess -> Open file para cargar el archivo y después seleccionar Choose -> Weka -> filters -> unsupervised -> atribute --> StringToNominal, una vez seleccionado el atributo se debe definir que fila será la procesada para dar clic al botón Apply el cual traerá los resultados obtenidos, ver figura 8.

 

 


Figura 8. Aplicación de filtros en Weka.

 

Después de aplicar filtros se guardan los cambios realizados de otra forma estos no serán almacenados y se perderán al salir la aplicación.

Una vez guardado el archivo se pasa a la sección Classify la cual permite usar algoritmos de clasificación en los datos de los archivos generados, aunque anteriormente se ha mencionado la importancia de analizar los datos antes de aplicar minería de datos, Weka también cuenta con detección de atributos donde de no ser posible bloquea los algoritmos no compatibles con los datos.

Antes de realizar un procesamiento extenso de los archivos ARFF se utilizó el formato de prueba de índice de error obtenido de Taller con Weka para detectar si es o no favorable el aplicar algoritmos de clasificación. (Gutiérrez, Albarrán, & Rico, 2017)

Los rangos de simplicidad de la tabla 2 defienden el Rango del margen de éxito si este obtiene un rango entre 90%-100% es bueno y significa que es bastante para la implementación final, de obtener un porcentaje menor a 70% indica que los resultados no son fiables y no cumplen con la relación o formato suficiente para descubrir información.

Tabla 2. Rangos de simplicidad propuestos para calificación de aceptación de algoritmo tomando en cuenta el índice de clasificación correcto.

Simplicidad

Rango

Bueno

90% - 100%

Regular

70% - 89%

Malo

0% - 69%

Los algoritmos establecidos en el formato de prácticas predefinen casi todos los algoritmos de la tabla 3 a excepción de uno NaiveBayesMultinominalText que fue agregado debido a que en algunos casos la mayoría de datos eran descriptivos.

Tabla 3. Formato de registro para resultados de Weka al aplicar algoritmos.

Clasificador

Instancias clasificadas correctamente

% índice correcto de clasificación

NaiveBayes

 

 

NaiveBayesMultinominalText

 

 

OneR

 

 

PART

 

 

J48

 

 

RandomTree

 

 

 

La tabla 4 recaba los datos obtenidos de índice de error, el tiempo que tarda Weka en procesar la información con cada algoritmo, el tipo de algoritmo y si califica usando la Tabla 2.

Tabla 4. Formato de registro de índice de error y calificación de simplicidad.

Clasificador

Tasa de error

Rapidez

Interpretabilidad

Simplicidad

NaiveBayes

 

 

Bayes

 

NaiveBayesMultinominalText

 

 

Bayes

 

OneR

 

 

Reglas

 

PART

 

 

Reglas

 

J48

 

 

Árbol

 

RandomTree

 

 

Árbol

 

 

Tomando los formatos expuestos anteriormente se puede continuar con la aplicación de algoritmos en la plataforma de Weka, para eso es necesario ir al apartado Explorer –> open file para subir el archivo a procesar, ver figura 9.

Figura 9. Pantalla inicial al subir un archivo a procesar con Weka.

 

Después se debe seleccionar la pestaña classify –> Choose, para elegir el algoritmo deseado la figura 10 muestra un ejemplo usando el algoritmo NaiveBayes.

Figura 10. Resultados al aplicar el algoritmo NaiveBayes.

Así estos pasos se repiten en cada zona con cada área de interés y algoritmo. Finalmente, al ser completados se pasa a la presentación de resultados que se verá en la siguiente sección.

RESULTADOS

Como se expresó al inicio del artículo se realizó la aplicación web para producción esto significa que al terminar seria subida a un servidor y entregada al departamento a catastro municipal de Colima, este último aun no sido realizado.

La plataforma fue terminada en su totalidad por lo que las capas agregadas suman un total de 53, cada una con sus respectivos campos y filtros.

A continuación, se muestran las capturas de pantalla obtenidas de la vista del proyecto en su versión final. La figura 11 muestra la implementación de opciones de las capas, campos, valores y área de influencia para consulta, pero también funciones como limpiar mapa o limpiar todo de forma extra que ayuden al usuario cuando realiza una gran cantidad de consultas.


Figura 11. Vista de consultas en mapa.

Los resultados son presentados de cinco formas diferentes: contador en la tabla búsqueda, marcadores en el mapa, individual en ventana emergente, grupal en tabla de datos y archivo en CSV, ver figura 12.

Figura 11. Representación de resultados usando la tabla de datos

Por último, se tienen los resultados del archivo dependiente a los resultados de las consultas del usuario, cabe mencionar que el archivo solo se descarga si es indicado seleccionando el botón Exportar datos a CVS, ver figura 13.

Figura 12. Resultados obtenidos al exportar los datos a formato CSV.

Los resultados obtenidos con uso de Weka serán expuestos usando el formato definido anteriormente en la sección de minería de datos encontrada en proceso. Se usaron cuatro áreas de influencia: Social, Económica, Turística y Cultural para evaluar, ya que son un punto de importancia para el sector gubernamental.

Social

Después de realizar el pre procesamiento de los datos para Weka, no fue posible aplicar algún algoritmo, debido a que automáticamente se detectó la falta de relación.

Económico

El sector económico presentó mayor relación que cualquier otro sector, aun así, no fue posible obtener resultados positivos. A continuación, se muestran los resultados de las zonas procesadas: Zona Centro, Zona 1, Zona 2 y Zona 4; la Zona 3 fue omitida por falta de resultados a causa de no tener los datos adecuados para aplicar un algoritmo.

 

Zona Centro (ZC)

Los resultados de la zona centro son menores a lo esperado, el porcentaje de clasificación de forma correcta es 53.4057 % con 1623 instancias clasificadas y el menor de 14.1823 con 431 instancias clasificadas, ver tabla 5.

Tabla 5. Resultados de instancias clasificadas en economía Zona Centro

Clasificador

Instancias clasificadas correctamente

% índice correcto de clasificación

NaiveBayes

431

14.1823

NaiveBayesMultinominalText

1623

53.4057

OneR

1559

51.9667

PART

1460

48.6667

J48

1580

52.6667

RandomTree

929

30.9667

 

Tomando en cuenta lo anterior y los resultados de la tabla 6 no se recomida proseguir con la implementación de minería de datos, de ser necesario se deberá hacer uso del clasificador NaiveBayesMultinominalText perteneciente a Bayes, puesto que tiene la tasa de error más baja.

 

Tabla 6. Resultados de rapidez y simplicidad en economía zona centro

Clasificador

Tasa de error

Rapidez

Interpretabilidad

Simplicidad

NaiveBayes

85.8177

0 s

Bayes

Malo

NaiveBayesMultinominalText

46.5943

0 s

Bayes

Malo

OneR

48.0333

0.01 s

Reglas

Malo

PART

51.3333

0.07 s

Reglas

Malo

J48

47.333

0.03 s

Árbol

Malo

RandomTree

69.0333

0.01 s

Árbol

Malo

 

Zona 1 (Z1)

La zona 1 generó resultados parecidos de la zona centro, la mejor clasificación de estancias ocurrió con la aplicación del algoritmo de clasificación J48 quedando PART a solo 2.1337%, ver tabla 7.

 

Tabla 7. Resultados de instancias clasificadas en economía Zona 1

Clasificador

Instancias clasificadas correctamente

% índice correcto de clasificación

NaiveBayes

1261

42.0333

NaiveBayesMultinominalText

1099

36.6333

OneR

1076

35.8667

PART

1345

44.8333

J48

1409

46.9667

RandomTree

929

30.9667

 

Todos los algoritmos aplicados a economía Zona 1 dieron una tasa de error alto por lo que su simplicidad y eficiencia es mala, esto indica que su implementación no es favorable para obtención de información relevante, ver tabla 8.

Tabla 8. Resultados de rapidez y simplicidad en economía Zona 1

Clasificador

Tasa de error

Rapidez

Interpretabilidad

Simplicidad

NaiveBayes

63.3667

0 s

Bayes

Malo

NaiveBayesMultinominalText

64.2509

0 s

Bayes

Malo

OneR

64.1333

0.01 s

Reglas

Malo

PART

55.1667

0.6 s

Reglas

Malo

J48

53.0333

0.06 s

Árbol

Malo

RandomTree

72.9

3.32

Árbol

Malo

 

Zona 2 (Z2)

La Zona 2 obtuvo entre 37 y 49 instancias correctamente clasificadas con un índice de simplicidad entre 51.32% y 68.05%, si se comparar con tablas de otras zonas fue la que mejor resultados obtuvo en general, ver tabla 9.

Tabla 9. Resultados de instancias clasificadas en economía Zona 2.

Clasificador

Instancias clasificadas correctamente

% índice correcto de clasificación

NaiveBayes

49

68.0556

NaiveBayesMultinominalText

37

51.3889

OneR

39

54.1667

PART

48

66.6667

J48

48

66.6667

RandomTree

45

62.5

 

Si tomamos en cuenta los datos anteriores y en relación a la Tabla 10 podemos observar que, aunque los índices de clasificación no son favorecedores solo se encuentra a 1.94% de obtener una simplicidad media y ser considerados para pasar a la etapa de interpretación.

 

Tabla 10. Resultados de rapidez y simplicidad en economía Zona 2

Clasificador

Tasa de error

Rapidez

Interpretabilidad

Simplicidad

NaiveBayes

31.9444

0 s

Bayes

Malo

NaiveBayesMultinominalText

48.6111

0 s

Bayes

Malo

OneR

45.8333

0 s

Reglas

Malo

PART

33.3333

0.01 s

Reglas

Malo

J48

33.3333

0 s

Árbol

Malo

RandomTree

37.5

0 s

Árbol

Malo

 

Zona 4 (Z4)

La Tabla 11 muestra rangos positivos de clasificación sin ser suficientes para interpretación ya que debido a los datos obtenidos de la zona solo se maneja la tabla giros comerciales que por sí sola no genera información relevante.

 

Tabla 11. Resultados de instancias clasificadas en economía Zona 4.

Clasificador

Instancias clasificadas correctamente

% índice correcto de clasificación

NaiveBayes

47

92.1569

NaiveBayesMultinominalText

46

90.1961

OneR

46

90.1961

PART

48

94.1176

J48

46

90.1961

RandomTree

46

90.1961

 

La tasa de error para esta zona es muy baja, con 9.8039% como la mayor; esto ocurre cuando todos los campos tienen registros y correlación entre sí, ver tabla 12.

 

Tabla 12. Resultados de rapidez y simplicidad en economía Zona 4.

Clasificador

Tasa de error

Rapidez

Interpretabilidad

Simplicidad

NaiveBayes

7.8431

0 s

Bayes

Bueno

NaiveBayesMultinominalText

9.8039

0 s

Bayes

Bueno

OneR

9.8039

0 s

Reglas

Bueno

PART

5.8824

0.02 s

Reglas

Bueno

J48

9.8039

0 s

Árbol

Bueno

RandomTree

9.8039

0 s

Árbol

Bueno

 

Turístico

Los datos obtenidos para este rubro son insuficientes, por tal motivo la información no fue usada, los detalles de los campos se pueden ver en la sección de análisis de tablas de Catastro en la sección de tablas no utilizadas.

Cultural

EL sector cultural suele estar relacionado a bienes culturales, mercados de la cultura, industrias y empresas culturales los cuales no pueden ser obtenidos de la actual base de datos; para esto se usaron las capas enfocadas a la cultura del lugar sin incluir el aspecto económico, las tablas utilizadas fueron esculturas y panteón municipal.

Zona Centro (ZC)

Los resultados conseguidos durante la implementación de algoritmos de minería de datos en la zona centro fue muy variada ya que los rangos de clasificación rondan desde 12.82% al 61.53% de éxito en instancias clasificadas correctamente, estos índices no son suficientemente buenos para proseguir, pero ayudan a determinar cuál algoritmo será mejor opción de tener más datos o tablas, ver tabla 13.

Tabla 13. Resultados de instancias clasificadas en cultura Zona Centro.

Clasificador

Instancias clasificadas correctamente

% índice correcto de clasificación

NaiveBayes

11

28.2051

NaiveBayesMultinominalText

23

58.9744

OneR

5

12.8205

PART

18

46.1538

J48

24

61.5385

RandomTree

21

53.8462

Los resultados de simplicidad de la tabla 14 indican que cualquier uso de los algoritmos expuestos obtendrán altos índices de error, por lo que son clasificados como malo, refiriendo a su poca recomendación de uso.

 

Tabla 14 Resultados rapidez y simplicidad en cultura Zona Centro.

Clasificador

Tasa de error

Rapidez

Interpretabilidad

Simplicidad

NaiveBayes

71.7949

0 s

Bayes

Malo

NaiveBayesMultinominalText

41.0256

0 s

Bayes

Malo

OneR

87.1795

0 s

Reglas

Malo

PART

53.8462

1.02 s

Reglas

Malo

J48

46.1538

0 s

Árbol

Malo

RandomTree

38.4615

0 s

Árbol

Malo

 

Zona 1 (Z1)

Los últimos datos procesados pertenecen a la zona 1, si se comparan con los obtenidos en la zona centro son bastante diferentes aun cuando se hace uso de la misma, lo cual indica que existían pocos datos a clasificar, ver tabla 15.

 

Tabla 15. Resultados de instancias clasificadas en cultura Zona 1.

Clasificador

Instancias clasificadas correctamente

% índice correcto de clasificación

NaiveBayes

33

42.8571

NaiveBayesMultinominalText

35

45.4545

OneR

1

1.2987

PART

34

44.1558

J48

34

44.1558

RandomTree

21

53.8462

 

Al igual que los demás resultados obtenidos, la tabla 16 presenta una tasa de error elevada incluso se obtiene la tasa de error más alta registrada con 98.70% de error, es de esperarse que tampoco pueda ser posible la clasificación.

 

Tabla 16. Resultados de rapidez y simplicidad en cultura Zona 1.

Clasificador

Tasa de error

Rapidez

Interpretabilidad

Simplicidad

NaiveBayes

57.1429

0 s

Bayes

Malo

NaiveBayesMultinominalText

54.5455

0 s

Bayes

Malo

OneR

98.7013

0.01 s

Reglas

Malo

PART

55.8442

0.04 s

Reglas

Malo

J48

55.8442

0 s

Árbol

Malo

RandomTree

59.7403

0.02 s

Árbol

Malo

 

CONCLUSIONES

El desarrollo de una plataforma web para la generación de consultas dinámica por medio de trazo de geocercas significó una solución a las necesidades del departamento de catastro del municipio de Colima, se establecieron estándares de manejo de datos como de desarrollo para agregar filtros para que en dado el caso de realizar una actualización se pueda hacer de manera fácil y rápida.

Al inicio del proyecto se planteó la implementación e interpretación de resultados a partir de la aplicación de minería de datos, si bien los resultados de este último no fueron los esperados sirve como base de aprendizaje para futuros planteamientos que desee realizar Catastro del municipio de Colima.

De querer en un futuro el departamento de catastro implementar algoritmos de minería de datos se tendrá que replantear su forma de recolección, actualización y relación de datos, ya que la forma actual no es suficiente para generar algún tipo de resultado.

BIBLIOGRAFÍA

Cano, R., Osorio, J., Lira, A., & Matínez, M. (diciembre de 2018). Búsquedas dinámicas en fuentes de datos abiertos, caso: catastro digital Colima. Recuperado el 23 de febrero de 2019, de http://citt.itsm.edu.mx/ingeniantes/pdfversion/ingeniantes5no2vol1.pdf

Bautista, O., Elizabeth, J., Rosero Reinoso, M. A., & Cueva, L. Implementación de un prototipo de geoposicionamiento con tecnología Sigfox, aplicado a paradas inteligentes y rastreo de niños.

Betancourt Rodríguez, L. E. (2018). Sistema de geolocalización móvil para la optimización del transporte público brindado por la Cooperativa Flecha Verde-Ruta 55 en la ciudad de Guayaquil (Doctoral dissertation, Universidad de Guayaquil. Facultad de Ingeniería Industrial. Carrera de Ingeniería en Teleinformática.).

Errecalde, M. L. (Diciembre de 2007). Preparación de los datos en el proceso KDD. (https://www.researchgate.net/) Recuperado el 5 de Abril de 2019, de https://www.researchgate.net/publication/266445601_Preparacion_de_los_datos_en_el_proceso_KDD

Farr, J. V., Merino, D. N., & Gandhi, S. J. (2016). The Engineering Management Handbook (2nd Edition ed.). American Society for Engineering Management.

Fonseca Duarte, R. F., Lizarazo Cifuentes, C. A., & Pérez Hernández, L. G. (2015). Sistema inteligente de monitoreo y rastreo para equipos de alta gama.“Caso de estudio empresa Colvatel SA ESP”.

Gutiérrez, D., Albarrán, Y. A., & Rico, R. (2017). Manual para prácticas del laboratorio de cómputo. Universidad autónoma del estado de México.

Halpin, A. L., & Kurthakot, R. (2015). Can Systemic Thinking Be Measured? Introducing the Systemic Thinking Scale (STS). Developments in Business Simulation and Experiential Learning, vol. 42, 153.

Hernandez, R., Fernandez, C., & Baptista, P. (2010). Metodologia de la Investigación. Mexico, DF: McGrawHill.

Keating, C., Calida, B., Souza-Poza, A., & Kovacic, S. (2016). Systems Thinking. Engineering Management Handbook, American Society for Engineering, 245-297.

Krathwohl, D. R. (2002). A Revision of Bloom’s Taxonomy: An Overview. Theory into Practice, 212-218.

OSORIO, M. A. F., LÓPEZ, M. P. M., & GIRALDO, J. F. S. 07. Transporte inteligente. Coloquio de Investigación Formativa, 36.

Pizzuto, R. (20 de febrero de 2019). ¿Qué son los Datos Abiertos? Obtenido de https://datos.gob.mx/blog/que-son-los-datos-abiertos

Quispe Perez, J. A. (2022). Eficacia de un sistema de monitoreo y control de vehículos con el uso de aplicativos móviles y geocercas para reducir los indicadores de accidentabilidad durante el transporte de GLP en la ruta Cusco-Quillabamba por el operador logístico Mogrovejo.

Rokach, L., & Maimon, O. (2010). Data Mining and Knowledge Discovery Handbook. Israel: Springer US.

Zárate, K. L. A. GENERACIÓN Z: Nuevos Paradigmas para la Interacción en el Desarrollo de Aplicaciones.