MODELO DE PROYECCIÓN POBLACIONAL

CON SERIES DE TIEMPO DIFUSAS

POPULATION PROJECTION MODEL WITH FUZZY

TIME SERIES

Jaqueline Jessica Cabello Blanco

Universidad Nacional del Santa-Nuevo Chimbote , Perú

pág. 1059

DOI: https://doi.org/10.37811/cl_rcm.v8i2.10549

Modelo de Proyección Poblacional con Series de Tiempo Difusas

Jaqueline Jessica Cabello Blanco1

jcabello@unjfsc.edu.pe

https://orcid.org/0000-0002-7464-0305

Universidad Nacional del Santa-Nuevo Chimbote

Perú

RESUMEN

El presente estudio es de alcance descriptivo – propositivo, la finalidad del estudio es modelar la

proyección poblacional con series de tiempo difusas, el diseño de investigación empleado es no

experimental. El modelo de proyección de la población peruana (variable lingüística) obtenido fue:

 󰇟󰇠 más 󰇟󰇠 más

 󰇟󰇠 más 󰇟󰇠 más

 󰇟󰇠 , este modelo de proyección poblacional con series de tiempo difusas

presenta una tasa media de error de pronóstico de 0.106% frente a una tasa media de error de pronóstico

del modelo lineal de 4.06% y 1.40% de tasa media de error de pronóstico del modelo logístico. Se

concluye que el pronóstico de la población peruana con series de tiempo difusas tiene mayor precisión

tomando en cuenta en el proceso, la tendencia de la población en estudio.

Palabras clave: proyección poblacional, series de tiempo difusas, conjuntos difusos

Autor principal.

Correspondencia: jcabello@unjfsc.edu.pe

pág. 1060

Population Projection Model With Fuzzy Time Series

ABSTRACT

The present study is descriptive - propositional in scope, the purpose of the study is to model the

population projection with fuzzy time series, the research design used is non-experimental. The

projection model of the Peruvian population (linguistic variable) obtained was: 󰇛󰇜

 󰇟󰇠  󰇟󰇠  󰇟󰇠 

plus 󰇟󰇠  󰇟󰇠 , this population projection

model with fuzzy time series presents an average forecast error rate of 0. 106% versus a mean forecast

error rate of the linear model of 4.06% and 1.40% mean forecast error rate of the logistic model. It is

concluded that the forecast of the Peruvian population with fuzzy time series has greater accuracy taking

into account in the process, the trend of the population under study.

Keywords: population projection, fuzzy time series, fuzzy sets

Artículo recibido 20 febrero 2024

Aceptado para publicación: 26 marzo 2024

pág. 1061

INTRODUCCIÓN

La población mundial está experimentando crecimientos drásticos, sus relaciones económicas y sociales

son complejas, la función de los países es desarrollar, implementar y evaluar programas para mejorar

la calidad de vida de sus ciudadanos, por lo que se necesita información del crecimiento demográfico,

Rincón (1989) afirma que las proyecciones de población constituyen una de las bases fundamentales

para fines de planificación de las actividades económicas y sociales de un país; en Perú, la metodología

seguida para la elaboración de las proyecciones nacionales, consideran las recomendaciones,

normativas y metodologías de las Naciones Unidas, que utiliza el método demográfico de los

componentes (fecundidad, mortalidad y migración), método tradicional cuya principal fortaleza es su

simplicidad, englobando los nacimientos y población migrante para después deducir las defunciones y

emigraciones, el procesamiento de los datos lo realizan utilizando el PRODEX que es un programa en

Excel preparado por la Comisión Económica para América Latina y el Caribe (CEPAL) del Centro

Latinoamericano y Caribeño Demográfico (CELADE), el cual permite ingresar cada uno de los

componentes elaborados en forma independiente, cuyo principio fundamental es la ecuación

compensadora desarrollada por Pascal Whelpton en 1947, de esta forma la población total es proyectada

por el método de componentes, que es resultado de la combinación de la fecundidad, la mortalidad y la

migración, la precisión de estas proyecciones están sujetas a un determinado margen de error, la

población se proyecta en el tiempo bajo supuestos del comportamiento de las tasas que regulan los

niveles de crecimiento, por tanto el propósito de esta investigación es determinar el modelo de

proyección poblacional con series de tiempo difusas que aproxime la realidad desde esta teoría, que

proporcione mayor indice de precisión que el método existente, es necesario entender que la proyección

poblacional es un fenómeno con incertidumbre en su ocurrencia. La importancia de esta investigación

es cuantificar la incertidumbre que se relaciona a la proyección poblacional, este modelo de proyección

poblacional servirá como instrumento científico que cuente con la coherencia, validez y veracidad

científica. Los datos de esta investigación provienen del Boletín de Análisis Demográfico N° 38 del

Instituto Nacional de Estadística e Informática (INEI) y se presenta el modelo de proyección

poblacional “desarrollo de la población” con series de tiempo difusas; diferentes autores han venido

estudiando en este campo (Abbasov y Mamedova, 2003; Argote-Cusi, 2018; Chen y Hsu, 2004; Chen

pág. 1062

y Hwang, 2000; Jilani et al., 2008; Sasu, 2010; Song y Chissom, 1993, 1994; Stevenson y Porter, 1972)

y otros campos de la dinámica social humana; Tabares y Hernández (2009) y Zadeh (1975) mencionan

que la ciencia moderna no puede comprender un fenómeno si no está caracterizado en términos

cuantitativos, al renunciar a la precisión se disponen a entender números inciertos (números difusos)

para explorar el uso de las variables lingüísticas que son variables cuyos valores no son números sino

palabras o frases en un lenguaje natural o artificial que son de utilidad en una amplia variedad de

aplicaciones prácticas, Aluja (2000) menciona que la caracterización de estos números difusos son

susceptibles de representarse en fenómenos con incertidumbre en su ocurrencia. Así el conjunto total

de términos de la variable lingüística “desarrollo de la población” de esta investigación es: bajo

crecimiento poblacional más invariante crecimiento poblacional más moderado crecimiento

poblacional más alto crecimiento poblacional más muy alto crecimiento poblacional. En conclusión, la

teoría de las series de tiempo difusas es útil en la modelación del crecimiento poblacional, que es un

fenómeno no caracterizado en términos cuantitativos.

METODOLOGÍA

La investigación desarrollada es de enfoque cuantitativo, cuyo alcance es descriptivo – propositivo

cuenta con un diseño no experimental de corte transeccional. Para desarrollar el modelo de proyección

poblacional con series de tiempo difusas se utilizó el modelo de primer orden, se siguió una metodologia

rigurosa que se describen a continuación:

1. Definición del universo de discurso  que contiene el valor máximo y mínimo de la variación de

población.

2. Segmentación del universo de discurso  en  intervalos de igual longitud

3. Descripción cualitativa de los valores de variación de la población total como variable lingüística

󰇛󰇜 (conjunto del conjunto difuso).

4. Fuzzificación los datos de entrada o conversión de los valores numéricos a valores difusos,

mediante la fórmula: 

󰇛󰇜

pág. 1063

5. Definición del valor pronosticado en su forma difusa 󰇛󰇜. Para definir el valor pronosticado se

calcula la matriz de operaciones y la matriz de criterios que mediante la operación min 󰇛󰇜 se

determina la relación difusa 󰇛󰇜 que es modelo de primer orden de 󰇛󰇜.

6. Defuzzificación (proceso inverso de fuzzificar) de los resultados obtenidos. Se propone la fórmula:

󰇛󰇜





󰇛󰇜





RESULTADOS Y DISCUSIÓN

Primer paso: Definición del universo de discurso  que contiene el valor máximo y mínimo de la

variación de población, para definir el universo de discurso , primero se definen el valor mínimo y

máximo en la columna de variación de la población. Se encontró el valor máximo que se denota por

  y el valor mínimo denotado con   , se define el universo de discurso con

la fórmula:   󰇟     󰇠 donde  y  son dos números positivos, escogemos 

 y . Luego el universo de discurso es:   󰇟󰇠

Segundo paso: Segmentación del universo de discurso  en  intervalos de igual longitud, se

segmentó el universo de discurso  en  intervalos de igual longitud:   󰇟󰇛󰇜󰇛󰇜󰇠

 , con

󰇟   󰇛  󰇜    󰇠. Obteniendo los intervalos: 󰇟󰇠;

󰇟󰇠; 󰇟󰇠; 󰇟󰇠; 

󰇟󰇠. Tomando en cuenta que el pronóstico con series de tiempo difusas presenta el

menor error promedio, se halló los puntos medios de cada uno de los intervalos: , 

, , , .

Tercer paso: Descripción cualitativa de los valores de variación de la población total como

variable lingüística 󰇛󰇜 (conjunto del conjunto difuso). A cada valor lingüístico le corresponde una

variable difusa que, de acuerdo con una regla, se asignará contra un conjunto difuso. Es importante

comprender que la noción de incertidumbre es distinta de la de probabilidad (Zadeh, 1975).

pág. 1064

Tabla 1. Modelo de proyección de la población peruana

Conjunto difuso

Variable lingüística “Desarrollo de

la población”

= Nivel bajo de crecimiento poblacional (NBCP)

 󰇟󰇠 

= Nivel invariante de crecimiento poblacional (NICP)

 󰇟󰇠 

= Nivel moderado de crecimiento poblacional (NMCP)

 󰇟󰇠 

= Nivel alto de crecimiento poblacional (NACP)

 󰇟󰇠 

= Nivel muy alto de crecimiento poblacional (NMACP)

 󰇟󰇠 

La tabla 1 muestra los conjuntos difusos que están definidos sobre el universo de discurso . En este

caso el “Desarrollo de la población” es una variable lingüística que asume los valores lingüísticos =

Nivel bajo de crecimiento poblacional (NBCP), = Nivel invariante de crecimiento poblacional

(NICP), = Nivel moderado de crecimiento poblacional (NMCP), = Nivel alto de crecimiento

poblacional (NACP), = Nivel muy alto de crecimiento poblacional (NMACP). A cada valor

lingüístico le corresponde una variable difusa que, según una regla determinada, se asigna a un conjunto

difuso correspondiente que determina el significado de dicha variable. Por ejemplo, el valor lingüístico

“nivel bajo de crecimiento poblacional” está dado por la variable difusa  󰇟󰇠 ,

donde  es un conjunto difuso definido en el dominio 󰇟󰇠 del universo de discurso .

Cuarto paso: Fuzzificación los datos de entrada o conversión de los valores numéricos a valores

difusos, mediante la fórmula: 

󰇛󰇜

Donde:

variación poblacional

: puntos medio de los intervalos

 es una constante que asegura la conversión de los valores definidos en los valores difusas o su

pertenencia al intervalo ( 󰇜.

Si se acepta el valor de  como punto medio del intervalo correspondiente, el conjunto difuso 󰇛 

  󰇜, se define de la siguiente manera:

pág. 1065



󰇝󰇛1.00000/󰇜

(0.00010/󰇜

(0.00002/󰇜

(0.00001/󰇜

0.00001/󰇜



󰇝󰇛0.00010/󰇜

(1.00000/󰇜

(0.00010/󰇜

0.00002/󰇜

0.00001/󰇜



󰇝󰇛0.00002/󰇜

(0.00010/󰇜

(1.00000/󰇜

0.00010/󰇜

0.00002/󰇜



󰇝󰇛0.00001/󰇜

(0.00002/󰇜

(0.00010/󰇜

1.00000/󰇜

0.00010/󰇜



󰇝󰇛0.00001/󰇜

(0.00001/󰇜

(0.00002/󰇜

0.00010/󰇜

1.00000/󰇜

Figura 1. Función de pertenencia de los valores del conjunto difuso de la variable lingüística

“Desarrollo de la población”

Quinto paso: Definición del valor pronosticado en su forma difusa 󰇛󰇜.

Se calcula la matriz de relaciones difusas 󰇛󰇜 mediante el cual se da un pronóstico del crecimiento de

la población en el año siguiente. En este caso se selecciona    y se define la matriz de operaciones

󰇛󰇜 (que es la matriz de variación difusa en la población total sobre los años   ,   ,   ,  

) y la matriz de criterios 󰇛󰇜 (que es la matriz de variación difusa para el año   ). Así para   ,

se utiliza los datos de los 6 años anteriores (se debe conocer la población total del año 󰇛  󰇜 para

encontrar la variación del año 󰇛  󰇜.

Posterior a esto se halla 󰇛󰇜 󰇛󰇜 󰇛󰇜 que es una relación difusa y se denomina modelo de

primer orden de 󰇛󰇜 donde  es una operación 󰇛󰇜; luego se define el valor pronosticado 󰇛󰇜 para

el año  en forma difusa:

0,00000

0,10000

0,20000

0,30000

0,40000

0,50000

0,60000

0,70000

0,80000

0,90000

1,00000

140000 190000 240000 290000 340000 390000 440000 490000 540000

función de pertenencia

puntos medios de los intervalos

pág. 1066

󰇛󰇜󰇛    󰇜 󰇛    󰇜 󰇛    󰇜 ,

Por ejemplo, para pronosticar la población total para el año 1956 se establecerá la matriz de operaciones:

0.026

0.064

0.005

0.002

0.001

  

󰇛󰇜

0.021

0.088

0.006

0.002

0.001

  

0.017

0.138

0.006

0.002

0.001

  

0.014

0.263

0.007

0.002

0.001

  

La matriz de criterios:

󰇛󰇜

0.012

0.644

0.009

0.002

0.001

  

Se calcula la matriz de relaciones difusas 󰇛󰇜;  es una operación min 󰇛󰇜, que es el modelo de primer

orden de 󰇛󰇜.

0.012

0.064

0.005

0.002

0.001

󰇛󰇜 󰇛󰇜 󰇛󰇜

0.012

0.088

0.006

0.002

0.001

0.012

0.138

0.006

0.002

0.001

0.012

0.263

0.007

0.002

0.001

Luego se define el valor pronosticado 󰇛󰇜 para el año 1956 en forma difusa:

󰇛󰇜

0.012

0.263

0.007

0.002

0.001

Sexto paso: Defuzzificación (proceso inverso de fuzzificar).

Para defuzzificar los resultados obtenidos o conversión de los valores difusos en valores numéricos se

propone la fórmula: 󰇛󰇜





󰇛󰇜



 (crecimiento esperado de la población).

Donde:

: es el valor calculado de función de pertenencia para el año de pronóstico .

 : son los puntos medios de los intervalos.

pág. 1067

Para estimar la población total pronosticada para el año 1956, se calcula el crecimiento esperado:

󰇛󰇜 (según la figura 1, se interpreta que para el año 1956 el nivel de crecimiento

poblacional peruano fue invariante con un grado de pertenencia de 0.90). Luego se calcula la población

pronosticada para el año 1956:

󰇛󰇜     millones.

Finalmente los pronósticos de la población peruana obtenidos con series de tiempo difusas (STD) se

compara con el modelo lineal (ML): 󰇛󰇜   y el modelo logístico

(MLOGI): 󰇛󰇜

 . Los resultados se muestra en la tabla 2.

Tabla 2. Comparación de pronóstico de la población peruana entre los modelos de proyección

poblacional: series de tiempo difusas (STD), modelo lineal (ML) y el modelo logístico (MLOGI).

Donde se observa que la tasa media de error de pronóstico porcentual con series de tiempo difusas es

de 0.106 %, la población pronosticada con el modelo lineal 󰇛󰇜 presenta una tasa media de error de

pronóstico porcentual de 4.06% y el modelo logístico 󰇛󰇜 tiene una tasa media de error de pronóstico

porcentual de 1.40%, concluyendo que el método de pronóstico con series de tiempo difusas presenta

Año

Población

observada

󰇛󰇜

Población

pronosticada

con series de

tiempo difusas

(STD)

Población

pronosticada

con el modelo

lineal

(ML)

Población

pronosticada

con el modelo

logistico

(MLOGI)

Error

relativo

(STD)

Error

relativo

(ML)

Error

relativo

(MLOGI)

1956

9098885

9098746.7

9519545.85

9228338.84

0.000015199

0.04623213

0.01422744

1960

10153262

10127507.2

10908233.8

10383666.8

0.002536607

0.07435756

0.02269269

1970

13453692

13429789.6

14379953.7

13681000.9

0.001776641

0.06884814

0.01689565

1980

17531898

17535319.7

17851673.5

17473695.9

0.000195169

0.01823964

0.00331978

1990

22031627

22018655.3

21323393.4

21558828.5

0.000588778

0.03214622

0.02145999

2000

26390142

26448748.9

24795113.3

25659112.7

0.002220788

0.06044032

0.02770085

2010

28692915

28681410.3

28266833.2

29493196.6

0.000400959

0.01484972

0.02789126

2020

32625948

32658503.8

31738553

32848109.9

0.00099785

0.02719906

0.00680936

2030

35792079

35803032.3

35210272.9

35617428.9

0.000306026

0.01625516

0.00487957

2040

38023290

38058262.2

38681992.8

37795402

0.000919757

0.01732367

0.00599338

2050

39363351

39431252.8

42153712.6

39444028

0.001725001

0.0708873

0.00204955

Tasa media de error de pronóstico (TMEP)

0.00106207

0.04061627

0.01399268

Tasa media de error de pronóstico porcentual (TMEP %)

0.106207048

4.06162663

1.39926845

pág. 1068

una mayor precisión con una tasa media de error de pronóstico porcentual de 0.106%.

los resultados del pronóstico de la población peruana con series de tiempo difusas han demostrado que

tienen una buena aproximación a diferencia del modelo lineal y el modelo logístico, el modelo de

proyección poblacional con series de tiempo difusas, toma en cuenta la tendencia de población en

estudio, logrando una mayor precisión frente al modelo lineal y el modelo logístico, demostrando que

el pronóstico de la población con las series de tiempo difusas logra pronósticos más precisos para

cualquier horizonte lejano, coincidiendo con Stevenson y Porter (2009), quienes concluyen que el

método de series de tiempo difusas da como resultado una mayor precisión en los pronósticos que los

modelos existentes. Song y Chissom (1993) mencionan la superioridad en los pronósticos con series de

tiempo difusas, Abbasov y Mamedova, 2003; Argote-Cusi, 2018, observan que las series de tiempo

difusas permiten tener en cuenta la tendencia, la no linealidad de la población y tasas de crecimiento,

logrando pronósticos más precisos, Sasu (2010) concluye que las series de tiempo difusas ayudan a

realizar cálculos de pronóstico para cualquier perspectiva lejana, concordando con los resultados

obtenidos en este estudio.

CONCLUSIONES

Se concluye que se logró el propósito de esta investigación que es modelar la proyección poblacional

con series de tiempo difusas obteniendo el modelo de proyección de la población peruana (variable

lingüística):

 󰇟󰇠  󰇟󰇠  󰇟󰇠 

 󰇟󰇠  󰇟󰇠 , definiendo el universo de

discurso   󰇟󰇠, este modelo de proyección poblacional presenta mayor precisión y se

concluye que es posible realizar un pronóstico más preciso dado que el modelo toma en cuenta las

tendencias de la población analizada.

REFERENCIAS BIBLIOGRÁFICAS

Abbasov, A., y Mamedova, M. (2003). Application of fuzzy time series to population forecasting.

Vienna University of Technology, 12, 545-552.

Aluja, J. (2000). Génesis de una teoría de la incertidumbre. Fundación General de la Universidad

Autónoma de Madrid.

pág. 1069

Argote-Cusi, M. (2018). El uso de lógica difusa en proyecciones de población: el caso de México.

Papeles de población, 24(95), 273-301.

Chen, S.-M., y Hsu, C.-C. (2004). A new method to forecast enrollments using fuzzy time series.

International Journal of Applied Science and Engineering, 2(3), 234-244.

Chen, S.-M., y Hwang, J.-R. (2000). Temperature prediction using fuzzy time series. IEEE Transactions

on Systems, Man, and Cybernetics, Part B (Cybernetics), 30(2), 263-275.

García, J., Sánchez, A., Hidalgo, N., y Benavides, H. (2019). Perú: Estimaciones y proyecciones de la

población Nacional, 1950-2070. Boletín de Análisis Demográfico(38).

Jilani, T., Burney, S., y Ardil, C. (2008). Multivariate high order fuzzy time series forecasting for car

road accidents. International Journal of Computer and Information Engineering, 2(6), 2038-

2043.

López Vargas, G., & Rodríguez García, J. C. (2021). Enfermería en Contexto de Trabajo en Salud

Pública en América Latina. Revista Científica De Salud Y Desarrollo Humano, 2(1), 51–66.

https://doi.org/10.61368/r.s.d.h.v2i1.14

Mathews, J. y Fink, K. (2000). Métodos Numéricos. Madrid: Prentice Hall.

Martínez Pérez , S. I. (2022). La Protección de la Propiedad Intelectual y la Piratería en Línea. Estudios

Y Perspectivas Revista Científica Y Académica , 2(1), 74–95.

https://doi.org/10.61384/r.c.a.v2i1.10

Rincón, M. (1989). Teoria y metodos para la preparacion de estimaciones y proyecciones de poblacion:

insumos para la planificacion.

Sasu, A. (2010). An application of fuzzy time series to the Romanian population. Bulletin of the

Transilvania University of Brasov. Mathematics, Informatics, Physics. Series III, 3, 125.

Abbasov, A., y Mamedova, M. (2003). Application of fuzzy time series to population forecasting.

Vienna University of Technology, 12, 545-552.

Aluja, J. (2000). Génesis de una teoría de la incertidumbre. Fundación General de la Universidad

Autónoma de Madrid.

Argote-Cusi, M. (2018). El uso de lógica difusa en proyecciones de población: el caso de México.

Papeles de población, 24(95), 273-301.

pág. 1070

Chen, S.-M., y Hsu, C.-C. (2004). A new method to forecast enrollments using fuzzy time series.

International Journal of Applied Science and Engineering, 2(3), 234-244.

Chen, S.-M., y Hwang, J.-R. (2000). Temperature prediction using fuzzy time series. IEEE Transactions

on Systems, Man, and Cybernetics, Part B (Cybernetics), 30(2), 263-275.

Cruz Rosas, J., & Oseda Gago, D. (2022). Design thinking en la creatividad de los estudiantes de

administración de empresas, en una universidad de Trujillo – 2020. Emergentes - Revista

Científica, 2(1), 57–70. https://doi.org/10.37811/erc.v1i2.13

Chavarría Oviedo, F. A., & Avalos Charpentier, K. (2022). English for Specific Purposes Activities to

Enhance Listening and Oral Production for Accounting . Sapiencia Revista Científica Y

Académica , 2(1), 72–85. https://doi.org/10.61598/s.r.c.a.v2i1.31

García, J., Sánchez, A., Hidalgo, N., y Benavides, H. (2019). Perú: Estimaciones y proyecciones de la

población Nacional, 1950-2070. Boletín de Análisis Demográfico(38).

Jilani, T., Burney, S., y Ardil, C. (2008). Multivariate high order fuzzy time series forecasting for car

road accidents. International Journal of Computer and Information Engineering, 2(6), 2038-

2043.

Mathews, J. y Fink, K. (2000). Métodos Numéricos. Madrid: Prentice Hall.

Rincón, M. (1989). Teoria y metodos para la preparacion de estimaciones y proyecciones de poblacion:

insumos para la planificacion.

Sasu, A. (2010). An application of fuzzy time series to the Romanian population. Bulletin of the

Transilvania University of Brasov. Mathematics, Informatics, Physics. Series III, 3, 125.

Sethi, P., Sonawane, S., Khanwalker, S., Keskar, R. B. (2017). Automatic text summarization of news

articles. 2017 International Conference on Big Data, IoT and Data Science (BID), pp. 23–29.

Song, Q., y Chissom, B. (1993). Forecasting enrollments with fuzzy time series—Part I. Fuzzy sets and

systems, 54(1), 1-9.

Song, Q., y Chissom, B. (1994). Forecasting enrollments with fuzzy time series—Part II. Fuzzy sets

and systems, 62(1), 1-8.

Stevenson, M., Porter, J. (1972). Fuzzy time series forecasting using percentage change as the universe

of discourse. Change, 1971(3.89), 464-467.

pág. 1071

Stevenson, M., Porter, J. (1972). Fuzzy time series forecasting using percentage change as the universe

of discourse. Change, 1971(3.89), 464-467.

Tabares, H., y Hernández, J. (2009). Aproximación por lógica difusa de la serie de tiempo: demanda

diaria de energía eléctrica. Revista Facultad de Ingeniería Universidad de Antioquia(47), 209-

217.

Trinidad, A. (2014). Modelos de crecimiento en biología, su significado biológico y selección del

modelo por su ajuste. Universidad Auntónoma Metropolitana-Iztapalapa.

Zadeh, L. (1965). Fuzzy sets. Information and control, 8(3), 338-353.

Zadeh, L. (1975). The concept of a linguistic variable and its application to approximate reasoning—I.

Information sciences, 8(3), 199-249.