Modelamiento y control de un péndulo invertido desde una perspectiva mecatrónica

Paul David Alvarez Herrera

Gloria Irene Poémape Rojas

gpoemape@unitru.edu.pe

Universidad Nacional de Trujillo

RESUMEN

El objetivo del presente trabajo es modelar y controlar un sistema de péndulo invertido, con actuador y con sistema de trasmisión, mediante una perspectiva mecatrónica basada en la teoría de diagrama de enlaces. El requerimiento básico de control consiste en desplazar el carro de una posición a otra, usando una entrada escalón, sin que el péndulo caiga. Se ha aplicado la metodología conocida de modelamiento mediante diagrama de enlaces, estableciendo las restricciones cinemáticas necesarias entre el péndulo y el carro y usando transformadores para relacionar los engranajes entre ellos y con la correa dentada. Se ha utilizado el software 20Sim para establecer automáticamente la causalidad del modelo, para linealizarlo y para simularlo. Se desarrolló un controlador por retroalimentación de estados a partir del sistema linealizado, se lo probó en el sistema original no lineal encontrando que, para ciertos márgenes, éste es efectivo manteniendo el péndulo vertical hacia arriba mientras el carro cambia de posición.

Palabras clave: diagrama de enlaces; control por retroalimentación de estados; péndulo invertido; modelamiento.

Modeling and control of an inverted pendulum from a mechatronic perspective

ABSTRACT

The aim of this work is to model and control an inverted pendulum system, with actuator and transmission system, using a mechatronic perspective based on the bond graph theory. The basic control requirement is to move the car from one position to another, using a step input, without the pendulum falling. The known methodology of bond graph modeling has been applied, establishing the necessary kinematic restrictions between the pendulum and the car and using transformers to relate the gears to each other and to the toothed belt. The 20Sim software has been used to automatically establish the causality of the model, to linearize it and to simulate it. A state feedback controller was developed from the linearized system, it was tested in the original non-linear system, finding that, for certain range, it is effective keeping the pendulum vertical up while the car changes position.

Keywords: bond graph; state feedback control; inverted pendulum; modeling.

Artículo recibido: 07 ene. 2021

Aceptado para publicación: 20 ene. 2021

Correspondencia palvarez@unitru.edu.pe

Conflictos de Interés: Ninguna que declarar

1. INTRODUCCIÓN

Los sistemas multicuerpo son sistemas compuestos por cuerpos rígidos o flexibles interconectados, cada uno de los cuales puede tener movimientos traslacionales, rotacionales u otros más complejos. Sus ecuaciones matemáticas parten de las leyes de Newton y de Euler, pero por la complejidad que podrían llegar a tener estos sistemas, se desarrollan ciertas herramientas que permiten su modelamiento de una manera ordenada. Por ejemplo, en robótica se desarrolló la convención Denavit - Hartenberg, la cual permite definir la configuración de los eslabones de una manera ordenada y secuencial (Siciliano et al., 2009). En general, para encontrar la dinámica de los sistemas multicuerpo se pueden usar la Formulación de Lagrange o el enfoque de Newton - Euler. Existen diversos sistemas multicuerpo ampliamente conocidos y estudiados, entre ellos están los sistemas subactuados, los cuales tienen menos actuadores que articulaciones y constituyen un problema interesante en el área de control automático y mecatrónica. Entre esos sistemas están, por ejemplo, el péndulo invertido, el Acrobot y el Pendubot, principalmente, una característica interesante de estos sistemas es que son inestables y además son no lineales.

Un sistema mecatrónico puede ser entendido como un sistema electromecánico inteligente. Los sistemas mecatrónicos tienen en general una base electromecánica e hidráulica sobre la cual se integran diferentes elementos de sensado, procesamiento de información y control. En general, los sistemas mecatrónicos pueden ser vistos como sistemas multidominio, en el sentido de que involucran la integración de varios dominios, sean, mecánico, eléctrico, hidráulica, etc. (Karnopp, 2012). El diseño de sistemas mecatrónicos tiene uno de sus puntos clave en el modelamiento (Gausemeier y Moehringer, 2003), se presenta entonces el problema de modelar física y matemáticamente sistemas multidominio. Una manera de integrar o relacionar elementos o componentes de diversos dominios es mediante las variables de energía o potencia. La energía, de alguna manera, representa una variable común entre todos los dominios, de hecho, tiene siempre las mismas unidades indistintamente del domino. La teoría de Diagramas de Enlaces (del inglés Bond Graph) explota la idea anterior, y permite construir modelos de sistemas multidominio con facilidad, con la variable energía como elemento integrador. Esta teoría ha demostrado funcionalidad en el diseño de sistemas mecatrónicos, y en general, sistemas dinámicos multidominio, incluso pudiendo aplicarse al modelamiento de la dinámica tridimensional de sistemas multicuerpo (Borutzky, 2010). Una de las características de los modelos de diagramas de enlaces es su facilidad para integrarse con otros modelos para formar sistemas más complejos. Otra de ellas es que es posible formular las ecuaciones diferenciales del sistema en forma metódica y ordenada.

La teoría de diagrama de enlaces visualiza los sistemas físicos como multipuertos, es decir, sistemas con puntos de interconexión o puertos con los cuales pueden conectarse o relacionarse con otros sistemas. Estos puertos se definen por dos variables apareadas llamadas variables de potencia y que multiplicadas dan justamente la potencia que entra o sale del sistema por el puerto. La teoría describe elementos básicos abstractos con relaciones matemáticas simples los cuales hacen de bloques de construcción que permiten construir modelos complejos.

Figura 1. Diagrama esquemático del péndulo invertido.

El péndulo invertido consiste, en su forma básica, en un carro que se puede mover horizontalmente y sobre el cual un agente externo ejerce una fuerza; y un péndulo o barra que puede rotar alrededor del carro gracias a una articulación. Existen múltiples investigaciones en las cuales se ha tratado la dinámica y el control del péndulo invertido, la mayoría de ellas enfocadas en la parte mecánica únicamente (Hasan et al., 2012; Bradshaw y Shao, 1996; Kafetzis y Moysis, 2017). Usualmente las ecuaciones dinámicas son extraídas mediante lo que se podría llamar el método tradicional, que consiste simplemente en extraer las ecuaciones de los diferentes elementos del sistema a partir de los principios físicos conocidos y luego intentar ordenar esas ecuaciones. En esta investigación, se modela el péndulo invertido con su sistema de actuación y transmisión incluido (ver Figura 1), desde una perspectiva mecatrónica, utilizando la teoría de diagrama de enlaces.

2. MATERIALES Y MÉTODOS

Aplicaremos la teoría de diagrama de enlaces para modelar el péndulo invertido, con su sistema de actuación y trasmisión, tal como se ve en la Figura 1. Luego de ello, linealizaremos el sistema para poder aplicar una técnica de control lineal, como es el control en espacio de estados por ubicación de polos. Utilizaremos el software 20Sim para simular el modelo construido, además, utilizaremos el software Matlab para algunos cálculos, como por ejemplo los del diseño del controlador.

La teoría de diagramas de enlaces establece un procedimiento para modelar sistemas multicuerpo partiendo de las analogías entre la segunda ley de Newton y las leyes de movimiento de cuerpos rígidos (Karnopp, 2012). Una masa puntual en movimiento unidimensional puede ser representada por un elemento inercial porque la segunda ley de Newton establece que la velocidad es proporcional a la integral en el tiempo de la fuerza resultante aplicada sobre la masa. Extendiendo este razonamiento, se puede modelar una masa puntual en movimiento bidimensional o tridimensional, utilizando dos o tres elementos inerciales. En el caso de cuerpos rígidos que se mueven en el plano se cumple también la ley de Newton - Euler, la cual establece que la velocidad angular es proporcional a la integral del torque resultante. Por lo anterior, es claro que el movimiento plano de un cuerpo rígido debe ser representado por tres elementos inerciales, dos para los movimientos de translación y uno para el de rotación. Un sistema multicuerpo con movimiento plano contendrá tres elementos inerciales por cada cuerpo, si algunos cuerpos tienen movimiento restringido, como por ejemplo una masa puntual (que no puede rotar), algunos elementos inerciales estarán inactivos y no se requerirá representarlos.

Las relaciones dinámicas entre los diversos cuerpos quedan establecidas por las llamadas restricciones cinemáticas, que son ecuaciones que relacionan las diferentes velocidades de los diferentes cuerpos del sistema multicuerpo. Estas restricciones pueden ser calculadas de manera sencilla en el movimiento plano a través de la relación fundamental de la cinemática de los puntos del cuerpo rígido (Meriam y Kraige, 2012), esta es

donde y son dos puntos cualesquiera del cuerpo rígido, y son sus correspondientes velocidades, es la velocidad angular del cuerpo rígido y es el vector que va de hacia . Se puede demostrar que, para garantizar la coherencia de las relaciones dinámicas, solo basta con garantizar que se cumplan las restricciones cinemáticas, es decir, garantizando las restricciones cinemáticas se garantizan las relaciones entre los esfuerzos, garantizando también la conservación de la energía y la ley de acción y reacción.

Luego de construir el modelo en diagrama de enlaces, éste es ingresado al software 20Sim, el cual automáticamente asigna la causalidad. Se debe tener cuidado en escoger, cuando sea posible, los elementos que estarán en causalidad integral, ya que esto permitirá tener un modelo más simple de analizar. Luego tener el modelo en el software 20Sim, debemos linealizarlo en el punto de operación escogido en la posición vertical hacia arriba. Este proceso puede ser realizado por el mismo software, dándonos como salida las matrices de estado, de modo que el sistema queda representado como (Nise, 2020)

donde es el vector de estado, es el vector de entradas, es la salida y , y son matrices de constantes. En un sistema expresado de ese modo, se pueden aplicar diversas estrategias de control lineal. El controlador por ubicación de polos fue diseñado en Matlab, y luego aplicado al modelo de 20Sim para probar su efectividad.

3. Resultados y discusión

3.1. MODELAMIENTO

Las restricciones cinemáticas son encontradas aplicando la relación fundamental de la cinemática entre el centro de masa del péndulo y el punto en la articulación, se obtiene que

donde y son las velocidades del centro de masa del péndulo en las direcciones y respectivamente, es la velocidad (horizontal) del carro y es la velocidad angular del péndulo, definida en el sentido antihorario, de modo que . Estas restricciones cinemáticas son incluidas en el modelo mediante una unión tipo 0 para construir la diferencia de flujos y mediante trasformadores modulados. Mediante piñones y una correa se transmite la energía del motor al mecanismo, se ha supuesto que la correa es inelástica y se han despreciado los efectos centrífugos de ésta, por lo cual se la ha modelado simplemente como un elemento inercial con flujo igual a la velocidad del carro. La relación de velocidades entre los piñones y la correa ha sido modelada mediante un transformador. Se ha utilizado un modelo clásico de un motor eléctrico de corriente continua, conformado por una resistencia, una inductancia y un girador en serie. Por simplicidad se considera una inductancia muy pequeña, la cual se toma como inexistente, y por tanto, . Esto implica que podemos quitar el elemento inercial del diagrama de enlaces. El diagrama de enlaces obtenido e ingresado a 20Sim se muestra en la Figura 2.

Figura 2. Diagrama de enlaces del sistema en 20Sim.

Inicialmente, se ha simulado el sistema sin controlador y con entrada nula, para ello se establecieron unas condiciones iniciales diferentes al punto de equilibrio vertical hacia arriba y se observó que efectivamente el sistema cae y se estabiliza en la posición vertical hacia abajo, en el punto de equilibrio estable. Para realizar estas simulaciones y las que veremos luego, del sistema controlado, se han utilizado los parámetros de la Tabla 1.

Tabla 1. Parámetros del sistema y sus valores.

SÍMBOLO	DESCRIPCIÓN	VALOR
	aceleración de la gravedad
	masa del carro
	masa del péndulo
	masa de la correa
	coeficiente de fricción
	longitud hasta el centro de masa del péndulo
	momento de inercia del péndulo (respecto al centro de masa)
	momento de inercia de los engranajes de la correa
	momento de inercia del engrane del motor
	radio de los engranes de la correa
	radio del engrane del motor
	inductancia del motor
	resistencia del motor
	constante del motor
	reducción del motor

3.2. LINEALIZACIÓN

Se llama punto de operación a cualquier conjunto particular de valores de las variables de estado y de las entradas, el punto de operación en el cual estamos interesados es el definido cuando el péndulo se encuentra vertical hacia arriba, todas las velocidades son cero y además la entrada es cero, es decir,

Este punto es también un punto de equilibrio, ya que si la entrada permanece constantemente nula, el sistema seguirá en ese estado (Williams y Lawrence, 2007). En general, una ecuación de estado tiene la forma

El diferencial de una función puede ser escrito como una combinación lineal de los diferenciales, por tanto

y podemos tomar la aproximación

donde , con , para , y para . El subíndice en las derivadas parciales indica que éstas son evaluadas en algún punto de operación .

El sistema es claramente no lineal, además que contiene bucles algebraicos, los cuales hacen que sea difícil obtener las ecuaciones dinámicas de manera manual para luego linealizarlas, por ello, se utilizó la herramienta que trae el software 20Sim de linealización. El software linealiza solo sistemas de una entrada una salida, por ello, se escogió alguna de las salidas de manera que el orden del sistema linealizado sea el mismo que el orden del sistema establecido en el diagrama de enlaces. Podría suceder que sean diferentes si la variable seleccionada como salida no dependiese de cierta variable de estado. Aquí se ha seleccionado como salida la posición del carro. Se han colocado las condiciones iniciales de manera que el sistema se encuentre en el punto de equilibrio señalado anteriormente. El proceso de linealización arrojo las siguientes matrices:

3.3. CONTROL

Se ha desarrollado un controlador por retroalimentación de estados mediante ubicación de polos. Si un sistema tiene la forma

se demuestra que el sistema en lazo cerrado tendría la forma

donde es una matriz de ganancias (Nise, 2020).

El controlador se ha diseñado con el software Matlab. Se ha verificado la controlabilidad del sistema, ésta debe ser igual al orden del sistema. Con la función place se realiza el proceso de ubicar los polos deseados encontrando el vector . El sistema controlado no tiene ganancia unitaria por lo cual, de ser necesario, se debe aplicar una pre - compensación. El controlador ha sido implementado en 20Sim y se muestra en la Figura 3.

El sistema ha sido simulado para entradas escalón obteniendo buenos resultados, en el sentido de que el sistema puede pasar de un punto de equilibrio a otro sin desestabilizarse y caer. En la Figura 4 se muestra el resultado de una de dichas simulaciones, se muestra la entrada, la posición del carro y la posición angular del péndulo. Adicionalmente, se ha desarrollado una animación 3D (solo del sistema multicuerpo) en 20Sim para una mejor visualización, esto se ve en la Figura 5. Aunque el controlador fue diseñado para una aproximación lineal, tuvo buen desempeño en la tarea, dentro de ciertos márgenes.

Figura 3. Diagrama de enlaces del sistema con controlador en 20Sim.

Figura 4. Simulación del sistema para entradas escalón.

Figura 5. Animación 3D del mecanismo en 20Sim.

3.4. DISCUSIÓN

La teoría de diagrama de enlaces ha permitido establecer con claridad un procedimiento, el cual puede ser automatizado, para el modelamiento de sistemas multidominio que incluyen cuerpos con movimiento plano. Para cualquier sistema multicuerpo, se necesitan tres elementos inerciales para su modelado, y en algunos casos menos, dependiendo de las restricciones de movimiento que tengan. La interacción entre los diversos elementos puede ser encontrada estableciendo las restricciones cinemáticas, las cuales son relaciones entre flujos, en este caso, velocidades lineales y angulares. Un adecuado planteamiento de las restricciones cinemáticas genera la coherencia necesaria en todas las ecuaciones, garantizando la conservación de la energía.

El uso de las analogías entre las ecuaciones fundamentales de la dinámica permite establecer con claridad la pertinencia del uso de los elementos inerciales. Entendiendo también que los cuerpos en movimiento plano almacenan energía cinética, la cual puede ser descompuesta en tres partes, correspondientes a los dos movimientos de translación y a un movimiento de rotación.

4. conclusión

Se estableció con claridad el procedimiento para modelar sistemas multicuerpo en el plano. Se parte de la asignación, en principio arbitraria, de los sentidos de las variables, se establecen tres elementos inerciales por cada cuerpo, y se establecen las restricciones cinemáticas. Las relaciones dinámicas son establecidas completamente por las restricciones cinemáticas, garantizando la congruencia de las demás ecuaciones. Esto tiene la ventaja de que el modelador no necesita estar al tanto de garantizar todas las ecuaciones. El método y el software permiten automatizar varios procedimientos de modelado, por ejemplo, la asignación de causalidad o la linealización, los cuales podrían también haberse hecho de manera manual.

El modelamiento de la parte mecánica se basa en las abstracciones de masa puntual y solido rígido, bajo estas consideraciones es posible modelar cualquier sistema multicuerpo. Adicionalmente, las articulaciones han sido consideradas como libres de fricción, en un escenario más realista puede incluirse un elemento resistor para modelarla. Aunque el modelamiento del movimiento tridimensional requeriría de muchos más elementos inerciales, la organización de estos seguiría los mismos principios que en el movimiento plano, pero también deben ser estudiadas con la finalidad de conocer la robustez del método y la complejidad en la solución de las ecuaciones diferenciales resultantes.

Aunque se ha utilizado un controlador sencillo en su arquitectura, este ha mostrado ser lo suficientemente bueno para este sistema inestable y medianamente complejo. Un controlador mas elaborado como un LQR podría mejorar algunas características del sistema controlado, aunque probablemente se tenga que utilizar un control no lineal si se requiere que el sistema abarque ángulos mayores sin desestabilizarse.

5. Lista de Referencias

Bradshaw, A., y Shao, J. (1996). Swing-up control of inverted pendulum systems. Robotica, 14(4), 397-405.

Borutzky, W. (2010). Bond Graph Methodology: Development and Analysis of Multidisciplinary Dynamic System Models. Springer.

Gausemeier, J., y Moehringer, S. (2003). New guideline Vdi 2206 - a flexible procedure model for the design of mechatronic systems. In DS 31: Proceedings of ICED 03, the 14th International Conference on Engineering Design, Stockholm.

Hasan, M., Saha, C., Rahman, M. M., Sarker, M. R. I., y Aditya, S. K. (2012). Balancing of an inverted pendulum using PD controller. Dhaka University Journal of Science, 60(1), 115-120.

Kafetzis, I., y Moysis, L. (2017). Inverted Pendulum: A system with innumerable applications. School of Mathematical Sciences.

Karnopp, D. C., Margolis, D. L., y Rosenberg, R. C. (2012). System dynamics: Modeling, simulation and control of mechatronic systems. Wiley.

Meriam, J. L., y Kraige, L. G. (2012). Engineering mechanics: Dynamics (Vol. 2). John Wiley & Sons.

Nise, N. S. (2020). Control systems engineering. John Wiley & Sons.

Siciliano, B., Sciavicco, L., Villani, L., y Oriolo, G. (2009). Robotics: Modelling, planning and control. Springer.

Williams, R. L., y Lawrence, D. A. (2007). Linear state-space control systems. John Wiley & Sons.