You are on page 1of 10

Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.

ISSN 0122-1701 32

Fecha de Recepcin: 24 de Enero de 2013
Fecha de Aceptacin: 29 de Abril de 2013
Balanceo y Estabilizacin del Pndulo Invertido
Empleando Redes Neuronales Artificiales y un
Regulador Lineal ptimo con Criterio Cuadrtico
(LQR)

Swing Up and Stabilization of Inverted Pendulum Using Artificial Neural Networks and
Optimal Linear Regulator with quadratic criterion (LQR)

Oscar Danilo Montoya Giraldo, J uan Guillermo Valenzuela Hernndez, Didier Giraldo Buitrago
Ingeniera elctrica, Universidad Tecnolgica de Pereira, Pereira, Colombia
odmont oya@ut p. edu. co
j gval enzuel a@ut p. edu. co
dgi r al do@ut p. edu. co


Resumen En este artculo se presenta el desarrollo de un
controlador para el pndulo invertido, basado en
realimentacin de las variables de estado para la zona de
equilibrio a partir de un regulador lineal ptimo con criterio
cuadrtico y un modelo de energa como esquema de
aprendizaje para la implementacin de un control inteligente
empleando redes neuronales artificiales a travs del modelo
inverso. Se presenta la integracin de los controladores y las
pruebas realizadas para el balanceo y la estabilizacin del
sistema fsico.

Palabras clave Control inteligente, Pndulo invertido, Redes
neuronales artificiales, Regulador lineal ptimo con criterio
cuadrtico.

Abstract This paper presents the development of a state
variable feedback controller to inverted pendulum for the
equilibrium zone Using a linear quadratic regulator and a
model of energy and learning scheme for implementing
intelligent control using artificial neural networks through the
inverse model. It is presented the integration of the controllers
and testing drivers for balancing and stabilizing of the
physical system.

Key Word Intelligent control, inverted pendulum, artificial
neural networks, optimal linear regulator with quadratic
criterion

I. INTRODUCCIN

El desarrollo de controladores es una constante en el
mundo de la investigacin cientfica, mxime cuando el
crecimiento econmico de los pases junto con la
globalizacin de los mercados son los motores que
impulsan en gran medida avance de las empresas, haciendo
necesaria la expansin y automatizacin de los procesos
industriales, con el fin de lograr competitividad y as
enfrentar en forma adecuada los retos que impone el crecimiento
socioeconmico de los pases [7].

As pues, desarrollar controladores que operen adecuadamente
ante sistemas fsicos lineales y no lineales, presentes en los
procesos productivos, es un reto al cual todo investigador est
abocado, ms cuando se pretende realizar una integracin de la
industria con el mundo acadmico, y de esta forma lograr
desarrollos e investigaciones que vayan en pro del avance de la
industria, la academia y el pas.

La razn por la cual el sistema fsico pndulo invertido es tan
empleado por los investigadores para probar y desarrollar
controladores, es su dinmica no lineal, que permite comprender
los fenmenos y comportamientos fsicos de plantas y equipos
presentes en el mundo industrial y que son de caractersticas
similares, como es el caso del sector de trasportes, las
telecomunicaciones y la aeronutica, entre otros; con lo que los
controladores desarrollados para los sistemas pendulares son
fcilmente adaptables a este tipo de sistemas fsicos [1-2] [5].

En la seccin II de este artculo se presenta una descripcin
general del pndulo invertido y se realiza el modelado global del
sistema fsico empleando la mecnica de Newton. En la seccin
III se desarrolla un controlador para la estabilizacin en la zona
de equilibrio utilizando regulador lineal ptimo con criterio
cuadrtico. En la seccin IV se describe modelo simplificado
basado en funciones de energa para obtener el balanceo del
pndulo invertido. En la seccin V se presenta la red neuronal
artificial y un modelo inverso como alternativa de control para el
swing up. En la seccin VI se presenta la integracin del
controlador inteligente y el controlador para la zona de
equilibrio. En la seccin VII se presentan las simulaciones y
pruebas realizadas al modelo representativo del pndulo
invertido.


Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.

33
II. MODELO MATEMTICO PARA EL
PNDULO INVERTIDO

A. Descripcin del sistema fsico

El sistema fsico conocido como pndulo invertido simple
hace parte del conjunto de sistemas dinmicos pendulares
que han sido estudiados desde la dcada de los 60s, por
sus caractersticas no lineales que imponen un desafo
notable para las tcnicas clsicas de control. De la familia
de sistemas pendulares que han sido objeto de mltiples
investigaciones se pueden destacar los siguientes modelos:
pndulo invertido, pndulo de Furuta, pndulo con rueda
de reaccin y pendubot [1] [7].

Sin embargo, el desarrollo de este sistema de control ser
realizado usando como sistema dinmico al pndulo
invertido, que se compone de un vehculo (carro) que tiene
la funcin de balancear el pndulo, el cual puede moverse
en nica dimensin y cuyo movimiento est gobernado por
un motor DC (actuador) localizado en uno de los extremos
de la barra horizontal y que est adherido al carro por
medio de un engranaje y una banda de conexin. Sujeto al
vehculo se encuentra la barra pendular que en estado de
reposo se encuentra en la posicin vertical inferior y que se
conoce como estado natural. La figura 1 muestra en forma
grfica el sistema fsico pndulo invertido [6].

Figura 1. Representacin del sistema dinmico pndulo
invertido simple.

La figura 1 muestra el diagrama de cuerpo libre del
pndulo invertido con sus respectivas variables y
parmetros asociados a la dinmica del sistema.

B. Modelado matemtico de la planta

El modelo matemtico del sistema pndulo invertido se
obtiene a travs de la aplicacin de la segunda ley de
Newton a cada uno de los elementos que componen el sistema
(carro y pndulo) y la suma de momentos en el punto de apoyo o
conexin; con lo que se tiene el conjunto de ecuaciones (1)-(4)
que describen la dinmica del sistema:
2
2 r
d x
H u F M
dt
=
( ) 1
( )
2
2
sin
d
H m x L
dt
= +

( ) 2
( )
2
2
cos
d
V mg m L
dt
= +

( ) 3
2
2
sin cos
p
d
VL HL D J
dt

=

( ) 4

Donde:

Parmetro Descripcin
M
Masa del carro
m Masa de la barra
L
Longitud desde el apoyo hasta el centroide de la
barra
J
Momento de inercia de la barra
r
F
Friccin de los rodamientos del carro
( )
r c
F f x =
p
D
Friccin rotacional de la barra
( )
p p
D f =

Tabla 1. Parmetros fsicos del pndulo de Furuta.

Eliminando las fuerzas de reaccin H y V y haciendo las
respectivas derivadas, se obtienen las ecuaciones (5) y (6) que
corresponden al modelo no lineal del pndulo invertido [6].

( )
2
sin cos 0
p
mgL J ML mLx f + + = ( ) 5
( )
2
cos sin
c
M m x mL mL f x u + + + = ( ) 6

C. Linealizacin del modelo alrededor del punto de
operacin

Considerando que en la regin prxima a la posicin vertical
superior o punto de equilibrio inestable, el modelo dinmico
presentado en (5) y (6) puede ser linealizado bajo las siguientes
consideraciones:
2
cos 1 , sin , 0 ~ ~ ~

El conjunto de ecuaciones (7) y (8) representa el modelo
matemtico linealizado del pndulo invertido [6].

( )
2
0
p
J ML mLx f mgL + + = ( ) 7
( )
c
M m x mL f x u + + + = ( ) 8
Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.


34
Para obtener una representacin de (7) y (8) como un
sistema de ecuaciones diferenciales de primer orden se
definen las variables de estado como:
1
x posicin del
carro,
2
x posicin angular del pndulo,
3
x velocidad del
carro y
4
x velocidad angular del pndulo [6].

Realizando una representacin matricial del conjunto de
ecuaciones que representan la dinmica lineal del sistema
fsico empleando variables de estado se tienen las
ecuaciones (9) y (10) [2] [6].

( ) d x
A x B u
dt
o
o o = +
( ) 9
y C x D u o o = +
( ) 10

Las matrices de relacin A, B , C y D son
determinadas como se muestra en (11) y (12).

0 0 1 0
0 0 0 1
0
1 1 1
0
1 1 1
A
c | o

c | o

(
(
(
(
=
(

(
(

(






( ) 11
T
0
1 0
0
0 1 0
, ,
0 0 0 1
0 0
1
B C D
o

(
(
(
(
(
( (
(
= = =
( (
(

(
(
(






( ) 12
Donde las letras griegas o , | , , , c y o estn
definidas en funcin de los parmetros fsicos de la planta
y se calculan como:

1
M m
o =
+

mL
M m
=
+

2
mgL
J mL
c =
+

c
f
M m
| =
+

2
mL
J mL
=
+

2
p
f
J mL
o =
+


III. REGULADOR LINEAL PTIMO CON
CRITERIO CUADRTICO (LQR)

Para un sistema fsico definido en espacio de estados como
se present en las ecuaciones (7) y (8) es posible
determinar las ganancias de realimentacin considerando
algunos criterios de optimizacin, tales como la ubicacin de
polos y magnitudes mximas permisibles en la seal de control y
las variables de estado; razn por la cual es necesario formular
un problema de optimizacin que tenga en cuenta la rapidez de
convergencia al estado cero y en general las restricciones fsicas
de los elementos a controlar. Uno de los criterios de
optimizacin ms ampliamente empleado en la literatura es el
denominado criterio de la integral cuadrtica, ya que presenta
excelente resultados y su concepcin matemtica es fcil de
entender [2] [8].

A. Formulacin general del LQR

Considerando el modelo de espacio de estados definido en (7) y
(8), en el cual se supone que la matriz de controlabilidad
o
C es
de rango n , se plantea la integral cuadrtica dada por la
ecuacin (13).

( ) ( ) ( )
0
1 1
2 2
f
t
T T T T
L f f
t
J x t Px t x Qx u Ru dt = + +
}


( ) 13

La ecuacin (13) puede ser simplificada si se considera que
f
t , entonces el estado
( )
0
f
x t para sistemas de
regulacin. Con estas simplificaciones se obtiene (14) que es
conocida como la funcin de costo [8].
Donde Q y R son matrices de ( ) * n n y ( ) * m m definidas
positivas, con n el nmero de estados y m el nmero de
entradas.
( )
0
1
2
f
t
T T
L
t
J x Qx u Ru dt = +
}


( ) 14
La cantidad
T
x Qx es una medida de la desviacin del estado,
con respecto al estado cero en un tiempo t y
T
u Ru es una
medida del esfuerzo de la seal de control en el mismo tiempo;
la integral obtiene como resultado el acumulado de las medidas
anteriores.

Las matrices Q y R son definidas por el diseador en forma
emprica y cuyos elementos deben ser positivos o cero. En
general, el diseo de un controlador LQR ptimo, depende de la
habilidad en la minimizacin de la funcin de costo dada en
(14), lo cual supone que para tener un mayor grado de fidelidad
con respecto a los requerimientos del sistema, es necesario un
mayor conocimiento del sistema bajo estudio [2] [8].


B. Reformulacin del espacio de estados para seguimiento
de referencia con ganancia integral

Para el sistema definido en espacio de estados dado por las
ecuaciones (7) y (8), es posible definir una ley de control que
Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.

35
permita seguimiento de referencia para una de las variables
de estado que lo permita y regular el resto del sistema. La
figura 2 muestra un esquema de control en lazo cerrado
para la planta con la posibilidad de seguimiento de
referencia [3] [10].

Figura 2. Esquema de control en lazo cerrado.

Del diagrama de bloques presentado en la figura 2, es
posible determinar el conjunto de ecuaciones que logran
regulacin y seguimiento de referencia para el sistema
fsico pndulo invertido, siempre que sea posible seguir
una seal de referencia [10].

Sea el espacio de estados redefinido en (15) y (16), con
una seal de control dada por (17) y un error que se puede
determinar a partir de (18).

x Ax Bu = +
( ) 15
r
y C x =
( ) 16
I
u Kx K = +
( ) 17
r
r y r C x = =

( ) 18

Donde
r
C es la fila de la matriz C correspondiente a la
variable de estado que permite realizar seguimiento de
referencia. As las variables de estado para el nuevo
sistema podrn ser reescritas como:

e
e Ae Bu = +

( ) 19
e
u Ke =

( ) 20
Con el siguiente conjunto de matrices y vectores
ampliados.

0
0
A
A
C
(
=
(


0
B
B
(
=
(

,
x
e

(
=
(


| |
I
K K K =

| | 1 0 0 0
r
C =


C. Clculo de la ganancia de realimentacin K

y la
ecuacin de Riccati

Definiendo la ley de control ptima como (21) para el
sistema de espacio de estados dado en (19) y teniendo en
cuenta que la ganancia de realimentacin ( ) K t

para un
controlador LQR tiene la forma (22), es posible encontrar la
ganancia de realimentacin mediante el previo conocimiento de
la matriz ( ) P t , cuya solucin se determina resolviendo la
ecuacin diferencial matricial de Riccati dada en (23).

( ) ( ) ( )
e
u t K t e t =

( ) 21
( ) ( )
1 T
K t R B P t

=

( ) 22
1
0
T T
P PA PBR B P Q A P

+ + + =

( ) 23

Si para la ecuacin (23), las matrices A

, B

, Q y R , son
independientes del tiempo y
f
t , entonces 0 P =

, con lo
que la ecuacin diferencial matricial de Riccati se convierte en
la ecuacin algebraica de Riccati, como se muestra en (24).

1
0
T T
PA PBR B P Q A P

+ + =

( ) 24

Al resolver la ecuacin algebraica de Riccati, es posible
encontrar la ganancia de realimentacin K

, que ser ms o
menos ptima en la medida que las matrices Q y R , hayan
sido bien escogidas por el diseador [2] [8].

IV. MODELO SIMPLIFICADO DEL PNDULO PARA
SWING UP

A. Funcin de energa y seal de control para la lograr el
swing up del pndulo

Dado que las variables de estado en modelos matemticos
linealizados solo pueden realizar acciones de control en regiones
muy cercanas al punto de equilibrio, ser necesario realizar una
maniobra de control que permita llegar a zonas muy cercanas al
punto de equilibrio inestable. Con este fin es necesario definir
una funcin que permita la regulacin de energa en la planta,
hasta alcanzar as un valor energtico deseado y que se define a
partir de los requerimientos del control. La primera aplicacin
de esta metodologa fue mostrada en 1996 por Astrom y Furuta
[2], y an hoy en da por su eficiencia sigue siendo ampliamente
implementada [7].

En la figura 3, se considera un modelo simplificado del pndulo
donde se desprecia la friccin en el punto de pivote.
Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.


36


Figura 3. Esquema simplificado del pndulo invertido.

Realizando una descomposicin de fuerzas sobre los ejes
coordenados y suponiendo que la entrada activa del
sistema, es la aceleracin ( ) u en el punto de pivote, se
hallan las ecuaciones (25) y (26).

( )
2
sin
y
d
F H m y l
dt
u = = +



( ) 25

( )
2
cos
z
d
F V mg m l
dt
u = =



( ) 26


Aplicando una suma de momentos alrededor del centro de
masa del pndulo se obtiene la ecuacin (27).

sin cos
cm
M Vl Hl I u u u = =


( ) 27

Con una combinacin lineal de las ecuaciones (25), (26) y
(27), y definiendo como
2
p
J I ml = + y u y = , se
obtiene la ecuacin diferencial de segundo orden (28) para
el modelo simplificado del pndulo. [7]

cos sin 0
p
J mlu mgl u u u + =

( ) 28

La expresin correspondiente a la energa del pndulo
invertido se define como cero en la posicin vertical
superior ( 0) u = y para una seal de control nula, es decir,
0 u = como se observa en la ecuacin (29).

( )
2
1
cos 1
2
p
E J mgl u u = +


( ) 29


De (29) es evidente que para llevar el pndulo a la posicin
vertical superior, es necesario que la posicin y velocidad
angular del eslabn pendular sean cero [7].

La influencia de una seal de control ( ) u , en el
comportamiento energtico de la planta se puede notar, al
diferenciar con respecto al tiempo la ecuacin (29),
obtenindose como resultado (30).

sin cos
p
dE
J mgl mgu
dt
uu u u u u = + =


( ) 30


Al observar (29), es posible inferir que una variacin en la seal
de control, tendr repercusin directa sobre la energa de la
planta, sin embargo, existen dos condiciones que son ajenas a
este comportamiento, y se presentan cuando 0 u =

y
2
t
u = ,
condiciones para las cuales no existe seal de control que
influencie la variacin energtica, pero no son crticos, ya que la
planta solo estar all por un lapso de tiempo muy corto [2].

Es posible mediante la aplicacin de la teora desarrollada por el
matemtico y fsico Ruso Aleksandr Lyapunov encontrar una
seal de control que permita llevar la funcin correspondiente a
la posicin del pndulo a una regin de operacin deseada; lo
que en consecuencia tiene como un posible resultado la ley de
control (31).
( ) ( )
0
cos u k E E sign u u =

( ) 31

Donde la funcin ( ) sign x representa la direccin que debe ser
implementada para llevar la funcin de energa al valor deseado
y k es un parmetro de diseo [2] [7].

Con el fin de asociar la aceleracin del carro con el voltaje
aplicado en los terminales del motor DC, se define ley de control
(32) que relaciona la tensin DC aplicada al motor con la
aceleracin del carro.
*
t
k
v u
R r
=
( ) 32


Donde
t
k es la constante de torque del motor, R es la
resistencia de los bobinados del motor y r es la relacin de
acople entre el eje del actuador y la banda.

V. REDES NEURONALES ARTIFICIALES

Las redes neuronales artificiales son una herramienta de control
que ha estado presente desde hace ms de tres dcadas, por su
habilidad de aprender del entorno que la rodea y su capacidad de
generalizacin, es decir, que no requieren que la tarea de control
sea programada sino que a partir del aprendizaje guiado es capaz
de realizar tareas y acciones para las que no haban sido
Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.

37
preparadas, y esto es gracias las redes neuronales
artificiales que tienen la capacidad de aprender de la
experiencia tal y como sucede con las redes neuronales de
los seres vivos [2] [9].

Las redes neuronales biolgicas estn constituidas por tres
partes principales: dendritas, cuerpo de la clula o soma y
axn. Las dendritas son fibras nerviosas que se encargan de
recibir las seales elctricas para luego conducirlas al
soma, el cual cumple la funcin de acumular estas seales
de entrada para luego transferirlas al axn que finalmente
las entregar a las neuronas adyacentes. El punto de
contacto entre el axn de una neurona y una dendrita de
otra es conocido como sinapsis [11].

A partir de las caractersticas de una red neuronal biolgica
se plantea el modelo equivalente para la red neuronal
artificial, la cual est constituida principalmente por un
vector de entradas
i
p que representa las seales que
provienen de otras neuronas y que son capturadas por las
dendritas, una matriz de pesos
i
W que representan la
intensidad de la sinapsis que conecta dos neuronas y una
funcin suma que representa la funcin umbral que la
neurona debe sobrepasar para activarse. ste ltimo
proceso ocurre en el cuerpo de la clula [2].


Figura 4. Representacin de una red neuronal artificial de
una sola capa, con mltiples entradas y s neuronas.

En la figura 4, se puede observar la representacin de una
red neuronal artificial de una sola capa, con mltiples
entradas y neuronas, donde b es una ganancia escalar que
refuerza la salida del sumador n , este ltimo representa la
salida neta de la red neuronal. La salida total a est
determinada por la funcin de transferencia f la cual
puede ser una funcin lineal o no lineal de n , y es
escogida dependiendo de las especificaciones del problema
que la neurona tenga que resolver [2] [4].


A. Redes neuronales artificiales multicapa

Este tipo de topologas se desarrolla a partir de la conexin en
cascada de un conjunto de capas de que contienen a su vez
conjuntos de redes neuronales con funciones de transferencia
propias y que son seleccionadas segn las caractersticas del
problema tratado. Es de notar que las salidas de la primera capa
son las entradas de la segunda capa y las salidas de la segunda
capa son las entradas de la tercera capa y as sucesivamente [11].

Al final del proceso se tendr una red acoplada en la cual la
salida resultante depende de las entradas externas y de cada una
de las capas que conforman la red neuronal artificial como se
muestra en la figura 5.


Figura 5. Red neuronal artificial de tres capas.

B. Red neuronal Backpropagation

La red Backpropagation trabaja bajo aprendizaje supervisado, es
decir, sta necesita conocer la salida que se desea obtener. Una
vez aplicado un estmulo a la entrada de la red, ste se propaga
capa por capa hasta generar una salida. La seal de salida
obtenida se compara con la salida deseada calculando as una
seal de error para cada componente de la salida total [9] [11].

Una vez determinada dicha seal de error, sta se propaga hacia
atrs desde la salida, a travs de todas las capas, hasta que todas
las neuronas hayan recibido la seal de error que describe su
contribucin a la seal de error total. Basndose en la
minimizacin del error medio cuadrtico, el algoritmo
Backpropagation actualiza los valores de las ganancias y de los
pesos con el fin de que la red converja hacia un estado que le
permita aprender los patrones de entrenamiento [2] [9].

C. Modelo inverso de aprendizaje

El modelo inverso de aprendizaje es uno de los mecanismos que
se emplea para realizar el entrenamiento de una red neuronal
artificial, en donde las salidas de la planta se constituyen en las
entradas del modelo y la seal de control dada por la ley de
control (31) se considera el objetivo de aprendizaje para la red
neuronal artificial [4]; una representacin tpica del modelo
inverso de aprendizaje para redes neuronales y controladores
inteligentes, es la que se observa en la figura 6.
Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.


38

Figura 6. Esquema de aprendizaje supervisado empleando
el modelo inverso.

VI. INTEGRACIN DEL CONTROLADOR LQR Y
LA RED NEURONAL ARTIFICIAL

Con el fin de realizar la integracin de los controladores, es
necesario definir todos los parmetros asociados al sistema
fsico pndulo invertido simple y los controladores
desarrollados.

A. Parmetros fsicos del sistema pndulo invertido y
matrices del controlador LQR

Parmetro Valor Unidades (SI)
Masa del carro ( M )
1.12 kg
Masa del pndulo ( m) 0.12 kg
Gravedad ( g )
9,80665 m/s
Momento de inercia ( J ) 0,0136 Kg*m
Coeficiente de friccin (
c
f ) 0.05 N*s/m
Coeficiente de friccin
rotacional (
p
f )
0.007 Kg*m/rad*s
Distancia del eje de rotacin al
centro de masa ( L )
0.3434 m
Lmites del riel (Longitud de
desplazamiento del carro)
0.50 m

Tabla 2. Parmetros del sistema fsico pndulo invertido
simple.

Los parmetros del sistema dinmico pndulo invertido con
los que se realizan las pruebas y simulaciones se
encuentran en la tabla 2 y corresponden a los datos del
modelo del pndulo de invertido simple disponible en el
Laboratorio de Investigacin en Sistemas Control de la
Universidad Tecnolgica de Pereira [6].

B. Matrices del control lineal ptimo con criterio
cuadrtico (LQR)

Una vez determinadas las matrices que corresponde al
modelo de espacio de estados ampliado definido por el
conjunto de ecuaciones (15)-(18) con los datos de la tabla 2, se
realiza la seleccin de las matrices Q y R segn los
requerimientos del sistema fsico bajo estudio, teniendo especial
cuidado en que la seal de control generada presente
comportamientos dentro de un rango aceptable [1]. As
[650 100 20 10 100] Q diag = y [1] R = .
Una vez se definen las matrices Q y R se resuelve la ecuacin
algebraica de Riccati dada en (24) y se hallan los valores de las
ganancias de realimentacin definidas en la ecuacin (22).
Hecho esto, se obtienen las ganancias de realimentacin:
[35.483 30.810 207.942 55.856 10.000] K =

.

C. Parmetros de ajuste para el controlador con funcin de
energa para swing up

Para la ley de control (31), como se mencion anteriormente es
necesario definir algunos parmetros de diseo que hacen parte
de la implementacin de la ley de control, tales como el
parmetro k y la energa de referencia
0
E .
Despus de haber realizado mltiples pruebas variando estos
factores, se encontr que para el sistema dinmico pndulo
invertido los factores ms adecuados son 9 k = y
0
0.05 E = .

D. Obtencin de los datos para el entrenamiento de la red
neuronal artificial

Figura 7. Diagrama de bloques para el control del pndulo
invertido.

Para realizar la implementacin del controlador inteligente por
medio del modelo inverso para balanceo del pndulo, se
implement el controlador usando el modelo para regulacin
energa definido por las ecuaciones (29) y (31) y el regulador
lineal ptimo con criterio cuadrtico como se muestra en el
diagrama de bloques de la figura 7.

Una vez implementando el controlador en lazo cerrado para el
sistema dinmico, es necesario extraer la informacin de entrada
para el modelo inverso de aprendizaje para las redes neuronales
que se mostr en la figura 6. La informacin de entrada para el
entrenamiento de la red neuronal artificial backpropagation son
la posicin y velocidad angular del pndulo, as como la seal de
control definida por las funciones de energa, con la cual se
logra el balanceo del sistema [2].
Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.

39

La figuras 8 y 9 muestran el comportamiento dinmico del
sistema y los datos de inters para el entrenamiento de la
red neuronal artificial.

Figura 8. Posicin y velocidad angular del pndulo en
funcin del tiempo.

Figura 9. Seal de control para balanceo de sistema.

Los datos necesarios para el entrenamiento de la red
neuronal artificial son aquellos que corresponden a la zona
de balance o donde acta la seal de control definida en
(31) y terminan cuando las variables de estado mostradas
en la figura 8 alcanzan el estado de regulacin, es decir,
tienden a cero y esto sucede alrededor de los 20s tiempo
para el cual entra en operacin el controlador LQR.

E. Entrenamiento de la red neuronal artificial
backpropagation

Se implementa una red neuronal artificial de tres capas y su
entrenamiento se realiza empleando el software
MATLAB. La primera capa consta de dos neuronas y una
funcin de transferencia tipo tansig (tangente sigmoidal), la
segunda capa est compuesta por 10 neuronas e igual
funcin de transferencia que la anterior capa, finalmente la
tercera capa o capa de salida se compone de una neurona y
una funcin de transferencia tipo logsig (sigmoidal
logartmico).
Para su entrenamiento se emple el algoritmo de
entrenamiento Levenberg Marquardt y a travs de la
minimizacin del error medio cuadrtico [2] [9].

La figura 10 permite observar la interconexin entre las tres
capas que conforman la red neuronal artificial y la figura 11
muestra el diagrama de bloques con la red neuronal
implementada, que es la encargada de realizar el balanceo del
sistema, hasta llegar al punto de equilibrio en la posicin vertical
superior.


Figura 10. Interconexin de las capas en la red neuronal
backpropagation.

Figura 11. Diagrama de bloques para el control del pndulo
invertido con red neuronal artificial y control LQR.

VII. RESULTADOS

Esta seccin presenta las simulaciones correspondientes al
diseo del controlador empleando redes neuronales artificiales y
un regulador lineal ptimo con criterio cuadrtico (LQR). Para
este propsito se utiliz MATLAB 2010a en un computador
Intel Celeron, sistema operativo Windows 7 y 2GB RAM.

A. Operacin integrada del controlador LQR y la red
neuronal artificial.

Una vez realizado el entrenamiento de la red neuronal artificial e
integrados los controladores, tal y como se observ en el
diagrama de bloques de la figura 11, se realizaron las pruebas
para verificar del comportamiento de la red neuronal artificial y
el acople con el regulador lineal cuadrtico a travs del arranque
del modelo representativo del pndulo invertido desde la
posicin vertical inferior o de equilibrio natural, hasta el punto
de equilibrio inestable en la posicin vertical superior.

La figura 12 muestra la evolucin de la seal de control y las
figuras 13 y 14 presentan el comportamiento de las variables de
estado correspondientes a la posicin del carro y del pndulo,
respectivamente.
Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.


40

Figura 12. Seal de control global para el balanceo y
estabilizacin del pndulo invertido simple.

En la figura 12 se puede observar que la seal alrededor de
cero corresponde a la seal de control enviada por la red
neuronal durante el periodo de balanceo del pndulo y que
el pico observado alrededor de los 18s sucede en el
momento en que se conmutan los controladores y entra en
operacin el LQR.

Figura 13. Comportamiento de la variable de estado
correspondiente a la posicin del carro en el riel.

La figura 13 muestra claramente que la posicin del carro
est en los lmites operativos del sistema y es considerada
una condicin inicial diferente de cero.


Figura 14. Posicin angular del pndulo en funcin del
tiempo.

Finalmente la figura 14 muestra el comportamiento de la barra
pendular desde su posicin de equilibrio natural hasta el punto
de operacin y se puede ver que la red neuronal artificial lleva el
pndulo al estado deseado en un tiempo muy similar al mostrado
en la figura 8 que se obtuvo con el controlador basado en
funciones de energa de la figura 7.

B. Perturbacin en la seal de control y seguimiento de
referencia

Es comn encontrar alteraciones en la seal de control debido a
ruidos externos o alteraciones en los sensores, es por esto que es
necesario realizar pruebas para observar el comportamiento del
sistema ante alteraciones aleatorias de la seal de control y
adicional a esto se puede considerar un estado en el cual una de
las variables de estado permita seguir una referencia en la regin
de operacin lineal (posicin vertical superior), mientras las
otras siguen en el estado de regulacin.

Figura 15. Seal de control con perturbaciones.

La figura 15 presenta la seal de control para seguimiento de
referencia incluyendo perturbaciones de tipo pulso en diferentes
intervalos de tiempo. Las figura 16 muestra el comportamiento
de la posicin del carro ante seguimiento de referencia tipo
escaln y las variaciones asociadas a las perturbaciones en la
seal de control y la figura 17 presenta la posicin del pndulo y
las pequeas variaciones asociadas al seguimiento de referencia
y las perturbaciones.


Figura 16. Comportamiento de la variable de estado
correspondiente a la posicin del carro en el riel.

Scientia et Technica Ao XVIII, Vol. 18, No 1, Abril de 2013. Universidad Tecnolgica de Pereira.

41
Las alteraciones de la figura 16 cuando llega al estado de
equilibrio se deben a las perturbaciones de la seal de
control que varan la posicin del carro ya que la prioridad
es mantener el pndulo en la posicin vertical superior.

Figura 17. Posicin angular del pndulo ante
perturbaciones en la seal de control y seguimiento de
referencia.

Finalmente la figura 17 permite observar como el pndulo
permanece en la zona de equilibrio inestable a pesar de que
existen perturbaciones en la seal de control y adicional a
esto la posicin del carro no es fija dado que se encuentra
siguiendo una referencia tipo escaln.


VIII. CONCLUSIONES

Se desarroll un modelo matemtico del pndulo invertido
considerando fricciones entre las superficies de contacto, se
obtiene un modelo de espacio de estados con base en las
ecuaciones que definen la dinmica global del sistema
alrededor del punto de operacin en la posicin vertical
superior y se presenta un modelo de energa simplificado
para realizar un controlador de swing up basado en
funciones de energa.

La tcnica de control por realimentacin de las variables de
estado empleando un regulador lineal ptimo con criterio
cuadrtico (LQR) adaptado para seguimiento de referencia
mostr ser eficiente y capaz de realizar con xito la tarea de
control sin grandes esfuerzos en la seal de control.

Se implement una red neuronal artificial multicapa capaz
de aprender un comportamiento tpico de patrones a travs
del modelo inverso de aprendizaje, la cual present un
comportamiento eficiente al ser comparado con el modelo
gua logrando realizar la tarea de control sin mayores
dificultades.

La integracin de dos controladores de diferente naturaleza
para formar un controlador global de caractersticas
hbridas muestra ser una alternativa exitosa y eficiente para
el control de sistemas dinmicos no lineales.

REFERENCIAS

[1] F. Castaos, and R. Carreras. Levantamiento y control
de un pndulo invertido con un esquema de control,
reconfigurable, XI Congreso Latinoamericano de
Control Automtico, May, 2004.

[2] L. F. Escobar and O. D. Montoya, Control hbrido del
pndulo de Furuta, Bsc. Disertation. Dept. Elec. Eng.
Univ. Tecnolgica de Pereira, Mar, 2012.

[3] C. A. Sanabria, and O. M. Hernndez. Control de un
pndulo invertido simple por mtodos de
realimentacin de estados, Revista Conciencias, Sep,
2009.

[4] V. A. Rodrguez-Toro, J. E. Garzn, and J. A. Lpez,
Control neuronal por modelo inverso de un sistema
usando algoritmos de aprendizaje Levenberg
Marquardt y Bayesiano, VIII Congreso de la
Asociacin Colombiana de Automtica, Univ.
Tecnolgica de Bolvar, Apr, 2009.

[5] J. Aracil, and F. Gordillo, El pndulo invertido: un
desafo para el control no lineal, Revista
Iberoamericana de Automtica e Informtica
Industrial, vol. 2, a. 8-19, Apr, 2005.

[6] C. A. Saldarriaga, and J. D. Henao Identificacin de
parmetros y control de um pndulo invertido, Bsc.
disertation. Dept. Elec. Eng. Univ. Tecnolgica de
Pereira, 2009.

[7] O. D. Montoya, J. G. Valenzuela, and D. Giraldo
Control global del Pndulo Rotacional Invertido
empleando modelos de energa Revista Scientia et
Technica, No. 52, Dec, 2012.

[8] S. A. Menndez, Aportacin al control del convertidor
CC/CA de tres niveles Ph.D thesis, Univ. Politnica
de Catalunya. Nov, 2004.

[9] C. Vieira, Realizao de um controlador utilizando
Redes Neurais para o controle de estabilizao do
Pndulo de Furuta, Bsc. Disertation. Dept. Tec. Univ.
Federal de Amazonas, 2010.

[10] M. M. Juan, Control lineal y no lineal de un levitador
magntico, Bsc. Disertation, Univ. Politnica de
Catalunya. 2010.

[11] M. I. Acosta and C. A. Zuluaga, Tutorial sobre redes
neuronales aplicadas en ingeniera Dept. Elec. Eng.
Univ. Tecnolgica de Pereira, 2000.

You might also like