Professional Documents
Culture Documents
Control de sistemas
no lineales basado en la
estructura hamiltoniana
por
Fabio G
omez-Estern Aguilar
Ingeniero de Telecomunicacion por la Escuela Superior de Ingenieros
de la Universidad de Sevilla
Presentada en la
Escuela Superior de Ingenieros
de la
Universidad de Sevilla
para la obtencion del
Grado de Doctor Ingeniero de Telecomunicaci
on
TESIS DOCTORAL
Control de sistemas
no lineales basado en la
estructura hamiltoniana
Agradecimientos
Ante todo, expresar mi gratitud a mis padres cuyo cari
no y apoyo incondicional, han
resultado imprescindibles para llevar a termino esta ambiciosa tarea.
Estoy igualmente agradecido a Javier Aracil, mi primer director por sus muchas sugerencias y apoyo constante durante esta investigacion. Su imaginacion, sabidura y dedicacion lo hacen indiscutible merecedor del prestigio del que disfruta.
Al codirector de esta tesis, Francisco Gordillo, le debo la dedicacion, su compromiso
con la calidad y la puesta al servicio del trabajo com
un de sus solidos conocimientos en
nuestra area en la difcil preparacion de los artculos que contribuyeron a esta tesis.
El profesor Romeo Ortega manifesto su interes por nuestro trabajo y la posibilidad de
abrir un lnea com
un de investigacion entre su grupo frances de Supelec y el sevillano, que
ha dado sus frutos y continuara haciendolo en el futuro. Es un honor para m el haber
sido coautor con el de una serie de artculos.
Estoy igualmente agradecido al profesor Francisco Rodrguez Rubio por su decisiva
contribucion al inicio y desarrollo de esta tesis, as como la ejemplar gestion de los proyectos en los que se enmarca el presente trabajo.
Por sus sugerencias y colaboracion, me siento en deuda con Enrique Ponce, Mark W.
Spong, Antonio Barreiro, Hugo Rodrguez, Carlos Perez, Daro Becares, Ismael Alcala,
Miguel Pe
na, Kurt Schlacher, Jose Angel Acosta, Guido Blankestein, Cesareo Raim
undez,
Manolo Lopez, Miguel Angel G. Cordones, Oscar Collazo, Gregory Potel, Jorge Chavez,
Wolfgang Mitterbaur, y los anonimos revisores que intervinieron en las publicaciones
relacionadas con la tesis; todos ellos investigadores de primera lnea.
Por u
ltimo hare constar mi cari
no y gratitud por su apoyo y comprension a los siguientes: Cesar Saiz, Pedro Montes, Agustn Martnez, Rafael Garca, Ivan Gonzalez, Olga
Puente, Javi Reig, Teresa Cruz, y los amigos injustamente omitidos, en recuerdo de los
buenos momentos compartidos.
El presente trabajo ha sido nanciado parcialmente por el Ministerio de Ciencia y
Tecnologa espa
nol bajo los programas FEDER y PICASSO. Igualmente ha recibido nanciacion para las estancias del doctorando en el Laboratoire de Signaux et Systemes,
Supelec, por parte del Centre National de la Recherche Scientique frances.
Sevilla
Septiembre de 2002
Indice General
Glosario
Resumen
1 Introducci
on
1.1
Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2
Motivacion y objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3
1.4
1.5
1.5.1
1.5.2
1.5.3
1.5.4
Comportamiento transitorio . . . . . . . . . . . . . . . . . . . . . . 15
1.5.5
1.6
Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 Fundamentos te
oricos y estado de la t
ecnica
19
2.1
Sistemas electromecanicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2
Sistemas de EulerLagrange . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3
Sistemas hamiltonianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1
2.3.2
Hamiltoniano y energa . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4
2.5
INDICE GENERAL
ii
2.6
2.7
Pasividad y disipatividad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.1
Estabilidad Lq
2.6.2
Pasividad y ganancia L2 . . . . . . . . . . . . . . . . . . . . . . . . 29
2.6.3
2.6.4
Atenuacion L2 de perturbaciones . . . . . . . . . . . . . . . . . . . 30
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Sistemas subactuados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7.1
2.7.2
2.7.3
Inmersion e invariancia . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.7.4
41
3.1
. . . . . . . . . . . . . . . . . . . . 41
3.2
3.3
Modelo de la plataforma . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.4
Control hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.1
3.4.2
Estabilidad seg
un Lyapunov . . . . . . . . . . . . . . . . . . . . . . 49
3.5
Rechazo de perturbaciones L2 . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.6
Seguimiento visual . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.6.2
3.7
Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.8
3.9
Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.9.1
3.9.2
3.9.3
3.9.4
INDICE GENERAL
iii
67
4.1
Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.2
4.3
4.4
4.2.1
Dinamica objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.2
Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.2.3
Moldeo de energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.2.4
Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.3.2
Dise
no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.3.3
Resultados de simulacion . . . . . . . . . . . . . . . . . . . . . . . . 82
Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.4.2
Dise
no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.4.3
4.4.4
Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5 Reducci
on del m
etodo IDA-PBC para sistemas subactuados
99
5.1
Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.2
5.3
5.4
5.5
5.6
5.7
Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
5.8
5.8.2
INDICE GENERAL
iv
5.9
5.9.2
5.9.1.2
6 Estabilizaci
on de oscilaciones en sistemas no lineales
. . . . . . . . 125
129
6.1
Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
6.2
6.3
6.4
6.5
6.6
. . . . . . . . . . . . . . . . . . . . . . . . . . . 142
6.7
6.8
6.9
. . . . . . . . . . . . . . . . . . . 155
6.9.2
6.9.3
6.9.4
6.9.5
Dise
no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.9.6
6.9.7
6.9.8
6.9.9
171
INDICE GENERAL
7.2
7.3
7.4
7.5
7.5.2
7.5.3
A Proyecto DORNA
181
191
Bibliografa
195
vi
INDICE GENERAL
Glosario
Notaci
on matem
atica
IR+
Cn
R>0
R0
M (q) > I
G
G
u
g
In
Mij
Mi
Mj
q
Conjunto de n
umeros reales no negativos.
Conjunto de funciones diferenciables n veces.
Matriz simetrica denida positiva.
Matriz simetrica semidenida positiva.
(Matriz uniformemente denida positiva). Matriz dependiente del estado q donde los autovalores cumplen
i > , i, q para una cierta constante > 0.
Matriz que multiplica al vector de control en sistemas
del tipo x = f (x) + Gu.
Matriz cuyas las son ortogonales a las columnas de G,
tal que G G = 0 y cuyo rango es r = n rango(G).
Ley de control (vector).
Par de control (vector).
Aceleracion de la gravedad en la supercie terrestre de
valor 9.8m/s2 .
Matriz identidad de orden n.
Elemento de la la i, columna j de la matriz M .
Fila i-esima de la matriz M .
Columna j-esima de la matriz M .
Vector de coordenadas articulares dado por q =
[q1 , q2 , . . . , qn ]T en un sistema mecanico de n grados de
libertad.
Vector de momentos generalizados dado por p =
[p1 , p2 , . . . , pn ]T en un sistema mecanico de n grados de
libertad.
Glosario
q f
qk f
gradf
y (r)
Lq
L2
H(q, q)
M (q)
T (q, q)
V (q)
Hd (q, q)
Md (q)
Td (q, q)
Vd (q)
q
arg min (V (q))
q0
p0
t
ues
udi
BIBO
Ixx , Iyy , Izz
rango(A)
Vector gradiente
T
f f
f
, , . . . , qn .
q1 q2
de
la
funcion
escalar
f:
f
Elemento k-esimo de q f , es decir q
k
Equivalente a q f .
Derivada r-esima con respecto al tiempo de la funcion
y(t).
Vease la seccion 2.6.
Vease la seccion 2.6.
Funcion de Hamilton de un sistema en bucle abierto.
Matriz de inercia en bucle abierto.
Energa cinetica en bucle abierto.
Energa potencial en bucle abierto.
Funcion de Hamilton de un sistema en bucle cerrado.
Matriz de inercia en bucle cerrado.
Energa cinetica en bucle cerrado.
Energa potencial en bucle cerrado.
Posicion de referencia que se desea estabilizar q.
Valor del vector q que hace mnima localmente la funcion
V (q).
Valores de las coordenadas generalizadas en el instante
inicial.
Valores de los momentos generalizados en el instante
inicial.
Variable tiempo
Ley de control de moldeo de energa (Energy Shaping).
Ley de control de inyeccion de amortiguamiento (Damping Injection).
Estabilidad en terminos de entrada acotada salida
acotada (Bounded Input Bounded Output).
Momentos de inercia respecto a los ejes principales x,y,z,
respectivamente.
Rango de la matriz A.
Glosario
T
erminos matem
aticos
Curva de nivel
Conjunto de nivel
Matriz acotada
Trayectoria acotada
Pasividad
Conjunto abierto
Conjunto cerrado
Conjunto acotado
Conjunto compacto
Conjunto conexo
Funcion propia
Clase K
Clase K
Glosario
Abreviaturas y acr
onimos
Cont.
DHR
Discont.
EDO
EDP
EL
GAS
GHS
GPS
IDA-PBC
INS
ISA
LSS
PBC
PCH
PCHD
US
Resumen
Resumen
Captulo 1
Introducci
on
1.1 Generalidades
En esta tesis se presentaran distintas contribuciones en el contexto del control de sistemas
mecanicos basado en la estructura hamiltoniana y el enfoque energetico.
El presente captulo se destina a la exposicion de las motivaciones practicas subyacentes en el control de plataformas de sensores giroestabilizadas, el control de sistemas
subactuados, y las tecnicas de estabilizacion de orbitas periodicas, al ser estos tres los
principales ambitos de aplicacion de los resultados de esta tesis.
Asimismo se realizara una breve introduccion, con referencias historicas, a los metodos
de control basado en la energa, en los que se asientan las tecnicas de pasividad y el control
hamiltoniano.
En la seccion 1.6 de este captulo se detallara la estructura del resto de los captulos
de esta la, y se detallaran publicaciones a que ha dado lugar cada uno de los captulos.
Existe una extensa literatura de investigacion dedicada a este tipo de sistemas. Para
una introduccion al problema vease (Spong 1997). Una clasicacion interesante de problemas de sistemas subactuados sencillos desde el punto de vista de las posibles estrategias
para su resolucion puede verse en (Weibel 1997) y tambien en (Olfati-Saber 2001). Pese
a los grandes avances teoricos y experimentales, los resultados distan de tener gran generalidad, y en este momento del desarrollo de la tecnica cada ejemplo en particular es
un problema abierto diferente de los ya resueltos y que debe ser abordado atendiendo a
Captulo 1. Introducci
on
10
realizados por los estudiosos de la entonces entonces llamada losofa natural1 . En ellos,
pronto se observo que las leyes de la mecanica admitan la existencia de ciertas funciones
escalares del estado que contenan suciente informacion para determinar la evolucion
futura del sistema en forma diferencial gracias a un principio variacional de mnima acci
on
elegantemente formulado. La b
usqueda de estas funciones generatrices del movimiento
fue objeto de una intensa investigacion iniciada por Maupertuis y culminada por Euler y
Lagrange. Posteriormente, resultados en gran medida equivalentes fueron trasladados a
sistemas electricos.
A estas funciones, que admiten la denominacion de integrales de movimiento, no se
poda atribuir una existencia autonoma en la naturaleza. Hasta un cierto momento de la
historia de la ciencia, la energa solo exista ligada a la conguracion o estado del cuerpo al
que describe. El perspicaz avance en la descripcion de los fenomenos naturales que supone
la teora electromagnetica de Maxwell y los resultados de Poynting, establecen por primera
vez la existencia de una magnitud llamada energa que es independiente de los cuerpos y
puede ser medida en un volumen en ausencia de masa. El teorema de Poynting permite
calcular la energa del campo contenida en un volumen carente de materia radiante y el
ujo a traves de su contorno, como si de un uido se tratara. De ello se deduce que la
energa no requiere la existencia de un substrato material para existir.
La coronacion a este proceso de enriquecimiento del entendimiento cientco llego con
la aparicion de la teora de la relatividad restringida que en 1905 consagra a Albert Einstein estableciendo una equivalencia entre masa y energa, otorgando a la segunda el status
de realidad fsica que hasta entonces solo ostentaba la primera. Desafortunadamente una
representacion no desde
nable de la comunidad intelectual de principios del siglo XX encontro en este hecho una razon para comenzar un amargo distanciamiento entre fsica
y metafsica. Sobre los fsicos teoricos recaa la acusacion de abusar de incomprensibles
articios matematicos desligados de su natural objeto de estudio, y se haca imposible
constatar experimentalmente sus predicciones. Esta actitud es mas paradojica a
un si se
tiene en cuenta que las pesquisas que condujeron al enunciado del principio de relatividad surgieron de hechos tan empricos como el experimento de Michelson y Morley. Las
tecnicas experimentales de la fsica nuclear tardaron decadas en desarrollarse, pero en
su madurez corroboraron todas las predicciones de la teora de Einstein, con lo que se
admitio denitivamente que el nuevo concepto de energa recoga elmente gran cantidad
de fenomenos observables en la naturaleza, y es instrumento esencial para posteriores
desarrollos en todos las escalas, desde la fsica de partculas hasta la astrofsica.
Termino empleado en el ttulo de la principal obra de Sir Isaac Newton Philosophae Naturalis Principia Mathematica.
Captulo 1. Introducci
on
11
(1.5.1)
=0
dt x
x
sean tambien solucion del sistema no lineal autonomo (1.5.1). Tengase en cuenta que f (x)
contiene tambien la ley de control bajo la suposicion de que esta sea funcion exclusiva del
estado x. El problema formulado no siempre admite solucion pero se pueden establecer
ciertas relaciones que aqu no comentaremos por razones de espacio. La segunda razon
por la cual este enfoque no es practico en control reside en que la funcion de energa, al
contener informacion sobre el comportamiento del lazo cerrado debe ser un objetivo de
dise
no.
De lo esgrimido anteriormente se desprende que en la fase de dise
no de un controlador
basado en energa, tanto la funcion de energa como la se
nal de control son los parametros
a dise
nar. La eleccion de estos parametros se hara atendiendo a restricciones de distinta
naturaleza, que aparecen por especicaciones de rendimiento del sistema o por simples
limitaciones del equipamiento disponible:
Restricciones en la se
nal de control, como sucede con las saturaciones, en la maxima
complejidad admisible en implementacion (por restricciones de tiempo o memoria para los calculos del microprocesador), restricciones de tipo matematico o geometrico debidas a la subactuacion.
12
Restricciones en la funci
on de energa en bucle cerrado. Como se vera mas adelante
en esta tesis, la forma funcion de energa en bucle cerrado va a determinar las
propiedades de estabilidad del sistema al identicarse con la funcion de Lyapunov
de control .
Restricciones en las trayectorias. Dichas restricciones suelen plantear problemas
practicos de gran dicultad e interes, pues muchos sistemas se dise
nan para funcionar correctamente siempre que se garantice que ciertas variables permanezcan en
un rango determinado. En la presente tesis se vera que estas restricciones pueden
trasladarse al grupo anterior de restricciones en la funcion de energa, proporcionando interesantes resultados practicos.
Restricciones en el tiempo de establecimiento. Es de sumo interes practico limitar el
tiempo en el que un sistema controlado alcanza el objetivo deseado. Desde el punto
de vista teorico existen pocos resultados a este respecto para sistemas no lineales,
por lo tanto permanece como problema abierto en el control.
Conocidas las restricciones y conocido el modelo del sistema en bucle abierto se puede
enunciar el problema del control basado en la energa del siguiente modo: dado el sistema
x = f (x, u), hallar una funcion de realimentacion del estado u u(x), tal que el sistema
resultante tenga, respecto a una funcion del estado H(x), denominada funci
on de almacenamiento o energa, un comportamiento disipativo (la energa decrece con el tiempo).
La forma de esta funcion debe acomodarse al conjunto de restricciones que se desprenden
de las especicaciones en bucle cerrado del sistema.
En el caso particular de no existir restricciones explcitas sobre la se
nal de control
el proceso de dise
no es secuencial: se obtiene una funcion de energa adecuada a las
especicaciones y se calcula por procedimientos puramente algebraicos la se
nal de control
que transforma el sistema en bucle abierto en otro que sea descrito por dicha funcion de
energa.
Captulo 1. Introducci
on
13
cinetica) es una supercie que atribuye un valor de energa a cada punto en el plano (, )
seg
un la expresion
H = cos + k 2
A la izquierda de la gura 1.3 aparece la funcion de energa de dicho sistema frente al
angulo y su derivada. Es facil observar el un punto de silla en el origen de coordenadas
(pendulo en posicion vertical superior). En efecto, si avanzamos hacia el origen en la
nos encontramos un mnimo de
direccion perpendicular al papel (direccion del eje )
energa (valle), mientras que si avanzamos en la direccion horizontal paralela al papel, al
pasar por el origen atravesaremos el perl de maximo de energa (cresta).
Es bien sabido que un punto de silla de la energa no representa un equilibrio estable
de un sistema dinamico. Un controlador basado en la energa tratara de cambiar la forma
completa de la funcion de energa de modo que apareciese un mnimo estricto en el punto
que se desea estabilizar. Para ello se podra a
nadir a la funcion de energa natural, H, un
termino de inyeccion de energa Ha = 2 cos de modo que en bucle cerrado resultara.
H + Ha = cos + k 2
Esta funcion de energa s posee un mnimo en el origen y por tanto, si el sistema es
disipativo (de energa decreciente), tendera asintoticamente a dicho equilibrio. Una vez
elegida la funcion de energa, se calcula la se
nal de control que logra que el sistema
en bucle cerrado posea una dinamica lagrangiana con respecto a dicha funcion. Dicho
calculo involucra la resolucion de un sistema de ecuaciones generalmente algebraicas. El
procedimiento expuesto se conoce como moldeo de energa (energy shaping).
Este procedimiento, que pudiera parecer sencillo a primera vista, involucra ciertos
matices y complicaciones que no es posible evitar. En primer lugar, como se vera ampliamente en esta tesis, no se trata de un metodo general aplicable a la totalidad de
14
Figura 1.3: Energa del pendulo en bucle abierto (izquierda), y bucle cerrado (derecha).
de sistemas mecanicos en IR2 arma que los subconjuntos de nivel (areas encerradas bajo
las curvas de nivel) son invariantes del sistema (Landau & Lifchitz 1964). Este resultado
es solo de aplicacion en sistemas disipativos, y debe interpretarse del siguiente modo: si
una curva de nivel de la energa del sistema disipativo es cerrada, entonces las trayectorias
que comiencen dentro de esa curva de nivel, permaneceran dentro de ella indenidamente.
Visto en el espacio tridimensional (tomando la energa como el tercer eje), y dado un
la energa de ese punto establece un plano
punto origen del movimiento en el plano (, ),
Captulo 1. Introducci
on
15
Esta
es la energa inicial en bucle abierto. Si el concursante emplea sus manos exclusivamente como punto de apoyo para la cada del martillo sin esfuerzo adicional, esta energa
se transmite al peso que se eleva hasta una altura que sera una medida de la energa
potencial inicial del martillo elevado. En este caso se puede armar que la altura de la
pesa en instantes futuros esta acotada superiormente por el valor de la energa potencial
inicial del martillo.
Al estudiar el sistema en bucle cerrado, el concursante se convierte en actuador y
realiza un esfuerzo para acelerar el martillo mas alla de la gravedad y por tanto inyecta
energa al sistema. Si deseamos encontrar una cota superior para la altura de la pesa
tras el golpe nos encontramos con la siguiente pregunta: cual es la maxima energa que
el forzudo puede transmitir al martillo y por consiguiente a la pesa? Ya no basta con
conocer la energa del sistema en bucle abierto, sino que es necesario tener un modelo de
energa del conjunto concursante-martillo y en funcion de el se podra obtener la altura
maxima que puede alcanzar la pesa.
El control basado en la energa tal y como se desarrolla en esta tesis proporciona dicho
modelo de energa en bucle cerrado y una adicion de amortiguamiento tal que el equilibrio
deseado pasa a ser estable. Si ademas empleamos el hecho de que las curvas de nivel
de energa representan regiones de connamiento de las coordenadas, podemos deducir
que el energy shaping puede ser una va para modular el comportamiento transitorio.
En efecto, una curva cerrada en el espacio de las coordenadas representa un conjunto
acotado. Esto implica que existe un valor maximo para cada coordenada cuando las
trayectorias comienzan con una energa inicial determinada. Mas a
un, el valor de dicho
maximo depende precisamente de la energa inicial, con lo que estamos en una situacion
semejante a la gura 1.4 pero con interesantes consecuencias en el campo del control.
De hecho el interes del acotamiento de trayectorias en control es un problema fundamental para determinar regiones de operacion de los sistemas reales. En los primeros
cursos de Control Automatico se incide profundamente en el dise
no de controladores con
16
(1.5.2)
Es sabido que el problema del control consiste en determinar una funcion u = k(x) tal
que el sistema resultante de llevar esta u a (1.5.2) de lugar a un sistema en bucle cerrado
de la forma
x = f (x, k(x)) = F (x),
(1.5.3)
sistema autonomo que posee el comportamiento requerido. Este comportamiento comprende la propiedad de estabilidad en el origen, lo que se traduce en que las trayectorias
de (1.5.3) tienden al mnimo de la funcion de Lyapunov V (x). Es decir,
V
V =
f (x, k(x)) < 0.
x
(1.5.4)
Pues bien la gran aportacion de Lyapunov fue permitir generalizar los conceptos de comportamiento de la energa, que se han comentado en las secciones anteriores, a situaciones
en las que exista esa funcion V (x) que posee las mismas propiedades matematicas que la
3
S
olo si nos restringimos a sistemas lagrangianos con equilibrios estables.
Captulo 1. Introducci
on
17
energa, aunque no tenga su mismo signicado fsico. De este modo se puede generalizar
considerablemente el control basado en la energa al control basado en la existencia de la
funcion de Lyapunov.
Una generalizacion adicional, que esta teniendo lugar en nuestros das, es la de asociar
una estructura (o realizacion, en una terminologa clasica de la teora del control) hamiltoniana al sistema considerado. La funcion de Hamilton de esta realizacion hamiltoniana
posee las propiedades de una funcion del Lyapunov, por lo que se alcanza una notable
sntesis para el tratamiento de los sistemas dinamicos que admiten esa formalizacion.
Es el caso, en principio, de los sistemas electromecanicos para los que la adopcion de
una estructura hamiltoniana es un hecho bien conocido y explotado desde hace tiempo.
Para estos sistemas las tecnicas de proyecto de controladores mediante moldeo de energa
poseen un caracter natural. Sin embargo, mediante las formulaciones hamiltonianas, y
el consecuente empleo de funciones de Lyapunov, se puede ampliar considerablemente el
campo de aplicacion de las tecnicas de moldeo de energa, desarrolladas inicialmente para
sistemas electromecanicos. En el captulo 6 de esta tesis se ilustra este hecho al proponer como objetivo que el sistema realimentado posea una funcion del Lyapunov cuartica,
sin ning
un signicado de energa, pero cuyo comportamiento presenta unas oscilaciones
periodicas que constituyen el objetivo del proyecto.
18
El objetivo del quinto captulo es la reduccion de las ecuaciones IDA-PBC para una
clase de sistemas subactuados en los que el sistema de ecuaciones diferenciales parciales
propio del metodo, admite una solucion trivial gracias a la reduccion obtenida. Ademas
se presentan soluciones de razonable generalidad para los pasos de moldeo de energa
cinetica y potencial para el caso de sistemas de dos grados de libertad, y se estudia la
aplicacion de la reduccion a sistemas de orden mayor. Los resultados de este captulo han
sido publicados en (Gomez-Estern, Ortega, Rubio & Aracil 2001).
El sexto captulo aborda el problema de la estabilizacion de orbitas periodicas en
sistemas no lineales mediante realimentacion estatica del estado basadas en la energa
y la estructura hamiltoniana. En el se parte de un sistema hamiltoniano oscilante de
orden dos, que se propone como dinamica objetivo para el sistema a controlar, y se
desarrolla una teora para la extension del comportamiento oscilante en una amplia clase
de sistemas de orden superior, incluyendo los sistemas con estructura triangular no afn,
los linealizables por realimentacion y otros sistemas de forma aproximada. Dos resultados
fundamentales son la deteccion de una bifurcacion de Hopf que se mantiene al aumentar
el orden del sistema y la posibilidad de representar el sistema en bucle cerrado en forma
hamiltoniana generalizada. Los resultados presentados en este captulo han dado lugar
a la serie de publicaciones (Aracil, Gordillo & Gomez-Estern 2002), (Gordillo, GomezEstern, Ortega & Aracil 2002), (Gomez-Estern, Aracil & Gordillo 2002), (Gordillo, Aracil
& Gomez-Estern 2002) y (Aracil, Gomez-Estern & Gordillo 2002).
El septimo captulo contiene una exposicion de conclusiones referentes a los captulos
comprendidos entre el tres y el seis, y se expone una discusion detallada de las posibles
lneas futuras de investigacion posteriores a esta tesis, clasicadas en funcion de las tres
partes fundamentales de la tesis.
El apendice A describe la labor desarrollada en el contexto del proyecto DORNA por
el doctorando y el equipo de desarrollo formado a tal efecto, para el control de plataformas
giroestabilizadas. La aplicacion, de tiempo real, contiene elementos de interes desde el
punto de vista del modelado, el control, la programacion de procesadores de se
nales en
tiempo real, la sincronizacion de procesos y el dise
no de protocolos de comunicaciones.
Los resultados de este apendice dieron lugar a la publicacion (Gomez-Estern, Perez, Rubio
& Gordillo 2000).
En el apendice B se detallan los procedimientos Maple desarollados para el calculo
automatizado de la ley de control para sistemas oscilantes de orden arbitrario, presentada
en la seccion 6.8. El principal interes de estos procedimientos reside en la dicultad del
manejo de sistemas de ecuaciones diferenciales cuando se desea trabajar con sistemas de
orden variable. Este apendice tambien se ha incluido en publicacion (Aracil, GomezEstern & Gordillo 2002).
Captulo 2
Fundamentos te
oricos y estado de la
t
ecnica
2.1 Sistemas electromecanicos
Esta tesis tiene por objeto estudiar y desarrollar metodos de estabilizacion, seguimiento
de trayectorias y robusticacion en una clase de sistemas, cuya propiedad fundamental es
que poseen integrales de movimiento. Esto quiere decir que la evolucion de sus trayectorias
puede ser descrita en terminos de las derivadas temporales y con respecto a las coordenadas
generalizadas de una funcion escalar relacionada con la energa. Esta propiedad es com
un
en sistemas mecanicos y sistemas electricos, y por tanto es una herramienta esencial en
el analisis y control de sistemas roboticos y electromecanicos en general. La comunidad
del control ha dividido sus lneas de trabajo en dos paradigmas con un alto grado de
paralelismo: los sistemas lagrangianos o de EulerLagrange (EL) y los hamiltonianos.
Pese existir una equivalencia entre ambos enfoques y poder expresar la modelo EL en
forma hamiltoniana, las formulaciones han sido generalizadas hasta el punto en que no es
evidente su equivalencia, y por tanto tampoco son intercambiables las tecnicas de control
desarrolladas en uno u otro enfoque.
20
t1
t1
=0
dt qi
qi
Tras a
nos de especulaciones (Maupertuis) en cuanto a la denicion de la funcion L, Euler
y Lagrange la denieron correctamente en el caso general, tomando la forma
L = T (q, q,
t) V (q, t)
i = 1, 2 . . . n
donde T (q, q,
t) y V (q, t) representan, respectivamente, las energa cinetica y potencial.
Generalizando al caso de sistemas sometidos a fuerzas externas, las trayectorias q(t) seran
soluciones al sistema de ecuaciones diferenciales de segundo orden
d L
L
= fi
i = 1...n
dt qi
qi
donde fi representa el conjunto de fuerzas y momentos externos que no derivan de un
potencial, entre los que habitualmente incluiremos
Los efectos de friccion que tienen como consecuencia una disipacion de energa.
Fuerzas y pares de control.
Estas ecuaciones, en el caso de solidos rgidos (p. ej. sistemas roboticos), en ausencia de
friccion pueden ser escritas del siguiente modo
M (q)
q + C(q, q)
q + g(q) =
(2.2.1)
Donde M (q) es la matriz de inercia del sistema, g(q) = Vq(q) y el termino C(q, q)
q corresponde a los efectos centrfugos y de coriolis, cumpliendose que M 2C es una matriz
antisimetrica.
El modelo de EulerLagrange ha dado lugar a una serie de metodos de sntesis de controladores que ademas de perseguir la estabilidad asintotica de equilibrios y trayectorias,
preservan la estructura de EulerLagrange en bucle cerrado. Con ello se logra
Captulo 2. Fundamentos te
oricos y estado de la tecnica
21
L
qk
L
qi L qi
= pk
qk
qi qk qk
i
i
qi L qi
= qk +
pi
= qk
pk
qi pk
i
i
=
pi
(2.3.1)
22
(q,p)
(q,p)
grad(H)
H
+ Gu
x
(2.3.2)
T
H H
H
H =
,
,...,
x1 x2
xn
Es facil de comprobar, por la propiedad antisimetrica de J(x), que en ausencia de accion
de control la derivada del hamiltoniano viene dado por
H = (H)T R(x)(H) 0
Captulo 2. Fundamentos te
oricos y estado de la tecnica
23
H H
H
,
,...,
H =
1 2
n
Entonces se tiene
x
x
x
x
x H x .
=
(J R ) H =
(J R )
x =
T
x
x
Jx =
J
T
x
x
Rx =
R
antisimetrica de Jd se tiene
T
x
T
T x
z Jx z = z
z = y T J y = 0
z
J
24
q1
Captulo 2. Fundamentos te
oricos y estado de la tecnica
25
Por que se conserva solo el primero? La razon subyace en que el sistema no esta aislado
pues precisa del aporte de energa de un motor externo para mantener la rotacion a velocidad constante (normalmente oscilara). En consecuencia existe un ujo de energa entre
el sistema y el exterior. La condicion para la conservacion del hamiltoniano es diferente.
Para comprender lo que sucede con el hamiltoniano hay que puntualizar que cuando el
sistema se encuentre en un sistema de referencia no inercial, la energa cinetica puede
constar, ademas de los terminos cuadraticos, de otros terminos lineales. La expresion
general de la energa cinetica de un sistema de partculas toma, pues, la expresion general
1
B(q, t)r qr + C(q, t) = T2 + T1 + T0
T =
Ars (q, t)qr qs +
2
r,s
r
Por otro lado, si denimos rj como la expresion en cartesianas respecto a un sistema de
referencia inercial de la partcula j del sistema, esta se podra calcular siempre en funcion
de las coordenadas articulares q por la relacion
rj = rj (q1 , q2 , . . . , qn , t).
Si en esta relacion no aparece explcitamente el tiempo, entonces la energa cinetica se
reduce al termino T = T2 en cuyo caso diremos que se trata de un sistema natural. Si
ademas L (y por tanto H) no dependen explcitamente del tiempo, se trata de un sistema
aut
onomo, por lo cual H es una constante de movimiento.
El ejemplo mencionado se trata de un sistema no natural y autonomo y por tanto
se conserva el hamiltoniano, pero no la energa. Estas circunstancias son de especial
relevancia en el contexto de esta tesis pues se estudiara el control de un sistema instalado
en la cubierta de un buque, y por tanto sumergido en un sistema de referencia no inercial.
(2.4.1)
t t0
(2.4.2)
26
V (x) > 0,
x = x
x , x = x
Captulo 2. Fundamentos te
oricos y estado de la tecnica
27
Estado
Parmetro de bifurcacin
Tayectoria entrante
Trayectoria saliente
Equilibrio estable
(2.5.1)
(2.5.2)
28
2.6.1 Estabilidad Lq
Denici
on 2.6.1 (Espacios Lq ). Para cada q {1, 2, . . . } se dene Lq [0, ) = Lq como
el conjunto de funciones2 f : IR+ IR que satisfagan
|f (t)|q dt <
0
tIR+
tIR+
de donde se deduce que f 2 =< f, f > 2 . Para las funciones no acotadas sin tiempo de
escape nito se dene el espacio extendido Lqe
Denici
on 2.6.3 (Espacios Lqe ). Sea f : IR+ IR. Entonces, para cualquier T IR+ ,
la funcion fT : IR+ IR se dene como
f (t)
,
0t<T
fT (t) =
0
,
tT
llamada la truncacion de f en el intervalo [0, T ]. Para cada q = 1, 2, . . . , el espacio Lqe
consiste de todas las funciones f : IR+ IR tal que fT Lq para todo T con 0 T .
Lqe se denomina el espacio extendido de Lq .
Lo expuesto anteriormente se puede extender trivialmente a funciones f : IR+ IRn
suponiendo la existencia de una norma denida en IRn . Los conceptos presentados son
elementales para las siguientes deniciones de estabilidad Lq entradasalida. Para representar la dinamica de un sistema haremos uso del concepto mas general mapa de entrada
salida. Sea U un espacio lineal m-dimensional con norma U , e Y otro espacio lineal
p-dimensional con norma Y , junto a una aplicacion entradasalida
G : Lqe (U ) Lqe (Y )
u y = G(u)
2
En adelante se supondr
a que estamos hablando en todo caso de funciones medibles. Un funci
on es
medible si es el lmite punto por punto de una secuencia de funciones constantes a trozos, excepto un
conjunto de medida cero.
Captulo 2. Fundamentos te
oricos y estado de la tecnica
29
Denici
on 2.6.4 (Estabilidad Lqe ). Sea un sistema representado por el mapeo G :
Lqe (U ) Lqe (Y ). Entonces se dice que G es Lq estable si
u Lqe (U ) G(u) Lq (Y )
es decir, G aplica el subconjunto Lq (U ) Lqe (U ) en el subconjunto Lq (Y ) Lqe (Y ).
Evidentemente, la estabilidad L , equivale a estabilidad BIBO (Bounded Input Bounded
Output).
La desigualdad (2.6.1) es conocida como la desigualdad de disipacion. Una eleccion habitual de la tasa de suministro es
s(u, y) =< y|u > .
Denici
on 2.6.6 (Pasividad). Un sistema en variables de estado con u = y =
m
IR es pasivo si es disipativo con respecto a la tasa de suministro s(u, y) = uT y. es
estrictamente pasivo a la entrada si existe > 0 tal que es disipativo con respecto a
s(u, y) = uT y u2 . es estrictamente pasivo a la salida si existe > 0 tal que
es disipativo con respecto a s(u, y) = uT y y2 . Finalmente, es conservativo si se
cumple (2.6.1) con signo de igualdad con respecto a la funcion s(u, y) = uT y para todo
x0 ,t1 t0 y u().
Denici
on 2.6.7 (Ganancia L2 ). Un sistema en variables de estado con U = IRm ,
p
Y = IR , tiene ganancia L2 si es disipativo con respecto a la tasa de suministro
s(u, y) = 12 2 u2 y2 . La ganancia L2 de se dene como () = inf{| tiene ganancia L2 }.
Se dice que tiene ganancia L2 < si existe < tal que tenga ganancia L2 <
Un resultado fundamental es el que relaciona la pasividad con la ganancia L2 :
Proposici
on 2.6.1. Si el sistema es pasivo estrictamente a la salida, entonces tiene
ganancia L2 nita.
30
u1
+
-
S1
y1
y2
e2
S2
u2
Proposici
on 2.6.2. (i) Supongamos que 1 y 2 son pasivos o estrictamente pasivos a
la salida. Entonces el sistema en bucle cerrado f2 ,2 de la la gura (2.4) con entradas
(e1 , e2 ) y salidas (y1 , y2 ) es pasivo, y estrictamente pasivos a la salida si ambos 1 y 2
son estrictamente pasivos a la salida.
(ii)Supongase que S1 , S2 , que satisfacen las desigualdades de disipacion
t1
S1 (x1 (t1 ))) S1 (x1 (t0 ))) +
(u1 (t)y1 (t) 1 y1 2 )dt
t
0t1
S2 (x2 (t1 ))) S2 (x2 (t0 ))) +
(u2 (t)y2 (t) 2 y2 2 )dt
t0
1
Captulo 2. Fundamentos te
oricos y estado de la tecnica
31
donde x IRn es vector de estado, u IRm el vector de control y w IRp una perturbacion
desconocida de norma acotada. Se dene el problema de rechazo de perturbaciones L2
del siguiente modo: Dada una se
nal de penalizacion z = q(x), un nivel de atenuacion
de las perturbaciones > 0, y un equilibrio deseado x IRn , se trata de hallar una
realimentacion del estado u = (x) y una funcion de almacenamiento V (x) denida
positiva en un entorno de x tal que la desigualdad de disipacion
1
V + Q(x) { 2 w2 z2 }, w
2
(2.6.3)
se cumpla a lo largo de todas las trayectorias del sistema en lazo cerrado (2.6.2) con la ley
de control u = (x), donde Q(x) 0 es una funcion no negativa dada. Como puntualizan
Besancon et al. (Besancon & Battiloti 1998), el cumplimiento de (2.6.3) puede asegurar
los siguientes comportamientos:
nal de penalizacion z es menor que el
La ganancia L2 de la perturbacion w a la se
nivel dado (Van der Schaft 2000).
El sistema en bucle cerrado es estable en el sentido de Lyapunov cuando w se
desvanece (tomese V (x) como funcion de Lyapunov, y es facil de ver, atendiendo a
(2.6.3) que V 0). Mas a
un el sistema en bucle cerrado es asintoticamente estable
si Q(x) > 0.
Existe una funcion (c) de clase K tal que para cualquier c > 0 y cualquier
condicion inicial V (x(0)) c, se cumple que
V (x(t)) c, t, w(t) (c).
Ahora considerese el siguiente sistema hamiltoniano con disipacion:
x = (J(x) R(x))H + g1 (x)u + g2 (x)w
z = h(x)g1T (x)H
(2.6.4)
1
[g2 (x)g2T (x) g1 (x)g1T (x)] 0,
2 2
on dada por la
entonces el problema de atenuaci
on de perturbaciones L2 admite la soluci
ley de realimentacion
1
1 T
(2.6.5)
u = h (x)h(x) + 2 Im g1T (x)H
2
2
32
1
1
T
T
T
H + (H) R(x) 2 (g2 (x)g2 (x) g1 (x)g1 (x)) H { 2 w2 z2 }, (2.6.6)
2
2
se cumple a lo largo de las trayectorias del sistema en bucle cerrado consistente en (2.6.4)
y (2.6.5)
Dado que en el momento de redaccion de esta tesis este teorema no ha sido a
un publicado,
se expondran los detalles de la breve demostracion.
Demostraci
on. A partir de (2.6.4) y (2.6.5), es facil observar que
dH
dt
2
1
1
1
1
+
(H)T g1 hT hg1T H (H)T g1 ( hT h + 2 Im ) + 2 (H)T g2 g2T H
2
2
2
2
1
1
= (H)T R(x) 2 g2 (x)g2T (x) + 2 g1 (x)g1T (x)) H
2
2
1
1
1 2
( w2 z2 ) w g2T H2 .
+
2
2
Entonces
dH
dt
1
T
T
+ (H) R(x) 2 (g2 (x)g2 (x) g1 (x)g1 (x)) H
2
1 2
1
1
1
=
( w2 z2 ) w g2T H2 ( 2 w2 z2 )
2
2
2
T
que tiene la forma (2.6.6), dado que R(x) 212 [g2 (x)g2T (x) g1 (x)g1T (x)] 0, y por tanto
T
1
T
T
Q(x) = (H) R(x) 2 (g2 (x)g2 (x) g1 (x)g1 (x)) H 0
2
Por tanto la ley de control (2.6.5) es una solucion al problema de atenuacion de pertur2
baciones L2 con funcion de Hamilton H(x).
Captulo 2. Fundamentos te
oricos y estado de la tecnica
33
= ui ,
i = 1...r
dt qi
qi
d L
L
= 0,
i = r + 1...n
dt qi
qi
En la descripcion hamiltoniana generalizada presentada en (2.3.2), un sistema subactuado
es aquel en el que el rango de la matriz de control G es inferior al n
umero de grados de
libertad.
Al no poder actuar sobre el espacio articular completo, aparecen limitaciones en cuanto
al conjunto de comportamientos que se pueden alcanzar en bucle cerrado. La primera
cuestion en este sentido es determinar si un sistema es controlable en una region del
espacio de estados.
m
i=1
ui fi (x) +
r
vj gj (x),
i = 1 . . . m, j = 1 . . . r
j=1
34
u = k(x) + (x)v,
que transformen el sistema en la
0 1 0 ...
0 0 1 ...
. . . .
. . . ..
z =
. . .
0 0 0 ...
0 0 0 ...
0
0
0
0
.
..
.. v = Ac z + bc v,
z IRn
z
+
.
0
1
0
1
(2.7.2)
que es una forma lineal controlable. En este caso diremos que el estado del sistema es
linealizable por realimentaci
on. Si las condiciones se cumplen de forma global, entonces el
estado del sistema es globalmente linealizable por realimentaci
on. En un caso de sistemas
subactuados este resultado no proporciona explcitamente la ley de control ni la transformacion z = T (x). Mas a
un, la controlabilidad es posible en sistemas que no cumplen
estas condiciones, como se estudiara en esta tesis.
Para evitar las estrictas condiciones de la linealizacion por realimentacion, as como
la inconveniencia de no proporcionar elementos constructivos para el dise
no de la ley de
control, se han desarrollado nuevas lneas de investigacion entre las que podemos destacar
el trabajo de (Spong 1997) consistente en la linealizacion parcial en sistemas mecanicos
subactuados. El sistema (2.7.1) es linealizable parcialmente si existe una ley de control
u = k(x) + (x)v y un cambio de coordenadas z = T (x) tal que es equivalente al sistema
parcialmente lineal
= (, z),
0 1
0 0
. .
. .
z =
. .
0 0
0 0
0
1
..
.
0
0
IRnr
... 0
... 0
.
... . z +
... 1
... 0
0
0
..
.
v,
0
1
z IRr
sistema. Este
se dene como el n
umero de veces que hay que derivar la salida con respecto
al tiempo para que aparezca explcitamente la ley de control. Por ejemplo
x 1
x 2
x 3
y
=
=
=
=
x2
u + x21 x3
x1
x3
Captulo 2. Fundamentos te
oricos y estado de la tecnica
35
Metodo IDA-PBC
El metodo basado en pasividad conocido como Interconnection and Damping Assignment
Passivity Based Control o IDA-PBC fue introducido en (Ortega & Spong 2000). Esencialmente consiste en partir de una estructura PCH en bucle abierto y obtener otra en bucle
cerrado con las propiedades de estabilidad deseadas. Igualando las ecuaciones de bucle
abierto y del sistema deseado se obtiene la ley de control. En el captulo 4 se estudiara
en detalle la aplicacion del metodo a sistemas mecanicos subactuados. Sin embargo, la
losofa del mismo no es mas que la b
usqueda de una funcion de energa y una estructura
hamiltoniana para el sistema en bucle cerrado tal y como se describio en el captulo
introductorio.
El metodo IDA-PBC persigue una dinamica en bucle cerrado con funcion de Hamilton
on generalizada de la
Hd (q, p) y una matriz antisimetrica tambien llamada de interconexi
forma Jd (q, p) = Jd (q, p)T que permite aumentar los grados de libertad en el dise
no. Las
ecuaciones de estado en lazo abierto y cerrado se deben ajustar exactamente. Esto quiere
decir que la ley de control u debe calcularse de modo que
Hd
H
q
0 I2
q
q
= (Jd Rd ) Hd =
+ Gu.
(2.7.3)
H
p
I2 0
p
p
donde Rd (q) 0 la matriz de disipacion en bucle cerrado. Las principales dicultades
de este metodo aparecen en en el caso de sistemas subactuados, donde el conjunto de
36
= ui ,
i = 1...n
(2.7.5)
dt qi
qi
donde, eventualmente, algunos de los terminos de control ui pueden ser nulos, se propone
un conjunto alcanzable de Lagrangianos controlados Lc y una ley de control tales que las
soluciones q(t) de las trayectorias en bucle cerrado sean tambien las trayectorias de
d Lc
Lc
= 0,
i = 1...n
(2.7.6)
dt qi
qi
En (Bloch, Leonard & Marsden 2000) se enuncia un teorema que establece las condiciones
que debe cumplir dicho conjunto de lagrangianos controlados. Este resultado, conocido
como matching theorem o teorema de ajuste se resumira a continuacion. En la notacion de
(Bloch et al. 2000), los lagrangianos en bucle abierto y cerrado toman, respectivamente,
la forma
1
L(q, q)
= gij (q)qi qj V (q)
2
1
Lc (q, q)
= gij (q)qi qj V (q)
2
donde gij Y gij representan los elementos de la matriz de inercia en bucle abierto y cerrado,
respectivamente. El hecho de que (2.7.5) sea subactuado implica la existencia de una
Captulo 2. Fundamentos te
oricos y estado de la tecnica
37
V
j V
l j k
h
gil Tjk
q q
i
i
j
q
q
(2.7.7)
38
(2.7.8)
()
(2.7.9)
(2.7.10)
(2.7.11)
(2.7.12)
est
an acotadas para todo t [0, ).
oticamente estable del sistema en bucle
Entonces, x es un equilibrio globalmente asint
cerrado x = f (x) + g(x)(x, (x)).
(2.7.13)
(2.7.14)
Captulo 2. Fundamentos te
oricos y estado de la tecnica
39
z = u0 ().
Si denimos v = z y recordamos que u = entonces
u = u0 () + v.
(2.7.15)
(2.7.16)
(2.7.17)
(2.7.18)
se obtiene
V 1 = V0 + z z
= V0 (f () + g()u0 ()) + V0 g()z + zv
W () + V0 g()z + zv.
Con el n de lograr que V1 sea una funcion de Lyapunov del sistema completo se hara la
eleccion
v = ( V0 g() + kz),
lo que equivale a
u = u0 () ( V0 g() + kz)
= u0 ()(f () + g()) V0 g() k( u0 ())
(2.7.19)
(2.7.20)
40
Captulo 3
Control de una plataforma
giroestabilizada de dos grados de
libertad
En este captulo se abordara el problema de control basado en pasividad para sistemas
hamiltonianos completamente actuados y se planteara el problema de la implementacion
de un controlador realizado mediante estas tecnicas en una plataforma de dos grados de
libertad sobre base movil. Este tipo de plataformas se emplea en aplicaciones de robotica
movil y muchas otras en las que se desea incorporar antenas, camaras o sensores externos
del tipo sonar, radar, telemetro, infrarrojos y similares donde la lnea de mira del sensor
ha de mantenerse estable frente a los movimientos del vehculo donde se asienta. En
sistemas de navegacion tienen su aplicacion en los equipos que han de mantener contacto
visual estable con elementos externos al buque, como pueden ser los receptores GPS,
antenas parabolicas para comunicaciones va satelite (por ejemplo, inmarsat), deteccion
de obstaculos, faros, puntos de referencia en la costa y por u
ltimo en aplicaciones militares
como sistemas de defensa antiaerea.
En todos estos casos la medida del sensor puede verse degradada por el movimiento
aleatorio de la supercie sobre la que se asienta. En la supercie del buque el oleaje,
relativamente lento, provoca unas velocidades angulares en todas las direcciones del triedro
de referencia, siendo posible compensarlos con actuadores lentos (motores electricos o
hidraulicos) mediante la correcta realimentacion de la velocidad angular. En el caso
de plataformas de sensores instaladas sobre vehculos terrestres, como es el caso de las
camaras montadas sobre vehculos autoguiados, la perturbacion que obliga al vehculo y la
plataforma de sensores montada sobre el a a abandonar el movimiento inercial, vara con
mas celeridad y por tanto es necesario contar con actuadores veloces como pueden ser los
de tipo neumatico y leyes de realimentacion rapidas que deben ser dise
nadas con mayor
renamiento para mantener margenes de fase aceptables evitando posibles situaciones de
inestabilidad y oscilaciones.
42
a las que estan sometidos. Se dice que son medidas internas por no basarse en ninguna
interaccion con el exterior como sera el caso de los de sonares, que pueden proporcionar
medidas ables del vector velocidad y aceleracion pero siempre basandose en una interaccion (en este caso reexion) con el entorno.
Los sensores que se aplican en este tipo de sistemas son los denominados inerciales.
Estos sensores se destinan a medir las derivadas de las variables de posicion del robot.
Uno de los primeros usos de sensores inerciales pueden encontrarse en el trabajo del
grupo aleman Peenem
unde. El Vergeltungswae V1 (arma de venganza) era una aeronave
autonoma que se basaba en el guiado inercial. Con un rango operacional de 200 km, el V1
se asentaba en m
ultiples sensores inerciales para guiar el arma hacia el objetivo. El V1
deba viajar en una direccion determinada, a una altitud especca, durante una tiempo
y distancia determinados. La realimentacion de los sensores inerciales de este dispositivo
permitan evaluar las peque
nas desviaciones respeto a la trayectoria prevista y actuar en
consecuencia.
Por el principio de relatividad de los sistemas inerciales, la velocidad lineal no es un
parametro fsico directamente medible sin que medie interaccion alguna con el entorno
(una astronave no debe experimentar ning
un cambio fsico relacionado con su velocidad
respecto a la tierra). Por esta razon los sensores inerciales estan destinados a la medida
de fenomenos de aceleracion, entre los que estan la velocidad angular del solido y la
aceleracion lineal. Generalmente nos encontramos dos tipos de sensores.
;;;
;;;
;;;
;;;
Muelles
Masa
Sensor de
desplazamiento
Direccin de
aceleracin
Aceler
ometros Proporcionan una medida de la aceleracion en lineal proyectada
en una direccion del movimiento como se describe en la gura 3.1.
Gir
oscopos Son empleados para medir velocidades angulares, en torno a un eje
jo. Pueden ser opticos, relacionados con la fsica del la luz sometida a aceleracion,
y mecanicos en los que un disco sometido a un giro constante, sufre una torsion
cuando el sistema de referencia en el que se sustenta posee cierta velocidad angular.
El principio de funcionamiento del giroscopo mecanico admite una sencilla interpretacion
ausente de toda terminologa matematica. Este instrumento se representa esquematicamente
la gura 3.2 mediante cuatro masas puntuales A,B,C,D en lugar del disco completo que se
emplea habitualmente. Estas masas representan las areas del disco que mas importantes
a la hora de visualizar el funcionamiento del giroscopo.
43
El punto inferior del eje se mantiene estacionario pero puede pivotar en todas direcciones. Cuando una fuerza de torsion se aplica al eje superior, el punto A sube y C
desciende (gura a). Al estar el giroscopo en rotacion en sentido horario, el punto ocupara
el lugar del B tras un giro de /2 rads. Lo mismo sucede para los puntos C y D. El punto
A esta a
un desplazandose hacia arriba cuando se encuentra a /2 rads en la (gura b), y
el punto C viajara hacia abajo. El movimiento combinado de A y C hace que el eje rote
en el plano de precesi
on hacia la derecha (gura b). Este fenomeno recibe el nombre de
precesion.
44
x
y
45
()
0
1
T = [ ]
(3.3.1)
2
0
Iyy2
que coincide con las funciones de Lagrange y de Hamilton al mismo tiempo. EL termino
() representa la expresion
(3.3.2)
donde Izz1 es el momento de inercia de la base con respecto al eje z; mientras que Ixx2 , Iyy2
y Izz2 representan los momentos de inercia con respecto a los ejes x,y y z respectivamente.
46
Recordando la ecuacion (3.3.1), la energa mecanica total del sistema vendra dada por
1
p1
p22
1 p21
p22
(3.4.1)
H=
+
=
+
2 m1 (q) m2 (q)
2 () Iyy2
donde m1 y m2 representan las constantes de inercia efectivas asociadas a cada movimiento
de rotacion. La ecuacion (3.4.1) expresada en la base (q, q)
se convierte en
1
1
H=
m1 (q)q12 + m2 (q)q22 =
() 2 + Iyy2 2
2
2
Deniendo q = [q1 q2 ]T y p = [p1 p2 ]T , la formulacion hamiltoniana del sistema en bucle
abierto en la base (q, p) resulta
H
q
0
I2
O
u
2
q
=
+
(3.4.2)
H
p
I2 K
I
u
2
p
donde I2 es la matriz identidad de segundo orden, y K = diag{k1 , k2 } es la matriz
constante de friccion viscosa.
Dado que q = [q1 q2 ]T , introducimos el cambio de base : (q, p) (q, q)
de modo que
1
0
0
0
1
0
0
0
(3.4.3)
=
p1
1
x
()
()
0
0
()2
0
1
Iyy
2
d q
q
+
(3.4.4)
=
H
dt q
x
x
x
I2 K
I2
u
p
lo cual, aplicado a la plataforma, conduce a:
0
0
0
1 ()
0
0
0
Iyy
d
2
=
k
1
1
()
0
dt
2
()
k2
1
0
Iyy
2
2
I
yy2
H
H
0
0
0
0
1
() 0
1
0
Iyy
2
u
u
(3.4.5)
(3.4.6)
47
0
0
0
Iyy
d
2
=
Kc1
1
0
dt
c
2c
0
Iyy2
0
IK2c2
yy2
Hd
Hd
Hd
Hd
(3.4.8)
1 ()
(3.4.9)
() k1 () + u =
c
1
Kc2
1
Iyy
() 2 k2 + u =
2
2
Iyy2
1
(3.4.10)
(3.4.11)
u = () + k1 Kc1 ()1
c
1
u = () 2 + k2 Kc2
2
(3.4.12)
(3.4.13)
48
i = 1, 2,
(3.4.14)
Ha
= Kd2 ( d ).
(3.4.15)
1
u = () 2 + k2 Kc2 Kd2 ( d )
2
A
(3.4.16)
Donde los terminos de la ley de control no lineal pueden ser agrupados en funcion de su
signicado fsico:
(A) Moldeo de la energa cinetica para eliminar los efectos de acoplamiento entre
articulaciones
(B) Compensacion de la friccion real del sistema
(C) Introduccion de friccion en el sistema hamiltoniano objetivo
(D) Control proporcional del error, derivado del moldeo de energa potencial
Si denimos el error de seguimiento como e = [e e ]T donde e = ( d ) and
e = ( d ) y suponemos que la referencia se mantiene constante se obtiene:
u = () + k1 1
c (Kc1 e Kd1 e )
P Dacimut
1
u = () 2 + k2 Kc2 e Kd2 e
2
(3.4.17)
P Delevacion
49
1
0
0
0
0
0
0
c
0
0
1
0 0 0
0
0
0 Iyy2
J(x) =
R(x) =
Kc1
0
0
0
1
0
0
0
2
c
0
1
Iyy
2
0 0
Kc2
2
Iyy
2
es facil ver que J(x) = J(x)T y que R(x) es globalmente semidenida positiva. Los pares
de control que se a
nadan actuaran sobre la aceleracion, es decir, sobre las dos u
ltimas las
50
de las ecuaciones de estado (3.4.8). Lo mismo sucedera con los pares de perturbacion w,
de modo que se tienen las matrices de ganancias de control y perturbacion como
g1 (x) = g2 (x) =
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
1
1
[g2 (x)g2T (x) g1 (x)g1T (x)] = R 0.
2 2
Para la eleccion de la se
nal de control, tomese la matriz de ponderacion de la forma
h(x) =
0 0 1 0
0 0 0 1
de donde se tiene la se
nal de penalizacion
z=
Hd
Hd
=
c
Iyy2
1
1 T
T
u = h (x)h(x) + 2 I4 g1 (x)H =
2
2
0
0
0
0
0
0
0
0
0
0
1
0 1 + 2 2
0
0
0
1 + 212 .
0
0
c
Iyy2
(3.5.2)
Con esta ley se garantiza el cumplimiento de la desigualdad de disipacion a lo largo de
las trayectorias del sistema en bucle cerrado, dada por
2 Kc2 1 { 2 w2 z2 }
H + (c )
2 Kc1 + (Iyy2 )
2
con lo que son aplicables las tres implicaciones del problema de rechazo de perturbaciones
descrito en la seccion 3.5. Concretamente la tercera de ellas determina la posibilidad de
encontrar, para cualquier constante c > 0, un valor (c) tal que si w(t) entonces
Hd (t) c. En nuestro problema es un hecho esencial, ya que si la funcion Hd (t) tal y
como se denio en (3.4.13) esta acotada, se deduce que la norma del error en posicion
tambien esta acotada (estabilidad entrada-estado).
51
Radar
Video
x(t),y(t)
Encoder/gyro q(t),q'(t)
Plataforma de sensores
qd(t),q' d(t)
Clculo visual de la
trayectoria de referencia
52
Es admisible armar que las coordenadas en pantalla (x,y), as como las coordenadas
tridimensionales en el sistema de referencia de la camara, (X,Y ,Z), son medidas del error
en seguimiento. Sin embargo, es necesario expresar dicho error en coordenadas articulares
(, ), y as se obtendra a continuacion. La posicion 2D del objetivo en la imagen capturada se supone estimada por un algoritmo de vision por computador estandar. El calculo
de las coordenadas (X, Y, Z) del objeto referidas al sistema de referencia de la camara se
deriva de las propiedades geometricas ilustradas en de la gura 3.5. Por semejanza de
Vista lateral
Plano de la Imagen
Y
y
d
Z
Plano de la Imagen
Vista superior
X
x
d
Z
triangulos, se tiene
X
x
=
d
Z
y
Y
=
d
Z
53
X =
Y
e =
= d
arctan
=
arctan
= 2
dt
Z
dt
d
d + x2
Y
d
y
yd
arctan
=
arctan
= 2
e =
= d ,
dt
Z
dt
d
d + y2
De donde obtenemos trayectoria articular deseada y sus derivadas en el instante t
e (t)
(t)
+
qd (t) =
(3.6.1)
(t)
e (t)
(t)
e (t)
qd (t) =
+
e (t)
(t)
(3.6.2)
Esta trayectoria objetivo calculada en tiempo real sera la referencia del bloque de estabilizacion de trayectorias que se dise
nara a continuacion con metodos basados en pasividad.
(3.6.4)
en la que se han omitido los terminos derivados de la energa potencial por razones anteriormente esgrimidas, y donde la matriz C(q, q)
viene expresada en terminos de los smbolos
de Christoel de primera especie como
1 mkj mki mij
cijk (q) = {
+
}
2 qi
qj
qk
54
siendo mab los terminos de la matriz de inercia en bucle abierto M (q). Para estabilizar la
orbita qd (t) aplicaremos la ley de control (Van der Schaft 2000)
= M (q) + C(q, q)
+
(3.6.5)
= qd (q qd )
(3.6.6)
donde
T
y = > 0. Esta variable fue introducida por primera vez en el celebrado controlador
de Slotine y Li (Slotine & Li 1987). Sustituyendo (3.6.5) en (3.6.4) resulta
M (q)s + C(q, q)s
= ,
(3.6.7)
= Ks
(3.6.8)
un aparece en
donde K = K T > 0 es una matriz denida positiva, y se realimenta seg
la estructura de control de la gura 3.6, se estabilizara la trayectoria de referencia como
indica la siguiente proposicion.
te +
M(q)s+C(q,q)s=n
~
n
n=Ks
s
Proposici
on 3.6.1. La ley de control
qd (q qd )) + K[q qd + (q qd )]
= M (q)[
qd (q qd )] + C(q, q)(
ametros de ajuste, y qd (t) es la trayectoria
donde K = K T > 0 y = T > 0 son par
calculada en (3.6.1), estabiliza asintoticamente en el punto (0, 0) la posicion (x, y) de la
imagen en pantalla del objetivo m
ovil en el sistema de la plataforma de sensores.
55
(3.6.9)
t1
Por tanto, e2 (t), t 0 es una secuencia de Cauchy, que como tal ha de converger a un
valor nito para t . El hecho de que e L2 y consecuentemente la integral en tiempo
innito de e2 (t) este acotada, implica necesariamente que este valor lmite es cero.
2
3.7 Simulaciones
Los razonamientos expuestos en este captulo se ilustran con mayor claridad mediante un
conjunto de simulaciones implementadas en SIMULINK. En sistemas no lineales, valores
como el tiempo de subida dependen del punto de operacion. Para ilustrar las capacidades
del controlador, se mostrara que la respuesta transitoria del sistema controlado no depende
del estado inicial, comportamiento usual en sistemas lineales. Al situar inicialmente la
plataforma con acimut cero e introduciendo un escalon en la referencia, de amplitud
180 grados, se hara una medida del tiempo de establecimiento. El sistema no lineal
original, controlado con una ley lineal, alcanzara el regimen permanente en un tiempo
que sera funcion de la conguracion de inicio del sistema, e intervendran en tal medida
el acoplamiento de ambos cuerpos.
Este fenomeno se entiende a la luz del momento de inercia rotacional. Como consecuencia de lo armado previamente, la respuesta a una entrada en escalon en el par
de orientacion del sistema original, tendra un tiempo de subida diferente para distintas
posiciones iniciales del cuerpo de elevacion. La gura 3.7 muestra el comportamiento del
sistema sin compensacion de los terminos de acoplamiento de la matriz de inercia. En este
caso se ha controlado el eje de acimut con un simple control PD, mientras que el eje de
elevacion se ha dejado libre de actuacion. Se han lanzado las simulaciones a partir de dos
condiciones iniciales (0 y /2 grados en elevacion) por ser puntos de equilibrio relativos
del sistema (en estas posiciones, no se ve modicada por la velocidad de orientacion).
La curva superior de la gura 3.7 corresponde al caso en el que 0 = 2 , con una menor
inercia efectiva () en la rotacion acimutal y un perodo transitorio mas breve de 487
milisegundos. La curva inferior ilustra el caso en el que = 0, con una mayor inercia en el
movimiento de orientacion, y por tanto un tiempo de subida mayor, de 882 milisegundos.
Finalmente conectamos el controlador a la entrada de los motores para realizar medidas
del tiempo de subida del sistema linealizado por realimentacion en dos simulaciones que
comienzan en sendas posiciones de equilibrio de la plataforma (0 = 0 y 0 = 2 ). Como se
56
180
160
Acimut (grados)
140
120
100
80
60
40
20
200
400
600
800
1000
1200
1400
1600
1800
2000
Comparacion de tiempos de subida en orientacion, para elevaciones iniciales de 0 y 90 g
Figura 3.7: Tiempos de subida diferentes para bajo diferentes condiciones iniciales, = /2
y = 0.
aprecia en la gura 3.8 ambas curvas estan superpuestas dado que el periodo transitorio
del seguimiento en orientacion ya no depende de la condicion inicial 0 . El tiempo de
subida del sistema lineal desacoplado es 641 ms en todos los casos. Este valor puede ser
ajustado a traves de los parametros Kc , Kd del controlador c .
200
180
160
Acimut (grados)
140
120
100
80
60
40
20
200
400
600
800
1000
1200
1400
1600
1800
2000
Comparacion de tiempos de subida en orientacion, para elevaciones iniciales de 0 y 90 g
Figura 3.8: Seguimiento de la referencia en el eje de acimut para valores iniciales diferentes de
, con compensacion de pares de acoplamiento.
57
(3.8.1)
(3.8.2)
0 = Izz1 + Izz2
/2 = Izz1 + Ixx2
(3.8.4)
(3.8.5)
58
(3.8.6)
(3.8.7)
() =
()
Ixx2
Izz2
, Ixx2 =
, Izz2 =
Kt
Kt
Kt
b =
b
co
p
, co =
, p =
,
Kt
Kt
Kt
=
Vin + (/2 0 )sen2 F
()
(3.8.8)
1
(Vin + b co )
()
(3.8.10)
59
el cambio de variable z = .
La u
ltima ecuacion expresada en terminos de la velocidad z
se transforma en
z + k1 z = k2
b
k1 =
, k2 =
()
(3.8.11)
Vin co
()
(3.8.12)
k1 =
(3.8.14)
k2
(3.8.15)
40
35
30
25
20
15
10
0.2
0.4
0.6
0.8
1.2
1.4
1.6
1.8
tabla 3.1 muestra los diferentes valores de la velocidad maxima alcanzada y los tiempos de
subida para elevacion nula, a medida que se incrementa el tama
no del escalon de entrada.
La tabla 3.2 muestra los mismos resultados cuando el movimiento parte con una elevacion
inicial de 45 grados.
A primera vista, las tablas 3.1 y 3.2 revelan una saturacion abrupta en la entrada.
Esta no linealidad se puede apreciar con mayor claridad en la gura 3.11 donde se traza
la maxima velocidad de rotacion frente a la amplitud del voltaje de entrada. La funcion
de saturacion es simetrica respecto a la tension de entrada nula. Por tanto la se
nal de
control esta acotada en el intervalo [0.6, 0.6]
60
Tabla 3.1: M
axima velocidad de rotaci
on y tiempo de subida para = 0.
10.3912
26.6888
45.0227
44.8184
44.832
0.116
0.105
0.102
0.061
0.056
Tabla 3.2: M
axima velocidad de rotaci
on y tiempo de subida para = 45.
11.0424
27.0524
44.5196
44.9311
44.8316
0.113
0.102
0.1
0.69
0.62
45
40
35
30
25
20
15
10
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
61
ecuacion (3.8.3) para cualquier valor de . S los lmites mecanicos no permiten angulos de
elevacion tan altos como = /2, como es el caso de nuestra plataforma de laboratorio, el
mismo procedimiento se llevara a cabo, haciendo los experimentos en = /4, y usando
la relacion
(3.8.17)
() = 0 + 2(/4 0 )sen2
Consecuentemente, a n de determinar analticamente la funcion de inercia efectiva (),
se deben llevar a cabo cuatro experimentos:
dos de ellos con elevacion nula a diferentes amplitudes del escalon de entrada en
acimut,
y los otros dos con el angulo de elevacion jo a /4 o /2 radianes (solo uno de ellos
a elegir).
En todos los experimentos se mantiene el sentido de rotacion constante para no interferir
con los fenomenos de friccion estatica2 . El parametro de friccion viscosa resulta
co = Vin k2 ()
(3.8.18)
62
x 10
3.5
2.5
1.5
0.5
0
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Figura 3.12: Inercia efectiva frente a la tension de entrada para una elevaci
on nula.
(400 y 800) hacen difcil de apreciar, en nuestro caso, los efectos de acoplamiento. Se han
realizado experimentos similares para el eje de elevacion y se obtuvo un valor medio del
momento de inercia Iyy2 en torno al eje y de 0.001.
grados
4
Posicin
Referencia
6
10
15
Tiempo(s)
63
10
grados
Posicin
Referencia
10
10
15
Tiempo(s)
6
Posicin
Referencia
grados
10
10
15
Tiempo(s)
64
6
Posicin
Referencia
4
grados
10
15
Tiempo(s)
grados
4
Posicin
Referencia
6
10
15
Tiempo(s)
65
grados
Posicin
Referencia
10
15
Tiempo(s)
66
Captulo 4
Control de sistemas subactuados
mediante el m
etodo IDA-PBC
Lo mayor parte de lo que se expondra en este captulo aparece publicado en el artculo
(Ortega, Spong, Gomez-Estern & Blankenstein 2002). En el estudiaremos la aplicacion
de una nueva formulacion del problema del control, basada en pasividad, conocida como
interconexion y asignacion de amortiguamiento (IDA-PBC), al problema de estabilizacion
de sistemas mecanicos subactuados. Este metodo, introducido inicialmente en (Ortega &
Spong 2000) a
nade a la modicacion de la energa potencial que se ha venido haciendo
habitualmente, el moldeo de la energa cinetica como va imprescindible para salvar los obstaculos relacionados con la subactuacion. La principal contribucion es la caracterizacion
de una clase de sistemas para la cual el IDA-PBC proporciona un controlador suave con
estabilizacion asintotica en un dominio de atraccion garantizado, la resolucion de algunos
problemas de control subactuado mediante esta tecnica, y el analisis transitorio de las
soluciones.
La clase en la que es aplicable esta tecnica se dene en terminos resolubilidad de
un conjunto de ecuaciones diferenciales parciales. Una ventaja importante del metodo
debida a su formulacion hamiltoniana (en oposicion al mas clasico metodo lagrangiano)
es la introduccion de nuevos grados de libertad para la solucion de estas ecuaciones, como
los elementos de la matriz de interconexion. Usando este grado de libertad adicional,
se puede probar que el metodo de Lagrangianos controlados en su formulacion original
puede verse como un caso particular del enfoque IDA-PBC. Con el n de ilustrar la
tecnica se dise
naran controladores asintoticamente estables para el clasico problema de la
bola en la viga, y para un sistema subactuado recientemente presentado (Spong, Corke
& Lozano 2001), el pendulo de disco inercial. En el primer ejemplo se probara que para
cualquier condicion inicial (excepto un conjunto de medida cero), el controlador es capaz
de conducir al sistema de la bola en la viga hacia la orientacion correcta. Asimismo,
deniremos un dominio de atraccion del equilibrio en el origen que garantiza que todas
las trayectorias permanecen acotadas dentro de los lmites de la viga. Para el pendulo de
disco inercial se probara que es posible levantar (swingup) y estabilizar el pendulo en la
posicion vertical superior sin conmutacion entre la ley de swingup y la de estabilizacion,
y sin necesidad alguna de sensores de velocidad.
67
68
4.1. Introducci
on
4.1 Introduccion
El control basado en pasividad (PBC) es una metodologa de dise
no para el control de
sistemas no lineales ampliamente conocido en aplicaciones mecanicas. En algunos problemas de regulacion, proporciona un procedimiento natural para moldear la energa potencial preservando, en bucle cerrado, la estructura de Euler-Lagrange del sistema. En
un profundo analisis en (Ortega et al. 1998), se extiende la aplicacion del PBC a una
amplia clase de sistemas descritos mediante ecuaciones de EulerLagrange, incluidos sistemas electricos y electromecanicos. En (Ortega, Loria, Kelly & Praly 1995) se propone el
uso de controladores dinamicos, conectados con la planta a traves de interconexiones que
preservan la potencia (y por tanto conservan estructura de Euler-Lagrange), para moldear
la energa potencial de una clase de sistemas de EulerLagrange subactuados empleando
medidas parciales del estado. Sin embargo, para estabilizar algunos sistemas mecanicos
subactuados, ademas de la mayora de sistemas electricos y electromecanicos, es necesario
modicar la funcion de energa total (potencial mas cinetica). Desafortunadamente, el
moldeo de energa total por el procedimiento clasico PBC, donde en primer lugar se selecciona la funcion de energa y despues se dise
na el control que fuerza la desigualdad de
la disipacion, destruye la estructura EulerLagrange. Esto acarrea en estos casos que el
sistema en bucle cerrado aun deniendo un operador pasivo deje de ser un sistema de
EulerLagrange, y la funcion de almacenamiento del mapa pasivo (que es normalmente
una funcion cuadratica del error) carece de signicado fsico, lo cual diculta el analisis
posterior del sistema controlado. A
nadido a esto, el metodo IDA-PBC incorpora la ventaja de resolver ciertos problemas de forma totalmente sistematica, como se vera en este
texto.
Tal y como se explica en la Seccion 10.3.1 del libro (Ortega et al. 1998), esta situacion
proviene del hecho de que esto dise
nos involucran una inversion del sistema a lo largo
de las trayectorias de referencia, heredando las pobres propiedades de robustez de los
dise
nos de linealizacion por realimentacion e imponiendo al sistema el articial requisito
de la invertibilidad.
Para solventar esta dicultad se desarrollo en (Ortega, Van der Schaft, Maschke &
Escobar 2002) (vease tambien (Ortega, Van der Schaft, Mareels & Maschke 2001, Van
der Schaft 2000)), un metodo de sntesis basado en pasividad denominado Interconexi
on y
Asignaci
on de Amortiguamiento, o IDA-PBC. Las principales caractersticas del metodo
IDA-PBC son:
1 Esta formulado para la clase de sistemas PCH, que es una clase que contiene estrictamente los sistemas de Euler-Lagrange, y
2 la funcion de energa en bucle cerrado se obtiene tras resolver un sistema de
ecuaciones diferenciales parciales como resultado de nuestra eleccion libre de interconexiones deseadas entre subsistemas y del amortiguamiento. Es bien sabido que
la resolucion de sistemas de ecuaciones diferenciales parciales (EDPs) es una tarea
difcil. Sin embargo, la EDP particular que aparece en IDA-PBC esta parametrizada
en terminos de las matrices de interconexion y amortiguamiento, las cuales pueden
ser elegidas cuidadosamente invocando consideraciones fsicas para resolverla. Este
punto ha sido ilustrado en varias aplicaciones practicas incluyendo sistemas de balance de masas, motores electricos, sistemas de levitacion magnetica, sistemas de
potencia, control de satelite y vehculos subacuaticos.
69
En este captulo, nos centraremos en la aplicacion del IDA-PBC al problema de estabilizacion de sistemas subactuados1 .
La principales contribuciones de este captulo son: la caracterizacion de una clase
de sistemas para la cual el metodo IDA-PBC proporciona una ley de control suave, la
aplicacion a dos problemas de control subactuado, el estudio de la estabilidad de los
controladores, y el analisis del comportamiento transitorio del clasico sistema de la bola
y la viga en bucle cerrado. La clase de sistemas de aplicacion del metodo esta denida
en terminos de resolubilidad de dos EDPs que corresponden a sendas etapas de moldeo
de la energa potencial y cinetica. A modo de ilustracion dise
naremos controladores IDAPBC asintoticamente estables para los clasicos sistemas de la bola en la viga y para un
pendulo invertido de reciente aparicion (Spong et al. 2001), el pendulo de disco inercial.
Para el sistema bola y viga se probara que para cualquier condicion inicial (excepto un
conjunto de medida cero) el controlador lleva la viga a la posicion horizontal con la bola
al centro de la viga. Mas a
un, deniremos un dominio de atraccion que garantice que la
bola permanece dentro de los lmites de longitud de la viga. Para el pendulo de disco de
inercia se presentara una realimentacion dinamica de la salida para la cual, de nuevo para
casi todas las condiciones iniciales se logra estabilizar el sistema en la posicion vertical
superior. Esto quiere decir que es posible levantar el pendulo desde su posicion estable en
bucle abierto y estabilizar arriba sin necesidad de conmutacion. Ademas, no es necesario
tomar medidas directas de la velocidad.
Otro tema de interes tratado en este captulo es situar el nuevo enfoque hamiltoniano
en perspectiva con el de los Lagrangianos Controlados para estabilizacion de sistemas
mecanicos simples subactuados, desarrollados en una serie de artculos de Bloch et al.
(vease (Bloch et al. 2000, Chang, Bloch, Leonard, Marsden & Woolsey 2002)), y continuados con el trabajo de (Auckly, Kapitanski & White 2002, Andreev, Auckly, Kapitanski,
Gosavi, Kelkar & White 2000). 2
Como se comento en el captulo 2, los metodos IDA-PBC y Lagrangianos Controlados
comparten objetivos y en cierta medida su fundamento teorico. Una diferencia central
entre ambos metodos recae en que mientras la dinamica EL objetivo en el metodo de
Lagrangianos Controlados se obtiene modicando exclusivamente la matriz de inercia
generalizada y la funcion de energa potencial, en IDA-PBC tenemos tambien la posibilidad de cambiar la matriz de interconexion, es decir, la estructura de Poisson del sistema.
A este respecto, se plantean las siguientes cuestiones:
1. Cual es la eleccion especca de este parametro libre que proporciona los mismos
controladores para ambos metodos?. Para responder a esta cuestion usaremos los
recientes resultados de (Blankenstein, Ortega & Van der Schaft 2001).
2. Podemos usar este grado de libertad adicional para simplicar la b
usqueda de
soluciones para las EDPs mencionadas? Para responder a esta pregunta escribiremos
las EDPs en una forma tal que los parametros libres aparezcan explcitamente como
entradas de control y trabajaremos con dos ejemplos clasicos para ilustrar como
se seleccionaran dichas entradas.
1
Cabe puntualizar que, tal y como se presentado, el metodo IDA-PBC se aplica solo a sistemas
estabilizables mediante leyes suaves, excluyendo una amplia clase considerada en (M. Reyhanoglu &
Kolmanovsky 2001). Sin embargo, la versi
on de IDA-PBC de (Fujimoto & Sugie 2001), se aplica tambien a problemas que involucren hamiltonianos variantes en el tiempo, permitiendo la estabilizaci
on con
controladores variantes en el tiempo.
2
En (Hamberg 1999) aparece una extension a los sistemas Lagrangianos en general.
70
3. Es el conjunto de modelos EL en bucle cerrado alcanzable por medio de IDAPBC mayor que el que se obtiene mediante metodos Lagrangianos? Si fuera as,
podramos caracterizar la diferencia? Proporcionaremos una respuesta a ambas
cuestiones, mostrando que con IDA-PBC podemos aun preservando la estructura
EL, a
nadir terminos giroscopicos al sistema en bucle cerrado, una caracterstica que
no aparece en la literatura del enfoque lagrangiano. 3
Para claricar mas a
un las conexiones entre IDA-PBC y Lagrangianos Controladosde
nuevo invocando(Blankenstein et al. 2001)probaremos que las condiciones de ajuste
(matching conditions) de (Bloch et al. 2000) caracterizan una clase de sistemas mecanicos
tales que sus funciones de energa cinetica puede ser moldeada sin resolver las mencionadas
EDPs. Obviando la necesidad de resolver dichas ecuaciones, principal obstaculo en ambos
enfoques, claramente aumenta la aplicabilidad de estos metodos de dise
no.
El resto del captulo se organizara del siguiente modo. En la seccion 4.2 presentamos
la aplicacion de IDA-PBC a sistemas mecanicos subactuados. Las secciones 4.3 y 4.4
contienen las derivaciones de IDA-PBC para los sistemas pendulo de disco inercial y la
bola en la viga, respectivamente. Por u
ltimo, se presentara un analisis novedoso de los
comportamientos transitorios del sistema de la bola y la viga en bucle cerrado controlado
mediante IDAPBC.
Recientemente, Bloch et al. (Chang et al. 2002) han extendido el metodo de Lagrangianos controlados
para obtener un metodo equivalente al IDA-PBC.
71
(4.2.5)
0
M 1 Md
Md M 1 J2 (q, p)
Rd = Rd =
0
0
0 GKv G
0
(4.2.7)
(4.2.8)
72
4.2.2 Estabilidad
Para la dinamica deseada en bucle cerrado se tiene la siguiente proposicion, la cual revela
las propiedades de estabilizacion del enfoque IDA-PBC:
Proposici
on 4.2.1. El sistema (4.2.6), con (4.2.3) y (4.2.4), tiene un punto de equilibrio
estable en (q , 0). Este equilibrio es asintoticamente estable si es localmente detectable
desde la salida7 G (q)p Hd (q, p). Una estimaci
on del dominio de atracci
on esta dado
a acotado}
c = sup{c > Hd (q , 0) | c est
(4.2.9)
Demostraci
on. De (4.2.3) y (4.2.4) tenemos que Hd es una funcion denida positiva en
un entorno de (q , 0). Un calculo sencillo muestra que a lo largo de las trayectorias de
(4.2.6), H d satisface
H d = (q Hd ) q + (p Hd ) p
= (p Hd ) GKv G p Hd
min {Kv }|(p Hd ) G|2 0
al ser Jd antisimetrica y Kv denida positiva. Consecuentemente, (q , 0) es un equilibrio
estable. Adicionalmente, al ser Hd propia (por denicion) en su subconjunto de nivel
c, todas las trayectorias comenzando en c estan acotadas are bounded. La estabilidad
asintotica, bajo la suposicion de detectabilidad, se establece invocando el teorema de
BarbashinKrasovskii y los argumentos usados en la prueba del Teorema 3.2 de (Byrnes,
Isidori & Willems 1991). Finalmente, la estimacion del dominio de atraccion proviene del
2
hecho de que c es el mayor subconjunto de nivel acotado de Hd .
73
(4.2.10)
(4.2.11)
Las EDPs (4.2.10) pueden separarse de forma natural en los terminos que dependen
en p y terminos que son independientes de p, es decir, aquellos que corresponden a las
energas cinetica y potencial, respectivamente. Por tanto, el sistema de ecuaciones de
(4.2.10) puede reescribirse como
G q (p M 1 p) Md M 1 q (p Md1 p) + 2J2 Md1 p = 0
(4.2.12)
G {q V Md M 1 q Vd } = 0
(4.2.13)
La primera ecuacion es una EDP no lineal que ha de resolverse para los elementos desconocidos de la matriz de inercia en bucle cerrado Md . Dado Md , la ecuacion (4.2.13)
es una simple EDP lineal cuya incognita es Vd , y por tanto la principal dicultad se
halla en la resolucion de (4.2.12). La ecuacion (4.2.12) puede expresarse en una forma mas explcita con las siguientes derivaciones. En primer lugar usemos el hecho de
que q (z P (q)z) = [q (P (q)z)] z, para toda z IRn y cualquier matriz simetrica
P (q) IRnn , para escribir (4.2.12) como
G [q (M 1 p)] Md M 1 [q (Md1 p)] + 2J2 Md1 p = 0.
Entonces, aplicando la identidad
q (P (q)z) =
n
q (P(,k) )zk ,
k=1
valida para todo z IRn y todo P IRnn , donde P(,k) denota la columna kesima de
la matriz P , reparametrizando J2 en terminos de las matrices Uk (q) = Uk (q) IRnn
como
n
2J2 =
Uk pk
(4.2.14)
k=1
1
G
q (Md )(,k) + Uk Md
q (M(,k) ) Md M
=0
(4.2.15)
8
Se entiende por anulador por la izquierda de una matriz A, otra matriz B cuyas las est
an en el espacio
n
ucleo de A. Dicho anulador es de rango completo si el espacio generado por las las de B coincide con
el n
ucleo de A.
74
75
(4.2.16)
donde Lc es el lagrangiano deseado. Este problema ha sido estudiado con gran generalidad
en (Hamberg 1999), vease tambien (Blankenstein et al. 2001). Para el caso que nos
interesa, restringido a Lagrangianos de la forma
1
L = q M (q)q V (q),
2
1
Lc = q Mc (q)q Vc (q),
2
(4.2.17)
1
1
[q (M q)
G
M Mc q (Mc q)]
q q (q M q)
M Mc q (q Mc q)
= 0(4.2.18)
2
G {q V M Mc1 q Vc } = 0(4.2.19)
lo cual, de forma similar a (4.2.12), (4.2.13) del IDA-PBC, ajustan los terminos de energa
cinetica y potencial10 . Recordando que p = M q y deniendo una matriz
Mc (q) = M Md1 M,
la cual es, claramente simetrica y denida positiva, vemos que (4.2.19) coincide exactamente con (4.2.13)haciendo Vc = Vd . Mas a
un, la ecuacion (4.2.12) se reduce a (4.2.18)
si y solo si
(4.2.20)
J2 (q, p) = Md M 1 [q (M Md1 p)] q (M Md1 p) M 1 Md
Aunque la expresion de arriba puede ser comprobada mediante sustitucion directa, una
prueba mas elegante aparece en (Blankenstein et al. 2001) comprobando que la parte conservadora de energa del sistema PCH (4.2.3), (4.2.6) es equivalente al sistema mecanico
EL
0 In
q H c
q
=
pc
In 0
pc H c
1
donde pc = Mc q and Hc (q, pc ) = 12 p
c Mc (q)pc + Vc (q). Una forma alternativa para J2
puede obtenerse como
(J2 )(i,j) = p Md1 M (M 1 Md )(,i) , (M 1 Md )(,j)
siendo [, ] los corchetes de Lie y ()(i,j) representa el termino (i, j) de una matriz.
Tambien se ha mostrado en (Blankenstein et al. 2001) que podemos a
nadir a (4.2.20)
1
1
una matriz antisimetrica de la forma Md M {[q Q(q)] q Q(q)}M Md , siendo Q
9
En las referencias citadas (4.2.18) se expresan usando los smbolos de Christoel de segunda especie,
lo cual lleva a una notaci
on mas elegante y compacta. Para evitar notaciones adicionales se usar
a
preferentemente la forma expresada hasta ahora.
10
En (Ortega et al. 1995), vease tambien (Ortega, Van der Schaft, Maschke & Escobar 2002), se
desarrollan las condiciones de ajuste expresadas en terminos de restricciones algebraicaspara moldeo
de energa potencial de sistemas EL en bucle cerrado con controladores EL din
amicos.
76
1
Lc = q Mc q + q Q Vc
2
que incluye los terminos giroscopicos q Q, que resultan ser intrnsecoso dicho manera
sencilla, que no pueden ser eliminados mediante un cambio de coordenadas. En otras
palabras IDA-PBC general naturalmente una clase mas rica de sistemas EL ajustables
de la forma (4.2.16), los cuales no han sido considerados en la literatura del enfoque
lagrangiano.
Recientemente (Chang et al. 2002) han mostrado que un peque
no ajuste en el metodo
de los Lagrangianos Controlados da lugar a un metodo que es completamente equivalente
al IDA-PBC descrito en el captulo 4. Esencialmente, en lugar de restringir los sistemas
a la forma (4.2.16), tambien permiten incluir fuerzas externas en el sistema de Euler
Lagrange en bucle cerrado (por esto se entiende que el segundo miembro de (4.2.16) no
sea necesariamente igual a cero, sino cualquier fuerza externa). De este modo, es posible
escribir cualquier sistema mecanico hamiltoniano en un formato Euler-Lagrange incluyendo la parte no integrable del sistema hamiltoniano como un fuerza externa (giroscopica)
del sistema de Euler-Lagrange. Notese que este metodo solo funciona para la clase de
sistemas mecanicos simples, como los que se presentaran en este captulo. Considerando
esta clase mas amplia de sistemas EulerLagrange en bucle cerrado (Chang et al. 2002)
establece que el metodo de Lagrangianos Controlados es equivalente al metodo IDA-PBC.
11
Esto signica que la cuenca de atracci
on de nuestro controlador es un conjunto abierto denso en el
espacio de estados, lo cual es lo mejor que se puede esperar al usar una realimentacion continua (Shiriaev
& et al. 2000).
77
2
u
4.3.1 Modelo
Las ecuaciones dinamicas del dispositivo pueden ser escritas de una forma estandar usando
la formulacion EL (Spong & Vidyasagar 1989) como
0
1
mgLsen1
I 1 + I2 I2
=
u
+
2
I2
I2
0
1
donde 1 , 2 y I1 , I2 son los angulos respectivos y momentos de inercia de pendulo y disco,
m es la masa del pendulo, L es su longitud, g es la constante de gravedad, y u es el par
de control de entrada actuando entre el disco y el pendulo. El cambio de coordenadas
1
q1
=
q2
1 + 2
lleva a la descripcion simplicada
I1 0
q1
m3 senq1
1
+
=
u
q2
0
1
0 I2
(4.3.1)
donde m3 = mgL. El sistema puede ser escrito en forma hamiltoniana (4.2.2) con p =
[I1 q1 , I2 q2 ] , la funcion de energa total (4.2.1) y
1
I1 0
,
G=
,
V (q1 ) = m3 (cos q1 1)
M=
1
0 I2
El equilibrio a estabilizar es la posicion vertical con el disco inercial alineado, lo cual se
corresponde con q1 = q2 = 012 .
Comentario 4.3.1. El modelo del pendulo inercial de disco puede verse de dos maneras:
como un sistema denido en IR4 , o tomando q1 modulo 2, over S IR3 , siendo S el
crculo unidad. Para permitir leyes de realimentacion que no sean necesariamente 2
no del controlador. Sin embargo para
periodicas en q1 adoptaremos la primera para el dise
determinar el dominio de atraccion observaremos el sistema en el cilindro.
2
12
al ser simetrica la distribuci
on de masas del disco inercial, puede argumentarse que no hay raz
on
particular para alinearlo. A pesar de ello impondremos este objetivo para ilustrar la generalidad del
enfoque.
78
A. Moldeo de energa
Observese, en primer lugar, que los elementos de la matriz de inercia M no dependen de
q (sistema plano, del ingles at), y por tanto podemos hacer J2 = 0 y elegir Md como una
matriz constante, cuyos elementos seran:
a 1 a2
(4.3.2)
Md =
a2 a3
a1 > 0, a1 a3 > a22
(4.3.3)
Las desigualdad que se imponen a estos coecientes tienen como nalidad asegurar que
la matriz Md es globalmente denida positiva. La u
nica EDP que habra que resolver, por
tanto, es la de la energa potencial, que viene dada por la ecuacion (4.2.13), es decir
a1 + a2
I1
Vd
+
q1
a2 + a3
I2
Vd
= m3 senq1
q2
Vd (q) =
(4.3.4)
(4.3.5)
donde es una funcion diferenciable arbitraria que debemos escoger para satisfacer la
condicion (4.2.4) para q = 0. Asimismo se ha denido la constante 2 = I1 (a2 +
a3 )/(I2 (a1 + a2 )). Tras algunos calculos sencillos se prueba que la condicion necesaria de
estabilidad q Vd (0) = 0 se satisface si y solo si (z(0)) = 0, mientras que la condicion
suciente de mnimo (suponiendo que es cierta la anterior) 2q Vd (0) > 0 se cumplira si la
matriz hessiana de en el origen es denida positiva, y
a2 < a1
La positividad del hessiano se satisface con la eleccion13 (z) =
representa una ganancia ajustable.
(4.3.6)
k1 2
z ,
2
donde k1 > 0
13
Para simplicidad hemos tomado una funci
on cuadr
atica de . Claramente otras opciones, que pueden
ser seleccionadas para mejorar el rendimiento transitorio, son posibles; por ejemplo una funci
on de saturacion.
79
a2 a3 Vd
a1 a2 Vd
1
+
+ m3 senq1
=
2
I1
q1
I2
q2
= 1 senq1 + kp (q2 + 2 q1 )
(4.3.7)
kp = k1
a1 a3 a22
I2 (a1 + a2 )
2 >
I1 1
I2 1 m 3
(4.3.8)
3
2
I1
2=
I2
1
0
1
=m
1
2
3
2
10
80
proponemos a
nadir amortiguamiento realimentando la nueva salida pasiva p Hd G, la
cual puede ser calculada como
1
[(a2 + a3 )p1 + (a1 + a2 )p2 ]
a1 a3 a22
= k2 (q2 + 2 q1 )
G p H d =
(4.3.9)
2)
donde hemos denido k2 = Ia21(aa13+a
> 0, con positividad derivada de (4.3.3) y (4.3.6).
a2
2
(4.3.10)
81
kv D
(q2 + 2 q1 ),
D + 1
siendo D = dtd , y kv , > 0 algunos parametros del ltro. La idea relevante es que udi es
implementable sin realimentacion de la velocidad. Esta consideracion nos lleva a nuestro
resultado nal contenido en la proposicion abajo. La prueba resulta a lo largo de las
lneas en la siguiente proposicion.
Proposici
on 4.3.2. Considerese el pendulo de disco inercial (4.3.1) en bucle cerrado con
la realimentaci
on dinamica de la salida IDA-PBC
u = 1 sen(q1 ) + kp (q2 + 2 q1 ) + udi
donde 1 , 2 satisfacen (4.3.8), kp > 0 es una ganancia proporcional; udi es un termino
de inyecci
on de amortiguamiento generado a partir de la derivada sucia de las posiciones
como
kv
1
= + 2 (q2 + 2 q1 )
kv
udi = (q2 + 2 q1 )
(4.3.11)
con , kv > 0. Entonces, para toda condicion inicial excepto un conjunto de medida
ceroel pendulo converge hacia su posici
on vertical superior con todas las se
nales internas
acotadas uniformemente.
82
Demostraci
on. En primer lugar, notese que de (4.3.9) y (4.3.11) se obtiene
1
kv
G p H d
u di = udi
k2
0
0
M 1 Md
q
q W
M M 1
kv
p W
G
0
d
p =
2
kv
kv
u di
udi W
k2 2
0 k2 G
k2 2
u ,
2kv di
Kp=1
1.5
Kp=1
Kp=0.1
0.5
q2 (rad)
q1 (rad)
Kp=0.1
1
0.5
2
1
1.5
10
15
20
25
tiempo (segundos)
30
35
40
10
20
30
40
50
60
tiempo (segundos)
2.5
83
Kv=100
1.5
Kv=10
Kv=100
q2 (rad)
q1 (rad)
0.5
Kv=10
2
0
0.5
Kv=50
Kv=50
1.5
3
0
10
12
14
16
18
20
10
15
20
25
30
tiempo (segundos)
tiempo (segundos)
10
10
15
10
15
20
25
tiempo (segundos)
Figura 4.5: Se
nal de control para kv = 10, y kp = 0.1.
4.4.1 Modelo
Este sistema es un clasico que ocupa un lugar en los laboratorios de control de las universidades de todo el mundo. Existen conguraciones alternativas y las ligeras variaciones
en la construccion pueden dar lugar modelos con estructuras muy diferentes.
En general, para el modelado se desprecia la inercia rotacional de la bola. Este hecho es
a
un mas razonable cuando en lugar de la bola tenemos un peque
no carro sobre railes como
el construido recientemente en la universidad de Linz (gura 4.7). Esta conguracion tiene
84
q1
q2
una caracterstica peculiar, consistente en que la lnea de avance del carro no intersecta con
el eje de giro de la viga o rail. El carro esta levemente desplazado hacia arriba. La principal
consecuencia de este desplazamiento es que en el modelo aparecen elementos no diagonales
en la matriz de inercia en bucle abierto, a diferencia del modelo que emplearemos en
nuestro desarrollo. En cualquier caso, este u
ltimo sirve como aproximacion bona de y
sera descrito a continuacion.
El modelo que emplearemos, el mas aludido en la literatura, fue presentado por Hauser
et al. (Hauser, Sastry & Kokotovic 1992), donde se proponen las siguientes ecuaciones de
EulerLagrange
Jb
+ m q1 + mgsen mq1 2 = 0
2
R
2
mq1 + J + Jb + 2mq1 q1 + mgq1 cos =
(4.4.1)
donde q1 , q2 son la posicion de la bola y el angulo de la viga, respectivamente. Las constantes J y Jb representan los momentos de inercia de la viga y la bola, respectivamente,
mientras que m es la masa de la bola, R su radio y g la aceleracion de la gravedad de
valor 9.8m/s. Finalmente, es el par de control aplicado a la viga.
Para traer al primer plano los parametros relevantes de nuestro desarrollo, haremos
unas leves modicaciones. Si se desprecia la inercia rotacional de la bola frente a la de
la viga, dividimos ambas ecuaciones entre la masa de la bola m, y denimos u = /m
85
tendremos
q12 +
J
m
q1 + gsen q1 2 = 0
(4.4.2)
(4.4.3)
1
0
2
0 L + q12
, G=
0
1
y la funcion de energa potencial V (q) = gq1 sen(q2 ). El objetivo del control es estabilizar
la bola y la viga en su posicion de reposo con q1 = q2 = 0.
0
j(q, p)
j(q, p)
0
86
1
0=
p1 a3 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )2 a2 (q1 ) dqd a2 (q1 )
p1 dqd a3 (q1 )
1
1
1
1
a1 (q1 )
2
p2 a2 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )2 a2 (q1 ) dqd a2 (q1 )
p2 dqd a2 (q1 )
1
1
1
1
p1 +
2
p1 a2 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )2 a2 (q1 ) dqd a2 (q1 )
p1 d a2 (q1 )
1
1
1
dq1
+
2
p2 a1 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )2 a2 (q1 ) dqd a2 (q1 )
p2 dqd a1 (q1 )
1
1
1
1
p2
+
que es globalmente denido positivo, como se deseaba, para todo > L2 . Por simplicidad,
se tomara = L2 en adelante. La matriz Md resultante es entonces
1
2(L2 + q12 )1/2
(4.4.5)
Md = (L2 + q12 )
$
2
2
2(L + q1 )
1
El moldeo de energa cinetica es completado evaluando j en (4.2.12) y la Md calculada
arriba
87
Vd
a2 (q1 ) Vd
(q) + 2
(q) = gsen(q2 )
q1
L + q12 q2
(4.4.7)
2L
g
>equ:=a*diff(Vd(x1,x2),x1)*sqrt(1+x1\^2)+b*diff(Vd(x1,x2),x2)=sin(x2);
>sol:=pdsolve(equ);
lo cual produce (tras deshacer el cambio de variables) el siguiente resultado16
Vd (q) = g cos(q2 ) + (z(q))
q
1
1
z(q) = q2 arcsenh
L
2
En esta ecuacion, una funcion arbitraria diferenciable de z. Esta funcion debe ser
escogida para asegurar la asignacion del punto de equilibrio, es decir, para satisfacer
(4.2.4) con q = 0. A este n, evaluaremos el gradiente
12 2 z (z(q))
2(L +q1 )
q Vd (q) =
gsen(q2 ) + z (z(q))
Evidentemente, una condicion necesaria para asignar el equilibrio en cero es z (z(0)) =
0. Cabe comentar que, independientemente de la eleccion de , (o la constante de integracion ), el bucle cerrado tiene otros puntos de equilibrio. Ciertamente, al ser z(0) = 0
q ) = 0 tiene
y senh() una funcion monotona creciente de primer ytercer cuadrante, q Vd (
un n
umero contable de races dados por q = (Lsenh( 2i), i), con i IN . Por otro lado,
se tiene que solo el equilibrio donde, |
q1 | L es el equilibrio en cero. Por supuesto, esta
propiedad es signicativa a efectos practicos solo si somos capaces de mostrar que en las
trayectorias se cumple |q1 (t)| L para todo t 0, tarea que se emprendera mas adelante.
Es importante recordar que, los equilibrios q2 = i con i par corresponden a la viga
en su orientacion original, mientras que para i impar la viga aparece rotada 180 . Se
16
88
demostrara a continuacion que, para una eleccion adecuada de , podremos hacer los
primeros equilibrios estables y los u
ltimos inestables.
Para estudiar la estabilidad de los equilibrios comprobaremos la positividad del Hessiano de Vd , evaluado en q, que toma la forma
1
2
q ))
12 2 2z (z(
q ))
2 ) z (z(
2 +
2(L
q
2(L +
q1 )
1
q) =
2q Vd (
1
2
2 2 z (z(
q )) g cos(
q2 ) + 2z (z(
q ))
2(L +
q1 )
4
3
8
2
6
1
4
1
2
0
0.6
0.4
3
0.2
0.2
0.4
4
0.6
89
Figura 4.9: Curvas de nivel de Vd (q) alrededor del origen para kp = 0.05.
Figura 4.10: Curvas de nivel de Vd (q) alrededor del origen para kp = 0.01.
q1
1
2
2
p2 + (q)
ues =
(4.4.9)
L2 + q12 p1 + 2p1 p2 + $
2(L2 + q12 )
L2 + q12
donde
%
#
q
2 + q2
1
L
1
1
2
(q) = gq1 cos q2 g 2(L2 + q1 )senq2 kp
q2 arcsenh
2
L
2
La fase de dise
no del controlador se culmina con el termino de inyeccion de amortiguamiento (4.2.8), que resulta
&
'
kv
2
udi = 2
p2
p1
(4.4.11)
L + q12
L2 + q12
Es importante subrayar que, a pesar de su aparente complejidad, el controlador esta
denido globalmente y en su exponente maximo es cuadratico. Esta es una propiedad
muy importante para el control, ya que la saturacion debe ser evitada en aplicaciones
practicas, as como la complejidad del calculo. Ademas, el papel de los parametros de
ajuste admite un sencillo analisis: kp es un ganancia proporcional bona de en posicion,
ya que multiplica terminos que crecen linealmente en q, y kv inyecta amortiguamiento
a lo largo de una direccion especicada de las velocidades. El ajuste del controlador se
simplicara por esta caracterstica, tal y como se ilustra en el apartado de simulaciones.
90
atracci
on c donde c = {(q, p) IR4 | Hd (q, p) c}, donde Hd toma la forma (4.2.3),
Md viene dada por (4.4.5), y Vd y c denidas seg
un (4.4.8), (4.2.9), respectivamente.
Adicionalmente, para todas las condiciones iniciales, excepto un conjunto de medida cero,
la bola converger
a asintoticamente al origen con inclinaci
on nula cd la viga, es decir, para
casi todas las trayectorias se tiene que limt q2 (t) = 0.
Demostracion. La estabilidad del equilibrio en cero se desprende de vericar las condiciones de la Proposicion 4.2.1. Sin embargo, para establecer la estabilidad asintotica, en
lugar de comprobar la detectabilidad se invocara el teorema de Matrosov17 . Para ello se
tomara una funcion auxiliar W (q) = q1 + q2 cuya derivada a lo largo de las trayectorias
del sistema en bucle cerrado es
= p1 +
W
Ahora, H d = 0 si y solo si
1
p2
L2 + q12
p1 =
L2
2
p2
+ q12
donde W
es una funcion no desvaneciente denida en el conjunto {(q, p)|Hd = 0}, y las condiciones
del teorema se satisfacen (en un entorno de cero) siendo Hd la funcion de Lyapunov
requerida.
De forma similar a la prueba de la Proposicion 4.3.1, para probar la propiedad de
cuasi convergencia establecida previamente observaremos al sistema en IR S IR2
para establecer el acotamiento de todas las trayectorias. Para sumergir el sistema en este
cilindro cambiaremos la primera coordenada por
q
1
1
q1 = q2 arcsenh
(4.4.12)
L
2
y deniremos coherentemente la funcion de energa
1
d (
1 (
H
q1 , q2 , p) =
q1 , q2 )p + Vd (
q1 , q2 )
p M
d
2
kp
Vd (
q1 , q2 ) = g(1 cos q2 ) + q12
2
(4.4.13)
(4.4.14)
91
es similar a la presentada para el pendulo de disco inercial, recordando que para todo
esquilibrio estable tendremos el comportamiento asintotico deseado en q2 , mientras que
los otros equilibrios son inestables.
2
Antes de cerrar este apartado cabe destacar que en este ejemplo no es posible reemplazar medidas de velocidades por las derivadas sucias de la posicion. Esto se debe a que en
el controlador de la bola en la viga, ademas del termino de inyeccion de amortiguamiento,
el termino de moldeo de energa depende explcitamente de p.
D. Comportamiento transitorio
Se ha establecido en la Proposicion 4.4.1 que en bucle cerrado el origen es un equilibrio
asintoticamente estable con la energa total como funcion de Lyapunov.
En este apartado se renara este analisis, estudiando el efecto del parametro de ajuste
no del dominio de atraccion, y cuanticando explcitamente un conjunto de
kp en el tama
condiciones iniciales tales que la bola permanece todo el tiempo dentro de los lmites de
la viga es decir, |q1 (t)| L para todo t 0.
En primer lugar, cabe destacar que a medida que Hd decrece y siempre que la energa
cinetica sea no negativa, tendremos que Vd (q(t)) Hd (q(0), p(0)), y por tanto los subconjuntos de nivel Vd (denidos por Vd c para cada constante c) son conjuntos invariantes
para q(t). Adicionalmente, si podemos demostrar que la energa cinetica esta acotada,
entonces los conjuntos acotados proporcionan una estimacion del dominio de atraccion.
Antes de continuar cabe puntualizar que en un campo potencial como el de Vd , debido a la existencia de funciones periodicas, algunos conjuntos de nivel denidos como
{x IRn |Vd (x) < c} pueden descomponerse en una serie innita discreta de componentes
conexas, desconectadas entre s. Si este es el caso, nos interesaremos por la componente
que contiene al origen, al ser este el equilibrio a estabilizar (vease la gura 4.11).
;;;
;;;
;;;
;;;
;;; ;;;
q1
q2
92
20
18
16
14
12
q1
10
2
10
20
30
40
50
60
70
q2
93
(i) Siempre es posible calcular una constante kpM > 0, funcion de las condiciones iniciales (q o , po ), tales que para todo kp kpM , el conjunto
1
{(q, p) | p Md1 (q)p + g(1 cos q2 ) < 2g}
2
(4.4.15)
es una estimaci
on del dominio de atracci
on del equilibrio en el origen. En particular,
todas las trayectorias que comiencen con velocidad cero y q2o (, ) converger
an
asintoticamente al origen.
(ii) Fijemos kp kpM y supongamos que |q1o | < L. Entonces,
!
q 1 k g "
1 1
kp
1
1
p
<
(q, p) | p Md (q)p + g(1 cos q2 ) +
q2 arcsenh
2
2
L
8 2kp + g
2
(4.4.16)
es un dominio de atracci
on del equilibrio en cero, tal que todas las trayectorias
comenzando en este conjunto satisfacen |q1 (t)| < L para todo t 0.
Demostracion. Se ha mostrado previamente que los subconjuntos de nivel de Vd (q) son
conjuntos invariantes para q(t). Adicionalmente, el Lema 4.4.2 establece que la particion
conexa de los subconjuntos de nivel de Vd (q) que contenga el origen esta acotada si y solo
si c < 2g. Por tanto, haciendo c = Hdo en el Lema 4.4.2 se desprende que este conjunto
estara acotado si y solo si
1
kp
Hdo = (po ) Md1 (q o )po + g(1 cos(q2o )) + q12 < 2g
2
2
Claro esta que, si los dos primeros terminos son estrictamente menores que g, podremos
siempre encontrar una cota superior para kp tal que la desigualdad se mantenga. Para
completar la prueba del punto (i) de la proposicion cabe comentar que, para todas las
trayectorias comenzando en el conjunto (4.4.15), q(t) esta acotado. Por tanto, de (5.9.11),
concluimos que en este conjunto Md1 (q(t)) > I para cierta constante > 019 . Esto, unido
al hecho de que 12 p (t)Md1 (q(t))p(t) < Hdo , establece que la correspondiente p(t) tambien
esta acotada y el conjunto (4.4.15) es una estimacion del dominio de atraccion.
La prueba de (ii) procede a continuacion. De (4.4.12) se tiene que
1
|q1 | L |q2 q1 | arcsenh(1)
2
(4.4.17)
donde hemos usado el hecho de que arcsenh() es impar y monotona. La region denida
por (4.4.17) aparece en la gura 4.13 junto a los dos conjuntos c . Nuestro problema es
entonces calcular el mayor valor de c tal que el conjunto c no intersecte las lneas q1 = q2
1 arcsenh(1). Para simplicar las expresiones usaremos la desigualdad 1 arcsenh(1) > 1 ,
2
2
2
y comprobaremos la interseccion con las lneas mas cercanas q1 = q2 12 en la banda
q2 [ 12 , 12 ]. A continuacion, substituiremos q1 = q2 + 12 en la ecuacion del contorno de
q2
94
g
La segunda desigualdad se cumple para todo c < 18 2kkpp+g
y todo q2 en la banda. Esto
demuestra que el contorno de c no intersecta las lneas lmite dentro de la banda. Por
otra parte no pueden intersectar fuera del intervalo porque c > g(1 cos( 12 )) implica que
g
en c , |q2 | < 12 , y esta cota en c es menos estricta que c < 18 2kkpp+g
. Esto completa la
demostracion.
20
18
q1=q2+m
16
14
q =q m
1
V >c |q |<L
12
V <c |q |<L
q1
10
V c |q |<L
d 2
2
10
20
30
40
50
60
70
q2
1 arcsenh(1).
2
95
las trayectorias estan contenidas en curvas de nivel cerradas que permiten calcular cotas para las trayectorias. Evidentemente, Hd (0) depende de las condiciones iniciales del
sistema.
Al igual que se hizo en la secci
on anterior, emplearemos un cambio de coordenadas
1
(z, q2 , p1 , p2 ), z = q2 2 arcsenh q1 , recordando que dicho cambio representa un difeo d (z, q2 , p1 , p2 ) = Hd (q, p)
morsmo global. La funcion de energa en las nuevas variables H
toma la forma
T
1 p + V (z, q2 )
d =
p M
H
d
2
kp
V (z, q2 ) = g(1 cos q2 ) + z 2
2
(4.4.18)
(4.4.19)
q22
2 2
q2 ,
(4.4.20)
1 cos q2 >
4
3 3
Para demostrarlo solo hay que observar el termino indeterminado de cuarto orden en
forma diferencial (lagrangiana) del desarrollo en serie de Taylor de la funcion cos(x) en
torno a x = 0. Esto nos lleva al siguiente lema:
Lema 4.4.4. Sea c = {(z, q2 ) | V (z, q2 ) c}, para cierto valor c > 0, un subconjunto de nivel de la funcion V (z, q2 ) denida en (4.4.19). Sea 0c el mayor subconjunto conectado de c que incluya al origen (vease la gura 4.11) y defnase el conjunto
Sc = {(z, q2 ) | g
q 2 + k2p z 2 c} que esta delimitado por una elipse para cualesquiera
4 2
valores > 0, kp > 0.
2
g 2
q
4 2
kp 2
z
2
(c D)
96
kp
<
2
z02
2
9
Demostraci
on. Partiendo del hecho de la disipatividad con respecto a Hd en bucle cerrado
hemos mostrado que todas las trayectorias estan connadas en el conjunto V (z, q2 ) <
Hd (0). Si ahora hacemos c = Hd (0) en el lema 4.4.4 se tiene que 0c = {(V (z, q2 ) <
kp 2
2
Hd (0)) D} esta acotado por la elipse
Sc si Hd (0) = h + 2 z0 < g 9 lo cual es cierto
si y solo si h <
2
,
9
kp
<
2
z02
2
9
h .
97
el efecto de la constante (que antes se hizo igual a 1) sobre la posicion de los equilibrios.
En las coordenadas (z, q2 ), una trayectoria dentro de los lmites de la barra satisface el
hecho
!
"
1
L
=m
(4.4.22)
|q1 | L |q2 z| arcsenh
2
Esto se debe a que
L
L
L
|q1 | L senh
2(q2 z) < arcsenh
2(q2 z) arcsenh
4.4.4 Simulaciones
Se ha realizado un conjunto de simulaciones del sistema de la bola en la viga tomando
g = 9.8, kp = 1 . Los resultados aparecen en la gura 4.14. Las gracas en la la superior
representan la posicion de la bola q1 y el angulo de la viga q2 para una velocidad inicial
nula y diferentes posiciones iniciales y valores de los parametros. Al pie de cada una
de ellas se muestran las gracas correspondientes con el hamiltoniano deseado Hd y la
funcion de energa potencial Vd . Cada columna en la graca corresponde a una simulacion
aislada. En las dos primeras simulaciones se puede observar el efecto de aumentar la
constante de amortiguamiento kv comenzando con la bola en posicion vertical. Notese
que la convergencia no es siempre acelerada para valores mayores de kv , al entrar en
escena nuevas oscilaciones. La tercera simulacion comienza en reposo con la viga en
posicion horizontal y la bola en el extremo de la viga. En sucesivas simulaciones, se ha
observado que el controlador funciona mejor comenzando en q2 (0) = 0 y cualquier valor
de q1 (0). Para asegurar que la condicion inicial se halla en el dominio de atraccion, kp se
ha escogido por debajo de kpM de acuerdo con la Proposicion 4.4.3. La gura 4.14 tambien
ilustra la naturaleza monotona de Hd junto al hecho de que Vd (t) < Hd (t) < Hd (0) para
todo t.
El efecto de la viga de longitud nita y el uso de la u
ltima parte de la Proposicion 4.4.3
se ilustra mediante simulacion en la gura 4.15. Los valores asignados a los parametros
son g = 9.8, kp = 1, kv = 50, y L = 10. Se ha calculado que la condicion para mantener la
bola dentro de los lmites de la viga es Hd (0) < 0.1038. La primera simulacion comienza
en el estado (q 0 , p0 ) = (8, 0, 1, 1) con Hd (0) = 0.1837. Debido a la velocidad inicial,
el controlador es incapaz de atrapar la bola antes de abandonar el lmite de la barra
(L = 10). En la segunda simulacion el sistema parte del estado (q 0 , p0 ) = (6, 0, 0.5, 1)
no y as los
y Hd (0) = 0.0928. Por tanto, la cota |q1 | < L esta garantizada por el dise
corroboran los resultados de la simulacion.
98
-50
-100
-50
-100
-150
50
100
0
Posicion frente al tiempo(s)
Hd(cont.), Vd(discont.)
Hd(cont.), Vd(discont.)
10
50
100
Posicion frente al tiempo(s)
-5
-10
100
200
300
Posicion frente al tiempo(s)
Hd(cont.), Vd(discont.)
-150
q1(cont.), q2(discont.)
q1(cont.), q2(discont.)
q1(cont.), q2(discont.)
10
50
100
Energia frente al tiempo(s)
0.15
0.1
0.05
50
100
Energia frente al tiempo(s)
100
200
300
Energia frente al tiempo(s)
10
q1(cont.), q2(discont.)
q1(cont.), q2(discont.)
-2
-2
-4
-4
-6
-8
50
100
150
tiempo(s)
200
250
300
-6
50
100
150
tiempo(s)
200
250
Figura 4.15: sistema de la bola en la viga comenzando con velocidad inicial no nula.
300
Captulo 5
Reducci
on del m
etodo IDA-PBC
para sistemas subactuados
5.1 Introduccion
Se observo en el captulo anterior que la principal virtud del metodo IDA-PBC reside
en que la funcion de energa total en bucle cerrado se obtiene mediante la solucion de
una ecuacion diferencial parcial (EDP) como un resultado de nuestra eleccion de la
interconexion de subsistemas y el amortiguamiento. Tal y como ilustran los ejemplos
analizados, este sistema es en general de difcil solucion.
La principal aportacion de este captulo es la denicion de una clase de sistemas
mediante un conjunto de condiciones facilmente satisfechas, que admiten ciertas manipulaciones algebraicas de las EDPs dadas por el metodo IDA-PBC para dar lugar a un
sistema reducido equivalente de ecuaciones diferenciales ordinarias (EDOs).
Estas ecuaciones son faciles de resolver, especialmente en sistemas de dos grados de
libertad. Las soluciones obtenidas mediante esta tecnica se aplican al moldeo de energa
en problemas de estabilizacion de sistemas subactuados con cierto grado de generalidad.
Dichas soluciones proporcionan la matriz de inercia Md (moldeo energa cinetica) y la
funcion de energa potencial Vd , ambos en bucle cerrado. Para dise
nar la ley de control
el resto del procedimiento presentado en el captulo anterior es de directa aplicacion.
Mediante la nueva formulacion, se obtiene un controlador suave con una amplia cuenca
de atraccion para los sistemas de la bola en la viga y el pendulo invertido en carro. Mas
a
un, para sistemas de dos grados de libertad y un actuador, comprendidos en esta clase,
las EDOs admiten una reparametrizacion de los elementos de la matriz de inercia en bucle
cerrado que conducen a una solucion algebraica directa del sistema de ecuaciones. Este
procedimiento completo se ilustra con el ejemplo del pendulo invertido.
Ademas, analizando las ecuaciones reducidas , se arroja una luz sobre problemas como
la perdida de controlabilidad en ciertos puntos, como es el caso del pendulo en su posicion
horizontal.
La exposicion se desarrollara en el siguiente orden. En primer lugar, se presentaran
los antecedentes existentes en cuanto a metodos de reduccion y resolucion de ecuaciones
de ajuste (matching conditions) para metodos de control basados en la estructura la99
100
Estos son las condiciones de ajuste 2 y 4 simplicadas de (Bloch et al. 2000), respectivamente.
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
101
102
(5.2.2)
Este concepto puede ser utilizado para el control de sistemas mecanicos, si elegimos la
matriz de inercia como tensor metrico denotando gij a los elementos de dicha matriz en
bucle abierto y gij en bucle cerrado. En virtud de (5.2.2) se deduce que g ij (
g ij ) denota
los elementos de la inversa de la matriz de inercia en bucle abierto (cerrado). Ademas si
se dene el smbolo de Christoel de segunda especie como:
1 gjk gik gij
[i j, k] =
+
k
2 xi
xj
x
y denimos las variables como sigue
ra = gai gir
se llega a que todo lagrangiano controlado en bucle cerrado con matriz de inercia gij y
energa potencial V debe satisfacer las ecuaciones
r] = [j k, a]
ra [j k,
ja Cr = Ca
ja
V
V
=
xr
xa
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
103
q Mij = ek
q (Md )ij
(5.3.1)
(5.3.2)
(5.3.3)
104
subactuados. Como consecuencia, las derivadas de los elementos de dicha matriz con
respecto al vector de posicion q = [q1 , . . . , qn ]T se reducen a una u
nica derivada con
respecto a qk .
En virtud de la hipotesis (5.3.3) la propiedad (5.3.2) se extiende a la matriz de inercia
en bucle cerrado. Es natural proponer la matriz de inercia Md (q) como solo dependiente
de la coordenada no actuada qk .
(5.4.1)
(5.4.2)
(5.4.3)
(5.4.4)
(5.4.5)
Esta
u
ltima expresion puede verse como
1 T
p Qp + eTk (J2 R2 )Md1 p = 0
2
Q = qk M 1 eTk Md M 1 ek qk Md1
(5.4.6)
(5.4.7)
(5.4.9)
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
105
(5.4.11)
106
= det(M )
La coordenada no actuada es q1 . Por tanto, k = 1 0 y G = eTk = [1 0]. De acuerdo
con las hipotesis dadas en la seccion 5.3.1, los terminos de M (q) solo dependen de la
coordenada no actuada. Por tanto es razonable proponer una matriz de inercia en bucle
cerrado de la forma
a1 (q1 ) a2 (q1 )
Md =
a2 (q1 ) a3 (q1 )
siendo las ai funciones a denir. Entonces podremos aplicar directamente la ecuacion
(5.4.12) calculando los diversos terminos que en ella aparecen
da1 da2
T
qk ek Md =
dq1 dq1
0
0
a
a
2m1 m2 q1 a1
1
2
[Md (qk M 1 )Md ]k = [a1 a2 ]
[a2 a3 ]
=
2m1 q1
(1 + m1 q12 )2
0 (1+m1 q2 )2
a2 a3
1
1
a1
[Md M 1 ]kk = [a1 a2 ] m2 =
m2
0
Con todo ello obtenemos el conjunto de ecuaciones diferenciales ordinarias
2m1 m2 q1 a22
d
a1 (q1 ) =
dq1
(1 + m1 q12 )2 a1
d
2m1 m2 q1 a2 a3
a2 (q1 ) =
dq1
(1 + m1 q12 )2 a1
(5.4.13)
(5.4.14)
A
nadiendo a estas ecuaciones la eleccion a3 = a1 a2 con la constante > 0 lleva a
la solucion con Md globalmente denida positiva que ha sido presentada en el captulo
anterior.
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
107
q2
q1
a
c cos q2
c cos q2
b
, G=
1
0
da2 da3
dq2 dq2
cs2
cs2 2
a2 cc2 + a3 a
qk eTk Md
108
lineales. Suponiendo que los elementos ai son todos funciones de q2 , se obtiene el sistema
da2
cs2
=
a1 a2 (2bcc2 ) + a1 a3 (ab + c2 c22 ) + a22 (ab + c2 c22 ) a2 a3 (2acc2 )
dq2
a2 cc2 + a3 a
2
cs2
da3
=
(5.4.15)
a2 (2bcc22 ) + 2a2 a3 (ab + c2 c22 ) a23 (2acc2 )
dq2
a2 cc2 + a3 a
Ahora bien, es posible deshacerse de todas las funciones trigonometricas, de modo que los
segundos miembros del sistema (5.4.15) se conviertan en funciones racionales de cos q2 .
Esto es cierto ya que si denimos x = cos q2 se tiene
d
d
() = senq2 ()
dq2
dx
debido al factor com
un s2 a la derecha del sistema (5.4.15).
Comentario 5.4.3. El cambio de variable x = cos(q2 ) no implica una perdida de generalidad, dado que debido a la simetra del sistema con respecto a q2 , las soluciones a las
ecuaciones deben ser pares y por tanto podran siempre ser expresadas en funcion del
coseno de q2
Las EDOs no lineales expresadas en funcion de x se transforman en
da2
= (x)
(5.4.16)
dx
da3
= (x)
(5.4.17)
dx
c
(x) =
a1 a2 (2bcx) + a1 a3 (ab + c2 x2 ) + a22 (ab + c2 x2 ) a2 a3 (2acx)
a2 cx + a3 a
2
c
(x) =
a2 (2bcx) + 2a2 a3 (ab + c2 x2 ) a23 (2acx)
a2 cx + a3 a
Nos centraremos en la solucion de (5.4.17) ya que en ella aparecen solo dos de los elementos
de la matriz Md . Es facil probar que siempre y cuando el termino [Md M 1 ]kk no se anule,
(x) es una funcion integrable y por tanto la ecuacion (5.4.15) admite una solucion de la
forma
*
a3 (x) = e
F (x)dx
(5.4.18)
Siendo una constante positiva ajustable. Con el n de obtener la funcion F (x) propondremos una nueva parametrizacion de los elementos de Md
a2 = f23 (q2 )a3
a1 = f13 (q2 )a3
(5.4.19)
(5.4.20)
Comentario 5.4.4. Notese que esta parametrizacion esta bien denida, ya que la u
nica
condicion que podra invalidar (5.4.19) o (5.4.20) es a3 = 0. Pero esto no puede suceder,
ya que a3 es un termino diagonal de una matriz que es denida positiva en el dominio de
denicion del controlador, por tanto a3 > 0.
Comentario 5.4.5. Las funciones f23 y f13 son incognitas con un grado de libertad, por
ejemplo, una vez elegida f23 arbitrariamente, f12 quedara determinada por la solucion
de(5.4.15).
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
109
(5.4.21)
(5.4.22)
(5.4.23)
sea positiva para cualquier valor de q2 se garantiza que Md es una matriz denida positiva
de la forma
f13 (q2 ) f23 (q2 )
(5.4.24)
Md = a3 (q2 )
f23 (q2 )
1
Con la eleccion de Md se concluye la fase de moldeo de energa cinetica del metodo
IDAPBC reducido. Sin embargo los elementos de dicha matriz han sido parametrizados
nador y siempre es
en terminos de una funcion f23 (q), que debe ser una eleccion del dise
posible conservar este grado de libertad para la fase de moldeo de energa potencial, donde
se dispondra de mas argumentos para la eleccion.
j = 1, 2
(5.4.25)
son cuadraticos en los elementos de Md y pueden contener dos o tres elementos de dicha
matriz. Si los reescribimos en la forma
eTk Md (qk M 1 )Md ej
j = 1, 2
110
(5.5.1)
(5.5.3)
(5.5.4)
donde es una funcion arbitraria que se empleara para asignar el equilibrio. La solucion
particular de la ecuacion completa resulta
q2
V
(2)
(5.5.6)
Vd =
1 qk dq2
Md M
k2
En consecuencia, todas las soluciones de (5.5.1) estan contenidas en la expresion
(1)
Vd = Vd
3
(2)
+ Vd
(5.5.7)
Lo cual no es incompatible con que V (q) dependa tambien de variables actuadas, como sucede en el
caso de la bola en la viga.
4
La derivada mencionada es funci
on de la variable no actuada, concretamente. Esto no es cierto en el
sistema de la bola en la viga, pero como se demostrara en el siguiente ejemplo, es un obstaculo salvable.
5
Si este no es el caso, las coordenadas pueden ser reordenadas de modo que la no actuada aparezca
en segundo lugar.
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
111
Si hemos de asignar un punto de equilibrio estable en q = q , entonces Vd debe ser tal que
q Vd (q ) = 0
2 Vd (q )
>0
x2
Como regla general, estas condiciones se traducen en
q (q ) = 0
2 (q )
>0
x2
(2)
2 Vd (q )
>0
x2
(5.5.8)
(5.5.9)
(5.5.10)
(5.5.11)
m1
q1
m2 m1 q2
la cual se resuelve empleando las ecuaciones (5.5.5), (5.5.6) y (5.5.7) para dar lugar a
m2
Vd = m1 m2 m3 cos(q2 ) + q2 $ arcsenh( m1 q1 )
2 m1
Una eleccion apropiada que verica las condiciones (5.5.8), (5.5.9) y (5.5.10) en q = 0 es
(z) =
kp 2
z
2
(5.5.12)
m2
kp
Vd = m1 m2 m3 cos(q2 ) +
q2 $ arcsenh( m1 q1 )
2
2 m1
(5.5.13)
112
Su derivada con respecto a qk es, como de costumbre, dependiente de una sola de las
coordenadas, q2 . En este caso i = k = 2. Haciendo uso de la factorizacion introducida en
(5.4.19) y (5.4.20) y el cambio de variable (5.4.16) podremos calcular cada termino de la
ecuacion de moldeo de energa potencial.
Vd
Vd
a3 (bf23 cx)
+ a3 (cf23 x + a)
= mglsenq2
(5.5.14)
q1
q2
En lo que respecta a la segunda parte de la solucion, Vd , la funcion f23 debe ser tal
que (5.5.10) se cumple en q = 0. Esto impone una condicion en f23 que restringe las
posibles soluciones de las ecuaciones de moldeo de la energa cinetica. De hecho, en q = 0
V
(2)
(q )
2
V
1 qk dq2 = q2 a3 (cxf23 (q) + a) qk =
q22
Md M
k2
2 V (q ) V (q )
+
=
a3 (cf23 (q ) + a) qk2
qk q2 a3 (cxf23 (q) + a)
El u
ltimo termino es cero ya que al contiene el factor
solo queda
V (q )
qk
2 V (q )
>0
a3 (cf23 (q ) + a) qk2
para lo cual es necesario que
a3 (cf23 (q ) + a) < 0
(5.5.16)
La condicion (5.5.16) unida a al hecho de que [Md M 1 ]kk = 0 se extiende a todo el rango
de x, lo cual signica que
a3 (cf23 (x)x + a) < 0
x [1, 1]
(5.5.17)
Observese que hasta el momento no se ha tomado partido por ninguna forma concreta de f23 con
lo cual el resultado es general salvo por la condicion [Md M 1 ]kk = 0. Se ha estudiado, sin embargo, la
posibilidad de que este termino se anule en q2 = /2, y se concluyo que no era compatible con ninguna
solucion global para la energa cinetica.
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
113
114
p1 f23 p2
2
f13 f23
(5.6.1)
a
c cos q2
2. Para lograr que Md sea denida positiva, f23 debe ser monotona creciente con respecto a x. Esto se puede demostrar sustituyendo f23 y el valor de a1 como una
solucion de (5.4.16) en det(Md ) = a1 a3 a22 , dando lugar a que el determinante tiene
el signo de dfdx23 .
3. f23 debe ser par con respecto a q2 , para que las ecuaciones en bucle cerrado sean
pares y puedan expresarse en funcion de x.
La u
ltima condicion permite expresar f23 en terminos de la nueva variable x. Notese
tambien que la primera condicion es tambien suciente para la integrabilidad de F (x).
Ademas, f23 debe ser elegida juiciosamente de modo que todas las integrales de una
variable que aparecen en el procedimiento posean una primitiva conocida7 . Este es el
caso de una funcion que tome la forma
f23 (x) =
1
f0 + x
Si < 0, f0 > 0 y f0 > ||, las dos primeras condiciones son satisfechas, mientras que la
tercera implica que
a
1
>
f0 + x
cx
7
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
115
donde se ha denido x = cos( 2 + ) como el lmite inferior del intervalo de validez del
controlador en terminos de x, es decir, x [x , 1]. Para cualquier valor especco de f0 ,
la constante debe ser tal que
c
f0
|| >
x a
Para nuestra solucion particular, la funcion F (x) toma la forma
bc2 x
2 2
2
2 f0 + x + 2 ab + 2 c x 2 ac x
F (x) =
(5.6.2)
(af0 + (a c) x)
Bajo las condiciones expresadas anteriormente esta funcion no presenta singularidades
dentro del intervalo de interes, y por lo tanto puede ser integrada. A pesar de la complejidad aparente, se trata de una funcion racional de x cuya primitiva se ha obtenido usando
la aplicacion de calculo simbolico Maple. Entonces los terminos de Md se calculan como
*
a3 (x) = e F (x)dx
a2 (x) = f23 a3 (x)
2
a2 2 (ab + c2 x2 ) + 2 a2 a3 acx
(a2 cx + a3 a) da
dx
a1 (x) =
2 a2 bcx + a3 (ab + c2 x2 )
donde es una ganancia ajustable positiva que no tiene efecto alguno en el signo de
det(Md ). En cuanto a los terminos de energa potencial, de la ecuacion (4.2.11) se deduce
claramente que solo se requiere el conocimiento de las derivadas Vd para implementar el
controlador, y por tanto no se requiere el calculo de la integral indenida (excepto para
algunas elecciones de la funcion libre (z) de la solucion de la ecuacion homogenea).
Proposici
on 5.6.1. Considerese el modelo del pendulo invertido lineal (5.1) en bucle
cerrado con la realimentaci
on estatica del estado IDA-PBC u = ues + udi obtenida en las
oticamente estable
secciones anteriores y kv > 0. Entonces, el origen es un equilibrio asint
4
con dominio de atracci
on c donde c = {(q, p) IR | Hd (q, p) c}, donde Hd toma la
(1)
(2)
forma (4.2.3), Md viene dada por (5.4.24), Vd = Vd + Vd y c denida seg
un (4.2.9).
Demostracion. Se reere al lector a la prueba de la proposicion (4.4.2) esbozada para el
control de la bola en la viga en el captulo 4.
2
5.7 Simulaciones
En esta seccion se muestra el comportamiento simulado de los sistemas controlados de la
bola en la viga y pendulo invertido lineal cuando se emplea el metodo descrito previamente.
La bola en la viga se simulo con las constantes m1 = m2 = kp = 1 y g = 9.8. Se observa
una gran cuenca de atraccion. Por ejemplo, un caso de simulacion comenzando en q2 =
(viga boca abajo) puede ser conducido a la posicion (0, 0) mediante el controlador dise
nado
para un conjunto de valores iniciales positivos de q1 .
La graca de la izquierda en la gura 5.3 representa el angulo de la viga comenzando
en (1, 1.5), con una constante de amortiguamiento kv = 10. La graca de la derecha
muestra la trayectoria de la bola comenzando en (1, 0) para distintos valores de kv .
116
1.5
0.8
0.5
0.6
0.4
Kv=10
0.2
0
0
0.2
0.5
10
12
14
16
18
0.4
20
Kv=1
10
15
20
Tiempo (s)
25
30
35
40
45
50
Tiempo (s)
En la simulacion del pendulo invertido, los parametros del modelo son los propuestos
en el artculo de (Bloch et al. 2000), concretamente m = 0.14 kg, M = 0.44 kg, y l=0.215
m. Las constates de nuestro modelo se obtienen indirectamente a partir derivan de ellas:
a = ml2 = 0.0064715 b = M + m = 0.58 y c = ml = 0.0301. Los valores empleados en
el dise
no del controlador son f0 = 1, = 0.8 y = 1014 (este u
ltimo con el criterio
de minimizar el rango de variacion de a3 en el dominio de denicion). La posicion y
velocidad deseada del carro es 0 m/s. El pendulo comienza en una posicion practicamente
horizontal q2 (0) = /2 0.3 rad, mostrando la amplia cuenca de atraccion del equilibrio
con el pendulo levantado. La gura (5.4) muestra los resultados de la simulacion. El
comportamiento es el deseado incluso partiendo de puntos cercanos al lmite del dominio
de atraccion. El rendimiento del controlador es muy satisfactorio como se puede apreciar
por el transitorio de tipo deadbeat que aparece en las gracas.
Velocidad del pendulo
1.6
0.04
1.4
1.2
0.02
1
0
0.8
0.6
0.4
0.2
0.02
0.04
0.06
0
0.2
0.08
0.4
50
100
150
200
250
300
350
400
450
500
0.1
0.2
tiempo (s)
0.2
0.4
0.6
Angulo del pendulo (rad)
0.8
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
117
1 + + + z 2 1
1
1+
(zsen + cos )
(5.8.1)
donde , son constantes positivas derivadas de los parametros fsicos. Este modelo es
empleado en los controladores basados en el metodo de los lagrangianos controlados y
su reduccion mediante las ecuaciones . En adelante se haran simulaciones a efectos de
comparacion de los transitorios y las cuencas de atraccion, aunque es preciso recordar que
bajo estos paradigmas de control no se han descrito tecnicas para acotar las trayectorias
en los transitorios de manera analoga a la expuesta en el captulo 4.
118
p2
+ q12
p22 q1
=
gsenq2
(L2 + q12 )2
= gq1 cos q2 +
q2 =
p1
p2
L2
x =
0
0 1
0
0 0
0 g 0
g 0 0
x +
0
0
1
L2
0
0
0
donde x = [q1 , q2 , p1 , p2 ]T . Es facil observar que el sistema lineal es controlable y observable en el origen. Por tanto, la tecnica de asignacion de polos es de directa aplicacion.
Sin embargo, una estructura tpica empleada en el aplicaciones practicas comprende la
anidacion de dos subsistemas control (gura 5.6): un subsistema rapido que lleva la viga
a una posicion deseada, y un sistema lento que toma la posicion de la viga como entrada
de un subsistema de control de la posicion de la bola. En este caso el subsistema de la
rd
PD
Qd
torque
Q(s)
PID
r
Ball & Beam
posicion de la bola es
q1 = p1
p1 = gq2 ,
donde q2 se considera la entrada. Este sistema equivale a
q1 = gq2
Una estructura de control PD para la estabilizacion de la bola en el origen dara
gqd2 = kp1 q1 kd1 q1
1
qd2 = (kp1 q1 + kd1 q1 )
g
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
119
q (0)=0.00, q (0)=0.30
1
100
0.5
50
Seal de Control
q (cont.), q (disc.)
0.5
50
100
1.5
10
15
20
tiempo(s)
25
30
35
40
150
10
15
20
tiempo(s)
25
30
35
40
donde kp1 y kd1 son ganancias ajustables, y qd2 representa el angulo de la viga deseado.
Ahora bien, este angulo tiene su dinamica propia, que debe ser controlada mediante un
lazo PD interno rapido (respecto al cual la referencia q2d sea cuasi-constante). La dinamica
linealizada de la viga viene dada por
p2
L2
= gq1 cos q2 +
q2 =
p2
120
q (0)=0.00, q (0)=0.70
1
150
100
50
Seal de Control
q1(cont.), q2(disc.)
50
100
150
200
250
5
300
10
15
20
tiempo(s)
25
30
35
350
40
10
15
20
tiempo(s)
25
30
35
40
q (0)=0.00, q (0)=1.00
1
x 10
5000
2
0
Seal de Control
q1(cont.), q2(disc.)
4
5000
10000
15000
20000
10
10
15
20
tiempo(s)
25
30
35
40
12
10
15
20
tiempo(s)
25
30
35
40
Figura 5.9: Control lineal de la bola en la viga, q2 (0) = 1 rad. Comportamiento inestable.
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
121
descrito por las ecuaciones (5.8.1). La resolucion de las ecuaciones de ajuste proporciona
el lagrangiano controlado dado por la metrica (matriz de inercia en bucle cerrado)
2
q1
5
2
g = e 6+6
2 1
y la funcion de energa potencial
(1+)
6
q
1 + iq1
i( 31 q2 )
Er
Re e
6 + 6
6 + 6
(5.9.1)
122
y
x
F2
F1
M =
M +m
0
0 mlsen
ml cos
2
ml
M +m 0
mlsen ml cos 0
(5.9.2)
Este
es un problema con gran cantidad de grados de libertad. La matriz de inercia en bucle
cerrado consta de diez elementos libres si se quiere preservar la simetra. Sin embargo el
analisis del signo de la matriz puede tornarse bastante complejo, de modo que vamos a
prescindir de buena parte de estos elementos. Propondremos la siguiente matriz de inercia
en bucle cerrado
a1
0
Md =
a2
a3
a4
a4
a5
(5.9.3)
cuyo determinante es det(Md ) = a1 (a2 a3 a5 a4 2 a3 ) , que debe ser positivo siguiendo las
directrices del metodo.
d
a4 (x) = ml2 M
dx
a4 mx
a4 2
a5
2
+
a2
(a4 xml a5 )1
M
lM
lM
0=
ml (2 a4 mlx2 + a4 ml + a5 x) a1
(a4 xml + a5 )
(5.9.4)
(5.9.5)
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
a4 mx
a4 a5
a5
d
2
a5 (x) = ml M 2
+
a4
(a4 xml a5 )1
dx
M
lM
lM
123
(5.9.6)
6. Para simplicar las ecuaciones se recurre al cambio x = sen lo cual implica que los
elementos de Md van a ser simetricos respecto a , (como sucede en la matriz de
inercia en bucle abierto M ).
Para hallar la solucion se despeja, del numerador de (5.9.5) a4 en funcion de a5 :
a4 =
a5 x
ml (2 x2 1)
2 x2 1
(5.9.7)
(5.9.8)
124
a1
Md =
(2 x4 1)C1 2
(2 x2 1)3/2 l2 m2
C1 x
2 x2 1ml
a3
C1 x
2 x2 1ml
C1
0
2 x2 1
(5.9.11)
a1
Md ( = 0) =
C1 x
2 x2 1ml
a3
C1 x
2 x2 1ml
(2 x4 1)C1 2
(2 x2 1)3/2 l2 m2
C1
2 x2 1
(5.9.12)
Esta matriz sera denida positiva si los menores descendentes de la matriz Md son positivos, es decir
(2 x4 1) C1 2
>0
(2 x2 1)3/2 l2 m2
a1 > 0
a3 > 0
al igual que el determinante
a1 C1 2 2 a3 (2 x4 1 x2 )
det(Md ) =
>0
(2 x2 1) l2 m2
Para garantizar la positividad de la matriz Md se debe escoger la constante C1 en el
siguiente intervalo
C1
a4 ml 2a4 ml
,
(5.9.13)
(5.9.14)
(5.9.15)
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
125
(5.9.16)
126
0
,
G
=
, V = mg cos q1
M (q1 ) =
1
0 + sen2 q1
(5.9.17)
Para el moldeo de energa cinetica debemos encontrar una matriz Md denida positiva
que cumpla las conocidas EDOs reducidas (5.4.12) con k = 1. Sustituyendo todos los
terminos esta ecuacion se traduce en
d
22 senq1 cos q1 a22
a1 (q1 ) =
dq1
( + sen2 (q1 ))2 a1
d
22 sen(q1 ) cos(q1 ) a2 a3
a2 (q1 ) =
dq1
( + sen2 (q1 ))2 a1
lo cual admite el cambio de variable x = sen(q1 ) dando lugar por tanto a
d
22 x a22
a1 (x) =
dx
+ x2 a1
d
22 x a2 a3
a2 (x) =
dx
+ x2 a1
Al igual que en el ejemplo de la bola en la viga, que posee muchas analogas con este, se
encontrara una solucion a este sistema de ecuaciones mediante la eleccion
a3 = ka2 a1
(5.9.18)
para cierto valor positivo de la constante k. En este caso, con una eleccion apropiada de
las constantes de integracion, se llega a una matriz Md denida positiva para cualquier
valor de q1 . Los elementos de Md resultan
%
2
( + sen2 q1 )
a1 =
k
1
a2 =
( + sen2 q1 )
k
3
2
2
2
a3 =
3 ( + sen q1 )
k 2
Sin embargo, independiente de que la eleccion de a3 sea diferente (5.9.18), se demostrara
en adelante que si a1 ha de ser positivo (lo cual es necesario para la positividad de Md ), la
ecuacion de energa potencial no admite ninguna solucion con un mnimo local en q1 = 0
(perla vertical superior).
Proposici
on 5.9.1. Considerese el sistema descrito por (5.9.17). El sistema de ecuaciones (5.9.18) del metodo IDA-PBC no admite ninguna solucion con Md denida positiva
en un entorno de q1 = 0 (perla en el cenit de la circunferencia), compatible con la existencia de un mnimo de Vd en dicho punto.
Demostraci
on. De hecho, la siguiente igualdad debe ser cierta para la funcion de energa
potencial deseada Vd :
G {q V Md M 1 q Vd } = 0
Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados
127
(5.9.19)
Suponiendo que a1 es distinto de cero, la solucion de esta EDP se expresa como la suma
de una solucion general de la ecuacion homogenea mas la particular de la completa:
q1
q1
a2
mgsenq1
dq1
(5.9.20)
Vd = q2
dq1
2
a1 ( + sen q1 )
a1
donde = (z) es la funcion arbitraria de la solucion homogenea y z servira para designar
el argumento de la funcion libre (z es funcion de q1 y q2 ). La solucion Vd tendra un
mnimo en q1 = 0 si y solo si
Vd
(q ) = 0
q
2 Vd
(q ) > 0
q 2
(5.9.21)
(5.9.22)
|
(
0
q=q
q=q
z
z
q1
q1 q2
q
a1
+
2q Vd (q ) =
.
(5.9.23)
z z
z 2 2
2
|
(
)
|
0
0
q=q
q=q
z
q1 q2 z
q2
Notese que la segunda matriz de esta expresion corresponde a la solucion no homogenea.
La primera matriz es singular al ser el Hessiano de una funcion escalar . Observando
los elementos diagonales y el determinante podemos concluir que esta matriz es denida
positiva si y solo si
2z |q=q >= 0
mgsenq1
> 0.
2z |q=q
q
a1
(5.9.24)
(5.9.25)
(5.9.26)
= a1 > 0.
q
a1
q=q
q=q
Esta condicion no puede ser cierta si a1 > 0, que es una suposicion natural que se desprende de la exigencia de que el sistema en bucle cerrado posea estructura hamiltoniana,
con matriz de inercia denida positiva.
Continuando con el razonamiento, se obtendra el conjunto de posiciones q donde la
funcion de energa potencial (5.9.20) presenta un mnimo. Dado que
2 Vd
2 mgsenq1
mg
sen(q1 ) da1
cos(q1 ) +
,
|q=q = 2
=
q 2
q
a1
a1
a1 dq1
q
(5.9.27)
128
El termino
Sustituyendo esta u
ltima expresion en (5.9.27) y reordenando los elementos se llega a
2 Vd
22 sen2 q1 a22
cos q1
1+
(5.9.29)
|q=q =
q 2
a1
( + sen2 q1 )2 a1
La u
nica manera de lograr que (5.9.29) sea mayor que cero es haciendo cos q1 < 0, lo
cual limita los posibles puntos de equilibrio del sistema hamiltoniano en bucle cerrado al
intervalo q1 [ 2 , 3
], la mitad inferior de la circunferencia.
2
2
Este
es un resultado previsible que se desprende de las consideraciones fsicas apuntadas al comienzo de este apartado, pero con el se ha pretendido ilustrar como se maniestan estos fenomenos al aplicar el metodo IDA-PBC. El problema surge del hecho de que
el metodo obvia las consideraciones de controlabilidad previas al dise
no de un controlador.
Captulo 6
Estabilizaci
on de oscilaciones en
sistemas no lineales
6.1 Introduccion
La mayor parte de las tecnicas de control desarrolladas en las ultimas decadas abordan
los problemas de estabilizacion asintotica de puntos de equilibrio y el seguimiento de
trayectorias. As sucede, por ejemplo, con el metodo IDA-PBC estudiado en captulos
previos de esta tesis. Sin embargo, en algunos sistemasincluyendo conversores de alterna
y robots caminantesel objetivo consiste en obtener oscilaciones estables y robustas.
La estabilizacion de oscilaciones es un problema que se ha considerado en la literatura
(Fradkov & Pogromsky 1998, Leonard, Bloch & Marsden 1998) empleando diferentes
metodologas.
Se presentara en este captulo un metodo para la generacion de oscilaciones estables
por realimentacion del estado en una clase de sistemas de control no lineales. El objetivo
propuesto es la estabilizacion basada en la energa de oscilaciones en sistemas mecanicos no
lineales en cascada. Las oscilaciones estan asociadas a un ciclo lmite que surge a traves de
una bifurcacion de Hopf supercrtica. El metodo que se introduce a continuacion consiste
en dos pasos. En primer lugar, un sistema de segundo orden sera controlado para dar
lugar a uno nuevo que experimenta una bifurcacion de Hopf all donde emerge un ciclo
lmite. En el segundo paso, el controlador se extiende a sistemas de orden mayor mediante
backstepping. A n de ilustrar el metodo descrito se ha realizado una implementacion sobre
un sistema de levitacon magnetica y se ha simulado el funcionamiento sobre un clasico
sistema mecanico subactuado: la bola y la viga.
En la parte nal del captulo se presentara otra tecnica alternativa para la estabilizacion de oscilaciones por realimentacion del estado. Para ello deniremos un sistema
de dimension dos que exhibe oscilaciones periodicas estables y robustas y lo sumergimos
en el espacio de estados de orden mayor del sistema a controlar, empleando la tecnica
de Inmersi
on e Invariancia de (Astol & Ortega 2001). Con este n, extenderemos el
resultado principal de esta tecnica que en su origen se aplica a la estabilizacion de equilibrios. Con peque
nas modicaciones el resultado se traslada tambien a la estabilizacion
de orbitas periodicas como se pretende aqu.
La ventaja principal de una ley de estabilizacion de oscilaciones mediante una reali129
130
6.1. Introducci
on
Trayectoria de
referencia
con informacin
de fase
Trayectoria de
la garra del robot
error
en t=0
error
en t=0
Orbita objetivo
sin informacin de fase
Posicin de la
rbita de referencia
en el punto de alcance
Posicin inicial de la
rbita de referencia
Figura 6.1: Comparacion entre el seguimiento de trayectorias dependientes del tiempo (izquierda) y la estabilizaci
on de orbitas peri
odicas sin informaci
on de fase (derecha).
En este captulo tambien estudiaremos la bifurcacion de Hopf (Hale & Kocak 1991,
Kuznetsov 1995) que aparece asociada a un parametro del controlador que propondremos.
La bifurcacion de Hopf es uno de los escasos metodos que permiten para determinar
la existencia de ciclos lmite en sistemas de dimension alta. Este hecho se emplea en
este captulo para generar de oscilaciones estables y robustas mediante el dise
no de un
controlador capaz de lograr que los sistemas pertenecientes a una clase no lineal, que
incluye una variedad de sistemas subactuados, experimenten una bifurcacion de este tipo.
El metodo introducido en este captulo para dise
nar el controlador comprende dos
pasos principales. En el primero se considera un sistema de segundo orden en bucle abierto.
Con la ley de realimentacion apropiada, este subsistema es transformado en otro con una
bifurcacion de Hopf y, consiguientemente, un comportamiento oscilante (Aracil, Gordillo
& Acosta. 2002). Entonces, en un segundo paso, la tecnica denominada backstepping
(Khalil 1996, Krstic, Kanellakopoulos & Kokotovic 1995, Sepulchre et al. 1997) se aplica
para extender la ley de control al sistema completo de orden mayor de tal manera que la
bifurcacion de Hopf se mantiene y, entonces, el comportamiento oscilante del subsistema
de segundo orden se propaga hacia todas la variables.
El metodo empleado para obtener la ley de realimentacion para el subsistema del
primera fase de dise
no pertenece a la familia de controladores no lineales relacionados con
metodos de moldeo de energa (Ortega et al. 1998). Tal y como se ha publicado recientemente la mayora de estos metodos proporcionan leyes de realimentacion que dirigen al
sistema controlado hacia un punto de equilibrio aislado (el punto de trabajo). Sin embargo, nuestro objetivo se ha transformado en la consecucion de un ciclo limite en regimen
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
131
permanente, que nace en una bifurcacion de Hopf. Conviene notar que el nacimiento
del ciclo lmite asociado a una bifurcacion de Hopf tiene lugar en un espacio de dos dimensiones. Este es el espacio natural en el que se dene el subsistema de segundo orden
en bucle abierto considerado en la primera fase del metodo. De hecho, el metodo que
se presenta en estas paginas comienza con la bifuracion de Hopf (y por tanto del ciclo
lmite) en este subespacio, y entonces se extiende al espacio de estados completo. Este hecho subraya la relevancia de la bifurcacion de Hopf como fundamento teorico del enfoque
presentado.
Igualmente cabe destacar que un sistema que presente una bifurcacion de Hopf es tal
que para ciertos valores del parametro de bifurcacion el sistema tiene un punto atractor,
que es el caso normalmente considerado en sistemas control no lineales convencionales;
sin embargo para otros valores de el conjunto lmite del sistema dinamico se transforma
en un ciclo lmite y el sistema oscila de un modo estable y robusto.
Una vez concluido el dise
no del controlador para el sistema de segundo orden, el problema consiste en la extension del comportamiento oscilante a todas las variables de estado.
La solucion viene de la mano de un procedimiento recursivo basado en el backstepping.
En la segunda fase de dise
no comenzaremos con el controlador y la funcion de Lyapunov
obtenidos en la primera fase, para obtener, seguidamente, mediante backstepping un controlador y una funcion de Lyapunov de control para un subsistema de tercer orden. El
proceso se repite para pasar a cuarto orden, quinto, y as sucesivamente. La clase de
sistemas considerada en los ejemplos de este captulo no excede el cuarto orden, pero la
metodologa no se restringe a ellos. Uno de los resultados clave del captulo se centra
en el hecho de que la bifurcacion de Hopf detectada en el sistema de segundo orden se
mantiene gracias a la tecnica de backstepping en los sistemas completos de orden mayor
aqu considerados.
Una implicacion muy interesante reside en el hecho de que el sistema bucle cerrado
obtenido tras aplicar la tecnica basada en backstepping a la clase de sistemas aqu considerada tiene estructura hamiltoniana generalizada. De este modo, se ha detectado una
sorprendente interrelacion entre backstepping y la estructura hamiltoniana generalizada.
Las consecuencias de este hecho son exploradas de manera supercial, quedando abierta
una interesante lnea de investigacion.
El metodo propuesto en este captulo funciona debidamente para sistemas completamente actuados, en cuyo caso la solucion es trivial, y para una clase de subactuados que es
la que se tratara en detalle. A n de ilustrar el metodo se han seleccionado como ejemplos
dos sistemas mecanicos subactuados bien conocidos en la literatura y en el desarrollo de
esta tesis: el sistema de levitacion magnetica y la bola en la viga.
El resto del captulo se organiza como sigue. En la seccion 6.2, se presenta una funcion
de Lyapunov de control apropiada para la obtencion del comportamiento oscilante en el
sistema de segundo orden en bucle cerrado. Empleando dicha funcion como hamiltoniano
del sistema, se obtiene un sistema en bucle cerrado que presenta una bifurcacion de Hopf.
Este sistema es considerado como la dinamica objetivo para un sistema de bucle abierto
de segundo orden. En la seccion 6.3, se introduce una ley sencilla para la estabilizacion de
oscilaciones en sistemas de segundo orden que sirve de base a los desarrollos posteriores.
Las secciones 6.4 y 6.5 describen una tecnica inspirada en el backstepping que se empleara
recursivamente para calcular una ley de control para sistemas de tercer orden. En la
seccion 6.6 se presentan los resultados teoricos destinados a extender el metodo de dise
no
a sistemas subactuados de cualquier orden que posean estructura en cascada. Se probara
que la bifurcacion de Hopf se mantiene a lo largo de cada iteracion del procedimiento de
132
backstepping.
La seccion 6.7 discute, en virtud de los teoremas de linealizacion por realimentacion,
la posibilidad de extender los resultados del captulo a sistemas con estructuras mas
generales, no estrictamente en cascada. El apartado 6.8 presenta una expresion cerrada
para ley de control de estabilizacion de oscilaciones que se aplica a la clase de sistemas
descrita en 6.7.
En el apartado 6.9 el metodo se aplicara a dos conocidos sistemas subactuados: el
sistema de levitacion magnetica (tercer orden) y la bola en la viga (cuarto orden). En el
primero de ellos se vericaran los resultados teoricos en un sistema real de laboratorio. En
el caso de la bola en la viga se analizaran las cuencas de atraccion limitadas al emplear un
controlador basado en un modelo aproximado. Adicionalmente se demostrara la existencia
de una bifurcacion de Hopf en el sistema controlado. La seccion 6.10 trata el problema
de estabilizacion de oscilaciones mediante una tecnica alternativa de reciente desarrollo,
el metodo de Inmersi
on e Invariancia(Astol & Ortega 2001).
2
1
V0 (x1 , x2 ) = (c2 x21 + x22 )2 (c2 x21 + x22 ) + ,
4
2
4
(6.2.1)
x 1
x 2
=
0
1
2 x2 +x
2
c 1
c2 x21 +x22
Dx1 V0
.
Dx2 V0
(6.2.3)
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
Figura 6.3: V0 para > 0 con un conjunto mnimo formado por una curva cerrada.
133
134
x 1
x 2
=
x2
c2 x1
(6.2.4)
.
(6.2.5)
V0
x
T
x = [ c2 x1 P x2 P ]
x 1
x 2
.
(6.2.6)
(6.2.8)
(6.2.9)
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
135
Proposici
on 6.2.1. El sistema (6.2.8)(6.2.9) atraviesa una bifurcaci
on de Hopf asociada al equilibrio x1 = x2 = 0 cuando = 0.
Demostracion. Es palpable que el origen representa un punto de equilibrio para cualquier
valor del parametro . La linealizacion en este punto viene dada por
x1
0
1
x 1
=
,
(6.2.10)
x 2
x2
c2 ka
cuyo polinomio caracterstico es 2 ka + c2 y los correspondientes autovalores son, a
su vez,
$
ka (ka )2 4c2
1,2 =
.
(6.2.11)
2
Entonces, para < 0, se tiene Re() < 0 y el origen es estable; para = 0, = jc y
el origen es un equilibrio no hiperbolico; y para > 0, Re() > 0 y el origen es inestable.
Consecuentemente el sistema (6.2.8)(6.2.9) tiene un equilibrio u
nico en el origen para
< 0, y para > 0 este equilibrio se torna inestable. La condicion de transversalidad se
satisface dado que
ka
dRe[(0 )]
=
= 0
d
2
=0
2
2
Comentario 6.2.1. Resulta de interes considerar que para ka = 0, el sistema (6.2.8)(6.2.9)
se reduce a x = c2 x, un sistema cuyo retrato de estados lo forma un continuo de orbitas
cerradas que llena densamente el espacio de estados. Sin embargo estos comportamientos
oscilatorios no son estructuralmente estables. El efecto del amortiguamiento no es mas
que seleccionar entre todos las orbitas periodicas una en particular a la que se le asignara
un estado de mnima energa. El sistema alcanzara y se mantendra en dicha orbita de
forma estable y robusta.
Comentario 6.2.2. El perodo inicial (de la oscilacion de amplitud nula) es
T0 =
2
c
136
Una primera posibilidad esta asociada a x2 (t) 0, lo cual implica que x 1 = 0 (de
(6.2.8)) y x 2 = 0 (del signo de identidad). Empleando (6.2.9) esto signica que
c x21 = 0 x1 = 0. En consecuencia, este caso corresponde al punto (x1 , x2 ) =
(0, 0). Por linealizacion se puede ver que este punto es localmente estable para < 0
y localmente inestable para > 0.
La segunda posibilidad es la de P = 0. Este conjunto no existe para < 0.
En consecuencia con la aplicacion del principio de invariancia de LaSalle (Khalil 1996)
se prueba la primera parte de la proposicion. Para la segunda, a
un hemos de demostrar
que la curva P = 0 es realmente un ciclo lmite, o dicho de otro modo, demostraremos la
ausencia de puntos de equilibrio sobre P = 0. Procederemos por contradiccion: supongase
que existe dicho equilibrio en P = 0. De (6.2.8), se tiene x2 = 0 y de (6.2.9) con P = 0
se tiene x1 = 0. Pero x1 = x2 = P = 0 solo es posible si = 0.
Finalmente para P = 0, el sistema (6.2.8)(6.2.9) se reduce a (6.2.4) para el cual el
2
periodo de las oscilaciones es 2/c .
Al ser el ciclo lmite estable y, para > 0, existe cuando el equilibrio es localmente
estable, se desprende el siguiente corolario.
Corolario 6.2.3. La bifurcaci
on de Hopf de la proposici
on 6.2.1 es supercrtica.
x 1 = x2
x 2 = g(u),
(6.3.1)
(6.3.2)
donde g 1 () existe sobre el dominio de interes, los resultados de las secciones previas
permiten tratar con el problema de dise
no de un controlador que haga que el sistema
oscile. Es claro que el sistema en bucle abierto (6.3.1)-(6.3.2) puede ser ajustado para
obtener el comportamiento en bucle cerrado (6.2.5) mediante la ley de control
u = g 1 (c2 x1 ka P x2 ).
(6.3.3)
Adicionalmente, V0 es una funcion de Lyapunov de control del sistema. Esto signica que
los conjuntos lmite del sistema (6.3.1)-(6.3.2) tras la aplicacion de (6.3.3) son los mnimos
de V0 ; es decir, una curva cerrada para > 0 y un punto aislado para < 0. Entonces el
comportamiento del sistema en bucle cerrado sera oscilatorio o asintoticamente estable,
2
= x2
= f (x1 , x2 ) + g(u)
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
137
dependiendo del signo del parametro . Esto puede ser enunciado alternativamente indicado que el sistema atraviesa una bifurcacion de Hopf cuando = 0.
Con estos resultados, el dise
no de un controlador para un sistema de segundo orden con
un actuador de la forma (6.3.1)(6.3.2) puede lograrse si las condiciones apropiadas son
satisfechas. Este resultado admite una generalizacion a sistemas con muchos actuadores
e incluso a una clase mas amplia. Por ejemplo, si el sistema a controlar es un robot con
actuadores en todas sus articulaciones, entonces se podra aplicar a cada una de ellas una
ley del tipo (6.3.3). De este modo cada una de las diferentes articulaciones puede entrar
en oscilacion de forma independiente.
0
1
(6.4.1)
(6.4.2)
h() = bh(),
donde IR2 , IR. Suponga que este sistema tiene un punto de equilibrio en (0, 0, ),
es decir f (0) = 0 y h( ) = 0, y adicionalmente h ( ) = 0.
Con el n de aplicar backstepping, considerese en primer lugar el sistema (6.4.1) con
como control virtual. Supongase que existe una ley de realimentacion = u0 () tal que
el sistema (6.4.1) tiene las propiedades de estabilidad deseadas. Dicho de otro modo, el
sistema
= f () + g(u0 ())
(6.4.3)
es estable, o al menos sus trayectorias estan acotadas. Adicionalmente, supondremos que
existe una funcion de Lyapunov V0 tal que
V0 (f () + g(u0 ())) 0.
Sumando y restando g(u0 ()) al segundo miembro de la ecuacion (6.4.3) se tiene
= f () + g(u0 ()) + g() g(u0 ())
= f () + g(u0 ()) + b(h() h(u0 ()))
= f () + g(u0 ()) + bz,
138
z = h h u0 .
Si denimos v = z y recordamos que u = entonces
u = u0 +
v
.
h
(6.4.4)
(6.4.5)
(6.4.6)
(6.4.7)
se obtiene
V 1 = V0 + z z
= V0 (f () + g(u0 ())) + V0 bz + zv.
Entonces para lograr que V 1 0 una eleccion razonable es
v = ( V0 b + kz),
es decir
u = u0
V0 b + kz
h
= u0 (f () + g())
1
k
(h() h(u0 ()))
V0 b
h
h ()
(6.4.8)
(6.4.9)
(6.5.1)
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
139
= u0 (1 ) = h1 (c2 1 ).
(6.5.2)
a al ciclo lmite
(0, 0, ), el sistema (6.5.1) con la ley de control (6.5.3) se aproximar
P () = 0 cuando t . Si < 0, para cualquier condici
on inicial en , el sistema
(6.5.1) con la ley de control (6.5.3) se tendera al punto (0, 0, ) cuando t .
Demostracion. el control mediante backstepping (6.5.3) asegura que la funcion
1
V1 = V0 + z12 ,
2
(6.5.4)
140
=
=
=
=
..
.
2
h(3 )
4
5
(6.5.5)
n1 =
= u,
y continuando con el procedimiento basado en backstepping, se obtiene el mismo resultado.
En la seccion 6.9.7 se presenta un ejemplo de la aplicacion del Corolario 6.5.2.
Proposici
on 6.5.3. Considerese el sistema (6.5.1) tras aplicar la ley de realimentaci
on
(6.5.3). El sistema experimenta una bifurcaci
on de Hopf para = 0.
Demostraci
on. Tras la aplicacion de la ley de realimentacion (6.5.3), el sistema en bucle
cerrado es
x 1 = x2
x 2 = h(x3 )
x 3
(6.5.6)
1
= u0 (x1 )x2
(k1 c2 x1 + x2 P + k1 h(x3 )).
h (x3 )
A n de obtener la linealizacion de este sistema en torno al origen debe hacerse notar que
u0 (0) = c2 /h (x3 ) y por tanto
2
(h ) h h
u
= k1
x3 (0,0,x )
(h )2
(0,0,x )
3
pero al ser h(x3 ) = 0 este termino es igual a k1 , y el resto de la matriz jacobiana toma
la forma
0
1
0
x 1
(6.5.7)
0
x 2 = 0
k1 c2
c2
x 3
k1
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
141
(6.5.8)
1
0
1
2 = P
0
z1
0
1 P
0
1 2 P ,
1 k1
z1
(6.5.9)
1
P
(6.5.10)
donde la u
ltima columna es x V1 , siendo x = [1 2 z1 ]T . Notese que el sistema (6.5.10) es
la version en dimension tres de (6.2.7). La matriz del sistema tiene una deseable propiedad
estructural: admite la descomposicion en la suma de una diagonal negativa y una antisimetrica. Esto permite interpretar el sistema (6.5.10) como un sistema hamiltoniano
generalizado (Van der Schaft 2000). Tambien puede ser reescrito como
1
0
0
0
0
0
1
P
(6.5.11)
2 = P1 0 1 x V1 + 0 0 0 x V1 ,
0 1 0
z1
0 0 k1
142
=
=
=
=
..
.
=
=
x2
h3 (x3 )
h4 (x4 )
h5 (x5 )
(6.6.1)
hn (xn )
u,
Para el calculo de la ley de control no se presentara una formula explcita, sino que se
realizara un calculo recursivo que facilitara su comprension. Para ello comenzaremos con
el subsistema de segundo orden (x1 , x2 ).
x 1 = x2
x 2 = u2
Donde u2 es la ley de control que estabiliza el sistema en la oscilacion deseada con funcion
de Lyapunov V2 = P 2 /4. Concretamente
u2 = c2 x1 k2 P x2
siendo k2 > 0 un parametro libre. Si extendemos el sistema a tercer orden
x 1 = x2
x 2 = h3 (x3 )
x 3 = u3
y denimos
u2 )
u2 = h1
3 (
1
V2
k3 z3
u3 =
h (u2 )u 2
h3 (x3 ) 3
x2
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
143
=
=
=
=
x2
h3 (x3 )
h4 (x4 )
u4
y denamos, de nuevo
u3 = h1
u3 )
4 (
1
V3
u4 =
k4 z4
h (u3 )u 3
h4 (x4 ) 4
x3
estabiliza asintoticamente el sistema de cuarto orden en la orbita P = 0 con funcion de
Lyapunov V4 . A partir de aqu es de facil deduccion la ley de control generica, como se
arma en la siguiente proposicion
Proposici
on 6.6.1. Sea el sistema de orden n con la estructura en cascada (6.6.1).
Supongase que el subsistema de orden k > 2 formado por las k 1 primeras ecuaciones
de estado m
as la ecuaci
on
x k = u
se estabiliza asintoticamente en la orbita P = 0 con la ley u = uk . Entonces la ley un
calculada recursivamente seg
un la formula
1
Vi
ui+1 =
h (ui )u i
i = k...n
(6.6.2)
ki+1 zi+1 ,
hi+1 (xi+1 ) i+1
xi
donde
ui )
ui = h1
i+1 (
144
Vi1
ki zi ,
xi1
i>2
y dado que
Vi zi
Vi
=
= zi hi (xi ),
xi
zi xi
i = 3...n
se llega a la expresion
zi = hi (xi )zi+1 hi1 (xi1 )zi1 ki zi ,
i3 . . . n
z1 = x1
z2 = x2
z3 = h3 (x3 ) h3 (u2 )
..
.
zn = hn (xn ) hn (un1 )
posee la estructura PCH con disipaci
on
z = (J(z) R(z))z Vn
con funci
on de energa Vn , siendo la matriz de interconexi
on
1
0
0
0
0
P
1
1
0
0
P 0
0 1
0
0
h3 (x3 )
0
0 h3 (x3 )
0
h4 (x4 )
J(z) =
0
0
0
0
h4 (x4 )
..
..
..
..
..
...
.
.
.
.
.
0
on
que cumple J(z) = J(z T ) y la de disipaci
R(z) =
0 0 0
0 k2 0
0 0 k3
..
.
...
kn
0
0
0
..
.
0
0
0
0
0
..
.
0
0
0
0
0
hn1 (xn1 )
hn1 (xn1 )
0
(6.6.3)
(6.6.4)
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
145
=
=
=
=
..
.
=
=
x2
f2 (2 ) + g2 (2 )h3 (x3 )
f3 (3 ) + g3 (3 )h4 (x4 )
f4 (4 ) + g4 (4 )h5 (x5 )
(6.6.5)
1
Vk
=
gk (k ) kk+1 zk+1
h (uk )u k
hk+1 (xk+1 ) k+1
xk
146
Hemos construido un metodo recursivo directo para el calculo de la ley de control. Sin
embargo por la inclusion del termino gk ha resulta inviable la obtencion de una formulacion
en forma PCH de las ecuaciones de estado.
x 1
x 2
x 3
..
.
x2
h(x3 )
x4
..
.
x n
0
0
0
..
.
u.
(6.7.1)
Se dene el cambio
3 = h(x3 )
4 = h (x3 )x4 = 3
5 = h (x3 )x24 + h (x3 )x5 = 4
..
.
dn3
n =
3
dtn3
Pero esta u
ltima derivada se puede descomponer en dos terminos,
dn
(n)
(n1)
(h(x3 )) = h (x3 )x3 + (h (x3 ), h(3) (x3 ), ...hn (x3 ), x3 , x3 ...x3
)
dtn
(n)
= h (x3 )x3 + (x3 , x4 , x5 ...xn+2 ) = (x) + h (x3 )u
Este sistema posee un grado relativo bien denido si h(x3 ) = 0. donde se deduce que la
condicion h(x3 ) = 0 es suciente para que la realimentacion
u=
+v
h (x3 )
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
147
unida al cambio de variable x linealice por realimentacon el sistema (3), dando lugar
a
x 1 = x2
x 2 = 3
3 = 4
(6.7.2)
4 = 5
..
.
4 = v
Comentario 6.7.1. Notese que el cambio de coordenadas x es invertible si y solo si
h() es invertible (para lo que es necesario que h (x3 ) = 0), dado que
x3 = h1 (3 )
4
x4 =
h (x3 )
..
.
i fi (x3 , ..., xi1 )
xi =
h (x3 )
El nuevo sistema linealizado admite la estabilizacion de orbitas periodicas mediante la
implementacion recursiva del backstepping y la obtencion de las sucesivas leyes de control
en cascada, que ahora expresaremos del siguiente modo
V0
k1 (3 + u0 )
x2
V1
= u 1
k2 (4 u1 )
x3
u1 = u 0
u2
..
.
ui = u i1
Vi1
k2 (4 u1 )
i+1
V0 =
V1
V2
1
(3 u0 )2
2
1
1
(3 u0 )2 + (4 u1 )2 ,
2
2
..
.
y as sucesivamente. Deniendo un nuevo cambio de variable
z3 = 3 u0
z4 = 4 u1
..
.
(6.7.3)
1
0 0
x 1
0
P
x 1 0
1 0
2 P
z V2
=
z1 0 1 0 1
0
0 1 0
z2
0 0 0 0
0 k0 0 0
0 0 k1 0
0 0 0 k2
z V2 .
(6.7.4)
Cabe destacar que al ser la estructura simplectica invariante con respecto al sistema de coordenadas (vease la seccion 2.3.1), se deduce que la estructura hamiltoniana generalizada
no es una caracterstica particular que solo se manieste en estas coordenadas. De hecho,
deshaciendo el cambio de variable volveramos a una estructura semejante con matrices
de interconexion y disipacion expresadas en funcion de x.
Si observamos que el sistema (6.7.2) esta expresado en la forma canonica de Brunovski
(2.7.2), se deduce que el desarrollo previo es aplicable a cualquier sistema en esta forma.
Sin embargo el teorema de linealizaci
on por realimentaci
on (Marino & Tomei 1995) arma
que un sistema de entrada u
nica del tipo
x IRn , u IR
x = f (x) + g(x)u,
Esto implica que en los sistemas que cumplen las condiciones del teorema de linealizacion por realimentacion es aplicable el metodo presentado de estabilizacion de oscilaciones basado en backstepping. Una consecuencia importante es que se abre una va para
salvar la exigencia de la estructura en cascada.
(m = n 2)
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
149
que supuestamente resulta de la linealizacion por realimentacion del sistema en lazo abierto. El objetivo es encontrar una ley de realimentacion del estado para cualquier valor de
n, evitando la forma recursiva (6.7.3). Recordemos que el procedimiento backstepping
estandar para sistemas en la forma canonica de Brunovski, produce la siguiente ley
Sistema de segundo orden:
u0 = x1 k0 P x2
Vi1
g(xi+1 ) ki zi
i+1
x
i = 1...m
g(xi ) =
..
.
1
de donde se obtiene que
zi1
Vi1
Vi1
g(xi+1 ) =
= zi1
= xi+1 ui2
i+1
x
xi+1
xi+1
V0
g(x2 ) = P x2
x2
i = 2...m
i = 2...m
partenorecursiva
i = 2...m
i = ki +
d
dt
1
0
0 i1 1 0 ui1
ui
. . . ..
u
u
i1
.
0
0
=
i2
ui
.
.
..
0 2 1
. 0
.
0
0 0 1
u0
u0
0
0 0 1
i = 2...m
+ f i = i ui1 + f i
i = 1...m
i = 1, 2 . . . m
0 0
i 1
0 i1 1 0
. . . ..
0
0
.
i =
i = 1, 2 . . . m
0
0 2 1
0
0 0 1
0
0 0 1
Para la multiplicacion de matrices conviene tener en cuenta el siguiente comentario.
Comentario 6.8.1. Notese que la matriz i posee i + 1 las e i columnas, por los cual el
producto i i1 es el producto de una matriz de i columnas por otra de i las. Consecuentemente, el producto esta bien denido.
La descomposicion sucesiva del vector ui en terminos de la matriz i , la funcion fi y
el vector ui1 da lugar a
ui = eT1 ui
= eT1 (i ui1 + f i )
= eT1 (i (i1 ui2 + f i1 ) + f i )
..
.
donde se emplea el vector e1 = [1 0 . . . 0]T con la dimension apropiada. Como resultado
fundamental, hemos obtenido la forma general del termino n-esimo:
& 1
'
& j+1 '
m1
+
+
i u0 + eT1
k f j
(6.8.1)
un = eT1
i=m
j=1
k=m
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
151
donde el smbolo del producto debe ser entendido en orden decreciente de los ndices de
izquierda a derecha4 , es decir
j
+
i = k k1 . . . j
k>j
(6.8.2)
i=k
Proposici
on 6.8.1. En la familia de sistemas de orden n
x 1 = x2
x 2 = x3
..
.
&
x n = eT1
1
+
'
i
u0 + eT1
m1
& j+1
+
j=1
k=m
i=m
'
k
fj
(6.8.3)
P 2 z12 z22
z2
+
+
+ ... + m
4
2
2
2
z2
P 2 z12 z22
+
+
+ ... n2
4
2
2
2
y probaremos que el sistema de orden n + 1 con estructure (6.8.3) es GAS con respecto
{P = 0, zi = 0 i} y funcion de Lyapunov
Vn1
2
2
zn1
zn1
P 2 z12 z22
=
+
+
+ ...
= Vn2 +
4
2
2
2
2
Efectivamente, si en el sistema
n :
0 1 0 0
0 0 1 0
. . . ..
n
x =
.
0 0
0 0 0 1
0 0 0 0
se cumple que
V m =
Vm
xn
n
x + g(xn )un2
T
x n 0
V m+1 =
i = 1...m
lo cual produce
V i = k0 P x22 k1 z12 k2 z22 ki zi2
i = 1...m
Entonces los u
nicos conjuntos invariantes donde V i = 0 son {x|P (x) = 0, zi = 0 i} y
x(t) 0 t. Este u
ltima es un punto de equilibrio, y concluimos del principio de LaSalle
principio que el sistema n es GAS con respecto a la orbita {x|P (x) = 0, zi = 0 i} con
funcion de Lyapunov Vn1 para todo n, excepto la condicion inicial (xi = 0, i).
2
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
153
Ejemplos
Sistema de dimensi
on 3
A n de ilustrar el empleo de la ecuacion (6.8.1), se obtendra a continuacion la ley de
control para n = 3. En este caso m = 1, la ley de control es u1 y las u
nicas matrices y
vectores involucrados son
1
k
x
P
x
2
1
3
1
1 =
f 0 = 0.
f =
0
1
tras simples calculos se llega a
u1 = [1 0](1 u0 + f 1 )
= (x1 k0 P x2 )k1 P x2 k1 x3 x2
k0 (2 x1 x2 + 2 x2 x3 )x2 k0 P x3
Es facil comprobar que con esta ley de control el sistema en bucle cerrado puede ser escrito
en forma hamiltoniana:
1
0
0
0
0
P
P
x 1
+
V
0 P
k
0
k
V1
x 2 = P 1
1
0
0
P
x 3
P
2
P
0
0 k0 k0 k1
P
= 1 2k0 x1 x2
= 2k0 x22 k0 P
donde la parte conservativa (matriz antisimetrica a la izquierda) y la disipativa ( matriz semidenida negativa a la derecha) han sido separadas para visualizar la estructura
hamiltoniana. Notese tambien que el hamiltoniano en este caso es la funcion de Lyapunov
que se obtendra con el procedimiento de backstepping, es decir
V1 =
P 2 (x3 + x1 + x0 x2 P )2
+
4
2
Sistema de dimensi
on 5
A medida que aumenta el orden del sistema el calculo gana en complejidad, aunque
conceptualmente no presenta dicultad alguna. A partir de orden 4 es preferible recurrir
a una herramienta software de calculo simbolico. Calcularemos la ley de control para un
sistema de orden n = 5 y por tanto m = 2 en forma canonica de Brunovski, . Para ello
se emplearan las matrices
1
0
k3 + dtd
d
+
1
k
2
dt
d
d
k1 + dt
1
0
k2 + dt
3 =
1 =
2 =
0
k1 + dtd
0
0
k1 + dtd
1
0
1
0
0
1
y los vectores
f3 =
x4 k3 x5
x3 k2 x4
P x2 k1 x3
0
k
x
x
3
2
4
P x2 k1 x3
2
1
, f 0 = 0.
, f = P x2 k1 x3 , f =
0
0
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
155
x3
x1
Las ecuaciones en bucle abierto del sistema de levitacion magnetica vienen dadas por
(Ortega et al. 1998)
x 1 = x2
1 2
x 2 =
x mg
2k 3
R
x 3 = (1 x1 )x3 + u
k
(6.9.1)
156
(6.9.3)
kx2 P
k1 k
u = $
x3
x3
2k(mg c2 x1 )
1 2
x mg + c2 x1
2k 3
(6.9.4)
que es la ley de realimentacion deseada. Esta ley a sido comprobada por simulacion
dado el comportamiento deseado tanto para > 0 (oscilaciones) y para < 0 (equilibrio
estable). Los resultados se ilustran en la gura 6.5. Se muestran en ella tres simulaciones,
las dos primeras de las cuales tienen constantes k = 1, k1 = 0.5, c = 0.1 y = 0.1, y en
la tercera se ha hecho igual a 0.1 para lograr un comportamiento de estabilizacion.
Cada graca contenida en la la superior de la gura representa las variables de estado
oscilantes, x1 y x2 con respecto al tiempo en tres escenarios de simulacion diferentes. Bajo
cada uno de estos escenarios, se muestra la funcion de Lyapunov obtenida en cada paso
del procedimiento de backstepping, para las mismas simulaciones.
El metodo de dise
no propuesto admite una interesante interpretacion fsica en el caso
del levitador magnetico. Si nuestro objetivo es hacer oscilar una bola metalica inmersa
en un campo magnetico, el ujo magnetico seguira una cierta forma de onda, pero esto es
logrado a su vez excitando un circuito de induccion con una ley de control aplicada como
voltaje de entrada. Esto sugiere una estrategia de dise
no de un controlador en cascada,
como es el caso del metodo backstepping.
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
20
tiempo(s)
20
tiempo(s)
40
30
20
10
0
20
tiempo(s)
40
20
40
tiempo(s)
60
20
40
tiempo(s)
60
80
60
40
20
0
40
Funcin de Lyapunov
50
80
Funcin de Lyapunov
Funcin de Lyapunov
60
10
40
x1(cont.), x2(discont.)
x (cont.), x (discont.)
x1(cont.), x2(discont.)
157
60
40
20
0
20
tiempo(s)
40
158
con la corriente de la bobina y por tanto con el campo magnetico. A efectos practicos la
corriente viene dado por
I = 0.15(u + u0 )
donde u0 es una constante. El hecho de que esta relacion sea puramente algebraica
convierte a la ecuacion (6.9.1) en un modelo de segundo orden. Esto hace innecesaria la
aplicacion de la extension del metodo backstepping como se hizo en la seccion anterior.
La distancia vertical hacia abajo entre el electroiman y la bola, x1 , se mide mediante un
emisor y receptor de infrarrojos, cada uno a un lado de la bola. La dinamica en bucle
abierto esta descrita por las ecuaciones en variables de estado de son:
x 1 = x2
x 2 = g k
I
X
2
=gk
u + u0
x1 + x0
2
(6.9.5)
(6.9.6)
donde k, u0 y x0 son constantes del modelo que deben ser identicadas, k = k/0.15.
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
0.5
0.5
0.5
1.5
159
0.5
1.5
10
20
tiempo (s)
30
2.5
0.5
0
0.5
1
Tensin de entrada en rgimen permanente
#
donde b1 = kg es la pendiente identicada y b0 = x0 + b1 u0 es la interseccion con el
eje u de la recta que se ha identicado. De b1 derivamos el valor k = 11.86. Por tanto
hemos de obtener una tercera ecuacion para identicar los tres parametros (u0 , x0 , k) e
identicar completamente el modelo.
La informacion adicional necesaria no puede obtenerse del comportamiento en regimen
permanente. Para caracterizar la respuesta transitoria con la mayor cantidad de informacion posible se ha hecho variar la referencia siguiendo una secuencia aleatoria de escalones,
dentro del rango de validez del controlador no lineal. Los escalones deben sucederse a una
frecuencia sucientemente alta para que la bola no alcance a estabilizarse. De nuevo se
muestrean la entrada y la salida a una frecuencia de 500Hz y se registran en MATLAB.
Para emplear la informacion recabada las ecuaciones del modelo pueden reescribirse
del siguiente modo
u + u0
$
x g = k
,
x + x0
las cuales pueden ser reordenadas para dar lugar a la ecuacion vectorial
%
%
x g
x g
xu=
k
k
1
x0
u0
.
0.5
0.5
0.5
Posicion (mm)
0.5
Posicion (mm)
Posicion (mm)
160
0.5
0.5
1.5
1.5
1.5
2.5
5.5
6.5
7.5
Tiempo (s)
8.5
9.5
10
2.5
20
20.5
21
21.5
22
22.5
23
Tiempo (s)
23.5
24
24.5
25
2.5
46
46.5
47
47.5
48
Tiempo (s)
48.5
49
49.5
50
Figura 6.8: Respuesta transitoria al variar entre los valores 0, 10, 20, 10, y 0.
(6.9.7)
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
161
x 1
x 2
x 3
x 4
x2
2
B(x1 x4 Gsenx3 )
x4
0
0
0
0
1
u.
(6.9.9)
La variable x1 denota la posicion de la bola, y x3 el angulo de la barra (q1 y q2 respectivamente en la gura 4.6). Con la intencion de escribir el sistema en la forma (6.6.1), se
empleara una aproximacion frecuentemente utilizada (Hauser et al. 1992) obtenida al ignona
rar el termino de aceleracion centrfuga x1 x24 , suponiendo una velocidad angular peque
de la bola. Mas a
un, el sistema (6.9.9) puede ser normalizado haciendo B = G = 1.
162
Entonces se tiene
x 1
x 2
x 3
x 4
x2
senx3
x4
0
0
0
0
1
u.
(6.9.10)
x 1
x 2
=
x2
senx3
.
(6.9.11)
Este sistema, unido a la ecuacion x 3 = x4 posee la misma estructura que las ecuaciones
(6.5.1) (tomando x4 como una variable de control virtual) y, por consiguiente, en el primer
paso, la realimentacion (6.5.3) puede aplicarse dando lugar a
x3 = u0 (x1 , x2 ) = sen1 (c2 x1 + k0 x2 P ).
(6.9.12)
u1
u2
1
V0
=
k1 (senx3 + senu0 )
h (u0 )u 0
h (x3 )
x2
V1
= u 1
k2 (x4 u1 )
x3
(6.9.13)
(6.9.14)
V0 =
V1
V2
1
1
1
(senx3 + senu0 )2 = P 2 + z12
2
4
2
1
1
1
1
1
(senx3 + senu0 )2 + (x4 u1 )2 = P 2 + z12 + z22
2
2
4
2
2
(6.9.15)
z2 = x4 u1 ,
(6.9.16)
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
163
u1 =
u2
(6.9.17)
=
=
=
=
+
+
+
x2
senx3
x4
z1 cos x3 + k1 k0 P 2 k0 x2 2 x4 k2 z2
(6.9.19)
Comentario 6.9.1. Recuerdese que este sistema, a pesar de su complejidad, esta descrito en
forma hamiltoniana generalizada disipativa con funcion de Hamilton V2 . Para comprobar
este hecho basta observar, en virtud del corolario 6.6.2 que el cambio
x 1
x 2
z1
z2
=
=
=
=
x2
z1 c2 x1 k0 x2 P
h (x3 )z2 x2 P k1 z1
h (x3 )z1 k2 z2
z = [x1 x2 ; z1 z2 ]T
donde J(z) y R(z) poseen la forma (6.6.3) y (6.6.4), respectivamente. Para completar
la armacion basta probar que esta propiedad tambien es cierta cuando el sistema esta
expresado en variables x, seg
un (6.9.19). Pero este hecho se desprende de la invariabilidad
de la estructura hamiltoniana frente al cambio de variables, que se demostro en la seccion
2.3.1.
164
0
1
0
0
0
0
1
0
0
0
0
1
2
2
2
2
2
c + c k1 k2 k1 c + k2 c k2 1 c + k2 k1 k1 k2
cuyo polinomio caracterstico es
s4 + (k1 + k2 ) s3 + 1 + c 2 + k2 k1 s2 + (k1 + k2 ) c 2 k2 s + (1 + k2 k1 ) c 2 .
La condicion para la existencia de races puramente imaginarias (recuerdese las ecuaciones
(2.5.1)(2.5.2)) son
k1 + k2 > 0,
k1 k1 + k2 k1 + k2 + k2 2 k1 > 0,
k1 k2 2 (k1 + k2 ) k1 c 2 + k2 2 k1 + k2 = 0.
2
(6.9.20)
(k1 + k2 ) (1 + k2 k1 )
= max ,
k1
mientras que la u
ltima tiene dos races reales para , a saber
(k1 + k2 ) k1 c 2 + k2 2 k1 + k2
1 = 0
2 =
k2 k1
Observando que 2 > max concluiremos que el u
nico valor del parametro tal que
exista un par de races puramente imaginarias es = 0. Entonces el polinomio puede ser
factorizado como
2
c + s2 s2 + sk1 + sk2 + 1 + k2 k1 = 0.
Esta ecuacion tiene dos de sus races en s = jc mientras que las otras tienen parte real
negativa siempre que k1 > 0 y k2 > 0.
La transversalidad sera satisfecha si el primer miembro de (6.9.20) cambia de signo al
hacerlo . Esto es cierto cuando k1 > 0 y k2 > 0.
2
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
165
166
0.5
1.5
300
x (cont.), x (trazos)
0.5
1.5
200
tiempo(s)
100
200
tiempo(s)
300
400
100
200
tiempo(s)
300
1.5
2
1
0.5
0.5
100
200
tiempo(s)
1
0.5
x (cont.), x (trazos)
1.5
0.5
x (cont.), x (trazos)
0.5
x1(cont.), x2(trazos)
x (cont.), x (trazos)
x1(cont.), x2(trazos)
0
1
100
200
tiempo(s)
300
0
0.5
100
200
tiempo(s)
300
1.5
x3(0)
0.5
0.5
1.5
6
x1(0)
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
167
168
El primer paso del metodo es la determinacion del mapeo (). Para forzar las oscilaciones en la coordenada de la bola escogeremos 1 = 1 y 2 = 2 . Las funciones 3 y 4
pueden determinarse imponiendo la condicion de invariancia, que resulta
3 () = sen1 (1 + ka 2 P ())
3
3
4 () =
2 +
(1 ka 2 P ())
1
2
(6.10.1)
(6.10.2)
3 |x
3 |x
x2
(senx3 )
x1
x2
3
3
2 +
(1 ka 2 P ())
1
2
S(x1 , x2 , x3 ) =
3 |x
3 |x
x2 +
senx3
x1
x2
(6.10.3)
S
S
S
x2
senx3 +
x4
x1
x2
x3
(6.10.4)
S
S
S
x2 +
senx3
x4 k1 1 (x) k2 2 (x)
x1
x2
x3
con k1 , k2 > 0.
Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales
169
(cont.) (discont.)
0.5
0.5
1.5
10
15
Tiempo (s)
20
25
30
0.8
0.6
x (cont.) x (discont.)
0.4
0.2
0.2
0.4
0.6
0.8
10
15
Tiempo
20
25
30
0.6
0.4
0.2
x2
0.2
0.4
0.6
0.8
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
x1
170
Captulo 7
Conclusiones y desarrollos futuros
Este captulo se dedica a la exposicion resumida de las aportaciones de esta tesis comenzando por el captulo 3. Al nal del captulo se propondran una serie de trabajos de
desarrollos futuros a modo de continuacion de la investigacion desarrollada en esta tesis.
172
173
174
175
z1
elevacin
plataforma
P
z0
Rotacn: R01
Traslacin T01
y1
acimut
plataforma
x1
x0
Sistema de referencia
fijo en tierra
Sistema de referencia
del vehculo
y0
coordenadas del vector P 0 expresadas en el sistema de referencia jo en tierra (0) independientemente de las perturbaciones y los movimientos realizados por el vehculo que
soporta la antena. En este caso se tiene que la salida del sistema es
y = P 0 = R01 P 1 .
y el equilibrio a estabilizar sera
y = (c , c )
El problema se enunciara del siguiente modo: conocido P 1 dise
nar un sistema de sensores
de precision para obtener R01 y sus derivadas, y una ley de control robusta que estabilice
la salida del sistema en y .
Tengase en cuenta que en este problema no es necesario conocer las velocidades de
traslacion del origen del sistema (1) respecto a tierra.
Un problema a
nadido es determinar una ley de control que logre este objetivo, al
menos de forma aproximada, a partir de las medidas de dos giroscopos montados sobre la
cabeza de la plataforma. El dise
no de esta ley plantea la dicultad a
nadida de realimentar
la velocidad en lugar de la posicion, por lo que se desea estabilizar es una integral de la
medida de los sensores, ya que no se dispone de una estimacion de R01 . La estabilizacion de
la integral puede acumular errores en regimen permanente irrecuperables debido al efecto
de perturbaciones. Sin embargo, es posible obtener una realimentacion periodica del error
de seguimiento mediante un subsistema de vision externo, de mucha menor frecuencia,
que permita al sistema corregir la deriva acumulada. Este es el principio del sistema
DORNA que se describira en el apendice de esta tesis, para el que a
un no se ha propuesto
un marco teorico completo de analisis de estabilidad y rendimiento.
Los posibles resultados en esta lnea tendran la ventaja de reducir la complejidad
y el tiempo de computo asociados a la introduccion de un modulo de interpretacion de
imagenes de vdeo en el sistema.
176
177
subactuados simples. Las distintas tecnicas de control presentadas en esta tesis allanan
el camino hacia las soluciones de tipo GAS de cierto sistema pero al mismo tiempo,
el imponer estructuras en bucle cerrado de tipo lagrangiano o hamiltoniano, podran
obstaculizar el descubrimiento de otras leyes mas generales.
Una metodologa constructiva (mas alla de los importantes pero poco practicos enunciados de existencia) de sntesis para sistemas no lineales controlables de la forma x =
f (x, u) sigue siendo uno de los objetivos mas codiciados y al mismo tiempo inalcanzables
dentro de la literatura del control.
178
179
Inicio
SI
Modelo linealizable
por realimentacin?
NO
Rediseo a Nivel 1
Rediseo a Nivel 2
NO
SI
Agotada
bsqueda?
NO
SI
NO
Estuctura triangular?
SI
Inmersin e Invariancia
u otras tcnicas de ajuste
Backstepping
Fin
180
Ap
endice A
Proyecto DORNA
A.1 Introduccion
En este apendice se presenta una aplicacion para el control de una plataforma giroestabilizada inicialmente publicado en (Gomez-Estern, Perez, Rubio & Gordillo 2000). El
objetivo de la aplicacion es controlar las velocidades de la plataforma medidas respecto a
ejes inerciales independientemente de las perturbaciones a las que se ve sometida. Dicha
aplicacion se implementa en un hardware basado en bus VME, en la que se usa una arquitectura distribuida mediante tres procesadores DSP. Para el desarrollo de la aplicacion se
ha implementado a su vez un simulador de la plataforma giroestabilizada con una interfaz
hardware con el controlador.
Inicialmente se explicara lo que se entiende en este apendice por plataforma. Una
plataforma consiste en un mecanismo de dos grados de libertad de tipo rotacional. La
disposicion fsica de los ejes permite al elemento terminal posicionarse con distintas orientaciones y elevaciones, dentro de los limites fsicos del mecanismo, un esquema completo
de la plataforma se puede ver en la gura A.1. Normalmente el movimiento se limita
u
nicamente en elevacion, por lo que la transmision de se
nales se realiza a traves de anillos
colectores situados en la parte inferior.
El control de plataformas giroestabilizadas presenta un gran interes en el ambito de
aplicaciones de tipo aeronautico o de navegacion. Normalmente este tipo de plataformas
se ubican en un movil que posee una determinada orientacion variable respecto a tierra.
Estas variaciones de orientacion del movil que soporta la plataforma son detectadas por
sensores de tipo giroscopico ubicados en el extremo de la plataforma. Por lo que las
medidas proporcionadas por el giroscopo dependen de la posicion en la que se encuentren
los dos grados de libertad de la plataforma. El sensor giroscopico usado mide velocidades
en dos de sus ejes.
182
y
z
equipos. En concreto las distintas tarjetas de las que dispone el sistema y que conforman
la arquitectura de la gura A.2 son:
Una tarjeta basada en un procesador Motorola 68040 que se encarga de gestionar
las interfases Ethernet.
Una tarjeta basada en un DSP TMS320C40 (Texas Instruments 1999) que interpreta
los mensajes recibidos de por la red Ethernet. A su vez enva respuestas a traves de
la red y gestiona una maquina de estados que gobierna las distintas modalidades de
comportamiento del pedestal.
Dos tarjetas basadas en un DSP TMS320C40 que implementan lazos de control
para los dos grados de libertad de la plataforma. Cada tarjeta posee un modulo
de entradas y salidas analogicas que permite a cada eje la lectura de tacometro y
giroscopo. Este modulo tambien dispone de salidas analogicas para controlar el par
aplicado a lo motores. Los modulos de E/S analogicas no son accesibles desde el bus
VME, sino desde el bus interno de las tarjetas DSP. Todos los canales analogicos,
tanto los de entrada como los de salida tienen una resolucion de 12 bits.
Una tarjeta de E/S digital para tener informacion de mecanismos de seguridad y
activar y desactivar dispositivos auxiliares. Esta tarjeta se gestiona desde el procesador de comunicaciones y maquina de estados.
Una tarjeta para permitir la lectura de los resolver que proporcionan la posicion del
pedestal. Los resolver usados son de doble precision 1 y 16 usando convertidores
RD de 14 bits.
El intercambio de informacion entre los distintos procesadores se realiza mediante
memorias del tipo DPR (dual port RAM ) que incorporan las tarjetas DSP.
183
Lazo elevacin
i
, ,
Ordenes
Datos Pedestal
Diagnsticos
Subsistema de
Operacin
Consignas
Modo de operacin
Registro de
Datos
M68040
Gestin de
Ethernet
i
, ,
Gestin de
Comunicaciones
y Estado.
Plataforma Giroestabilizada
Lazo orientacin
184
PAR_ELEVACION
GIROSCOPO_ELEVACION
HABILITACION_PEDESTAL
SINCRONIZACION
PETICION_TSO
ORDENES_VELOCIDAD_INERCIAL
SELECCION_MODO
ORDENES_VEL_INERCIAL_EM_GYRO
REFERENCIA_ELEV
ORDENES_VELOCIDAD_CUBIERTA
VARIABLES_ELEVACION
LAZO_CONTROL_
ELEVACION
TACOMETRO_ELEVACION
RESOLVER_ELEVACION
ORDENES_POSICION
GESTION
DE
COMUNICACIONES
ORDENES_DIAGNOSTICO
VARIABLES_
ELEVACION
DATOS_PLATAFORMA
VARIABLES_
ORIENTACION
GIROSCOPO_ORIENTACION
TABLA_SITUACION_OPERATIVA
SINCRONIZACION
SELECCION_MODO
DATOS_PEDESTAL
REFERENCIA_ELEV
TACOMETRO_ORIENTACION
LAZO_CONTROL_
ORIENTACION
RESOLVER_ORIENTACION
RESULTADOS_DIAGNOSTICO
VARIABLES_ORIENTACION
TOPES_PEDESTAL
PAR_ORIENTACION
BOCINA_PEDESTAL
FRENOS_PEDESTAL
plazo determinado a la espera del desbloqueo de una region crtica por parte de otro
proceso. Si se supera dicho plazo, se enviara un mensaje noticando la inactividad del
proceso bloqueante.
La arquitectura software descrita aparece reejada en el diagrama de la gura A.3
185
e kme iae
2 (Ixx Izz ) + f o ()
+ 2 bmo
+ s
2
2
o
2
= Iyy2 + e Ime
1
+ 2 bme
2 s2 (Ixx Izz ) + f e ()
2
donde i son las corrientes de los estator de los motores, km constantes de par de los motores, relaciones de las cajas de engranajes, Im inercias de los actuadores y los elementos
Iij las componentes de los tensores de inercia de las partes moviles. Las funciones f se
corresponden con los pares de friccion, en el caso de que este venga dado por el modelo
LuGre, se usan las expresiones:
f = 0 z + 1 z
abs(v)
z = v +
z
f (v)
1 (
f (v) =
C1 + V 1 abs(v)+
0
B1 abs(v)
sgn1 (v)
+ (S1 C1 ) e
C2 + V 2 abs(v)+
)
+ (S2 C2 ) eB2 abs(v) sgn2 (v)
!
1 si() > 0
sgn1 () =
0 si() 0
!
0 si() > 0
sgn2 () =
1 si() 0
(A.4.1)
(A.4.2)
(A.4.3)
186
son diversas:
Captura de informacion relativa a la dinamica de los lazos de orientacion y elevacion.
Para ello se establece una zona de memoria compartida con los procesadores de lazos
de control y sus correspondientes semaforos de acceso concurrente.
Construccion de mensajes de protocolo que seran enviados mediante UDP/Ethernet
al sistema de operacion del buque. Dichos mensajes se almacenaran en una zona de
memoria compartida con la CPU Motorola, arbitrandose los mecanismos oportunos
para el acceso concurrente y la noticacion de llegada de nuevos mensajes. El envo
de las tramas por red es tarea de la CPU de acceso a la red.
Recepcion de las referencias de control y modo de seguimiento desde el sistema de
operacion mediante el mismo protocolo. Si las ordenes solicitadas son viables seg
un
el estado de la maquina, se noticara debidamente a los lazos de control.
Realizacion de todos los chequeos de inicializacion y rutinarios de los elementos
hardware del sistema. (Tarjetas de entrada/salida, procesadores y memorias).
Habilitacion de temporizadores y disparo de eventos para la gestion de la actividad
sncrona de la maquina. Entre los procesos que se ejecutan de forma sncrona se
encuentra el envo de datos periodicos para los equipos de registro de datos del
buque, activable a distintas frecuencias.
Monitorizacion del funcionamiento de las DSP de los lazos de control. Se hace uso
de un mecanismo de tipo watchdog para detectar si alguno de los controladores
interrumpio su actividad al cabo de un periodo determinado.
Implementacion de una maquina de estados sncrona para la coordinacion de modos,
estados, entradas y salidas digitales como frenos y alarmas. La maquina de estados
se describe de forma somera en el siguiente apartado.
187
ENCENDIDO
_1
BITE OK
OR IGNORA_BIT
ENCENDIDO
_2
FIN
TEMPORIZADOR
BOCINA
AND
PROTECCIONES_
OFF
Peticin TSO
HABILITA_
PEDESTAL
AND
EMERGENCIA
ARRAN
QUE
Prdida
COMUNICACION
ENCENDIDO
_3
FIN
TEMPORIZADOR
BOCINA
OPERACION
Prdida
COMUNICACION
188
189
encuentra la base que soporta la plataforma, de este modo se pueden estimar las
velocidades inerciales.
Los procesadores de lazo de control disponen de mecanismos de autodiagnostico por medio
de los cuales se puede comunicar fallos hardware o desajustes de los controladores. Los
resultados de estos test se transmiten al procesador de comunicaciones. Las principales
funciones del modo de diagnosticos son:
Comprobacion de la respuesta al escalon de posicion.
Comprobacion de la respuesta al escalon de velocidad.
Ajuste manual y/o automatico de derivas.
A.8 Conclusiones
En este apendice se ha presentado un sistema en tiempo real para el control de una
plataforma con dos grados de libertad acoplados. El sistema mecanico es una plataforma
de sensores de navegacion martima de grandes dimensiones y estrictas especicaciones
de funcionamiento.
El texto pone de relieve aquellos aspectos de la implementacion que por su complejidad y originalidad resultan de interes en campos teoricos como el modelado y control
de sistemas dinamicos no lineales y en areas mas tecnicas como el desarrollo de aplicaciones con restricciones de tiempo real en sistemas multiprocesadores con elementos de
sincronizacion y memoria compartida basados en DSPs.
La losofa de la aplicacion informatica obedece a la estructura de programacion de
automatas programables al existir en la literatura metodos compactos de especicacion
y modelado de maquinas de estados para estos sistemas. El procedimiento de dise
no y
documentacion de la aplicacion obedece a normas de calidad en ingeniera del software.
190
A.8. Conclusiones
Ap
endice B
C
odigo Maple para la ecuaci
on
(6.8.1)
El computo de cada termino de la ecuacion (6.8.1) puede ser tarea ardua, lo cual ha
motivado el desarrollo de unas rutinas Maple para el calculo automatico simbolico de la
ley de control para un orden arbitrario.
En primer lugar se crean los vectores cuyos elementos son los ki , i xi y fi de la seccion
6.8. Para ello se denira el siguiente procedimiento Maple
init := proc (n) local m, i;
global gam,x,f,vectk,P,u0;
m:=n-2; u0:=-x1-k0*P*x2; m := n-2;
vectk := [evaln(k || (1 .. m))];
gam := [evaln(gamma || (1 .. m))];
x := [evaln(x || (1 .. n))];
f := matrix(m+1,1,0);
f[m,1] := -P*x2-k1*x3;
for i from 2 to m do
f[m+1-i,1]:=-x[i+1]-vectk[i]*x[i+2]
od;
evalm(f)
end proc;
Esta funcion ha de invocarse con un argumento indicando el orden del sistema linealizado. (5 en el u
ltimo ejemplo). Por tanto si escribimos
init(5);
todos los vectores son inicializados para n = 5, m = 3, y se muestra en pantalla f 3 dando
como resultado
x4 k3 x5
x3 k2 x4
P x2 k1 x3
0
191
192
El segundo paso consiste en calcular la matriz k para cualquier valor de k. Con este
proposito emplearemos el siguiente procedimiento Maple:
mat:=proc(k) local m,i;
if (k = 1)
then m:=matrix(2,1,[gam[1],1])
else
m:=matrix(k+1,k,0);
for i from 1 to k-1 do
m[i,i]:=gam(k-i+1);
m[i,i+1]:=1;
od;
m[k,k]:=gam(1); m[k+1,k]:=1;
end if;
evalm(m);
end;
para el cual una tpica llamada sera
m1:=mat(4);
que dara como resultado la matriz 5 4
m1 :=
4 1 0 0
0 3 1 0
0 0 2 1
0 0 0 1
0 0 0 1
Ahora bien, para obtener series de multiplicaciones del tipo 4 3 2 deniremos un sencillo
procedimiento
matprod:=proc(k,l) local m,i;
m:=matgamma(l);
for i from l+1 to k do
m:=evalm(matgamma(i)&*m);
od;
evalm(m);
end;
La llamada a esta funcion para calcular en particular 4 3 2 sera
m2:=matprod(4,2);
lo cual da como resultado el vector
4 (3 (2 1 + 1) + 1 ) + 2 1 + 1
3 (2 1 + 1) + 1
2 1 + 1
193
El siguiente paso es obtener la formula (6.8.1) por medio de los procedimientos previos,
para lo cual deniremos la funcion
control1:=proc(n) local m,i,u;
global u0,vectk;
m:=n-2; init(n);
u:=matprod(m,1)*u0+sum(evalm(matprod(m,h+1)
&*submatrix(f,m+1-h..m+1,1..1)),h=1..m-1)
+f; evalm(u)[1,1];
end;
Para su uso, en el caso hipotetico en que n = 6, m = 4 escribiramos
u4:=control1(6);
para dar lugar a
u4 := (x1 k0 P x2 )(4 (3 (2 1 + 1) + 1 ) + 2 1 + 1) + 4 3 2 (P x2 k1 x3 )
+ 4 3 (x3 k2 x4 ) + (4 + 2 )(P x2 k1 x3 )
+ 4 (x4 k3 x5 ) + x3 k2 x4 + x5 k4 x6
A n de transformar todos los i en los correspondientes operadores derivativos deniremos el siguiente procedimiento:
derproc:=proc(u,n) local i,v; v:=u;
for i from 1 to n-2 do
v:=subs(gam[i]=vectk[i]+s,v);
od;
v;
end;
Se invocara esta funcion con el resultado de la u
ltima llamada a control1 y el orden del
sistema n, que en el anterior ejemplo tomaran la forma
u4:=derproc(u4,6);
dando como resultado la ley de control en el dominio de Laplace, donde s representa la
derivada temporal:
u4 :=
+
+
+
A continuacion necesitamos convertir esta expresion en una funcion del estado. El siguiente procedimiento Maple toma los coecientes del polinomio en s y toma sus derivadas
temporales
derproc2:=proc(u,n) local i,v,w,m; m:=n-2;
v:=subs(P=x1^2+x2^2-mu,u);
for i from 1 to n do
v:=subs(x[i]=x[i](t),v);
od;
w:=coeff(v,s,0);
194
for i from 1 to m do
w:=w+diff(coeff(v,s,i),t$i);
od;
w;
end;
La salida de derproc debera pasarse como argumento de derproc2, mientras que su salida
a su vez es pasada a una funcion que realiza la sustitucion general x i = xi+1 :
derproc3:=proc(u,n) local i,h,m,v;
m:=n-2; v:=u;
for h from 1 to n-1 do
for i from n-h by -1 to 1 do
v:=subs(diff(x[h](t),t$i)=x[h+i](t),v);
od;
od;
for h from 1 to n do
v:=subs(x[h](t)=x[h],v);
od;
v;
end;
con la implementacion de esta funcion el calculo completo queda automatizado. De hecho,
para obtener la ley de control completa solo hay que proporcionar el orden del sistema n,
como sucede en el siguiente metodo que aglutina los pasos anteriores.
fullproc:=proc(ord) local m,v,i;
m:=ord-2; v:=control1(ord);
v:=derproc(v,ord);
v:=derproc2(v,ord);
v:=derproc3(v,ord);
v:=subs(x1(t)^2+x2(t)^2-mu=P,v);
for i from 1 to ord do
v:=subs(x[i](t)=x[i],v)
od;
v;
end:
Como puede observarse, esta funcion tambien realiza tareas de limpieza. Para obtener
la ley u3 para un sistema de quinto orden como se realizo en la seccion 6.8 anterior,
simplemente escribiremos
u3:=fullproc(5);
Bibliografa
Andreev, F., Auckly, D., Kapitanski, L., Gosavi, S., Kelkar, A. & White, W. (2000),
Matching control laws for a ball and beam system, in Proc. 1st IFAC Workshop on
Lagrangian and Hamiltonian Methods for nonlinear control, Princeton, NJ, USA,
pp. 161162.
Aracil, J., Gomez-Estern, F. & Gordillo, F. (2002), A family of hamiltonian oscillating systems, in Lagrangian and Hamiltonian methods in nonlinear control 2003 (pendiente
de aceptacion), Sevilla, Espa
na.
Aracil, J., Gordillo, F. & Acosta., J. (2002), Stabilization of oscillations in the inverted
pendulum, in Proc. XV IFAC World Congress, Barcelona, Espa
na.
Aracil, J., Gordillo, F. & Gomez-Estern, F. (2002), Generation of stable oscillations in
cascade nonlinear systems and the hopf bifurcation, Int. Journal of Control (en
revision) .
Astol, A. & Ortega, R. (2001), Immersion and invariance: a new tool for stabilization and
adaptive control of nonlinear systems, in Proc. 5th IFAC Symp. Nonlinear Control
Systems, NOLCOS01, St Petersburg, Russia.
196
BIBLIOGRAFIA
Blankenstein, G., Ortega, R. & Van der Schaft, A. (2002), Matching of euler-lagrange and
hamiltonian systems, in Proc. XV IFAC World Congress, Barcelona, Espa
na.
Bloch, A., Leonard, N. & Marsden, J. (2000), Controlled lagrangians and the stabilization
of mechanical systems, IEEE Tr. on Automatic Control 45, No. 12.
Bullo, F. (2002), Control of hybrid systems along limit cycles, in 15th Symposium on
Mathematical Theory of Networks and Systems MTNS. University of Notre Dame,
August 12-16,.
Byrnes, C., Isidori, A. & Willems, J. (1991), Passivity, feedback equivalence, and the
global stabilization of minimum phase nonlinear systems, IEEE Tr. on Automatic
Control 36, No. 11, 12281240.
Canudas de Wit, C., Olsson, H.,
Astrom, K. J. & Lischinscky, P. (1995), A new model
for control on systems with friction, IEEE Transactions of Automatic Control 40,
No. 3.
Chang, D. E., Bloch, A. M., Leonard, N. E., Marsden, J. E. & Woolsey, C. A. (2002), The
equivalence of controlled lagrangian and controlled hamiltonian systems, ESAIM:
Control, Optimisation, and Calculus of Variations (en revisi
on) .
Espinosa-Perez, G., Sira-Ramrez, H. & Ros-Bolivar, M. (2000), Regulation of the ppr
mobile robot with a exible joint: a combined passivity and atness approach, in
Proceedings of the 39th Conference on Decision and Control Systems, Vol. 4, Orlando, FL, USA, pp. 40364041.
Fradkov, A. & Pogromsky, A. (1998), Introduction to Control of Oscillations and Chaos,
World Scientic.
Fujimoto, K. & Sugie, T. (2001), Stabilization of hamiltonian systems with nonholonomic
contraints based on timevarying generalized canonical transformations, Systems
and Control Letters 44, No. 15, 309320.
Gomez-Estern, F., Aracil, J. & Gordillo, F. (2002), The hopf bifurcation and controlled
oscillations in electromechanical systems, in Proc. 10th Mediterranean Conference
on Control and Automation, Inst. Superior Tecnico, Lisbon, Portugal.
Gomez-Estern, F., Aracil, J. & Rubio, F. R. (2000), Practical implementation of a
hamiltonianbased 2DOF platform, in Proc. IFAC Symposium on Robot Control,
Vienna, AU.
Gomez-Estern, F., Cordones, M. & Rubio, F. (2002), Passivity-based control and disturbance rejection on a 2-dof platform, in European Control Conference 2003 (pendiente
de aceptacion), Cambridge, UK.
Gomez-Estern, F., Ortega, R., Rubio, F. & Aracil, J. (2001), Stabilization of a class
of underactuated mechanical systems via total energy shaping, in Proc. 40th IEEE
Conf on Decision and Control, Orlando, FL, USA.
Gomez-Estern, F., Ortega, R. & Spong, M. (2001), Total energy shaping for underactuated mechanical systems, in Proc. 5th IFAC Symp. Nonlinear Control Systems,
NOLCOS01, St Petersburg, Russia.
BIBLIOGRAFIA
197
Gomez-Estern, F., Perez, C., Rubio, F. & Gordillo, F. (2000), Aplicacion en tiempo
real para el control de una plataforma giroestabilizada, in Proc. XXI Jornadas de
Automatica, Sevilla, Espa
na.
Gordillo, F., Aracil, J. & Gomez-Estern, F. (2002), Stabilization of autonomous oscillations and the Hopf bifurcation in the ball and beam, Las Vegas, USA. Proceedings
of the CDC02.
Gordillo, F., Gomez-Estern, F., Ortega, R. & Aracil, J. (2002), On the ball and beam
problem: regulation with guaranteed transient performance and tracking periodic
orbits, in 15th International Symposium on Mathematical Theory of Networks and
Systems,MTNS02, University of Notre Dame, August 12-16.
Hale, J. & Kocak, H. (1991), Dynamics and Bifurcations, Springer-Verlag.
Hamberg, J. (1999), General matching conditions in the theory of controlled lagrangians,
in Proc. of the 38th IEEE Conference on Decision and Control, Phoenix, AZ, USA.
Hauser, J., Sastry, S. & Kokotovic, P. (1992), Nonlinear control via approximate inputoutput linearization: The ball and beam example, IEEE Trans. on AC 37, No.
3, 392398.
Isidori, A. (1989), Nonlinear Control Systems, Springer-Verlag, Berlin, DE.
Kelly, R. (1993), A simple set point robot controller by using only position measurements,
in Proc. 12th IFAC World Conf., Vol. 6, Sydney, Australia, pp. 173176.
Khalil, H. (1996), Nonlinear Systems, Prentice Hall.
Krstic, M., Kanellakopoulos, I. & Kokotovic, P. (1995), Nonlinear and Adaptive Control
Design, Wiley.
Krstic, M., Sepulchre, R. & Praly, L. (1995), On the measure of global invariant manifold
for xed points, in Technical Report CCEC 95-0228, University of California, Santa
Barbara.
Kuznetsov, Y. (1995), Elements of Applied Bifurcation Theory, Springer-Verlag.
Landau, L. & Lifchitz, E. (1964), Curso de fsica te
orica, Tomo I: Mec
anica, Ediciones
MIR, Mosc
u.
Leonard, N., Bloch, A. & Marsden, J. (1998), Mechanical feedback control systems, in
M. Vidyasagar, V. Blondel, E. Sontag & J. Willems, eds, Open Problems in Mathematical Systems and Control Theory, Springer-Verlag, pp. 3944.
Liu, W. (1994), Criterion of Hopf bifurcations without using eigenvalues, Journal of
Mathematics Analysis and Applications 182, 250256.
M. Reyhanoglu, A.J. Van der Schaft, N. M. & Kolmanovsky, I. (2001), Dynamics and control of underactuated mechanical systems, IEEE Transactions on Automatic Control
44, No. 9, 16631671.
Marino, R. & Tomei, P. (1995), Nonlinear Control Design, Prentice Hall.
Marsden, J. & McCracken, M. (1976), The Hopf Bifurcation and Its Applications,
Springer-Verlag.
198
BIBLIOGRAFIA
Mees, A. & Chua, L. (1979), The Hopf bifurcation theorem and its applications to nonlinear oscillations in circuits and systems, IEEE Trans. on CAS 26, No. 4, 235254.
Olfati-Saber, R. (2001), PhD thesis: Nonlinear Control of Underactuated Mechanical
Systems with Application to Robotics and Aerospace Vehicles, PhD thesis, Massachusetts Institute of Technology.
Ortega, R., Loria, A., Kelly, R. & Praly, L. (1995), On output feedback global stabilization of euler-lagrange systems, Int. J. of Robust and Nonlinear Cont. Special Issue
on Mechanical Systems 5, No. 4, 313324.
Ortega, R., Loria, A., Niklasson, P. & Sira-Ramrez, H. (1998), Passivity-based Control
of Euler-Lagrange Systems, Springer-Verlag.
Ortega, R. & Spong, M. (2000), Stabilization of underactuated mechanical systems via
interconnection and damping assignment, in Proceedings of the 1st IFAC Workshop
on Lagrangian and Hamiltonian methods in nonlinear systems, Princeton, NJ, USA.
Ortega, R., Spong, M., Gomez-Estern, F. & Blankenstein, G. (2002), Stabilization of
underactuated mechanical systems via interconnection and damping assignment,
IEEE Tr. on Automatic Control 47, No. 8, 12181233.
Ortega, R., Van der Schaft, A., Mareels, I. & Maschke, B. (2001), Putting energy back
in control, IEEE Control Syst. Magazine 9, No. 4, 637644.
Ortega, R., Van der Schaft, A., Maschke, B. & Escobar, G. (2002), Interconnection and
damping assignment passivity-based control of port-controlled hamiltonian systems,
Automatica 38, No. 10, 585596.
Praly, L., Ortega, R. & Kaliora, G. (2001), Stabilization of nonlinear systems via forwarding mod{Lg V }, IEEE Transactions on Automatic Control 46, No.9.
Ra
nada, A. (1990), Dinamica Clasica, Alianza Universidad Textos, Madrid.
Rampazzo, F. & Sussmann, H. (2001), Set-valued dierentials and a nonsmooth version
of chows theorem, in Proceedings of the 40th IEEE Conference on Decision and
Control, Orlando, FL, USA, pp. 26132618.
Rodrguez, H. & Ortega, R. (2002), Interconnection and damping assignment control of
electromechanical systems, in Proc. XV IFAC World Congress, Barcelona, Espa
na.
Rouche, N. & Mawhin, J. (1980), Ordinary Dierential Equations: Vol II, Pitman Publ.,
London.
Santilli, R. M. (1978), Foundations of Theoretical Mechanics I, SpringerVerlag.
Sepulchre, R., Jankovic, M. & Kokotovic, P. (1997), Constructive Nonlinear Control,
Springer-Verlag.
Shen, T., Mei, S., Lu, Q. & Tamura, K. (1999), Robust nonlinear excitation control with
L2 -disturbance attenuation for power systems, in Proc. of the 38th IEEE Conference
on Decision and Control, Phoenix, AZ, USA.
Shiriaev, A. & et al. (2000), On global properties of passivity-based control of the inverted
pendulum, Int Journal of Robust and Nonlinear Control 10, No.4, 283300.
BIBLIOGRAFIA
199
Slotine, J. & Li, W. (1987), On the adaptive control of robot manipulators, Int. J.
Robotics Research 6, 4959.
Spong, M. (1997), Underactuated mechanical systems, in International Workshop on
Control Problems in Robotics and Automation: Future Directions, Hyatt Regency,
San Diego, California, pp. 26132618.
Spong, M., Corke, P. & Lozano, R. (2001), Nonlinear control of the inertia wheel pendulum, Automatica 37, 18451851.
Spong, M. & Vidyasagar, M. (1989), Robot Dynamics and Control, John Wiley & Sons,
Inc., New York, USA.
Tanenbaum, A. S. (2001), Modern Operating Systems, Prentice Hall.
Texas Instruments (1999), Texas Instruments TMS320C4x User Guide.
Van der Schaft, A. (2000), L2 -Gain and Passivity Techniques in Nonlinear Control,
Springer-Verlag.
Vidyasagar, M. (1993), Nonlinear system analysis (2nd edition), Prentice Hall, London,
UK.
Wang, Y., Cheng, D., Li, C. & Ge, Y. (2002), Dissipative hamiltonian realization and
energy-based L2 -disturbance attenuation control of multimachine power systems,
Preprint, 2002 .
Weibel, S. (1997), Applications of qualitative methods in the nonlinear control of superarticulated mechanical systems, PhD thesis, Boston University, Boston, Massachusetts,
USA.