You are on page 1of 213

TESIS DOCTORAL

Control de sistemas
no lineales basado en la
estructura hamiltoniana
por
Fabio G
omez-Estern Aguilar
Ingeniero de Telecomunicacion por la Escuela Superior de Ingenieros
de la Universidad de Sevilla
Presentada en la
Escuela Superior de Ingenieros
de la
Universidad de Sevilla
para la obtencion del
Grado de Doctor Ingeniero de Telecomunicaci
on

Sevilla, Septiembre de 2002

TESIS DOCTORAL

Control de sistemas
no lineales basado en la
estructura hamiltoniana

Autor: Fabio Gomez-Estern Aguilar


Directores: Javier Aracil Santonja

Francisco Gordillo Alvarez

Agradecimientos
Ante todo, expresar mi gratitud a mis padres cuyo cari
no y apoyo incondicional, han
resultado imprescindibles para llevar a termino esta ambiciosa tarea.
Estoy igualmente agradecido a Javier Aracil, mi primer director por sus muchas sugerencias y apoyo constante durante esta investigacion. Su imaginacion, sabidura y dedicacion lo hacen indiscutible merecedor del prestigio del que disfruta.
Al codirector de esta tesis, Francisco Gordillo, le debo la dedicacion, su compromiso
con la calidad y la puesta al servicio del trabajo com
un de sus solidos conocimientos en
nuestra area en la difcil preparacion de los artculos que contribuyeron a esta tesis.
El profesor Romeo Ortega manifesto su interes por nuestro trabajo y la posibilidad de
abrir un lnea com
un de investigacion entre su grupo frances de Supelec y el sevillano, que
ha dado sus frutos y continuara haciendolo en el futuro. Es un honor para m el haber
sido coautor con el de una serie de artculos.
Estoy igualmente agradecido al profesor Francisco Rodrguez Rubio por su decisiva
contribucion al inicio y desarrollo de esta tesis, as como la ejemplar gestion de los proyectos en los que se enmarca el presente trabajo.
Por sus sugerencias y colaboracion, me siento en deuda con Enrique Ponce, Mark W.
Spong, Antonio Barreiro, Hugo Rodrguez, Carlos Perez, Daro Becares, Ismael Alcala,
Miguel Pe
na, Kurt Schlacher, Jose Angel Acosta, Guido Blankestein, Cesareo Raim
undez,

Manolo Lopez, Miguel Angel G. Cordones, Oscar Collazo, Gregory Potel, Jorge Chavez,
Wolfgang Mitterbaur, y los anonimos revisores que intervinieron en las publicaciones
relacionadas con la tesis; todos ellos investigadores de primera lnea.
Por u
ltimo hare constar mi cari
no y gratitud por su apoyo y comprension a los siguientes: Cesar Saiz, Pedro Montes, Agustn Martnez, Rafael Garca, Ivan Gonzalez, Olga
Puente, Javi Reig, Teresa Cruz, y los amigos injustamente omitidos, en recuerdo de los
buenos momentos compartidos.
El presente trabajo ha sido nanciado parcialmente por el Ministerio de Ciencia y
Tecnologa espa
nol bajo los programas FEDER y PICASSO. Igualmente ha recibido nanciacion para las estancias del doctorando en el Laboratoire de Signaux et Systemes,
Supelec, por parte del Centre National de la Recherche Scientique frances.
Sevilla
Septiembre de 2002

Fabio Gomez-Estern Aguilar

Nocte dieque incubando


(Da y noche dandole vueltas)
Sir Isaac Newton

Por supuesto, por siempre, a Paloma.

Indice General
Glosario

Resumen

1 Introducci
on

1.1

Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2

Motivacion y objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3

Control de plataformas giroestabilizadas . . . . . . . . . . . . . . . . . . .

1.4

Sistemas subactuados en control . . . . . . . . . . . . . . . . . . . . . . . .

1.5

Control basado en la energa . . . . . . . . . . . . . . . . . . . . . . . . . .

1.5.1

Evolucion del concepto de energa . . . . . . . . . . . . . . . . . . .

1.5.2

Energa en control: planteamiento del problema . . . . . . . . . . . 10

1.5.3

Estabilizacion mediante la energa . . . . . . . . . . . . . . . . . . . 12

1.5.4

Comportamiento transitorio . . . . . . . . . . . . . . . . . . . . . . 15

1.5.5

Generalizacion de la energa en el control . . . . . . . . . . . . . . . 16

1.6

Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2 Fundamentos te
oricos y estado de la t
ecnica

19

2.1

Sistemas electromecanicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2

Sistemas de EulerLagrange . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3

Sistemas hamiltonianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1

Sistemas hamiltonianos generalizados. . . . . . . . . . . . . . . . . . 22

2.3.2

Hamiltoniano y energa . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.4

Estabilidad en sistemas autonomos . . . . . . . . . . . . . . . . . . . . . . 25

2.5

Bifurcaciones en sistemas no lineales . . . . . . . . . . . . . . . . . . . . . 26


i

INDICE GENERAL

ii

2.6

2.7

Pasividad y disipatividad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.1

Estabilidad Lq

2.6.2

Pasividad y ganancia L2 . . . . . . . . . . . . . . . . . . . . . . . . 29

2.6.3

Interconexion de sistemas pasivos . . . . . . . . . . . . . . . . . . . 30

2.6.4

Atenuacion L2 de perturbaciones . . . . . . . . . . . . . . . . . . . 30

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

Sistemas subactuados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7.1

Controlabilidad en sistemas subactuados . . . . . . . . . . . . . . . 33

2.7.2

Metodos de sntesis que preservan la estructura hamiltoniana/lagrangiana


en bucle cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.7.3

Inmersion e invariancia . . . . . . . . . . . . . . . . . . . . . . . . . 37

2.7.4

Control de sistemas en cascada mediante backstepping . . . . . . . . 38

3 Control de una plataforma giroestabilizada de dos grados de libertad

41

3.1

Sensores empleados en control inercial

. . . . . . . . . . . . . . . . . . . . 41

3.2

Descripcion de la plataforma inercial . . . . . . . . . . . . . . . . . . . . . 43

3.3

Modelo de la plataforma . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.4

Control hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.1

Eleccion de un punto de equilibrio arbitrario . . . . . . . . . . . . . 47

3.4.2

Estabilidad seg
un Lyapunov . . . . . . . . . . . . . . . . . . . . . . 49

3.5

Rechazo de perturbaciones L2 . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.6

Seguimiento de objetos moviles en superces no inerciales . . . . . . . . . . 51


3.6.1

Seguimiento visual . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.6.2

Subsistema de estabilizacion de trayectorias . . . . . . . . . . . . . 53

3.7

Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.8

Aplicacion a una planta de laboratorio . . . . . . . . . . . . . . . . . . . . 56


3.8.1

3.9

Identicacion de los parametros . . . . . . . . . . . . . . . . . . . . 60

Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.9.1

Identicacion de la planta real . . . . . . . . . . . . . . . . . . . . . 61

3.9.2

Control hamiltoniano con prealimentacion de friccion . . . . . . . . 62

3.9.3

Atenuacion de perturbaciones en la planta real . . . . . . . . . . . . 63

3.9.4

Seguimiento de trayectorias en la planta real . . . . . . . . . . . . . 64

INDICE GENERAL

4 Control de sistemas subactuados mediante el m


etodo IDA-PBC

iii

67

4.1

Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.2

Estabilizacion de sistemas mecanicos subactuados . . . . . . . . . . . . . . 70

4.3

4.4

4.2.1

Dinamica objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.2.2

Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.2.3

Moldeo de energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.2.4

Comparacion entre los enfoques lagrangiano y hamiltoniano . . . . 74

El pendulo de disco inercial . . . . . . . . . . . . . . . . . . . . . . . . . . 76


4.3.1

Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.3.2

Dise
no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . 78

4.3.3

Resultados de simulacion . . . . . . . . . . . . . . . . . . . . . . . . 82

El sistema de la bola en la viga . . . . . . . . . . . . . . . . . . . . . . . . 83


4.4.1

Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

4.4.2

Dise
no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . 85

4.4.3

Metodo aproximado de la elipse exterior . . . . . . . . . . . . . . . 94

4.4.4

Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

5 Reducci
on del m
etodo IDA-PBC para sistemas subactuados

99

5.1

Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

5.2

Reduccion de las EDPs de ajuste en metodos lagrangianos . . . . . . . . . 100


5.2.1

5.3

Reduccion de las ecuaciones de ajuste en IDA-PBC . . . . . . . . . . . . . 103


5.3.1

5.4

Las ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

Denicion de la clase de sistemas . . . . . . . . . . . . . . . . . . . 103

Reduccion de las ecuaciones de moldeo de la energa cinetica . . . . . . . . 104


5.4.1

Generalizacion de la parametrizacion de Md para sistemas dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

5.5

Moldeo de la energa potencial . . . . . . . . . . . . . . . . . . . . . . . . . 110

5.6

Calculo de la ley de control . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.7

Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

5.8

Comparacion de leyes de control . . . . . . . . . . . . . . . . . . . . . . . . 116


5.8.1

Control lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

5.8.2

Control por lagrangianos controlados . . . . . . . . . . . . . . . . . 119

INDICE GENERAL

iv

5.9

Extension de la solucion a otros sistemas . . . . . . . . . . . . . . . . . . . 121


5.9.1

5.9.2

Sistemas de orden mayor . . . . . . . . . . . . . . . . . . . . . . . . 121


5.9.1.1

Moldeo de energa cinetica del robot PPR . . . . . . . . . 121

5.9.1.2

Moldeo de la energa potencial . . . . . . . . . . . . . . . 125

Efecto de la perdida de controlabilidad en IDA-PBC

6 Estabilizaci
on de oscilaciones en sistemas no lineales

. . . . . . . . 125
129

6.1

Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

6.2

Un sistema hamiltoniano generalizado oscilatorio de segundo orden . . . . 132

6.3

Estabilizacion de oscilaciones en sistemas de orden dos . . . . . . . . . . . 136

6.4

Backstepping para una clase de sistemas no anes . . . . . . . . . . . . . . 137

6.5

Un metodo para la estabilizacion de oscilaciones mediante backstepping . . 138

6.6

Sistemas de orden mayor


6.6.1

. . . . . . . . . . . . . . . . . . . . . . . . . . . 142

Caso mas general . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

6.7

Revision del metodo empleando linealizacion por realimentacion . . . . . . 146

6.8

Realizacion de una familia de sistemas oscilantes a partir de la linealizacion


por realimentacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

6.9

Aplicacion a sistemas subactuados . . . . . . . . . . . . . . . . . . . . . . . 155


6.9.1

Sistema de levitacion magnetica

. . . . . . . . . . . . . . . . . . . 155

6.9.2

Implementacion en un sistema de laboratorio . . . . . . . . . . . . . 156

6.9.3

Modelo del sistema de laboratorio . . . . . . . . . . . . . . . . . . . 156

6.9.4

Identicacion de parametros . . . . . . . . . . . . . . . . . . . . . . 158

6.9.5

Dise
no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . 160

6.9.6

Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . 160

6.9.7

Oscilaciones en la bola en la viga . . . . . . . . . . . . . . . . . . . 161

6.9.8

Bifurcaciones en el sistema de la bola y la viga . . . . . . . . . . . . 164

6.9.9

Efecto de la aceleracion centrfuga . . . . . . . . . . . . . . . . . . . 165

6.10 Estabilizacion de oscilaciones por Inmersion e Invariancia . . . . . . . . . . 167


6.10.1 Resultados de la simulacion . . . . . . . . . . . . . . . . . . . . . . 168
7 Conclusiones y desarrollos futuros
7.1

171

Conclusiones del captulo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

INDICE GENERAL

7.2

Conclusiones del captulo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

7.3

Conclusiones del captulo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

7.4

Conclusiones del captulo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

7.5

Desarrollos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174


7.5.1

Cinematica de la plataforma de sensores . . . . . . . . . . . . . . . 174

7.5.2

Sistemas subactuados . . . . . . . . . . . . . . . . . . . . . . . . . . 176

7.5.3

Estabilizacion de oscilaciones . . . . . . . . . . . . . . . . . . . . . 177

A Proyecto DORNA

181

A.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181


A.2 Arquitectura hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
A.3 Arquitectura de la aplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . 183
A.4 Simulador de la plataforma giroestabilizada . . . . . . . . . . . . . . . . . 184
A.5 Procesador de comunicaciones . . . . . . . . . . . . . . . . . . . . . . . . . 185
A.6 Maquina de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
A.7 Procesadores de lazos de control . . . . . . . . . . . . . . . . . . . . . . . . 188
A.8 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
B C
odigo Maple para la ecuaci
on (6.8.1)

191

Bibliografa

195

vi

INDICE GENERAL

Glosario
Notaci
on matem
atica
IR+
Cn
R>0
R0
M (q) > I

G
G
u

g
In
Mij
Mi
Mj
q

Conjunto de n
umeros reales no negativos.
Conjunto de funciones diferenciables n veces.
Matriz simetrica denida positiva.
Matriz simetrica semidenida positiva.
(Matriz uniformemente denida positiva). Matriz dependiente del estado q donde los autovalores cumplen
i > , i, q para una cierta constante  > 0.
Matriz que multiplica al vector de control en sistemas
del tipo x = f (x) + Gu.
Matriz cuyas las son ortogonales a las columnas de G,
tal que G G = 0 y cuyo rango es r = n rango(G).
Ley de control (vector).
Par de control (vector).
Aceleracion de la gravedad en la supercie terrestre de
valor 9.8m/s2 .
Matriz identidad de orden n.
Elemento de la la i, columna j de la matriz M .
Fila i-esima de la matriz M .
Columna j-esima de la matriz M .
Vector de coordenadas articulares dado por q =
[q1 , q2 , . . . , qn ]T en un sistema mecanico de n grados de
libertad.
Vector de momentos generalizados dado por p =
[p1 , p2 , . . . , pn ]T en un sistema mecanico de n grados de
libertad.

Glosario

q f
qk f
gradf
y (r)
Lq
L2
H(q, q)

M (q)
T (q, q)

V (q)
Hd (q, q)

Md (q)
Td (q, q)

Vd (q)
q
arg min (V (q))
q0
p0
t
ues
udi
BIBO
Ixx , Iyy , Izz
rango(A)

Vector gradiente
T

f f
f
, , . . . , qn .
q1 q2

de

la

funcion

escalar

f:

f
Elemento k-esimo de q f , es decir q
k
Equivalente a q f .
Derivada r-esima con respecto al tiempo de la funcion
y(t).
Vease la seccion 2.6.
Vease la seccion 2.6.
Funcion de Hamilton de un sistema en bucle abierto.
Matriz de inercia en bucle abierto.
Energa cinetica en bucle abierto.
Energa potencial en bucle abierto.
Funcion de Hamilton de un sistema en bucle cerrado.
Matriz de inercia en bucle cerrado.
Energa cinetica en bucle cerrado.
Energa potencial en bucle cerrado.
Posicion de referencia que se desea estabilizar q.
Valor del vector q que hace mnima localmente la funcion
V (q).
Valores de las coordenadas generalizadas en el instante
inicial.
Valores de los momentos generalizados en el instante
inicial.
Variable tiempo
Ley de control de moldeo de energa (Energy Shaping).
Ley de control de inyeccion de amortiguamiento (Damping Injection).
Estabilidad en terminos de entrada acotada salida
acotada (Bounded Input Bounded Output).
Momentos de inercia respecto a los ejes principales x,y,z,
respectivamente.
Rango de la matriz A.

Glosario

T
erminos matem
aticos

Curva de nivel
Conjunto de nivel
Matriz acotada
Trayectoria acotada
Pasividad
Conjunto abierto
Conjunto cerrado
Conjunto acotado
Conjunto compacto
Conjunto conexo

Funcion propia

Clase K
Clase K

Lugar geometrico donde el valor de una funcion


V (x) permanece constante.
Lugar geometrico donde una funcion toma valores inferiores a una determinada constante.
Matriz de autovalores acotados.
Trayectoria donde la norma eucldea del vector
q esta acotada.
Vease la seccion 2.6.
Conjunto en el que para cada elemento x, existe
una bola de radio r contenida en el.
Conjunto cuyo complemento es un conjunto
abierto.
Conjunto donde existe una cota M IRn tal
que x M para todo elemento x en el.
Conjunto cerrado y acotado.
Conjunto donde para cada par de puntos existe
una sucesion de segmentos que los une plenamente contenida en el.
Funcion V (x) denida en tal que los conjuntos
{x |0 V (x) c} son compactos para cada
c IR+ ). Equivale al termino radialmente no
acotada.
Un funcion continua : [0, a) [0, ) es de
clase K si es estrictamente creciente y (0) = 0.
Un funcion continua : [0, ) [0, ) es de
clase K si es de clase K y ademas (r)
cuando r .

Glosario

Abreviaturas y acr
onimos

Cont.
DHR
Discont.
EDO
EDP
EL
GAS
GHS
GPS
IDA-PBC
INS
ISA
LSS
PBC
PCH
PCHD
US

Lnea continua en una graca.


Realizacion hamiltoniana directa (Direct Hamiltonian
Realization, equivalente a GHS).
Lnea a trazos en una graca.
Ecuacion diferencial ordinaria.
Ecuacion diferencial en derivadas parciales.
Ecuaciones de Euler-Lagrange.
Estabilidad asintotica global.
Sistema hamiltoniano generalizado (Generalizaed
Hamiltonian System).
Sistema de posicionamiento global por satelite (Global
Positioning System).
PBC con inyeccion de amoriguamiento (Interconnection
and Damping Assigmnment-PBC).
Sistema de navegacion inercial (Inertial Navigation System).
Depto. de Ingeniera de Sistemas y Automatica.
Laboratoire des Signaux et Syst`emes.
Control basado en pasividad (Passivity-Based Control).
Sistema hamiltoniano controlado por puertos (PortControlled Hamiltonian System).
Sistema hamiltoniano controlado por puertos con disipacion.
Universidad de Sevilla.

Resumen

Las tecnicas de control basadas en las estructuras lagrangiana y hamiltoniana de los


sistemas electromecanicos han experimentado un reciente auge de notables proporciones.
Los metodos a los que ha dado lugar esta lnea de investigacion permiten, por primera
vez, abordar de manera sistematica un conjunto de problemas abiertos como el control
de sistemas subactuados y la obtencion de funciones de Lyapunov para controladores no
lineales.
En esta tesis se han abordado tres problemas de diferente naturaleza que comparten
un hilo com
un en la exposicion: la explotacion de la estructura hamiltoniana de sistemas
electromecanicos tanto en bucle abierto como en bucle cerrado para dirigirlos de manera
robusta hacia equilibrios y orbitas periodicas basandose en consideraciones energeticas.
Al comienzo de esta tesis se presentan, de forma sucinta y ordenada, las deniciones
y resultados mas importantes de la literatura afn que dan el soporte teorico para la
comprension del presente trabajo.
El primer sistema estudiado es una plataforma de sensores de dos grados de libertad inmersa en un sistema de referencia no inercial (mesa desestabilizadora) instalada
en el departamento de Ingeniera de Sistemas y Automatica de la Universidad de Sevilla. Este sistema esta motivado por una aplicacion naval, consistente en un sistema de
deteccion visual de obstaculos en navegacion. La sntesis de controladores para este sistema plantea importantes retos; sirva de ejemplo la estabilizacion robusta frente a perturbaciones, seguimiento visual de objetos moviles y estabilizacion giroscopica frente a
movimientos del sistema de referencia en que se apoya.
La segunda lnea de investigacion se centra en el interesante y no trivial problema de
sntesis de controladores para sistemas subactuados basados en pasividad. Se hace un
estudio teorico con el n de extender y sistematizar los metodos basados en pasividad, y
se proponen soluciones para problemas que quedaban abiertos desde largo tiempo atras.
Se ofrece una comparativa teorica y de simulacion con otros metodos actualmente en uso.
La tercera lnea aborda la estabilizacion de oscilaciones periodicas en sistemas no lineales y el analisis de bifurcaciones que aparecen en bucle cerrado. En esta seccion se
presentan una serie de resultados teoricos de gran utilidad para lograr los comportamientos oscilatorios en una amplia clase de sistemas, incluyendo buen n
umero de sistemas
5

Resumen

mecanicos subactuados. Los resultados son contrastados mediante simulacion y de forma


experimental en sistemas reales de laboratorio .
A continuacion se presenta una seccion de conclusiones resumiendo las pricipales contribuciones de esta tesis y propuestas de desarrollos futuro. El presente texto concluye
con un apendice en el que se muestran los detalles de una aplicacion de tiempo real que
desarrollo un equipo del departamento ISA al que perteneca el doctorando y que dio pie
a la primera lnea de investigacion de esta tesis.

Captulo 1
Introducci
on
1.1 Generalidades
En esta tesis se presentaran distintas contribuciones en el contexto del control de sistemas
mecanicos basado en la estructura hamiltoniana y el enfoque energetico.
El presente captulo se destina a la exposicion de las motivaciones practicas subyacentes en el control de plataformas de sensores giroestabilizadas, el control de sistemas
subactuados, y las tecnicas de estabilizacion de orbitas periodicas, al ser estos tres los
principales ambitos de aplicacion de los resultados de esta tesis.
Asimismo se realizara una breve introduccion, con referencias historicas, a los metodos
de control basado en la energa, en los que se asientan las tecnicas de pasividad y el control
hamiltoniano.
En la seccion 1.6 de este captulo se detallara la estructura del resto de los captulos
de esta la, y se detallaran publicaciones a que ha dado lugar cada uno de los captulos.

1.2 Motivacion y objetivos


En este apartado se comentaran los motivos y aplicaciones reales que suscitan el interes del
ingeniero de control por la resolucion de los problemas tratados en esta tesis. Si bien existe
una lnea com
un clara en el enfoque de la investigacion, consistente en la estabilizacion
de sistemas no lineales empleando tecnicas de pasividad y la estructura hamiltoniana,
podemos discernir tres lneas de estudio tratadas de forma independiente

1.3 Control de plataformas giroestabilizadas


La primera parte de la tesis, con un caracter mas practico que el resto del texto, emerge
en el marco de un proyecto de aplicacion en la industria naval que conlleva importantes
ingredientes de interes teorico. El sistema de control esta basado en procesadores digitales
de se
nales conectados en bus VME destinados a la estabilizacion inercial de una plataforma
7

1.4. Sistemas subactuados en control

de dos grados de libertad equipada con sensores de movimiento (giroscopos, resolvers y


encoders) y otros tipos: radar, telemetro, comunicaciones, infrarrojos, etc. Este sistema
se instala sobre la cubierta de un buque, de modo que la perturbacion en la medida de los
sensores causada por el oleaje se ve compensada por la estabilizacion giroscopica de la lnea
de mira. En esta tesis se desarrollan los fundamentos teoricos para la identicacion de la
plataforma, el control hamiltoniano de la misma, la robustecimiento mediante un resultado
reciente de rechazo de perturbaciones y el seguimiento de trayectorias basado en pasividad.
Los supuestos teoricos estan ampliamente avalados con resultados de simulacion y trabajos
experimentales.

1.4 Sistemas subactuados en control


La segunda parte de la tesis aborda uno de los problemas matematicos abiertos en teora
de control que mas interes ha despertado en la u
ltima decada: la sntesis de controladores
para sistemas mecanicos subactuados.
Un sistema subactuado es aquel que posee menos entradas de control que grados de
libertad. Mantener en equilibrio una varilla cilndrica sobre la palma de nuestra mano es
un buen ejemplo de un sistema subactuado. Este sistema, como se muestra en la gura
1.1, tiene cinco grados de libertad (tres para la posicion del punto de contacto de la mano
con la varilla, y dos angulos para la u
ltima). Sin embargo solo podemos actuar en los
tres grados de libertad de la mano. En la practica cualquier sistema que necesite nuestra
atencion para mantenerse en equilibrio es un sistema subactuado. Otros ejemplos son
la bicicleta, y aunque menos evidente, un avion, con seis grados de libertad y cuatro
actuadores.

Figura 1.1: Grados de libertad de un sistema subactuado.

Existe una extensa literatura de investigacion dedicada a este tipo de sistemas. Para
una introduccion al problema vease (Spong 1997). Una clasicacion interesante de problemas de sistemas subactuados sencillos desde el punto de vista de las posibles estrategias
para su resolucion puede verse en (Weibel 1997) y tambien en (Olfati-Saber 2001). Pese
a los grandes avances teoricos y experimentales, los resultados distan de tener gran generalidad, y en este momento del desarrollo de la tecnica cada ejemplo en particular es
un problema abierto diferente de los ya resueltos y que debe ser abordado atendiendo a

Captulo 1. Introducci
on

sus particularidades. En la practica existe un peque


no conjunto de sistemas subactuados
sencillos que han cobrado gran popularidad por el desafo que representan, para los cuales
existe una amplia gama de controladores en la literatura. Evidentemente, existe una innidad de ejemplos inexplorados, tantos como queramos idear, para los que las tecnicas
existentes se muestran impotentes.
El problema del control de sistemas subactuados esta motivado por numerosas aplicaciones practicas. En primer lugar se esgrime el solido argumento de la economa de
dise
no. Si un aeronave es un sistema subactuado en el que se aplica el empuje en la
direccion del motor de reaccion y se controla la trayectoria del cuerpo (de seis grados de
libertad) con la sola intervencion del timon de cola y la potencia del motor, podramos
a
nadir actuadores, hasta seis, que apliquen la propulsion en las tres direcciones espaciales
y que impriman cualquier momento de giro, hasta poder situar el avion en la posicion que
queramos, incluso detenido o invertido, garantizando estabilidad y trayectorias optimas.
Posiblemente sera un sistema mas facil de pilotar, sobre todo en despegue y aterrizaje, pero se tratara de una maquina costossima y el consumo de combustible resultara
sumamente ineciente.
Otras aplicaciones surgen por la propia disposicion fsica del sistema. Una lanzadera
espacial es un sistema subactuado inestable por naturaleza al aplicar el empuje del motor
por debajo de su centro de gravedad. Mantener la estabilidad de la lanzadera en la
posicion vertical superior es un reto para el control que se ha reproducido en un popular
sistema instalado en gran parte de los laboratorios de las universidades del mundo: el
pendulo invertido, que se analizara en esta tesis.
Otras aplicaciones de sistemas subactuados aparecen en el dise
no de vehculos submarinos, misiles, satelites de comunicaciones, y robots bpedos.

1.5 Control basado en la energa


Una de las tecnicas que mayor interes ha despertado en la comunidad del control de
sistemas subactuados por sus m
ultiples aplicaciones y por su retorno al uso de la intuicion
fsica en la labor del ingeniero, es la pasividad. Para su entendimiento es preciso establecer
el papel de la energa en el control.
Si al analizar una ley de control que act
ua sobre un sistema, sabemos discernir que
terminos mantienen la energa constante, cuales tienen un efecto disipativo, y cuales
inyectan energa al sistema, se arrojara una luz necesaria para el problema de la estabilizacion, abriendo paso a las tareas subsiguientes de ajuste y renamiento del comportamiento transitorio.

1.5.1 Evolucion del concepto de energa


El concepto de energa en control tiene un valor relativo, y requiere informacion adicional
para cobrar signicado. La energa, causa eciente de los movimientos, cobro un sentido
formal en el analisis de los sistemas mecanicos, gracias a los trabajos del siglo XVII,

10

1.5. Control basado en la energa

realizados por los estudiosos de la entonces entonces llamada losofa natural1 . En ellos,
pronto se observo que las leyes de la mecanica admitan la existencia de ciertas funciones
escalares del estado que contenan suciente informacion para determinar la evolucion
futura del sistema en forma diferencial gracias a un principio variacional de mnima acci
on
elegantemente formulado. La b
usqueda de estas funciones generatrices del movimiento
fue objeto de una intensa investigacion iniciada por Maupertuis y culminada por Euler y
Lagrange. Posteriormente, resultados en gran medida equivalentes fueron trasladados a
sistemas electricos.
A estas funciones, que admiten la denominacion de integrales de movimiento, no se
poda atribuir una existencia autonoma en la naturaleza. Hasta un cierto momento de la
historia de la ciencia, la energa solo exista ligada a la conguracion o estado del cuerpo al
que describe. El perspicaz avance en la descripcion de los fenomenos naturales que supone
la teora electromagnetica de Maxwell y los resultados de Poynting, establecen por primera
vez la existencia de una magnitud llamada energa que es independiente de los cuerpos y
puede ser medida en un volumen en ausencia de masa. El teorema de Poynting permite
calcular la energa del campo contenida en un volumen carente de materia radiante y el
ujo a traves de su contorno, como si de un uido se tratara. De ello se deduce que la
energa no requiere la existencia de un substrato material para existir.
La coronacion a este proceso de enriquecimiento del entendimiento cientco llego con
la aparicion de la teora de la relatividad restringida que en 1905 consagra a Albert Einstein estableciendo una equivalencia entre masa y energa, otorgando a la segunda el status
de realidad fsica que hasta entonces solo ostentaba la primera. Desafortunadamente una
representacion no desde
nable de la comunidad intelectual de principios del siglo XX encontro en este hecho una razon para comenzar un amargo distanciamiento entre fsica
y metafsica. Sobre los fsicos teoricos recaa la acusacion de abusar de incomprensibles
articios matematicos desligados de su natural objeto de estudio, y se haca imposible
constatar experimentalmente sus predicciones. Esta actitud es mas paradojica a
un si se
tiene en cuenta que las pesquisas que condujeron al enunciado del principio de relatividad surgieron de hechos tan empricos como el experimento de Michelson y Morley. Las
tecnicas experimentales de la fsica nuclear tardaron decadas en desarrollarse, pero en
su madurez corroboraron todas las predicciones de la teora de Einstein, con lo que se
admitio denitivamente que el nuevo concepto de energa recoga elmente gran cantidad
de fenomenos observables en la naturaleza, y es instrumento esencial para posteriores
desarrollos en todos las escalas, desde la fsica de partculas hasta la astrofsica.

1.5.2 Energa en control: planteamiento del problema


En control automatico es tendencia reciente la incorporacion del concepto de energa como un elemento matematico de ayuda al dise
no de los controladores, as como marco
para la incorporacion de la intuicion fsica en el control. En la descripcion de sistemas
electromecanicos en bucle abierto se emplea una funcion de energa que se corresponde
con el fenomeno natural, concretamente en el sentido de funcion asociada al estado o conguracion del mecanismo. En este caso se puede establecer una separacion entre energas
potencial, cinetica, electrica y magnetica, cuya suma es invariante o decreciente en ausencia de una fuente externa que suministre energa. Tambien podemos identicar en bucle
1

Termino empleado en el ttulo de la principal obra de Sir Isaac Newton Philosophae Naturalis Principia Mathematica.

Captulo 1. Introducci
on

11

abierto el fenomeno de disipacion y sus causas. El segundo principio de la termodinamica


establece el sentido de la disipacion de la energa en sistemas aislados. Mas a
un, la
expresion analtica de una funcion de energa de un sistema autonomo, el hamiltoniano,
expresado en funcion de las coordenadas generalizadas, proporciona informacion suciente
para calcular trayectorias en ausencia de disipacion o inyeccion externa de energa.
En la tarea de sntesis de controladores, no basta con un conocimiento del sistema libre,
se requieren objetos matematicos que reejen el efecto energetico de la se
nal de control.
Controlar implica la adicion de energa al sistema en algunos instantes y absorcion en
otros, de manera que se abandona la naturaleza conservativa o disipativa del sistema
natural porque este ya no se encuentra aislado. En este contexto, sin un principio de
conservacion de la energa o de la cantidad de movimiento, el ingeniero se ve desprovisto de
las herramientas mas fundamentales para el calculo de trayectorias o analisis de estabilidad
de los cuerpos. La alternativa natural que surge de estos planteamientos es encontrar
funciones de energa que describan a los sistemas controlados, para que las trayectorias
de estos puedan ser calculadas y analizadas en virtud de dichas funciones. Se abre un
problema conceptual de dos incognitas para el ingeniero de control: la eleccion de la
funcion de energa en bucle cerrado y el consiguiente calculo de se
nal de control.
Tratemos de formular la pregunta correctamente y habremos recorrido parte del camino
hacia la solucion. Primera cuestion: dado un sistema controlado como encontrar una
nueva funcion de energa que sirva de descripcion del sistema realimentado mediante de
un principio de mnima accion? Este enfoque no es practico en control porque supone
el conocimiento previo de la solucion del problema de dise
no. Aun as sirve de base
para un campo de investigacion de enorme interes denominado problema analtico inverso
(Santilli 1978), en el que se parte de un sistema no lineal descrito en variables de estado:
x = f (x)

(1.5.1)

y se pretende encontrar una funcion L(x, x)


tal que las trayectorias x(t) solucion del
sistema de ecuaciones de Euler-Lagrange


d L
L

=0
dt x
x
sean tambien solucion del sistema no lineal autonomo (1.5.1). Tengase en cuenta que f (x)
contiene tambien la ley de control bajo la suposicion de que esta sea funcion exclusiva del
estado x. El problema formulado no siempre admite solucion pero se pueden establecer
ciertas relaciones que aqu no comentaremos por razones de espacio. La segunda razon
por la cual este enfoque no es practico en control reside en que la funcion de energa, al
contener informacion sobre el comportamiento del lazo cerrado debe ser un objetivo de
dise
no.
De lo esgrimido anteriormente se desprende que en la fase de dise
no de un controlador
basado en energa, tanto la funcion de energa como la se
nal de control son los parametros
a dise
nar. La eleccion de estos parametros se hara atendiendo a restricciones de distinta
naturaleza, que aparecen por especicaciones de rendimiento del sistema o por simples
limitaciones del equipamiento disponible:
Restricciones en la se
nal de control, como sucede con las saturaciones, en la maxima
complejidad admisible en implementacion (por restricciones de tiempo o memoria para los calculos del microprocesador), restricciones de tipo matematico o geometrico debidas a la subactuacion.

12

1.5. Control basado en la energa

Restricciones en la funci
on de energa en bucle cerrado. Como se vera mas adelante
en esta tesis, la forma funcion de energa en bucle cerrado va a determinar las
propiedades de estabilidad del sistema al identicarse con la funcion de Lyapunov
de control .
Restricciones en las trayectorias. Dichas restricciones suelen plantear problemas
practicos de gran dicultad e interes, pues muchos sistemas se dise
nan para funcionar correctamente siempre que se garantice que ciertas variables permanezcan en
un rango determinado. En la presente tesis se vera que estas restricciones pueden
trasladarse al grupo anterior de restricciones en la funcion de energa, proporcionando interesantes resultados practicos.
Restricciones en el tiempo de establecimiento. Es de sumo interes practico limitar el
tiempo en el que un sistema controlado alcanza el objetivo deseado. Desde el punto
de vista teorico existen pocos resultados a este respecto para sistemas no lineales,
por lo tanto permanece como problema abierto en el control.
Conocidas las restricciones y conocido el modelo del sistema en bucle abierto se puede
enunciar el problema del control basado en la energa del siguiente modo: dado el sistema
x = f (x, u), hallar una funcion de realimentacion del estado u u(x), tal que el sistema
resultante tenga, respecto a una funcion del estado H(x), denominada funci
on de almacenamiento o energa, un comportamiento disipativo (la energa decrece con el tiempo).
La forma de esta funcion debe acomodarse al conjunto de restricciones que se desprenden
de las especicaciones en bucle cerrado del sistema.
En el caso particular de no existir restricciones explcitas sobre la se
nal de control
el proceso de dise
no es secuencial: se obtiene una funcion de energa adecuada a las
especicaciones y se calcula por procedimientos puramente algebraicos la se
nal de control
que transforma el sistema en bucle abierto en otro que sea descrito por dicha funcion de
energa.

1.5.3 Estabilizacion mediante la energa


Al introducir el problema del control basado en la energa, hemos comentado soterradamente la necesidad de trasladar las especicaciones de lazo cerrado a restricciones en la
funcion de energa. Que signicado tiene esto en la practica? El procedimiento que
se emplea en la literatura se denomina Energy Shaping (moldeo de energa) ya que las
especicaciones en bucle cerrado se satisfacen dando forma o moldeando la supercie
n-dimensional de la funcion de energa.
Con que criterio hemos de moldear la funcion de energa? Muy brevemente, las
especicaciones de un sistema en bucle cerrado se dividen en dos aspectos: estabilidad
del regimen permanente y calidad del transitorio (velocidad, sobreoscilacion).
Para el regimen permanente sabemos que la herramienta fundamental del analisis de
estabilidad de sistemas no lineales es el metodo directo de Lyapunov. La existencia de
una funcion denida positiva (salvo en el conjunto lmite deseado donde vale cero), que
evaluada en las trayectorias solucion es monotona decreciente, implica la de estabilidad de
dicho conjunto lmite. Bajo ciertas condiciones adicionales dadas en teoremas como los de
LaSalle o Matrosov, se garantiza la estabilidad asintotica, es decir, la convergencia de las
trayectorias hacia el lmite deseado. Al analizar la estabilidad de un sistema controlado por

Captulo 1. Introducci
on

13

Figura 1.2: Pendulo simple.

metodos energeticos en la energa veremos en esta tesis que el concepto de disipatividad,


unido al de moldeo de energa, proporcionan una funcion de Lyapunov para el control,
que es la energa del sistema en bucle cerrado.
El proceso de dise
no en este contexto sera: dado un punto o conjunto de puntos que se
desee estabilizar, hallar una ley de control tal que la funcion de energa en bucle cerrado
sea denida positiva en todo el rango de funcionamiento y cero en el objetivo. Si el
sistema en bucle cerrado es conservativo con respecto a la energa, esta sera la funcion de
Lyapunov y el sistema sera estable. Para ilustrar este procedimiento, observese el clasico
sistema del pendulo simple de la gura 1.2.
En ausencia de accion externa, la funcion de energa mecanica total (potencial mas

cinetica) es una supercie que atribuye un valor de energa a cada punto en el plano (, )
seg
un la expresion
H = cos + k 2
A la izquierda de la gura 1.3 aparece la funcion de energa de dicho sistema frente al
angulo y su derivada. Es facil observar el un punto de silla en el origen de coordenadas
(pendulo en posicion vertical superior). En efecto, si avanzamos hacia el origen en la
nos encontramos un mnimo de
direccion perpendicular al papel (direccion del eje )
energa (valle), mientras que si avanzamos en la direccion horizontal paralela al papel, al
pasar por el origen atravesaremos el perl de maximo de energa (cresta).
Es bien sabido que un punto de silla de la energa no representa un equilibrio estable
de un sistema dinamico. Un controlador basado en la energa tratara de cambiar la forma
completa de la funcion de energa de modo que apareciese un mnimo estricto en el punto
que se desea estabilizar. Para ello se podra a
nadir a la funcion de energa natural, H, un
termino de inyeccion de energa Ha = 2 cos de modo que en bucle cerrado resultara.
H + Ha = cos + k 2
Esta funcion de energa s posee un mnimo en el origen y por tanto, si el sistema es
disipativo (de energa decreciente), tendera asintoticamente a dicho equilibrio. Una vez
elegida la funcion de energa, se calcula la se
nal de control que logra que el sistema
en bucle cerrado posea una dinamica lagrangiana con respecto a dicha funcion. Dicho
calculo involucra la resolucion de un sistema de ecuaciones generalmente algebraicas. El
procedimiento expuesto se conoce como moldeo de energa (energy shaping).
Este procedimiento, que pudiera parecer sencillo a primera vista, involucra ciertos
matices y complicaciones que no es posible evitar. En primer lugar, como se vera ampliamente en esta tesis, no se trata de un metodo general aplicable a la totalidad de

14

1.5. Control basado en la energa

sistemas no lineales de parametros conocidos, ni siquiera a los invariantes en el tiempo, ni


aun restringiendonos a los sistemas controlables. A lo sumo proporciona un fundamento
matematico estructurado para abordar problemas que anteriormente solo admitan soluciones muy particulares. En segundo lugar, incluso en los casos para los que existen
soluciones explcitas, lo habitual es que el equilibrio estabilizado en bucle cerrado tenga
una cuenca de atracci
on limitada. Este fenomeno se observa a la derecha de la gura 1.3
donde si el sistema comienza a cierta distancia del origen, en la direccion del eje , jamas
podra llegar al origen en una trayectoria de energa decreciente.
Otro matiz interesante que se desprende de la tecnica del moldeo de energa para
sistemas en IR2 , es el hecho de que en la region donde la funcion de energa es convexa,
las curvas de nivel2 son cerradas. De nuevo en la gura 1.3, observamos las lneas de nivel
constante. Un hecho fundamental en el estudio
proyectadas sobre el plano inferior (, )

Figura 1.3: Energa del pendulo en bucle abierto (izquierda), y bucle cerrado (derecha).

de sistemas mecanicos en IR2 arma que los subconjuntos de nivel (areas encerradas bajo
las curvas de nivel) son invariantes del sistema (Landau & Lifchitz 1964). Este resultado
es solo de aplicacion en sistemas disipativos, y debe interpretarse del siguiente modo: si
una curva de nivel de la energa del sistema disipativo es cerrada, entonces las trayectorias
que comiencen dentro de esa curva de nivel, permaneceran dentro de ella indenidamente.
Visto en el espacio tridimensional (tomando la energa como el tercer eje), y dado un
la energa de ese punto establece un plano
punto origen del movimiento en el plano (, ),

horizontal paralelo al (, ) tal que las trayectorias en el espacio tridimensional siempre


estaran por debajo de dicho plano. En sistemas conservativos y disipativos sabemos que la
energa mecanica no puede superar el valor inicial, por lo que dados la posicion y velocidad
iniciales el sistema queda connado a la region por debajo del corte.
Si todo lo anteriormente es valido para sistemas disipativos, hay que tener en cuenta
que hemos llegado a la funcion de energa H + Ha de forma articial, y por tanto no es
natural esperar que la propia friccion del sistema lo haga disipativo con respecto a esta
funcion. Por tanto todo metodo de control basado en el moldeo de energa debe incluir
un termino que ayude al sistema a disipar energa adecuadamente.
2

Curvas de nivel: lugar geometrico de dimension n 1 en el espacio de estados donde la energa


permanece constante.

Captulo 1. Introducci
on

15

1.5.4 Comportamiento transitorio


Una vez establecida la relacion entre energa, disipacion, y trayectorias del sistema, describiremos la conexion existente entre la forma de la funcion de energa y el acotamiento
de coordenadas en el transitorio. Para explicarlo recurriremos a un curioso ejemplo: una
persona vigorosa golpea un martillo de feria para medir su energa. Para ello observa la
maxima altura a la que llega una pesa empujada por el martillazo sobre un trampoln
(gura 1.4). Inicialmente el martillo esta en la posicion P0 y posee una energa mgh0 = 0.

Esta
es la energa inicial en bucle abierto. Si el concursante emplea sus manos exclusivamente como punto de apoyo para la cada del martillo sin esfuerzo adicional, esta energa
se transmite al peso que se eleva hasta una altura que sera una medida de la energa
potencial inicial del martillo elevado. En este caso se puede armar que la altura de la
pesa en instantes futuros esta acotada superiormente por el valor de la energa potencial
inicial del martillo.
Al estudiar el sistema en bucle cerrado, el concursante se convierte en actuador y
realiza un esfuerzo para acelerar el martillo mas alla de la gravedad y por tanto inyecta
energa al sistema. Si deseamos encontrar una cota superior para la altura de la pesa
tras el golpe nos encontramos con la siguiente pregunta: cual es la maxima energa que
el forzudo puede transmitir al martillo y por consiguiente a la pesa? Ya no basta con
conocer la energa del sistema en bucle abierto, sino que es necesario tener un modelo de
energa del conjunto concursante-martillo y en funcion de el se podra obtener la altura
maxima que puede alcanzar la pesa.

Figura 1.4: Variaci


on del estado en funci
on de la energa a
nadida .

El control basado en la energa tal y como se desarrolla en esta tesis proporciona dicho
modelo de energa en bucle cerrado y una adicion de amortiguamiento tal que el equilibrio
deseado pasa a ser estable. Si ademas empleamos el hecho de que las curvas de nivel
de energa representan regiones de connamiento de las coordenadas, podemos deducir
que el energy shaping puede ser una va para modular el comportamiento transitorio.
En efecto, una curva cerrada en el espacio de las coordenadas representa un conjunto
acotado. Esto implica que existe un valor maximo para cada coordenada cuando las
trayectorias comienzan con una energa inicial determinada. Mas a
un, el valor de dicho
maximo depende precisamente de la energa inicial, con lo que estamos en una situacion
semejante a la gura 1.4 pero con interesantes consecuencias en el campo del control.
De hecho el interes del acotamiento de trayectorias en control es un problema fundamental para determinar regiones de operacion de los sistemas reales. En los primeros
cursos de Control Automatico se incide profundamente en el dise
no de controladores con

16

1.5. Control basado en la energa

determinadas especicaciones de sobreoscilacion para sistemas lineales. En esta tesis se


abre la puerta a un ajuste analogo para sistemas mecanicos no lineales subactuados.
Por otra parte, el ritmo de disipacion de energa en bucle cerrado es un parametro
crtico para ajustar comportamientos como el tiempo empleado en alcanzar el equilibrio.
El estudio del tiempo de establecimiento tiene tanta relevancia como la sobreoscilacion,
esta bien asentado en la teora de sistemas lineales y se mantiene como problema abierto.
De nuevo en esta tesis, con las tecnicas de control basado en la energa se daran las bases
para abordar este problema en situaciones de mayor generalidad.

1.5.5 Generalizacion de la energa en el control


El concepto de energa suministra una magnitud escalar cuya evolucion sintetiza, en alg
un
sentido, la del propio sistema dinamico. Es decir, desde un punto de vista fsico estricto, el sistema evoluciona de forma autonoma hacia el estado en que la energa se hace
mnima. El hecho de que una magnitud escalar resuma en su comportamiento la evolucion del estado (en general un vector) tiene consecuencias teoricas y practicas que resulta
difcil sobrevalorar. La evolucion del sistema hacia el estado de energa mnima sirvio de
inspiracion a Lyapunov para desarrollar su conocido metodo para el estudio de la estabilidad de los sistemas dinamicos no lineales. Por una parte, introdujo lo que luego se
ha conocido como funcion de Lyapunov, que no es sino una funcion V (x) que posee las
mismas propiedades matematicas que la energa3 , es decir:
V (0) = 0 y V (x) > 0, x = 0
V (x) < 0, x = 0.
Con el concurso de las funciones de Lyapunov V (x), el problema del control se puede
plantear, de forma abstracta, de manera extremadamente simple. Supongase que se
dispone de una planta, o sistema en bucle abierto, a la que se asocia una representacion
matematica, en general no lineal, de la forma
x = f (x, u).

(1.5.2)

Es sabido que el problema del control consiste en determinar una funcion u = k(x) tal
que el sistema resultante de llevar esta u a (1.5.2) de lugar a un sistema en bucle cerrado
de la forma
x = f (x, k(x)) = F (x),
(1.5.3)
sistema autonomo que posee el comportamiento requerido. Este comportamiento comprende la propiedad de estabilidad en el origen, lo que se traduce en que las trayectorias
de (1.5.3) tienden al mnimo de la funcion de Lyapunov V (x). Es decir,
V
V =
f (x, k(x)) < 0.
x

(1.5.4)

Pues bien la gran aportacion de Lyapunov fue permitir generalizar los conceptos de comportamiento de la energa, que se han comentado en las secciones anteriores, a situaciones
en las que exista esa funcion V (x) que posee las mismas propiedades matematicas que la
3

S
olo si nos restringimos a sistemas lagrangianos con equilibrios estables.

Captulo 1. Introducci
on

17

energa, aunque no tenga su mismo signicado fsico. De este modo se puede generalizar
considerablemente el control basado en la energa al control basado en la existencia de la
funcion de Lyapunov.
Una generalizacion adicional, que esta teniendo lugar en nuestros das, es la de asociar
una estructura (o realizacion, en una terminologa clasica de la teora del control) hamiltoniana al sistema considerado. La funcion de Hamilton de esta realizacion hamiltoniana
posee las propiedades de una funcion del Lyapunov, por lo que se alcanza una notable
sntesis para el tratamiento de los sistemas dinamicos que admiten esa formalizacion.
Es el caso, en principio, de los sistemas electromecanicos para los que la adopcion de
una estructura hamiltoniana es un hecho bien conocido y explotado desde hace tiempo.
Para estos sistemas las tecnicas de proyecto de controladores mediante moldeo de energa
poseen un caracter natural. Sin embargo, mediante las formulaciones hamiltonianas, y
el consecuente empleo de funciones de Lyapunov, se puede ampliar considerablemente el
campo de aplicacion de las tecnicas de moldeo de energa, desarrolladas inicialmente para
sistemas electromecanicos. En el captulo 6 de esta tesis se ilustra este hecho al proponer como objetivo que el sistema realimentado posea una funcion del Lyapunov cuartica,
sin ning
un signicado de energa, pero cuyo comportamiento presenta unas oscilaciones
periodicas que constituyen el objetivo del proyecto.

1.6 Estructura de la tesis


Esta tesis consta de siete captulos complementados con dos apendices. En este primer
captulo se ofrece una exposicion de motivos, as como una perspectiva general de los
conceptos involucrados en el desarrollo de los posteriores captulos.
En el segundo captulo se presentan formamente los fundamentos teoricos necesarios
para la correcta comprension del texto subsiguiente, y se realiza una revision del estado
actual de las tecnicas de control dentro de las que se enmarcan las aportaciones de la
tesis.
El tercer captulo esta dedicado al control de un sistema completamente actuado que
presenta interesantes peculiaridades y dicultades en el control: una plataforma giroestabilizada de dos grados de libertad situada sobre una supercie movil como puede ser un
vehculo o buque. Para este sistema se desarrolla un control de la lnea de mira basado
en la estructura hamiltoniana con rechazo de perturbaciones. Los resultados se aplican a
una planta real instalada en el laboratorio del departamento de Ingeniera de Sistema y
Automatica de la Universidad de Sevilla. La mayor parte del contenido de este captulo
ha sido publicado en (Gomez-Estern, Aracil & Rubio 2000) y (Gomez-Estern, Cordones
& Rubio 2002).
El cuarto captulo esta dedicado al control de sistemas mecanicos subactuados simples
basado en pasividad, empleando el metodo IDA-PBC, recientemente desarrollado. Se
presenta el metodo con rigor teorico y se aplica a la resolucion de problemas abiertos
ampliamente conocidos en la comunidad del control como la bola y la viga. Se aporta
un analisis de los transitorios del sistema en bucle cerrado, para el calculo de cotas en
las trayectorias del sistema. Lo expuesto en este captulo ha dado lugar a la publicacion en la revista IEEE Transactions on Automatic Control del artculo (Ortega, Spong,
Gomez-Estern & Blankenstein 2002) y al artculo de congreso (Gomez-Estern, Ortega &
Spong 2001).

18

1.6. Estructura de la tesis

El objetivo del quinto captulo es la reduccion de las ecuaciones IDA-PBC para una
clase de sistemas subactuados en los que el sistema de ecuaciones diferenciales parciales
propio del metodo, admite una solucion trivial gracias a la reduccion obtenida. Ademas
se presentan soluciones de razonable generalidad para los pasos de moldeo de energa
cinetica y potencial para el caso de sistemas de dos grados de libertad, y se estudia la
aplicacion de la reduccion a sistemas de orden mayor. Los resultados de este captulo han
sido publicados en (Gomez-Estern, Ortega, Rubio & Aracil 2001).
El sexto captulo aborda el problema de la estabilizacion de orbitas periodicas en
sistemas no lineales mediante realimentacion estatica del estado basadas en la energa
y la estructura hamiltoniana. En el se parte de un sistema hamiltoniano oscilante de
orden dos, que se propone como dinamica objetivo para el sistema a controlar, y se
desarrolla una teora para la extension del comportamiento oscilante en una amplia clase
de sistemas de orden superior, incluyendo los sistemas con estructura triangular no afn,
los linealizables por realimentacion y otros sistemas de forma aproximada. Dos resultados
fundamentales son la deteccion de una bifurcacion de Hopf que se mantiene al aumentar
el orden del sistema y la posibilidad de representar el sistema en bucle cerrado en forma
hamiltoniana generalizada. Los resultados presentados en este captulo han dado lugar
a la serie de publicaciones (Aracil, Gordillo & Gomez-Estern 2002), (Gordillo, GomezEstern, Ortega & Aracil 2002), (Gomez-Estern, Aracil & Gordillo 2002), (Gordillo, Aracil
& Gomez-Estern 2002) y (Aracil, Gomez-Estern & Gordillo 2002).
El septimo captulo contiene una exposicion de conclusiones referentes a los captulos
comprendidos entre el tres y el seis, y se expone una discusion detallada de las posibles
lneas futuras de investigacion posteriores a esta tesis, clasicadas en funcion de las tres
partes fundamentales de la tesis.
El apendice A describe la labor desarrollada en el contexto del proyecto DORNA por
el doctorando y el equipo de desarrollo formado a tal efecto, para el control de plataformas
giroestabilizadas. La aplicacion, de tiempo real, contiene elementos de interes desde el
punto de vista del modelado, el control, la programacion de procesadores de se
nales en
tiempo real, la sincronizacion de procesos y el dise
no de protocolos de comunicaciones.
Los resultados de este apendice dieron lugar a la publicacion (Gomez-Estern, Perez, Rubio
& Gordillo 2000).
En el apendice B se detallan los procedimientos Maple desarollados para el calculo
automatizado de la ley de control para sistemas oscilantes de orden arbitrario, presentada
en la seccion 6.8. El principal interes de estos procedimientos reside en la dicultad del
manejo de sistemas de ecuaciones diferenciales cuando se desea trabajar con sistemas de
orden variable. Este apendice tambien se ha incluido en publicacion (Aracil, GomezEstern & Gordillo 2002).

Captulo 2
Fundamentos te
oricos y estado de la
t
ecnica
2.1 Sistemas electromecanicos
Esta tesis tiene por objeto estudiar y desarrollar metodos de estabilizacion, seguimiento
de trayectorias y robusticacion en una clase de sistemas, cuya propiedad fundamental es
que poseen integrales de movimiento. Esto quiere decir que la evolucion de sus trayectorias
puede ser descrita en terminos de las derivadas temporales y con respecto a las coordenadas
generalizadas de una funcion escalar relacionada con la energa. Esta propiedad es com
un
en sistemas mecanicos y sistemas electricos, y por tanto es una herramienta esencial en
el analisis y control de sistemas roboticos y electromecanicos en general. La comunidad
del control ha dividido sus lneas de trabajo en dos paradigmas con un alto grado de
paralelismo: los sistemas lagrangianos o de EulerLagrange (EL) y los hamiltonianos.
Pese existir una equivalencia entre ambos enfoques y poder expresar la modelo EL en
forma hamiltoniana, las formulaciones han sido generalizadas hasta el punto en que no es
evidente su equivalencia, y por tanto tampoco son intercambiables las tecnicas de control
desarrolladas en uno u otro enfoque.

2.2 Sistemas de EulerLagrange


Una interesante y compacta denicion de sistemas de EulerLagrange (indistintamente
EL) se enuncia en (Landau & Lifchitz 1964), mediante el principio de mnima acci
on (o
de Hamilton) . En virtud de este principio, todo sistema mecanico esta caracterizado por
una funcion de las coordenadas generalizadas qi , i = 1, 2 . . . n, sus derivadas, y el tiempo t
L(q1 , q2 , . . . , qn , q1 , q2 , . . . , qn , t)
o mas brevemente L(q, q,
t) tal que las trayectorias del sistema q(t) satisfacen la condicion
siguiente (Landau & Lifchitz 1964).
Supongamos que en los instantes t = t1 y t = t2 , el sistema ocupa posiciones determinadas, caracterizadas por los conjuntos de coordenadas q 1 y q 2 . Entre estas posiciones, el
19

20

2.2. Sistemas de EulerLagrange

sistema se mueve de forma que la integral


 t2
S=
L(q, q,
t)dt
t1

tome el menor valor posible. La funcion L se conoce como funcion de Lagrange y la


integral S como integral de acci
on.
Sea, precisamente, q = q(t) la funcion (trayectoria) para la cual S se hace mnima,
es decir, que S aumenta si el sistema sigue cualquier trayectoria alternativa a q(t) de la
forma q(t) + q(t), donde q(t) es una funcion peque
na en el intervalo de tiempo de t1 a
t2 . La variacion innitesimal en S debe anularse en el mnimo, por lo que
 t2
 t2
 t2
S =
L(q + q, q + q,
t)dt
L(q, q,
t)dt =
L(q, q,
t)dt = 0
t1

t1

t1

desarrollando la variacion de la integral se tiene



 t2 
L
L
q +
q dt = 0
q
q
t1
y no es difcil probar (Ra
nada 1990) que la condicion necesaria y suciente para que
S = 0 es


d L
L

=0
dt qi
qi
Tras a
nos de especulaciones (Maupertuis) en cuanto a la denicion de la funcion L, Euler
y Lagrange la denieron correctamente en el caso general, tomando la forma
L = T (q, q,
t) V (q, t)

i = 1, 2 . . . n

donde T (q, q,
t) y V (q, t) representan, respectivamente, las energa cinetica y potencial.
Generalizando al caso de sistemas sometidos a fuerzas externas, las trayectorias q(t) seran
soluciones al sistema de ecuaciones diferenciales de segundo orden


d L
L

= fi
i = 1...n
dt qi
qi
donde fi representa el conjunto de fuerzas y momentos externos que no derivan de un
potencial, entre los que habitualmente incluiremos
Los efectos de friccion que tienen como consecuencia una disipacion de energa.
Fuerzas y pares de control.
Estas ecuaciones, en el caso de solidos rgidos (p. ej. sistemas roboticos), en ausencia de
friccion pueden ser escritas del siguiente modo
M (q)
q + C(q, q)
q + g(q) =

(2.2.1)

Donde M (q) es la matriz de inercia del sistema, g(q) = Vq(q) y el termino C(q, q)
q corresponde a los efectos centrfugos y de coriolis, cumpliendose que M 2C es una matriz
antisimetrica.
El modelo de EulerLagrange ha dado lugar a una serie de metodos de sntesis de controladores que ademas de perseguir la estabilidad asintotica de equilibrios y trayectorias,
preservan la estructura de EulerLagrange en bucle cerrado. Con ello se logra

Captulo 2. Fundamentos te
oricos y estado de la tecnica

21

Una funcion de Lyapunov natural como es la funcion de energa.


Estructuras pasivas que permiten obtener resultados de robustez.
Generalizar teoras de sntesis para el control de sistemas subactuados.
Separacion entre energas cinetica y potencial en bucle cerrado, lo que permite hacer
analisis en espacios de dimension reducida.

2.3 Sistemas hamiltonianos


La dinamica de los sistemas de Euler Lagrange admite una descripcion alternativa conocida como ecuaciones canonicas de Hamilton. Su primera ventaja aparente es la estructura:
un conjunto de ecuaciones diferenciales de primer orden, que se ajusta a la descripcion
clasica en variables de estado x = f (x) empleada en control no lineal. A medida que analicemos la estructura y propiedades de esta descripcion apareceran interesantes ventajas
para el control, que hacen de ella una herramienta merecedora de su gran popularidad.
Para obtener estas ecuaciones se dene la funcion de Hamilton a partir de la transformada
de Legendre de la funcion de Lagrange


pi qi L
H=
donde la variables {p1 , p2 , . . . , pn } se denominan momentos conjugados y se denen como
pk =

L
qk

Tomando derivadas parciales (Ra


nada 1990)
H
qk
H
pk

L
qi  L qi

= pk
qk
qi qk qk
i
i
 qi  L qi
= qk +
pi

= qk
pk
qi pk
i
i
=

pi

se llega a la siguiente descripcion en variables de estado




  
H
0nn In
q
q
=
= H
H
p
In 0nn
p

(2.3.1)

Donde In es la matriz identidad de orden n. La matriz se denomina matriz simplectica.


Si sobre el sistema act
uan una serie de fuerzas externas y de control dadas por el vector
f = [f1 , f2 , . . . , fn ]T , la dinamica se transforma en

 

q
0nn
f
= H +
In
p
Mucho mas que un sencillo cambio de variables, la formulacion hamiltoniana de la mecanica
tiene gran elegancia y ofrece una vision profunda sobre la evolucion de los sistemas. Al

22

2.3. Sistemas hamiltonianos

representar la matriz simplectica una rotacion de angulo /2, el campo vectorial en el


espacio de las fases (q,
p)
aparece girando el gradiente del hamiltoniano 90o en sentido
horario, por lo que se dice que H es el generador de las trayectorias, ya que sus derivadas
denen y determinan el vector de las derivadas del estado, que a su vez determina la
direccion del movimiento en el espacio de las fases (vease la gura 2.3). En efecto, el
hecho de que en las trayectorias del sistema se cumple que
 H
 H
H
H
=
,
qk +
pk +
H =
q
p
t
t
k
k
k
k
implica que si H no depende explcitamente del tiempo (el caso habitual que estudiaremos
en esta tesis), las trayectorias son curvas de H(t) H(0).
grad(H)

(q,p)

(q,p)

grad(H)

Figura 2.1: Campo vectorial de un sistema hamiltoniano.

2.3.1 Sistemas hamiltonianos generalizados.


En (Van der Schaft 2000) aparece una generalizacion de los sistemas hamiltonianos mediante la denicion de la estructura PCH (PortControlled Hamiltonian System), o sistemas
hamiltonianos controlados por puertos. Generalmente trataremos con sistemas PCH con
disipacion (o PCHD) al incluir un termino disipativo en la dinamica. Los sistemas PCH
con disipacion admiten la siguiente descripcion en variables de estado
x = (J(x) R(x))

H
+ Gu
x

(2.3.2)

donde x IRn es el vector de estado, J(x) = J(x)T es la matriz de interconexi


on,
R(x) 0 es la matriz de disipaci
on, H es el hamiltoniano o funcion de Hamilton y G y
u representan, respectivamente, la matriz y el vector de control. Ademas,

T
H H
H
H =
,
,...,
x1 x2
xn
Es facil de comprobar, por la propiedad antisimetrica de J(x), que en ausencia de accion
de control la derivada del hamiltoniano viene dado por
H = (H)T R(x)(H) 0

Captulo 2. Fundamentos te
oricos y estado de la tecnica

23

De hecho, si R(x) = 0 desaparece el efecto disipativo y el hamiltoniano se conserva


(sistema PCH). Gracias a este hecho fundamental, la funcion H puede ser empleada como
funcion de Lyapunov de control para sistemas con estructura PCHD en bucle cerrado.

Cambio de variable en sistemas hamiltonianos


Un resultado u
til para los propositos de esta tesis surge de la invariancia de las propiedades
de la estructura hamiltoniana generalizada frente a un cambio de coordenadas en el sistema. Sea el sistema PCHD denido en variables IRn cuya dinamica esta descrita por
las ecuaciones
= (J () R ()) H
donde

H H
H
,
,...,
H =
1 2
n

Supongamos que deseamos obtener las ecuaciones de estado en un nuevo conjunto de


variables x IRn denido por el mapa diferenciable y difeomorco : x. Para ello
se ha de calcular el jacobiano de la transformacion inversa x representado por x
.

Entonces se tiene

x
x
x
x
x H x .
=
(J R ) H =
(J R )
x =

Si denimos las matrices


T
x
x
Jx =
J


T
x
x
Rx =
R

es sencillo demostrar que Jx es una matriz antisim


 etrica. En efecto, para cualquier vecz IRn tal que por la propiedad
tor z IRn podemos denir otro vector y = x

antisimetrica de Jd se tiene


T
x
T
T x
z Jx z = z
z = y T J y = 0
z
J

de lo que se deduce que Jx tambien es antisimetrica. El hecho de que Rx 0 se demuestra


de una manera analoga. Tomense los mismos vectores z e y del parrafo anteriores y se
tiene


T
x
T
T x
z Rx z = z
z = y T R y (>)0
z
R

Para lo cual es condicion suciente y necesaria que Rx (>)0. Consecuentemente, el


sistema expresado en variables x toma la forma
x = (Jx (x) Rx (x))x Hx
que es, precisamente, un sistema PCHD con matrices de interconexion Jx y disipacion
Rx . Este resultado permite, en determinadas situaciones, recurrir a unas variables en las
que sea sencillo encontrar una estructura hamiltoniana, para poder deshacer el cambio
preservando dicha estructura. Un caso particular es el de un sistema linealizado por
realimentacion, como se analizara en el captulo 6.

24

2.3. Sistemas hamiltonianos

2.3.2 Hamiltoniano y energa


La siguiente discusion esta motivada por la confusion que a menudo induce el emplear los
terminos energa y funcion de Hamilton indistintamente. Como se vera a continuacion, y
seg
un se indica (Ra
nada 1990), en los sistemas mecanicos que no se asientan sobre sistemas
de referencia inerciales, no existe la consabida equivalencia entre energa y hamiltoniano.
En el caso de sistemas autonomos no inerciales, la cantidad conservada es el hamiltoniano,
ya que el movimiento del sistema de referencia en el que esta inmerso el sistema suele suele
provocado por un intercambio de energa con el exterior.
Para ilustrar esto observese el sistema de la gura (2.2). El sistema consiste en una
masa puntual m restringida a moverse sobre una circunferencia de radio a que gira en torno
a un eje vertical que pasa por su centro. Supongamos que este sistema esta accionado por
un motor que lo mantiene girando en torno a un eje vertical que pasa por el centro del
aro con velocidad constante .

q1

Figura 2.2: Sistema hamiltoniano en sistema de referencia no inercial.

El lagrangiano de este sistema toma la forma


1
L = a2 m(q12 + 2 sen2 q1 ) mga cos q1
2
donde g es la constante de gravedad. El hamiltoniano, que es la u
nica cantidad conservada,
es
1
H = a2 m(q12 2 sen2 q1 ) + mga cos q1
2
mientras que la energa mecanica toma la forma
1
E = T + V = a2 m(q12 + 2 sen2 q1 ) + mga cos q1
2
Derivando la energa con respecto al tiempo se tiene
E = a2 m 2 q1 sen2q1
lo que implica que siempre que haya variacion del angulo q1 , habra un intercambio de
energa con el exterior. A que se debe esta discrepancia entre hamiltoniano y energa?.

Captulo 2. Fundamentos te
oricos y estado de la tecnica

25

Por que se conserva solo el primero? La razon subyace en que el sistema no esta aislado
pues precisa del aporte de energa de un motor externo para mantener la rotacion a velocidad constante (normalmente oscilara). En consecuencia existe un ujo de energa entre
el sistema y el exterior. La condicion para la conservacion del hamiltoniano es diferente.
Para comprender lo que sucede con el hamiltoniano hay que puntualizar que cuando el
sistema se encuentre en un sistema de referencia no inercial, la energa cinetica puede
constar, ademas de los terminos cuadraticos, de otros terminos lineales. La expresion
general de la energa cinetica de un sistema de partculas toma, pues, la expresion general

1
B(q, t)r qr + C(q, t) = T2 + T1 + T0
T =
Ars (q, t)qr qs +
2
r,s
r
Por otro lado, si denimos rj como la expresion en cartesianas respecto a un sistema de
referencia inercial de la partcula j del sistema, esta se podra calcular siempre en funcion
de las coordenadas articulares q por la relacion
rj = rj (q1 , q2 , . . . , qn , t).
Si en esta relacion no aparece explcitamente el tiempo, entonces la energa cinetica se
reduce al termino T = T2 en cuyo caso diremos que se trata de un sistema natural. Si
ademas L (y por tanto H) no dependen explcitamente del tiempo, se trata de un sistema
aut
onomo, por lo cual H es una constante de movimiento.
El ejemplo mencionado se trata de un sistema no natural y autonomo y por tanto
se conserva el hamiltoniano, pero no la energa. Estas circunstancias son de especial
relevancia en el contexto de esta tesis pues se estudiara el control de un sistema instalado
en la cubierta de un buque, y por tanto sumergido en un sistema de referencia no inercial.

2.4 Estabilidad en sistemas autonomos


Los resultados presentados en esta seccion son ampliamente conocidos y empleados en la
literatura del control no lineal (Khalil 1996). Se incluiran con el proposito de crear un
texto autocontenido, ya que son esenciales para los desarrollos de esta tesis.
Considerese el conjunto de ecuaciones diferenciales
x = f (x)

(2.4.1)

donde x IRn . Mas generalmente, x denota un conjunto de coordenadas locales en un


espacio mdimensional . Supondremos que f es localmente continua en el sentido de
Lipschitz, implicando la existencia y unicidad de soluciones.
Denici
on 2.4.1 (Estabilidad en sistemas no lineales). Sea x un equilibrio de
(2.4.1), es decir, f (x ) = 0, y por tanto x(t; x ) = x , t. El equilibrio x es
(a) estable, si para cada  > 0 existe = () > 0 tal que
x(t0 ) x  < x(t) x  < ,

t t0

(b) asintoticamente estable, si es estable y existe c > 0 tal que


x(t0 ) x  < c lim x(t; x(t0 )) = x
t

(2.4.2)

26

2.5. Bifurcaciones en sistemas no lineales

(c) globalmente asint


oticamente estable, si es estable y limt x(t, x0 ) = x para todo
x0 .
Una herramienta fundamental para el analisis de estabilidad de los sistemas dinamicos es
el metodo directo de Lyapunov:
Teorema 2.4.1 (Lyapunov). Sea x un equilibrio de (2.4.1). Sea V : IR+ una
funci
on C 1 que cumple
V (x ) = 0,

V (x) > 0,

x = x

(es decir, denida positiva en x ), tal que


V (x) = (x V (x))T f (x) 0, x
as
Entonces x es un equilibrio estable. Si adem
V (x) < 0,

x , x = x

entonces x es un equilibrio asint


oticamente estable, y lo es globalmente si V es propia.
Una herramienta muy potente para probar estabilidad asintotica en sistemas no lineales
es el principio de invariancia de LaSalle.
Teorema 2.4.2 (Principio de invariancia de LaSalle). V : IR+ una funci
on C 1
T
para la cual V (x) = (x V (x)) f (x) 0 para todo x . Sea x(t, x0 ), t 0 una solucion
de x = f (x). suponga que existe un conjunto compacto B tal que x(t : x0 ) B, t 0.
Entonces x(t : x0 ) converge al mayor subconjunto de {x |V (x) = 0} B que es
invariante para el sistema x = f (x).

2.5 Bifurcaciones en sistemas no lineales


En el estudio de sistemas dinamicos no lineales es frecuente observar que la estructura del
espacio de fases se ve drasticamente afectada por la variacion de uno o varios parametros
del sistema. En el caso de que el n
umero o la naturaleza de los conjuntos lmite del sistema
se vean modicados por la variacion de dicho parametro, decimos que se ha producido un
bifurcaci
on. Un caso tpico es el de un sistema del tipo
x = f (x, )
en el que existe un ciclo lmite estable para < 0 que colapsa en un punto de equilibrio
estable cuando cambia de signo (vease la gura 2.3). Este tipo de bifurcaciones es
conocido como bifurcaci
on de Hopf. La bifurcacion de Hopf, de interes en esta tesis, y
sus aplicaciones ha sido estudiada en (Marsden & McCracken 1976). El siguiente teorema
describe las condiciones para la existencia de dicha bifurcacion, y tiene especial interes en
sistemas de alto orden donde la complejidad imposibilita hacer un analisis detallado del
retrato de estados. Supongamos que el sistema dinamico x = f (x, ) con f C 3 , x IRn
y IR tiene un punto de equilibrio en x , para alg
un = c ; esto es, f (x , c ) = 0.

Captulo 2. Fundamentos te
oricos y estado de la tecnica

27

Estado

Parmetro de bifurcacin

Tayectoria entrante
Trayectoria saliente
Equilibrio estable

Figura 2.3: Representacion esquematica de las trayectorias en la bifurcaci


on de Hopf.

Sea A() = Dx f (x (), ) la matriz jacobiana del sistema en el punto de equilibrio. El


polinomio caracterstico para A es
(A) = sn + an1 sn1 + + a1 s + a0
donde los ai dependen de .
nico par de autovalores imaginarios (c ) = jc , y
Supongamos que A(c ) tiene un u
ning
un otro autovalor con parte real nula; y adicionalmente,

dRe(())
= 0

d
=c
Esto u
ltimo se conoce como la condicion de transversalidad. Bajo estas condiciones, el
teorema de la bifurcacion de Hopf (Marsden & McCracken 1976) sugiere la aparicion de
un ciclo lmite en (x , c )1 .
Las condiciones para la existencia de un par de autovalores puramente imaginarios de
la matriz A() pueden ser formulados para cualquier dimension del siguiente modo (Liu
1994):
Hn1 () = 0
Hn2 () > 0, Hn3 > 0, . . . , H1 () > 0, a0 () > 0

(2.5.1)
(2.5.2)

Donde Hi () representa el i-esimo menor descendente de la matriz de Hurwitz de (A).

2.6 Pasividad y disipatividad


Los conceptos que se describiran a continuacion pueden estudiarse con mayor detalle
en: (Vidyasagar 1993) para estabilidad L2 , (Van der Schaft 2000) para pasividad e interconexion de sistemas pasivos y (Ortega, Loria, Niklasson & Sira-Ramrez 1998) para
control basado en pasividad de sistemas EL.
1

En rigor, esta condici


on solo indica la existencia de oscilaciones bien a uno de los lados de la bifurcaci
on
o precisamente en el punto = c . Para determinar exactamente el lugar y si realmente se trata de un
ciclo lmite atractivo, son necesarias consideraciones adicionales basadas en la informacion no lineal del
sistema. Una posibilidad es el recurso a la tecnica de la funci
on descriptiva.

28

2.6. Pasividad y disipatividad

2.6.1 Estabilidad Lq
Denici
on 2.6.1 (Espacios Lq ). Para cada q {1, 2, . . . } se dene Lq [0, ) = Lq como
el conjunto de funciones2 f : IR+ IR que satisfagan

|f (t)|q dt <
0

A su vez, L consiste en el conjunto de funciones f : IR+ IR acotadas, es decir


sup |f (t)| <

tIR+

En estos espacios es posible denir las siguientes normas


Denici
on 2.6.2 (Norma Lq ). Para toda funcion f : IR+ IR contenida en Lq se
denen la normas

 1q
q
|f (t)| dt
q = 1, 2, . . .
f q =
f  =

sup |f (t)| <

tIR+

Asimismo, en L2 se dene el producto interior de dos funciones f ,g contenidas en L2



< f, g >=
f (t)g(t)dt
0
1

de donde se deduce que f 2 =< f, f > 2 . Para las funciones no acotadas sin tiempo de
escape nito se dene el espacio extendido Lqe
Denici
on 2.6.3 (Espacios Lqe ). Sea f : IR+ IR. Entonces, para cualquier T IR+ ,
la funcion fT : IR+ IR se dene como

f (t)
,
0t<T
fT (t) =
0
,
tT
llamada la truncacion de f en el intervalo [0, T ]. Para cada q = 1, 2, . . . , el espacio Lqe
consiste de todas las funciones f : IR+ IR tal que fT Lq para todo T con 0 T .
Lqe se denomina el espacio extendido de Lq .
Lo expuesto anteriormente se puede extender trivialmente a funciones f : IR+ IRn
suponiendo la existencia de una norma denida en IRn . Los conceptos presentados son
elementales para las siguientes deniciones de estabilidad Lq entradasalida. Para representar la dinamica de un sistema haremos uso del concepto mas general mapa de entrada
salida. Sea U un espacio lineal m-dimensional con norma  U , e Y otro espacio lineal
p-dimensional con norma  Y , junto a una aplicacion entradasalida
G : Lqe (U ) Lqe (Y )
u y = G(u)
2
En adelante se supondr
a que estamos hablando en todo caso de funciones medibles. Un funci
on es
medible si es el lmite punto por punto de una secuencia de funciones constantes a trozos, excepto un
conjunto de medida cero.

Captulo 2. Fundamentos te
oricos y estado de la tecnica

29

Denici
on 2.6.4 (Estabilidad Lqe ). Sea un sistema representado por el mapeo G :
Lqe (U ) Lqe (Y ). Entonces se dice que G es Lq estable si
u Lqe (U ) G(u) Lq (Y )
es decir, G aplica el subconjunto Lq (U ) Lqe (U ) en el subconjunto Lq (Y ) Lqe (Y ).
Evidentemente, la estabilidad L , equivale a estabilidad BIBO (Bounded Input Bounded
Output).

2.6.2 Pasividad y ganancia L2


Sea un sistema descrito en variables de estado de la forma

x = f (x, u),
uU
:
y = h(x, u)
yY
donde x = x1 , x2 , . . . , xn son las coordenadas locales en una variedad , U e Y son
espacios lineales, de dimensiones m y p, respectivamente. En el espacio de estados U Y
de variables externas se dene la funcion
s : U Y IR
denominada tasa de suministro.
Denici
on 2.6.5 (Disipatividad). Un sistema en variables de estado se dice que
es disipativo con respecto a la tasa de suministro s si existe una funcion S : IR+ ,
denominada funcion de almacenamiento tal que para todo x y todas las funciones de
entrada u
 t1
S(x(t1 )) S(x(t0 )) +
s(u(t), y(t))dt
(2.6.1)
t0

La desigualdad (2.6.1) es conocida como la desigualdad de disipacion. Una eleccion habitual de la tasa de suministro es
s(u, y) =< y|u > .
Denici
on 2.6.6 (Pasividad). Un sistema en variables de estado con u = y =
m
IR es pasivo si es disipativo con respecto a la tasa de suministro s(u, y) = uT y. es
estrictamente pasivo a la entrada si existe > 0 tal que es disipativo con respecto a
s(u, y) = uT y u2 . es estrictamente pasivo a la salida si existe  > 0 tal que
es disipativo con respecto a s(u, y) = uT y y2 . Finalmente, es conservativo si se
cumple (2.6.1) con signo de igualdad con respecto a la funcion s(u, y) = uT y para todo
x0 ,t1 t0 y u().
Denici
on 2.6.7 (Ganancia L2 ). Un sistema en variables de estado con U = IRm ,
p
Y = IR , tiene ganancia L2 si es disipativo con respecto a la tasa de suministro
s(u, y) = 12 2 u2 y2 . La ganancia L2 de se dene como () = inf{| tiene ganancia L2 }.
Se dice que tiene ganancia L2 < si existe < tal que tenga ganancia L2 <
Un resultado fundamental es el que relaciona la pasividad con la ganancia L2 :
Proposici
on 2.6.1. Si el sistema es pasivo estrictamente a la salida, entonces tiene
ganancia L2 nita.

30

2.6. Pasividad y disipatividad

2.6.3 Interconexion de sistemas pasivos


Considerese la interconexion por realimentacion de los sistemas 1 y 2 como se presenta
en la gura 2.4. Un resultado instrumental resulta del hecho de que la interconexion de
sistemas pasivos es tambien pasiva. Mas a
un, la condicion de una realimentacion pasiva
estrictamente a la salida conduce a la propiedad de ganancia L2 nita en bucle cerrado.
e1

u1

+
-

S1

y1

y2

e2

S2
u2

Figura 2.4: Interconexi


on por realimentaci
on de sistemas pasivos.

Proposici
on 2.6.2. (i) Supongamos que 1 y 2 son pasivos o estrictamente pasivos a
la salida. Entonces el sistema en bucle cerrado f2 ,2 de la la gura (2.4) con entradas
(e1 , e2 ) y salidas (y1 , y2 ) es pasivo, y estrictamente pasivos a la salida si ambos 1 y 2
son estrictamente pasivos a la salida.
(ii)Supongase que S1 , S2 , que satisfacen las desigualdades de disipacion
 t1
S1 (x1 (t1 ))) S1 (x1 (t0 ))) +
(u1 (t)y1 (t) 1 y1 2 )dt
t
 0t1
S2 (x2 (t1 ))) S2 (x2 (t0 ))) +
(u2 (t)y2 (t) 2 y2 2 )dt
t0
1

con 1 > 0, 2 > 0 son C y tienen mnimos locales estrictos en x1 y x2 respectivamente.


Entonces (x1 , x2 ) es un equilibrio estable de f2 ,2 con e1 = e2 = 0.
(iii) Supongase que 1 y 2 son estrictamente pasivos a la salida y detectables en el estado
cero, y que las S1 , S2 que satisfacen (2.6.2) son C 1 y tienen mnimos locales estrictos en
x1 = 0 y x2 = 0 respectivamente. Entonces, (0, 0) es un equilibrio asint
oticamente estable
f
de 2 ,2 con e1 = e2 = 0. Si adicionalmente S1 y S2 tienen mnimos globales en x1 = 0
y x2 = 0 respectivamente, y son propias, entonces (0, 0) es un equilibrio globalmente
asintoticamente estable.

2.6.4 Atenuacion L2 de perturbaciones


En esta tesis se empleara el concepto de ganancia L2 para analizar el rechazo de perturbaciones en sistemas hamiltonianos. Este concepto se basa en las tecnicas de pasividad
estudiadas por A. Van der Shaft (Van der Schaft 2000), y ha sido desarrollado posteriormente por (Shen, Mei, Lu & Tamura 1999). Sea el sistema de control no lineal descrito
como
(2.6.2)
x = f (x) + g1 (x)u + g2 (x)w

Captulo 2. Fundamentos te
oricos y estado de la tecnica

31

donde x IRn es vector de estado, u IRm el vector de control y w IRp una perturbacion
desconocida de norma acotada. Se dene el problema de rechazo de perturbaciones L2
del siguiente modo: Dada una se
nal de penalizacion z = q(x), un nivel de atenuacion
de las perturbaciones > 0, y un equilibrio deseado x IRn , se trata de hallar una
realimentacion del estado u = (x) y una funcion de almacenamiento V (x) denida
positiva en un entorno de x tal que la desigualdad de disipacion
1
V + Q(x) { 2 w2 z2 }, w
2

(2.6.3)

se cumpla a lo largo de todas las trayectorias del sistema en lazo cerrado (2.6.2) con la ley
de control u = (x), donde Q(x) 0 es una funcion no negativa dada. Como puntualizan
Besancon et al. (Besancon & Battiloti 1998), el cumplimiento de (2.6.3) puede asegurar
los siguientes comportamientos:
nal de penalizacion z es menor que el
La ganancia L2 de la perturbacion w a la se
nivel dado (Van der Schaft 2000).
El sistema en bucle cerrado es estable en el sentido de Lyapunov cuando w se
desvanece (tomese V (x) como funcion de Lyapunov, y es facil de ver, atendiendo a
(2.6.3) que V 0). Mas a
un el sistema en bucle cerrado es asintoticamente estable
si Q(x) > 0.
Existe una funcion (c) de clase K tal que para cualquier c > 0 y cualquier
condicion inicial V (x(0)) c, se cumple que
V (x(t)) c, t, w(t) (c).
Ahora considerese el siguiente sistema hamiltoniano con disipacion:

x = (J(x) R(x))H + g1 (x)u + g2 (x)w
z = h(x)g1T (x)H

(2.6.4)

donde x IRn , u IRm , J(x) = J(x)T , R(x) 0, H(x) es denida positiva en la


proximidades del equilibrio estable del sistema no perturbado, h(x) es una matriz de
H H
H T
,
, .., x
) .
ponderacion y H = ( x
n
1 x2
Si jamos un nivel de atenuacion de perturbaciones > 0, y tomamos z = h(x)g1T (x)H
como la se
nal de penalizacion se tiene el siguiente teorema
Teorema 2.6.3. (Wang, Cheng, Li & Ge 2002) Dado el sistema (2.6.4) y un nivel
de atenuaci
on de perturbaciones > 0, si
R(x)

1
[g2 (x)g2T (x) g1 (x)g1T (x)] 0,
2 2

on dada por la
entonces el problema de atenuaci
on de perturbaciones L2 admite la soluci
ley de realimentacion


1
1 T
(2.6.5)
u = h (x)h(x) + 2 Im g1T (x)H
2
2

32

2.7. Sistemas subactuados

donde Im es la matriz identidad de orden m. Adem


as, la desigualdad de disipacion

1
1
T
T
T
H + (H) R(x) 2 (g2 (x)g2 (x) g1 (x)g1 (x)) H { 2 w2 z2 }, (2.6.6)
2
2
se cumple a lo largo de las trayectorias del sistema en bucle cerrado consistente en (2.6.4)
y (2.6.5)
Dado que en el momento de redaccion de esta tesis este teorema no ha sido a
un publicado,
se expondran los detalles de la breve demostracion.
Demostraci
on. A partir de (2.6.4) y (2.6.5), es facil observar que
dH
dt

= (H)T R(x)H + (H)T g1 u + (H)T g2 w


1
1
1
= (H)T R(x)H w g2T H2 + ( 2 w2 z2 )
2

2
1
1
1
1
+
(H)T g1 hT hg1T H (H)T g1 ( hT h + 2 Im ) + 2 (H)T g2 g2T H
2
2
2
2

1
1
= (H)T R(x) 2 g2 (x)g2T (x) + 2 g1 (x)g1T (x)) H
2
2
1
1
1 2
( w2 z2 ) w g2T H2 .
+
2
2

Entonces
dH
dt

1
T
T
+ (H) R(x) 2 (g2 (x)g2 (x) g1 (x)g1 (x)) H
2
1 2
1
1
1
=
( w2 z2 ) w g2T H2 ( 2 w2 z2 )
2
2

2
T

que tiene la forma (2.6.6), dado que R(x) 212 [g2 (x)g2T (x) g1 (x)g1T (x)] 0, y por tanto

T
1
T
T
Q(x) = (H) R(x) 2 (g2 (x)g2 (x) g1 (x)g1 (x)) H 0
2


Por tanto la ley de control (2.6.5) es una solucion al problema de atenuacion de pertur2
baciones L2 con funcion de Hamilton H(x).

2.7 Sistemas subactuados


Tal y como se comento en la seccion 1.4, el dise
no de leyes de control para sistemas subactuados es un area objeto de una intensa labor investigadora. En esta tesis se presentan
contribuciones para la resolucion de este tipo de problemas, y se estudia una clase de sistemas subactuados para los cuales el dise
no de controladores se simplica notablemente.
En esta seccion se hara una revision de los conceptos fundamentales subyacentes a la
teora del control de sistemas subactuados, donde se enmarcan las tecnicas basadas en

Captulo 2. Fundamentos te
oricos y estado de la tecnica

33

la energa y la estructura hamiltoniana, y se aportara un breve repaso de las tecnicas


existentes destinadas a resolver problemas de esta naturaleza.
Formalmente se dice que son subactuados los sistemas de n grados de libertad y r < n
actuadores cuyas ecuaciones de Lagrange toman la forma


d L
L

= ui ,
i = 1...r
dt qi
qi


d L
L

= 0,
i = r + 1...n
dt qi
qi
En la descripcion hamiltoniana generalizada presentada en (2.3.2), un sistema subactuado
es aquel en el que el rango de la matriz de control G es inferior al n
umero de grados de
libertad.
Al no poder actuar sobre el espacio articular completo, aparecen limitaciones en cuanto
al conjunto de comportamientos que se pueden alcanzar en bucle cerrado. La primera
cuestion en este sentido es determinar si un sistema es controlable en una region del
espacio de estados.

2.7.1 Controlabilidad en sistemas subactuados


Se ha comentado que el problema de dise
no de controladores para sistemas subactuados
puede abordarse de una manera general analizando la controlabilidad de los mismos. En
este apartado se resumen los resultados clasicos fundamentales relativos a la controlabilidad de sistemas lineales y no lineales, a n de vislumbrar sus ventajas e inconvenientes
y justicar, en este contexto, el empleo de estructuras hamiltonianas de control en bucle
cerrado.
En el caso de sistemas lineales, con estructura x = Ax + Bu, siendo x IRn el vector
estado y u IRp el de control, para determinar si un sistema es controlable en el origen
se calcula la matriz de controlabilidad,
C = [B, AB, A2 B, ..., An1 B]
Un resultado sobradamente conocido arma que el sistema es controlable si y solo si el
rango de C es igual a n, el orden del sistema. En el caso de sistemas no lineales el
problema se mantiene abierto y el resultado mas conocido es la condicion suciente de
controlabilidad en el origen de Sussman (Rampazzo & Sussmann 2001), para determinar
si un sistema no lineal de la forma
x =

m

i=1

ui fi (x) +

r


vj gj (x),

i = 1 . . . m, j = 1 . . . r

j=1

con restricciones en el control, es controlable desde un conjunto de condiciones iniciales


en tiempo peque
no hacia el origen. Las condiciones enunciadas en (Rampazzo &
Sussmann 2001) no son constructivas en el sentido de que aun cumpliendose, no proporcionan metodos para dise
nar la ley de control que lleve el sistema al origen. Tambien
son de gran utilidad y generalidad para determinar la controlabilidad de sistemas subactuados los resultados de Isidori (Isidori 1989, Marino & Tomei 1995) que proporcionan

34

2.7. Sistemas subactuados

la condicion necesaria y suciente para que un sistema no lineal con entrada u


nica, de la
forma
(2.7.1)
x = f (x) + g(x)u,
x IRn , u R
admita una transformacion de coordenadas z = T (x), T (0) = 0 y una ley de control
k(0) = 0, (x) = 0, x IRn

u = k(x) + (x)v,
que transformen el sistema en la

0 1 0 ...

0 0 1 ...
. . . .
. . . ..
z =
. . .

0 0 0 ...
0 0 0 ...

forma canonica lineal de Brunovski,


0
0


0
0
.
..
.. v = Ac z + bc v,
z IRn
z
+
.


0
1
0
1

(2.7.2)

que es una forma lineal controlable. En este caso diremos que el estado del sistema es
linealizable por realimentaci
on. Si las condiciones se cumplen de forma global, entonces el
estado del sistema es globalmente linealizable por realimentaci
on. En un caso de sistemas
subactuados este resultado no proporciona explcitamente la ley de control ni la transformacion z = T (x). Mas a
un, la controlabilidad es posible en sistemas que no cumplen
estas condiciones, como se estudiara en esta tesis.
Para evitar las estrictas condiciones de la linealizacion por realimentacion, as como
la inconveniencia de no proporcionar elementos constructivos para el dise
no de la ley de
control, se han desarrollado nuevas lneas de investigacion entre las que podemos destacar
el trabajo de (Spong 1997) consistente en la linealizacion parcial en sistemas mecanicos
subactuados. El sistema (2.7.1) es linealizable parcialmente si existe una ley de control
u = k(x) + (x)v y un cambio de coordenadas z = T (x) tal que es equivalente al sistema
parcialmente lineal
= (, z),

0 1

0 0
. .
. .
z =
. .

0 0
0 0

0
1
..
.
0
0

IRnr

... 0

... 0

.
... . z +

... 1
... 0

0
0
..
.

v,

0
1

z IRr

La estabilidad de los sistemas parcialmente linealizables depende del estudio asintotico


del subsistema de orden n r cuando z tiende a cero, conocido como din
amica cero. Si
es estable, se dice que el sistema completo es de fase mnima.
Otra denicion importante desde el punto de vista entradasalida es grado relativo del

sistema. Este
se dene como el n
umero de veces que hay que derivar la salida con respecto
al tiempo para que aparezca explcitamente la ley de control. Por ejemplo
x 1
x 2
x 3
y

=
=
=
=

x2
u + x21 x3
x1
x3

Captulo 2. Fundamentos te
oricos y estado de la tecnica

35

Si derivamos dos veces la salida y se tiene


y = u + x21 x3 ,
en cuyo caso la ley de control u = x21 x3 + v produce la relacion entradasalida lineal
y = u y el sistema es controlable. En general todo sistema de grado relativo r bien denido
en un conjunto en torno al origen es linealizable en sentido entradasalida mediante una
ley de realimentacion del tipo u = k(x) + (x)v dando lugar al sistema lineal controlable
y (r) = v
Todas las condiciones para los resultados anteriores pueden ser consultadas en detalle
en (Marino & Tomei 1995).

2.7.2 Metodos de sntesis que preservan la estructura hamiltoniana/lagrangiana


en bucle cerrado
Existen en la literatura del control un gran n
umero de ejemplos de sistemas subactuados
que sin ser candidatos a la linealizacion por realimentacion ni vericar las condiciones de
Sussman, pueden ser estabilizados en tiempo peque
no mediante leyes de control dise
nadas
por procedimientos relativamente sistematicos. Para abordar este tipo de problemas se
han desarrollado tecnicas de control como las basadas en la estructura hamiltoniana y
lagrangiana en bucle cerrado que se comentaran a continuacion y seran objeto de estudio
detallado en esta tesis.

Metodo IDA-PBC
El metodo basado en pasividad conocido como Interconnection and Damping Assignment
Passivity Based Control o IDA-PBC fue introducido en (Ortega & Spong 2000). Esencialmente consiste en partir de una estructura PCH en bucle abierto y obtener otra en bucle
cerrado con las propiedades de estabilidad deseadas. Igualando las ecuaciones de bucle
abierto y del sistema deseado se obtiene la ley de control. En el captulo 4 se estudiara
en detalle la aplicacion del metodo a sistemas mecanicos subactuados. Sin embargo, la
losofa del mismo no es mas que la b
usqueda de una funcion de energa y una estructura
hamiltoniana para el sistema en bucle cerrado tal y como se describio en el captulo
introductorio.
El metodo IDA-PBC persigue una dinamica en bucle cerrado con funcion de Hamilton
on generalizada de la
Hd (q, p) y una matriz antisimetrica tambien llamada de interconexi
forma Jd (q, p) = Jd (q, p)T que permite aumentar los grados de libertad en el dise
no. Las
ecuaciones de estado en lazo abierto y cerrado se deben ajustar exactamente. Esto quiere
decir que la ley de control u debe calcularse de modo que
 

 


Hd
H
q
0 I2
q
q
= (Jd Rd ) Hd =
+ Gu.
(2.7.3)
H
p
I2 0
p
p
donde Rd (q) 0 la matriz de disipacion en bucle cerrado. Las principales dicultades
de este metodo aparecen en en el caso de sistemas subactuados, donde el conjunto de

36

2.7. Sistemas subactuados

funciones de Hamilton Hd alcanzables en bucle cerrado es limitado, y depende de la


resolubilidad de un sistema de ecuaciones diferenciales parciales. En efecto, en el caso
umero de grados de libertad,
subactuado existe una matriz G de rango r < n siendo n el n
que represente las direcciones en las que la ley de control no tiene efecto, cumpliendose
que
G G = 0,
es decir, si G es una matriz constante, las las de G forman el n
ucleo de G. Si premul
tiplicamos (2.7.3) por G se obtiene





Hd
H
0
I
2
q
q
G (Jd Rd ) H
= G
.
(2.7.4)
H
d
I
0
2
p
p
Esta ecuacion ha de cumplirse para cualquier valor de la ley de control, y por lo tanto
representa una restriccion en el conjunto de sistemas hamiltonianos alcanzables en bucle
cerrado denidos por las matrices (Hd , Jd , Rd ). Una correcta eleccion de los parametros
(Hd , Jd , Rd ) debe ser compatible con estas ecuaciones de ajuste y al mismo tiempo representar una dinamica en bucle cerrado con las propiedades deseadas en terminos de
estabilidad. Proporcionar metodos de calculo de las (Hd , Jd , Rd ) adecuadas y de leyes
de control para el ajuste bucle abierto-bucle cerrado es la esencia del metodo IDA-PBC.
En esta tesis se haran aportaciones esenciales al metodo y se aplicara a la resolucion de
problemas clasicos de control subactuado.

Metodo de los lagrangianos controlados


Paralelamente a la publicacion del metodo IDA-PBC, el grupo de Bloch, Leonard y Marsden ha desarrollado en una serie de artculos el metodo de Lagrangianos Controlados,
del que se expondran sus fundamentos. Dado un sistema mecanico, descrito por las ecuaciones


L
d L

= ui ,
i = 1...n
(2.7.5)
dt qi
qi
donde, eventualmente, algunos de los terminos de control ui pueden ser nulos, se propone
un conjunto alcanzable de Lagrangianos controlados Lc y una ley de control tales que las
soluciones q(t) de las trayectorias en bucle cerrado sean tambien las trayectorias de


d Lc
Lc

= 0,
i = 1...n
(2.7.6)
dt qi
qi
En (Bloch, Leonard & Marsden 2000) se enuncia un teorema que establece las condiciones
que debe cumplir dicho conjunto de lagrangianos controlados. Este resultado, conocido
como matching theorem o teorema de ajuste se resumira a continuacion. En la notacion de
(Bloch et al. 2000), los lagrangianos en bucle abierto y cerrado toman, respectivamente,
la forma
1
L(q, q)
= gij (q)qi qj V (q)
2
1
Lc (q, q)
= gij (q)qi qj V (q)
2
donde gij Y gij representan los elementos de la matriz de inercia en bucle abierto y cerrado,
respectivamente. El hecho de que (2.7.5) sea subactuado implica la existencia de una

Captulo 2. Fundamentos te
oricos y estado de la tecnica

37

variedad no nula denominada subespacio de las direcciones no actuadas. La proyeccion


en este espacio se representa por iA ui = 0 (A = 1 . . . m). Empleando los smbolos de
i
ij

Christoel ijk y Gamma


jk de las matrices gij y g , y se dene
i
ijk ijk
Tjk
=

hji = gik gjk


j = gik g jk
h
i
n
Tijk = hpi hqj hrk gpn Tqr
donde g ij y gij representan las inversas de gij y gij , respectivamente. Entonces el teorema
de ajuste arma que Lc cumple (2.7.6) s y solo si las siguientes condiciones se satisfacen
(Hamberg 1999)
l
0
iA gil Tjk
V
V
iA hji j iA i
q
q

En este caso la ley de control para lograr (2.7.6) en bucle cerrado es


ui =

V
j V
l j k

h
gil Tjk
q q
i
i
j
q
q

Este metodo tambien comprende la adicion de un termino de amortiguamiento para lograr


la estabilidad asintotica de sus equilibrios.

2.7.3 Inmersion e invariancia


Los metodos de control de sistemas subactuados mediante el ajuste (matching) de una
dinamica hamiltoniana (lagrangiana) en bucle abierto con otra dinamica, tambien hamiltoniana (lagrangiana) en bucle cerrado con las deseadas propiedades de estabilidad, tienen
la ventaja de abordar el problema de forma relativamente sistematica. Sin embargo encontrar leyes de ajuste exactas a menudo es una tarea difcil, y suele implicar la resolucion
de ecuaciones diferenciales parciales para las cuales, seg
un la complejidad de cada caso,
puede no existir una solucion explcita.
Un metodo para relajar las estrictas condiciones de ajuste, que introduce apreciables
grados de libertad en el dise
no, consiste en determinar una dinamica objetivo y hallar
una ley de control tal que la dinamica en bucle cerrado se ajuste asintoticamente a dicho
sistema objetivo. En la practica la dinamica objetivo es de dimension inferior a la del
sistema en bucle abierto. Esta idea se subsume en el metodo de Inmersi
on e Invariancia introducido por (Astol & Ortega 2001) y cuyo resultado fundamental se enuncia a
continuacion
Proposici
on 2.7.1. Considerese el sistema
x = f (x) + g(x)u,

(2.7.7)

nal de control u IRm , con un punto de equilibrio x


con variables de estado x IRn y se
n
IR para ser estabilizado. Sea p < n y supongamos que podemos encontrar aplicaciones
: IRp IRp , : IRp IRn ,c : IRp IRm , : IRn IRnp , : IRn(np) IRm tales
que:

38

2.7. Sistemas subactuados

(H1) (Sistema objetivo) El sistema


= (),

(2.7.8)

con IRp , tienen un equilibrio globalmente asintoticamente estable en IRp y


x = ( ).
(H2) (Condicion de inmersion ) Para todo IRp
f (()) + g(())c() =

()

(2.7.9)

(H3) (Variedad implcita) Se cumpla la identidad de conjuntos


{x IRn | (x) = 0} = {x IRn | x = (), IRp }

(2.7.10)

(H4) (Atractividad de la variedad y acotamiento de las trayectorias ) El sistema


z =

(f (x) + g(x)(x, z))


x

(2.7.11)

con variables de estado z, tiene un equilibrio globalmente asint


oticamente estable en
cero, uniformemente en x. Adem
as, las trayectorias del sistema
x = f (x) + g(x)(x, z)

(2.7.12)

est
an acotadas para todo t [0, ).
oticamente estable del sistema en bucle
Entonces, x es un equilibrio globalmente asint
cerrado x = f (x) + g(x)(x, (x)).

2.7.4 Control de sistemas en cascada mediante backstepping


Una tecnica de gran utilidad en una clase de sistemas subactuados y en general en sistemas con estructura triangular es la conocida como backstepping, (Khalil 1996, Krstic,
Kanellakopoulos & Kokotovic 1995, Sepulchre, Jankovic & Kokotovic 1997). Para ilustrar
sus fundamentos, considerese la siguiente clase de sistemas de orden n
1 = f () + g()
= u,

(2.7.13)
(2.7.14)

donde = (1 , 2 . . . n1 ) IRn1 y IR. Supongamos que existe una ley de control


= u0 () que estabiliza al subsistema (2.7.13) en el origen de modo que el sistema
= f () + g()u0 ()
es estable en el origen con funcion de Lyapunov V0 tal que
V 0 = V0 (f () + g()u0 ()) 0.

Captulo 2. Fundamentos te
oricos y estado de la tecnica

39

siendo W () una funcion denida positiva excepto en el origen. Si sumamos y restamos


g()u0 () al segundo miembro de la ecuacion (2.7.13) se tiene
= f () + g()u0 () + g() g()u0 ()
= f () + g()u0 () + g()( u0 ())
= f () + g()u0 () + g()z,


donde se ha introducido la variable de error z = u0 (). Derivando respecto al tiempo

z = u0 ().
Si denimos v = z y recordamos que u = entonces
u = u0 () + v.

(2.7.15)

Empleando la variable z, las ecuaciones anteriores pueden escribir como


= f () + g()u0 () + g()z
z = v

(2.7.16)
(2.7.17)

Proponiendo para este sistema la funcion de Lyapunov


1
V1 = V0 + z 2
2

(2.7.18)

se obtiene
V 1 = V0 + z z
= V0 (f () + g()u0 ()) + V0 g()z + zv
W () + V0 g()z + zv.
Con el n de lograr que V1 sea una funcion de Lyapunov del sistema completo se hara la
eleccion
v = ( V0 g() + kz),
lo que equivale a
u = u0 () ( V0 g() + kz)
= u0 ()(f () + g()) V0 g() k( u0 ())

(2.7.19)

que es la ley de realimentacion para el sistema (2.7.13)-(2.7.14). Con esta ley


V1 = V0 (f () + g()u0 ()) kz 2 W (x) kz 2 0.

(2.7.20)

Esta tecnica se puede extender trivialmente a sistemas de orden mayor.


El metodo backstepping, inicialmente formulado para resolver problemas de estabilizacion de equilibrios, se extendera en esta tesis a la estabilizacion de orbitas periodicas.

40

2.7. Sistemas subactuados

Captulo 3
Control de una plataforma
giroestabilizada de dos grados de
libertad
En este captulo se abordara el problema de control basado en pasividad para sistemas
hamiltonianos completamente actuados y se planteara el problema de la implementacion
de un controlador realizado mediante estas tecnicas en una plataforma de dos grados de
libertad sobre base movil. Este tipo de plataformas se emplea en aplicaciones de robotica
movil y muchas otras en las que se desea incorporar antenas, camaras o sensores externos
del tipo sonar, radar, telemetro, infrarrojos y similares donde la lnea de mira del sensor
ha de mantenerse estable frente a los movimientos del vehculo donde se asienta. En
sistemas de navegacion tienen su aplicacion en los equipos que han de mantener contacto
visual estable con elementos externos al buque, como pueden ser los receptores GPS,
antenas parabolicas para comunicaciones va satelite (por ejemplo, inmarsat), deteccion
de obstaculos, faros, puntos de referencia en la costa y por u
ltimo en aplicaciones militares
como sistemas de defensa antiaerea.
En todos estos casos la medida del sensor puede verse degradada por el movimiento
aleatorio de la supercie sobre la que se asienta. En la supercie del buque el oleaje,
relativamente lento, provoca unas velocidades angulares en todas las direcciones del triedro
de referencia, siendo posible compensarlos con actuadores lentos (motores electricos o
hidraulicos) mediante la correcta realimentacion de la velocidad angular. En el caso
de plataformas de sensores instaladas sobre vehculos terrestres, como es el caso de las
camaras montadas sobre vehculos autoguiados, la perturbacion que obliga al vehculo y la
plataforma de sensores montada sobre el a a abandonar el movimiento inercial, vara con
mas celeridad y por tanto es necesario contar con actuadores veloces como pueden ser los
de tipo neumatico y leyes de realimentacion rapidas que deben ser dise
nadas con mayor
renamiento para mantener margenes de fase aceptables evitando posibles situaciones de
inestabilidad y oscilaciones.

3.1 Sensores empleados en control inercial


Una gran variedad de robots moviles, vehculos autonomos y otros sistemas realizan una
navegacion basada en la percepcion interna de las velocidades angulares y aceleraciones
41

42

3.1. Sensores empleados en control inercial

a las que estan sometidos. Se dice que son medidas internas por no basarse en ninguna
interaccion con el exterior como sera el caso de los de sonares, que pueden proporcionar
medidas ables del vector velocidad y aceleracion pero siempre basandose en una interaccion (en este caso reexion) con el entorno.
Los sensores que se aplican en este tipo de sistemas son los denominados inerciales.
Estos sensores se destinan a medir las derivadas de las variables de posicion del robot.
Uno de los primeros usos de sensores inerciales pueden encontrarse en el trabajo del
grupo aleman Peenem
unde. El Vergeltungswae V1 (arma de venganza) era una aeronave
autonoma que se basaba en el guiado inercial. Con un rango operacional de 200 km, el V1
se asentaba en m
ultiples sensores inerciales para guiar el arma hacia el objetivo. El V1
deba viajar en una direccion determinada, a una altitud especca, durante una tiempo
y distancia determinados. La realimentacion de los sensores inerciales de este dispositivo
permitan evaluar las peque
nas desviaciones respeto a la trayectoria prevista y actuar en
consecuencia.
Por el principio de relatividad de los sistemas inerciales, la velocidad lineal no es un
parametro fsico directamente medible sin que medie interaccion alguna con el entorno
(una astronave no debe experimentar ning
un cambio fsico relacionado con su velocidad
respecto a la tierra). Por esta razon los sensores inerciales estan destinados a la medida
de fenomenos de aceleracion, entre los que estan la velocidad angular del solido y la
aceleracion lineal. Generalmente nos encontramos dos tipos de sensores.

;;;
;;;
;;;
;;;

Muelles

Masa

Sensor de
desplazamiento

Direccin de
aceleracin

Figura 3.1: Funcionamiento de un aceler


ometro lineal.

Aceler
ometros Proporcionan una medida de la aceleracion en lineal proyectada
en una direccion del movimiento como se describe en la gura 3.1.
Gir
oscopos Son empleados para medir velocidades angulares, en torno a un eje
jo. Pueden ser opticos, relacionados con la fsica del la luz sometida a aceleracion,
y mecanicos en los que un disco sometido a un giro constante, sufre una torsion
cuando el sistema de referencia en el que se sustenta posee cierta velocidad angular.
El principio de funcionamiento del giroscopo mecanico admite una sencilla interpretacion
ausente de toda terminologa matematica. Este instrumento se representa esquematicamente
la gura 3.2 mediante cuatro masas puntuales A,B,C,D en lugar del disco completo que se
emplea habitualmente. Estas masas representan las areas del disco que mas importantes
a la hora de visualizar el funcionamiento del giroscopo.

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

43

El punto inferior del eje se mantiene estacionario pero puede pivotar en todas direcciones. Cuando una fuerza de torsion se aplica al eje superior, el punto A sube y C
desciende (gura a). Al estar el giroscopo en rotacion en sentido horario, el punto ocupara
el lugar del B tras un giro de /2 rads. Lo mismo sucede para los puntos C y D. El punto
A esta a
un desplazandose hacia arriba cuando se encuentra a /2 rads en la (gura b), y
el punto C viajara hacia abajo. El movimiento combinado de A y C hace que el eje rote
en el plano de precesi
on hacia la derecha (gura b). Este fenomeno recibe el nombre de
precesion.

Figura 3.2: Funcionamiento de un gir


oscopo mecanico.

El eje de un giroscopo se movera en angulo recto respecto del movimiento de rotacion,


en este caso a la derecha. Si el giroscopo rotara en sentido antihorario, el eje se movera
en el plano de precesion hacia la izquierda. Si en el ejemplo de giro horario la fuerza
de torsion tirara en lugar de empujar, la precesion sera hacia la izquierda. Cuando el
giroscopo ha rotado otros /2 rads (gura c), el punto C se encontrara donde estaba A
en el momento inicial de aplicacion de la fuerza de torsion. El movimiento hacia abajo
de C es ahora contrario a la fuerza de torsion y el eje no rota en el plano de la fuerza de
torsi
on .
Mientras mayor sea la fuerza de torsion sobre el eje, mas empujara el disco en el lado
opuesto al eje hacia su posicion inicial. De hecho, el eje rotara en el plano de torsion en
este ejemplo. El eje rotara porque parte de la energa en los mivimientos arriba y abajo
de A y C se emplea en cusar que los ejes roten en el plano de precesion. Entonces cuando
los puntos A y C nalmente dan la vuelta hasta el lado contrario, la fuerza de torsion
(constante) es mayor que las fuerzas de reaccion verticales. La propiedad de precesion de
un giroscopo se emplea para mantener los trenes monorrail verticales al tomar las curvas.
Un cilindro hidraulico empuja y tira, seg
u se necesite, en un eje de un pesado giroscopo.

3.2 Descripcion de la plataforma inercial


El sistema que se desea controlar es la plataforma de dos grados de libertad representada
en la gura 3.3. Se compone de dos cuerpos principales: La base, que contiene dos motores
de corriente continua sin escobillas y esta sometida al movimiento de acimut. Su posicion
viene dada por el angulo de acimut . La cabeza de sensores, montada sobre la base,
gira solidaria con esta, y posee ademas un movimiento en elevacion en torno a un eje
horizontal que corta al eje de acimut. El angulo que determina la posicion de la cabeza
es , la elevacion.
La cabeza del pedestal posee los sensores inerciales. Dos giroscopos opticos orientados perpendicularmente proporcionan las siguientes medidas (suponiendo que la base se

44

3.3. Modelo de la plataforma

asienta sobre un sistema de referencia inercial):


La velocidad angular de elevacion:
La velocidad angular de acimut proyectada sobre la lnea de mira, es decir cos .
La velocidad angular de orientacion se obtendra dividiendo la medida del giroscopo
de elevacion por el coseno de la elevacion. Esto se debe a que ambos giroscopos
estan montados sobre la cabeza, es decir, el cuerpo de elevacion, y por tanto estan
sometidos a sus movimientos.
Este montaje con los dos giroscopos en el cuerpo de elevacion habitual en la practica
por dos razones: a menudo los fabricantes proveen dos estaciones giroscopicas integradas
capaces de medir dos ejes y por tanto ambos deben estar en uno de los dos cuerpos; por
otro lado, si la intencion es la de estabilizar la lnea de mira de la elevacion (para la
correcta operacion de una antena o camara), cuando se alcance el objetivo mediante este
montaje ambos sensores daran una medida nula.
A menudo, a n de reducir el consumo de los motores, se equilibra la cabeza del
pedestal mediante resortes, de modo que cualquier posicion de elevacion es una posicion de
equilibrio, quedando anulados los efectos gravitatorios. De este modo la energa potencial
es invariante y por tanto desaparece de las ecuaciones de movimiento. Esta tecnica tiene
como contrapartida la inexactitud en el modelado.
El origen del angulo de acimut es arbitrario. La variable de elevacion toma el valor
cero cuando la lnea de mira de la cabeza es perpendicular al eje de rotacion de la base.

x
y

Figura 3.3: Plataforma de dos grados de libertad.

3.3 Modelo de la plataforma


Las ecuaciones de movimiento se obtienen facilmente tanto en forma hamiltoniana como
lagrangiana. Bajo las suposiciones expresadas previamente, y situada en un sistema de

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

45

referencia inercial, la energa mecanica de la planta se ve reducida al termino de energa


cinetica:
 


()
0
1

T = [ ]
(3.3.1)
2
0
Iyy2

que coincide con las funciones de Lagrange y de Hamilton al mismo tiempo. EL termino
() representa la expresion


() = Izz1 + Ixx2 sen2 + Izz2 cos2 ,

(3.3.2)

donde Izz1 es el momento de inercia de la base con respecto al eje z; mientras que Ixx2 , Iyy2
y Izz2 representan los momentos de inercia con respecto a los ejes x,y y z respectivamente.

3.4 Control hamiltoniano


Al ser un sistema completamente actuado, podemos imponer cualquier estructura deseada
en bucle cerrado, optando la estructura lineal con matriz de inercia constante donde los
dos grados de libertad aparecen desacoplados. Al imponer estructura hamiltoniana lineal
en bucle cerrado, se obtendra una ley de realimentacion que cancele las no linealidades,
los terminos de acoplamiento y la friccion existente.
A continuacion se a
nadira un termino de amortiguamiento para que la funcion de
Hamilton tienda asintoticamente hacia una posicion estable con velocidad cero. Los
terminos de friccion a
nadidos pueden verse como la disipacion controlada que evita que el
sistema permanezca indenidamente en una orbita donde el hamiltoniano permaneciera
constante (se obtendra un sistema conservativo respecto a Hd ). Por tanto, las conguraciones de mnima energa Hd seran las conguraciones en regimen permanente para la
plataforma. Posteriormente estudiaremos como es posible seleccionar el equilibrio objetivo arbitrariamente y dise
nar la funcion de Hamilton de modo que el mmimo de energa
coincida con el punto de referencia deseado.
De lo anterior se desprende que la manera de especicar el comportamiento deseado
consiste en dar forma a la funcion de Hamilton en bucle cerrado, de manera que esta
presente un mnimo absoluto en el equilibrio que se desea estabilizar con velocidad cero,
y ausencia de otros mnimos locales. Al a
nadir al sistema amortiguamiento mediante un
termino de friccion viscosa, el sistema perdera gradualmente su energa y convergera al
mnimo donde se encuentra el objetivo.
La tecnica conocida como moldeo de energa consiste en calcular una accion de control que modique la dinamica del sistema de modo que en bucle cerrado se obtenga la
dinamica hamiltoniana deseada, y a
nadir un efecto disipativo respecto a la funcion de
Hamilton moldeada. De este modo la energa en bucle cerrado puede ser considerada
como funcion de Lyapunov del equilibrio estabilizado. Para obtener la ley de control,
basta con despejarla del ajuste entre las ecuaciones de bucle abierto y cerrado. En el caso
de sistemas completamente actuados, esto no representa ning
un problema y no existen
restricciones en cuanto a la dinamica objetivo (manteniendo del orden del sistema). Sin
embargo, como se vera a continuacion, el ajuste ha de realizarse en el sistema de coordenadas adecuado, si se desea especicar con libertad la matriz de inercia de la estructura
hamiltoniana en bucle cerrado.

46

3.4. Control hamiltoniano

Recordando la ecuacion (3.3.1), la energa mecanica total del sistema vendra dada por


1
p1
p22
1 p21
p22
(3.4.1)
H=
+
=
+
2 m1 (q) m2 (q)
2 () Iyy2
donde m1 y m2 representan las constantes de inercia efectivas asociadas a cada movimiento
de rotacion. La ecuacion (3.4.1) expresada en la base (q, q)
se convierte en

 1
1
H=
m1 (q)q12 + m2 (q)q22 =
() 2 + Iyy2 2
2
2
Deniendo q = [q1 q2 ]T y p = [p1 p2 ]T , la formulacion hamiltoniana del sistema en bucle
abierto en la base (q, p) resulta
  

 


H
q
0
I2
O
u
2

q
=
+
(3.4.2)
H
p
I2 K
I
u
2

p
donde I2 es la matriz identidad de segundo orden, y K = diag{k1 , k2 } es la matriz
constante de friccion viscosa.
Dado que q = [q1 q2 ]T , introducimos el cambio de base : (q, p) (q, q)
de modo que

el jacobiano de la transformacion x resulta

1
0
0
0

1
0
0
0

(3.4.3)
=
p1 

1
x

()

()
0
0

()2
0

1
Iyy
2

Con estos elementos la formulacion hamiltoniana en la nueva base se obtiene directamente:


  


   
  
T
H
u
0
I2
O

d q

q
+
(3.4.4)
=
H
dt q
x
x
x
I2 K
I2
u
p
lo cual, aplicado a la plataforma, conduce a:


0
0
0
1 ()

0
0
0
Iyy
d

2

=
k
1
1

()
0

dt
2

()

k2
1
0
Iyy

2
2
I
yy2

H

H

0
0
0
0
1
() 0
1
0
Iyy
2

u
u

(3.4.5)

donde el termino se ha denido del siguiente modo


1
Iyy
2
() =
 ()
()


(3.4.6)

Con el n de expresar el sistema deseado en bucle cerrado como un par de sistemas


lineales desacoplados, deberamos en primer lugar proponer la funcion de energa deseada
Hd como aquella en la que el termino de acoplamiento () es reemplazado por una C
constante

1
c 2 + Iyy2 2
(3.4.7)
Hd =
2

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

47

y a continuacion se expresaran las correspondientes ecuaciones de Hamilton como un par


de sistemas lineales de segundo orden independientes con disipacion. A n de lograr
que el sistema lineal transformado siga una referencia en posicion o velocidad, la friccion
existente en las articulaciones seran compensadas por el controlador y se a
nadira un
termino de friccion viscosa para lograr un descenso con el tiempo de la energa Hd y por
tanto la estabilidad asintotica del equilibrio deseado.
La formulacion en bucle cerrado se convierte en:

0
0
0
1

0
0
0
Iyy
d

2
=
Kc1
1

0
dt
c
2c

0
Iyy2
0
IK2c2

yy2

Hd

Hd

Hd

Hd

(3.4.8)

Las derivadas parciales de Hd se obtienen de la ecuacion (3.4.7). La ley de control se


calcula igualando la dinamica en bucle abierto (3.4.5) y la de bucle cerrado (3.4.8). En
estas circunstancias las primeras dos las resultan
H
Hd
= c
=


1 H
1 Hd
= Iyy
=
Iyy
2
2

1 ()

(3.4.9)

mientras que de las dos u


ltimas se obtiene

Kc1

() k1 () + u =

c


1 
Kc2
1
Iyy
() 2 k2 + u =

2
2
Iyy2
1

(3.4.10)
(3.4.11)

A partir de las ecuaciones (3.4.10),(3.4.11) se deducen las leyes de control:

u =  () + k1 Kc1 ()1

 c 
1
u =  () 2 + k2 Kc2
  
2

(3.4.12)

En esta expresion los terminos subrayados representan la accion de control que ha de


a
nadirse para crear al efecto de friccion deseado en el sistema linealizado.

3.4.1 Eleccion de un punto de equilibrio arbitrario


Si el punto de equilibrio viene especicado como (d , d ), propondremos una funcion de
Hamilton en bucle cerrado con un mnimo en dicho punto. Una opcion evidente sera una
funcion cuadratica del error y la velocidad
1
1
Hd = (c 2 + Iyy2 2 ) + (Kd1 ( d )2 + Kd2 ( d )2 )
2
2


Ha

(3.4.13)

48

3.4. Control hamiltoniano

Donde el termino denotado por Ha , representa la energa a


nadida al sistema con respecto
al de la ecuacion Eq.(3.4.7). Esta funcion es tal que:
Ha
=0
qi

i = 1, 2,

(3.4.14)

siempre que la referencia sea puntual, y dado que


Ha
= Kd1 ( d )

Ha
= Kd2 ( d ).

(3.4.15)

Procediendo de manera equivalente a la obtencion de la ecuacion (3.4.12) se llega a


u =  () + k1 1
K 1 K 1 ( d )
     c  c1   c d

B

1
u =  () 2 + k2 Kc2 Kd2 ( d )
    


2  
A

(3.4.16)

Donde los terminos de la ley de control no lineal pueden ser agrupados en funcion de su
signicado fsico:
(A) Moldeo de la energa cinetica para eliminar los efectos de acoplamiento entre
articulaciones
(B) Compensacion de la friccion real del sistema
(C) Introduccion de friccion en el sistema hamiltoniano objetivo
(D) Control proporcional del error, derivado del moldeo de energa potencial
Si denimos el error de seguimiento como e = [e e ]T donde e = ( d ) and
e = ( d ) y suponemos que la referencia se mantiene constante se obtiene:
u =  () + k1 1
c (Kc1 e Kd1 e )



P Dacimut

1
u =  () 2 + k2 Kc2 e Kd2 e



2

(3.4.17)

P Delevacion

Esta es la ley de control que se implementara.


Cabe se
nalar que los u
ltimos dos terminos de la se
nal de control pueden interpretarse
como un controlador PD al ser una realimentacion el error en posicion y su derivada, proporcionando ganancias de ajuste independientes (Kc1 , Kc2 , Kd1 , Kd2 ) que permiten obtener
un transitorio optimo. El termino () multiplicando al PD en acimut hace que se trate
de un PD no lineal, que permite un ajuste del transitorio homogeneo en todas las regiones
de trabajo.

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

49

3.4.2 Estabilidad segun Lyapunov


De lo visto anteriormente es facil comprobar que la funcion de energa es una funcion de
Lyapunov del sistema en bucle cerrado. En efecto, la derivada con respecto al tiempo de
Hd es
2 Kc2 0
H d = (H)T x = (c )
2 Kc1 (Iyy2 )
(3.4.18)
Proposici
on 3.4.1. El sistema (3.4.2) realimentado con la ley de control (3.4.16) posee
un equilibrio globalmente asint
oticamente estable en (d , d , 0, 0)
Demostracion. Dada la desigualdad estricta en (3.4.18) y el hecho de que Hd es propia, el
principio de invariancia de LaSalle garantiza la estabilidad asintotica del maximo conjunto
invariante contenido en ( = 0, = 0). Sin embargo, observando la ley de control, el u
nico
conjunto invariante con velocidades nulas es, precisamente (d = 0, d = 0), con lo que se
prueba la estabilidad asintotica global.
2

3.5 Rechazo de perturbaciones L2


Pudiera argumentarse que los resultados obtenidos previamente obedecen a una nalidad
puramente estetica. De hecho el dotar al sistema de lazo cerrado con una estructura
hamiltoniana desacoplada con el u
nico n de lograr controles independientes en orientacion
y elevacion puede ser obviado. En su lugar se podra recurrir a la tecnica del par calculado,
una version sencilla de la linealizacion por realimentacion aplicable a sistemas roboticos
completamente actuados.
Sin embargo, la virtud de la expresion del sistema en bucle cerrado en forma hamiltoniana subyace en los resultados relativos a la robustez y al rechazo de perturbaciones
originalmente presentados en (Van der Schaft 2000) y que se complementan con el teorema
fundamental 2.6.3.
El problema de rechazo de perturbaciones con ganancia L2 se ha denido el la seccion 3.5. Haremos uso del teorema 2.6.3 all presentado. El sistema en bucle cerrado
perturbado tiene la estructura

x = (J(x) R(x))H + g1 (x)v + g2 (x)w
(3.5.1)
z = h(x)g1T (x)H
donde v = [0 0 v v ]T es el vector de control que se a
nadira a los pares u y u calculados
en (3.4.16). La matriz J(x) de interconexion en bucle cerrado y la de disipacion R(x)
vienen dadas por

1
0
0
0
0
0
0
c
0

0
1
0 0 0
0
0
0 Iyy2

J(x) =
R(x) =

Kc1

0
0
0
1

0
0
0
2

c
0

1
Iyy
2

0 0

Kc2
2
Iyy
2

es facil ver que J(x) = J(x)T y que R(x) es globalmente semidenida positiva. Los pares
de control que se a
nadan actuaran sobre la aceleracion, es decir, sobre las dos u
ltimas las

3.5. Rechazo de perturbaciones L2

50

de las ecuaciones de estado (3.4.8). Lo mismo sucedera con los pares de perturbacion w,
de modo que se tienen las matrices de ganancias de control y perturbacion como

g1 (x) = g2 (x) =

0
0
0
0

0
0
0
0

0
0
1
0

0
0
0
1

= g1 (x)g1T (x) = g2 (x)g2T (x),

de lo que se deduce que


g1 (x)g1T (x) g2 (x)g2T (x) = 0,
por lo que la hipotesis del teorema 2.6.3 se cumple trivialmente para cualquier nivel de
atenuacion ya que
R

1
[g2 (x)g2T (x) g1 (x)g1T (x)] = R 0.
2 2

Para la eleccion de la se
nal de control, tomese la matriz de ponderacion de la forma

h(x) =

0 0 1 0
0 0 0 1

de donde se tiene la se
nal de penalizacion

z=

Hd

Hd


=

c
Iyy2

con lo que se calcula la ley de realimentacion (2.6.5)

1
1 T
T
u = h (x)h(x) + 2 I4 g1 (x)H =

2
2

0
0
0
0

0
0
0
0
0
0
1
0 1 + 2 2
0
0
0
1 + 212 .

0
0
c
Iyy2

(3.5.2)
Con esta ley se garantiza el cumplimiento de la desigualdad de disipacion a lo largo de
las trayectorias del sistema en bucle cerrado, dada por
2 Kc2 1 { 2 w2 z2 }
H + (c )
2 Kc1 + (Iyy2 )
2
con lo que son aplicables las tres implicaciones del problema de rechazo de perturbaciones
descrito en la seccion 3.5. Concretamente la tercera de ellas determina la posibilidad de
encontrar, para cualquier constante c > 0, un valor (c) tal que si w(t) entonces
Hd (t) c. En nuestro problema es un hecho esencial, ya que si la funcion Hd (t) tal y
como se denio en (3.4.13) esta acotada, se deduce que la norma del error en posicion
tambien esta acotada (estabilidad entrada-estado).

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

51

3.6 Seguimiento de objetos moviles en superces no inerciales


Lo presentado hasta el momento parte de la suposicion de que se desea estabilizar un punto
del espacio de conguraciones frente a posibles perturbaciones externas. Esto es deseable
si sobre la plataforma se instalan antenas orientadas a emisores jos y la plataforma en
s se encuentra en un soporte jo.
El problema se enriquece en gran medida cuando el objetivo de control es el seguimiento
visual de un objeto movil. El movimiento del objetivo respecto a la plataforma puede
darse en una o ambas de las siguientes situaciones:
Seguimiento de objetos moviles desde una plataforma apoyada en tierra. La solucion
a este problema, al ser un caso particular, esta contenida en el siguiente supuesto.
Seguimiento de objetos jos o moviles desde una plataforma apoyada en la cubierta
de un buque u otra base movil. En este caso el objeto a seguir tendra un vector
de velocidad no nulo con respecto al sistema de referencia ligado a la cabeza del
pedestal, tanto si el objeto esta en movimiento como si no. Esta velocidad sera la
composicion del movimiento del propio objeto con el movimiento de la plataforma
debido a las oscilaciones provocadas en el buque por el oleaje.
Siendo el segundo caso el mas general, sera el que abordaremos a continuacion. Se
planteara el control como un seguimiento de trayectorias basado en pasividad con rechazo de perturbaciones. Las trayectorias de referencia seran aquellas que hagan nulas
las coordenadas del objeto en la imagen captada por la camara y sus derivadas. Para
ello se incluira un modulo de precalculo de la trayectoria de referencia en virtud de los
movimientos del objetivo en la imagen de la camara. El esquema de control propuesto
aparece en la gura 3.4.
Perturbacin (oleaje)
D(t)
Seguimiento de
trayectoria basado en
pasividad

Radar

Video

x(t),y(t)

Encoder/gyro q(t),q'(t)
Plataforma de sensores

qd(t),q' d(t)

Clculo visual de la
trayectoria de referencia

Figura 3.4: Esquema de control para seguimiento visual.

3.6.1 Seguimiento visual


El dise
no del primer bloque consiste en calcular la trayectoria deseada para las coordenadas de la plataforma, qd (t) = (d (t), d (t)) de modo que la imagen del objeto movil

52

3.6. Seguimiento de objetos moviles en superces no inerciales

se estabilice en el centro de la pantalla de la imagen capturada por la camara CCD. La


entrada de este bloque esta formada por la posicion 2D del objeto en la imagen, referida
al centro de la pantalla. Denotaremos estas coordenadas (x(t), y(t)). Supongamos que
nica en las coordenadas articulares de la plataforma,
existe una trayectoria qd (t) C 2 u
tal que
q(t) = qd (t) (x(t), y(t)) = (0, 0), t
Esta trayectoria es, evidentemente desconocida, pues depende de los movimientos del
buque y del objeto movil. Sin embargo, como se vera a continuacion, bastara con conocer
las trayectorias de las coordenadas del objeto en la imagen capturada por la camara,
nara un
para estimar qd (t) y sus derivadas en cada instante t. Conocidas estas, se dise
controlador basado en pasividad para lograr estabilidad asintotica de la trayectoria, y
consecuentemente
lim (x(t), y(t)) = (0, 0)
t

Es admisible armar que las coordenadas en pantalla (x,y), as como las coordenadas
tridimensionales en el sistema de referencia de la camara, (X,Y ,Z), son medidas del error
en seguimiento. Sin embargo, es necesario expresar dicho error en coordenadas articulares
(, ), y as se obtendra a continuacion. La posicion 2D del objetivo en la imagen capturada se supone estimada por un algoritmo de vision por computador estandar. El calculo
de las coordenadas (X, Y, Z) del objeto referidas al sistema de referencia de la camara se
deriva de las propiedades geometricas ilustradas en de la gura 3.5. Por semejanza de

Vista lateral

Plano de la Imagen

Y
y
d
Z

Plano de la Imagen

Vista superior

X
x
d
Z

Figura 3.5: Coordenadas en pantalla y coordenadas reales.

triangulos, se tiene
X
x
=
d
Z
y
Y
=
d
Z

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

53

siendo d la distancia focal al plano de la imagen, un parametro caracterstico (y a menudo


ajustable) de la camara. Tras algunas manipulaciones se despejan las coordenadas 3D
xD
d2 + r2
yD
=
d2 + r2

X =
Y

donde r2 = x2 + y 2 . El error de orientacion de la camara en funcion de x e y viene dado


por
x
X
= d
e = arctan( ) = arctan
Z
d
y 
Y
= d
e = arctan( ) = arctan
Z
d
Si derivamos esta expresion, se tiene


d
X
d 
x
xd

e =
= d
arctan
=
arctan
= 2
dt
Z
dt
d
d + x2


Y
d 
y
yd

arctan
=
arctan
= 2
e =
= d ,
dt
Z
dt
d
d + y2
De donde obtenemos trayectoria articular deseada y sus derivadas en el instante t
 


e (t)
(t)
+
qd (t) =
(3.6.1)
(t)
e (t)


 
(t)

e (t)
qd (t) =
+

e (t)
(t)
(3.6.2)
Esta trayectoria objetivo calculada en tiempo real sera la referencia del bloque de estabilizacion de trayectorias que se dise
nara a continuacion con metodos basados en pasividad.

3.6.2 Subsistema de estabilizacion de trayectorias


Para lograr el seguimiento de trayectorias partiremos de las ecuaciones de EulerLagrange,
y emplearemos los resultados de (Van der Schaft 2000). Dada la matriz de inercia del
pedestal


() 0
(3.6.3)
M=
0
Iyy2
y la formulacion de EulerLagrange estandar en sistemas roboticos
M (q)
q + C(q, q)
q =

(3.6.4)

en la que se han omitido los terminos derivados de la energa potencial por razones anteriormente esgrimidas, y donde la matriz C(q, q)
viene expresada en terminos de los smbolos
de Christoel de primera especie como
1 mkj mki mij
cijk (q) = {
+

}
2 qi
qj
qk

54

3.6. Seguimiento de objetos moviles en superces no inerciales

siendo mab los terminos de la matriz de inercia en bucle abierto M (q). Para estabilizar la
orbita qd (t) aplicaremos la ley de control (Van der Schaft 2000)
= M (q) + C(q, q)
+

(3.6.5)

= qd (q qd )

(3.6.6)

donde
T

y = > 0. Esta variable fue introducida por primera vez en el celebrado controlador
de Slotine y Li (Slotine & Li 1987). Sustituyendo (3.6.5) en (3.6.4) resulta
M (q)s + C(q, q)s
= ,

(3.6.7)

donde se ha introducido la variable s = q . Deniendo la funcion de energa H(s, q) =


1 T
s M (q)s, se tiene que a lo largo de las trayectorias (3.6.7)
2
1
d
H = sT M (q)s + sT M (q)s
dt
2
1
= sT Cs + sT M s + sT
2
T
= s
Esto u
ltimo se debe a que la matriz M 2C es antisimetrica. Del hecho H 0 se desprende
que el sistema (3.6.7) dene un sistema disipativo con respecto a la tasa de suministro
sT , y un mapa pasivo s para toda condicion inicial. Si denimos adicionalmente


= Ks

(3.6.8)

un aparece en
donde K = K T > 0 es una matriz denida positiva, y se realimenta seg
la estructura de control de la gura 3.6, se estabilizara la trayectoria de referencia como
indica la siguiente proposicion.

te +

M(q)s+C(q,q)s=n

~
n

n=Ks
s

Figura 3.6: Estructura de realimentaci


on para seguimiento de trayectorias.

Proposici
on 3.6.1. La ley de control
qd (q qd )) + K[q qd + (q qd )]
= M (q)[
qd (q qd )] + C(q, q)(
ametros de ajuste, y qd (t) es la trayectoria
donde K = K T > 0 y = T > 0 son par
calculada en (3.6.1), estabiliza asintoticamente en el punto (0, 0) la posicion (x, y) de la
imagen en pantalla del objetivo m
ovil en el sistema de la plataforma de sensores.

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

55

Demostracion. La ecuacion 3.6.8 dene un mapa estrictamente pasivo a la entrada s .


Entonces, en virtud de la Proposicion 2.6.2, apartado (ii), para todo e Ln2 tal que s (y
nal de error estara en Ln2 . Este
por tanto ) esten en e Ln2 (vease la gura (3.6), la se
hecho es relevante, pues en virtud de 3.6.6 y s = q , el error e = q qd satisface
e = e + s

(3.6.9)

De la positividad de se deduce, seg


un la teora de sistemas lineales, que e Ln2 y por
tanto, por (3.6.9), e Ln2 . Se probara a continuacion que esto implica que e(t) 0 para
t . En efecto, si hacemos
d 2
e2 (t2 ) e2 (t1 )
e (t) = 2e(t)e(t)
dt
 t2
 t2
= 2
e(t)e(t)

[e2 (t) + e 2 (t)]dt 0 para t1 , t2
t1

t1

Por tanto, e2 (t), t 0 es una secuencia de Cauchy, que como tal ha de converger a un
valor nito para t . El hecho de que e L2 y consecuentemente la integral en tiempo
innito de e2 (t) este acotada, implica necesariamente que este valor lmite es cero.
2

3.7 Simulaciones
Los razonamientos expuestos en este captulo se ilustran con mayor claridad mediante un
conjunto de simulaciones implementadas en SIMULINK. En sistemas no lineales, valores
como el tiempo de subida dependen del punto de operacion. Para ilustrar las capacidades
del controlador, se mostrara que la respuesta transitoria del sistema controlado no depende
del estado inicial, comportamiento usual en sistemas lineales. Al situar inicialmente la
plataforma con acimut cero e introduciendo un escalon en la referencia, de amplitud
180 grados, se hara una medida del tiempo de establecimiento. El sistema no lineal
original, controlado con una ley lineal, alcanzara el regimen permanente en un tiempo
que sera funcion de la conguracion de inicio del sistema, e intervendran en tal medida
el acoplamiento de ambos cuerpos.
Este fenomeno se entiende a la luz del momento de inercia rotacional. Como consecuencia de lo armado previamente, la respuesta a una entrada en escalon en el par
de orientacion del sistema original, tendra un tiempo de subida diferente para distintas
posiciones iniciales del cuerpo de elevacion. La gura 3.7 muestra el comportamiento del
sistema sin compensacion de los terminos de acoplamiento de la matriz de inercia. En este
caso se ha controlado el eje de acimut con un simple control PD, mientras que el eje de
elevacion se ha dejado libre de actuacion. Se han lanzado las simulaciones a partir de dos
condiciones iniciales (0 y /2 grados en elevacion) por ser puntos de equilibrio relativos
del sistema (en estas posiciones, no se ve modicada por la velocidad de orientacion).
La curva superior de la gura 3.7 corresponde al caso en el que 0 = 2 , con una menor
inercia efectiva () en la rotacion acimutal y un perodo transitorio mas breve de 487
milisegundos. La curva inferior ilustra el caso en el que = 0, con una mayor inercia en el
movimiento de orientacion, y por tanto un tiempo de subida mayor, de 882 milisegundos.
Finalmente conectamos el controlador a la entrada de los motores para realizar medidas
del tiempo de subida del sistema linealizado por realimentacion en dos simulaciones que
comienzan en sendas posiciones de equilibrio de la plataforma (0 = 0 y 0 = 2 ). Como se

56

3.8. Aplicacion a una planta de laboratorio


200

180

160

Acimut (grados)

140

120

100

80

60

40

20

200

400
600
800
1000
1200
1400
1600
1800
2000
Comparacion de tiempos de subida en orientacion, para elevaciones iniciales de 0 y 90 g

Figura 3.7: Tiempos de subida diferentes para bajo diferentes condiciones iniciales, = /2
y = 0.

aprecia en la gura 3.8 ambas curvas estan superpuestas dado que el periodo transitorio
del seguimiento en orientacion ya no depende de la condicion inicial 0 . El tiempo de
subida del sistema lineal desacoplado es 641 ms en todos los casos. Este valor puede ser
ajustado a traves de los parametros Kc , Kd del controlador c .
200

180

160

Acimut (grados)

140

120

100

80

60

40

20

200

400
600
800
1000
1200
1400
1600
1800
2000
Comparacion de tiempos de subida en orientacion, para elevaciones iniciales de 0 y 90 g

Figura 3.8: Seguimiento de la referencia en el eje de acimut para valores iniciales diferentes de
, con compensacion de pares de acoplamiento.

3.8 Aplicacion a una planta de laboratorio


A continuacion se pondran en practica los resultados anteriores sobre una plataforma de
sensores construida en el laboratorio del Dpto. de Ingeniera de Sistemas y Automatica
de la Universidad de Sevilla, que se muestra en la gura 3.9. Los resultados que se
presentaran han sido publicados en (Gomez-Estern, Aracil & Rubio 2000). La plataforma
ha sido desarrollada por los becarios y profesores del departamento ISA, estando dotada
del siguiente equipamiento:
Mesa desestabilizadora apoyada en rotula.
Dos motores DC lineales controlados por variadores para el movimiento de la mesa.
Dos motores DC sin escobillas con sus respectivos servoamplicadores de potencia.
Reductoras con factor de reduccion 800:1 en acimut y 400:1 en elevacion.
Dos giroscopos situados perpendicularmente.

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

57

Figura 3.9: Plataforma de laboratorio de dos grados de libertad.

Un encoder en el eje de cada motor.


Un encoder de alta precision (10000 pulsos por vuelta) en la carga de cada eje.
Dos inclinometros para medir la inclinacion de la mesa.
Camara de vdeo CCD.
Circuitos de adaptacion de se
nales, tarjetas A/D de adquisicion y PC.
Fuentes de alimentacion y dispositivo de parada de emergencia.
Como se comento previamente, a n de implementar el controlador hamiltoniano basado
en el modelo, es necesario un conocimiento preciso en tiempo real de la inercia efectiva y
su derivada
() = Izz1 + Ixx2 sen2 + Izz2 cos2
d
= (Ixx2 Izz2 )sen2,
 () =
d

(3.8.1)
(3.8.2)

ltimos dos representan las constantes de friccion


as como los coecientes Iyy2 , b , y b (los u
viscosa medidas en el sistema real).
La funcion () puede obtenerse de las constantes inerciales. Si estas no estan disponibles,

se empleara la nueva variable = sen2 () de modo que es una funcion lineal de la nueva
variable :
(3.8.3)
() = Izz1 + Izz2 + (Ixx2 Izz2 )
Tomando dos observaciones en = 0 y en = 2 , se determinan las constantes 0 y 2 .
Sus valores se relacionan con el momento de inercia del siguiente modo:


0 = Izz1 + Izz2


/2 = Izz1 + Ixx2

(3.8.4)
(3.8.5)

58

3.8. Aplicacion a una planta de laboratorio

Susituyendo las ecuaciones (3.8.4) y (3.8.5) en Eq.(3.8.3) se obtiene


() = 0 + (/2 0 )

(3.8.6)

por tanto bastara con encontrar las constantes 0 y 2 de forma experimental a n de


poder calcular analticamente las funciones () y  () = d()
. La obtencion estos
d
valores se explicaran a continuacion. La dinamica de la planta, modelando la friccion con
los terminos basicos de Coulomb y friccion viscosa, viene dada por
/2 0 )sen2
F = () + (

(3.8.7)

donde F = b + co es la fuerza de friccion y co es la constante de friccion de Coulomb


para el movimiento en el eje . El par de control es proporcional a la tension de entrada
al servoamplicador1
= Kt V
A menudo no se dispone de un valor able y estable de la constante de par Kt , que depende
del servo y del motor de corriente continua. Este problema se solventa dividiendo ambos
terminos de la ecuacion (3.8.7) por Kt y empleando el cambio de variable


() =

()
 Ixx2
 Izz2
, Ixx2 =
, Izz2 =
Kt
Kt
Kt


b =

b
 co
 p
, co =
, p =
,
Kt
Kt
Kt

de modo que el sistema a identicar se transforma en



1 

=
Vin + (/2 0 )sen2 F
()

(3.8.8)

donde el voltaje aplicado al servoamplicador aparece de forma explcita en as como


una serie de parametros relacionados con sus equivalente fsicos por la constante Kt , no
apareciendo esta explcitamente.
La ecuacion (3.8.7) se simplica para una entrada en escalon de tal modo que la
maxima velocidad en orientacion no supera el siguiente valor:

2co
max
,
(3.8.9)
 ()
Que se puede considerar como la condicion de arranque del movimiento del cuerpo de
elevacion cuando este se origina exclusivamente por efecto del acoplamiento. Bajo esta
hipotesis, (la cabeza de la plataforma se mantiene estatica), la respuesta a una entrada
en escalon en el eje de acimut viene descrita por la ecuacion
=

1
(Vin + b co )
()

(3.8.10)

La ausencia de derivadas de orden cero en la variable , al tratarse esta de una variable


cclica, permite la reduccion de la ecuacion diferencial a una de primer orden, nmediante
1
Precisamente esta es la funcion del servoamplicador: lograr que la corriente y por tanto el par
aplicado sigan a la referencia proporcionada por la tensi
on de entrada, convirtiendo la din
amica de
primer orden del motor DC en una relaci
on de proporcionalidad

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

59

el cambio de variable z = .
La u
ltima ecuacion expresada en terminos de la velocidad z
se transforma en
z + k1 z = k2
 b

k1 =
, k2 =
()

(3.8.11)
Vin co
()

(3.8.12)

La condicion de movimiento implica necesariamente que k1 > 0 y k2 > 0, manteniendose


ambos valores constantes dentro del horizonte temporal del experimento. La solucion de
(3.8.11) da lugar a:


(3.8.13)
z(t) = z 1 ek1 t
A traves de la experimentacion se determinaran el tiempo de subida tr y la velocidad en
regimen permanente z .
1
tr
= z k1

k1 =

(3.8.14)

k2

(3.8.15)

En la gura 3.10 se ha obtenido la respuesta del sistema a un par de entrada en escalon. La


Angulo de acimut (verde), velocidad de acimut (azul) y tension de entrada (rojo)
45

40

35

30

25

20

15

10

0.2

0.4

0.6

0.8

1.2

1.4

1.6

1.8

Figura 3.10: Respuesta de la velocidad en acimut (en grados/segundo) al escal


on de entrada
en bucle abierto, frente al tiempo (mseg) .

tabla 3.1 muestra los diferentes valores de la velocidad maxima alcanzada y los tiempos de
subida para elevacion nula, a medida que se incrementa el tama
no del escalon de entrada.
La tabla 3.2 muestra los mismos resultados cuando el movimiento parte con una elevacion
inicial de 45 grados.
A primera vista, las tablas 3.1 y 3.2 revelan una saturacion abrupta en la entrada.
Esta no linealidad se puede apreciar con mayor claridad en la gura 3.11 donde se traza
la maxima velocidad de rotacion frente a la amplitud del voltaje de entrada. La funcion
de saturacion es simetrica respecto a la tension de entrada nula. Por tanto la se
nal de
control esta acotada en el intervalo [0.6, 0.6]

60

3.8. Aplicacion a una planta de laboratorio

Tabla 3.1: M
axima velocidad de rotaci
on y tiempo de subida para = 0.

Voltaje de entrada (V) Vel. max. (grad/s)


0.2
0.4
0.6
0.8
1

Tiempo de subida (s)

10.3912
26.6888
45.0227
44.8184
44.832

0.116
0.105
0.102
0.061
0.056

Tabla 3.2: M
axima velocidad de rotaci
on y tiempo de subida para = 45.

Voltaje de entrada (V) Vel. max. (grad/s)


0.2
0.4
0.6
0.8
1

Tiempo de subida (s)

11.0424
27.0524
44.5196
44.9311
44.8316

0.113
0.102
0.1
0.69
0.62

Max. rotation speed vs. input voltage


50

45

40

35

30

25

20

15

10

0
0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Figura 3.11: Efecto de la saturaci


on de la velocidad m
axima frente a la tension de entrada.

3.8.1 Identicacion de los parametros


El valor de () sera obtenido experimentalmente a diferentes angulos empleando, a traves
de (3.8.12), la relacion lineal entre k2 y ()1 . La pendiente de la funcion lineal es
estimada mediante la obtencion de dos valores de k2 bajo diferentes tensiones de entrada
Vin
k2
1
k2
=
=
(3.8.16)
Vin
Vin
()
Repitiendo el experimento en dos angulos de elevacion estaticos, concretamente = 0
y = /2, se puede obtener la expresion analtica de la funcion () en terminos de la

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

61

ecuacion (3.8.3) para cualquier valor de . S los lmites mecanicos no permiten angulos de
elevacion tan altos como = /2, como es el caso de nuestra plataforma de laboratorio, el
mismo procedimiento se llevara a cabo, haciendo los experimentos en = /4, y usando
la relacion
(3.8.17)
() = 0 + 2(/4 0 )sen2
Consecuentemente, a n de determinar analticamente la funcion de inercia efectiva (),
se deben llevar a cabo cuatro experimentos:
dos de ellos con elevacion nula a diferentes amplitudes del escalon de entrada en
acimut,
y los otros dos con el angulo de elevacion jo a /4 o /2 radianes (solo uno de ellos
a elegir).
En todos los experimentos se mantiene el sentido de rotacion constante para no interferir
con los fenomenos de friccion estatica2 . El parametro de friccion viscosa resulta
co = Vin k2 ()

(3.8.18)

ltimo paso, siempre que permanezca constante.


siendo k2 y () los obtenidos en el u
Esto es cierto a causa de la relacion b = k1 ().
Se han realizado calculos analogos para identicar la dinamica del eje de elevacion.
Dado que su inercia Iyy2 no se ve afectada por el valor de , solo deben obtenerse los
valores de z y tr .

3.9 Resultados experimentales


3.9.1 Identicacion de la planta real
Se aplicara el procedimiento de identicacion a la planta de laboratorio y se analizaran los
resultados de la identicacion. En primer lugar, se muestra la saturacion en la velocidad
de regimen permanente (debido a la saturacion del par de entrada) en la gura 3.11.
Claramente, esta limitacion ha de ser tenida en cuenta a la hora de dise
nar controladores.
En la gura 3.12, se ha trazado el valor de (0) para diferentes tensiones de entrada.
A velocidades bajas, este parametro cambia drasticamente. Esto se debe a los fenomenos
de friccion y holgura de los engranajes que sugiere la inclusion de un precompensador
de friccion para aumentar la precision (Canudas de Wit et al. 1995). Sin embargo, a
velocidades mayores, el comportamiento de la plataforma se ajusta con gran exactitud al
modelo aqu desarrollado. Desde un valor de la entrada cercano a 0.2 voltios, la medida de
se mantiene constante hasta que alcanzamos el punto de saturacion, donde la relacion
(3.8.16) deja de ser valida. El valor medio obtenido para la inercia efectiva normalizada
(0) (con elevacion cero) es 0.000596, y la relativa a la posicion del cabezal elevado a
/4 resulto /4 = 0.0006. Se observa, por tanto, que los altos ratios de las reductoras
2

Para una correcta identicaci


on de los fen
omenos asociados a los cambios de signo de velocidad
(efecto de Stribeck etc.), habra de emplear los metodos desarrollados por el grupo de LuGre (Canudas
de Wit, Olsson,
Astrom & Lischinscky 1995).

62

3.9. Resultados experimentales

x 10

3.5

2.5

1.5

0.5

0
0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Figura 3.12: Inercia efectiva frente a la tension de entrada para una elevaci
on nula.

(400 y 800) hacen difcil de apreciar, en nuestro caso, los efectos de acoplamiento. Se han
realizado experimentos similares para el eje de elevacion y se obtuvo un valor medio del
momento de inercia Iyy2 en torno al eje y de 0.001.

3.9.2 Control hamiltoniano con prealimentacion de friccion


La precision de los resultados aumenta considerablemente cuando se una estrategia de
prealimentacion de la friccion basada en el modelo de LuGre (Canudas de Wit et al. 1995).
Los detalles del compensador de friccion seran omitidos al no ser un objetivo central de
esta tesis. La gura 3.13 se ha obtenido tras la implementacion de un control en posicion
basado en la ley hamiltoniana (3.4.16). Los resultados son plenamente satisfactorios para
se
nales de referencia de tipo escalon o variaciones lentas en la referencia. Sin embargo,
a medida que aumentamos la frecuencia de la se
nal a seguir, como sucede en el caso de
seguimiento de trayectorias, el rendimiento del controlador se degrada considerablemente
(guras 3.14 y 3.15), al aparecer atenuacion y desfase entre la referencia y la salida. En
estos casos es preciso cambiar la estrategia de control por la del seguimiento de trayectorias
basado en pasividad presentado en la seccion 3.6.
6

grados

4
Posicin
Referencia
6

10

15

Tiempo(s)

Figura 3.13: Seguimiento en posici


on con perturbaciones. Referencia en escalon.

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

63

10

grados

Posicin
Referencia

10

10

15

Tiempo(s)

Figura 3.14: Seguimiento en posici


on con perturbaciones. Referencia senoidal, baja frecuencia.
10

6
Posicin
Referencia

grados

10

10

15

Tiempo(s)

Figura 3.15: Seguimiento en posici


on con perturbaciones. Referencia senoidal de alta frecuencia.

3.9.3 Atenuacion de perturbaciones en la planta real


Se ha tratado de medir el efecto de las perturbaciones en los pares de control debido a
la composicion de velocidades angulares producida por el movimiento de la mesa desestabilizadora. Sin embargo se ha observado que las velocidades de esta u
ltima son bajas
y los altos ratios de reduccion de los motores (1:400 y 1:800) impiden que este efecto
se manieste de forma apreciable como perturbacion. Por tanto, con el n de ilustrar
las propiedades de atenuacion de perturbaciones se ha a
nadido a la propia se
nal de control un ruido generado por el ordenador, con dos envolventes distintas: ruido blando y
oscilaciones senoidales lentas (el escenario esperado en la cubierta de un buque).
En las distintas experiencias de laboratorio se hizo variar el valor de de la ley,
obteniendose, seg
un lo previsto, un mejor rechazo de las perturbaciones en la salida, para
valores menores de este parametros. En la gura 3.16 se representa la referencia, la salida
y la se
nal de perturbacion de gran amplitud superpuesta. Con un valor de = 0.2 se
obtiene un rechazo de perturbaciones muy satisfactorio, especialmente en el caso de ruido
blanco. Se observo, sin embargo, que esta mejora no se poda aumentar indenidamente al
estar relacionada con el termino derivativo del control, de modo que para muy peque
no
la dinamica del controlador es demasiado rapida y presenta vibraciones probablemente
relacionadas con las imprecisiones en los modelos de holgura y friccion.

64

3.9. Resultados experimentales

6
Posicin
Referencia
4

grados

10

15

Tiempo(s)

Figura 3.16: Rechazo de perturbaciones para el seguimiento en posici


on.

3.9.4 Seguimiento de trayectorias en la planta real


La estructura de control presentada en la seccion 3.6 comprende un subsistema de seguimiento visual para el calculo de la trayectoria de referencia que excede los lmites de esta tesis.
El rendimiento del controlador, sin embargo, esta mas relacionado con la capacidad de
seguir una referencia cambiante y rechazar las perturbaciones que con la manera de obtennales
er la se
nal qd (t). Por tanto el comportamiento del controlador se ha estudiado bajo se
de referencia generadas por ordenador con forma senoidal a distintas frecuencias. Como
se observa en las gura 3.17 y 3.18, el seguimiento de trayectorias basado en pasividad
presenta un comportamiento optimo incluso a frecuencias altas, salvando el problema de
desfase detectado en el control hamiltoniano en posicion.
6

grados

4
Posicin
Referencia
6

10

15

Tiempo(s)

Figura 3.17: Seguimiento de trayectoria senoidal con perturbaci


on senoidal.

Captulo 3. Control de una plataforma giroestabilizada de dos grados de libertad

65

grados

Posicin
Referencia

10

15

Tiempo(s)

Figura 3.18: Seguimiento de trayectoria senoidal con perturbaci


on en forma de ruido blanco.

66

3.9. Resultados experimentales

Captulo 4
Control de sistemas subactuados
mediante el m
etodo IDA-PBC
Lo mayor parte de lo que se expondra en este captulo aparece publicado en el artculo
(Ortega, Spong, Gomez-Estern & Blankenstein 2002). En el estudiaremos la aplicacion
de una nueva formulacion del problema del control, basada en pasividad, conocida como
interconexion y asignacion de amortiguamiento (IDA-PBC), al problema de estabilizacion
de sistemas mecanicos subactuados. Este metodo, introducido inicialmente en (Ortega &
Spong 2000) a
nade a la modicacion de la energa potencial que se ha venido haciendo
habitualmente, el moldeo de la energa cinetica como va imprescindible para salvar los obstaculos relacionados con la subactuacion. La principal contribucion es la caracterizacion
de una clase de sistemas para la cual el IDA-PBC proporciona un controlador suave con
estabilizacion asintotica en un dominio de atraccion garantizado, la resolucion de algunos
problemas de control subactuado mediante esta tecnica, y el analisis transitorio de las
soluciones.
La clase en la que es aplicable esta tecnica se dene en terminos resolubilidad de
un conjunto de ecuaciones diferenciales parciales. Una ventaja importante del metodo
debida a su formulacion hamiltoniana (en oposicion al mas clasico metodo lagrangiano)
es la introduccion de nuevos grados de libertad para la solucion de estas ecuaciones, como
los elementos de la matriz de interconexion. Usando este grado de libertad adicional,
se puede probar que el metodo de Lagrangianos controlados en su formulacion original
puede verse como un caso particular del enfoque IDA-PBC. Con el n de ilustrar la
tecnica se dise
naran controladores asintoticamente estables para el clasico problema de la
bola en la viga, y para un sistema subactuado recientemente presentado (Spong, Corke
& Lozano 2001), el pendulo de disco inercial. En el primer ejemplo se probara que para
cualquier condicion inicial (excepto un conjunto de medida cero), el controlador es capaz
de conducir al sistema de la bola en la viga hacia la orientacion correcta. Asimismo,
deniremos un dominio de atraccion del equilibrio en el origen que garantiza que todas
las trayectorias permanecen acotadas dentro de los lmites de la viga. Para el pendulo de
disco inercial se probara que es posible levantar (swingup) y estabilizar el pendulo en la
posicion vertical superior sin conmutacion entre la ley de swingup y la de estabilizacion,
y sin necesidad alguna de sensores de velocidad.

67

68

4.1. Introducci
on

4.1 Introduccion
El control basado en pasividad (PBC) es una metodologa de dise
no para el control de
sistemas no lineales ampliamente conocido en aplicaciones mecanicas. En algunos problemas de regulacion, proporciona un procedimiento natural para moldear la energa potencial preservando, en bucle cerrado, la estructura de Euler-Lagrange del sistema. En
un profundo analisis en (Ortega et al. 1998), se extiende la aplicacion del PBC a una
amplia clase de sistemas descritos mediante ecuaciones de EulerLagrange, incluidos sistemas electricos y electromecanicos. En (Ortega, Loria, Kelly & Praly 1995) se propone el
uso de controladores dinamicos, conectados con la planta a traves de interconexiones que
preservan la potencia (y por tanto conservan estructura de Euler-Lagrange), para moldear
la energa potencial de una clase de sistemas de EulerLagrange subactuados empleando
medidas parciales del estado. Sin embargo, para estabilizar algunos sistemas mecanicos
subactuados, ademas de la mayora de sistemas electricos y electromecanicos, es necesario
modicar la funcion de energa total (potencial mas cinetica). Desafortunadamente, el
moldeo de energa total por el procedimiento clasico PBC, donde en primer lugar se selecciona la funcion de energa y despues se dise
na el control que fuerza la desigualdad de
la disipacion, destruye la estructura EulerLagrange. Esto acarrea en estos casos que el
sistema en bucle cerrado aun deniendo un operador pasivo deje de ser un sistema de
EulerLagrange, y la funcion de almacenamiento del mapa pasivo (que es normalmente
una funcion cuadratica del error) carece de signicado fsico, lo cual diculta el analisis
posterior del sistema controlado. A
nadido a esto, el metodo IDA-PBC incorpora la ventaja de resolver ciertos problemas de forma totalmente sistematica, como se vera en este
texto.
Tal y como se explica en la Seccion 10.3.1 del libro (Ortega et al. 1998), esta situacion
proviene del hecho de que esto dise
nos involucran una inversion del sistema a lo largo
de las trayectorias de referencia, heredando las pobres propiedades de robustez de los
dise
nos de linealizacion por realimentacion e imponiendo al sistema el articial requisito
de la invertibilidad.
Para solventar esta dicultad se desarrollo en (Ortega, Van der Schaft, Maschke &
Escobar 2002) (vease tambien (Ortega, Van der Schaft, Mareels & Maschke 2001, Van
der Schaft 2000)), un metodo de sntesis basado en pasividad denominado Interconexi
on y
Asignaci
on de Amortiguamiento, o IDA-PBC. Las principales caractersticas del metodo
IDA-PBC son:
1 Esta formulado para la clase de sistemas PCH, que es una clase que contiene estrictamente los sistemas de Euler-Lagrange, y
2 la funcion de energa en bucle cerrado se obtiene tras resolver un sistema de
ecuaciones diferenciales parciales como resultado de nuestra eleccion libre de interconexiones deseadas entre subsistemas y del amortiguamiento. Es bien sabido que
la resolucion de sistemas de ecuaciones diferenciales parciales (EDPs) es una tarea
difcil. Sin embargo, la EDP particular que aparece en IDA-PBC esta parametrizada
en terminos de las matrices de interconexion y amortiguamiento, las cuales pueden
ser elegidas cuidadosamente invocando consideraciones fsicas para resolverla. Este
punto ha sido ilustrado en varias aplicaciones practicas incluyendo sistemas de balance de masas, motores electricos, sistemas de levitacion magnetica, sistemas de
potencia, control de satelite y vehculos subacuaticos.

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

69

En este captulo, nos centraremos en la aplicacion del IDA-PBC al problema de estabilizacion de sistemas subactuados1 .
La principales contribuciones de este captulo son: la caracterizacion de una clase
de sistemas para la cual el metodo IDA-PBC proporciona una ley de control suave, la
aplicacion a dos problemas de control subactuado, el estudio de la estabilidad de los
controladores, y el analisis del comportamiento transitorio del clasico sistema de la bola
y la viga en bucle cerrado. La clase de sistemas de aplicacion del metodo esta denida
en terminos de resolubilidad de dos EDPs que corresponden a sendas etapas de moldeo
de la energa potencial y cinetica. A modo de ilustracion dise
naremos controladores IDAPBC asintoticamente estables para los clasicos sistemas de la bola en la viga y para un
pendulo invertido de reciente aparicion (Spong et al. 2001), el pendulo de disco inercial.
Para el sistema bola y viga se probara que para cualquier condicion inicial (excepto un
conjunto de medida cero) el controlador lleva la viga a la posicion horizontal con la bola
al centro de la viga. Mas a
un, deniremos un dominio de atraccion que garantice que la
bola permanece dentro de los lmites de longitud de la viga. Para el pendulo de disco de
inercia se presentara una realimentacion dinamica de la salida para la cual, de nuevo para
casi todas las condiciones iniciales se logra estabilizar el sistema en la posicion vertical
superior. Esto quiere decir que es posible levantar el pendulo desde su posicion estable en
bucle abierto y estabilizar arriba sin necesidad de conmutacion. Ademas, no es necesario
tomar medidas directas de la velocidad.
Otro tema de interes tratado en este captulo es situar el nuevo enfoque hamiltoniano
en perspectiva con el de los Lagrangianos Controlados para estabilizacion de sistemas
mecanicos simples subactuados, desarrollados en una serie de artculos de Bloch et al.
(vease (Bloch et al. 2000, Chang, Bloch, Leonard, Marsden & Woolsey 2002)), y continuados con el trabajo de (Auckly, Kapitanski & White 2002, Andreev, Auckly, Kapitanski,
Gosavi, Kelkar & White 2000). 2
Como se comento en el captulo 2, los metodos IDA-PBC y Lagrangianos Controlados
comparten objetivos y en cierta medida su fundamento teorico. Una diferencia central
entre ambos metodos recae en que mientras la dinamica EL objetivo en el metodo de
Lagrangianos Controlados se obtiene modicando exclusivamente la matriz de inercia
generalizada y la funcion de energa potencial, en IDA-PBC tenemos tambien la posibilidad de cambiar la matriz de interconexion, es decir, la estructura de Poisson del sistema.
A este respecto, se plantean las siguientes cuestiones:
1. Cual es la eleccion especca de este parametro libre que proporciona los mismos
controladores para ambos metodos?. Para responder a esta cuestion usaremos los
recientes resultados de (Blankenstein, Ortega & Van der Schaft 2001).
2. Podemos usar este grado de libertad adicional para simplicar la b
usqueda de
soluciones para las EDPs mencionadas? Para responder a esta pregunta escribiremos
las EDPs en una forma tal que los parametros libres aparezcan explcitamente como
entradas de control y trabajaremos con dos ejemplos clasicos para ilustrar como
se seleccionaran dichas entradas.
1

Cabe puntualizar que, tal y como se presentado, el metodo IDA-PBC se aplica solo a sistemas
estabilizables mediante leyes suaves, excluyendo una amplia clase considerada en (M. Reyhanoglu &
Kolmanovsky 2001). Sin embargo, la versi
on de IDA-PBC de (Fujimoto & Sugie 2001), se aplica tambien a problemas que involucren hamiltonianos variantes en el tiempo, permitiendo la estabilizaci
on con
controladores variantes en el tiempo.
2
En (Hamberg 1999) aparece una extension a los sistemas Lagrangianos en general.

70

4.2. Estabilizacion de sistemas mecanicos subactuados

3. Es el conjunto de modelos EL en bucle cerrado alcanzable por medio de IDAPBC mayor que el que se obtiene mediante metodos Lagrangianos? Si fuera as,
podramos caracterizar la diferencia? Proporcionaremos una respuesta a ambas
cuestiones, mostrando que con IDA-PBC podemos aun preservando la estructura
EL, a
nadir terminos giroscopicos al sistema en bucle cerrado, una caracterstica que
no aparece en la literatura del enfoque lagrangiano. 3
Para claricar mas a
un las conexiones entre IDA-PBC y Lagrangianos Controladosde
nuevo invocando(Blankenstein et al. 2001)probaremos que las condiciones de ajuste
(matching conditions) de (Bloch et al. 2000) caracterizan una clase de sistemas mecanicos
tales que sus funciones de energa cinetica puede ser moldeada sin resolver las mencionadas
EDPs. Obviando la necesidad de resolver dichas ecuaciones, principal obstaculo en ambos
enfoques, claramente aumenta la aplicabilidad de estos metodos de dise
no.
El resto del captulo se organizara del siguiente modo. En la seccion 4.2 presentamos
la aplicacion de IDA-PBC a sistemas mecanicos subactuados. Las secciones 4.3 y 4.4
contienen las derivaciones de IDA-PBC para los sistemas pendulo de disco inercial y la
bola en la viga, respectivamente. Por u
ltimo, se presentara un analisis novedoso de los
comportamientos transitorios del sistema de la bola y la viga en bucle cerrado controlado
mediante IDAPBC.

4.2 Estabilizacion de sistemas mecanicos subactuados


En esta seccion aplicaremos el enfoque IDA-PBC para regular la posicion de sistemas
mecanicos subactuados cuya energa total viene dada por
1
H(q, p) = p M 1 (q)p + V (q)
(4.2.1)
2
donde q IRn , p IRn son los momentos y coordenadas generalizados, respectivamente,
M (q) = M  (q) > 0 es la matriz de inercia, y V (q) es la energa potencial. Si suponemos
que el sistema no tiene amortiguamiento natural, entonces las ecuaciones de movimiento
pueden escribirse del siguiente modo

 

  
q H
0
q
0 In
+
u
(4.2.2)
=
In 0
G(q)
p H
p
ua
La matriz G IRnm es determinada por el modo en que el controlador u IRm act
sobre el sistema y es invertible en el caso de que el sistema sea completamente actuado,
i.e. m = n. Consideraremos aqu el caso mas difcil en el que el sistema es subactuado, y
por tanto lka matriz de control es tal que rango(G) = m < n.
En el metodo IDA-PBC se siguen dos pasos basicos del control basado en pasividad
o PBC (Ortega & Spong 2000): 1) moldeo de energa, donde modicamos la funcion de
on
energa total del sistema para asignar el punto de equilibrio deseado (q , 0); y 2) inyecci
de amortiguamiento para lograr estabilidad asintotica. Como se explico previamente, para
mantener la interpretacion del mecanismo de estabilizacion necesitaremos, ademas, que
el sistema en bucle cerrado este en forma hamiltoniana (Van der Schaft 2000).
3

Recientemente, Bloch et al. (Chang et al. 2002) han extendido el metodo de Lagrangianos controlados
para obtener un metodo equivalente al IDA-PBC.

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

71

4.2.1 Dinamica objetivo


Motivado por (4.2.1) propondremos a siguiente forma para la funcion de energa (en bucle
cerrado)
1
Hd (q, p) = p Md1 (q)p + Vd (q)
(4.2.3)
2
donde Md = Md > 0 y Vd representan respectivamente la matriz de inercia y funcion de
energa potencial (ambas por denir). Se requerira que Vd tenga un mnimo local aislado
en q , es decir,
(4.2.4)
q = arg min Vd (q)
En PBC la se
nal de control se descompone de forma natural en4
u = ues (q, p) + udi (q, p)

(4.2.5)

donde el primer termino se dise


na para lograr el moldeo de energa y el segundo es responsable de la inyeccion de amortiguamiento. La dinamica hamiltoniana deseada se toma en
la forma5
 


q
q H d
= [Jd (q, p) Rd (q, p)]
(4.2.6)
p H d
p
donde los terminos

Jd = Jd =

0
M 1 Md
Md M 1 J2 (q, p)


Rd = Rd =

0
0
0 GKv G


0

(4.2.7)

representan las estructuras deseadas de interconexion y amortiguamiento.


De lo previamente dicho se desprenden las siguientes observaciones
De (4.2.1), (4.2.2) se tiene que q = M 1 p. Al ser esta una coordenada no actuada
la relacion debe ser valida en bucle cerrado. Fijando (4.2.3) y (4.2.6) se determina
el bloque (1, 2) de Jd .
la matriz Rd se incluye para introducir amortiguamiento en el sistema. Como es
sabido, esto se logra mediante realimentacion negativa de la (nueva) salida pasiva
(esta tecnica tambien se conoce como control Lg V ), que en este caso toma la forma
G p Hd . Esto quiere decir que seleccionaremos el segundo termino de (4.2.5) como
udi = Kv G p Hd

(4.2.8)

donde tomamos Kv = Kv > 0. Esto justica el bloque (2, 2) de Rd .


Se mostrara que la matriz antisimetrica J2 (y algunos de los elementos de Md )
pueden ser usados como par
ametros libres para lograr el moldeo de energa cinetica.
Proporcionar estos grados de libertad adicionales es la esencia del metodo IDAPBC6 .
4
Los subndices es y di hacen referencia, respectivamente, a las palabras energy shaping (moldeo
de energa) y damping injection (inyeccion de amortiguamiento).
5
Vease (Ortega, Van der Schaft, Maschke & Escobar 2002, Van der Schaft 2000) para una justicaci
on
fsica de esta eleccion.
6
En el apartado 4.2.4 se mostrar
a que, para una elecci
on particular de J2 antisimetrica , IDA-PBC
se reduce al esquema de lagrangianos controlados de (Auckly et al. 2002, Hamberg 1999, Chang et al.
2002). Es razonable esperar que la posibilidad de elegir entre la clase completa de matrices antisimetricas
aumenta la clase de sistemas estabilizables.

72

4.2. Estabilizacion de sistemas mecanicos subactuados

4.2.2 Estabilidad
Para la dinamica deseada en bucle cerrado se tiene la siguiente proposicion, la cual revela
las propiedades de estabilizacion del enfoque IDA-PBC:
Proposici
on 4.2.1. El sistema (4.2.6), con (4.2.3) y (4.2.4), tiene un punto de equilibrio
estable en (q , 0). Este equilibrio es asintoticamente estable si es localmente detectable
desde la salida7 G (q)p Hd (q, p). Una estimaci
on del dominio de atracci
on esta dado


por c donde c = {(q, p) IR2n | Hd (q, p) < c} y




a acotado}
c = sup{c > Hd (q , 0) | c est

(4.2.9)

Demostraci
on. De (4.2.3) y (4.2.4) tenemos que Hd es una funcion denida positiva en
un entorno de (q , 0). Un calculo sencillo muestra que a lo largo de las trayectorias de
(4.2.6), H d satisface
H d = (q Hd ) q + (p Hd ) p
= (p Hd ) GKv G p Hd
min {Kv }|(p Hd ) G|2 0
al ser Jd antisimetrica y Kv denida positiva. Consecuentemente, (q , 0) es un equilibrio
estable. Adicionalmente, al ser Hd propia (por denicion) en su subconjunto de nivel
c, todas las trayectorias comenzando en c estan acotadas are bounded. La estabilidad
asintotica, bajo la suposicion de detectabilidad, se establece invocando el teorema de
BarbashinKrasovskii y los argumentos usados en la prueba del Teorema 3.2 de (Byrnes,
Isidori & Willems 1991). Finalmente, la estimacion del dominio de atraccion proviene del
2
hecho de que c es el mayor subconjunto de nivel acotado de Hd .

4.2.3 Moldeo de energa


Para obtener el termino de moldeo de energa, ues , del controlador, sustituiremos (4.2.5)
y (4.2.8) en (4.2.2) y lo igualaremos a (4.2.6)




 


0
M 1 Md
0 In
q H
0
q Hd
+
ues =
p H
In 0
G
Md M 1 J2 (q, p)
p H d
Mientras que las primeras n ecuaciones son claramente satisfechas, el segundo conjunto
puede ser expresado como
Gues = q H Md M 1 q Hd + J2 Md1 p
Ahora bien, esta claro que si G es invertible, es decir, si el sistema es completamente
actuado, entonces podemos resolver de forma u
nica para la se
nal de control ues dado
7

Es decir, que para cualquier soluci


on (q(t), p(t)) del sistema en bucle cerrado perteneciente a alg
un
entorno abierto del equilibrio, la siguiente implicaci
on sea cierta.
G (q(t))p Hd (q(t), p(t)) 0, t 0 lim (q(t), p(t)) = (q , 0).
t

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

73

cualquier Hd y J2 . En el caso subactuado, G no es invertible sino solamente de rango


completo por columnas, y ues puede solo inuenciar a los terminos dentro del espacio
imagen de G. Esto lleva al siguiente juego de ecuaciones de restriccion el cual debe ser
satisfecho para cualquier eleccion de ues ,
G {q H Md M 1 q Hd + J2 Md1 p} = 0

(4.2.10)

donde G es un anulador por la izquierda de rango completo de G8 , es decir, G G = 0.


La ecuacion (4.2.10), con Hd dado por (4.2.3), es un conjunto de EDPs no lineales cuyas
incognitas son Md y Vd . Se tomara J2 como parametro libre, y p es una coordenada
independiente. Si se obtiene una solucion para esta EDP, la ley de control resultante ues
vendra dada por
ues = (G G)1 G (q H Md M 1 q Hd + J2 Md1 p)

(4.2.11)

Las EDPs (4.2.10) pueden separarse de forma natural en los terminos que dependen
en p y terminos que son independientes de p, es decir, aquellos que corresponden a las
energas cinetica y potencial, respectivamente. Por tanto, el sistema de ecuaciones de
(4.2.10) puede reescribirse como

G q (p M 1 p) Md M 1 q (p Md1 p) + 2J2 Md1 p = 0
(4.2.12)
G {q V Md M 1 q Vd } = 0

(4.2.13)

La primera ecuacion es una EDP no lineal que ha de resolverse para los elementos desconocidos de la matriz de inercia en bucle cerrado Md . Dado Md , la ecuacion (4.2.13)
es una simple EDP lineal cuya incognita es Vd , y por tanto la principal dicultad se
halla en la resolucion de (4.2.12). La ecuacion (4.2.12) puede expresarse en una forma mas explcita con las siguientes derivaciones. En primer lugar usemos el hecho de
que q (z  P (q)z) = [q (P (q)z)] z, para toda z IRn y cualquier matriz simetrica
P (q) IRnn , para escribir (4.2.12) como


G [q (M 1 p)] Md M 1 [q (Md1 p)] + 2J2 Md1 p = 0.
Entonces, aplicando la identidad
q (P (q)z) =

n


q (P(,k) )zk ,

k=1

valida para todo z IRn y todo P IRnn , donde P(,k) denota la columna kesima de
la matriz P , reparametrizando J2 en terminos de las matrices Uk (q) = Uk (q) IRnn
como
n

2J2 =
Uk pk
(4.2.14)
k=1

e igualando los terminos pk se obtienen n EDPs, expresadas solo en terminos de la variable


independiente q, de la forma
!
"



1
1
1

1
G
q (Md )(,k) + Uk Md
q (M(,k) ) Md M
=0
(4.2.15)
8
Se entiende por anulador por la izquierda de una matriz A, otra matriz B cuyas las est
an en el espacio
n
ucleo de A. Dicho anulador es de rango completo si el espacio generado por las las de B coincide con
el n
ucleo de A.

74

4.2. Estabilizacion de sistemas mecanicos subactuados

donde Uk son las matrices elegidas por el dise


nador. La idea fundamental es elegir entonces
los parametros libres Uk que denen J2 de tal manera que (4.2.15) admita una solucion
con Md simetrica y denida positiva. A continuacion, la sustituiremos en (4.2.13), que es
una EDP lineal, y buscaremos una solucion Vd que satisfaga (4.2.4). El grado de libertad
adicional proporcionado por Uk es la principal caracterstica que distingue al metodo IDAPBC de los metodos lagrangianos que revisaremos en la siguiente seccion. De lo anterior
se desprenden los siguientes comentarios
Los desarrollos previos caracterizan una clase de sistemas subactuados para los
cuales el metodo dise
no IDA-PBC proporciona estabilizacion suave. La clase viene
dada en terminos de resolubilidad de la EDP no lineal (4.2.12), (o de la mas explcita
(4.2.15)), y la EDP lineal (4.2.13). Aunque es bien sabido que resolver EDPs es una
tarea en general difcil, tenemos la ventaja de que el grado de libertad a
nadido la
matriz de interconexion en bucle cerrado J2 (equivalentemente, Uk )simplica este
trabajo. Este punto se desarrollara con mas detalle en los ejemplos del captulo.
Hay dos casos particulares extremos en el procedimiento. En primer lugar, si no
modicamos la matriz de interconexion entonces recuperaremos el clasico procedimiento de moldeo de energa potencial de PBC. Ciertamente, si Md = M y J2 = 0,
entonces la ecuacion del controlador (4.2.11) se reduce a
ues = (G G)1 G (q V q Vd )
que es el conocido control de moldeo de energa potencial. En el extremo opuesto,
si no modicamos la energa potencial, sino solo la cinetica, entonces, como se
vera en el siguiente apartado, para una eleccion particular de J2 , es decir, (4.2.20),
se recupera el metodo de Lagrangianos Controlados de (Bloch et al. 2000). Por
otro lado si moldeamos tanto la energa cinetica como la potencial, pero jamos
J2 a (4.2.20), entonces IDA-PBC coincide con el metodo propuesto en (Auckly
et al. 2002, Hamberg 1999).

4.2.4 Comparacion entre los enfoques lagrangiano y hamiltoniano


El metodo IDA-PBC puede ser interpretado como un procedimiento para generar controladores de realimentacion del estado que transforman un sistema hamiltoniano controlado
por puertos (PCH) en otro sistema hamiltoniano PCH con ciertas propiedades de estabilidad deseadas, por ejemplo en el caso de sistemas mecanicos, transformar (4.2.1), (4.2.2)
en (4.2.3), (4.2.6) para una matriz de inercia denida positiva Md , una funcion de energa
potencial Vd que satisfaga (4.2.4), y una matriz antisimetrica arbitraria J2 . Visto desde
esta perspectiva, las ecuaciones diferenciales parciales del metodo IDA-PBC (ver captulo
4) constituyen en cierto modo las conocidas condiciones de ajuste (matching conditions)
introducidas en (Bloch et al. 2000) que aseguran que las soluciones (q(t), p(t)) de ambos
sistemas son las mismas). Un enfoque similar puede tomarse a partir de un perspectiva
lagrangiana. Es decir, partiendo de un sistema de EulerLagrange
d
q L(q, q)
q L(q, q)
= G(q)u
dt
donde L es el lagrangiano, denido como la diferencia entre las energas cinetica y potencial, se desea encontrar una realimentacion estatica del estado tal que el comportamiento

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

75

en bucle cerrado sea descrito por el sistema lagrangiano controlado


d
q Lc (q, q)
q Lc (q, q)
=0
dt

(4.2.16)

donde Lc es el lagrangiano deseado. Este problema ha sido estudiado con gran generalidad
en (Hamberg 1999), vease tambien (Blankenstein et al. 2001). Para el caso que nos
interesa, restringido a Lagrangianos de la forma
1
L = q M (q)q V (q),
2

1
Lc = q Mc (q)q Vc (q),
2

(4.2.17)

se ha mostrado en (Auckly et al. 2002, Hamberg 1999) que el conjunto de Lagrangianos


Lc alcanzables en bucle cerrado se caracteriza por la resolubilidad de las EDPs9
!
"

1

1

1

[q (M q)
G
M Mc q (Mc q)]
q q (q M q)
M Mc q (q Mc q)

= 0(4.2.18)
2
G {q V M Mc1 q Vc } = 0(4.2.19)
lo cual, de forma similar a (4.2.12), (4.2.13) del IDA-PBC, ajustan los terminos de energa
cinetica y potencial10 . Recordando que p = M q y deniendo una matriz


Mc (q) = M Md1 M,
la cual es, claramente simetrica y denida positiva, vemos que (4.2.19) coincide exactamente con (4.2.13)haciendo Vc = Vd . Mas a
un, la ecuacion (4.2.12) se reduce a (4.2.18)
si y solo si

(4.2.20)
J2 (q, p) = Md M 1 [q (M Md1 p)] q (M Md1 p) M 1 Md
Aunque la expresion de arriba puede ser comprobada mediante sustitucion directa, una
prueba mas elegante aparece en (Blankenstein et al. 2001) comprobando que la parte conservadora de energa del sistema PCH (4.2.3), (4.2.6) es equivalente al sistema mecanico
EL
 



0 In
q H c
q
=
pc
In 0
pc H c
1
donde pc = Mc q and Hc (q, pc ) = 12 p
c Mc (q)pc + Vc (q). Una forma alternativa para J2
puede obtenerse como


(J2 )(i,j) = p Md1 M (M 1 Md )(,i) , (M 1 Md )(,j)

siendo [, ] los corchetes de Lie y ()(i,j) representa el termino (i, j) de una matriz.
Tambien se ha mostrado en (Blankenstein et al. 2001) que podemos a
nadir a (4.2.20)
1

1
una matriz antisimetrica de la forma Md M {[q Q(q)] q Q(q)}M Md , siendo Q
9

En las referencias citadas (4.2.18) se expresan usando los smbolos de Christoel de segunda especie,
lo cual lleva a una notaci
on mas elegante y compacta. Para evitar notaciones adicionales se usar
a
preferentemente la forma expresada hasta ahora.
10
En (Ortega et al. 1995), vease tambien (Ortega, Van der Schaft, Maschke & Escobar 2002), se
desarrollan las condiciones de ajuste expresadas en terminos de restricciones algebraicaspara moldeo
de energa potencial de sistemas EL en bucle cerrado con controladores EL din
amicos.

76

4.3. El pendulo de disco inercial

una funcion arbitraria de q, a


un preservando la estructura EL en bucle cerrado (4.2.16).
Esto corresponde al lagrangiano en bucle cerrado

1
Lc = q Mc q + q Q Vc
2
que incluye los terminos giroscopicos q Q, que resultan ser intrnsecoso dicho manera
sencilla, que no pueden ser eliminados mediante un cambio de coordenadas. En otras
palabras IDA-PBC general naturalmente una clase mas rica de sistemas EL ajustables
de la forma (4.2.16), los cuales no han sido considerados en la literatura del enfoque
lagrangiano.
Recientemente (Chang et al. 2002) han mostrado que un peque
no ajuste en el metodo
de los Lagrangianos Controlados da lugar a un metodo que es completamente equivalente
al IDA-PBC descrito en el captulo 4. Esencialmente, en lugar de restringir los sistemas
a la forma (4.2.16), tambien permiten incluir fuerzas externas en el sistema de Euler
Lagrange en bucle cerrado (por esto se entiende que el segundo miembro de (4.2.16) no
sea necesariamente igual a cero, sino cualquier fuerza externa). De este modo, es posible
escribir cualquier sistema mecanico hamiltoniano en un formato Euler-Lagrange incluyendo la parte no integrable del sistema hamiltoniano como un fuerza externa (giroscopica)
del sistema de Euler-Lagrange. Notese que este metodo solo funciona para la clase de
sistemas mecanicos simples, como los que se presentaran en este captulo. Considerando
esta clase mas amplia de sistemas EulerLagrange en bucle cerrado (Chang et al. 2002)
establece que el metodo de Lagrangianos Controlados es equivalente al metodo IDA-PBC.

4.3 El pendulo de disco inercial


En esta seccion aplicaremos la metodologa de dise
no precedente al problema de estabilizacion de la posicion invertida del pendulo de disco inercial mostrado en la gura 4.1.
Este sistema, que ha sido denido recientemente en (Spong et al. 2001), consiste en un
pendulo fsico con un rotor equilibrado situado el extremo. El par motor produce una
aceleracion angular de la masa del extremo lo cual genera un par de acoplamiento en el eje
del pendulo. Mostraremos el IDA-PBC proporciona una respuesta armativa a la cuestion
de la existencia de una ley de control continua que, para todas las condiciones iniciales
excepto un conjunto de medida cero, levanta el pendulo desde su posicion naturalmente
estable abajo, y lo estabiliza en la posicion vertical superior11 . Tambien mostramos que,
como es usual en PBC (Ortega, Van der Schaft, Maschke & Escobar 2002), la propiedad
de pasividad nos permite reemplazar la ley de realimentacion de estado por una realimentacion dinamica de la salida que no requiere la medida de velocidades.

11
Esto signica que la cuenca de atracci
on de nuestro controlador es un conjunto abierto denso en el
espacio de estados, lo cual es lo mejor que se puede esperar al usar una realimentacion continua (Shiriaev
& et al. 2000).

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

77

2
u

Figura 4.1: Pendulo de disco inercial.

4.3.1 Modelo
Las ecuaciones dinamicas del dispositivo pueden ser escritas de una forma estandar usando
la formulacion EL (Spong & Vidyasagar 1989) como
  

 

0
1
mgLsen1
I 1 + I2 I2
=
u
+
2
I2
I2
0
1
donde 1 , 2 y I1 , I2 son los angulos respectivos y momentos de inercia de pendulo y disco,
m es la masa del pendulo, L es su longitud, g es la constante de gravedad, y u es el par
de control de entrada actuando entre el disco y el pendulo. El cambio de coordenadas
 


1
q1
=
q2
1 + 2
lleva a la descripcion simplicada


 
 

I1 0
q1
m3 senq1
1
+
=
u
q2
0
1
0 I2

(4.3.1)

donde m3 = mgL. El sistema puede ser escrito en forma hamiltoniana (4.2.2) con p =
[I1 q1 , I2 q2 ] , la funcion de energa total (4.2.1) y




1
I1 0
,
G=
,
V (q1 ) = m3 (cos q1 1)
M=
1
0 I2
El equilibrio a estabilizar es la posicion vertical con el disco inercial alineado, lo cual se
corresponde con q1 = q2 = 012 .
Comentario 4.3.1. El modelo del pendulo inercial de disco puede verse de dos maneras:
como un sistema denido en IR4 , o tomando q1 modulo 2, over S IR3 , siendo S el
crculo unidad. Para permitir leyes de realimentacion que no sean necesariamente 2
no del controlador. Sin embargo para
periodicas en q1 adoptaremos la primera para el dise
determinar el dominio de atraccion observaremos el sistema en el cilindro.
2
12
al ser simetrica la distribuci
on de masas del disco inercial, puede argumentarse que no hay raz
on
particular para alinearlo. A pesar de ello impondremos este objetivo para ilustrar la generalidad del
enfoque.

78

4.3. El pendulo de disco inercial

4.3.2 Diseno del controlador


Se dise
nara el controlador IDA-PBC en tres pasos. En primer lugar se obtendra una
realimentacion del estado que moldeara la energa en bucle cerrado funcion de energa
para estabilizar globalmente la posicion vertical superior, y a continuacion se inyectara el
amortiguamiento necesario para lograr estabilidad asintotica mediante la realimentacion
negativa de la salida pasiva. Finalmente, se mostrara que es posible reemplazar la realimentacion de la velocidad por su derivada sucia, manteniendose el resultado de estabilidad asintotica.

A. Moldeo de energa
Observese, en primer lugar, que los elementos de la matriz de inercia M no dependen de
q (sistema plano, del ingles at), y por tanto podemos hacer J2 = 0 y elegir Md como una
matriz constante, cuyos elementos seran:


a 1 a2
(4.3.2)
Md =
a2 a3
a1 > 0, a1 a3 > a22

(4.3.3)

Las desigualdad que se imponen a estos coecientes tienen como nalidad asegurar que
la matriz Md es globalmente denida positiva. La u
nica EDP que habra que resolver, por
tanto, es la de la energa potencial, que viene dada por la ecuacion (4.2.13), es decir


a1 + a2
I1

Vd
+
q1

a2 + a3
I2

Vd
= m3 senq1
q2

Esta es una EDP lineal trivial cuya solucion general es de la forma


I1 m 3
cos(q1 ) + (z(q))
a1 + a2
z(q) = q2 + 2 q1

Vd (q) =

(4.3.4)
(4.3.5)

donde es una funcion diferenciable arbitraria que debemos escoger para satisfacer la

condicion (4.2.4) para q = 0. Asimismo se ha denido la constante 2 = I1 (a2 +
a3 )/(I2 (a1 + a2 )). Tras algunos calculos sencillos se prueba que la condicion necesaria de
estabilidad q Vd (0) = 0 se satisface si y solo si (z(0)) = 0, mientras que la condicion
suciente de mnimo (suponiendo que es cierta la anterior) 2q Vd (0) > 0 se cumplira si la
matriz hessiana de en el origen es denida positiva, y
a2 < a1
La positividad del hessiano se satisface con la eleccion13 (z) =
representa una ganancia ajustable.

(4.3.6)
k1 2
z ,
2

donde k1 > 0

13
Para simplicidad hemos tomado una funci
on cuadr
atica de . Claramente otras opciones, que pueden
ser seleccionadas para mejorar el rendimiento transitorio, son posibles; por ejemplo una funci
on de saturacion.

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

79

El termino de moldeo de energa de la entrada de control (4.2.11) viene dado por


ues = (G G)1 G (q V Md M 1 q Vd )





a2 a3 Vd
a1 a2 Vd
1
+
+ m3 senq1
=
2
I1
q1
I2
q2
= 1 senq1 + kp (q2 + 2 q1 )

(4.3.7)

donde hemos denido


a2
m3
1 =
a1 + a2


kp = k1

a1 a3 a22
I2 (a1 + a2 )

Recuerdese que a1 , a2 , a3 debera satisfacer las desigualdades (4.3.3) y (4.3.6). Algunos


calculos simples muestran que estas condiciones se traducen en
1 > m 3

2 >

I1 1
I2 1 m 3

(4.3.8)

lo cual, unido a kp > 0, dene la regi


on admisible para el ajuste de las ganancias (gura
4.2).
8
7
6
5
Regin permitida
para 1 y 2

3
2

I1
2=

I2

1
0
1

=m
1

2
3
2

10

Figura 4.2: Region admisible para el ajuste de las constantes 1 y 2 .

B. Inyeccion de amortiguamiento y analisis de estabilidad


La ley de control u = ues + udi produce el sistema

 

  
q H d
0
q
0
M 1 Md
+
udi
=
Md M 1
0
p H d
G
p
para el cual tenemos H d = p Hd  Gudi . Claramente, sin inyeccion de amortiguamiento el
origen es un equilibrio estable. Para lograr que este equilibrio sea asintoticamente estable

80

4.3. El pendulo de disco inercial

proponemos a
nadir amortiguamiento realimentando la nueva salida pasiva p Hd  G, la
cual puede ser calculada como
1
[(a2 + a3 )p1 + (a1 + a2 )p2 ]
a1 a3 a22
= k2 (q2 + 2 q1 )

G p H d =

(4.3.9)

2)
donde hemos denido k2 = Ia21(aa13+a
> 0, con positividad derivada de (4.3.3) y (4.3.6).
a2
2

Estamos en posicion de presentar el primer resultado de estabilizacion, que establece


que para toda condicion inicial excepto un conjunto de medida ceroel IDA-PBC lleva
el pendulo a su posicion vertical superior con el disco alineado.
Proposici
on 4.3.1. El pendulo de disco inercial (4.3.1) en bucle cerrado con la realimentaci
on estatica del estado IDA-PBC
u = 1 sen(q1 ) + kp (q2 + 2 q1 ) kv (q2 + 2 q1 )

(4.3.10)

donde 1 , 2 satisfacen (4.3.8), kp > 0 es una ganancia proporcional, y kv > 0 es una


ganancia de inyecci
on de amortiguamiento, tiene un equilibrio asint
oticamente estable en
cero, siendo el dominio de atracci
on el completo espacio de estados menos un conjunto de
medida cero Lebesgue.
Demostraci
on. Primero observaremos que el sistema en bucle cerrado tiene los equilibrios
q ) = 0. Recuerdese de
(
q , 0), donde q = (j, k), j, k IN , son las soluciones de q Vd (
la gura 4.1 que los puntos q1 con k par corresponden a la posicion deseada vertical,
mientras aquiellos con k impar corresponden al pendulo colgando
De la Proposicion 1 y los anteriores desarrollos sabemos que los equilibrios correspondientes a la posicion vertical superior son estables. Mas a
un, con alg
un control
basico de las se
nales, es posible mostrar queen una vecindad del cerolas trayectorias del sistema en bucle cerrado satisfacen las condicion (fuerte) de observabilidad:
H d 0 (q(t), p(t)) 0. Por tanto, la Proposicion 1 asegura que el equilibrio deseado es
asintoticamente estable. Aunque la Proposicion 1 proporciona tambien una estimacion de
su dominio de atraccion, se mostrara mas adelante que la estabilidad asintotica es casi
globalen el sentido de la Proposicion 2.
A este n, haremos la importante observacion de que la introduccion en el control
(4.3.10) de una funcion no periodica de q1 obliga a considerar el sistema en IR4 en lugar
de en S IR3 , y entonces Hd no sera una funcion propia de (q, p) y no se podra asegurar
el acotamiento de trayectorias (empezando fuera de c.) Sin embargo, en las coordenadas
(q1 , q2 , p1 , p2 ), con q2 = q2 + 2 q1 , el sistema en bucle cerrado esta en realidad denido en
S IR3 , y la funcion de energa
d (q1 , q2 , p1 , p2 ) = 1 p M 1 p + I1 m3 [cos(q1 ) 1] + k1 q22
H
d
2
a1 + a2
2
es denida positiva y por tanto propia an lo largo de S IR3 . Entonces, dado que
d = kv k2 q22 0, se tiene que todas las soluciones estan acotadas en S IR3 . Del
H
analisis previo sabemos que el equilibrio en cero es asintoticamente estable. Mostraremos
ahora que los otros equilibrios son inestables. De hecho, la linealizacion del sistema en
bucle cerrado en estos equilibrios tiene autovalores con parte real estrictamente positiva

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

81

y al menos un autovalor con parte real estrictamente negativa. Asociado al u


ltimo hay
una variedad estable, y las trayectorias que comienzan en el convergeran en la posicion
de abajo. Sin embargo, como es bien sabido una variedad invariante sdimensional de
un sistema ndimensional tiene medida cero Lebesgue si s < n; vease, a este respecto,
(Krstic, Sepulchre & Praly 1995). Consecuentemente el conjunto condiciones iniciales que
convergen al equilibrio indeseable tiene medida cero.
Para completar la prueba estableceremos ahora que las trayectorias tambien estan
acotadas en IR4 . Hemos visto que los desarrollos previos demuestran que, en S IR3 , todas
las trayectorias estan acotadas y tienden a uno de los equilibrios (0, 0, 0, 0) o (, 0, 0, 0).
El primer equilibrio es asintoticamente estable y el segundo es hiperbolico. Ademas se
ha mostrado que casi cualquier solucion converge al equilibrio estable, siendo atrapado
en tiempo nito en un entorno sucientemente peque
no del mismo, llamese N0 . Si ahora
sumergimos el cilindro en el espacio Eucldeo IR4 , y consideramos los conjuntos de IR4
los cuales corresponden a N0 sobre el cilindro. Si N0 se escoge sucientemente peque
no,
4
entonces estos conjuntos en IR no se intersectan. Como las soluciones en el cilindro no
abandonan N0 la inmersion de las trayectorias no abandonara el entorno correspondiente
en IR4 . Esto completa la prueba.
2
C. Realimentacion de la salida
Es bien conocido en dise
nos basados en pasividad que a veces es posible obviar la medida
de la velocidad realimentando en su lugar la derivada sucia de las posiciones (Kelly 1993).
Esta caracterstica proviene del hecho de que para la interconexion de mapas pasivos
podemos reemplazar una realimentacion constante por otra realimentacion a traves de
cualquier funcion de transferencia real positiva preservando la estabilidad. En particular,
para implementar la inyeccion de amortiguamiento podemos usar la realimentacion
udi =

kv D
(q2 + 2 q1 ),
D + 1

siendo D = dtd , y kv , > 0 algunos parametros del ltro. La idea relevante es que udi es
implementable sin realimentacion de la velocidad. Esta consideracion nos lleva a nuestro
resultado nal contenido en la proposicion abajo. La prueba resulta a lo largo de las
lneas en la siguiente proposicion.
Proposici
on 4.3.2. Considerese el pendulo de disco inercial (4.3.1) en bucle cerrado con
la realimentaci
on dinamica de la salida IDA-PBC
u = 1 sen(q1 ) + kp (q2 + 2 q1 ) + udi
donde 1 , 2 satisfacen (4.3.8), kp > 0 es una ganancia proporcional; udi es un termino
de inyecci
on de amortiguamiento generado a partir de la derivada sucia de las posiciones
como
kv
1
= + 2 (q2 + 2 q1 )

kv
udi = (q2 + 2 q1 )

(4.3.11)

con , kv > 0. Entonces, para toda condicion inicial excepto un conjunto de medida
ceroel pendulo converge hacia su posici
on vertical superior con todas las se
nales internas
acotadas uniformemente.

82

4.3. El pendulo de disco inercial

Demostraci
on. En primer lugar, notese que de (4.3.9) y (4.3.11) se obtiene
1
kv 
G p H d
u di = udi

k2


Consecuentemente, si denimos la nueva funcion de energa W (q, p, udi ) = Hd +


podemos escribir el sistema en bucle cerrado en forma PCH como

 

0
0
M 1 Md
q
q W

M M 1
kv
p W
G
0
d
p =

2



kv
kv

u di
udi W
k2 2
0 k2 G

k2 2
u ,
2kv di

= k2 (udi )2 . La prueba se completa procediendo como en la Proposicion


Tenemos W
kv
2@@@.
2

4.3.3 Resultados de simulacion


Se ha simulado la respuesta del pendulo de disco inercial usando los parametros I1 =
0.1, I2 = 0.2, m3 = 10 y el controlador completo de realimentacion de estado con ganancias
de ajuste 1 = 30, 2 = 0.2. Las siguientes gracas muestran la respuesta del sistema
comenzando en reposo con conguracion inicial q(0) = (3, 0). Por tanto el pendulo cuelga
casi en posicion vertical inferior.
Con el n de ilustrar la inuencia de la eleccion de kp y kv en el comportamiento
transitorio, se han mostrado juntos varias gracas de q1 (t) y q2 (t), primero cambiando
solamente kp dejando kv constante en un valor de 10 como se muestra en la gura 4.3.
Una simple observacion muestra que valores mayores de kp ralentizan la convergencia
hacia el equilibrio. Si dejamos kp constante y cambiamos kv de 10 a 100, se obtienen las
gracas de gura 4.4. Estas gracas muestran que, contra toda intuicion pero de forma no
totalmente inesperada, las oscilaciones se aten
uan mas rapidamente para valores menores
de kv ! Finalmente, la gura 4.5 muestra el par de control aplicado cuando kp = 0.1 y
kv = 10.
3

Kp=1
1.5

Kp=1

Kp=0.1

0.5

q2 (rad)

q1 (rad)

Kp=0.1

1
0.5

2
1

1.5

10

15

20

25

tiempo (segundos)

30

35

40

10

20

30

40

50

60

tiempo (segundos)

Figura 4.3: Evoluci


on de q1 (t) (izquierda) and q2 (t) (derecha) para valores diferentes de kp ,
dejando kv = 10.

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

2.5

83

Kv=100

1.5

Kv=10
Kv=100

q2 (rad)

q1 (rad)

0.5

Kv=10
2

0
0.5

Kv=50

Kv=50
1.5

3
0

10

12

14

16

18

20

10

15

20

25

30

tiempo (segundos)

tiempo (segundos)

Figura 4.4: Evoluci


on de q1 (t) (izquierda) y q2 (t) (derecha) para valores diferentes de kv , y
kp = 0.1.
15

Control Torque (Nm)

10

10

15

10

15

20

25

tiempo (segundos)

Figura 4.5: Se
nal de control para kv = 10, y kp = 0.1.

4.4 El sistema de la bola en la viga


En esta seccion se dise
nara un controlador IDA-PBC para el conocido sistema de la bola
en la viga mostrado en la gura 4.6. En primer lugar, se demostrara que para toda
condicion inicial (excepto un conjunto de medida cero) el controlador IDA-PBC llevara la
viga a la orientacion correcta. A continuacion deniremos un dominio de atraccion para
el equilibrio en el origen que garantiza que la bola se mantiene dentro de los lmites fsicos
de la viga.

4.4.1 Modelo
Este sistema es un clasico que ocupa un lugar en los laboratorios de control de las universidades de todo el mundo. Existen conguraciones alternativas y las ligeras variaciones
en la construccion pueden dar lugar modelos con estructuras muy diferentes.
En general, para el modelado se desprecia la inercia rotacional de la bola. Este hecho es
a
un mas razonable cuando en lugar de la bola tenemos un peque
no carro sobre railes como
el construido recientemente en la universidad de Linz (gura 4.7). Esta conguracion tiene

84

4.4. El sistema de la bola en la viga

q1
q2

Figura 4.6: Sistema de la bola en la viga.

Figura 4.7: Sistema de la bola en la viga. Universidad de Linz, Austria.

una caracterstica peculiar, consistente en que la lnea de avance del carro no intersecta con
el eje de giro de la viga o rail. El carro esta levemente desplazado hacia arriba. La principal
consecuencia de este desplazamiento es que en el modelo aparecen elementos no diagonales
en la matriz de inercia en bucle abierto, a diferencia del modelo que emplearemos en
nuestro desarrollo. En cualquier caso, este u
ltimo sirve como aproximacion bona de y
sera descrito a continuacion.
El modelo que emplearemos, el mas aludido en la literatura, fue presentado por Hauser
et al. (Hauser, Sastry & Kokotovic 1992), donde se proponen las siguientes ecuaciones de
EulerLagrange



Jb
+ m q1 + mgsen mq1 2 = 0
2
R

 2
mq1 + J + Jb + 2mq1 q1 + mgq1 cos =

(4.4.1)

donde q1 , q2 son la posicion de la bola y el angulo de la viga, respectivamente. Las constantes J y Jb representan los momentos de inercia de la viga y la bola, respectivamente,
mientras que m es la masa de la bola, R su radio y g la aceleracion de la gravedad de
valor 9.8m/s. Finalmente, es el par de control aplicado a la viga.
Para traer al primer plano los parametros relevantes de nuestro desarrollo, haremos
unas leves modicaciones. Si se desprecia la inercia rotacional de la bola frente a la de

la viga, dividimos ambas ecuaciones entre la masa de la bola m, y denimos u = /m

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

85

tendremos

q12 +

J
m

q1 + gsen q1 2 = 0

+ 2q1 q1 + grq1 cos = u

(4.4.2)

ahora bien, dado que el momento de inercia de un barra de longitud L y masa M es


M L2 /12, tendremos J/m = M L2 /(12m). Si el sistema se construyera tal que la masa de
la barra sea exactamente 12 veces la de la bola14 , una medida razonable, la constante L
aparecera de forma aislada en las ecuaciones EulerLagrange15 , hecho que se explotara en
el resto del desarrollo para asegurar que la bola permanece dentro de la viga.
q1 + gsen(q2 ) q1 q22 = 0
(L2 + q12 )
q2 + 2q1 q1 q2 + gq1 cos(q2 ) = u

(4.4.3)

donde L es la longitud de la viga. Como estamos interesados en que las trayectorias de la


bola no superen esta longitud, hemos incluido explcitamente L en el modelo. El modelo
hamiltoniano (4.2.1), (4.2.2) se obtiene deniendo las matrices

M (q1 ) =

1
0
2
0 L + q12


, G=

0
1

y la funcion de energa potencial V (q) = gq1 sen(q2 ). El objetivo del control es estabilizar
la bola y la viga en su posicion de reposo con q1 = q2 = 0.

4.4.2 Diseno del controlador


Por razones pedagogicas, se separara el dise
no del IDA-PBC en moldeo de energa cinetica,
moldeo de energa potencial, estabilidad asintotica por inyeccion de amortiguamiento, y
analisis del transitorio.

A. Moldeo de energa cinetica


Notese en primer lugar que M es funcion exclusivamente de q1 , y por tanto lo razonable
es proponer Md de la forma (4.3.2), siendo los coecientes a1 , a2 , a3 funciones (a denir)
tambien de q1 . Deniremos la matriz

J2 (q, p) =
14
15

0
j(q, p)
j(q, p)
0

No es imprescindible para el desarrollo, es conveniente para la claridad de la exposici


on.
De nuevo, el modelo puede verse tanto como un sistema denido en IR4 como en IR S IR2 .

86

4.4. El sistema de la bola en la viga

con la funcion j tambien a denir. La ecuacion de moldeo de la energa cinetica, tras


desarrollar sus componentes, toma la forma
2

ja2 (q1 )p1


2 q1
2 (L2p+q
+ 2 ja1 (q1 )p2
2 )2 2

1



0=
p1 a3 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )2 a2 (q1 ) dqd a2 (q1 )
p1 dqd a3 (q1 )
1
1
1
1
a1 (q1 )

2



p2 a2 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )2 a2 (q1 ) dqd a2 (q1 )
p2 dqd a2 (q1 )
1
1
1
1
p1 +

2




p1 a2 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )2 a2 (q1 ) dqd a2 (q1 )
p1 d a2 (q1 )
1
1
1
dq1
+
2




p2 a1 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )2 a2 (q1 ) dqd a2 (q1 )
p2 dqd a1 (q1 )
1
1
1
1
p2
+

Para enfrentarnos a la complejidad de estas ecuaciones, realizaremos una transformacion


motivada por la siguiente descomposicion matricial
q1 Md1 = Md1 (q1 Md )Md1
en la ecuacion original de moldeo de energa cinetica (4.2.12). Tras una serie de manipulaciones que seran estudiadas con la maxima generalidad en el captulo 5, y basandose en lo
publicado en (Gomez-Estern, Ortega, Rubio & Aracil 2001), las ecuaciones diferenciales
parciales del metodo IDA-PBC, se transforman en un sistema de ecuaciones diferenciales
ordinarias en los elementos de Md .
2q1
a22
d
a1 (q1 ) =
dq1
(L2 + q12 )2 a1
2q1
d
a2 a3
a2 (q1 ) =
dq1
(L2 + q12 )2 a1
que ha de ser resuelto para a1 , a2 , de modo que observaremos a3 como un parametro
libre. Para obtener dos ecuaciones con dos incognitas, jaremos a3 = a2 a1 . Por tanto
podremos facilmente obtener soluciones explcitas del sistema de ecuaciones como
#
a1 = 2( + q12 ),
a2 = L2 + q12
(4.4.4)
siendo una constante de integracion libre que ha de ser escogida para asegurar que Md
sea denida positiva. Es evidente que a1 > 0 para todo > 0, y el determinante de Md
resulta



a3 a1 a22 = L2 + q12 q12 + 2 L2
2

que es globalmente denido positivo, como se deseaba, para todo > L2 . Por simplicidad,
se tomara = L2 en adelante. La matriz Md resultante es entonces


1
2(L2 + q12 )1/2

(4.4.5)
Md = (L2 + q12 )
$
2
2
2(L + q1 )
1
El moldeo de energa cinetica es completado evaluando j en (4.2.12) y la Md calculada
arriba



j = q1 p1 2(L2 + q12 )1/2 p2


(4.4.6)

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

87

B. Moldeo de energa potencial


Una vez determinadas la matrices de inercia e interconexion deseadas se procedera a
denir la energa potencial en bucle cerrado de la solucion de (4.2.13), que en este caso se
expresa del siguiente modo
a1 (q1 )

Vd
a2 (q1 ) Vd
(q) + 2
(q) = gsen(q2 )
q1
L + q12 q2

(4.4.7)

Substituyendo las soluciones obtenidas para a1 y a2 en (4.4.4) se obtiene


#
Vd Vd
2(L2 + q12 )
+
= gsen(q2 )
q1
q2
Se resolvera esta EDP empleando el programa de calculo simbolico Maple. Para ayudar
a Maple a encontrar una solucion adecuada introduciremos el cambio de coordenadas
x1 = L1 q1 , x2 = q2 , y la EDP puede ser entonces reescrita como sigue
#
Vd
Vd
a 1 + x21
(x) + b
(x) = sen(x2 )
x1
x2


donde hemos denido a =

2L
g

and b = g1 . Los comandos de Maple requeridos son

>equ:=a*diff(Vd(x1,x2),x1)*sqrt(1+x1\^2)+b*diff(Vd(x1,x2),x2)=sin(x2);
>sol:=pdsolve(equ);
lo cual produce (tras deshacer el cambio de variables) el siguiente resultado16
Vd (q) = g cos(q2 ) + (z(q))
q 
1

1
z(q) = q2 arcsenh
L
2
En esta ecuacion, una funcion arbitraria diferenciable de z. Esta funcion debe ser
escogida para asegurar la asignacion del punto de equilibrio, es decir, para satisfacer
(4.2.4) con q = 0. A este n, evaluaremos el gradiente


12 2 z (z(q))
2(L +q1 )
q Vd (q) =
gsen(q2 ) + z (z(q))
Evidentemente, una condicion necesaria para asignar el equilibrio en cero es z (z(0)) =
0. Cabe comentar que, independientemente de la eleccion de , (o la constante de integracion ), el bucle cerrado tiene otros puntos de equilibrio. Ciertamente, al ser z(0) = 0
q ) = 0 tiene
y senh() una funcion monotona creciente de primer ytercer cuadrante, q Vd (
un n
umero contable de races dados por q = (Lsenh( 2i), i), con i IN . Por otro lado,
se tiene que solo el equilibrio donde, |
q1 | L es el equilibrio en cero. Por supuesto, esta
propiedad es signicativa a efectos practicos solo si somos capaces de mostrar que en las
trayectorias se cumple |q1 (t)| L para todo t 0, tarea que se emprendera mas adelante.
Es importante recordar que, los equilibrios q2 = i con i par corresponden a la viga
en su orientacion original, mientras que para i impar la viga aparece rotada 180 . Se
16

Independientemente de la forma de obtener la soluci


on, su validez se puede vericar por sustituci
on.

88

4.4. El sistema de la bola en la viga

demostrara a continuacion que, para una eleccion adecuada de , podremos hacer los
primeros equilibrios estables y los u
ltimos inestables.
Para estudiar la estabilidad de los equilibrios comprobaremos la positividad del Hessiano de Vd , evaluado en q, que toma la forma

1
2
q ))
12 2 2z (z(
q ))
2 ) z (z(
2 +
2(L
q
2(L +
q1 )
1

q) =
2q Vd (
1
2
2 2 z (z(
q )) g cos(
q2 ) + 2z (z(
q ))
2(L +
q1 )

4
3

8
2
6
1
4

1
2

0
0.6

0.4

3
0.2

0.2

0.4

4
0.6

Figura 4.8: Energa potencial Vd en bucle cerrado.

Teniendo en cuenta que cos(


q2 ) = 1, dependiendo de si la viga esta en su posicion original o rotada 180 , el determinante de esta matriz es 2(L2g+q2 ) 2 (z(
q )), y la
1
2
q )).
estabilidad (inestabilidad) del equilibrio queda determinada por el signo de (z(
kp 2
Elegiremos entonces (z) = 2 z , con kp > 0. De este modo, los equilibrios correspondientes a la orientacion original de la barra seran estables, mientras que aquellos con la
barra rotada son inestables. La nueva energa potencial (vease la gura 4.8), toma la
forma

 q 
2
kp
1
1
(4.4.8)
Vd = g[1 cos(q2 )] +
q2 arcsenh
2
L
2
donde hemos a
nadido una constante para trasladar el mnimo a cero. Observense las
lneas de nivel de la energa potencial en bucle cerrado en las guras 4.9 y 4.10. Al
compararlas se aprecia que las curvas de nivel de Vd sufren una especie de escalado en el
eje q1 al aumentar el valor de kp . Este hecho, utilizado concienzudamente, puede servir
para moldear los subconjuntos de nivel de la funcion de Lyapunov a n de mejorar el
comportamiento transitorio, como se vera mas adelante en este captulo.
C. Analisis de estabilidad asintotica
Para calcular la ley de control nal determinaremos en primer lugar el termino de moldeo
de energa ues a partir de (4.2.11), que en este caso toma la forma
ues = q2 H (Md M 1 )(2,1) q1 Hd (Md M 1 )(2,2) q2 Hd + (J2 Md1 )(2,1) p1 + (J2 Md1 )(2,2) p2

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

89

Figura 4.9: Curvas de nivel de Vd (q) alrededor del origen para kp = 0.05.

Figura 4.10: Curvas de nivel de Vd (q) alrededor del origen para kp = 0.01.

Reemplazando las funciones obtenidas para Md y j, y tras algunos calculos directos se


obtiene la expresion

 #

q1
1
2
2
p2 + (q)
ues =
(4.4.9)
L2 + q12 p1 + 2p1 p2 + $
2(L2 + q12 )
L2 + q12
donde
%

#
 q 
2 + q2
1
L
1
1
2
(q) = gq1 cos q2 g 2(L2 + q1 )senq2 kp
q2 arcsenh
2
L
2


La fase de dise
no del controlador se culmina con el termino de inyeccion de amortiguamiento (4.2.8), que resulta

&
'
kv
2
udi = 2
p2
p1
(4.4.11)
L + q12
L2 + q12
Es importante subrayar que, a pesar de su aparente complejidad, el controlador esta
denido globalmente y en su exponente maximo es cuadratico. Esta es una propiedad
muy importante para el control, ya que la saturacion debe ser evitada en aplicaciones
practicas, as como la complejidad del calculo. Ademas, el papel de los parametros de
ajuste admite un sencillo analisis: kp es un ganancia proporcional bona de en posicion,
ya que multiplica terminos que crecen linealmente en q, y kv inyecta amortiguamiento
a lo largo de una direccion especicada de las velocidades. El ajuste del controlador se
simplicara por esta caracterstica, tal y como se ilustra en el apartado de simulaciones.

90

4.4. El sistema de la bola en la viga

Daremos en este momento un primer resultado de estabilidad asintotica similar a aquel


obtenido para el pendulo de disco inercial, pero con la diferencia fundamental de que la
convergencia a cero de la bola solo es local. Un resultado mas practico, que toma en
consideracion la longitud nita de la viga, se desarrollara en el proximo apartado.
Proposici
on 4.4.1. Considerese el modelo de la bola en la viga (4.4.3) en bucle cerrado
con la realimentaci
on estatica del estado IDA-PBC u = ues + udi , con (4.4.9)(4.4.11),
y kp , kv > 0. Entonces, el origen es un equilibrio asint
oticamente estable con dominio de


atracci
on c donde c = {(q, p) IR4 | Hd (q, p) c}, donde Hd toma la forma (4.2.3),
Md viene dada por (4.4.5), y Vd y c denidas seg
un (4.4.8), (4.2.9), respectivamente.
Adicionalmente, para todas las condiciones iniciales, excepto un conjunto de medida cero,
la bola converger
a asintoticamente al origen con inclinaci
on nula cd la viga, es decir, para
casi todas las trayectorias se tiene que limt q2 (t) = 0.
Demostracion. La estabilidad del equilibrio en cero se desprende de vericar las condiciones de la Proposicion 4.2.1. Sin embargo, para establecer la estabilidad asintotica, en
lugar de comprobar la detectabilidad se invocara el teorema de Matrosov17 . Para ello se
tomara una funcion auxiliar W (q) = q1 + q2 cuya derivada a lo largo de las trayectorias
del sistema en bucle cerrado es
= p1 +
W
Ahora, H d = 0 si y solo si

1
p2
L2 + q12


p1 =

L2

2
p2
+ q12

vease (4.4.11), el cual (dado que el rango de q1 comprende (, )) dene un sector


triangular dentro del primer y tercer cuadrante del plano p1 p2 . Por otro lado, el sector
= 0 vive en el los cuadrantes dos y cuatro. Consecuentemente se obtiene que W

donde W

es una funcion no desvaneciente denida en el conjunto {(q, p)|Hd = 0}, y las condiciones
del teorema se satisfacen (en un entorno de cero) siendo Hd la funcion de Lyapunov
requerida.
De forma similar a la prueba de la Proposicion 4.3.1, para probar la propiedad de
cuasi convergencia establecida previamente observaremos al sistema en IR S IR2
para establecer el acotamiento de todas las trayectorias. Para sumergir el sistema en este
cilindro cambiaremos la primera coordenada por
q 
1
1
q1 = q2 arcsenh
(4.4.12)
L
2
y deniremos coherentemente la funcion de energa
 1 
d (
1 (
H
q1 , q2 , p) =
q1 , q2 )p + Vd (
q1 , q2 )
p M
d
2
kp

Vd (
q1 , q2 ) = g(1 cos q2 ) + q12
2

(4.4.13)
(4.4.14)

que es propia y denida positiva en IR S IR2 , y con derivada semidenida negativa.


Esto prueba la acotacion de todas trayectorias en IR S IR2 . El resto de la prueba
17

Vease, por ejemplo, el teorema 5.5 de (Rouche & Mawhin 1980).

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

91

es similar a la presentada para el pendulo de disco inercial, recordando que para todo
esquilibrio estable tendremos el comportamiento asintotico deseado en q2 , mientras que
los otros equilibrios son inestables.
2
Antes de cerrar este apartado cabe destacar que en este ejemplo no es posible reemplazar medidas de velocidades por las derivadas sucias de la posicion. Esto se debe a que en
el controlador de la bola en la viga, ademas del termino de inyeccion de amortiguamiento,
el termino de moldeo de energa depende explcitamente de p.
D. Comportamiento transitorio
Se ha establecido en la Proposicion 4.4.1 que en bucle cerrado el origen es un equilibrio
asintoticamente estable con la energa total como funcion de Lyapunov.
En este apartado se renara este analisis, estudiando el efecto del parametro de ajuste
no del dominio de atraccion, y cuanticando explcitamente un conjunto de
kp en el tama
condiciones iniciales tales que la bola permanece todo el tiempo dentro de los lmites de
la viga es decir, |q1 (t)| L para todo t 0.
En primer lugar, cabe destacar que a medida que Hd decrece y siempre que la energa
cinetica sea no negativa, tendremos que Vd (q(t)) Hd (q(0), p(0)), y por tanto los subconjuntos de nivel Vd (denidos por Vd c para cada constante c) son conjuntos invariantes
para q(t). Adicionalmente, si podemos demostrar que la energa cinetica esta acotada,
entonces los conjuntos acotados proporcionan una estimacion del dominio de atraccion.
Antes de continuar cabe puntualizar que en un campo potencial como el de Vd , debido a la existencia de funciones periodicas, algunos conjuntos de nivel denidos como
{x IRn |Vd (x) < c} pueden descomponerse en una serie innita discreta de componentes
conexas, desconectadas entre s. Si este es el caso, nos interesaremos por la componente
que contiene al origen, al ser este el equilibrio a estabilizar (vease la gura 4.11).

;;;
;;;
;;;
;;;
;;; ;;;
q1

Subconjunto conexo de Vd<c


conteniendo al origen

q2

Componentes del conjunto de nivel


Vd<c

Figura 4.11: Componentes desconectadas del conjunto de nivel Vd (x) < c.

Para estudiar estos conjuntos es conveniente trabajar en las nuevas coordenadas (


q1 , q2 , p1 , p2 ),
donde q1 se introdujo en (4.4.12)18 . En estas coordenadas la funcion de energa po18

Notese que el mapeo de coordenadas (q1 , q2 ) (


q1 , q2 ) dene un difeomorsmo global, y recuerdese

92

4.4. El sistema de la bola en la viga

tencial se convierte en (4.4.14)que tiene la misma expresion analtica que la funcion


de energa total del pendulo simpley los asociados subconjuntos de nivel, es decir,
q1 , q2 ) c}, toman la forma mostrada en la gura 4.12. En este apartado
{(
q1 , q2 ) | Vd (
estamos interesados en la particion conexa que contiene al origen, y que denotaremos por
c .
El siguiente lema basico sera instrumental en adelante.
Lema 4.4.2. El conjunto c est
a acotado si y solo si c < 2g.
Demostracion. El hecho de que todos los elementos q1 en c estan acotados para cualquier
c nita es obvio, al ser k2p q12 c g(1 cos q2 ). Por tanto nos concentraremos exclusivamente en la acotacion de q2 .
() Se tiene la siguiente implicacion
c
V (
q1 , q2 ) < c cos(q2 ) > 1 > 1
g
donde se ha usado la positividad de kp en la primera desigualdad y c < 2g para obtener la
segunda. Cabe destacar que la desigualdad estricta excluye un intervalo en torno a q2 =
y q2 = de c . Esto demuestra que c {(
q1 , q2 ) | q2 (, )}, y consecuentemente
q2 esta acotada.
() La necesidad se demostrara por contradiccion. Para ello, supondremos que c 2g.
Entonces esta claro que c {(
q1 , q2 ) | q1 = 0}, que es un conjunto no acotado, y
2
consecuentemente q2 es no acotada.

20

18

16

14

12
q1

10

2
10

20

30

40

50

60

70

q2

Figura 4.12: Curvas de nivel de V (


q1 , q2 ).

Nos encontramos en situacion de presentar el principal resultado de esta seccion. Para


simplicar la notacion usaremos ()o para designar el valor de las funciones en el instante
inicial t = 0.
Proposici
on 4.4.3. Considerese el modelo de la bola en la viga (4.4.3) en bucle cerrado
con la realimentaci
on estatica del estado IDA-PBC u = ues + udi , con (4.4.9)(4.4.11), y
kv > 0.
que la acotacion de los subconjuntos de nivel es invariante bajo la acci
on de difeomorsmos.

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

93

(i) Siempre es posible calcular una constante kpM > 0, funcion de las condiciones iniciales (q o , po ), tales que para todo kp kpM , el conjunto
1
{(q, p) | p Md1 (q)p + g(1 cos q2 ) < 2g}
2

(4.4.15)

es una estimaci
on del dominio de atracci
on del equilibrio en el origen. En particular,
todas las trayectorias que comiencen con velocidad cero y q2o (, ) converger
an
asintoticamente al origen.
(ii) Fijemos kp kpM y supongamos que |q1o | < L. Entonces,
!

 q  1 k g "
1  1
kp
1
1
p
<
(q, p) | p Md (q)p + g(1 cos q2 ) +
q2 arcsenh
2
2
L
8 2kp + g
2
(4.4.16)
es un dominio de atracci
on del equilibrio en cero, tal que todas las trayectorias
comenzando en este conjunto satisfacen |q1 (t)| < L para todo t 0.
Demostracion. Se ha mostrado previamente que los subconjuntos de nivel de Vd (q) son
conjuntos invariantes para q(t). Adicionalmente, el Lema 4.4.2 establece que la particion
conexa de los subconjuntos de nivel de Vd (q) que contenga el origen esta acotada si y solo
si c < 2g. Por tanto, haciendo c = Hdo en el Lema 4.4.2 se desprende que este conjunto
estara acotado si y solo si
1
kp
Hdo = (po ) Md1 (q o )po + g(1 cos(q2o )) + q12 < 2g
2
2
Claro esta que, si los dos primeros terminos son estrictamente menores que g, podremos
siempre encontrar una cota superior para kp tal que la desigualdad se mantenga. Para
completar la prueba del punto (i) de la proposicion cabe comentar que, para todas las
trayectorias comenzando en el conjunto (4.4.15), q(t) esta acotado. Por tanto, de (5.9.11),
concluimos que en este conjunto Md1 (q(t)) > I para cierta constante  > 019 . Esto, unido
al hecho de que 12 p (t)Md1 (q(t))p(t) < Hdo , establece que la correspondiente p(t) tambien
esta acotada y el conjunto (4.4.15) es una estimacion del dominio de atraccion.
La prueba de (ii) procede a continuacion. De (4.4.12) se tiene que
1
|q1 | L |q2 q1 | arcsenh(1)
2

(4.4.17)

donde hemos usado el hecho de que arcsenh() es impar y monotona. La region denida
por (4.4.17) aparece en la gura 4.13 junto a los dos conjuntos c . Nuestro problema es
entonces calcular el mayor valor de c tal que el conjunto c no intersecte las lneas q1 = q2
1 arcsenh(1). Para simplicar las expresiones usaremos la desigualdad 1 arcsenh(1) > 1 ,
2
2
2
y comprobaremos la interseccion con las lneas mas cercanas q1 = q2 12 en la banda
q2 [ 12 , 12 ]. A continuacion, substituiremos q1 = q2 + 12 en la ecuacion del contorno de
q2

c , y emplearemos la cota cos q2 < 1 42 , que es valida en la mencionada banda, para


obtener la primera de las siguientes desigualdades




kp
1
1
q22 kp
g(1 cos q2 ) +
q2 +
>g +
q2 +
>c
2
2
4
2
2
19

En estas circunstancias se dice que la matriz de inercia es uniformemente denida positiva.

94

4.4. El sistema de la bola en la viga

g
La segunda desigualdad se cumple para todo c < 18 2kkpp+g
y todo q2 en la banda. Esto
demuestra que el contorno de c no intersecta las lneas lmite dentro de la banda. Por
otra parte no pueden intersectar fuera del intervalo porque c > g(1 cos( 12 )) implica que
g
en c , |q2 | < 12 , y esta cota en c es menos estricta que c < 18 2kkpp+g
. Esto completa la
demostracion.

20

18

q1=q2+m

16

14

q =q m
1

V >c |q |<L
12

V <c |q |<L

q1

10

V c |q |<L
d 2

2
10

20

30

40

50

60

70

q2

Figura 4.13: Interpretaci


on gr
aca de |q1 | < L, con m =

1 arcsenh(1).
2

4.4.3 Metodo aproximado de la elipse exterior


Pese a haber determinado de forma exacta el maximo conjunto de nivel acotado de la
funcion de energa potencial en el sistema bola y viga controlado mediante IDA-PBC,
esta es una solucion afortunada que deriva de la similitud entre la funcion de energa
potencial tras el cambio de variable q1 q1 y la energa mecanica del pendulo simple.
Bajo la suposicion de que no siempre nos encontraremos en tales circunstancias, se
mostrara a continuacion un metodo alternativo que inicialmente sirvio para abordar el
mismo problema de la bola y la viga de manera aproximada y que presenta la ventaja
de admitir formas mas generales para la funcion Vd obtenida como solucion en el metodo
IDA-PBC. Se basa en una aproximacion de tercer orden del desarrollo en serie de Taylor
que permite determinar si una elipse contiene ntegramente a una determinada curva de
nivel de Vd , en cuyo caso se concluye que esta es cerrada.
Sea una trayectoria comienza en cierta posicion inicial (q, p) = (q(0), p(0)) con energa
inicial Hd (0) Hd (q(0), p(0)). Como se ha comentado previamente la ecuacion
Vd (t) Hd (0)
establece una cota superior para la energa potencial, y lo que nos proponemos es determinar si todos los subconjuntos de nivel de Vd por debajo de esa cota son conjuntos
cerrados y acotados. En caso armativo, tendremos que la energa inicial determina que

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

95

las trayectorias estan contenidas en curvas de nivel cerradas que permiten calcular cotas para las trayectorias. Evidentemente, Hd (0) depende de las condiciones iniciales del
sistema.
Al igual que se hizo en la secci
 on anterior, emplearemos un cambio de coordenadas
1
(z, q2 , p1 , p2 ), z = q2 2 arcsenh q1 , recordando que dicho cambio representa un difeo d (z, q2 , p1 , p2 ) = Hd (q, p)
morsmo global. La funcion de energa en las nuevas variables H
toma la forma
 T
1 p + V (z, q2 )
d =
p M
H
d
2
kp

V (z, q2 ) = g(1 cos q2 ) + z 2
2

(4.4.18)
(4.4.19)

d (z, q2 ) = Md (q1 , q2 ) ha sido tambien introducida para recalcar la


donde la matriz M
dependencia lineal de Md con 1 . Para encontrar una estimacion de la region de atraccion
con trayectorias acotadas emplearemos un hecho matematico elemental

q22
2 2
q2 ,
(4.4.20)
1 cos q2 >
4
3 3
Para demostrarlo solo hay que observar el termino indeterminado de cuarto orden en
forma diferencial (lagrangiana) del desarrollo en serie de Taylor de la funcion cos(x) en
torno a x = 0. Esto nos lleva al siguiente lema:

Lema 4.4.4. Sea c = {(z, q2 ) | V (z, q2 ) c}, para cierto valor c > 0, un subconjunto de nivel de la funcion V (z, q2 ) denida en (4.4.19). Sea 0c el mayor subconjunto conectado de c que incluya al origen (vease la gura 4.11) y defnase el conjunto

Sc = {(z, q2 ) | g
q 2 + k2p z 2 c} que esta delimitado por una elipse para cualesquiera
4 2
valores > 0, kp > 0.
2

Para todo c que satisfaga c < g 9 se tiene 0c Sc




2

}. Si c > g 9 , entonces z IR tal
Demostracion. Sea D = {(z, q2 ) | q2 2
, 2
3
3
q 2 + k2p z 2 = c, y por tanto Sc D.
que g
4 2
En virtud de (4.4.20) se tiene (z, q2 ) D, V (z, q2 ) >
(Sc D) = Sc

g 2
q
4 2

kp 2
z
2

(c D)

Pero al ser c D un conjunto conexo que contiene al origen, entonces c D = 0c D,


y probaremos que 0c D = 0c ( 0c D) por contradiccion:

i) c D = lo cual es imposible, ya que {0} c D
0c D
ii) c (R2 \D) = y (i) 0c Sc = (porque 0c es conexo)
donde 0c y Sc son las lneas de contorno de 0c y Sc respectivamente. Sin embargo estas
no intersectan dentro de D porque en este conjunto una solucion (
z , q1 ) de V (z, q2 ) = c
kp 2
g 2
no puede satisfacer la ecuacion 4 q2 + 2 z = c. Por tanto se deduce de (i) y (ii) que
0c D y necesariamente 0c Sc .
2

96

4.4. El sistema de la bola en la viga

Este lema demuestra la existencia de un subconjunto conexo de V (q2 , z) < c dentro


de Sc en torno al origen para un rango de valores de c. Este conjunto 0c es u
nico en el
intervalo q2 [, ], y en el siguiente lema se mostrara que, bajo ciertas condiciones,
contendra todas las trayectorias del sistema.
Lema 4.4.5. Sea (z0 , q20 , p0 ) el estado del sistema de la bola y la viga en el instante t = 0.

1 (z0 , q20 )p0 + g(1 cos q20 ). Entonces, (z0 , q20 , p0 ) {h < 2 },
Sea h(z0 , q20 , p0 ) = 12 pT0 M
d
9

kp

<

2
z02

2
9

h las trayectorias (z(t), q2 (t)) caen en 0c Sc , y p(t) L .

Demostraci
on. Partiendo del hecho de la disipatividad con respecto a Hd en bucle cerrado
hemos mostrado que todas las trayectorias estan connadas en el conjunto V (z, q2 ) <
Hd (0). Si ahora hacemos c = Hd (0) en el lema 4.4.4 se tiene que 0c = {(V (z, q2 ) <
kp 2
2
Hd (0)) D} esta acotado por la elipse
 Sc si Hd (0) = h + 2 z0 < g 9 lo cual es cierto
si y solo si h <

2
,
9

kp

<

2
z02

2
9

h .

Al ser 0c un subconjunto conexo completo de c = {


q |V (
q ) < c}, se trata de un invariante,
0
0
y por tanto (z(t), q2 (t)) c si (z0 , q2 , p0 ) c , lo cual es cierto para todas las condiciones
iniciales que cumplan q20 [, ] y tengan una energa menor que Hd (0).
Mas a
un, dado que (z(t), q2 (t)) L > 0 | < min (Md1 (z(t), q2 (t))) t. Entonces 12 pT Md1 p > ||p||2 y empleando el hecho de que Vd (t) 0 12 pT Md1 p < Hd (0)
2
se deduce que ||p||2 < Hd (0) para concluir que p L .
Este resultado caracteriza la region de atraccion del origen como una condicion sobre
la energa inicial Hd (0) y dene un rango valido para kp . Un caso interesante es el sistema
arrancando con velocidad nula, para que la pertenencia de (z0 , q20 , p0 ) al conjunto Sc se
reduzca a
2
cos(q2 ) > 1
0.01
(4.4.21)
9 

condicion que se satisface para todo q20 2 , 2 . Esto puede interpretarse como una
condicion suciente para la existencia de un par de valores kp , tal que en bucle cerrado el
estado inicial (z0 , q20 , 0, 0) se encuentra dentro del dominio de atraccion del origen. Notese
que esta condicion no depende de z y por tanto tampoco de q1 , pero la eleccion de kp s lo
hace. Notese tambien que para velocidades iniciales distintas de cero la energa cinetica
es un termino positivo a
nadido al segundo miembro de (4.4.21), y se convierte en una
condicion necesaria pero no suciente.
Otro hecho importante es que la construccion de curvas de nivel acotadas que satisfagan

V (z, q2 ) = c al aumentar el valor de c termina por encontrar un lmite superior absoluto.


Esto sucede porque si las curvas de nivel de V han de ser cerradas, estas deben caer
enteramente dentro del intervalo q2 [, ] (debido a la periodicidad de q2 , si no se
cierran en este intervalo, no se cierran nunca). Por tanto la mayor curva de nivel contenida
en este intervalo es aquella que intersecta el eje q2 en q2 = . Sustituyendo este punto en
la ecuacion V (z, q2 ) = c se obtiene
)
(

max c > 0 | {V (z, q2 ) c} esta acotado = 2


El resto del analisis (garanta de permanencia de la bola dentro de los lmites de la
viga) es equivalente a lo presentado en la seccion anterior. Si embargo vamos a observar

Captulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC

97

el efecto de la constante (que antes se hizo igual a 1) sobre la posicion de los equilibrios.
En las coordenadas (z, q2 ), una trayectoria dentro de los lmites de la barra satisface el
hecho
!
"


1
L

=m
(4.4.22)
|q1 | L |q2 z| arcsenh

2
Esto se debe a que








L
L
L


|q1 | L senh
2(q2 z) < arcsenh
2(q2 z) arcsenh

donde se ha empleado el hecho de que arcsenh(x) es monotona impar (de clase K ).


La ecuacion (4.4.22) dene dos lneas paralelas z = q2 m sobre el plano (z, q2 ) de
pendiente 1 (ver gura 4.13). Consecuentemente, el conjunto 0c = {(z, q2 )|V (z, q2 ) < c}
esta completamente contenido en |q1 | < L si y solo si el contorno 0c no intersecta la
lnea z = q2 m.
El valor de m es, por tanto, fundamental para dise
no con especicaciones de sobreoscilacion y puede ser alejado de la curvas de nivel de interes reduciendo el valor de
2
hasta su mnimo permitido, que se encuentra en L2 +  para cierto valor  > 0 peque
no
pero no nulo. Esto proporciona un maximo absoluto para m en 12 arcsenh(2).

4.4.4 Simulaciones
Se ha realizado un conjunto de simulaciones del sistema de la bola en la viga tomando
g = 9.8, kp = 1 . Los resultados aparecen en la gura 4.14. Las gracas en la la superior
representan la posicion de la bola q1 y el angulo de la viga q2 para una velocidad inicial
nula y diferentes posiciones iniciales y valores de los parametros. Al pie de cada una
de ellas se muestran las gracas correspondientes con el hamiltoniano deseado Hd y la
funcion de energa potencial Vd . Cada columna en la graca corresponde a una simulacion
aislada. En las dos primeras simulaciones se puede observar el efecto de aumentar la
constante de amortiguamiento kv comenzando con la bola en posicion vertical. Notese
que la convergencia no es siempre acelerada para valores mayores de kv , al entrar en
escena nuevas oscilaciones. La tercera simulacion comienza en reposo con la viga en
posicion horizontal y la bola en el extremo de la viga. En sucesivas simulaciones, se ha
observado que el controlador funciona mejor comenzando en q2 (0) = 0 y cualquier valor
de q1 (0). Para asegurar que la condicion inicial se halla en el dominio de atraccion, kp se
ha escogido por debajo de kpM de acuerdo con la Proposicion 4.4.3. La gura 4.14 tambien
ilustra la naturaleza monotona de Hd junto al hecho de que Vd (t) < Hd (t) < Hd (0) para
todo t.
El efecto de la viga de longitud nita y el uso de la u
ltima parte de la Proposicion 4.4.3
se ilustra mediante simulacion en la gura 4.15. Los valores asignados a los parametros
son g = 9.8, kp = 1, kv = 50, y L = 10. Se ha calculado que la condicion para mantener la
bola dentro de los lmites de la viga es Hd (0) < 0.1038. La primera simulacion comienza
en el estado (q 0 , p0 ) = (8, 0, 1, 1) con Hd (0) = 0.1837. Debido a la velocidad inicial,
el controlador es incapaz de atrapar la bola antes de abandonar el lmite de la barra
(L = 10). En la segunda simulacion el sistema parte del estado (q 0 , p0 ) = (6, 0, 0.5, 1)
no y as los
y Hd (0) = 0.0928. Por tanto, la cota |q1 | < L esta garantizada por el dise
corroboran los resultados de la simulacion.

98

4.4. El sistema de la bola en la viga

-50

-100

-50

-100

-150
50
100
0
Posicion frente al tiempo(s)

Hd(cont.), Vd(discont.)

Hd(cont.), Vd(discont.)

q1(0)=0.0, q2(0)=1.6, Kv=20, L=0.5


15

10

50
100
Posicion frente al tiempo(s)

-5

-10

100
200
300
Posicion frente al tiempo(s)

q1(0)=0.0, q2(0)=1.6, Kv=1, L=0.5 q1(0)=10.0, q2(0)=0.0, Kv=50, L=10.0


15
0.2

Hd(cont.), Vd(discont.)

-150

q1(0)=0.0, q2(0)=1.6, Kv=1, L=0.5 q1(0)=10.0, q2(0)=0.0, Kv=50, L=10.0


50
10

q1(cont.), q2(discont.)

q1(cont.), q2(discont.)

q1(cont.), q2(discont.)

q1(0)=0.0, q2(0)=1.6, Kv=20, L=0.5


50

10

50
100
Energia frente al tiempo(s)

0.15

0.1

0.05

50
100
Energia frente al tiempo(s)

100
200
300
Energia frente al tiempo(s)

Figura 4.14: Simulaciones de la bola en la viga comenzando en reposo.

La bola sobrepasa el extremo de la barra


12

La posicin de la bola es siempre inferior a L


8

10

q1(cont.), q2(discont.)

q1(cont.), q2(discont.)

-2

-2
-4

-4

-6

-8

50

100

150
tiempo(s)

200

250

300

-6

50

100

150
tiempo(s)

200

250

Figura 4.15: sistema de la bola en la viga comenzando con velocidad inicial no nula.

300

Captulo 5
Reducci
on del m
etodo IDA-PBC
para sistemas subactuados
5.1 Introduccion
Se observo en el captulo anterior que la principal virtud del metodo IDA-PBC reside
en que la funcion de energa total en bucle cerrado se obtiene mediante la solucion de
una ecuacion diferencial parcial (EDP) como un resultado de nuestra eleccion de la
interconexion de subsistemas y el amortiguamiento. Tal y como ilustran los ejemplos
analizados, este sistema es en general de difcil solucion.
La principal aportacion de este captulo es la denicion de una clase de sistemas
mediante un conjunto de condiciones facilmente satisfechas, que admiten ciertas manipulaciones algebraicas de las EDPs dadas por el metodo IDA-PBC para dar lugar a un
sistema reducido equivalente de ecuaciones diferenciales ordinarias (EDOs).
Estas ecuaciones son faciles de resolver, especialmente en sistemas de dos grados de
libertad. Las soluciones obtenidas mediante esta tecnica se aplican al moldeo de energa
en problemas de estabilizacion de sistemas subactuados con cierto grado de generalidad.
Dichas soluciones proporcionan la matriz de inercia Md (moldeo energa cinetica) y la
funcion de energa potencial Vd , ambos en bucle cerrado. Para dise
nar la ley de control
el resto del procedimiento presentado en el captulo anterior es de directa aplicacion.
Mediante la nueva formulacion, se obtiene un controlador suave con una amplia cuenca
de atraccion para los sistemas de la bola en la viga y el pendulo invertido en carro. Mas
a
un, para sistemas de dos grados de libertad y un actuador, comprendidos en esta clase,
las EDOs admiten una reparametrizacion de los elementos de la matriz de inercia en bucle
cerrado que conducen a una solucion algebraica directa del sistema de ecuaciones. Este
procedimiento completo se ilustra con el ejemplo del pendulo invertido.
Ademas, analizando las ecuaciones reducidas , se arroja una luz sobre problemas como
la perdida de controlabilidad en ciertos puntos, como es el caso del pendulo en su posicion
horizontal.
La exposicion se desarrollara en el siguiente orden. En primer lugar, se presentaran
los antecedentes existentes en cuanto a metodos de reduccion y resolucion de ecuaciones
de ajuste (matching conditions) para metodos de control basados en la estructura la99

100

5.2. Reduccion de las EDPs de ajuste en metodos lagrangianos

grangiana. A continuacion se dara una denicion de la clase de sistemas hamiltonianos


para los que es valida la reduccion aqu propuesta. En las secciones siguientes se detallan
los desarrollos que conducen a las reducciones de las ecuaciones de moldeo de energa
cinetica y potencial, ilustrando su aplicacion de forma paralela mediante conocidos ejemplos de sistemas subactuados. Se ampliara el estudio a un sistema de orden mayor que
dos contenido en la clase reducible y a un sistema no controlable. El captulo se concluye
con la presentacion de resultados de simulacion de dichos sistemas. Los resultados del
captulo dieron lugar a la publicacion (Gomez-Estern, Ortega, Rubio & Aracil 2001).

5.2 Reduccion de las EDPs de ajuste en metodos lagrangianos


Se ha puntualizado repetidamente que en los metodos de control lagrangiano o hamiltoniano, es necesario resolver ciertas EDPs de ajusteuna tarea casi siempre difcil.
Recordaremos algunos resultados publicados en la literatura que permiten simplicar este
problema.
En una serie de interesantes artculos, entre ellos (Bloch et al. 2000, Chang et al.
2002), se ha demostrado que en algunas casos que incluyen conocidos ejemplos, la solucion
de estas EDPs puede ser obviada. En (Blankenstein et al. 2001) se han interpretado
estas condiciones usando la notacion empleada en este captulo. Ahora resumiremos
brevemente estos resultados. Con este n, resulta conveniente particionar las coordenadas
generalizadas como q = [x ,  ] , con x IRr , IRnr . Esto induce una particion
natural de la matriz de inercia como


M xx M x
M=
M x M
Como en (Bloch et al. 2000), introduciremos las siguientes suposiciones:
(i) El lagrangiano es independiente de las coordenadas , es decir, son variables cclicas.
En este caso el lagrangiano toma la forma L(x, q)
= 12 q M (x)q V (x).
(ii) Las coordenadas son completamente actuadas, es decir, G = [0 I] .
(iii) La matriz M tiene el bloque M constante, y satisface1
xj M xi k = xi M xj k , i, j = 1, . . . , r; k = 1, . . . , n r
= 12 q Mc (x)q V (x). (Notese que,
A continuacion tomemos el lagrangiano como Lc (x, q)
al igual que en (Bloch et al. 2000), solo aspiramos al moldeo de la energa cinetica.) Una
primera observacion que se desprende es que en este caso, bajo las suposiciones (i), (ii),
la condicion de ajuste (4.2.19) se reduce a una ecuacion algebraica
 
I
x V = 0
[I 0](I M Mc1 )
(5.2.1)
0
1

Estos son las condiciones de ajuste 2 y 4 simplicadas de (Bloch et al. 2000), respectivamente.

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

101

Una contribucion fundamental de (Bloch et al. 2000) es la demostracion de que, para


siguiente clase particular de Mc , satisfaciendo las llamadas condiciones de ajuste simplicadas,


( + 1)M x (M )1 M x M x
Mc = M +
,
M x
0
con IR, las EDPs (4.2.19), (4.2.18) son satisfechas automaticamente.
En (Blankenstein et al. 2001) se muestra que, para la clase de Mc considereda en
(Bloch et al. 2000), su primera condicion de ajuste M-1 es equivalente a la acondicion
algebraica
 
I
[I 0](I M Mc1 )
= 0,
0
la cual a la luz de (5.2.1), claramente obvia la EDP de energa potencial (4.2.19). Mas a
un,
tambien esta establecido que las condiciones de ajuste M-2 y M-3 de (Bloch et al. 2000)
coinciden exactamente con la EDP (4.2.18).
Deberamos recordar que resolver las EDPs (4.2.18), (4.2.19) es solo el primer paso en
el procedimiento de dise
no. De hecho para establecer la estabilidad usando la Proposicion
4.2.1 la matriz Md debera ser denida positiva (al menos en un entorno del equilibrio q ),
y ademas, Vd debera tener un mnimo local aislado en q . En el teorema 3.4 de (Bloch
et al. 2000) se ha mostrado que los equilibrios relativos, de la forma (x = x, x = 0, = 0),
de sistemas conservativos son estables si el Hessiano de la energa total es de signo denido
(positivo o negativo). Para ello la solucion de las EDPs proporciona ciertos grados de
libertad en el dise
no. Aunque es de difcil justicacion desde un punto de vista fsico,
podemos de este modo usar estos metodos para estabilizar localmente los (equilibrios
relativos de) sistemas mecanicos conservativos con una matriz de inercia en bucle cerrado
denida negativa. Esta caracterstica es esencial en (Bloch et al. 2000) donde la energa
potencial no se modica por el control y tendra tpicamente un maximo en el equilibrio
deseado, por tanto la energa cinetica debera tambien tener un maximo en este punto.

5.2.1 Las ecuaciones


En una serie de artculos, Auckly y Kapitanski (Auckly & Kapitanski 2001) realizan una
de las principales contribuciones en la lnea iniciada por (Bloch et al. 2000) con el n de
transformar las ecuaciones de ajuste para el control de sistemas subactuados preservando
la estructura lagrangiana.
La contribucion mas importante de (Auckly et al. 2002), vease tambien (Andreev
et al. 2000), (Auckly & Kapitanski 2001), es la prueba de que todas las soluciones de
esta ecuacion pueden ser obtenidas secuencialmente resolviendo un conjunto de tres EDPs
lineales. Como se muestra en (Blankenstein et al. 2001) las tecnicas empleadas en (Auckly
et al. 2002) pueden ser extendidas al estudio de la EDP (4.2.12), los cuales incorporan
el parametro libre Uk . De hecho, esto da lugar a un juego de una ecuacion cuadratico
y dos EDPs lineales de primer orden. La primera EDP es cuadratica en el sentido de
que contiene terminos cuadraticos de las variables a despejar, aunque las derivadas siguen
apareciendo de forma lineal en la ecuacion.
Los desarrollos de (Auckly et al. 2002), basados en consideraciones geometricas dan
lugar a las llamadas ecuaciones. Para su interpretacion conviene notar que en geometra

102

5.2. Reduccion de las EDPs de ajuste en metodos lagrangianos

Riemanniana es posible dotar al espacio de conguracion de un tensor metrico distinto


de la identidad expresado como gij en coordenadas covariantes y g ij en coordenadas
contravariantes. En este contexto es un hecho que
gik g kj = ij

(5.2.2)

Este concepto puede ser utilizado para el control de sistemas mecanicos, si elegimos la
matriz de inercia como tensor metrico denotando gij a los elementos de dicha matriz en
bucle abierto y gij en bucle cerrado. En virtud de (5.2.2) se deduce que g ij (
g ij ) denota
los elementos de la inversa de la matriz de inercia en bucle abierto (cerrado). Ademas si
se dene el smbolo de Christoel de segunda especie como:


1 gjk gik gij
[i j, k] =
+
k
2 xi
xj
x
y denimos las variables como sigue
ra = gai gir
se llega a que todo lagrangiano controlado en bucle cerrado con matriz de inercia gij y
energa potencial V debe satisfacer las ecuaciones
r] = [j k, a]
ra [j k,
ja Cr = Ca
ja

V
V
=
xr
xa

siendo Cr i y Ca los terminos disipativos en bucle abierto y cerrado, respectivamente. Estas


ecuaciones permitiran obtener, implcitamente, las variables de la matriz de inercia gij y
la funcion de energa potencial V en bucle cerrado. Una vez halladas las incognitas gij
gij , Cr y V , la ley de control viene dada directamente por

r])x j x k + (Cl gli g ij Cj ) + ( V gli g ij V )


ul = ([jk, l] gli gir [jk,
xl
xj
Estas ecuaciones han dado unos resultados interesantes con algunos sistemas subactuados,
pero en casos como la bola en la viga, la solucion propuesta por Auckly y Kapitanski, seg
un
admiten los propios autores en (Andreev et al. 2000), no obtiene siquiera el rendimiento
alcanzado con un controlador lineal.
En el marco de esta tesis, el control basado en la estructura hamiltoniana, no se conoce
un enfoque similar, aunque podran derivarse unas ecuaciones equivalentes a partir de
las de Auckly basandose en la equivalencia entre las ecuaciones de Lagrange y las de
Hamilton. En este captulo se aborda el problema de manera diferente: se partira de
las ecuaciones generales del metodo IDA-PBC introducido en el captulo anterior y se
denira una clase de sistemas que abarca buena parte de los subactuados mas estudiados
en control, en los que dichas ecuaciones se transforman en otro sistema de ecuaciones
diferenciales ordinarias que admiten una solucion general para el moldeo de la energa
cinetica y potencial.
Estas ecuaciones reducidas, en algunos casos se resuelven de manera tan simple como
la obtencion de la integral indenida de una funcion de variable u
nica. Por el contrario,
si dicha integral no tuviera primitiva conocida, existen grados de libertad sucientes para
buscar otras integrales mejores candidatas.

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

103

5.3 Reduccion de las ecuaciones de ajuste en IDA-PBC


Cabe se
nalar, en primer lugar, que al realizar la comparacion entre los enfoques lagrangiano y hamiltoniano del captulo anterior, se comento que si jamos J2 en el metodo
IDA-PBC como (4.2.20), se asegura que el sistema en bucle cerrado admite una representacion EL de la forma (4.2.16), (4.2.17). Entonces la EDP no lineal (4.2.12) se reduce
a (4.2.18).
Paralelamente a los avances de presentados en el ajuste de ecuaciones para los metodos
basados en la estructura lagrangiana, se presentara a continuacion un nuevo metodo para
la resolucion de ecuaciones de ajuste del metodo IDA-PBC en una clase de sistemas
mecanicos subactuados.

5.3.1 Denicion de la clase de sistemas


Gran parte de los sistemas subactuados propuestos como retos (benchmarks) de control
en congresos y revistas de investigacion (vease la convocatoria del American Control
Conference de 1998), comparten ciertas propiedades. El bien conocido sistema de la bola
en la viga (Hauser et al. 1992), el pendulo invertido lineal (Bloch et al. 2000), y el pendulo
rotatorio de Furuta (
Astrom & Furuta 1996) pertenecen a una amplia clase de sistemas
de n grados de libertad y n 1 actuadores (codimension 1), donde se pueden hacer las
siguientes hipotesis
G = eTk
dMij
dqk
d(Md )ij
= ek
dqk

q Mij = ek
q (Md )ij

(5.3.1)
(5.3.2)
(5.3.3)

Estas condiciones se interpretan del siguiente modo. Sea k el ndice de la coordenada no


actuada. Llamamos ek al vector columna de dimension n cuyos elementos son todos nulos
excepto el que ocupa la posicion k cuyo valor es 1. Las las de la matriz G , al igual que
en el captulo 4, forman el n
ucleo de la matriz de control G. Por u
ltimo, en virtud de
(5.3.1), se asume que la matriz G coincide con la transpuesta del vector ek . Si no fuera
este el caso siempre se puede realizar una transformacion de coordenadas de modo que el
subespacio subactuado aparezca de forma aislada (Isidori 1989). Un escenario tpico sera
aquel en el que q1 represente la coordenada no actuada y q2 ...n el resto. en este caso se
tiene:


0 0
G = eTk = [1 . . . 0]1n
G=
0 In1
nn

donde In1 es la matriz identidad de orden n 1.


A su vez, la condicion (5.3.2) expresa el hecho de que los elementos de la matriz de
inercia en bucle abierto M (q) solo dependen de qk , la coordenada no actuada2 . Aunque
pueda resultar extra
na, esta es una caracterstica muy com
un para sistemas mecanicos
2
Algunos autores (Weibel 1997) emplean el termino variables de forma (shape variables) para designar
aquellas que aparecen en la matriz de inercia. Con este termino, la hip
otesis citada equivale a decir que
las u
nicas variables de forma son las no actuadas.

104

5.4. Reduccion de las ecuaciones de moldeo de la energa cinetica

subactuados. Como consecuencia, las derivadas de los elementos de dicha matriz con
respecto al vector de posicion q = [q1 , . . . , qn ]T se reducen a una u
nica derivada con
respecto a qk .
En virtud de la hipotesis (5.3.3) la propiedad (5.3.2) se extiende a la matriz de inercia
en bucle cerrado. Es natural proponer la matriz de inercia Md (q) como solo dependiente
de la coordenada no actuada qk .

5.4 Reduccion de las ecuaciones de moldeo de la energa cinetica


Estas ecuaciones son las mas difciles de resolver y por tanto se considera la contribucion principal de este captulo. En los calculos que aparecen a continuacion el operador
derivada dqdk () sera reemplazado por qk .
En virtud de (5.3.3), los elementos de la matriz de inercia propuesta para el sistema
en bucle cerrado solo dependeran de qk . De (5.3.2) y (5.3.3) se obtiene
eTk q (pT M 1 p) = pT qk M 1 p
eTk q (pT Md1 p) = pT qk Md1 p

(5.4.1)
(5.4.2)

Esto permite reescribir la ecuacion (4.2.10) del siguiente modo



1 T
p (qk M 1 )p eTk Md M 1 q (pT Md1 p) + eTk (J2 R2 )Md1 p = 0
2

(5.4.3)

Usando la hipotesis (5.3.3) transformamos el termino


q (pT Md1 p) = ek pT (qk Md1 )p

(5.4.4)

lo que sirve para transformar la ecuacion (5.4.3) en



1 T
p (qk M 1 )p eTk Md M 1 ek pT (qk Md1 )p + eTk (J2 R2 )Md1 p = 0
2

(5.4.5)

Esta
u
ltima expresion puede verse como
1 T
p Qp + eTk (J2 R2 )Md1 p = 0
2

Q = qk M 1 eTk Md M 1 ek qk Md1

(5.4.6)
(5.4.7)

Comentario 5.4.1. Q es simetrica al ser la suma de dos matrices simetricas: qk M 1 (por


la simetra de M 1 ) y la matriz qk Md1 multiplicada por el escalar eTk Md M 1 ek . Este
escalar aparecera en la forma [Md M 1 ]kk en adelante.
Denamos la matriz de interconexion deseada tal y como aparece en (4.2.7), que ha
de ser antisimetrica. La submatriz de disipacion R2 es denida positiva, y se supone que
toma la forma
R2 = diag{r1 , ..., rn }
ri 0
(5.4.8)
La ecuacion (5.4.6) debe cumplirse para cualquier valor del factor de los momentos generalizados, p, y por tanto
1 T
p Q + eTk (J2 R2 )Md1 = 0
2

(5.4.9)

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

105

Al ser Q una matriz simetrica como se demostro, podemos transponer la u


ltima expresion
y multiplicarla por la derecha por Md para llegar a
1
Md Qp = ek (J2 R2 )
(5.4.10)
2
El elemento k-esimo de la diagonal de R2 resulta ser cero. De hecho, multiplicando por
la izquierda la ecuacion (5.4.10) por el vector eTk se obtiene
1
eTk Md Qp = rk
2
que es una funcion lineal con respecto a p y no admite una solucion para rk globalmente
positivo (lo cual es necesario por ser un termino de disipacion). Esto conduce a la conclusion de que no se puede inyectar amortiguamiento en la direccion de la coordenada no
actuada.
En el caso de un sistema de dos grados de libertad J2 sera el u
nico parametro libre
restante para el moldeo de la energa cinetica en la variable no actuada. Este resultado
convierte la ecuacion matricial (5.4.10) en el sistema formado por de las n ecuaciones
diferenciales ordinarias no lineales.
eTk Md Q = 0
Comentario 5.4.2. La derivacion del producto (Md Md1 ) con respecto a qk proporciona la
siguiente descomposicion
qk Md1 = Md1 (qk Md )Md1

(5.4.11)

Sustituyendo (5.4.11) en el termino apropiado de la matriz Q en (5.4.10) se obtiene


eTk Md Q = eTk [Md (qk M 1 ) + (qk Md )Md1 [Md M 1 ]kk ] = 0
Si hacemos uso de la relacion
eTk qk Md = qk eTk Md
podremos nalmente aislar las derivadas de los elementos de la la k de la matriz Md con
respecto a qk
[Md (qk M 1 )Md ]k
qk [eTk Md ] =
(5.4.12)
[Md M 1 ]kk
siempre que el escalar [Md M 1 ]kk sea distinto de cero. Este resultado simplica notablemente la tarea de resolver la ecuacion (4.2.10) dando lugar a n ecuaciones diferenciales
ordinarias separadas con los elementos de Md como incognitas, con las derivadas aisladas
en el primer miembro.
En el caso de sistemas de dos grados de libertad, al haber una eleccion de tres
parametros en Md , se deduce que un elemento de la matriz de inercia es un parametro
libre, y mediante restricciones adicionales impuestas a dicho termino podremos garantizar
que la matriz Md es denida positiva.
En sistemas con mas de dos grados de libertad, la matriz de inercia consta de n2
elementos de los cuales los (n2 n)/2 por debajo de la diagonal quedan determinados
por la simetra, con lo que se obtiene un sistema de n ecuaciones y n2 (n2 n)/2 =
n2 /2+n/2 > n incognitas. De ello se deduce que aumenta considerablemente el n
umero de
grados de libertad con el orden del sistema, manteniendo su validez la sencilla formulacion
(5.4.12).

106

5.4. Reduccion de las ecuaciones de moldeo de la energa cinetica

Ejemplo 1. Aplicacion de las ecuaciones reducidas al moldeo de energa cinetica


de la bola en la viga
Con la nueva formulacion estamos en disposicion de resolver el problema del moldeo de
energa cinetica en el sistema de la bola en la viga del captulo anterior de una forma
mucho mas elegante.
El conocido sistema a controlar se presento en el captulo 4, gura 4.6. Los detalles de
modelado deben ser consultados en dicho captulo. Por facilidad de lectura recordaremos
que la dinamica hamiltoniana (4.2.2) de este sistema viene descrita por la funcion de
energa potencial V (q) = gq1 sen(q2 ) y las matrices


 
m2
0
0
M (q1 ) =
, G=
2
1
0 1 + m 1 q1
donde m1 y m2 son constantes del modelo, y q1 , q2 son la posicion de la bola y el angulo
de la barra, respectivamente. Denotaremos tambien


= det(M )
La coordenada no actuada es q1 . Por tanto, k = 1 0 y G = eTk = [1 0]. De acuerdo
con las hipotesis dadas en la seccion 5.3.1, los terminos de M (q) solo dependen de la
coordenada no actuada. Por tanto es razonable proponer una matriz de inercia en bucle
cerrado de la forma


a1 (q1 ) a2 (q1 )
Md =
a2 (q1 ) a3 (q1 )
siendo las ai funciones a denir. Entonces podremos aplicar directamente la ecuacion
(5.4.12) calculando los diversos terminos que en ella aparecen


da1 da2
T
qk ek Md =
dq1 dq1



0
0
a
a
2m1 m2 q1 a1
1
2
[Md (qk M 1 )Md ]k = [a1 a2 ]
[a2 a3 ]
=
2m1 q1
(1 + m1 q12 )2
0 (1+m1 q2 )2
a2 a3
1


1
a1
[Md M 1 ]kk = [a1 a2 ] m2 =
m2
0
Con todo ello obtenemos el conjunto de ecuaciones diferenciales ordinarias
2m1 m2 q1 a22
d
a1 (q1 ) =
dq1
(1 + m1 q12 )2 a1
d
2m1 m2 q1 a2 a3
a2 (q1 ) =
dq1
(1 + m1 q12 )2 a1

(5.4.13)
(5.4.14)

A
nadiendo a estas ecuaciones la eleccion a3 = a1 a2 con la constante > 0 lleva a
la solucion con Md globalmente denida positiva que ha sido presentada en el captulo
anterior.

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

107

q2

q1

Figura 5.1: Pendulo invertido en carro.

Ejemplo 2. Moldeo de energa cinetica en el pendulo invertido en carro


Los mismos resultados se pueden aplicar a un problema clasico en control no lineal subactuado. El sistema del pendulo invertido sobre carro aparece esquematicamente en la
gura 5.1.
De nuevo, se trata de un sistema de dos grados de libertad (n = 2) descrito por las
ecuaciones de Hamilton dadas en (4.2.2) con las matrices

M (q1 ) =

a
c cos q2
c cos q2
b


, G=

1
0

En este caso q2 es la coordenada no actuada y consecuentemente k = 2 y G = eTk = [0 1].




Ademas = det(M ) y M solo depende de q2 . Por tanto la matriz de inercia deseada se


propondra de la forma


a1 (q2 ) a2 (q2 )
Md =
a2 (q2 ) a3 (q2 )
De nuevo, se calcularan todos los terminos de las formulas (5.4.12). Por simplicidad se


denotara en adelante c2 = cos q2 y s2 = senq2 .

da2 da3
dq2 dq2

cs2 

a1 a2 (2bcc2 ) + a1 a3 (ab + c2 c22 ) + a22 (ab + c2 c22 ) a2 a3 (2acc2 )


cs2  2

a2 (2bcc2 ) + 2a2 a3 (ab + c2 c22 ) a23 (2acc2 )

a2 cc2 + a3 a


qk eTk Md

[Md (qk M 1 )Md ]k1 =


[Md (qk M 1 )Md ]k2 =
[Md M 1 ]kk =

Y nalmente sustituyendo en (5.4.12) llegamos a un par de ecuaciones diferenciales no

108

5.4. Reduccion de las ecuaciones de moldeo de la energa cinetica

lineales. Suponiendo que los elementos ai son todos funciones de q2 , se obtiene el sistema


da2
cs2
=
a1 a2 (2bcc2 ) + a1 a3 (ab + c2 c22 ) + a22 (ab + c2 c22 ) a2 a3 (2acc2 )
dq2
a2 cc2 + a3 a

 2
cs2
da3
=
(5.4.15)
a2 (2bcc22 ) + 2a2 a3 (ab + c2 c22 ) a23 (2acc2 )
dq2
a2 cc2 + a3 a
Ahora bien, es posible deshacerse de todas las funciones trigonometricas, de modo que los
segundos miembros del sistema (5.4.15) se conviertan en funciones racionales de cos q2 .

Esto es cierto ya que si denimos x = cos q2 se tiene
d
d
() = senq2 ()
dq2
dx
debido al factor com
un s2 a la derecha del sistema (5.4.15).


Comentario 5.4.3. El cambio de variable x = cos(q2 ) no implica una perdida de generalidad, dado que debido a la simetra del sistema con respecto a q2 , las soluciones a las
ecuaciones deben ser pares y por tanto podran siempre ser expresadas en funcion del
coseno de q2
Las EDOs no lineales expresadas en funcion de x se transforman en
da2
= (x)
(5.4.16)
dx
da3
= (x)
(5.4.17)
dx


c

(x) =
a1 a2 (2bcx) + a1 a3 (ab + c2 x2 ) + a22 (ab + c2 x2 ) a2 a3 (2acx)
a2 cx + a3 a

 2
c

(x) =
a2 (2bcx) + 2a2 a3 (ab + c2 x2 ) a23 (2acx)
a2 cx + a3 a
Nos centraremos en la solucion de (5.4.17) ya que en ella aparecen solo dos de los elementos
de la matriz Md . Es facil probar que siempre y cuando el termino [Md M 1 ]kk no se anule,
(x) es una funcion integrable y por tanto la ecuacion (5.4.15) admite una solucion de la
forma
*

a3 (x) = e

F (x)dx

(5.4.18)

Siendo una constante positiva ajustable. Con el n de obtener la funcion F (x) propondremos una nueva parametrizacion de los elementos de Md
a2 = f23 (q2 )a3
a1 = f13 (q2 )a3

(5.4.19)
(5.4.20)

Comentario 5.4.4. Notese que esta parametrizacion esta bien denida, ya que la u
nica
condicion que podra invalidar (5.4.19) o (5.4.20) es a3 = 0. Pero esto no puede suceder,
ya que a3 es un termino diagonal de una matriz que es denida positiva en el dominio de
denicion del controlador, por tanto a3 > 0.
Comentario 5.4.5. Las funciones f23 y f13 son incognitas con un grado de libertad, por
ejemplo, una vez elegida f23 arbitrariamente, f12 quedara determinada por la solucion
de(5.4.15).

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

109

Si se observa detalladamente la funcion (x), resulta ser un polinomio de grado dos


en las variables a2 y a3 , dividido por una funcion lineal en ambos terminos. Sustituyendo
todas las apariciones de a2 por la reparametrizacion del segundo miembro de (5.4.19) se
obtiene a23 como factor com
un del numerador, y a3 del denominator.
(x) = a3 F (x)

 2
c

F (x) =
f23 (2bcx2 ) + 2f23 (ab + c2 c22 ) (2acx)
f23 cx + a

(5.4.21)
(5.4.22)

Eligiendo f23 (q2 ) tal que


2
det(Md ) = a23 (f13 f23
)

(5.4.23)

sea positiva para cualquier valor de q2 se garantiza que Md es una matriz denida positiva
de la forma


f13 (q2 ) f23 (q2 )
(5.4.24)
Md = a3 (q2 )
f23 (q2 )
1
Con la eleccion de Md se concluye la fase de moldeo de energa cinetica del metodo
IDAPBC reducido. Sin embargo los elementos de dicha matriz han sido parametrizados
nador y siempre es
en terminos de una funcion f23 (q), que debe ser una eleccion del dise
posible conservar este grado de libertad para la fase de moldeo de energa potencial, donde
se dispondra de mas argumentos para la eleccion.

5.4.1 Generalizacion de la parametrizacion de Md para sistemas dos grados


de libertad
El paso clave para la validez de la parametrizacion (5.4.19)(5.4.19) surge del hecho de que
en la segunda de las ecuaciones (5.4.16) (5.4.17) solo aparecen dos de los elementos de
la matriz Md : a2 y a3 . Esta caracterstica tambien se presenta en la ecuacion (5.4.14) del
sistema de la bola y la viga. Se mostrara a continuacion que esta propiedad es extensible
a todos los sistemas de dos grados de libertad de la clase estudiada en este captulo. En
efecto, en la ecuacion (5.4.12) los terminos
[Md (qk M 1 )Md ]kj

j = 1, 2

(5.4.25)

son cuadraticos en los elementos de Md y pueden contener dos o tres elementos de dicha
matriz. Si los reescribimos en la forma
eTk Md (qk M 1 )Md ej

j = 1, 2

y tenemos en cuenta que eTk Md representa la la k de Md y Md ej es la columna j (la la


j traspuesta), concluimos que en el termino de (5.4.25) donde k = j, solo apareceran los
dos elementos de la la k de Md . Si j = k entonces (5.4.25) contiene los tres elementos
(a1 , a2 , a3 ) de Md .
Por tanto el sistema de ecuaciones completo (5.4.12) de moldeo de la energa cinetica
para n = 2 posee una ecuacion donde solo aparecen dos terminos de Md . Entre ellos,
escogeremos akk al ser diagonal y por tanto siempre positivo (consecuencia de Md > 0),
para parametrizar el resto de Md en funcion de el.

110

5.5. Moldeo de la energa potencial

5.5 Moldeo de la energa potencial


El objetivo del moldeo de la energa potencial es asignar libremente puntos de equilibrio
en la funcion de energa potencial en bucle cerrado. Una vez obtenida la matriz de inercia
Md aplicando la reduccion introducida previamente, podemos calcular la solucion de la
ecuacion de moldeo de energa potencial para el caso n = 2, mediante unos pasos sencillos.
La funcion Vd se obtiene como solucion a la ecuacion
G {q V Md M 1 q Vd } = 0

(5.5.1)

Suponiendo que se cumplen todas las condiciones descritas en (5.3.1), y a


nadiendo la
siguiente
V
= f (qi )
i {1...n}
(5.5.2)
qk
que se interpreta del siguiente modo: la derivada de la energa potencial del sistema
en bucle abierto con respecto a la coordenada no actuada, es funcion de una sola de
las coordenadas3 . Esto es cierto para todos los ejemplos presentados anteriormente. Se
supondra que i = k sin perdida de generalidad4 .
Para sistemas de dos grados de libertad, obtendremos una reduccion de la ecuacion
en derivadas parciales a la integral indenida de una funcion monovariable. En efecto,
cuando n = 2, la ecuacion (5.5.1) admite la siguiente expansion

 Vd 
 Vd
V
1
1
Md M
M
+
M
=
d
k1 q
k2 q
qk
1
2

1 = M 1
M

(5.5.3)
(5.5.4)

Por simplicidad se supondra que k = 2 sin perdida de generalidad5 . Bajo la conocida


suposicion de que [Md M 1 ]kk = 0 en el dominio de denicion del controlador, podemos
expresar la solucion general de la ecuacion homogenea como
&
'

 q2 
1
Md M
(1)

k1
(5.5.5)
Vd = q1
1 dq2
Md M
k2

donde es una funcion arbitraria que se empleara para asignar el equilibrio. La solucion
particular de la ecuacion completa resulta
 q2

V
(2)


(5.5.6)
Vd =
1 qk dq2
Md M
k2
En consecuencia, todas las soluciones de (5.5.1) estan contenidas en la expresion
(1)

Vd = Vd
3

(2)

+ Vd

(5.5.7)

Lo cual no es incompatible con que V (q) dependa tambien de variables actuadas, como sucede en el
caso de la bola en la viga.
4
La derivada mencionada es funci
on de la variable no actuada, concretamente. Esto no es cierto en el
sistema de la bola en la viga, pero como se demostrara en el siguiente ejemplo, es un obstaculo salvable.
5
Si este no es el caso, las coordenadas pueden ser reordenadas de modo que la no actuada aparezca
en segundo lugar.

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

111

Si hemos de asignar un punto de equilibrio estable en q = q , entonces Vd debe ser tal que
q Vd (q ) = 0
2 Vd (q )
>0
x2
Como regla general, estas condiciones se traducen en
q (q ) = 0
2 (q )
>0
x2
(2)
2 Vd (q )
>0
x2

(5.5.8)
(5.5.9)
(5.5.10)

Ejemplo 3. Reduccion de las ecuaciones de moldeo de energa potencial en la


bola y la viga
La funcion de energa potencial del sistema en bucle abierto viene dada por
V = m3 q1 cos q2

(5.5.11)

donde m3 es una constante positiva del modelo. La aplicacion de la ecuacion (5.5.1)


conduce a
$
1 + ml q1 2 Vd
1
Vd
(q) +
(q) = m3 senq2

m1
q1
m2 m1 q2
la cual se resuelve empleando las ecuaciones (5.5.5), (5.5.6) y (5.5.7) para dar lugar a



m2

Vd = m1 m2 m3 cos(q2 ) + q2 $ arcsenh( m1 q1 )
2 m1
Una eleccion apropiada que verica las condiciones (5.5.8), (5.5.9) y (5.5.10) en q = 0 es
(z) =

kp 2
z
2

(5.5.12)

Siendo kp > 0 una ganancia ajustable


2


m2

kp
Vd = m1 m2 m3 cos(q2 ) +
q2 $ arcsenh( m1 q1 )
2
2 m1

Ejemplo 4. Reduccion de las ecuaciones del moldeo de energa potencial en el


pendulo simple
La funcion de energa potencial en bucle abierto toma la forma
V = mgl cos q2

(5.5.13)

112

5.5. Moldeo de la energa potencial

Su derivada con respecto a qk es, como de costumbre, dependiente de una sola de las
coordenadas, q2 . En este caso i = k = 2. Haciendo uso de la factorizacion introducida en
(5.4.19) y (5.4.20) y el cambio de variable (5.4.16) podremos calcular cada termino de la
ecuacion de moldeo de energa potencial.
Vd
Vd
a3 (bf23 cx)
+ a3 (cf23 x + a)
= mglsenq2
(5.5.14)
q1
q2


donde se dene = abc2 x2 , el determinante de M (q). La solucion de la parte homogenea


toma la forma


 q2
bf23 c cos(q2 )
(1)
(5.5.15)
dq2
Vd = q1
cf23 cos(q2 ) + a
la cual es integrable dado que cf23 cos(q2 ) + a = 0. Las condiciones (5.5.8) y (5.5.9) se
cumplen mediante la eleccion de la funcion libre = k2p z 2 .
(2)

En lo que respecta a la segunda parte de la solucion, Vd , la funcion f23 debe ser tal
que (5.5.10) se cumple en q = 0. Esto impone una condicion en f23 que restringe las
posibles soluciones de las ecuaciones de moldeo de la energa cinetica. De hecho, en q = 0
V

(2)

(q )

obtenemos x = 1 y el termino dx2 se convierte en


&
'


q2

2
V


1 qk dq2 = q2 a3 (cxf23 (q) + a) qk =
q22
Md M
k2



2 V (q ) V (q )
+
=
a3 (cf23 (q ) + a) qk2
qk q2 a3 (cxf23 (q) + a)
El u
ltimo termino es cero ya que al contiene el factor
solo queda

V (q )
qk

= mglsenq = 0, y por tanto

2 V (q )

>0
a3 (cf23 (q ) + a) qk2
para lo cual es necesario que
a3 (cf23 (q ) + a) < 0

(5.5.16)

La condicion (5.5.16) unida a al hecho de que [Md M 1 ]kk = 0 se extiende a todo el rango
de x, lo cual signica que
a3 (cf23 (x)x + a) < 0

x [1, 1]

(5.5.17)

Esta restriccion para f23 presenta una singularidad en x = 0 (o equivalentemente q2 = 2 )


como ha sido representado en la gura 5.2. En esta gura las regiones permitidas para
f23 son los lados de las curvas apartados del origen en el primer y tercer cuadrante. Estas
regiones, obviamente, son inconexas. Para que la condicion (5.5.17) se siga cumpliendo
al aproximarse la variable q2 a 2 , f23 debera tender a innito. De esto se concluye que
no es posible dise
nar un controlador valido IDA-PBC sin conmutacion en el espacio de
estados completo6 . Este efecto se relaciona por tanto con una perdida de controlabilidad
del pendulo en q2 = 2 . La siguiente seccion restringira el problema de la estabilizacion
a un intervalo de la forma q2 (/2 + , /2 ), siendo  una constante positiva todo
lo peque
na que se desee teniendo en cuenta que afectara a la forma de la funcion f23 .
6

Observese que hasta el momento no se ha tomado partido por ninguna forma concreta de f23 con
lo cual el resultado es general salvo por la condicion [Md M 1 ]kk = 0. Se ha estudiado, sin embargo, la
posibilidad de que este termino se anule en q2 = /2, y se concluyo que no era compatible con ninguna
solucion global para la energa cinetica.

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

113

Figura 5.2: Regiones prohibidas (en gris) para f23 .

5.6 Calculo de la ley de control


Las secciones previas proporcionan un metodo de resolucion de las ecuaciones de moldeo de
energa en el metodo IDA-PBC. Mediante los sucesivos ejemplos se ha ilustrado la potencia
y sencillez del metodo. En este apartado se resumiran los calculos nales necesarios para
la obtencion de la ley de control. Nos centraremos al caso de dos grados de libertad y
complementaremos los resultados con el ejemplo del pendulo invertido, puesto que para
el sistema de la bola y la viga no representa ninguna novedad.
Para el calculo de ues (moldeo de energa sin amortiguamiento), en primer lugar se
obtiene la matriz de interconexion J a partir del conocimiento de Md mediante la ecuacion
(4.2.7), donde la submatriz J2 se calcula en virtud de la ecuacion (5.4.10) (recuerdese que
G = eTk )
1
Md Qp = G (J2 R2 )
2
la cual, en el caso de dos grados de libertad, se premultiplica por la matriz de control G
para dar
1
j(q, p) = GMd Qp
2
siendo j(q, p) un escalar, y por tanto la matriz J2 en estos casos (n = 2) toma la forma


0
j(q, p)
J2 =
j(q, p)
0
Una vez obtenidos Md y Vd y J, se calcula el termino ues de la ley de control que produce un sistema conservativo en bucle cerrado mediante la aplicacion directa de (4.2.11).
Mediante ues se transforma la funcion de energa de modo que en bucle cerrado tenga la
forma deseada con el mnimo en el punto de equilibrio objetivo. Si no se a
nade amortiguamiento, el sistema permanecera en orbitas de valor constante de Hd y no se lograra
estabilidad asintotica (aunque s estabilidad en el sentido de Lyapunov siendo Hd la funcion de Lyapunov). El termino de amortiguamiento que ha de ser a
nadido a al se
nal de
control para lograr un decrecimiento de Hd hacia el mnimo consiste en realimentar la
un la ecuacion (4.2.8). Para el caso de
salida pasiva con una ganancia ajustable Kv , seg
la bola en la viga, sabemos que toma la forma (4.4.11). El termino de amortiguamiento

114

5.6. Calculo de la ley de control

del pendulo invertido, debido a su complejidad, queda mejor expresado en terminos de la


nueva parametrizacion de Md :
udi = kv

p1 f23 p2
2
f13 f23

(5.6.1)

Ejemplo 5: Ley de control en el pendulo invertido


La ley de control en cualquiera de los casos se obtiene sumando los terminos de moldeo
de energa e inyeccion de amortiguamiento,
u = ues + udi
En el caso del pendulo invertido lineal, se ha visto que cualquier ley de control IDA-PBC
esta limitada a un intervalo del tipo (/2 + , /2 ) se debe actuar en conjuncion con
una ley de swing up que levante el pendulo hasta la region de atraccion del controlador
IDA-PBC y realizar una conmutacion entre ambos.
Para el calculo de la ley de control hemos observado que la solucion de las EDPs queda
reducida a encontrar una funcion monovariable f23 (q2 ) sujeta a las siguientes condiciones
dentro del intervalo q2 (/2 + , /2 ):
1. De la ecuacion (5.5.17), f23 >

a
c cos q2

2. Para lograr que Md sea denida positiva, f23 debe ser monotona creciente con respecto a x. Esto se puede demostrar sustituyendo f23 y el valor de a1 como una
solucion de (5.4.16) en det(Md ) = a1 a3 a22 , dando lugar a que el determinante tiene
el signo de dfdx23 .
3. f23 debe ser par con respecto a q2 , para que las ecuaciones en bucle cerrado sean
pares y puedan expresarse en funcion de x.
La u
ltima condicion permite expresar f23 en terminos de la nueva variable x. Notese
tambien que la primera condicion es tambien suciente para la integrabilidad de F (x).
Ademas, f23 debe ser elegida juiciosamente de modo que todas las integrales de una
variable que aparecen en el procedimiento posean una primitiva conocida7 . Este es el
caso de una funcion que tome la forma
f23 (x) =

1
f0 + x

Si < 0, f0 > 0 y f0 > ||, las dos primeras condiciones son satisfechas, mientras que la
tercera implica que
a
1
>
f0 + x
cx
7

Este es un aspecto crtico, que sugiere una ejecuci


on del metodo un iterativamente hasta satisfacer
esta condicion.

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

115

donde se ha denido x = cos( 2 + ) como el lmite inferior del intervalo de validez del
controlador en terminos de x, es decir, x [x , 1]. Para cualquier valor especco de f0 ,
la constante debe ser tal que
c
f0

|| >
x a
Para nuestra solucion particular, la funcion F (x) toma la forma


bc2 x
2 2
2
2 f0 + x + 2 ab + 2 c x 2 ac x
F (x) =
(5.6.2)
(af0 + (a c) x)
Bajo las condiciones expresadas anteriormente esta funcion no presenta singularidades
dentro del intervalo de interes, y por lo tanto puede ser integrada. A pesar de la complejidad aparente, se trata de una funcion racional de x cuya primitiva se ha obtenido usando
la aplicacion de calculo simbolico Maple. Entonces los terminos de Md se calculan como
*

a3 (x) = e F (x)dx
a2 (x) = f23 a3 (x)
2
a2 2 (ab + c2 x2 ) + 2 a2 a3 acx
(a2 cx + a3 a) da
dx
a1 (x) =
2 a2 bcx + a3 (ab + c2 x2 )
donde es una ganancia ajustable positiva que no tiene efecto alguno en el signo de
det(Md ). En cuanto a los terminos de energa potencial, de la ecuacion (4.2.11) se deduce
claramente que solo se requiere el conocimiento de las derivadas Vd para implementar el
controlador, y por tanto no se requiere el calculo de la integral indenida (excepto para
algunas elecciones de la funcion libre (z) de la solucion de la ecuacion homogenea).
Proposici
on 5.6.1. Considerese el modelo del pendulo invertido lineal (5.1) en bucle
cerrado con la realimentaci
on estatica del estado IDA-PBC u = ues + udi obtenida en las
oticamente estable
secciones anteriores y kv > 0. Entonces, el origen es un equilibrio asint

4
con dominio de atracci
on c donde c = {(q, p) IR | Hd (q, p) c}, donde Hd toma la
(1)
(2)
forma (4.2.3), Md viene dada por (5.4.24), Vd = Vd + Vd y c denida seg
un (4.2.9).
Demostracion. Se reere al lector a la prueba de la proposicion (4.4.2) esbozada para el
control de la bola en la viga en el captulo 4.
2

5.7 Simulaciones
En esta seccion se muestra el comportamiento simulado de los sistemas controlados de la
bola en la viga y pendulo invertido lineal cuando se emplea el metodo descrito previamente.
La bola en la viga se simulo con las constantes m1 = m2 = kp = 1 y g = 9.8. Se observa
una gran cuenca de atraccion. Por ejemplo, un caso de simulacion comenzando en q2 =
(viga boca abajo) puede ser conducido a la posicion (0, 0) mediante el controlador dise
nado
para un conjunto de valores iniciales positivos de q1 .
La graca de la izquierda en la gura 5.3 representa el angulo de la viga comenzando
en (1, 1.5), con una constante de amortiguamiento kv = 10. La graca de la derecha
muestra la trayectoria de la bola comenzando en (1, 0) para distintos valores de kv .

116

5.8. Comparacion de leyes de control

1.5

0.8

Posicion de la bola (m)

Angulo de la viga (rad)

0.5

0.6

0.4

Kv=10

0.2

0
0

0.2

0.5

10

12

14

16

18

0.4

20

Kv=1

10

15

20

Tiempo (s)

25

30

35

40

45

50

Tiempo (s)

Figura 5.3: Resultados de la simulaci


on de la bola en la viga.

En la simulacion del pendulo invertido, los parametros del modelo son los propuestos
en el artculo de (Bloch et al. 2000), concretamente m = 0.14 kg, M = 0.44 kg, y l=0.215
m. Las constates de nuestro modelo se obtienen indirectamente a partir derivan de ellas:
a = ml2 = 0.0064715 b = M + m = 0.58 y c = ml = 0.0301. Los valores empleados en
el dise
no del controlador son f0 = 1, = 0.8 y = 1014 (este u
ltimo con el criterio
de minimizar el rango de variacion de a3 en el dominio de denicion). La posicion y
velocidad deseada del carro es 0 m/s. El pendulo comienza en una posicion practicamente
horizontal q2 (0) = /2 0.3 rad, mostrando la amplia cuenca de atraccion del equilibrio
con el pendulo levantado. La gura (5.4) muestra los resultados de la simulacion. El
comportamiento es el deseado incluso partiendo de puntos cercanos al lmite del dominio
de atraccion. El rendimiento del controlador es muy satisfactorio como se puede apreciar
por el transitorio de tipo deadbeat que aparece en las gracas.
Velocidad del pendulo
1.6
0.04

1.4
1.2

0.02

1
0

0.8

Velocidad angular (rad/s)

Angulo del pendulo

0.6
0.4
0.2

0.02

0.04

0.06

0
0.2

0.08

0.4

Velocidad del carro


0

50

100

150

200

250

300

350

400

450

500

0.1
0.2

tiempo (s)

0.2

0.4
0.6
Angulo del pendulo (rad)

0.8

Figura 5.4: Resultados de la simulaci


on del pendulo invertido comenzando en q2 = 1.2 rad.

5.8 Comparacion de leyes de control


Existe en la literatura un creciente n
umero de controladores para el conocido sistema
de la bola en la viga. Continuamente aparecen nuevos trabajos en este sentido, que

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

117

reivindican una mejora en las propiedades de estabilidad en bucle cerrado o amplian el


grado de detalle del modelo empleado. A n de contrastar los el controlador basado
en pasividad desarrollado en esta tesis con otros trabajos anes, se realizara un estudio
simulado comparativo con otros dos controladores: uno lineal basado en una estructura
de control anidada y otro basado en la teora de lagrangianos controlados presentado en
(Hamberg 1999). El primero se ha elegido por su sencillez y por ser uno de los mas
implementados en los laboratorios con nalidades academicas. El segundo cobra interes
en el marco de las comparaciones de caracter teorico que se han llevado a cabo entre los
metodos basados en pasividad y la teora de lagrangianos controlados.
El primer aspecto que merece la pena destacar es la desafortunada disparidad entre
los modelos empleados en las distintas publicaciones. La razon de este hecho se ilustra
observando la gura 5.5. En ella se representa un carro en lugar de una bola, que es
una conguracion bastante habitual que presenta una peculiaridad: el centro de masas
del carro esta desplazado hacia arriba y por tanto nunca pasa por el eje de giro de la
viga. Esta separacion, hc en la gura 5.5 es responsable de la aparicion de elementos no
diagonales en la matriz de inercia del modelo de la bola en la viga.

Figura 5.5: Carro en viga con centro de masas desplazado.

El modelo del sistema con hc > 0 posee el lagrangiano:


1
L = [ z]

1 + + + z 2 1
1
1+




(zsen + cos )

(5.8.1)

donde , son constantes positivas derivadas de los parametros fsicos. Este modelo es
empleado en los controladores basados en el metodo de los lagrangianos controlados y
su reduccion mediante las ecuaciones . En adelante se haran simulaciones a efectos de
comparacion de los transitorios y las cuencas de atraccion, aunque es preciso recordar que
bajo estos paradigmas de control no se han descrito tecnicas para acotar las trayectorias
en los transitorios de manera analoga a la expuesta en el captulo 4.

5.8.1 Control lineal


Para el control lineal emplearemos el modelo del captulo anterior, ecuacion (4.4.1). Para
la linealizacion en el origen se partira de la descripcion en variables de estado que se

118

5.8. Comparacion de leyes de control

desprende de la descripcion Hamiltoniana.


q1 = p1

p2
+ q12
p22 q1
=
gsenq2
(L2 + q12 )2
= gq1 cos q2 +

q2 =
p1
p2

L2

La linealizacion jacobiana del sistema en el origen resulta

x =

0
0 1
0
0 0
0 g 0
g 0 0

x +

0
0

1
L2

0
0
0

donde x = [q1 , q2 , p1 , p2 ]T . Es facil observar que el sistema lineal es controlable y observable en el origen. Por tanto, la tecnica de asignacion de polos es de directa aplicacion.
Sin embargo, una estructura tpica empleada en el aplicaciones practicas comprende la
anidacion de dos subsistemas control (gura 5.6): un subsistema rapido que lleva la viga
a una posicion deseada, y un sistema lento que toma la posicion de la viga como entrada
de un subsistema de control de la posicion de la bola. En este caso el subsistema de la
rd
PD

Qd

torque

Q(s)

PID

r
Ball & Beam

Gear angle loop

Ball position loop

Figura 5.6: Estructura anidada para el control lineal de la bola y la viga.

posicion de la bola es
q1 = p1
p1 = gq2 ,
donde q2 se considera la entrada. Este sistema equivale a
q1 = gq2
Una estructura de control PD para la estabilizacion de la bola en el origen dara
gqd2 = kp1 q1 kd1 q1

1
qd2 = (kp1 q1 + kd1 q1 )
g

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

119

q (0)=0.00, q (0)=0.30
1

100

0.5
50

Seal de Control

q (cont.), q (disc.)

0.5

50

100

1.5

10

15

20
tiempo(s)

25

30

35

40

150

10

15

20
tiempo(s)

25

30

35

40

Figura 5.7: Resultados de simulaci


on del control lineal de la bola en la viga, q2 (0) = 0.3 rad.

donde kp1 y kd1 son ganancias ajustables, y qd2 representa el angulo de la viga deseado.
Ahora bien, este angulo tiene su dinamica propia, que debe ser controlada mediante un
lazo PD interno rapido (respecto al cual la referencia q2d sea cuasi-constante). La dinamica
linealizada de la viga viene dada por
p2
L2
= gq1 cos q2 +

q2 =
p2

haciendo = gq1 cos q2 + vL2 se transforma el sistema en


q2 = v,
que se estabiliza en la referencia dada por el subsistema lento q2d mediante una nueva ley
de control PD:
v = kp2 (qd2 q2) + kd2 (qd2 q2 )
de donde se obtiene la ley para el sistema completo:
1
1
= gq1 cos q2 + L2 (kp2 ( (kp1 q1 + kd1 q1 ) q2) + kd2 ( (kp1 q1 + kd1 q1 ) q2 ))
g
g
Este controlador se ha simulado aplicado al modelo no lineal con constantes L = 10m y
g = 9.8m/s2 . Los parametros del controlador son kp1 = 1, kd1 = 0.5, kp2 = 4 y kd2 = 2.
Los resultados de simulacion de este son satisfactorios para un amplio rango de valores
iniciales de q1 . Sin embargo se observa una limitacion: el controlador se desestabiliza
para angulos iniciales de la viga superiores a 1 rad. Esto contrasta con el controlador
IDAPBC del captulo anterior en el que se lograba estabilizar desde condiciones iniciales
muy proximas a /2.
Los resultados se muestran en las gracas de las guras 5.8.1, 5.8.1 y 5.8.1 donde se
ha hecho aumentar progresivamente el angulo inicial de la viga, q2 (0).

5.8.2 Control por lagrangianos controlados


En el artculo (Hamberg 1999) se ha presentado un controlador de la bola en la viga
basado en esta tecnica de control de subactuados. El modelo empleado en este caso es el

120

5.8. Comparacion de leyes de control

q (0)=0.00, q (0)=0.70
1

150

100

50

Seal de Control

q1(cont.), q2(disc.)

50

100

150

200

250

5
300

10

15

20
tiempo(s)

25

30

35

350

40

10

15

20
tiempo(s)

25

30

35

40

Figura 5.8: Control lineal de la bola en la viga, q2 (0) = 0.7 rad.

q (0)=0.00, q (0)=1.00
1

x 10

5000

2
0

Seal de Control

q1(cont.), q2(disc.)

4
5000

10000

15000

20000

10

10

15

20
tiempo(s)

25

30

35

40

12

10

15

20
tiempo(s)

25

30

35

40

Figura 5.9: Control lineal de la bola en la viga, q2 (0) = 1 rad. Comportamiento inestable.

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

121

descrito por las ecuaciones (5.8.1). La resolucion de las ecuaciones de ajuste proporciona
el lagrangiano controlado dado por la metrica (matriz de inercia en bucle cerrado)


2
q1
5
2
g = e 6+6
2 1
y la funcion de energa potencial

V (q1 , q2 ) = V0 (q1 , q2 ) V0 (0, q1 3q2 ) + (q1 3q2 )2


2
donde
V0 (q1 , q2 ) = e

(1+)
6




q
1 + iq1

i( 31 q2 )

Er
Re e
6 + 6
6 + 6

Los resultados de simulacion de este controlador han sido publicados en el conocido


artculo (Hamberg 1999) y a la luz de las gracas all presentadas, las propiedades transitorias son poco satisfactorias, a lo que cabe a
nadir el argumento de la inexistencia de un
adecuado analisis del comportamiento transitorio. En la simulacion de Hamberg, se ha
mostrado una trayectoria comenzando en (q1 = 1.0m, q2 = 0.5rad). Tras varios intentos
de simulacion el autor de esta tesis no ha logrado, con este mismo controlador, estabilizar trayectorias comenzando con angulos superiores a 1 rad, mientras que el controlador
IDAPBC, como hemos mostrado, puede estabilizar posiciones iniciales tan proximas a
/2 como se quiera.

5.9 Extension de la solucion a otros sistemas


5.9.1 Sistemas de orden mayor
Las formulas obtenidas en (5.4.12) se aplican sin dicultad en sistemas subactuados de
orden mayor. Sin embargo las ecuaciones que se desprenden de dichas formulas pueden
ser difciles de resolver. Se ha estudiado un caso en el que se consigue satisfactoriamente
el moldeo de energa cinetica gracias a dicha formulacion, sin embargo queda abierta la
resolucion de la ecuacion de energa potencial en la que las reducciones anteriores no son
efectivas.
5.9.1.1 Moldeo de energa cinetica del robot PPR
El robot movil PPR, representado esquematicamente en la gura 5.10, es un sistema
de cuatro grados de libertad y tres actuadores. Ha sido estudiado en (Espinosa-Perez,
Sira-Ramrez & Ros-Bolivar 2000) desde un punto de vista hbrido entre la pasividad
y la platitud (atness). El lector debe referirse a este artculo para mas detalles sobre
el modelado. Para el moldeo de la energa cinetica emplearemos la formula reducida de
IDA-PBC presentada anteriormente
qk [eTk Md ] =

[Md (qk M 1 )Md ]k


[Md M 1 ]kk

(5.9.1)

que en este caso comprende un sistema de cuatro ecuaciones con k = 4 y M es la matriz


de inercia en bucle abierto, dada por

122

5.9. Extension de la soluci


on a otros sistemas
z

y
x

F2

F1

Figura 5.10: Robot m


ovil PPR.

M =

M +m
0

0 mlsen

ml cos

2
ml

M +m 0

mlsen ml cos 0

(5.9.2)

Este
es un problema con gran cantidad de grados de libertad. La matriz de inercia en bucle
cerrado consta de diez elementos libres si se quiere preservar la simetra. Sin embargo el
analisis del signo de la matriz puede tornarse bastante complejo, de modo que vamos a
prescindir de buena parte de estos elementos. Propondremos la siguiente matriz de inercia
en bucle cerrado

a1

0
Md =

a2

a3

a4

a4

a5

(5.9.3)

cuyo determinante es det(Md ) = a1 (a2 a3 a5 a4 2 a3 ) , que debe ser positivo siguiendo las
directrices del metodo.


Tras el cambio de variable x = cos , el sistema de ecuaciones diferenciales obtenido


con las formulas reducidas es

d
a4 (x) = ml2 M
dx

 

a4 mx
a4 2
a5 
2
+
a2
(a4 xml a5 )1
M
lM
lM

0=

ml (2 a4 mlx2 + a4 ml + a5 x) a1
(a4 xml + a5 )

(5.9.4)

(5.9.5)

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

 
a4 mx
a4 a5 
a5 
d
2
a5 (x) = ml M 2
+
a4
(a4 xml a5 )1
dx
M
lM
lM

123

(5.9.6)

Analisis de las posibles soluciones


Debido a la riqueza en grados de libertad del problema, incluso despues de haber anulado
diez de los elementos de Md , restan numerosas opciones en la tarea de dise
no. Para
enmarcar el problema, analizaremos las posibles soluciones y las restricciones que aparecen
en el moldeo de energa cinetica.
1. M , m, l, y son constantes positivas.
2. Md es denida positiva si y solo si a1 , a2 , a3 , a5 y el determinante son positivos.
3. La ecuacion (5.9.5) es algebraica y establece una relacion entre a4 y a5 , ya que a1
no se puede anular (por estar en la diagonal de Md ). Esto permite expresar a4 en
funcion de a5 .
4. Para resolver la ecuacion (5.9.4) se emplea el grado de libertad a2 , con la restriccion
a2 > 0.
5. Lo mas interesante en este paso es el hecho de que a1 y a3 no intervienen en las
ecuaciones de energa cinetica, con lo cual basta con seleccionarlos garantizando el
signo del determinante de Md .


6. Para simplicar las ecuaciones se recurre al cambio x = sen lo cual implica que los
elementos de Md van a ser simetricos respecto a , (como sucede en la matriz de
inercia en bucle abierto M ).
Para hallar la solucion se despeja, del numerador de (5.9.5) a4 en funcion de a5 :
a4 =

a5 x
ml (2 x2 1)

Sustituyendo en (5.9.5) resulta


a5 = C1

2 x2 1

(5.9.7)

(5.9.8)

siendo C1 una constante real a elegir. Conocido a5 , obtendremos a4 directamente de


(5.9.7)
C1 x
(5.9.9)
a4 =
2 x2 1ml
quedando a
un por ajustar la ecuacion 5.9.4, que se transforma en una ecuacion algebraica
de la que despejamos a2 :
(2 x4 1) C1 2
,
(5.9.10)
a2 =
(2 x2 1)3/2 l2 m2

124

5.9. Extension de la soluci


on a otros sistemas

con lo que la matriz de inercia en bucle cerrado queda

a1

Md =

(2 x4 1)C1 2
(2 x2 1)3/2 l2 m2

C1 x
2 x2 1ml

a3

C1 x
2 x2 1ml

C1

0
2 x2 1

(5.9.11)

un conveniencia, que emplearemos en el


siendo a1 y a3 funciones positivas a escoger seg
ajuste de energa potencial. Estudiaremos la positividad de Md en torno al origen = 0
o equivalentemente x = 1.

a1

Md ( = 0) =

C1 x
2 x2 1ml

a3

C1 x
2 x2 1ml

(2 x4 1)C1 2
(2 x2 1)3/2 l2 m2

C1

2 x2 1

(5.9.12)

Esta matriz sera denida positiva si los menores descendentes de la matriz Md son positivos, es decir
(2 x4 1) C1 2

>0
(2 x2 1)3/2 l2 m2
a1 > 0
a3 > 0
al igual que el determinante
a1 C1 2 2 a3 (2 x4 1 x2 )
det(Md ) =
>0
(2 x2 1) l2 m2
Para garantizar la positividad de la matriz Md se debe escoger la constante C1 en el
siguiente intervalo

C1

a4 ml 2a4 ml
,


(5.9.13)

En cuanto al dominio de denicion del controlador, Los elementos de la matriz Md deben


ser reales, para lo cual debe cumplirse
1
0 < 1 2 x2 sen2 () <
2

|| ( , )
4 4

(5.9.14)
(5.9.15)

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

125

5.9.1.2 Moldeo de la energa potencial


En este caso la ecuacion a resolver es
G {q V Md M 1 q Vd } = 0

(5.9.16)

Particularizando los terminos de la solucion del balance de energa cinetica se llega a


la ecuacion
0 = x3 k + x4 k


C1 sen(x4 ) 1 + (cos(x4 ))2 x 1 V d(x1 , x2 , x3 , x4 )
#

2 (cos(x4 ))2 1lM




C1 cos(x4 ) M m + m (cos(x4 ))2 x 2 V d(x1 , x2 , x3 , x4 )
#
+
2 (cos(x4 ))2 1mlM


C1 1 + (cos(x4 ))2 x 4 V d(x1 , x2 , x3 , x4 )
#

2 (cos(x4 ))2 1ml2 M


Sin embargo, no se ha llegado a ninguna solucion satisfactoria para esta solucion. Las
obtenidas mediante Maple presentan singularidades difcilmente salvables.

5.9.2 Efecto de la perdida de controlabilidad en IDA-PBC


Se ha observado que el pendulo invertido presenta un problema intrnseco de continuidad
de las soluciones obtenidas mediante el metodo IDA-PBC en los puntos q2 = /2.
Mediante la linealizacion del sistema en estos puntos se puede comprobar sencillamente
que esto se debe a que el sistema deja de ser controlable. Existe un caso mas patologico
a
un, el sistema subactuado conocido como pendulo esferico de Rice o simplemente sistema
de la perla giratoria. Este sistema fue introducido en el captulo 2. El sistema consiste
en una masa puntual restringida a moverse sobre una circunferencia que gira en torno a
un eje vertical que pasa por su centro. Como se represento esquematicamente en la gura
2.2, la masa esta ensartada en la circunferencia como una perla en la gua del collar.
La peculiaridad de este sistema consiste en que si aplicamos el metodo IDA-PBC para
estabilizar la perla en cualquier posicion en la mitad de la superior de la circunferencia (lo
cual se consigue con momentos generalizados no nulos, obviamente), las ecuaciones llevan
a una contradiccion.
Por supuesto, esta limitacion es previsible desde el punto de vista fsico, ya que estando
la perla en la semicircunferencia superior, la suma vectorial de fuerzas (gravitatoria y
centrfuga) proyectadas en la direccion tangente al aro8 , solo puede apuntar en sentido
descendente. Sin embargo, sirve de ejemplo ilustrativo para explicar como se maniesta
esta imposibilidad en la nueva formulacion.
Para aplicar IDA-PBC, emplearemos el modelo descrito por las ecuaciones de Hamilton
8

La perpendicular es cancelada por las fuerzas de reacci


on de la ligadura.

126

5.9. Extension de la soluci


on a otros sistemas

(4.2.1)(4.2.2), tomando en particular los valores



 

0

0
,
G
=
, V = mg cos q1
M (q1 ) =
1
0 + sen2 q1

(5.9.17)

Para el moldeo de energa cinetica debemos encontrar una matriz Md denida positiva
que cumpla las conocidas EDOs reducidas (5.4.12) con k = 1. Sustituyendo todos los
terminos esta ecuacion se traduce en
d
22 senq1 cos q1 a22
a1 (q1 ) =
dq1
( + sen2 (q1 ))2 a1
d
22 sen(q1 ) cos(q1 ) a2 a3
a2 (q1 ) =
dq1
( + sen2 (q1 ))2 a1
lo cual admite el cambio de variable x = sen(q1 ) dando lugar por tanto a
d
22 x a22
a1 (x) =
dx
+ x2 a1
d
22 x a2 a3
a2 (x) =
dx
+ x2 a1
Al igual que en el ejemplo de la bola en la viga, que posee muchas analogas con este, se
encontrara una solucion a este sistema de ecuaciones mediante la eleccion
a3 = ka2 a1

(5.9.18)

para cierto valor positivo de la constante k. En este caso, con una eleccion apropiada de
las constantes de integracion, se llega a una matriz Md denida positiva para cualquier
valor de q1 . Los elementos de Md resultan
%
2
( + sen2 q1 )
a1 =
k
1
a2 =
( + sen2 q1 )
k

3
2
2
2
a3 =
3 ( + sen q1 )
k 2
Sin embargo, independiente de que la eleccion de a3 sea diferente (5.9.18), se demostrara
en adelante que si a1 ha de ser positivo (lo cual es necesario para la positividad de Md ), la
ecuacion de energa potencial no admite ninguna solucion con un mnimo local en q1 = 0
(perla vertical superior).
Proposici
on 5.9.1. Considerese el sistema descrito por (5.9.17). El sistema de ecuaciones (5.9.18) del metodo IDA-PBC no admite ninguna solucion con Md denida positiva
en un entorno de q1 = 0 (perla en el cenit de la circunferencia), compatible con la existencia de un mnimo de Vd en dicho punto.
Demostraci
on. De hecho, la siguiente igualdad debe ser cierta para la funcion de energa
potencial deseada Vd :
G {q V Md M 1 q Vd } = 0

Captulo 5. Reducci
on del metodo IDA-PBC para sistemas subactuados

127

lo cual en nuestro sistema se convierte en


a1 Vd
a2
V
Vd
+
=
2
q1
+ sen q1 q2
qk

(5.9.19)

Suponiendo que a1 es distinto de cero, la solucion de esta EDP se expresa como la suma
de una solucion general de la ecuacion homogenea mas la particular de la completa:
  q1

 q1
a2
mgsenq1
dq1
(5.9.20)
Vd = q2
dq1
2
a1 ( + sen q1 )
a1
donde = (z) es la funcion arbitraria de la solucion homogenea y z servira para designar
el argumento de la funcion libre (z es funcion de q1 y q2 ). La solucion Vd tendra un
mnimo en q1 = 0 si y solo si
Vd
(q ) = 0
q
2 Vd
(q ) > 0
q 2

(5.9.21)
(5.9.22)

A n de que la ecuacion (5.9.21) sea cierta es necesario que z = 0. La matriz Hessiana


de (5.9.22) es
 


z 2 2
z z
mg senq1
2

|
(
0

q=q
q=q
z
z
q1
q1 q2
q
a1
+
2q Vd (q ) =
.
(5.9.23)
z z
z 2 2
2

|
(
)

|
0
0
q=q
q=q
z
q1 q2 z
q2
Notese que la segunda matriz de esta expresion corresponde a la solucion no homogenea.
La primera matriz es singular al ser el Hessiano de una funcion escalar . Observando
los elementos diagonales y el determinante podemos concluir que esta matriz es denida
positiva si y solo si
2z |q=q >= 0
mgsenq1
> 0.
2z |q=q
q
a1

(5.9.24)
(5.9.25)

La primera condicion se cumple mediante una apropiada eleccion de , mientras que la


u
ltima depende u
nicamente del signo del factor derivativo, que se calcula derivando por
partes


mgsenq1
mg

(5.9.26)
= a1 > 0.
q
a1
q=q
q=q
Esta condicion no puede ser cierta si a1 > 0, que es una suposicion natural que se desprende de la exigencia de que el sistema en bucle cerrado posea estructura hamiltoniana,
con matriz de inercia denida positiva.
Continuando con el razonamiento, se obtendra el conjunto de posiciones q donde la
funcion de energa potencial (5.9.20) presenta un mnimo. Dado que

2 Vd
2 mgsenq1
mg
sen(q1 ) da1

cos(q1 ) +
,
|q=q = 2
=
q 2
q
a1
a1
a1 dq1
q

(5.9.27)

128

El termino

5.9. Extension de la soluci


on a otros sistemas
da1
dq1

se calcula por medio de


22 senq1 a22
d
a1 (q1 ) =
dq1
( + sen2 q1 )2 a1

Sustituyendo esta u
ltima expresion en (5.9.27) y reordenando los elementos se llega a


2 Vd
22 sen2 q1 a22
cos q1
1+
(5.9.29)
|q=q =
q 2
a1
( + sen2 q1 )2 a1
La u
nica manera de lograr que (5.9.29) sea mayor que cero es haciendo cos q1 < 0, lo
cual limita los posibles puntos de equilibrio del sistema hamiltoniano en bucle cerrado al
intervalo q1 [ 2 , 3
], la mitad inferior de la circunferencia.
2
2

Este
es un resultado previsible que se desprende de las consideraciones fsicas apuntadas al comienzo de este apartado, pero con el se ha pretendido ilustrar como se maniestan estos fenomenos al aplicar el metodo IDA-PBC. El problema surge del hecho de que
el metodo obvia las consideraciones de controlabilidad previas al dise
no de un controlador.

Captulo 6
Estabilizaci
on de oscilaciones en
sistemas no lineales
6.1 Introduccion
La mayor parte de las tecnicas de control desarrolladas en las ultimas decadas abordan
los problemas de estabilizacion asintotica de puntos de equilibrio y el seguimiento de
trayectorias. As sucede, por ejemplo, con el metodo IDA-PBC estudiado en captulos
previos de esta tesis. Sin embargo, en algunos sistemasincluyendo conversores de alterna
y robots caminantesel objetivo consiste en obtener oscilaciones estables y robustas.
La estabilizacion de oscilaciones es un problema que se ha considerado en la literatura
(Fradkov & Pogromsky 1998, Leonard, Bloch & Marsden 1998) empleando diferentes
metodologas.
Se presentara en este captulo un metodo para la generacion de oscilaciones estables
por realimentacion del estado en una clase de sistemas de control no lineales. El objetivo
propuesto es la estabilizacion basada en la energa de oscilaciones en sistemas mecanicos no
lineales en cascada. Las oscilaciones estan asociadas a un ciclo lmite que surge a traves de
una bifurcacion de Hopf supercrtica. El metodo que se introduce a continuacion consiste
en dos pasos. En primer lugar, un sistema de segundo orden sera controlado para dar
lugar a uno nuevo que experimenta una bifurcacion de Hopf all donde emerge un ciclo
lmite. En el segundo paso, el controlador se extiende a sistemas de orden mayor mediante
backstepping. A n de ilustrar el metodo descrito se ha realizado una implementacion sobre
un sistema de levitacon magnetica y se ha simulado el funcionamiento sobre un clasico
sistema mecanico subactuado: la bola y la viga.
En la parte nal del captulo se presentara otra tecnica alternativa para la estabilizacion de oscilaciones por realimentacion del estado. Para ello deniremos un sistema
de dimension dos que exhibe oscilaciones periodicas estables y robustas y lo sumergimos
en el espacio de estados de orden mayor del sistema a controlar, empleando la tecnica
de Inmersi
on e Invariancia de (Astol & Ortega 2001). Con este n, extenderemos el
resultado principal de esta tecnica que en su origen se aplica a la estabilizacion de equilibrios. Con peque
nas modicaciones el resultado se traslada tambien a la estabilizacion
de orbitas periodicas como se pretende aqu.
La ventaja principal de una ley de estabilizacion de oscilaciones mediante una reali129

130

6.1. Introducci
on

mentacion pura del estado frente a la posibilidad alternativa de seguimiento de trayectorias


sinusoidales de referencia es, ademas de no depender de se
nales variantes en el tiempo, lo
cual diculta tanto la implementacion como las pruebas de estabilidad y robustez, esta
en el hecho de que mediante la tecnica que se presentara no se persigue una trayectoria
con informacion de fase, con lo cual el sistema puede entrar en oscilacion desde cualquier
punto de la orbita, y por tanto el error en seguimiento es una medida de la distancia al
punto mas cercano de la orbita. En el caso tradicional de seguimiento de trayectorias, la
referencia posee una informacion de fase que obliga al sistema a incorporarse a la orbita
en punto exacto, lo cual puede dar lugar a una variable de medida del error mayor y
retrasar el transitorio hasta la convergencia en el lmite. Este efecto se ilustra en la gura
6.1.
Trayectoria de
la garra del robot

Trayectoria de
referencia
con informacin
de fase

Trayectoria de
la garra del robot

error
en t=0

error
en t=0
Orbita objetivo
sin informacin de fase

Posicin de la
rbita de referencia
en el punto de alcance
Posicin inicial de la
rbita de referencia

Figura 6.1: Comparacion entre el seguimiento de trayectorias dependientes del tiempo (izquierda) y la estabilizaci
on de orbitas peri
odicas sin informaci
on de fase (derecha).

En este captulo tambien estudiaremos la bifurcacion de Hopf (Hale & Kocak 1991,
Kuznetsov 1995) que aparece asociada a un parametro del controlador que propondremos.
La bifurcacion de Hopf es uno de los escasos metodos que permiten para determinar
la existencia de ciclos lmite en sistemas de dimension alta. Este hecho se emplea en
este captulo para generar de oscilaciones estables y robustas mediante el dise
no de un
controlador capaz de lograr que los sistemas pertenecientes a una clase no lineal, que
incluye una variedad de sistemas subactuados, experimenten una bifurcacion de este tipo.
El metodo introducido en este captulo para dise
nar el controlador comprende dos
pasos principales. En el primero se considera un sistema de segundo orden en bucle abierto.
Con la ley de realimentacion apropiada, este subsistema es transformado en otro con una
bifurcacion de Hopf y, consiguientemente, un comportamiento oscilante (Aracil, Gordillo
& Acosta. 2002). Entonces, en un segundo paso, la tecnica denominada backstepping
(Khalil 1996, Krstic, Kanellakopoulos & Kokotovic 1995, Sepulchre et al. 1997) se aplica
para extender la ley de control al sistema completo de orden mayor de tal manera que la
bifurcacion de Hopf se mantiene y, entonces, el comportamiento oscilante del subsistema
de segundo orden se propaga hacia todas la variables.
El metodo empleado para obtener la ley de realimentacion para el subsistema del
primera fase de dise
no pertenece a la familia de controladores no lineales relacionados con
metodos de moldeo de energa (Ortega et al. 1998). Tal y como se ha publicado recientemente la mayora de estos metodos proporcionan leyes de realimentacion que dirigen al
sistema controlado hacia un punto de equilibrio aislado (el punto de trabajo). Sin embargo, nuestro objetivo se ha transformado en la consecucion de un ciclo limite en regimen

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

131

permanente, que nace en una bifurcacion de Hopf. Conviene notar que el nacimiento
del ciclo lmite asociado a una bifurcacion de Hopf tiene lugar en un espacio de dos dimensiones. Este es el espacio natural en el que se dene el subsistema de segundo orden
en bucle abierto considerado en la primera fase del metodo. De hecho, el metodo que
se presenta en estas paginas comienza con la bifuracion de Hopf (y por tanto del ciclo
lmite) en este subespacio, y entonces se extiende al espacio de estados completo. Este hecho subraya la relevancia de la bifurcacion de Hopf como fundamento teorico del enfoque
presentado.
Igualmente cabe destacar que un sistema que presente una bifurcacion de Hopf es tal
que para ciertos valores del parametro de bifurcacion el sistema tiene un punto atractor,
que es el caso normalmente considerado en sistemas control no lineales convencionales;
sin embargo para otros valores de el conjunto lmite del sistema dinamico se transforma
en un ciclo lmite y el sistema oscila de un modo estable y robusto.
Una vez concluido el dise
no del controlador para el sistema de segundo orden, el problema consiste en la extension del comportamiento oscilante a todas las variables de estado.
La solucion viene de la mano de un procedimiento recursivo basado en el backstepping.
En la segunda fase de dise
no comenzaremos con el controlador y la funcion de Lyapunov
obtenidos en la primera fase, para obtener, seguidamente, mediante backstepping un controlador y una funcion de Lyapunov de control para un subsistema de tercer orden. El
proceso se repite para pasar a cuarto orden, quinto, y as sucesivamente. La clase de
sistemas considerada en los ejemplos de este captulo no excede el cuarto orden, pero la
metodologa no se restringe a ellos. Uno de los resultados clave del captulo se centra
en el hecho de que la bifurcacion de Hopf detectada en el sistema de segundo orden se
mantiene gracias a la tecnica de backstepping en los sistemas completos de orden mayor
aqu considerados.
Una implicacion muy interesante reside en el hecho de que el sistema bucle cerrado
obtenido tras aplicar la tecnica basada en backstepping a la clase de sistemas aqu considerada tiene estructura hamiltoniana generalizada. De este modo, se ha detectado una
sorprendente interrelacion entre backstepping y la estructura hamiltoniana generalizada.
Las consecuencias de este hecho son exploradas de manera supercial, quedando abierta
una interesante lnea de investigacion.
El metodo propuesto en este captulo funciona debidamente para sistemas completamente actuados, en cuyo caso la solucion es trivial, y para una clase de subactuados que es
la que se tratara en detalle. A n de ilustrar el metodo se han seleccionado como ejemplos
dos sistemas mecanicos subactuados bien conocidos en la literatura y en el desarrollo de
esta tesis: el sistema de levitacion magnetica y la bola en la viga.
El resto del captulo se organiza como sigue. En la seccion 6.2, se presenta una funcion
de Lyapunov de control apropiada para la obtencion del comportamiento oscilante en el
sistema de segundo orden en bucle cerrado. Empleando dicha funcion como hamiltoniano
del sistema, se obtiene un sistema en bucle cerrado que presenta una bifurcacion de Hopf.
Este sistema es considerado como la dinamica objetivo para un sistema de bucle abierto
de segundo orden. En la seccion 6.3, se introduce una ley sencilla para la estabilizacion de
oscilaciones en sistemas de segundo orden que sirve de base a los desarrollos posteriores.
Las secciones 6.4 y 6.5 describen una tecnica inspirada en el backstepping que se empleara
recursivamente para calcular una ley de control para sistemas de tercer orden. En la
seccion 6.6 se presentan los resultados teoricos destinados a extender el metodo de dise
no
a sistemas subactuados de cualquier orden que posean estructura en cascada. Se probara
que la bifurcacion de Hopf se mantiene a lo largo de cada iteracion del procedimiento de

132

6.2. Un sistema hamiltoniano generalizado oscilatorio de segundo orden

backstepping.
La seccion 6.7 discute, en virtud de los teoremas de linealizacion por realimentacion,
la posibilidad de extender los resultados del captulo a sistemas con estructuras mas
generales, no estrictamente en cascada. El apartado 6.8 presenta una expresion cerrada
para ley de control de estabilizacion de oscilaciones que se aplica a la clase de sistemas
descrita en 6.7.
En el apartado 6.9 el metodo se aplicara a dos conocidos sistemas subactuados: el
sistema de levitacion magnetica (tercer orden) y la bola en la viga (cuarto orden). En el
primero de ellos se vericaran los resultados teoricos en un sistema real de laboratorio. En
el caso de la bola en la viga se analizaran las cuencas de atraccion limitadas al emplear un
controlador basado en un modelo aproximado. Adicionalmente se demostrara la existencia
de una bifurcacion de Hopf en el sistema controlado. La seccion 6.10 trata el problema
de estabilizacion de oscilaciones mediante una tecnica alternativa de reciente desarrollo,
el metodo de Inmersi
on e Invariancia(Astol & Ortega 2001).

6.2 Un sistema hamiltoniano generalizado oscilatorio de segundo


orden
El objetivo de este apartado es denir sistema bidimensional no lineal de la forma x =
f (x), x = (x1 , x2 ) IR2 , que presente un ciclo lmite. Mas adelante se dise
nara la ley de
control que ajuste este sistema con el de bucle abierto. A este n, considerese la funcion

2
 1
V0 (x1 , x2 ) = (c2 x21 + x22 )2 (c2 x21 + x22 ) + ,
4
2
4

(6.2.1)


donde c IR and IR seran los parametros de dise


no. Deniendo P (x1 , x2 ) =
2 2
2
c x1 + x2 , se tiene
1
V0 = P 2
(6.2.2)
4
El mnimo de V0 se alcanza en P = 0. Dependiendo de los valores del parametro la
funcion V0 adopta dos formas geometricas muy diferentes. Para < 0 poseera un mnimo
u
nico en el origen del plano (x1 , x2 ), como se muestra en la gura 6.2; sin embargo para
> 0 los mnimos de V0 se alcanzan en la curva cerrada c2 x21 + x22 = (gura 6.3).
La forma de la funcion V0 invita a considerar los sistemas para los cuales V0 es una
funcion de Lyapunov (Mees & Chua 1979). Se espera que los conjuntos lmite sean puntos
de equilibrio para < 0, y para > 0 ciclos lmite. Un modo de lograr un sistea dinamico
con V0 como funcion de Lyapunov es denir el sistema hamiltoniano generalizado (Van
der Schaft 2000)


x 1
x 2


=

0
1
2 x2 +x
2
c 1

c2 x21 +x22




Dx1 V0
.
Dx2 V0

(6.2.3)

donde V0 es la funcion de Hamilton. La aparicion del denominador c2 x21 + x22 en los


elementos de la matriz simplectica no debe sorprender pues estan destinados a cancelar
el factor com
un P que aparece en las derivadas de V0 . De hecho lo que se persigue es que

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

Figura 6.2: V0 para < 0, con un u


nico mnimo.

Figura 6.3: V0 para > 0 con un conjunto mnimo formado por una curva cerrada.

133

134

6.2. Un sistema hamiltoniano generalizado oscilatorio de segundo orden

en ausencia de amortiguamiento la segunda ecuacion de estado coincida con la del clasico


movimiento armonico simple u oscilador armonico
x1 = c2 x1 ,
o equivalementemente

x 1
x 2


=

x2
c2 x1

(6.2.4)

.

(6.2.5)

La derivada con respecto al tiempo de la funcion V0 es



V 0 =

V0
x

T
x = [ c2 x1 P x2 P ]

x 1
x 2


.

(6.2.6)

Empleando la ecuacion (6.2.5) se obtiene V 0 = 0 a lo largo de las trayectorias de


este sistema, el cual, por tanto, es un sistema conservativo con respecto a la funcion de
almacenamiento V0 .
nadir amortiguamienPara obtener un sistema dinamico tal que V 0 < 0, debemos a
to. Con esta nalidad, se ha de realizar una ligera modicacion en la ecuacion (6.2.3),
a
nadiendo un termino de amortiguamiento con el que se obtiene


  
1
0
2
2
D
x 1
V
2
x1 0
c x1 +x2
=
,
(6.2.7)
1
x 2
2 x2 +x
k
D
2
a
x2 V0
c 1

siendo ka > 0 un coeciente de amortiguamiento1 . El sistema (6.2.7) puede escribirse


como
x 1 = x2
x 2 = c2 x1 ka P x2 .

(6.2.8)
(6.2.9)

No siempre sera necesario incluir de forma explcita un termino de amortiguamiento para


lograr la desigualdad en sentido estricto en la derivada de la funcion de Lyapunov. Esto se
debe al hecho de que el termino de amortiguamiento de la ecuacion (6.2.9) tiene la forma
P x2 . Por tanto, si un termino de este tipo aparece en alg
un punto del desarrollo, incluso
sin haber introducido explcitamente el amortiguamiento, el efecto sera el mismo. Como
se vera mas adelante, esto es exactamente lo que ocurre cuando aplicamos backstepping
en sistemas de orden mayor que dos.
El sistema (6.2.8)(6.2.9) tiene la muy interesante propiedad de exhibir una bifurcacion
de Hopf para = 0. Este hecho se puede apreciar de forma intuitiva en las gracas 6.2 y
6.3, donde se hace visible que para = 0 la geometra de V0 sufre un cambio radical. A
partir de este punto, el mnimo aislado que exista originalmente para valores negativos
de > 0 se transforma en una elipse en torno al origen (gura 6.3) descrita por la
ecuacion con P (x1 , x2 ) = 0. Estas formas proporcionan una intuicion geometrica sobre
los comportamientos esperados del sistema.
1
Se podra argumentar que la disipaci
on puede igualmente introducirse en la primera lnea de (6.2.7).
En la pr
actica esto no es viable porque esta primera la toma la forma x 1 = x2 invariablemente en
sistemas mecanicos.

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

135

Proposici
on 6.2.1. El sistema (6.2.8)(6.2.9) atraviesa una bifurcaci
on de Hopf asociada al equilibrio x1 = x2 = 0 cuando = 0.
Demostracion. Es palpable que el origen representa un punto de equilibrio para cualquier
valor del parametro . La linealizacion en este punto viene dada por

 


x1
0
1
x 1
=
,
(6.2.10)
x 2
x2
c2 ka
cuyo polinomio caracterstico es 2 ka + c2 y los correspondientes autovalores son, a
su vez,
$
ka (ka )2 4c2
1,2 =
.
(6.2.11)
2
Entonces, para < 0, se tiene Re() < 0 y el origen es estable; para = 0, = jc y
el origen es un equilibrio no hiperbolico; y para > 0, Re() > 0 y el origen es inestable.
Consecuentemente el sistema (6.2.8)(6.2.9) tiene un equilibrio u
nico en el origen para
< 0, y para > 0 este equilibrio se torna inestable. La condicion de transversalidad se
satisface dado que

ka
dRe[(0 )]
=
= 0

d
2
=0
2
2
Comentario 6.2.1. Resulta de interes considerar que para ka = 0, el sistema (6.2.8)(6.2.9)
se reduce a x = c2 x, un sistema cuyo retrato de estados lo forma un continuo de orbitas
cerradas que llena densamente el espacio de estados. Sin embargo estos comportamientos
oscilatorios no son estructuralmente estables. El efecto del amortiguamiento no es mas
que seleccionar entre todos las orbitas periodicas una en particular a la que se le asignara
un estado de mnima energa. El sistema alcanzara y se mantendra en dicha orbita de
forma estable y robusta.
Comentario 6.2.2. El perodo inicial (de la oscilacion de amplitud nula) es
T0 =

2
c

ya que jc son los autovalores de (6.2.10) para = 0 en el punto de equilibrio. Cuando


> 0 los efectos de la no linealidad se maniestan en la aparicion del ciclo lmite (que
no es un fenomeno reproducible en sistemas lineales). T0 es una estimacion del periodo
esperado de las oscilaciones. De este modo, c es un parametro que se puede emplear
para obtener la frecuencia deseada en las oscilaciones. En principio, esta aproximacion es
razonablemente buena para peque
nos valores de . Sin embargo, la siguiente proposicion
extiende la validez de la aproximacion y mas a
un, ayuda a comprender el comportamiento
del sistema lejos del punto de bifuracion.
Proposici
on 6.2.2. Considerese el sistema (6.2.8)-(6.2.9). Si < 0 el origen es globalmente asint
oticamente estable. Si > 0, para cualquier condici
on inicial salvo el origen,
las trayectorias tienden al ciclo lmite P = 0 con periodo 2/c .
Demostracion. Es facil de comprobar que la funcion radialmente no acotada V0 satisface
V 0 = ka P 2 x22 0. Procedamos a calcular los conjuntos invariantes para los cuales
V 0 = 0.

136

6.3. Estabilizacion de oscilaciones en sistemas de orden dos

Una primera posibilidad esta asociada a x2 (t) 0, lo cual implica que x 1 = 0 (de
(6.2.8)) y x 2 = 0 (del signo de identidad). Empleando (6.2.9) esto signica que
c x21 = 0 x1 = 0. En consecuencia, este caso corresponde al punto (x1 , x2 ) =
(0, 0). Por linealizacion se puede ver que este punto es localmente estable para < 0
y localmente inestable para > 0.
La segunda posibilidad es la de P = 0. Este conjunto no existe para < 0.
En consecuencia con la aplicacion del principio de invariancia de LaSalle (Khalil 1996)
se prueba la primera parte de la proposicion. Para la segunda, a
un hemos de demostrar
que la curva P = 0 es realmente un ciclo lmite, o dicho de otro modo, demostraremos la
ausencia de puntos de equilibrio sobre P = 0. Procederemos por contradiccion: supongase
que existe dicho equilibrio en P = 0. De (6.2.8), se tiene x2 = 0 y de (6.2.9) con P = 0
se tiene x1 = 0. Pero x1 = x2 = P = 0 solo es posible si = 0.
Finalmente para P = 0, el sistema (6.2.8)(6.2.9) se reduce a (6.2.4) para el cual el
2
periodo de las oscilaciones es 2/c .
Al ser el ciclo lmite estable y, para > 0, existe cuando el equilibrio es localmente
estable, se desprende el siguiente corolario.
Corolario 6.2.3. La bifurcaci
on de Hopf de la proposici
on 6.2.1 es supercrtica.

6.3 Estabilizacion de oscilaciones en sistemas de orden dos


Para un sistema de segundo orden de la forma2

x 1 = x2
x 2 = g(u),

(6.3.1)
(6.3.2)

donde g 1 () existe sobre el dominio de interes, los resultados de las secciones previas
permiten tratar con el problema de dise
no de un controlador que haga que el sistema
oscile. Es claro que el sistema en bucle abierto (6.3.1)-(6.3.2) puede ser ajustado para
obtener el comportamiento en bucle cerrado (6.2.5) mediante la ley de control
u = g 1 (c2 x1 ka P x2 ).

(6.3.3)

Adicionalmente, V0 es una funcion de Lyapunov de control del sistema. Esto signica que
los conjuntos lmite del sistema (6.3.1)-(6.3.2) tras la aplicacion de (6.3.3) son los mnimos
de V0 ; es decir, una curva cerrada para > 0 y un punto aislado para < 0. Entonces el
comportamiento del sistema en bucle cerrado sera oscilatorio o asintoticamente estable,
2

Esta estructura se puede extender trivialmente a la forma


x 1
x 2

= x2
= f (x1 , x2 ) + g(u)

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

137

dependiendo del signo del parametro . Esto puede ser enunciado alternativamente indicado que el sistema atraviesa una bifurcacion de Hopf cuando = 0.
Con estos resultados, el dise
no de un controlador para un sistema de segundo orden con
un actuador de la forma (6.3.1)(6.3.2) puede lograrse si las condiciones apropiadas son
satisfechas. Este resultado admite una generalizacion a sistemas con muchos actuadores
e incluso a una clase mas amplia. Por ejemplo, si el sistema a controlar es un robot con
actuadores en todas sus articulaciones, entonces se podra aplicar a cada una de ellas una
ley del tipo (6.3.3). De este modo cada una de las diferentes articulaciones puede entrar
en oscilacion de forma independiente.

6.4 Backstepping para una clase de sistemas no anes


La estabilizacion de oscilaciones tal y como se ha presentado en sistemas de orden dos es
trivial. Sin embargo sirve de base para la extension a una clase de sistemas subactuados de
orden ilimitado, que sera objeto de interes en este captulo. La segunda herramienta que
se precisa para la extension a orden mayor esta basada en el metodo backstepping (Khalil
1996, Krstic, Kanellakopoulos & Kokotovic 1995, Sepulchre et al. 1997) introducido en la
seccion 2.7.4.
En esta seccion, se desarrollara la aplicacion del metodo backstepping para sistemas
que no son anes en las variables que se emplearan como control virtual. Considerese el
sistema
= f () + g()
= u,

g() =

0
1

(6.4.1)
(6.4.2)


h() = bh(),

donde IR2 , IR. Suponga que este sistema tiene un punto de equilibrio en (0, 0, ),
es decir f (0) = 0 y h( ) = 0, y adicionalmente h ( ) = 0.
Con el n de aplicar backstepping, considerese en primer lugar el sistema (6.4.1) con
como control virtual. Supongase que existe una ley de realimentacion = u0 () tal que
el sistema (6.4.1) tiene las propiedades de estabilidad deseadas. Dicho de otro modo, el
sistema
= f () + g(u0 ())
(6.4.3)
es estable, o al menos sus trayectorias estan acotadas. Adicionalmente, supondremos que
existe una funcion de Lyapunov V0 tal que
V0 (f () + g(u0 ())) 0.
Sumando y restando g(u0 ()) al segundo miembro de la ecuacion (6.4.3) se tiene
= f () + g(u0 ()) + g() g(u0 ())
= f () + g(u0 ()) + b(h() h(u0 ()))
= f () + g(u0 ()) + bz,

138

6.5. Un metodo para la estabilizaci


on de oscilaciones mediante backstepping


donde hemos introducido z = h() h(u0 ()). De acuerdo con esta u


ltima denicion de
z se tiene

z = h h u0 .
Si denimos v = z y recordamos que u = entonces
u = u0 +

v
.
h

(6.4.4)

Las ecuaciones (6.4.1)-(6.4.2) se pueden escribir como sigue


= f () + g(u0 ()) + bz
z = v

(6.4.5)
(6.4.6)

Proponiendo para este sistema la funcion de Lyapunov


1
V1 = V0 + z 2
2

(6.4.7)

se obtiene
V 1 = V0 + z z
= V0 (f () + g(u0 ())) + V0 bz + zv.
Entonces para lograr que V 1 0 una eleccion razonable es
v = ( V0 b + kz),
es decir
u = u0

V0 b + kz
h

= u0 (f () + g())

1
k
(h() h(u0 ()))
V0 b 

h
h ()

(6.4.8)

que es la ley de realimentacion para el sistema (6.4.1)-(6.4.2). Con esta ley


V1 = V0 (f () + g(u0 ())) kz 2 ,

(6.4.9)

que es menor o igual que cero.

6.5 Un metodo para la estabilizacion de oscilaciones mediante backstepping


El metodo presentado en la seccion 6.3 puede ser extendido a sistemas en cascada cuya
dimension es superior a dos, incluyendo una amplia clase de subactuados. Con este objetivo, emplearemos la tecnica backstepping para sistemas no anes de la seccion anterior.
Para un comienzo motivador, considerese la siguiente clase de sistemas de tercer orden
1 = 2
2 = h()
= u,

(6.5.1)

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

139

donde = (1 , 2 ) IR2 y IR. Supongamos que h() es invertible y h () = 0 en


todo el dominio de interes IR3 . Asimismo, supongamos que el sistema, en ausencia
de accion de control, posee un punto de equilibrio en (0, 0, ); es decir h( ) = 0. Sea

P () = c2 12 + 22 = 0 el conjunto lmite deseado.
Las dos primeras ecuaciones dan un subsistema de segundo orden con como variable
de control virtual, que puede ser transformada en la forma (6.2.5) haciendo h() = c2 1 ,
es decir, con la ley de control virtual


= u0 (1 ) = h1 (c2 1 ).

(6.5.2)

Pese a que la construccion del subsistema oscilante de segundo orden as lo sugera, el


amortiguamiento a
un no ha sido introducido en esta fase de dise
no. Las razones se
aportaran mas adelante. De este modo, la funcion V0 (1 , 2 ) = P 2 /4 satisface V 0 = 0.
A n de trasladar la accion de control desde la tercera ecuacion de (6.5.1) a la segunda,
podemos hacer uso del procedimiento de backstepping (vease la seccion 6.4). Empleando
la ecuacion (6.4.8) con la V0 denida (6.2.1) se obtiene la siguiente ley de control:

1 
(6.5.3)
u = u1 (1 , 2 , ) = u0 (1 )2 
2 P + k1 (h() + c2 1 ) .
h ()
Comentario 6.5.1. Notese que para la eleccion de V0 dada en (6.2.1), obtendremos V0 b =
x2 P , que tomara el papel de ka P x2 en (6.2.9). Esto signica que la ley de realimentacion
(6.5.3) esta dotada de un termino de amortiguamiento. Esta es la razon para no introducir
amortiguamiento en (6.5.2).
Proposici
on 6.5.1. Si > 0, para cualquier condici
on inicial en , excepto el punto

a al ciclo lmite
(0, 0, ), el sistema (6.5.1) con la ley de control (6.5.3) se aproximar
P () = 0 cuando t . Si < 0, para cualquier condici
on inicial en , el sistema
(6.5.1) con la ley de control (6.5.3) se tendera al punto (0, 0, ) cuando t .
Demostracion. el control mediante backstepping (6.5.3) asegura que la funcion
1
V1 = V0 + z12 ,
2

(6.5.4)

con z1 = h() + c2 1 , satisface V 1 = k1 z12 0 (vease (6.4.9) en la seccion 6.4). A


continuacion procederemos a calcular los conjuntos invariantes donde V1 = 0:
V 1 0 z1 (t) 0 h() + c2 1 0.
Al ser la funcion h() invertible y u0 (1 ) = h1 (c2 1 ), V 1 0 u0 (1 ) 0 y por
tanto3
V 1 0 u0 (1 )1 0 u u0 (1 )2 0.
Empleando la expresion (6.5.3)

1 
V 1 0 
2 P + k1 (h() + c2 1 ) 0.
h ()
El factor multiplicado por k1 es igual a z1 , que estamos asumiendo igual a cero, y por
tanto
V 1 0 2 P 0.
Esta u
ltima expresion puede ser satisfecha en dos casos:
3

Tengase en cuenta el signo de identidad mantenido a lo largo del tiempo.

140

6.5. Un metodo para la estabilizaci


on de oscilaciones mediante backstepping

P 0. Este conjunto no existe para < 0.


2 0 h() = 0 c2 1 = 0 1 = 0. Esta situacion corresponde al equilibrio
(0, 0, ). Por linealizacion puede comprobarse que el equilibrio es inestable cuando
> 0 y estable cuando < 0.
Por tanto, aplicando el principio de LaSalle y siguiendo el mismo razonamiento que al
termino de la prueba de la Proposicion 6.2.2, el enunciado de la Proposicion 6.5.1 queda
demostrado.
2
Comentario 6.5.2. En regimen permanente, la variable tambien oscila ya que z1 0
h() c2 1 h1 (c2 1 ).
Corolario 6.5.2. Si el sistema (6.5.1) es reemplazado por
1
2
3
4

=
=
=
=
..
.

2
h(3 )
4
5

(6.5.5)

n1 =
= u,
y continuando con el procedimiento basado en backstepping, se obtiene el mismo resultado.
En la seccion 6.9.7 se presenta un ejemplo de la aplicacion del Corolario 6.5.2.
Proposici
on 6.5.3. Considerese el sistema (6.5.1) tras aplicar la ley de realimentaci
on
(6.5.3). El sistema experimenta una bifurcaci
on de Hopf para = 0.
Demostraci
on. Tras la aplicacion de la ley de realimentacion (6.5.3), el sistema en bucle
cerrado es
x 1 = x2
x 2 = h(x3 )
x 3

(6.5.6)

1
= u0 (x1 )x2 
(k1 c2 x1 + x2 P + k1 h(x3 )).
h (x3 )

A n de obtener la linealizacion de este sistema en torno al origen debe hacerse notar que
u0 (0) = c2 /h (x3 ) y por tanto

  2

(h ) h h
u
= k1

x3 (0,0,x )
(h )2
(0,0,x )
3

pero al ser h(x3 ) = 0 este termino es igual a k1 , y el resto de la matriz jacobiana toma
la forma

0
1
0
x 1

(6.5.7)
0

x 2 = 0
k1 c2
c2
x 3
k1

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

141

donde = h (x3 ). El polinomio caracterstico del jacobiano viene dado por


s3 + k1 s2 + (c2 )s + c2 k1
que es un polinomio Hurwitz si son satisfechas las siguientes condiciones: 1) k1 > 0 y
(c2 ) > 0; y 2) k1 (c2 ) > k1 c2 , es decir < 0. Recordando (2.5.1)-(2.5.2) las
condiciones de existencia de un par de autovalores imaginarios para n = 3 son
a0 > 0 , a2 > 0 , a1 a2 = a 0 .
La u
ltima condicion conduce a k1 c2 = k1 (c2 ), lo cual implica que = 0. La
condicion de transversalidad es satisfecha al cambiar el signo a1 a2 a3 = cuando
cambia el signo de . Por consiguiente, el sistema es estable para < 0, y la estabilidad
se pierde para = 0 cuando se produce la bifurcacion de Hopf. Para este u
ltimo valor
crtico de el polinomio caracterstico de la matriz Jacobiana se transforma en
s3 + k1 s2 + c2 s + c2 k1 (s2 + c2 )(s + k1 )
donde la existencia de dos races puramente imaginarias para = 0 se hace patente.

A continuacion se demostrara que mediante un sencillo cambio de variable el sistema


en bucle cerrado admite una descripcion hamiltoniana generalizada. Tras la aplicacion de
la ley de realimentacion (6.5.3) a (6.5.1) se obtiene
1 = 2
2 = h()
2
1
= 0 2  (2 P + k1 z1 ),
h
h

(6.5.8)

donde z1 = h() + c2 1 . Escribiendo la ecuacion (6.5.8) en el espacio (1 , 2 , z1 ) obtendremos


1 = 2
2 = c2 1 + z1
z1 = 2 P k1 z1 ,
que puede ser reescrito como


1
0

1
2 = P
0
z1

0
1 P

0
1 2 P ,
1 k1
z1

(6.5.9)

1
P

(6.5.10)

donde la u
ltima columna es x V1 , siendo x = [1 2 z1 ]T . Notese que el sistema (6.5.10) es
la version en dimension tres de (6.2.7). La matriz del sistema tiene una deseable propiedad
estructural: admite la descomposicion en la suma de una diagonal negativa y una antisimetrica. Esto permite interpretar el sistema (6.5.10) como un sistema hamiltoniano
generalizado (Van der Schaft 2000). Tambien puede ser reescrito como

1
0
0
0
0
0
1
P

(6.5.11)
2 = P1 0 1 x V1 + 0 0 0 x V1 ,
0 1 0
z1
0 0 k1

142

6.6. Sistemas de orden mayor

donde el sistema ha sido disociado en partes conservativa y disipativa. De este modo


el comportamiento del sistema puede comprenderse como la union de un movimiento
conservativo al que se superpone un efecto de amortiguamiento para alcanzar el comportamiento oscilatorio, modelado por la parte disipativa del comportamiento en bucle
cerrado. El subsistema conservativo es tal que la cantidad conservada es precisamente
V1 . Por tanto, la funcion de Lyapunov obtenida mediante backstepping proporciona una
cantidad conservativa para el sistema en bucle cerrado.

6.6 Sistemas de orden mayor


A continuacion se extenderan los resultados previos a sistemas no lineales no anes con
estructura en cascada de la forma
x 1
x 2
x 3
x 4
x n1
x n

=
=
=
=
..
.
=
=

x2
h3 (x3 )
h4 (x4 )
h5 (x5 )

(6.6.1)

hn (xn )
u,

Para el calculo de la ley de control no se presentara una formula explcita, sino que se
realizara un calculo recursivo que facilitara su comprension. Para ello comenzaremos con
el subsistema de segundo orden (x1 , x2 ).
x 1 = x2
x 2 = u2
Donde u2 es la ley de control que estabiliza el sistema en la oscilacion deseada con funcion
de Lyapunov V2 = P 2 /4. Concretamente
u2 = c2 x1 k2 P x2
siendo k2 > 0 un parametro libre. Si extendemos el sistema a tercer orden
x 1 = x2
x 2 = h3 (x3 )
x 3 = u3
y denimos


u2 )
u2 = h1
3 (


z3 = h3 (x3 ) h3 (u2 ) = h3 (x3 ) u2


1
V3 = V2 + z32
2
tendremos, en virtud de lo expuesto anteriormente, que la ley


1
V2

k3 z3
u3 = 
h (u2 )u 2
h3 (x3 ) 3
x2

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

143

estabiliza asintoticamente el conjunto P = 0 en el sistema de tercer orden, con funcion


de Lyapunov V3 . Para llegar a identicar el termino general de control para un sistema
de mayor dimension, es preciso repetir el proceso para un sistema de orden cuatro
x 1
x 2
x 3
x 4

=
=
=
=

x2
h3 (x3 )
h4 (x4 )
u4

y denamos, de nuevo


u3 = h1
u3 )
4 (


z4 = h4 (x4 ) h4 (u3 ) = h4 (x4 ) u3


1
V4 = V3 + z42
2
entonces la ley de control calculada recursivamente


1
V3

u4 = 
k4 z4
h (u3 )u 3
h4 (x4 ) 4
x3
estabiliza asintoticamente el sistema de cuarto orden en la orbita P = 0 con funcion de
Lyapunov V4 . A partir de aqu es de facil deduccion la ley de control generica, como se
arma en la siguiente proposicion
Proposici
on 6.6.1. Sea el sistema de orden n con la estructura en cascada (6.6.1).
Supongase que el subsistema de orden k > 2 formado por las k 1 primeras ecuaciones
de estado m
as la ecuaci
on
x k = u
se estabiliza asintoticamente en la orbita P = 0 con la ley u = uk . Entonces la ley un
calculada recursivamente seg
un la formula

1
Vi

ui+1 = 
h (ui )u i
i = k...n
(6.6.2)
ki+1 zi+1 ,
hi+1 (xi+1 ) i+1
xi
donde


ui )
ui = h1
i+1 (


zi = hi (xi ) hi (ui1 ) = hi (xi ) ui1


1
Vi = Vi1 + zi2
2
estabiliza asint
oticamente el sistema de orden n en la orbita P = 0.
Demostracion. Tomese Vn como funcion de Lyapunov para comprobar que
V n = k2 P x22 k3 z32 k4 z42 ... kn zn2
Que es nula si y solo si zi = 0 y P = 0. Por el principio de invariancia de LaSalle se
deduce que al ser el u
nico conjunto invariante con funcion de Lyapunov cero la orbita
periodica P = 0, el sistema convergera asintoticamente a dicho conjunto.
2

144

6.6. Sistemas de orden mayor

Tomando la derivada temporal de la variable de error generica zi :


zi = hi (xi )zi+1

Vi1
ki zi ,
xi1

i>2

y dado que
Vi zi
Vi
=
= zi hi (xi ),
xi
zi xi

i = 3...n

se llega a la expresion
zi = hi (xi )zi+1 hi1 (xi1 )zi1 ki zi ,

i3 . . . n

de la que se desprende el siguiente corolario


Corolario 6.6.2. El sistema de orden n con la estructura en cascada (6.6.1) realimentado
con la ley u = un obtenida recursivamente seg
un (6.6.2) y el cambio de variables


z1 = x1


z2 = x2


z3 = h3 (x3 ) h3 (u2 )
..
.

zn = hn (xn ) hn (un1 )
posee la estructura PCH con disipaci
on
z = (J(z) R(z))z Vn
con funci
on de energa Vn , siendo la matriz de interconexi
on

1
0
0
0

0
P
1
1
0
0

P 0


0 1
0

0
h3 (x3 )

0
0 h3 (x3 )
0
h4 (x4 )
J(z) =

0
0

0
0
h4 (x4 )

..
..
..
..
..
...
.
.
.
.
.
0

on
que cumple J(z) = J(z T ) y la de disipaci

R(z) =

0 0 0
0 k2 0
0 0 k3
..
.

...

kn

0
0
0
..
.

0
0
0
0
0
..
.

0
0
0
0
0

hn1 (xn1 )
hn1 (xn1 )
0
(6.6.3)

(6.6.4)

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

145

6.6.1 Caso mas general


Un caso mas general al que podemos aplicar este procedimiento de forma sistematica es
el de la estructura triangular
x 1
x 2
x 3
x 4
x n1
x n

=
=
=
=
..
.
=
=

x2
f2 (2 ) + g2 (2 )h3 (x3 )
f3 (3 ) + g3 (3 )h4 (x4 )
f4 (4 ) + g4 (4 )h5 (x5 )

(6.6.5)

fn1 (n1 ) + gn1 (n1 )hn (xn )


u,

donde fi (), gi () : IRi IR son funciones no lineales de sus argumentos, con gi = 0 y


hi () = 0 en todo el dominio de interes. Ademas se han denido los vectores de dimension
k
k = 1 . . . n 1.
k = [x1 , x2 . . . xk ]T ,
Proposici
on 6.6.3. Si el subsistema de (6.6.5) de orden k formado por las k 1 primeras
ecuaciones m
as x k = u, es decir
x 1 = x2
x 2 = f2 (2 ) + g2 (2 )h3 (x3 )
..
.
x k1 = fk1 (k1 ) + gk1 (k1 )hk (xk )
x n = u,
on de Lyapunov Vk , y denimos
se estabiliza con la ley u = uk (k ) y funci


fk (k ) + uk

1
uk = hk+1
gk (k )


zk+1 = hk+1 (xk+1 ) hk+1 (uk )


1 2

Vk+1 = Vk + zk+1
2
entonces la ley de control
u = uk+1


1
Vk

= 
gk (k ) kk+1 zk+1
h (uk )u k
hk+1 (xk+1 ) k+1
xk

estabiliza el sistema de orden k + 1


x 1 = x2
x 2 = f2 (2 ) + g2 (2 )h3 (x3 )
..
.
x k = fk (k ) + gk (k )hk+1 (xk+1 )
x k+1 = u,
con funcion de Lyapunov Vk+1 .

146

6.7. Revision del metodo empleando linealizaci


on por realimentaci
on

Hemos construido un metodo recursivo directo para el calculo de la ley de control. Sin
embargo por la inclusion del termino gk ha resulta inviable la obtencion de una formulacion
en forma PCH de las ecuaciones de estado.

6.7 Revision del metodo empleando linealizacion por realimentacion


Alternativamente al empleo de la extension de backstepping para sistemas no anes, ilustraremos un metodo de estabilizacion de oscilaciones que explota un cambio de variable
previo para obtener un sistema lineal en cascada sobre el que aplicar la version clasica de
backstepping. El controlador obtenido diere ligeramente de los proporcionados por los
metodos anteriores al ser las variables de la funcion de Lyapunov diferentes. Sin embargo
a efectos practicos los resultados son muy similares, las condiciones de realizabilidad son
practicamente las mismas y la estructura hamiltoniana generalizada se recupera con la
misma facilidad. Inicialmente se partira de una estructura semejante al sistema de la
bola en la viga, pero generalizado a orden mayor, para nalmente enunciar un resultado basandose en la linealizacion por realimentacion que permite extender el metodo a
sistemas de estructura no triangular.
Considerese un sistema generico de la forma

x 1
x 2
x 3
..
.

x2
h(x3 )
x4
..
.

x n

0
0
0
..
.

u.

(6.7.1)

Se dene el cambio
3 = h(x3 )
4 = h (x3 )x4 = 3
5 = h (x3 )x24 + h (x3 )x5 = 4
..
.
dn3
n =
3
dtn3
Pero esta u
ltima derivada se puede descomponer en dos terminos,
dn
(n)
(n1)
(h(x3 )) = h (x3 )x3 + (h (x3 ), h(3) (x3 ), ...hn (x3 ), x3 , x3 ...x3
)
dtn
(n)
= h (x3 )x3 + (x3 , x4 , x5 ...xn+2 ) = (x) + h (x3 )u
Este sistema posee un grado relativo bien denido si h(x3 ) = 0. donde se deduce que la
condicion h(x3 ) = 0 es suciente para que la realimentacion
u=

+v
h (x3 )

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

147

unida al cambio de variable x linealice por realimentacon el sistema (3), dando lugar
a
x 1 = x2
x 2 = 3
3 = 4
(6.7.2)
4 = 5
..
.
4 = v
Comentario 6.7.1. Notese que el cambio de coordenadas x es invertible si y solo si
h() es invertible (para lo que es necesario que h (x3 ) = 0), dado que
x3 = h1 (3 )
4
x4 = 
h (x3 )
..
.
i fi (x3 , ..., xi1 )
xi =
h (x3 )
El nuevo sistema linealizado admite la estabilizacion de orbitas periodicas mediante la
implementacion recursiva del backstepping y la obtencion de las sucesivas leyes de control
en cascada, que ahora expresaremos del siguiente modo
V0
k1 (3 + u0 )
x2
V1
= u 1
k2 (4 u1 )
x3

u1 = u 0
u2
..
.

ui = u i1

Vi1
k2 (4 u1 )
i+1

Las funciones de Lyapunov de cada paso seran


1 2
P
4
1 2
=
P +
4
1 2
=
P +
4

V0 =
V1
V2

1
(3 u0 )2
2
1
1
(3 u0 )2 + (4 u1 )2 ,
2
2

..
.
y as sucesivamente. Deniendo un nuevo cambio de variable
z3 = 3 u0
z4 = 4 u1
..
.

(6.7.3)

148 6.8. Realizacion de una familia de sistemas oscilantes a partir de la linealizaci


on por realimentaci
on

Se recupera la estructura PCH dada por


1
0 0
x 1
0
P
x 1 0

1 0

2 P

z V2

=
z1 0 1 0 1

0
0 1 0
z2

0 0 0 0
0 k0 0 0
0 0 k1 0
0 0 0 k2

z V2 .

(6.7.4)

Cabe destacar que al ser la estructura simplectica invariante con respecto al sistema de coordenadas (vease la seccion 2.3.1), se deduce que la estructura hamiltoniana generalizada
no es una caracterstica particular que solo se manieste en estas coordenadas. De hecho,
deshaciendo el cambio de variable volveramos a una estructura semejante con matrices
de interconexion y disipacion expresadas en funcion de x.
Si observamos que el sistema (6.7.2) esta expresado en la forma canonica de Brunovski
(2.7.2), se deduce que el desarrollo previo es aplicable a cualquier sistema en esta forma.
Sin embargo el teorema de linealizaci
on por realimentaci
on (Marino & Tomei 1995) arma
que un sistema de entrada u
nica del tipo
x IRn , u IR

x = f (x) + g(x)u,

es transformable mediante linealizacion por realimentacion y cambio de variables a la


forma canonica de Brunovski en una region U0 proxima al origen si y solo si, en dicha
region, las distribuciones
0in1

Gi = span{g, . . . , adif g},


Son involutivas y de rango constante i + 1.

Esto implica que en los sistemas que cumplen las condiciones del teorema de linealizacion por realimentacion es aplicable el metodo presentado de estabilizacion de oscilaciones basado en backstepping. Una consecuencia importante es que se abre una va para
salvar la exigencia de la estructura en cascada.

6.8 Realizacion de una familia de sistemas oscilantes a partir de la


linealizacion por realimentacion
Seg
un se comenta en el apartado anterior, en un sistema linealizado por realimentacion,
el procedimiento recursivo expresado en la ecuacion (6.7.3) resuelve el problema de estabilizacion de orbitas periodicas en sistemas linealizables por realimentacion.
La ley recursiva es susceptible de obtenerse como una funcion explcita del estado.
El deshacernos de la recursividad del metodo pretende generar una familia de sistemas
de cualquier orden con una dinamica explcita que simplica el analisis posterior. Los
resultados que se expondran se han publicado en (Aracil, Gomez-Estern & Gordillo 2002).
El punto de partida del presente estudio es un sistema de orden n en la forma canonica
de Brunovski,
x 1 = x2
x 2 = x3
..
.
x n = um

(m = n 2)

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

149

que supuestamente resulta de la linealizacion por realimentacion del sistema en lazo abierto. El objetivo es encontrar una ley de realimentacion del estado para cualquier valor de
n, evitando la forma recursiva (6.7.3). Recordemos que el procedimiento backstepping
estandar para sistemas en la forma canonica de Brunovski, produce la siguiente ley
Sistema de segundo orden:

u0 = x1 k0 P x2

Sistemas de orden n mayor que 2. Se aplica la siguiente formula recursiva


ui = u i1

Vi1
g(xi+1 ) ki zi
i+1
x

i = 1...m

donde se han empleado las deniciones


i = 1...n
xi = [x1 , x2 , ..., xi ]T
2
P
V0 =
4
P 2 z12 z22
z2
Vi =
+
+
+ ... + i
i = 1...m
4
2
2
2
zi = xi+2 ui1
i = 1...m
Ademas, el vector de control gi (xi ) tiene i las y toma la forma

0

0

g(xi ) =
..
.
1
de donde se obtiene que
zi1
Vi1
Vi1
g(xi+1 ) =
= zi1
= xi+1 ui2
i+1
x
xi+1
xi+1
V0
g(x2 ) = P x2
x2

i = 2...m

Por tanto estamos en posicion de deshacernos de derivada de la funcion de Lyapunov en


la formulacion recursiva
u0 = x1 k0 P x2
u1 = u 0 x2 P k1 (x3 u0 )
ui = u i1 + ui2 + ki ui1 xi+1 ki xi+2


 


parterecursiva

i = 2...m

partenorecursiva

En esta expresion se han diferenciado dos partes: la recursiva y la no recursiva a efectos


de los calculos posteriores. La parte no recursiva de ui se denominara fi en adelante, y
su forma general viene dada por
f0 = 0
f1 = P x2 k1 x3
fi = xi+1 ki xi+2

i = 2...m

150 6.8. Realizacion de una familia de sistemas oscilantes a partir de la linealizaci


on por realimentaci
on

Si denimos el operador lineal




i = ki +

d
dt

se obtiene la siguiente sucesion


u0 = x1 k0 P x2
u1 = 1 u 0 x2 P k1 x3
ui = i ui1 + ui2 + fi
que nos permite usar la notacion matricial

1
0

0 i1 1 0 ui1
ui

. . . ..

u
u
i1
.
0
0
=
i2
ui

.
.
..
0 2 1
. 0
.
0
0 0 1
u0
u0

0
0 0 1

i = 2...m

+ f i = i ui1 + f i

i = 1...m

donde se han denido los siguientes vectores y matrices




ui = [ui , ui1 , ..., u0 ]T

i = 1, 2 . . . m

f i = [fi , fi1 , ..., f0 ]T


i = 1, 2 . . . m

0 0
i 1

0 i1 1 0

. . . ..
 0
0
.
i =
i = 1, 2 . . . m

0
0 2 1

0
0 0 1

0
0 0 1
Para la multiplicacion de matrices conviene tener en cuenta el siguiente comentario.
Comentario 6.8.1. Notese que la matriz i posee i + 1 las e i columnas, por los cual el
producto i i1 es el producto de una matriz de i columnas por otra de i las. Consecuentemente, el producto esta bien denido.
La descomposicion sucesiva del vector ui en terminos de la matriz i , la funcion fi y
el vector ui1 da lugar a
ui = eT1 ui
= eT1 (i ui1 + f i )
= eT1 (i (i1 ui2 + f i1 ) + f i )
..
.
donde se emplea el vector e1 = [1 0 . . . 0]T con la dimension apropiada. Como resultado
fundamental, hemos obtenido la forma general del termino n-esimo:
& 1
'
& j+1 '
m1
+
 +
i u0 + eT1
k f j
(6.8.1)
un = eT1
i=m

j=1

k=m

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

151

donde el smbolo del producto debe ser entendido en orden decreciente de los ndices de
izquierda a derecha4 , es decir
j
+

i = k k1 . . . j

k>j

(6.8.2)

i=k

Proposici
on 6.8.1. En la familia de sistemas de orden n
x 1 = x2
x 2 = x3
..
.

&

x n = eT1

1
+

'
i

u0 + eT1

m1


& j+1
+

j=1

k=m

i=m

'
k

fj

(6.8.3)

las trayectorias convergen asint


oticamente a la orbita oscilatoria donde P = 0 y zi = 0 i
con funci
on de Lyapunov
V =

P 2 z12 z22
z2
+
+
+ ... + m
4
2
2
2

Demostracion. Haremos uso del principio de induccion matematica. Para n = 2, la ley


de control u0 = x1 k0 P x2 estabiliza el sistema de segundo orden en P = 0 con funcion
de Lyapunov V0 = P 2 /4. Si n > 2, supondremos que el sistema de orden n con estructura
(6.8.3) es GAS con respecto a la orbita P = 0 y zi = 0 i con funcion de Lyapunov
Vn2 =

z2
P 2 z12 z22
+
+
+ ... n2
4
2
2
2

y probaremos que el sistema de orden n + 1 con estructure (6.8.3) es GAS con respecto
{P = 0, zi = 0 i} y funcion de Lyapunov
Vn1

2
2
zn1
zn1
P 2 z12 z22
=
+
+
+ ...
= Vn2 +
4
2
2
2
2

Efectivamente, si en el sistema

n :

0 1 0 0

0 0 1 0

. . . ..
n
x =
.
0 0

0 0 0 1
0 0 0 0

se cumple que


V m =

Vm
xn

n
x + g(xn )un2

T
x n 0

The only possible way according to matrix dimensions.

152 6.8. Realizacion de una familia de sistemas oscilantes a partir de la linealizaci


on por realimentaci
on

entonces, en el sistema n+1 tenemos


 2 T
T
T

Vm+1
Vm
1 zm+1
n+1
n+1
x
=
x
+
x n+1
xn+1
xn+1
2 xn+1
T

T

 2 T
zm+1
Vm
1 zm+1
n
n+1
=
x +
x
zm+1
x n+1
xn
2 xn+1
xn+1
&
'
T

un2
= zm+1 x n+1
x n+1 = zm+1 (x n+1 u n2 )
xn+1


V m+1 =

= zm+1 (un1 u n2 ) = zm+1 ((xn un3 ) kn1 (xn+1 un2 ))


2
= kn1 zm+1
<0
La estabilidad asintotica se demuestra analizando los conjuntos invariantes donde V i = 0.
A partir de los calculos previos es facil comprobar que that
V i = V i1 ki zi2
V 0 = k0 P x22

i = 1...m

lo cual produce
V i = k0 P x22 k1 z12 k2 z22 ki zi2

i = 1...m

Entonces los u
nicos conjuntos invariantes donde V i = 0 son {x|P (x) = 0, zi = 0 i} y
x(t) 0 t. Este u
ltima es un punto de equilibrio, y concluimos del principio de LaSalle
principio que el sistema n es GAS con respecto a la orbita {x|P (x) = 0, zi = 0 i} con
funcion de Lyapunov Vn1 para todo n, excepto la condicion inicial (xi = 0, i).
2

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

153

Ejemplos
Sistema de dimensi
on 3
A n de ilustrar el empleo de la ecuacion (6.8.1), se obtendra a continuacion la ley de
control para n = 3. En este caso m = 1, la ley de control es u1 y las u
nicas matrices y
vectores involucrados son



1

k
x
P
x
2
1
3
1

1 =
f 0 = 0.
f =
0
1
tras simples calculos se llega a
u1 = [1 0](1 u0 + f 1 )
= (x1 k0 P x2 )k1 P x2 k1 x3 x2
k0 (2 x1 x2 + 2 x2 x3 )x2 k0 P x3
Es facil comprobar que con esta ley de control el sistema en bucle cerrado puede ser escrito
en forma hamiltoniana:

1
0
0
0
0
P
P
x 1

+
V
0 P

k
0
k

V1

x 2 = P 1
1
0
0
P

x 3

P
2
P
0
0 k0 k0 k1
P


= 1 2k0 x1 x2


= 2k0 x22 k0 P
donde la parte conservativa (matriz antisimetrica a la izquierda) y la disipativa ( matriz semidenida negativa a la derecha) han sido separadas para visualizar la estructura
hamiltoniana. Notese tambien que el hamiltoniano en este caso es la funcion de Lyapunov
que se obtendra con el procedimiento de backstepping, es decir
V1 =

P 2 (x3 + x1 + x0 x2 P )2
+
4
2

Sistema de dimensi
on 5
A medida que aumenta el orden del sistema el calculo gana en complejidad, aunque
conceptualmente no presenta dicultad alguna. A partir de orden 4 es preferible recurrir
a una herramienta software de calculo simbolico. Calcularemos la ley de control para un
sistema de orden n = 5 y por tanto m = 2 en forma canonica de Brunovski, . Para ello
se emplearan las matrices

1
0
k3 + dtd
d

+
1
k
2
dt

d
d

k1 + dt
1
0
k2 + dt

3 =
1 =
2 =
0
k1 + dtd

0
0
k1 + dtd
1

0
1
0
0
1

154 6.8. Realizacion de una familia de sistemas oscilantes a partir de la linealizaci


on por realimentaci
on

y los vectores

f3 =

x4 k3 x5
x3 k2 x4
P x2 k1 x3
0




k
x
x
3
2
4

P x2 k1 x3
2
1
, f 0 = 0.
, f = P x2 k1 x3 , f =

0
0

Mediante calculo simbolico, empleando las rutinas presentadas en el apendice B, se obtiene


la formula (6.8.1) para n = 5:


u3 = [1 0 0 0 ] 3 2 1 u0 + 3 2 f 1 + 3 f 2 + f 3


= k0 x5 P 3 k0 x4 (2 x1 x2 + 2 x2 x3 ) 3 k0 x3 2 x2 2 + 2 x1 x3 + 2 x3 2 + 2 x2 x4
k0 x2 (6 x2 x3 + 2 x1 x4 + 6 x3 x4 + 2 x2 x5 ) k0 x4 P (k3 + k2 + k1 )
2 k0 x3 (2 x1 x2 + 2 x2 x3 ) (k3 + k2 + k1 )


k0 x2 2 x2 2 + 2 x1 x3 + 2 x3 2 + 2 x2 x4 (k3 + k2 + k1 )


2 x2 2 + 2 x1 x3 + 2 x3 2 + 2 x2 x4 x2 2 (2 x1 x2 + 2 x2 x3 ) x3 P x4
k1 x5 + x4 k2 x5 k0 x3 P (k3 k2 + (k3 + k2 ) k1 + 2)
k0 x2 (2 x1 x2 + 2 x2 x3 ) (k3 k2 + (k3 + k2 ) k1 + 2)
+ (k3 + k2 ) ( (2 x1 x2 + 2 x2 x3 ) x2 P x3 k1 x4 ) k0 x2 P (k3 k2 k1 + k1 + k3 )
+ k3 (x3 k2 x4 )
+ k3 k2 (P x2 k1 x3 ) + x4 k3 x5 P x2 k1 x3
Si bien es cierto que esta ley es bastante compleja, cabe resaltar que el procedimiento de
calculo es completamente sistematico, que su validez es totalmente general para sistemas
linealizables por realimentacion de quinto orden, y que en virtud de la proposicion 6.8.1
estabiliza asintoticamente al sistema en el conjunto deseado.

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

155

6.9 Aplicacion a sistemas subactuados


Se ha presentado en las secciones anteriores anterior un metodo para la generacion de
oscilaciones estables por realimentacion en una clase de sistemas de control no lineales.
El metodo propuesto en el para la estabilizacion de oscilaciones funciona debidamente
para sistemas completamente actuados, en cuyo caso la solucion es trivial, y para una
clase de subactuados que es la que se tratara en los ejemplos a continuacion. A n de
ilustrar el metodo se han seleccionado como ejemplos dos sistemas mecanicos subactuados
bien conocidos en la literatura y en el desarrollo de esta tesis: el sistema de levitacion
magnetica y la bola en la viga.

6.9.1 Sistema de levitacion magnetica


Para ilustrar la aplicacion del metodo a un sistema de tercer orden se ha escogido el
sistema de levitacion magnetica. Este sistema aparece representado esquematicamente en
la gura 6.4, y consiste en una esfera metalica homogenea inmersa en un campo magnetico
vertical creado por un electroiman sencillo. La posicion vertical de la bola es la variable
x1 , estando el eje x1 orientado hacia arriba. El ujo magnetico en la bobina es la variable
x3 .
u
i

x3
x1

Figura 6.4: Sistema de levitacion magnetica.

Las ecuaciones en bucle abierto del sistema de levitacion magnetica vienen dadas por
(Ortega et al. 1998)
x 1 = x2
1 2
x 2 =
x mg
2k 3
R
x 3 = (1 x1 )x3 + u
k

(6.9.1)

donde x2 = mx 1 , siendo m la masa de la esfera. Aplicando un primer lazo de realimentacion interna


R
(6.9.2)
(1 x1 )x3 + u = v
k

156

6.9. Aplicacion a sistemas subactuados

al sistema (6.9.1) se obtiene el siguiente sistema en cascada


x 1 = x2
1 2
x 2 =
x mg
2k 3
x 3 = v.

(6.9.3)

El sistema (6.9.3) pertenece a la clase de sistemas (6.5.1) y consecuentemente es apropi1 2


x3 mg y u0 (x1 ) = h1 (c2 x1 ) =
ada para el backstepping. En este caso, h(x3 ) = 2k
$
2k(mg c2 x1 ) y, por consiguiente, la ecuacion (6.5.3) conduce a
c2 kx2

kx2 P
k1 k
u = $

x3
x3
2k(mg c2 x1 )

1 2
x mg + c2 x1
2k 3


(6.9.4)

que es la ley de realimentacion deseada. Esta ley a sido comprobada por simulacion
dado el comportamiento deseado tanto para > 0 (oscilaciones) y para < 0 (equilibrio
estable). Los resultados se ilustran en la gura 6.5. Se muestran en ella tres simulaciones,
las dos primeras de las cuales tienen constantes k = 1, k1 = 0.5, c = 0.1 y = 0.1, y en
la tercera se ha hecho igual a 0.1 para lograr un comportamiento de estabilizacion.
Cada graca contenida en la la superior de la gura representa las variables de estado
oscilantes, x1 y x2 con respecto al tiempo en tres escenarios de simulacion diferentes. Bajo
cada uno de estos escenarios, se muestra la funcion de Lyapunov obtenida en cada paso
del procedimiento de backstepping, para las mismas simulaciones.
El metodo de dise
no propuesto admite una interesante interpretacion fsica en el caso
del levitador magnetico. Si nuestro objetivo es hacer oscilar una bola metalica inmersa
en un campo magnetico, el ujo magnetico seguira una cierta forma de onda, pero esto es
logrado a su vez excitando un circuito de induccion con una ley de control aplicada como
voltaje de entrada. Esto sugiere una estrategia de dise
no de un controlador en cascada,
como es el caso del metodo backstepping.

6.9.2 Implementacion en un sistema de laboratorio


Los resultados anteriores pueden ser trasladados a un sistema real de laboratorio con poco
esfuerzo adicional. El equipamiento usado se muestra en la gura (6.9.2). El sistema de
levitacion esta conectado a un ordenador mediante una tarjeta conversora con canales
analogico/digital y digital/analogico. El ordenador ejecuta una rutina de tiempo real que
se comunica con MATLAB mediante una librera de enlace dinamico (DLL). El algoritmo
de control se ejecuta periodicamente con una frecuencia de muestreo de 500Hz. Desde
SIMULINK se registra la informacion generada por la rutina a una velocidad de diez veces
inferior para evitar sobrecargar el algoritmo de control.

6.9.3 Modelo del sistema de laboratorio


Aunque el sistema real esta compuesto de los mismos elementos descritos en la seccion
6.9.1, el modelo diere de manera signicante del all descrito. Esto es debido a la existencia a un lazo interior que compensa la dinamica de la que relaciona la tension de entrada

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

x (0)=0.10, x (0)=0.00, mu=0.1

x (0)=1.00, x (0)=3.00, mu=0.1

20
tiempo(s)

20
tiempo(s)

40
30
20
10
0
20
tiempo(s)

40

20
40
tiempo(s)

60

20
40
tiempo(s)

60

80

60
40
20
0

40

Funcin de Lyapunov

50

80

Funcin de Lyapunov

Funcin de Lyapunov

60

10

40

x (0)=1.00, x (0)=3.00, mu=0.1

x1(cont.), x2(discont.)

x (cont.), x (discont.)

x1(cont.), x2(discont.)

157

60
40
20
0

20
tiempo(s)

40

Figura 6.5: Resultados de simulaci


on en el levitador magnetico.

Figura 6.6: Sistema de levitacion magnetica de laboratorio.

158

6.9. Aplicacion a sistemas subactuados

con la corriente de la bobina y por tanto con el campo magnetico. A efectos practicos la
corriente viene dado por
I = 0.15(u + u0 )
donde u0 es una constante. El hecho de que esta relacion sea puramente algebraica
convierte a la ecuacion (6.9.1) en un modelo de segundo orden. Esto hace innecesaria la
aplicacion de la extension del metodo backstepping como se hizo en la seccion anterior.
La distancia vertical hacia abajo entre el electroiman y la bola, x1 , se mide mediante un
emisor y receptor de infrarrojos, cada uno a un lado de la bola. La dinamica en bucle
abierto esta descrita por las ecuaciones en variables de estado de son:
x 1 = x2
x 2 = g k

I
X

2


=gk

u + u0
x1 + x0

2

(6.9.5)
(6.9.6)

donde k, u0 y x0 son constantes del modelo que deben ser identicadas, k = k/0.15.

6.9.4 Identicacion de parametros


El controlador propuesto en (6.3.3), como es habitual en control basado en pasividad, se
basa en el ajuste de las ecuaciones de bucle abierto y cerrado, mediante la cancelacion
directa de terminos inestables. Esto signica que el rendimiento depende en gran medida
de un conocimiento preciso del modelo. Los parametros a identicar son k,u0 y x0 . El
sistema (6.9.5)(6.9.6) es, si se permite la incorreccion, altamente no lineal, e inestable.
Por tanto la u
nica manera de identicarlo experimentalmente es mediante la identicacion
en bucle cerrado. A este n se ha empleado una red lineal de avanceretraso analogica
capaz de estabilizar la bola con una peque
na region de atraccion. Las se
nales de entrada
(u) y salida (y = x1 ) son registradas desde el PC con una tarjeta A/D a una frecuencia
de 500 Hz.
En nuestro procedimiento de identicacion la referencia del control se incrementa de
forma escalonada con un periodo lo sucientemente largo para lograr la estabilizacion.
Un posicion de la bola estable corresponde a una corriente (y tension de entrada) constantes. En este caso el campo magnetico compensa con exactitud la fuerza constante de
la gravedad. Con este experimento se obtienen una serie de puntos de equilibrio estabilizados que forman pares entrada-salida (u , x1 ) (vease la gura 6.9.4).
Estos puntos deben ajustarse a la caracterstica de regimen permanente dada por la
ecuacion de equilibrio

2
u + u0
0=gk
x1 + x0
la cual a traves del apropiado convenio de signos representa una relacion lineal estatica
u x1 .

k
x1 = x0 +
(u + u0 )
g
Incluso si la informacion obtenida del regimen permanente es lo sucientemente precisa
para continuar, de la ecuacion de la recta solo podemos extraer dos parametros, ya que
la ecuacion general es:
x1 = b1 u + b0

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

Grafico xy de regimen permanente

0.5

0.5

Posicin en regimen permanente

entrada (V) y posicin (mm)

Respuesta a la secuencia de escalones

0.5

1.5

159

0.5

1.5

10

20
tiempo (s)

30

2.5
0.5
0
0.5
1
Tensin de entrada en rgimen permanente

Figura 6.7: Identicaci


on de la recta de regimen permanente.

#
donde b1 = kg es la pendiente identicada y b0 = x0 + b1 u0 es la interseccion con el
eje u de la recta que se ha identicado. De b1 derivamos el valor k = 11.86. Por tanto
hemos de obtener una tercera ecuacion para identicar los tres parametros (u0 , x0 , k) e
identicar completamente el modelo.
La informacion adicional necesaria no puede obtenerse del comportamiento en regimen
permanente. Para caracterizar la respuesta transitoria con la mayor cantidad de informacion posible se ha hecho variar la referencia siguiendo una secuencia aleatoria de escalones,
dentro del rango de validez del controlador no lineal. Los escalones deben sucederse a una
frecuencia sucientemente alta para que la bola no alcance a estabilizarse. De nuevo se
muestrean la entrada y la salida a una frecuencia de 500Hz y se registran en MATLAB.
Para emplear la informacion recabada las ecuaciones del modelo pueden reescribirse
del siguiente modo
u + u0
$
x g = k
,
x + x0
las cuales pueden ser reordenadas para dar lugar a la ecuacion vectorial
%

 %
x g
x g
xu=
k
k


1

x0
u0


.

donde las incognitas x0 y u0 aparecen de linealmente. De este modo el problema se


ha transformado en la identicacion no lineal de un sistema linealmente parametrizado,
para el cual la aplicacion directa de la formulacion de mnimos cuadrados proporciona los
valores x0 = 6.73 V y u0 = 4.9 V. La principal dicultad detectada en este enfoque es la
obtencion de un vector de aceleracion limpio a partir de las muestras de la posicion, para
el cual las se
nales, han sido preltradas con un ltro digital de Butterworth con frecuencia
de corte digital wn = 0.8 rad/s.

6.9. Aplicacion a sistemas subactuados


1

0.5

0.5

0.5

Posicion (mm)

0.5

Posicion (mm)

Posicion (mm)

160

0.5

0.5

1.5

1.5

1.5

2.5

5.5

6.5

7.5
Tiempo (s)

8.5

9.5

10

2.5
20

20.5

21

21.5

22

22.5
23
Tiempo (s)

23.5

24

24.5

25

2.5
46

46.5

47

47.5

48
Tiempo (s)

48.5

49

49.5

50

Figura 6.8: Respuesta transitoria al variar entre los valores 0, 10, 20, 10, y 0.

6.9.5 Diseno del controlador


Si se cuenta con un conocimiento preciso de los parametros del sistema, la ecuacion (6.9.7)
se linealiza por realimentacion aplicando la ley
u = u0 + v1 (x1 + x0 )
%
g v2

v1 =
.
k
Y en consecuencia el sistema se transforma en
x 1 = x2
x 2 = v2 .

(6.9.7)

Si ahora escogemos v2 = c x21 ka P (x)x2 tal y como se explico en la seccion 6.3


tendremos la siguiente ley de control
%
g + c x21 + ka P (x)x2
(6.9.8)
(x1 + x0 ) u0 .
u=
k
Esta ley se aplica a traves del convertidor sample and hold digitalanalogico. Para la frecuencia de muestreo especicada, 500 Hz, no ha sido considerado necesario hacer ninguna
transformacion para operar en tiempo discreto, mas alla del calculo de la velocidad de la
bola, x2 , por medio de la aproximacion de Euler hacia atras de la derivada.

6.9.6 Resultados experimentales


Analizaremos los resultados obtenidos al aplicar la ley de control (6.9.8) al sistema de levitacion magnetica real. En el primer experimento, la constante ka se ja a 0.0005, el valor
de c , la frecuencia deseada de la oscilacion se ha jado a 20 rad/s, mientras que la constante , responsable de la amplitud de las oscilaciones toma los valores 0.0,10.0,20.0,10.0
y de vuelta a 0.0. Los resultados aparecen en la gura 6. All se puede apreciar en detalle
el comportamiento transitorio al variar escalonadamente de 0 a 10, despues a 20, a 10
y de nuevo a 0.
A la constante ka se le ha dado el valor 0.0005, habiendo observado que es conveniente
para un mejor rendimiento reducir su valor a medida que se hace crecer la amplitud de
las oscilaciones.

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

161

A continuacion se enumeraran las ventajas de el empleo de este controlador frente a


tecnicas mas sencillas como el control lineal o el de trayectorias
1. El controlador no lineal funciona uniformemente en todo el rango del sensor de posicion, sin presentar distorsiones en la forma de la oscilacion al aumentar la amplitud.
Esto no sucedera en un control lineal.
2. En la practica la region de atraccion del controlador presentado coincide con el rango
de funcionamiento de dicho sensor.
3. El ancho de banda del controlador es mayor que el de un controlador lineal. Un
control por PID o una red de avance, con anchos de banda limitados, podra seguir
trayectorias de referencia senoidal hasta una determinada frecuencia maxima. A
frecuencias superiores la amplitud de las oscilaciones decrecera. El enfoque aqu
propuesto esta teoricamente ilimitado en la frecuencia de oscilacion, aunque en la
practica encontrara sus lmites en la frecuencia de Nyquist y en la dinamica del lazo
interno de corriente que se supuso ideal.
4. El controlador propuesto no emplea se
nales dependientes del tiempo como trayectorias de referencia.
5. Como se apunto en la introduccion, la trayectoria objetivo del sistema no posee
informacion de fase, lo cual es en general ventajoso para la calidad de los transitorios,
ya que en nuestro caso el sistema puede entrar en la orbita periodica en cualquier
punto de esta.

6.9.7 Oscilaciones en la bola en la viga


Esta seccion presenta un ejemplo de aplicacion de los resultados previos a un sistema
de cuarto orden, para nalmente demostrar la recursividad y sencillez del metodo. Emplearemos el resultado del corolario 6.5.2. El sistema que se tratara, de nuevo, es la bola
en la viga que fue representado en la gura 4.6. Para escribir el modelo en una forma en la que se pueda aplicar facilmente el metodo descrito reescribiremos el modelo de
EulerLagrange (4.4.1) en variables de estado, seg
un se aparece en (Hauser et al. 1992).
Deniendo el vector de estado como [x1 , x2 , x3 , x4 ] = [q1 , q1 , q2 , q2 ] y aplicando la ley de
linealizacion parcial = (2q1 q1 q2 gq1 cos(q2 ))/(L2 + q12 ) + u para cancelar los terminos
de la cuarta la, el sistema admite la descripcion alternativa

x 1
x 2
x 3
x 4

x2
2
B(x1 x4 Gsenx3 )
x4
0

0
0
0
1

u.

(6.9.9)

La variable x1 denota la posicion de la bola, y x3 el angulo de la barra (q1 y q2 respectivamente en la gura 4.6). Con la intencion de escribir el sistema en la forma (6.6.1), se
empleara una aproximacion frecuentemente utilizada (Hauser et al. 1992) obtenida al ignona
rar el termino de aceleracion centrfuga x1 x24 , suponiendo una velocidad angular peque
de la bola. Mas a
un, el sistema (6.9.9) puede ser normalizado haciendo B = G = 1.

162

6.9. Aplicacion a sistemas subactuados

Entonces se tiene

x 1
x 2
x 3
x 4

x2
senx3
x4
0

0
0
0
1

u.

(6.9.10)

Este sistema tiene la forma (6.6.1) para m = 2. Consecuentemente, el metodo introducido


en las secciones previas le es de aplicacion. En primer lugar, considerese el sistema de
segundo orden formado por las dos primeras ecuaciones de (6.3.1), es decir


x 1
x 2


=

x2
senx3


.

(6.9.11)

Este sistema, unido a la ecuacion x 3 = x4 posee la misma estructura que las ecuaciones
(6.5.1) (tomando x4 como una variable de control virtual) y, por consiguiente, en el primer
paso, la realimentacion (6.5.3) puede aplicarse dando lugar a
x3 = u0 (x1 , x2 ) = sen1 (c2 x1 + k0 x2 P ).

(6.9.12)

Entonces, la aplicacion recursiva del procedimiento de backstepping para sistemas de orden


mayor dada en la ecuacion (6.6.2), proporciona las siguientes leyes de control:

u1
u2



1
V0

= 
k1 (senx3 + senu0 )
h (u0 )u 0
h (x3 )
x2
V1
= u 1
k2 (x4 u1 )
x3

(6.9.13)
(6.9.14)

Las funciones de Lyapunov obtenidas en cada paso son


1 2
P
4
1 2
=
P +
4
1 2
=
P +
4

V0 =
V1
V2

1
1
1
(senx3 + senu0 )2 = P 2 + z12
2
4
2
1
1
1
1
1
(senx3 + senu0 )2 + (x4 u1 )2 = P 2 + z12 + z22
2
2
4
2
2

donde las variables de error zi se denen como




z1 = h(x3 ) h(u0 ) = senx3 + c2 x1 + k0 x2 P

(6.9.15)

z2 = x4 u1 ,
(6.9.16)

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

163

Desarrollando (6.9.13)-(6.9.14), se obtiene


k1 z1 + c 2 x2 + 2 k0 x2 2 c 2 x1 k0 P senx3 2 k0 x22 senx3 + P x2
cos x3


= z1 cos x3 + k1 k0 P 2 k0 x2 2 x4 k2 z2

u1 =
u2

(6.9.17)

6 k0 (senx3 )2 x2 ((P + 2 x2 2 ) k0 k1 + 6 k0 x2 c 2 x1 + c 2 + 2 x2 2 + P ) senx3


cos x3
2
2
2
2
(2 k0 x2 c + 2 x2 c x1 + k1 c + 2 k1 k0 x2 c 2 x1 ) x2
+
cos x3
((k1 k0 x2 + x2 ) x4 P + (c 2 x2 + 2 k0 x2 2 c 2 x1 + k1 c 2 x1 ) x4 ) senx3
+
(cos x3 )2
 


k0 x4 P + k1 + 2 k0 x2 2 x4 (tan x3 )2
(6.9.18)
+

donde u = u2 es la ley de control que ha de aplicarse a (6.9.10) y la cuarta ecuacion de


estado se convierte en x 4 = u2 . Con esta ley, las ecuaciones en bucle cerrado toman la
forma
x 1
x 2
x 3
x 4

=
=
=
=
+
+
+

x2
senx3
x4


z1 cos x3 + k1 k0 P 2 k0 x2 2 x4 k2 z2

(6.9.19)

6 k0 (senx3 )2 x2 ((P + 2 x2 2 ) k0 k1 + 6 k0 x2 c 2 x1 + c 2 + 2 x2 2 + P ) senx3


cos x3
(2 k0 x2 2 c 2 + 2 x2 c 2 x1 + k1 c 2 + 2 k1 k0 x2 c 2 x1 ) x2
cos x3
((k1 k0 x2 + x2 ) x4 P + (c 2 x2 + 2 k0 x2 2 c 2 x1 + k1 c 2 x1 ) x4 ) senx3
(cos x3 )2
 


k0 x4 P + k1 + 2 k0 x2 2 x4 (tan x3 )2

Comentario 6.9.1. Recuerdese que este sistema, a pesar de su complejidad, esta descrito en
forma hamiltoniana generalizada disipativa con funcion de Hamilton V2 . Para comprobar
este hecho basta observar, en virtud del corolario 6.6.2 que el cambio
x 1
x 2
z1
z2

=
=
=
=

x2
z1 c2 x1 k0 x2 P
h (x3 )z2 x2 P k1 z1
h (x3 )z1 k2 z2

conduce a la descripcion en variables de estado


z = (J(z) R(z))z V2 (z)


z = [x1 x2 ; z1 z2 ]T
donde J(z) y R(z) poseen la forma (6.6.3) y (6.6.4), respectivamente. Para completar
la armacion basta probar que esta propiedad tambien es cierta cuando el sistema esta
expresado en variables x, seg
un (6.9.19). Pero este hecho se desprende de la invariabilidad
de la estructura hamiltoniana frente al cambio de variables, que se demostro en la seccion
2.3.1.

164

6.9. Aplicacion a sistemas subactuados

6.9.8 Bifurcaciones en el sistema de la bola y la viga


En este apartado detectaremos la aparicion de una bifurcacion de Hopf asociada al
parametro en el sistema (6.9.19). Aunque la proposicion 6.5.3 se ha demostrado para
el caso de dimension tres, este es un sistema de cuarto orden que experimenta una bifurcacion de Hopf en virtud de la siguiente proposicion.
Proposici
on 6.9.1. Considerese el sistema (6.9.19) en bucle cerrado. Este sistema presenta una bifurcaci
on de Hopf para = 0.
Demostracion. A n de vericar que las condiciones para la ocurrencia de una bifurcacion,
calcularemos la matriz jacobiana evaluada en el origen del sistema de cuarto orden en bucle
cerrado .

0
1
0
0

0
0
1
0

0
0
0
1

2
2
2
2
2
c + c k1 k2 k1 c + k2 c k2 1 c + k2 k1 k1 k2
cuyo polinomio caracterstico es




s4 + (k1 + k2 ) s3 + 1 + c 2 + k2 k1 s2 + (k1 + k2 ) c 2 k2 s + (1 + k2 k1 ) c 2 .
La condicion para la existencia de races puramente imaginarias (recuerdese las ecuaciones
(2.5.1)(2.5.2)) son
k1 + k2 > 0,
k1 k1 + k2 k1 + k2 + k2 2 k1 > 0,


k1 k2 2 (k1 + k2 ) k1 c 2 + k2 2 k1 + k2 = 0.
2

(6.9.20)

Las dos primeras condiciones son satisfechas para


<

(k1 + k2 ) (1 + k2 k1 ) 
= max ,
k1

mientras que la u
ltima tiene dos races reales para , a saber


(k1 + k2 ) k1 c 2 + k2 2 k1 + k2
1 = 0
2 =
k2 k1
Observando que 2 > max concluiremos que el u
nico valor del parametro tal que
exista un par de races puramente imaginarias es = 0. Entonces el polinomio puede ser
factorizado como


 2
c + s2 s2 + sk1 + sk2 + 1 + k2 k1 = 0.
Esta ecuacion tiene dos de sus races en s = jc mientras que las otras tienen parte real
negativa siempre que k1 > 0 y k2 > 0.
La transversalidad sera satisfecha si el primer miembro de (6.9.20) cambia de signo al
hacerlo . Esto es cierto cuando k1 > 0 y k2 > 0.
2

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

165

6.9.9 Efecto de la aceleracion centrfuga


La ley de realimentacion (6.9.18) logra el comportamiento deseado al aplicarse al sistema
(6.9.10), pero el sistema de la bola y la viga se modela con mas precision mediante
las ecuaciones (6.9.9). Sin embargo, si la ley de realimentacion (6.9.18) se aplica al
modelo (6.9.9) en lugar del aproximado (6.9.10), el comportamiento deseado (oscilatorio
o estabilidad asintotica) sigue obteniendose, al menos de forma local en torno al equilibrio.
Esto se debe al hecho de que el termino ignorado x1 x24 no afecta a la matriz de linealizacion
Jacobiana de (6.9.9) y (6.9.10), y por consiguiente la bifurcacion de Hopf se produce en
el mismo punto ya se trate del sistema completo o el aproximado.
El termino x1 x24 afectara a la forma y tama
no de la cuenca de atraccion del ciclo lmite,
pero no la produccion de la bifurcacion misma. Podra afectar a la naturaleza (subcrtica
o supercrtica) de la bifurcacion de Hopf. Pero, en este caso, la bifurcacion mantiene su
naturaleza supercrtica, como se ha comprobado en las simulaciones. La gura 6.9 muestra
los resultados de simulacion del sistema de la bola en la viga empleando la ley de control
(6.9.18). Las tres gracas superiores corresponden a valores positivos de , obteniendo
un comportamiento oscilatorio, mientras que las tres u
ltimas se obtienen con < 0 y
por tanto estabilizando el sistema en el origen. El resto de los parametros son B = 1,
G = 1, k1 = 0, k2 = 10, c = 0.5. Las condiciones iniciales varan de una simulacion a la
siguiente, dentro de la cuenta de atraccion. Finalmente, la gura 6.10 muestra la cuenca
de atraccion del ciclo lmite obtenida por simulacion al hacer = 0.1. Las zonas oscuras
indican condiciones iniciales de velocidad nula para las cuales las trayectorias convergen al
conjunto lmite deseado. Esta region es notablemente menor que la obtenida en el sistema
de levitacion magnetica. Esto se debe al uso de un modelo simplicado de la bola en la
viga en el procedimiento de dise
no del controlador.
Ademas de la existencia de una region de atraccion limitada, otra consecuencia de
ignorar el termino x1 x24 en (6.9.9) es la distorsion de oscilaciones que aparecen al crecer
. Esto se ilustra en la gura 6.11, donde el sistema en bucle cerrado se ha simulado
con los valores B = 1, G = 3, k1 = 0, k2 = c = 0.1 (se ha incrementado el valor de G
para subrayar dicho termino de distorsion). La primera graca ilustra un comportamiento
cuasi-armonico puro para valores peque
nos de (en la simulacion =0.4), pero al crecer
(4.0 en la simulacion) la forma de la oscilacion lmite en x2 se aleja progresivamente del
perl senoidal.

166

6.9. Aplicacion a sistemas subactuados

x1(0)=3.90, x3(0)=0.01, =0.1

0.5

1.5

300

x1(0)=0.00, x3(0)=0.30, =0.1

x (cont.), x (trazos)

0.5

1.5

200
tiempo(s)

100
200
tiempo(s)

300

400

100
200
tiempo(s)

300

x1(0)=3.90, x3(0)=0.01, =0.1

x1(0)=2.00, x3(0)=0.80, =0.1

1.5

2
1

0.5

0.5

100
200
tiempo(s)

1
0.5

x (cont.), x (trazos)

1.5

0.5

x (cont.), x (trazos)

0.5

x1(cont.), x2(trazos)

x1(0)=2.00, x3(0)=0.80, =0.1

x (cont.), x (trazos)

x1(cont.), x2(trazos)

x1(0)=0.00, x3(0)=0.30, =0.1


1

0
1

100
200
tiempo(s)

300

0
0.5

100
200
tiempo(s)

300

Figura 6.9: Resultados de simulaci


on del sistema de la bola en la viga.

1.5

Puntos fuera del


dominio de atraccion (area en blanco)

x3(0)

0.5

Puntos dentro del dominio


de atraccion (area punteada)

0.5

1.5
6

x1(0)

Figura 6.10: Estimaci


on numerica de la cuenca de atraccion.

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

167

Figura 6.11: Distorsi


on para grandes amplitudes.

6.10 Estabilizacion de oscilaciones por Inmersion e Invariancia


En esta seccion,cuyos resultados se han publicado en (Gordillo, Gomez-Estern, Ortega &
Aracil 2002), se abordara el problema de la estabilizacion de orbitas periodicas desde una
perspectiva diferente. Se pretende servira para ilustrar una tecnica de reciente desarrollo
y extenderla al dominio de las oscilaciones. De nuevo se evitara tratar el problema de las
oscilaciones como un seguimiento de trayectorias sinusoidales la inconveniencia de tratar
con se
nales dependientes del tiempo. Para ello se hara una inmersion de la dinamica
objetivo del sistema oscilante denido en (6.2.7) y V0 = P 2 /4, en un espacio de orden
cuatro que es el espacio de estados del sistema original. En este espacio se denira una
variedad atractiva en la que las trayectorias siguen una oscilacion sinusoidal pura.
La novedad de este enfoque reside en la extension del metodo de Inmersi
on e Invariancia (vease la proposicion 2.7.1), inicialmente concebido para la estabilizacion de
equilibrios, a el caso de estabilizacion de conjuntos lmite de mayor dimension como es
el caso de orbitas periodicas. Asimismo supone una alternativa viable para el caso de
sistemas no lineales de orden mayor que dos que no posean estructura en cascada.
Como se indica en (Gordillo, Gomez-Estern, Ortega & Aracil 2002), aplicaremos la
proposicion 2.7.1 del metodo de Inmersion e Invariancia de (Astol & Ortega 2001) al
modelo simplicado normalizado (6.9.10) del sistema de la bola en la viga (gura 4.6) con
dinamica objetivo (6.2.3).
El metodo de Inmersi
on e Invariancia esta dise
nado con la idea de convertir una
dinamica objetivo estable de orden n en una variedad diferenciable inmersa en un espacio
de orden m > n, de modo que esta variedad sea invariante y atractiva en el espacio
m-dimensional. En nuestro caso la variedad de orden mayor, representada por (2.7.7)
en la proposicion (2.7.1), viene dada por el sistema de la bola en la viga. El sistema de
orden menor correspondiente a la dinamica objetivo (ecuacion (2.7.8)en la proposicion de
Inmersion e Invariancia) sera el sistema hamiltoniano oscilatorio de segundo orden (6.2.3).

168

6.10. Estabilizacion de oscilaciones por Inmersi


on e Invariancia

El primer paso del metodo es la determinacion del mapeo (). Para forzar las oscilaciones en la coordenada de la bola escogeremos 1 = 1 y 2 = 2 . Las funciones 3 y 4
pueden determinarse imponiendo la condicion de invariancia, que resulta
3 () = sen1 (1 + ka 2 P ())
3
3
4 () =
2 +
(1 ka 2 P ())
1
2

(6.10.1)
(6.10.2)

La eleccion obvia para el primer elemento de la variedad implcita (6.2.7), 1 , es 1 (x) =


x3 sen1 (x1 + ka x2 P (x1 , x2 )). Sea 2
2 (x) = x4

3 |x
3 |x
x2
(senx3 )
x1
x2

Notese que la identidad de la variedad implcita (6.2.7) es cierta, dado que


{1 = 0, 2 = 0} x4 =

3
3
2 +
(1 ka 2 P ())
1
2

Con esta eleccion, es obvio que 1 = 2 . Entonces, deniendo




S(x1 , x2 , x3 ) =

3 |x
3 |x
x2 +
senx3
x1
x2

se obtendra el sistema exterior a la variedad (donde z = 0 implica estar en ella) (2.7.11)


como sigue
z1 = z2
z2 = v +

(6.10.3)
S
S
S
x2
senx3 +
x4
x1
x2
x3

(6.10.4)

Entonces, una posible ley de control estabilizante es


v=

S
S
S
x2 +
senx3
x4 k1 1 (x) k2 2 (x)
x1
x2
x3

con k1 , k2 > 0.

6.10.1 Resultados de la simulacion


A n de mostrar el comportamiento de la ley de control obtenida se presenta una simulacion para = 0.1, ka = 1, k1 = 1 y k2 = 1. Las condiciones iniciales son x(0) =
[0.9, 0.1, 0, 0]. La gura 6.12 muestra las trayectorias de las coordenadas fuera de la variedad z1 y z2 tendiendo a cero, mientras que la gura 6.13 muestra que, tras un periodo
transitorio, las
variables x1 y x2 de hecho exhiben oscilaciones sinusoidales con la amplitud deseada . Finalmente, la gura 6.14 muestra el retrato de estados proyectado en
el plano (x1 x2 ).

Captulo 6. Estabilizaci
on de oscilaciones en sistemas no lineales

169

(cont.) (discont.)

0.5

0.5

1.5

10

15
Tiempo (s)

20

25

30

Figura 6.12: Evoluci


on de z1 y z2 .

0.8

0.6

x (cont.) x (discont.)

0.4

0.2

0.2

0.4

0.6

0.8

10

15
Tiempo

20

25

30

Figura 6.13: Evoluci


on de x1 y x2 .

0.6

0.4

0.2

x2

0.2

0.4

0.6

0.8
0.8

0.6

0.4

0.2

0.2

0.4

0.6

0.8

x1

Figura 6.14: Retrato de estados proyectado en (x1 x2 ).

170

6.10. Estabilizacion de oscilaciones por Inmersi


on e Invariancia

Captulo 7
Conclusiones y desarrollos futuros
Este captulo se dedica a la exposicion resumida de las aportaciones de esta tesis comenzando por el captulo 3. Al nal del captulo se propondran una serie de trabajos de
desarrollos futuros a modo de continuacion de la investigacion desarrollada en esta tesis.

7.1 Conclusiones del captulo 3


En el captulo 3 se ha presentado el desarrollo teorico y la implementacion practica de un
metodo de control no lineal que tiene su utilidad tanto para linealizar y desacoplar las
articulaciones de un sistema multivariable, como para estabilizar puntos de equilibrio. El
metodo se basa en la modicacion de la funcion de energa del sistema y su formulacion
hamiltoniana. La ley de control se obtuvo imponiendo ciertas condiciones a las ecuaciones de lazo cerrado. El hecho de obtener un sistema en bucle cerrado con estructura
hamiltoniana ha sido explotado para resolver el problema de rechazo de perturbaciones
con ganancia L2 . Posteriormente se ha desarrollado un controlador basado en pasividad
para el seguimiento visual de objetivos moviles.
Se ha resuelto el caso particular de una plataforma de sensores de dos grados de
libertad construida en el laboratorio del Depto. de Ingeniera de sistemas y Automatica
de la Universidad de Sevilla, para la que se ha dise
nado un controlador basado en estas
tecnicas. Las dicultades detectadas durante la implementacion real del sistema han
sido descritas, as como el metodo empleado para la identicacion de los parametros
del sistema. Se ha realizado una serie de experimentos de identicacion, de los que se
obtuvo un juego de parametros del modelo ables con los que ajustar el controlador para
estabilidad asintotica global. Finalmente se han presentado los resultados experimentales
en bucle cerrado.

7.2 Conclusiones del captulo 4


En el captulo 4 se ha caracterizado un clase de sistemas mecanicos subactuados para los
cuales la recientemente desarrollada metodologa IDA-PBC proporciona una estabilizacion
suave. La clase viene dada en terminos de resolubilidad de dos sistemas de ecuaciones
diferenciales parciales (4.2.12), (4.2.13). Aunque es bien sabido que resolver EDPs es
171

172

7.3. Conclusiones del captulo 5

en general difcil, se han a


nadido algunos grados de libertadla matriz de interconexion
en bucle cerrado J2 para simplicar la tarea, ademas de dar algunas claves para su
resolucion.
Para ilustrar la tecnica, se ha presentado una realimentacion no lineal de la salida IDAPBC que estabiliza para cualquier condicion inicial (excepto un conjunto de medida cero)
la posicion vertical superior de un pendulo invertido recientemente presentado (Spong
et al. 2001). En opinion del autor de esta tesis, se trata del primer resultado de swingup y estabilizacion de un pendulo subactuado sin el empleo de conmutacion ni haciendo
medida alguna de la velocidad. Vease tambien (Praly, Ortega & Kaliora 2001) para una
solucion alternativa, con realimentacion del estado completo, usando un variacion del
forwarding. Tambien hemos derivado una ley de realimentacion estatica del estado IDAPBC para el conocido sistema de la bola en la viga, capaz de estabilizar asintoticamente
el equilibrio en cero para un conjunto bien denido de condiciones iniciales, manteniendo
la bola dentro de la longitud de la viga. De nuevo, en opinion del autor de esta tesis, no
existe en la literatura ning
un resultado semejante relativo a la calidad del transitorio de
este sistema.
Hay muchos posibles extensiones para el trabajo de este captulo. En primer lugar se
puede tratar de evitar resolver las (infames) ecuaciones diferenciales parciales, planteando
el problema dual, jando la funcion de energa Hd a cierta forma deseada, y tratando de
resolver la ecuacion algebraica para Jd . Esto es, en esencia, el enfoque adoptado en el
reciente artculo de (Fujimoto & Sugie 2001), vease tambien (Rodrguez & Ortega 2002).
En segundo lugar, ya discutimos en la seccion 4.2.4 que el IDA-PBC permite la consideracion de fuerzas giroscopicas en la funcion de energa. Aunque no es claro a estas alturas
como pueden ser aprovechadas en aplicaciones mecanicas, se sabe que juegan un papel
fundamental en aplicaciones electromecanicas, donde el equilibrio deseado no ocurre para
una energa cinetica nula. Algunos resultados preliminares a lo largo de estas lneas para
sistemas de levitacion magnetica y motores electricos son muy prometedores (Rodrguez &
Ortega 2002). En tercer lugar sera deseable, por supuesto, tener un mejor entendimiento
de las EDPs que aparecen en IDA-PBC, por un lado, para obtener un procedimiento de
dise
no mas sistematico, y por otro, para llevar a termino las limitaciones intrnsecas de
la metodologa (por ejemplo, desarrollando condiciones para la no resolubilidad de las
EDPs.) Un aspecto particularmente importante es que a efectos de estabilidad, no basta
con encontrar cualquier solucion Md y Vd de las PDEs, sino una que satisfaga cierta clase
de condiciones de contorno. El estudio de esta restriccion adicional esta esencialmente
abierto.

7.3 Conclusiones del captulo 5


En el captulo 5 se ha obtenido una descripcion mas sencilla y practica del metodo IDAPBC, mediante transformaciones algebraicas de las ecuaciones de moldeo de energa. Esta
reduccion se aplica a una amplia clase de sistemas subactuados, que comprende algunos
de los mas estudiados en la literatura.
Las formulas resultantes tienen una estructura que permite en el caso de dos grados
de libertad, la construccion de una solucion por medio de la integracion de una funcion
monovariable. Para ello se ha propuesto nueva parametrizacion de los de los elementos

Captulo 7. Conclusiones y desarrollos futuros

173

de Md , la matriz de inercia en bucle cerrado1 .


La principal dicultad estriba en garantizar que Md sea globalmente denida positiva,
y simultanear este resultado con la asignacion del mnimo de energa potencial. Esto
es mas complicado a
un en sistemas de mas de dos grados de libertad. Sin embargo,
la reduccion propuesta no pierde generalidad con respecto al metodo general IDA-PBC
descrito en el captulo anterior y por tanto en muchos casos se dispone de grados de
libertad sucientes para resolver el problema.
Con este metodo se han obtenido leyes de control suaves con una amplia cuenca de
atraccion para problemas clasicos de control de sistemas subactuados. El rendimiento
de los controladores no lineales es muy satisfactorio incluso lejos de la region donde el
modelo puede ser linealizado y controlado por tecnicas lineales, como se aprecia en las
simulaciones. La respuesta transitoria y la cuenca de atraccion del control PBC de la
bola en la viga y el pendulo invertido, as como las posibilidades de ajuste de constantes
con signicado fsico ilustra las ventajas del metodo. Sin embargo, cabe recalcar que las
dicultades computacionales aumentan considerablemente cuando se trata de sistemas de
mas de dos grados de libertad.

7.4 Conclusiones del captulo 6


En este captulo se ha presentado una tecnica para la obtencion de oscilaciones estables y
robustas en una clase de sistemas no lineales, inclusive algunos sistemas mecanicos subactuados. Para lograr esto se ha presentado una ley de realimentacion capaz de conducir a
un sistema mecanico de segundo orden hacia un ciclo lmite estable. Esta realimentacion
pertenece a la familia de metodos de dise
no basados en el moldeo de energa. El ciclo
lmite esta asociado a la aparicion de una bifurcacion de Hopf en un sistema hamiltoniano generalizado. A continuacion, mediante backstepping la ley de control se obtiene
recursivamente para el sistema completo, sin limitacion en el orden de este. Un resultado interesante recae en el hecho de que la bifurcacion de Hopf se mantiene a medida
que aumenta el orden del sistema gracias a la tecnica basada en backstepping. El segundo resultado que se desprende de esta tecnica, en cierta medida sorprendente, es que
independientemente del orden del sistema, en bucle cerrado se obtiene una estructura
hamiltoniana generalizada con disipacion con respecto a la funcion de Lyapunov constru
ida en la fase de backstepping. Este
es un hecho a explorar por las posibilidades que abre
en cuanto a robustez y rechazo de perturbaciones L2 .
El metodo de dise
no ha sido ilustrado mediante su aplicacion a dos sistemas clasicos
subactuados: el levitador magnetico y la bola en la viga. La metodologa se extiende
a orden mayor, sin un lmite teorico. Finalmente se ha abordado el problema de la oscilacion con dinamica objetivo el sistema hamiltoniano generalizado empleando un metodo
novedoso, la Inmersion e Invariancia, obteniendo resultados similares. Finalmente se ha
abordado el problema de la oscilacion con dinamica objetivo el sistema hamiltoniano
generalizado empleando un metodo novedoso, la Inmersion e Invariancia, obteniendo resultados similares en el caso de la bola y la viga

Las incognitas de la fase de moldeo de energa potencial.

174

7.5. Desarrollos futuros

7.5 Desarrollos futuros


Los problemas que se abordan en esta tesis abren las puertas a una serie de lneas de
investigacion futuras destinadas basicamente a extender el ambito de aplicacion de los
razonamientos teoricos aqu expuestos y a renar los resultados.

7.5.1 Cinematica de la plataforma de sensores


En primer lugar se tratara el tema del control inercial. En el estudio de la dinamica
del pedestal de sensores se ha empleado un modelo hamiltoniano basado en la hipotesis
de un sistema inmerso en un sistema de referencia inercial. Esto implica ignorar los
pares centrfugos y de coriolis que aparecen debido a giros y aceleraciones del sistema de
referencia sobre el que se instala la plataforma, como es el caso de la cubierta de un buque.
En aplicaciones de este tipo (navales), las oscilaciones de cubierta debidas al oleaje son de
peque
na velocidad angular, hasta tal punto que los pares centrfugos y de coriolis pueden
ser ignorados, o como se hace en el captulo (3), subsumidos en un termino acotado de
perturbaciones cuyo efecto en el vector de estado sera rechazado mediante un control
basado en la atenuacion de perturbaciones con ganancia L2 . Si estamos interesados en
plataformas de sensores sometidas a dinamicas mas rapidas del sistema de referencia que
las soporta, como puede suceder en vehculos terrestres o aplicaciones aeroespaciales, este
enfoque pierde su validez.
Un estudio mas exhaustivo involucrara un conocimiento explcito de la cinematica y
dinamica del sistema completo soporteplataforma. Es evidente que el sistema que da
soporte a la plataforma esta sometido a movimientos y perturbaciones aleatorias, pero
a diferencia de el tratamiento presentado, estas perturbaciones pueden ser medibles. Un
sencillo sistema de inclinometros, acelerometros y giroscopos en la supercie del buque,
proporcionara una medida en tiempo real de la velocidad del origen y los angulos de
Euler del sistema de referencia de la plataforma, con respecto a unos ejes jos en tierra.
A partir de estas medidas, deniendo los sistemas de referencia (vease gura 7.1)
S.R.0 Sistema de referencia inercial jo en tierra.
S.R.1 Sistema de solidario al vehculo o buque, asociado al soporte inmovil de la
plataforma de sensores.
Denominaremos R01 a la matriz unitaria de rotacion desde el sistema de referencia 0 al 1,
formada por los senos y cosenos de los angulos de Euler, y P 1 al vector director unitario
de la lnea de mira de la plataforma expresado en las coordenadas del sistema (1), se tiene
P 1 = [cos cos sen cos sen]T
siendo y los angulos de acimut y elevacion de la plataforma, respectivamente seg
un el
criterio empleado en el captulo (3). Supongamos que el objetivo de control es mantener
estable la lnea de mira de la plataforma hacia un satelite geostacionario de comunicaciones. Dado que la distancia desde la supercie terrestre de la orbita ja (35900 km),
el apuntamiento (c , c ) se puede expresar como una funcion de la latitud y la longitud
terrestre. Este objetivo de control puede ser expresado como mantener constantes las

Captulo 7. Conclusiones y desarrollos futuros

175

z1
elevacin
plataforma

P
z0

Rotacn: R01
Traslacin T01

y1
acimut
plataforma

x1

x0
Sistema de referencia
fijo en tierra

Sistema de referencia
del vehculo

y0

Figura 7.1: Composicion de sistemas coordenados en la plataforma de sensores.

coordenadas del vector P 0 expresadas en el sistema de referencia jo en tierra (0) independientemente de las perturbaciones y los movimientos realizados por el vehculo que
soporta la antena. En este caso se tiene que la salida del sistema es
y = P 0 = R01 P 1 .
y el equilibrio a estabilizar sera
y = (c , c )
El problema se enunciara del siguiente modo: conocido P 1 dise
nar un sistema de sensores
de precision para obtener R01 y sus derivadas, y una ley de control robusta que estabilice
la salida del sistema en y .
Tengase en cuenta que en este problema no es necesario conocer las velocidades de
traslacion del origen del sistema (1) respecto a tierra.
Un problema a
nadido es determinar una ley de control que logre este objetivo, al
menos de forma aproximada, a partir de las medidas de dos giroscopos montados sobre la
cabeza de la plataforma. El dise
no de esta ley plantea la dicultad a
nadida de realimentar
la velocidad en lugar de la posicion, por lo que se desea estabilizar es una integral de la
medida de los sensores, ya que no se dispone de una estimacion de R01 . La estabilizacion de
la integral puede acumular errores en regimen permanente irrecuperables debido al efecto
de perturbaciones. Sin embargo, es posible obtener una realimentacion periodica del error
de seguimiento mediante un subsistema de vision externo, de mucha menor frecuencia,
que permita al sistema corregir la deriva acumulada. Este es el principio del sistema
DORNA que se describira en el apendice de esta tesis, para el que a
un no se ha propuesto
un marco teorico completo de analisis de estabilidad y rendimiento.
Los posibles resultados en esta lnea tendran la ventaja de reducir la complejidad
y el tiempo de computo asociados a la introduccion de un modulo de interpretacion de
imagenes de vdeo en el sistema.

176

7.5. Desarrollos futuros

7.5.2 Sistemas subactuados


Esta lnea es una fuente continua de problemas abiertos y objeto de una intensa actividad
investigadora por parte de matematicos e ingenieros de control. Dentro del contexto de la
pasividad y de los desarrollos presentados en esta tesis basados en el metodo IDA-PBC,
se proponen las siguientes lneas como trabajo futuro.
Como es sabido, la sobreoscilaci
on y el tiempo de establecimiento son dos parametros
del control de notable importancia en el dise
no. Paralelamente a los resultados
relacionados con el analisis transitorio de sistemas controlados mediante pasividad
presentados en el captulo 4, que establecen un marco para el computo aproximado
de la maxima sobreoscilacion, hallar un metodo exacto o numerico aproximado para
estimar el cotas superiores del tiempo de establecimiento del sistema. Para ello debemos explotar el hecho intuitivo de que kv , la tasa de disipacion, es una medida de lo
rapido que se perdera energa y se convergera al equilibrio. Sin embargo, debido al
caracter fuertemente no lineal del sistema de la bola en la viga, ni siquiera podemos
armar que en todo caso un crecimiento de kv implica un tiempo de establecimiento menor. Y de ning
un modo disponemos, de momento, de una relacion siquiera
aproximada entre kv y tiempo de establecimiento.
Extender las ecuaciones reducidas del metodo IDA-PBC al caso de sistemas con
mas de un grado de subactuacion2 .
Estudiar las posibles soluciones proporcionadas por el metodo del captulo 5 en otros
sistemas subactuados de interes en la comunidad investigadora: pendulos rotatorios,
Acrobot, Pendubot, etc.
Denir de una manera practica el conjunto posible de hamiltonianos controlados, es
decir, el conjunto de funciones de hamilton en bucle cerrado alcanzable en el caso
de un problema de control subactuado. Esta lnea ha comenzado de la mano de
los trabajos de (Blankenstein, Ortega & Van der Schaft 2002), y resta proporcionar
soluciones automaticas3 ,
Introduccion de restricciones no holonomas en el metodo IDA-PBC. El marco teorico
de esta lnea ha sido introducido en (Blankenstein 2002), sin embargo la complejidad que involucra requiere un tratamiento simplicador similar al presentado en el
captulo 5.
Incorporacion de terminos de friccion realistas en los modelos en bucle de abierto
del metodo IDA-PBC y Lagrangianos controlados. Pese a los recientes avances en
modelado y compensacion de friccion (Canudas de Wit et al. 1995), la manera de
compensar sus efectos en el caso de sistemas subactuados representa un terreno
difcil e inexplorado. Concretamente en el caso del IDA-PBC, un modelo simple
de friccion viscosa rompera la division energa potencialcinetica de las ecuaciones,
debido a la introduccion de terminos no cuadraticos de la velocidad.
El area del control de sistemas subactuados en toda su generalidad, se mantiene como
un problema abierto para el que solo se han encontrado soluciones en el caso de sistemas
2

Nos referimos los grados de subactuacion como la diferencia entre el n


umero de grados de libertad y
de subactuadores.
3
que no involucren la resoluci
on de un sistema de EDPs

Captulo 7. Conclusiones y desarrollos futuros

177

subactuados simples. Las distintas tecnicas de control presentadas en esta tesis allanan
el camino hacia las soluciones de tipo GAS de cierto sistema pero al mismo tiempo,
el imponer estructuras en bucle cerrado de tipo lagrangiano o hamiltoniano, podran
obstaculizar el descubrimiento de otras leyes mas generales.
Una metodologa constructiva (mas alla de los importantes pero poco practicos enunciados de existencia) de sntesis para sistemas no lineales controlables de la forma x =
f (x, u) sigue siendo uno de los objetivos mas codiciados y al mismo tiempo inalcanzables
dentro de la literatura del control.

7.5.3 Estabilizacion de oscilaciones


Como se ha mencionado recientemente en (Bullo 2002) la estabilizacion de oscilaciones en
sistemas no lineales tiene un enorme interes en el area de robots caminantes. Los robots
caminantes son sistemas hbridos ya que su dinamica tiene una parte continua que admite
la clasica descripcion en variables de estado y una parte conmutada, donde las variables
pueden tomar un valor dentro de un conjunto discreto.
En nuestro caso, cada articulacion o robot caminante debe conmutar entre una dinamica
donde el pie esta apoyado en el suelo, y otra donde este realizando una trayectoria de
avance en el aire. En (Bullo 2002) se propone una orbita periodica de referencia para el
sistema hbrido que permita el avance del robot caminante. La principal aportacion de
la ley de control resultante esta en el hecho de que no maneja se
nales dependientes del
tiempo y en su caracter hbrido.
Con el n de enlazar los procedimientos expuestos en esta tesis de estabilizacion de
orbitas mediante consideraciones energeticas, con la lnea de Bullo por su evidente interes
practico, una propuesta de desarrollo futuro consiste en extender los desarrollos a orbitas
hbridas, donde la funcion de energa, por si misma, admita discontinuidades cuando el
estado conmute de una region a otra. En este caso habra que estudiar el metodo para
garantizar un decrecimiento de la funcion de energa a lo largo de las trayectorias en
ausencia de conmutacion, as como la continuidad de dicha funcion en el cambio de region
de fucionamiento. Las ventajas de trasladar el enfoque hamiltoniano a estos contextos
son, fundamentalmente,
Posibilitar un estudio de robustez basado en pasividad y ganancia L2 .
Proporcionar un metodo de deteccion de bifurcaciones en sistemas como robots
caminantes.
Aproximacion a las orbitas objetivo por la va mas proxima posible. En el caso
de robots caminantes esto es un elemento esencial, dado que la aproximacion a
una orbita ja con se
nales dependientes del tiempo, podra introducir al sistema en
estados transitorios inestables y provocar una perdida de equilibrio del robot.
Evitar la incomodidad en la fase de desarrollo software de trabajar con se
nales
dependientes del tiempo como referencia de las trayectorias.
El segundo campo de aplicacion en el que se abre una lnea de investigacion de sumo
interes es el dise
no de sistemas electronicos de potencia, donde las se
nales de corriente
alterna producida por circuitos eventualmente conmutados, deben estabilizarse en una

178

7.5. Desarrollos futuros

orbita periodica correspondiente a un armonico puro y una serie de se


nales con desfase
constante. De especial interes es el caso de los sistemas de alimentacion ininterrumpida
(SAI).
Recordemos que los resultados presentados en esta tesis, concretamente la formulacion
hamiltoniana generalizada es solo de directa aplicacion en sistemas mecanicos completamente actuados y una amplia clase de subactuados. De hecho la ecuacion (6.2.7) esta
dise
nada para ajustarse a la de los sistemas mecanicos donde la primera ecuacion de estado es x 1 = x2 relacionando posicion y velocidad dado que las fuerzas solo tienen efecto
en la derivada de la velocidad. El ajuste de un sistema no lineal sin estructura mecanica,
como es el caso de los sistemas electronicos de potencia, puede presentar dicultades a
la hora de encontrar una ley de ajuste tal que en bucle cerrado se obtenga la estructura
disipativa oscilatoria (6.2.7). De hecho, posiblemente esta estructura puede no ser la ideal,
dependiendo del sistema que se trate, y posiblemente sea necesario dise
nar estructuras
hamiltonianas generalizadas ad hoc que cumplan la condicion de disipatividad con respecto
a la funcion de energa oscilatoria presentada en el capitulo 6, y que faciliten la b
usqueda
de leyes de control para el ajuste de las dinamicas en bucle abierto y cerrado.
A continuacion se daran unas indicaciones basicas para el procedimiento de dise
no.
En el caso de que el modelo del sistema de potencia sea linealizable por realimentacion,
es de directa aplicacion la tecnica de sntesis ilustrada en la seccion 6.7 del captulo 6. El
procedimiento en el caso mas general implica un proceso iterativo de dise
no a dos niveles:
la eleccion de una funcion de Hamilton Hd con un conjunto mnimo en una orbita periodica
deseada, lo cual puede ser objeto de una secuencia de ensayo y error, y el dise
no de una
dinamica hamiltoniana para un subsistema de segundo orden, con funcion de Hamilton
Hd . Si no se encuentra una ley de ajuste adecuada a partir del modelo en bucle abierto,
se puede optar redise
nar tanto la funcion de energa, como la dinamica objetivo oscilante.
Los detalles de este procedimiento se ilustran en el diagrama de ujo de la gura 7.2.

Captulo 7. Conclusiones y desarrollos futuros

179

Inicio

SI
Modelo linealizable
por realimentacin?

NO
Rediseo a Nivel 1

Eleccin de la funcin de energa


Hd con un conjunto mnimo en la
orbita peridica

Rediseo a Nivel 2

Eleccin de la dinmica en bucle


cerrado disipativa respecto a Hd
considerando las
peculiaridades del modelo

NO

SI

Agotada
bsqueda?

Emplear Hd y la estructura GHS


del Captulo 6

NO

Existe ley de ajuste para


subsistema de orden 2?

SI

NO
Estuctura triangular?

SI

Inmersin e Invariancia
u otras tcnicas de ajuste

Backstepping

Clculo de la ley de control


(Cap. 6)

Fin

Figura 7.2: Procedimiento de dise


no de un controlador para estabilizaci
on de oscilaciones
basado en pasividad en sistemas sin estructura mecanica.

180

7.5. Desarrollos futuros

Ap
endice A
Proyecto DORNA
A.1 Introduccion
En este apendice se presenta una aplicacion para el control de una plataforma giroestabilizada inicialmente publicado en (Gomez-Estern, Perez, Rubio & Gordillo 2000). El
objetivo de la aplicacion es controlar las velocidades de la plataforma medidas respecto a
ejes inerciales independientemente de las perturbaciones a las que se ve sometida. Dicha
aplicacion se implementa en un hardware basado en bus VME, en la que se usa una arquitectura distribuida mediante tres procesadores DSP. Para el desarrollo de la aplicacion se
ha implementado a su vez un simulador de la plataforma giroestabilizada con una interfaz
hardware con el controlador.
Inicialmente se explicara lo que se entiende en este apendice por plataforma. Una
plataforma consiste en un mecanismo de dos grados de libertad de tipo rotacional. La
disposicion fsica de los ejes permite al elemento terminal posicionarse con distintas orientaciones y elevaciones, dentro de los limites fsicos del mecanismo, un esquema completo
de la plataforma se puede ver en la gura A.1. Normalmente el movimiento se limita
u
nicamente en elevacion, por lo que la transmision de se
nales se realiza a traves de anillos
colectores situados en la parte inferior.
El control de plataformas giroestabilizadas presenta un gran interes en el ambito de
aplicaciones de tipo aeronautico o de navegacion. Normalmente este tipo de plataformas
se ubican en un movil que posee una determinada orientacion variable respecto a tierra.
Estas variaciones de orientacion del movil que soporta la plataforma son detectadas por
sensores de tipo giroscopico ubicados en el extremo de la plataforma. Por lo que las
medidas proporcionadas por el giroscopo dependen de la posicion en la que se encuentren
los dos grados de libertad de la plataforma. El sensor giroscopico usado mide velocidades
en dos de sus ejes.

A.2 Arquitectura hardware


La arquitectura hardware del controlador del posicionador esta basada en bus VME.
Sobre dicho bus se dispone de un sistema multiprocesador que cuenta con entradas y
salidas de diversos tipos, as como interfases Ethernet para la comunicacion con otros
181

182

A.2. Arquitectura hardware

y
z

Figura A.1: Esquema de la plataforma giroestabilizada.

equipos. En concreto las distintas tarjetas de las que dispone el sistema y que conforman
la arquitectura de la gura A.2 son:
Una tarjeta basada en un procesador Motorola 68040 que se encarga de gestionar
las interfases Ethernet.
Una tarjeta basada en un DSP TMS320C40 (Texas Instruments 1999) que interpreta
los mensajes recibidos de por la red Ethernet. A su vez enva respuestas a traves de
la red y gestiona una maquina de estados que gobierna las distintas modalidades de
comportamiento del pedestal.
Dos tarjetas basadas en un DSP TMS320C40 que implementan lazos de control
para los dos grados de libertad de la plataforma. Cada tarjeta posee un modulo
de entradas y salidas analogicas que permite a cada eje la lectura de tacometro y
giroscopo. Este modulo tambien dispone de salidas analogicas para controlar el par
aplicado a lo motores. Los modulos de E/S analogicas no son accesibles desde el bus
VME, sino desde el bus interno de las tarjetas DSP. Todos los canales analogicos,
tanto los de entrada como los de salida tienen una resolucion de 12 bits.
Una tarjeta de E/S digital para tener informacion de mecanismos de seguridad y
activar y desactivar dispositivos auxiliares. Esta tarjeta se gestiona desde el procesador de comunicaciones y maquina de estados.
Una tarjeta para permitir la lectura de los resolver que proporcionan la posicion del
pedestal. Los resolver usados son de doble precision 1 y 16 usando convertidores
RD de 14 bits.
El intercambio de informacion entre los distintos procesadores se realiza mediante
memorias del tipo DPR (dual port RAM ) que incorporan las tarjetas DSP.

Apendice A. Proyecto DORNA

183

Lazo elevacin
i
, ,

Ordenes
Datos Pedestal
Diagnsticos

Subsistema de
Operacin
Consignas
Modo de operacin
Registro de
Datos

M68040
Gestin de
Ethernet

i
, ,

Gestin de
Comunicaciones
y Estado.

Plataforma Giroestabilizada
Lazo orientacin

Figura A.2: Arquitectura hardware del sistema.

A.3 Arquitectura de la aplicacion


En el soporte fsico descrito se ejecuta una aplicacion en tiempo real multitarea y multiprocesador dividida en cuatro procesos:
Proceso para el envo y recepcion de datagramas UDP del protocolo de comunicaciones con el sistema de operacion. Las tramas recibidas se insertan en un buer de
memoria compartida para su acceso desde el proceso de gestion del sistema. Este
proceso no realiza ninguna interpretacion ni creacion de datagramas, solo sirve de
puente de comunicacion hacia el interfaz Ethernet. Esta tarea tiene lugar en la
tarjeta CPU basada en el procesador 68040.
Proceso de gestion del protocolo y la maquina de estados. Tiene lugar en una de
las tarjetas basada en el DSP TMS320C40 y su n es coordinar la actividad de los
controladores con las ordenes de protocolo recibidas en datagramas, responder a
dichas ordenes, gestionar los estados del sistema y detectar errores en los equipos.
En una seccion posterior se describe su funcionamiento con mayor detalle.
Proceso de control del eje de orientacion Tiene lugar en una de las DSP con tarjeta de
expansion conversora A/D-D/A. Controla la dinamica del eje en el modo requerido
por el sistema de operacion y la sincronizacion de los periodos de muestreo de ambos
lazos. Intercambia informacion con el proceso de gestion y variables dinamicas con
el controlador de orientacion para hacer posible el control multivariable.
Proceso de control del eje de elevacion. Act
ua de manera similar al anterior salvo
por tener los instantes de muestreo determinados por el controlador de orientacion,
por lo que funciona como esclavo de este. Ambos procesos seran descritos con mas
detalle en los apartados subsiguientes.
El acceso de tales procesos a zonas de memoria compartida para el intercambio de datos
conlleva la necesidad de arbitrar mecanismos de sincronizacion que eviten condiciones de
carrera. Para ellos se han implementado semaforos basados en el clasico algoritmo de
Peterson (Tanenbaum 2001), con la particularidad de que no se debe esperar mas de un

184

A.4. Simulador de la plataforma giroestabilizada

PAR_ELEVACION

GIROSCOPO_ELEVACION
HABILITACION_PEDESTAL
SINCRONIZACION
PETICION_TSO
ORDENES_VELOCIDAD_INERCIAL

SELECCION_MODO

ORDENES_VEL_INERCIAL_EM_GYRO

REFERENCIA_ELEV

ORDENES_VELOCIDAD_CUBIERTA

VARIABLES_ELEVACION

LAZO_CONTROL_
ELEVACION

TACOMETRO_ELEVACION
RESOLVER_ELEVACION

ORDENES_POSICION
GESTION
DE
COMUNICACIONES

ORDENES_DIAGNOSTICO

VARIABLES_
ELEVACION

DATOS_PLATAFORMA

VARIABLES_
ORIENTACION

GIROSCOPO_ORIENTACION
TABLA_SITUACION_OPERATIVA

SINCRONIZACION
SELECCION_MODO

DATOS_PEDESTAL

REFERENCIA_ELEV

TACOMETRO_ORIENTACION

LAZO_CONTROL_
ORIENTACION

RESOLVER_ORIENTACION

RESULTADOS_DIAGNOSTICO
VARIABLES_ORIENTACION
TOPES_PEDESTAL

PAR_ORIENTACION
BOCINA_PEDESTAL
FRENOS_PEDESTAL

Figura A.3: Arquitectura software del sistema.

plazo determinado a la espera del desbloqueo de una region crtica por parte de otro
proceso. Si se supera dicho plazo, se enviara un mensaje noticando la inactividad del
proceso bloqueante.
La arquitectura software descrita aparece reejada en el diagrama de la gura A.3

A.4 Simulador de la plataforma giroestabilizada


Para el desarrollo del sistema de control de la plataforma se ha contado con la importante
ayuda de un simulador de una plataforma. Dicho simulador se encuentra dotado de una
interfaz electrica conectable al controlador. El hardware del simulador consta de dos
partes:
Un rack con bus VME en el que se alojan tarjetas E/S para emular la presencia de
todos los sensores de la plataforma. En concreto se cuenta con entradas y salidas
analogicas y digitales, ademas de tarjetas para la emulacion de los resolvers.
Un ordenador PC en el que se ejecuta el programa simulador de la plataforma. La
interfase entre el ordenador y el bus VME se realiza mediante una tarjeta adaptadora
de bus VME a PCI.
El software del simulador se ha realizado en lenguaje C++ orientado a objetos, y realiza
como funciones mas importantes:
Integrar un modelo completo de la plataforma mediante el algoritmo Runge-Kutta
de orden 4 con un periodo de 1 ms.
Emular el movimiento de la base de la plataforma con se
nales conocidas.

Apendice A. Proyecto DORNA

185

Mantener una base de datos de juegos de parametros y opciones de simulacion de


la plataforma.
Realizar registros de las variables del sistema para su posterior analisis.
El modelo de la plataforma usado en el simulador ha tratado de recoger las no linealidades
mas importantes que se presentan en este tipo de sistemas. Se han incluido distintos
modelos de friccion como son los modelos estaticos y de LuGre (Canudas de Wit et al.
1995). El modelo a usar en cada simulacion es seleccionable por el usuario de entre los
existentes en la base de datos. En el simulador tambien se incorpora un modelo de la
holgura que se presenta en los engranajes que conectan el eje motor con el eje de la carga.
El conjunto de ecuaciones que se integran en cada periodo de muestreo es:


o kmo iao = Izz + s2 Ixx + c2 Izz + 2 Imo +
1

e kme iae

2 (Ixx Izz ) + f o ()
+ 2 bmo
+ s
2
2
o


2

= Iyy2 + e Ime
1
+ 2 bme
2 s2 (Ixx Izz ) + f e ()
2

donde i son las corrientes de los estator de los motores, km constantes de par de los motores, relaciones de las cajas de engranajes, Im inercias de los actuadores y los elementos
Iij las componentes de los tensores de inercia de las partes moviles. Las funciones f se
corresponden con los pares de friccion, en el caso de que este venga dado por el modelo
LuGre, se usan las expresiones:
f = 0 z + 1 z
abs(v)
z = v +
z
f (v)
1 (
f (v) =
C1 + V 1 abs(v)+
0

B1 abs(v)
sgn1 (v)
+ (S1 C1 ) e

C2 + V 2 abs(v)+

)
+ (S2 C2 ) eB2 abs(v) sgn2 (v)
!
1 si() > 0
sgn1 () =
0 si() 0
!
0 si() > 0
sgn2 () =
1 si() 0

(A.4.1)
(A.4.2)

(A.4.3)

El simulador incorpora un modulo para la visualizacion en tiempo real del movimiento


de la plataforma, tal y como se ve en la gura A.4. Tambien se incluyen herramientas
para la visualizacion y analisis de los datos generados por la simulacion.

A.5 Procesador de comunicaciones


Una tarjeta DSP se destina a gestionar la comunicacion con el sistema de operacion del
buque mediante un protocolo basado en datagramas UDP. Las funciones de esta tarjeta

186

A.5. Procesador de comunicaciones

Figura A.4: Modelo 3D del simulador de la plataforma.

son diversas:
Captura de informacion relativa a la dinamica de los lazos de orientacion y elevacion.
Para ello se establece una zona de memoria compartida con los procesadores de lazos
de control y sus correspondientes semaforos de acceso concurrente.
Construccion de mensajes de protocolo que seran enviados mediante UDP/Ethernet
al sistema de operacion del buque. Dichos mensajes se almacenaran en una zona de
memoria compartida con la CPU Motorola, arbitrandose los mecanismos oportunos
para el acceso concurrente y la noticacion de llegada de nuevos mensajes. El envo
de las tramas por red es tarea de la CPU de acceso a la red.
Recepcion de las referencias de control y modo de seguimiento desde el sistema de
operacion mediante el mismo protocolo. Si las ordenes solicitadas son viables seg
un
el estado de la maquina, se noticara debidamente a los lazos de control.
Realizacion de todos los chequeos de inicializacion y rutinarios de los elementos
hardware del sistema. (Tarjetas de entrada/salida, procesadores y memorias).
Habilitacion de temporizadores y disparo de eventos para la gestion de la actividad
sncrona de la maquina. Entre los procesos que se ejecutan de forma sncrona se
encuentra el envo de datos periodicos para los equipos de registro de datos del
buque, activable a distintas frecuencias.
Monitorizacion del funcionamiento de las DSP de los lazos de control. Se hace uso
de un mecanismo de tipo watchdog para detectar si alguno de los controladores
interrumpio su actividad al cabo de un periodo determinado.
Implementacion de una maquina de estados sncrona para la coordinacion de modos,
estados, entradas y salidas digitales como frenos y alarmas. La maquina de estados
se describe de forma somera en el siguiente apartado.

Apendice A. Proyecto DORNA

187

Fallo gyro AND


modo=velocidad_in
ercial
OR FALLO_BITE

ENCENDIDO
_1

BITE OK
OR IGNORA_BIT

ENCENDIDO
_2

FIN
TEMPORIZADOR
BOCINA

AND
PROTECCIONES_
OFF

Peticin TSO
HABILITA_
PEDESTAL
AND
EMERGENCIA

Fallo gyro AND


modo=velocidad_inercial
OR Fallo BITE
OR
DESHABILITA_
PEDESTAL

ARRAN
QUE
Prdida
COMUNICACION

ENCENDIDO
_3

FIN
TEMPORIZADOR
BOCINA

Fallo gyro AND


modo=velocidad_inercial
OR Fallo BITE
EMERGE
NCIA

OPERACION

Prdida
COMUNICACION

Figura A.5: Diagrama de estados del sistema.

A.6 Maquina de estados


Mencion aparte merece la funcion de coordinacion del sistema o maquina de estados. La
DSP de comunicaciones ejecuta un bucle innito con la estructura de automata logico
programable para coordinar las entradas, estados y salidas del sistema. El algoritmo
de la maquina de estados se descompone en adquisicion de las entradas (provenientes
del sistema de operacion, lazos, chequeos rutinarios, eventos del temporizacion y se
nales
digitales), determinacion del estado y modo de seguimiento futuros, determinacion de las
salidas correspondientes al estado y aplicacion de dichas salidas.
El bucle principal de operacion queda especicado en el pseudocodigo a continuacion:
1. Lectura de mensajes de protocolo provenientes del sistema de operacion.
2. Lectura de las coordenadas medidas por los lazos de control.
3. Lectura entradas digitales. Lectura a traves de la tarjeta I/O paralelo VME de las
se
nales binarias que dan cuenta del estado de operacion de los sistemas fsicos de
la maquina: topes superior e inferior, hombre arriba (para evitar el movimiento en
presencia de operarios), estado del giroscopo y perdida de la referencia del resolver.
4. Realizacion de chequeos internos periodicos. En el caso de existencia de fallos en
el Hardware, se determina si estos bloquean la operatividad de la maquina o si por
el contrario admiten un funcionamiento degradado. En funcion de este resultado
y del modo de funcionamiento se decidira si se debe operar de forma degradada o
deshabilitar el control.

188

A.7. Procesadores de lazos de control

5. Comprobacion de protecciones activas. El operario habilitara las protecciones al


aproximarse al pedestal para su manipulacion en condiciones de seguridad.
6. Actualizacion de los temporizadores. Los eventos sncronos generados por este
procesador funcionan mediante la cuenta atras de una serie de variables. Cuando
una de ellas llega a cero se dispara el evento correspondiente que sera posteriormente
procesado por la maquina de estados. La actualizacion de dichas variables se realiza
en virtud del tiempo transcurrido desde la u
ltima iteracion.
7. Obtencion del estado y modo seguimiento futuros en funcion de la informacion
recogida en los apartados anteriores.
8. Determinacion de salidas digitales correspondientes al estado actual. El conjunto
de salidas digitales activables son: frenos en cada eje, alimentacion del giroscopo,
bocina de emergencia y habilitacion de los servoamplicadores de los motores.
9. Aplicacion de los nuevos valores de las salidas digitales a traves de la tarjeta I/O
paralelo VME.
10. Envo de referencias y modos de seguimiento nuevos a las DSP de los lazos de
control. El modo de seguimiento dependera de la orden recibida desde el sistema
de operacion y la posibilidad de llevarla a cabo seg
un el estado y los errores que se
hayan detectado en los pasos anteriores.
11. Escritura en la memoria compartida de una tabla indicando el estado interno del
sistema y las modicaciones que se hayan producido para ser enviada hacia el sistema
de operacion. Asimismo se enviaran los mensajes periodicos pendientes al equipo
de registro de datos y las tramas de respuesta del protocolo que sean oportunas.
La gura (A.5) se reeja el diagrama de estados del controlador del pedestal de sensores:

A.7 Procesadores de lazos de control


Cada DSP que controla un lazo de control ejecuta un algoritmo de control en tiempo real
(Benett 1988). El programa en cada periodo de muestreo obtiene muestras de todos los
sensores y si la plataforma se encuentra en estado de operacion, el controlador calcula las
se
nales de control apropiadas. Los lazos de control pueden funcionar en distintos modos,
en cada modo la variable a controlar es distinta. Dichos modos son:
Modo de posicion, en el que se controla la posicion de los dos servomotores leda
por los resolver.
Modo de velocidad, en el que se controla la velocidad de los dos servomotores.
Modo de velocidad inercial, en el que se controla la velocidad inercial proporcionada
por el giroscopo.
Modo de velocidad de emulacion giroscopica, en este modo auxiliar se tiene utilidad
en caso de fallo del giroscopo. Externamente por medio de la conexion Ethernet a
otros sistemas se le puede proporcionar al los controladores la posicion en la que se

Apendice A. Proyecto DORNA

189

encuentra la base que soporta la plataforma, de este modo se pueden estimar las
velocidades inerciales.
Los procesadores de lazo de control disponen de mecanismos de autodiagnostico por medio
de los cuales se puede comunicar fallos hardware o desajustes de los controladores. Los
resultados de estos test se transmiten al procesador de comunicaciones. Las principales
funciones del modo de diagnosticos son:
Comprobacion de la respuesta al escalon de posicion.
Comprobacion de la respuesta al escalon de velocidad.
Ajuste manual y/o automatico de derivas.

A.8 Conclusiones
En este apendice se ha presentado un sistema en tiempo real para el control de una
plataforma con dos grados de libertad acoplados. El sistema mecanico es una plataforma
de sensores de navegacion martima de grandes dimensiones y estrictas especicaciones
de funcionamiento.
El texto pone de relieve aquellos aspectos de la implementacion que por su complejidad y originalidad resultan de interes en campos teoricos como el modelado y control
de sistemas dinamicos no lineales y en areas mas tecnicas como el desarrollo de aplicaciones con restricciones de tiempo real en sistemas multiprocesadores con elementos de
sincronizacion y memoria compartida basados en DSPs.
La losofa de la aplicacion informatica obedece a la estructura de programacion de
automatas programables al existir en la literatura metodos compactos de especicacion
y modelado de maquinas de estados para estos sistemas. El procedimiento de dise
no y
documentacion de la aplicacion obedece a normas de calidad en ingeniera del software.

190

A.8. Conclusiones

Ap
endice B
C
odigo Maple para la ecuaci
on
(6.8.1)
El computo de cada termino de la ecuacion (6.8.1) puede ser tarea ardua, lo cual ha
motivado el desarrollo de unas rutinas Maple para el calculo automatico simbolico de la
ley de control para un orden arbitrario.
En primer lugar se crean los vectores cuyos elementos son los ki , i xi y fi de la seccion
6.8. Para ello se denira el siguiente procedimiento Maple
init := proc (n) local m, i;
global gam,x,f,vectk,P,u0;
m:=n-2; u0:=-x1-k0*P*x2; m := n-2;
vectk := [evaln(k || (1 .. m))];
gam := [evaln(gamma || (1 .. m))];
x := [evaln(x || (1 .. n))];
f := matrix(m+1,1,0);
f[m,1] := -P*x2-k1*x3;
for i from 2 to m do
f[m+1-i,1]:=-x[i+1]-vectk[i]*x[i+2]
od;
evalm(f)
end proc;
Esta funcion ha de invocarse con un argumento indicando el orden del sistema linealizado. (5 en el u
ltimo ejemplo). Por tanto si escribimos
init(5);
todos los vectores son inicializados para n = 5, m = 3, y se muestra en pantalla f 3 dando
como resultado

x4 k3 x5

x3 k2 x4

P x2 k1 x3

0
191

192

Apendice B. Codigo Maple para la ecuaci


on (6.8.1)

El segundo paso consiste en calcular la matriz k para cualquier valor de k. Con este
proposito emplearemos el siguiente procedimiento Maple:
mat:=proc(k) local m,i;
if (k = 1)
then m:=matrix(2,1,[gam[1],1])
else
m:=matrix(k+1,k,0);
for i from 1 to k-1 do
m[i,i]:=gam(k-i+1);
m[i,i+1]:=1;
od;
m[k,k]:=gam(1); m[k+1,k]:=1;
end if;
evalm(m);
end;
para el cual una tpica llamada sera
m1:=mat(4);
que dara como resultado la matriz 5 4

m1 :=

4 1 0 0
0 3 1 0
0 0 2 1
0 0 0 1
0 0 0 1

Ahora bien, para obtener series de multiplicaciones del tipo 4 3 2 deniremos un sencillo
procedimiento
matprod:=proc(k,l) local m,i;
m:=matgamma(l);
for i from l+1 to k do
m:=evalm(matgamma(i)&*m);
od;
evalm(m);
end;
La llamada a esta funcion para calcular en particular 4 3 2 sera
m2:=matprod(4,2);
lo cual da como resultado el vector

4 (3 (2 1 + 1) + 1 ) + 2 1 + 1

3 (2 1 + 1) + 1

2 1 + 1

Apendice B. Codigo Maple para la ecuaci


on (6.8.1)

193

El siguiente paso es obtener la formula (6.8.1) por medio de los procedimientos previos,
para lo cual deniremos la funcion
control1:=proc(n) local m,i,u;
global u0,vectk;
m:=n-2; init(n);
u:=matprod(m,1)*u0+sum(evalm(matprod(m,h+1)
&*submatrix(f,m+1-h..m+1,1..1)),h=1..m-1)
+f; evalm(u)[1,1];
end;
Para su uso, en el caso hipotetico en que n = 6, m = 4 escribiramos
u4:=control1(6);
para dar lugar a
u4 := (x1 k0 P x2 )(4 (3 (2 1 + 1) + 1 ) + 2 1 + 1) + 4 3 2 (P x2 k1 x3 )
+ 4 3 (x3 k2 x4 ) + (4 + 2 )(P x2 k1 x3 )
+ 4 (x4 k3 x5 ) + x3 k2 x4 + x5 k4 x6
A n de transformar todos los i en los correspondientes operadores derivativos deniremos el siguiente procedimiento:
derproc:=proc(u,n) local i,v; v:=u;
for i from 1 to n-2 do
v:=subs(gam[i]=vectk[i]+s,v);
od;
v;
end;
Se invocara esta funcion con el resultado de la u
ltima llamada a control1 y el orden del
sistema n, que en el anterior ejemplo tomaran la forma
u4:=derproc(u4,6);
dando como resultado la ley de control en el dominio de Laplace, donde s representa la
derivada temporal:
u4 :=
+
+
+

(x1 k0 P x2 )((k4 + s)((k3 + s)((k2 + s) (k1 + s) + 1) + k1 + s)


(k2 + s)(k1 + s) + 1) + (k4 + s)(k3 + s)(k2 + s)(P x2 k1 x3 )
(k4 + s)(k3 + s)(x3 k2 x4 ) + (k4 + 2 s + k2 )(P x2 k1 x3 )
(k4 + s)(x4 k3 x5 ) + x3 k2 x4 + x5 k4 x6

A continuacion necesitamos convertir esta expresion en una funcion del estado. El siguiente procedimiento Maple toma los coecientes del polinomio en s y toma sus derivadas
temporales
derproc2:=proc(u,n) local i,v,w,m; m:=n-2;
v:=subs(P=x1^2+x2^2-mu,u);
for i from 1 to n do
v:=subs(x[i]=x[i](t),v);
od;
w:=coeff(v,s,0);

194

Apendice B. Codigo Maple para la ecuaci


on (6.8.1)

for i from 1 to m do
w:=w+diff(coeff(v,s,i),t$i);
od;
w;
end;
La salida de derproc debera pasarse como argumento de derproc2, mientras que su salida
a su vez es pasada a una funcion que realiza la sustitucion general x i = xi+1 :
derproc3:=proc(u,n) local i,h,m,v;
m:=n-2; v:=u;
for h from 1 to n-1 do
for i from n-h by -1 to 1 do
v:=subs(diff(x[h](t),t$i)=x[h+i](t),v);
od;
od;
for h from 1 to n do
v:=subs(x[h](t)=x[h],v);
od;
v;
end;
con la implementacion de esta funcion el calculo completo queda automatizado. De hecho,
para obtener la ley de control completa solo hay que proporcionar el orden del sistema n,
como sucede en el siguiente metodo que aglutina los pasos anteriores.
fullproc:=proc(ord) local m,v,i;
m:=ord-2; v:=control1(ord);
v:=derproc(v,ord);
v:=derproc2(v,ord);
v:=derproc3(v,ord);
v:=subs(x1(t)^2+x2(t)^2-mu=P,v);
for i from 1 to ord do
v:=subs(x[i](t)=x[i],v)
od;
v;
end:
Como puede observarse, esta funcion tambien realiza tareas de limpieza. Para obtener
la ley u3 para un sistema de quinto orden como se realizo en la seccion 6.8 anterior,
simplemente escribiremos
u3:=fullproc(5);

Bibliografa
Andreev, F., Auckly, D., Kapitanski, L., Gosavi, S., Kelkar, A. & White, W. (2000),
Matching control laws for a ball and beam system, in Proc. 1st IFAC Workshop on
Lagrangian and Hamiltonian Methods for nonlinear control, Princeton, NJ, USA,
pp. 161162.
Aracil, J., Gomez-Estern, F. & Gordillo, F. (2002), A family of hamiltonian oscillating systems, in Lagrangian and Hamiltonian methods in nonlinear control 2003 (pendiente
de aceptacion), Sevilla, Espa
na.
Aracil, J., Gordillo, F. & Acosta., J. (2002), Stabilization of oscillations in the inverted
pendulum, in Proc. XV IFAC World Congress, Barcelona, Espa
na.
Aracil, J., Gordillo, F. & Gomez-Estern, F. (2002), Generation of stable oscillations in
cascade nonlinear systems and the hopf bifurcation, Int. Journal of Control (en
revision) .
Astol, A. & Ortega, R. (2001), Immersion and invariance: a new tool for stabilization and
adaptive control of nonlinear systems, in Proc. 5th IFAC Symp. Nonlinear Control
Systems, NOLCOS01, St Petersburg, Russia.

Astrom, K. & Furuta, K. (1996), Swinging up a pendulum by energy control, in 13th


IFAC World Congress, Academic Press, San Francisco, USA, pp. 3742.
Auckly, D. & Kapitanski, L. (2001), On the equations for matching control laws, in
Preprint.
Auckly, D., Kapitanski, L. & White, W. (2002), Control of nonlinear underactuated
systems, Comm. Pure Appl. Math. 3, 354369.
Benett, S. (1988), Real-time Computer Control: An Introduction, Prentice Hall International.
Besancon, G. & Battiloti, S. (1998), On output feedback tracking control with disturbance
attenuation for euler-lagrange systems, in Proceedings of the 37th IEEE Conference
on Decision and Control, Tampa, FL, USA, pp. 31393143.
Blankenstein, G. (2002), Matching and stabilization of constrained systems, in 15th International Symposium on Mathematical Theory of Networks and Systems,MTNS02,
University of Notre Dame, August 12-16.
Blankenstein, G., Ortega, R. & Van der Schaft, A. (2001), The matching conditions of
controlled lagrangians and interconnection assigment passivity based control, Int J.
of Control 75, No. 9, 645665.
195

196

BIBLIOGRAFIA

Blankenstein, G., Ortega, R. & Van der Schaft, A. (2002), Matching of euler-lagrange and
hamiltonian systems, in Proc. XV IFAC World Congress, Barcelona, Espa
na.
Bloch, A., Leonard, N. & Marsden, J. (2000), Controlled lagrangians and the stabilization
of mechanical systems, IEEE Tr. on Automatic Control 45, No. 12.
Bullo, F. (2002), Control of hybrid systems along limit cycles, in 15th Symposium on
Mathematical Theory of Networks and Systems MTNS. University of Notre Dame,
August 12-16,.
Byrnes, C., Isidori, A. & Willems, J. (1991), Passivity, feedback equivalence, and the
global stabilization of minimum phase nonlinear systems, IEEE Tr. on Automatic
Control 36, No. 11, 12281240.
Canudas de Wit, C., Olsson, H.,
Astrom, K. J. & Lischinscky, P. (1995), A new model
for control on systems with friction, IEEE Transactions of Automatic Control 40,
No. 3.
Chang, D. E., Bloch, A. M., Leonard, N. E., Marsden, J. E. & Woolsey, C. A. (2002), The
equivalence of controlled lagrangian and controlled hamiltonian systems, ESAIM:
Control, Optimisation, and Calculus of Variations (en revisi
on) .
Espinosa-Perez, G., Sira-Ramrez, H. & Ros-Bolivar, M. (2000), Regulation of the ppr
mobile robot with a exible joint: a combined passivity and atness approach, in
Proceedings of the 39th Conference on Decision and Control Systems, Vol. 4, Orlando, FL, USA, pp. 40364041.
Fradkov, A. & Pogromsky, A. (1998), Introduction to Control of Oscillations and Chaos,
World Scientic.
Fujimoto, K. & Sugie, T. (2001), Stabilization of hamiltonian systems with nonholonomic
contraints based on timevarying generalized canonical transformations, Systems
and Control Letters 44, No. 15, 309320.
Gomez-Estern, F., Aracil, J. & Gordillo, F. (2002), The hopf bifurcation and controlled
oscillations in electromechanical systems, in Proc. 10th Mediterranean Conference
on Control and Automation, Inst. Superior Tecnico, Lisbon, Portugal.
Gomez-Estern, F., Aracil, J. & Rubio, F. R. (2000), Practical implementation of a
hamiltonianbased 2DOF platform, in Proc. IFAC Symposium on Robot Control,
Vienna, AU.
Gomez-Estern, F., Cordones, M. & Rubio, F. (2002), Passivity-based control and disturbance rejection on a 2-dof platform, in European Control Conference 2003 (pendiente
de aceptacion), Cambridge, UK.
Gomez-Estern, F., Ortega, R., Rubio, F. & Aracil, J. (2001), Stabilization of a class
of underactuated mechanical systems via total energy shaping, in Proc. 40th IEEE
Conf on Decision and Control, Orlando, FL, USA.
Gomez-Estern, F., Ortega, R. & Spong, M. (2001), Total energy shaping for underactuated mechanical systems, in Proc. 5th IFAC Symp. Nonlinear Control Systems,
NOLCOS01, St Petersburg, Russia.

BIBLIOGRAFIA

197

Gomez-Estern, F., Perez, C., Rubio, F. & Gordillo, F. (2000), Aplicacion en tiempo
real para el control de una plataforma giroestabilizada, in Proc. XXI Jornadas de
Automatica, Sevilla, Espa
na.
Gordillo, F., Aracil, J. & Gomez-Estern, F. (2002), Stabilization of autonomous oscillations and the Hopf bifurcation in the ball and beam, Las Vegas, USA. Proceedings
of the CDC02.
Gordillo, F., Gomez-Estern, F., Ortega, R. & Aracil, J. (2002), On the ball and beam
problem: regulation with guaranteed transient performance and tracking periodic
orbits, in 15th International Symposium on Mathematical Theory of Networks and
Systems,MTNS02, University of Notre Dame, August 12-16.
Hale, J. & Kocak, H. (1991), Dynamics and Bifurcations, Springer-Verlag.
Hamberg, J. (1999), General matching conditions in the theory of controlled lagrangians,
in Proc. of the 38th IEEE Conference on Decision and Control, Phoenix, AZ, USA.
Hauser, J., Sastry, S. & Kokotovic, P. (1992), Nonlinear control via approximate inputoutput linearization: The ball and beam example, IEEE Trans. on AC 37, No.
3, 392398.
Isidori, A. (1989), Nonlinear Control Systems, Springer-Verlag, Berlin, DE.
Kelly, R. (1993), A simple set point robot controller by using only position measurements,
in Proc. 12th IFAC World Conf., Vol. 6, Sydney, Australia, pp. 173176.
Khalil, H. (1996), Nonlinear Systems, Prentice Hall.
Krstic, M., Kanellakopoulos, I. & Kokotovic, P. (1995), Nonlinear and Adaptive Control
Design, Wiley.
Krstic, M., Sepulchre, R. & Praly, L. (1995), On the measure of global invariant manifold
for xed points, in Technical Report CCEC 95-0228, University of California, Santa
Barbara.
Kuznetsov, Y. (1995), Elements of Applied Bifurcation Theory, Springer-Verlag.
Landau, L. & Lifchitz, E. (1964), Curso de fsica te
orica, Tomo I: Mec
anica, Ediciones
MIR, Mosc
u.
Leonard, N., Bloch, A. & Marsden, J. (1998), Mechanical feedback control systems, in
M. Vidyasagar, V. Blondel, E. Sontag & J. Willems, eds, Open Problems in Mathematical Systems and Control Theory, Springer-Verlag, pp. 3944.
Liu, W. (1994), Criterion of Hopf bifurcations without using eigenvalues, Journal of
Mathematics Analysis and Applications 182, 250256.
M. Reyhanoglu, A.J. Van der Schaft, N. M. & Kolmanovsky, I. (2001), Dynamics and control of underactuated mechanical systems, IEEE Transactions on Automatic Control
44, No. 9, 16631671.
Marino, R. & Tomei, P. (1995), Nonlinear Control Design, Prentice Hall.
Marsden, J. & McCracken, M. (1976), The Hopf Bifurcation and Its Applications,
Springer-Verlag.

198

BIBLIOGRAFIA

Mees, A. & Chua, L. (1979), The Hopf bifurcation theorem and its applications to nonlinear oscillations in circuits and systems, IEEE Trans. on CAS 26, No. 4, 235254.
Olfati-Saber, R. (2001), PhD thesis: Nonlinear Control of Underactuated Mechanical
Systems with Application to Robotics and Aerospace Vehicles, PhD thesis, Massachusetts Institute of Technology.
Ortega, R., Loria, A., Kelly, R. & Praly, L. (1995), On output feedback global stabilization of euler-lagrange systems, Int. J. of Robust and Nonlinear Cont. Special Issue
on Mechanical Systems 5, No. 4, 313324.
Ortega, R., Loria, A., Niklasson, P. & Sira-Ramrez, H. (1998), Passivity-based Control
of Euler-Lagrange Systems, Springer-Verlag.
Ortega, R. & Spong, M. (2000), Stabilization of underactuated mechanical systems via
interconnection and damping assignment, in Proceedings of the 1st IFAC Workshop
on Lagrangian and Hamiltonian methods in nonlinear systems, Princeton, NJ, USA.
Ortega, R., Spong, M., Gomez-Estern, F. & Blankenstein, G. (2002), Stabilization of
underactuated mechanical systems via interconnection and damping assignment,
IEEE Tr. on Automatic Control 47, No. 8, 12181233.
Ortega, R., Van der Schaft, A., Mareels, I. & Maschke, B. (2001), Putting energy back
in control, IEEE Control Syst. Magazine 9, No. 4, 637644.
Ortega, R., Van der Schaft, A., Maschke, B. & Escobar, G. (2002), Interconnection and
damping assignment passivity-based control of port-controlled hamiltonian systems,
Automatica 38, No. 10, 585596.
Praly, L., Ortega, R. & Kaliora, G. (2001), Stabilization of nonlinear systems via forwarding mod{Lg V }, IEEE Transactions on Automatic Control 46, No.9.
Ra
nada, A. (1990), Dinamica Clasica, Alianza Universidad Textos, Madrid.
Rampazzo, F. & Sussmann, H. (2001), Set-valued dierentials and a nonsmooth version
of chows theorem, in Proceedings of the 40th IEEE Conference on Decision and
Control, Orlando, FL, USA, pp. 26132618.
Rodrguez, H. & Ortega, R. (2002), Interconnection and damping assignment control of
electromechanical systems, in Proc. XV IFAC World Congress, Barcelona, Espa
na.
Rouche, N. & Mawhin, J. (1980), Ordinary Dierential Equations: Vol II, Pitman Publ.,
London.
Santilli, R. M. (1978), Foundations of Theoretical Mechanics I, SpringerVerlag.
Sepulchre, R., Jankovic, M. & Kokotovic, P. (1997), Constructive Nonlinear Control,
Springer-Verlag.
Shen, T., Mei, S., Lu, Q. & Tamura, K. (1999), Robust nonlinear excitation control with
L2 -disturbance attenuation for power systems, in Proc. of the 38th IEEE Conference
on Decision and Control, Phoenix, AZ, USA.
Shiriaev, A. & et al. (2000), On global properties of passivity-based control of the inverted
pendulum, Int Journal of Robust and Nonlinear Control 10, No.4, 283300.

BIBLIOGRAFIA

199

Slotine, J. & Li, W. (1987), On the adaptive control of robot manipulators, Int. J.
Robotics Research 6, 4959.
Spong, M. (1997), Underactuated mechanical systems, in International Workshop on
Control Problems in Robotics and Automation: Future Directions, Hyatt Regency,
San Diego, California, pp. 26132618.
Spong, M., Corke, P. & Lozano, R. (2001), Nonlinear control of the inertia wheel pendulum, Automatica 37, 18451851.
Spong, M. & Vidyasagar, M. (1989), Robot Dynamics and Control, John Wiley & Sons,
Inc., New York, USA.
Tanenbaum, A. S. (2001), Modern Operating Systems, Prentice Hall.
Texas Instruments (1999), Texas Instruments TMS320C4x User Guide.
Van der Schaft, A. (2000), L2 -Gain and Passivity Techniques in Nonlinear Control,
Springer-Verlag.
Vidyasagar, M. (1993), Nonlinear system analysis (2nd edition), Prentice Hall, London,
UK.
Wang, Y., Cheng, D., Li, C. & Ge, Y. (2002), Dissipative hamiltonian realization and
energy-based L2 -disturbance attenuation control of multimachine power systems,
Preprint, 2002 .
Weibel, S. (1997), Applications of qualitative methods in the nonlinear control of superarticulated mechanical systems, PhD thesis, Boston University, Boston, Massachusetts,
USA.

You might also like