Control PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 181

N

IO
C
C
RU
ST
N
O
C

Control y Guiado
EN

Ingenierı́a Aeroespacial - Edición 2020


EN
C
O
N
ST
RU
C
C
IO
N
N
Índice general

IO
C
C
1. Introducción 1
1.1. Sistemas Realimentados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
RU
1.2. Sistemas de Control Automático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1. Control a Lazo Abierto y Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2. Entradas y Salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Estrategias Comunes de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.1. Control ON/OFF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.2. Control Proporcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
ST

1.3.3. Control PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7


1.3.4. Automatización y Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4. Ingenierı́a de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.1. Control Industrial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.2. Pilotos Automáticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
N

1.4.3. Control en el Campo Espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . 12


1.4.4. Sistemas Autónomos y Robótica . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5. Control PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
O

1.5.1. Ley de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15


1.5.2. Ajuste de Parámetros (Sintonización) . . . . . . . . . . . . . . . . . . . . . . . 19
1.5.3. Realización del Controlador PID . . . . . . . . . . . . . . . . . . . . . . . . . . 22
C

1.6. Cómputos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2. Objetivos del Control 27


2.1. Requerimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
EN

2.1.1. Seguimiento de Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28


2.1.2. Rechazo de Perturbaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.1.3. Dinámica del Sistema Controlado . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.1.4. Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2. Control a Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.1. Control por Inversión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.2. Inversión por Realimentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2.3. Realimentación y Dinámica de Lazo Cerrado . . . . . . . . . . . . . . . . . . . 33
2.3. Diseño del Lazo de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.1. Sistema SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.2. Sensibilidades del Lazo SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.3. Ecuación Caracterı́stica de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . 37
2.3.4. Compromisos del Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.3.5. Errores en Régimen Estacionario . . . . . . . . . . . . . . . . . . . . . . . . . 39

3. Análisis Clásico de Sistemas SISO 45

N
3.1. Lugar de Raı́ces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1.1. Análisis de la Ecuación Caracterı́stica de Lazo Cerrado . . . . . . . . . . . . . 48
3.1.2. Interpretación de las Condiciones de Módulo y Ángulo . . . . . . . . . . . . . . 49

IO
3.1.3. Reglas para el Trazado del Diagrama . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.4. Análisis de Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.1.5. Lugar de Raı́ces Complementario . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.1.6. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

C
3.2. Criterio de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1. Teorema del Encierro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.2. Estabilidad del Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

C
3.2.3. Funciones de Lazo Abierto con Polos en el Eje Imaginario . . . . . . . . . . . . 59
3.2.4. Márgenes de Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.2.5. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
RU
3.3. Respuesta en Frecuencia de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.1. Realimentación Unitaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.2. Ganancia de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.3. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.3.4. Revisita de la Función de Sensibilidad . . . . . . . . . . . . . . . . . . . . . . . 66
3.4. Compensación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
ST

3.4.1. Compensación en el “Plano s” . . . . . . . . . . . . . . . . . . . . . . . . . . . 69


3.4.2. Compensación en Frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.4.3. Ceros del Lazo Cerrado y Filtro de Referencia . . . . . . . . . . . . . . . . . . . 77

4. Control Moderno de Sistemas SISO 79


N

4.1. Especificaciones de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80


4.1.1. Respuesta Transitoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.1.2. Respuesta en Frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
O

4.2. Restricciones en el Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88


4.2.1. Limitaciones Asociadas a la Instrumentación . . . . . . . . . . . . . . . . . . . 88
4.2.2. Restricciones Estructurales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
C

4.3. Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3.1. Incertidumbre en el Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3.2. Modelos de Incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3.3. Estabilidad Robusta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
EN

4.3.4. Desempeño Robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100


4.4. Sı́ntesis de Compensadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.4.1. Asignación de Polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.4.2. Inversión Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.4.3. Loop-Shaping . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.5. Sistemas con Retardo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

versión (preliminar) 0.2 - pág.


4.5.1. Dinámicas con Retardo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.5.2. Modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.5.3. Predictor de Smith . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.5.4. Predictor de Smith Filtrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.6. Estructuras Especiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.6.1. Anti-Windup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.6.2. Control con Dos Grados de Libertad . . . . . . . . . . . . . . . . . . . . . . . . 118

5. Realimentación de Estado 121

N
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.1.1. Ubicación de Polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.1.2. Control Optimo Cuadrático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

IO
5.2. Observador de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.1. Observador de Luenberger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.2. Realimentación de Estados Observados . . . . . . . . . . . . . . . . . . . . . . 137
5.2.3. Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

C
5.2.4. Control Optimo Gausiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

A. Apéndices 143

C
A.1. Modelos Dinámicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
A.1.1. Modelos de Estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
A.1.2. Modelos Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
RU
A.1.3. Matriz de Transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
A.1.4. Modelos en Tiempo Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
A.1.5. Aproximación Discreta de Controles Continuos . . . . . . . . . . . . . . . . . . 153
A.2. Diagramas en Bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
A.2.1. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
A.3. Casos de Estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
ST

A.3.1. Misión Apollo - Control de Descenso . . . . . . . . . . . . . . . . . . . . . . . . 159


A.3.2. Turbogenerador Hidráulico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
N
O
C
EN

versión (preliminar) 0.2 - pág.


EN
C
O
N
ST
RU
C
C
IO
N
EN
C
O
N

1
ST
RU
C
C
IO
N
N
1

IO
C
Introducción

C
RU
ST
N
O
C
EN

versión (preliminar) 0.2 - pág.2


N
IO
Figura 1.1: superficies de control aerodinámico en un avión

Sistemas Realimentados

C
Los seres vivos interactúan permanentemente sobre su entorno, perturbando procesos

C
dinámicos de forma apropiada para llevarlos a condiciones de equilibrio deseables.
Esto es particularmente frecuente y deliberado en el caso de los humanos; en
situaciones que van desde la manipulación de objetos hasta la conducción de sistemas
RU
complejos, ya sean estos de carácter tecnológico, social, económico, biológico, etc.

A modo de ejemplo podemos reflexionar respecto de los elementos presentes y la forma


en que estos interactúan cuando:

un piloto conduce una aeronave


ST

un equipo económico de gobierno (por ejemplo el Banco Central de un Paı́s)


interviene para ajustar variables macro económicas
un médico diagnostica, trata y monitorea la salud de un paciente
un equipo de trabajo social interviene de paliar problemas de una comunidad
···
N

Pero también observamos esta clase de interacciones cuando simplemente llevamos


objetos de un lugar a otro, o cuando hacemos “equilibrio” sosteniendo un bastón con la
O

palma de la mano.
C

La intervención se produce por medio del ajuste de ciertas perturbaciones que pueden
ser manipuladas de forma directa cuando sea necesario. Denominamos a estas acciones
de control, para diferenciarlas respecto de aquellas perturbaciones que están fuera de
nuestro alcance.
EN

Por ejemplo, el médico ajusta la dosis de un medicamento, el piloto acciona los


comandos de la aeronave (figura 1.1), el Banco Central inyecta o retiene divisas en el
mercado financiero, etc.

En general la intervención no necesariamente finaliza al alcanzar la condición deseada.

versión (preliminar) 0.2 - pág.3


Frecuentemente es necesario mantener un proceso de supervisión continuo, para ajustar
las acciones de control al menos por dos razones:

porque debido a su comportamiento el proceso no tiende a mantenerse en la


condición deseada por si mismo (porque dicha condición es inestable)
porque las perturbaciones fluctúan, alterando el equilibrio alcanzado

Para desarrollar estas actividades es necesario poder observar la evolución del proceso,
y para ello se requiere de ciertas capacidades sensoriales.

N
El ente que intenta controlar el proceso (el controlador) lo observa permanentemente y
reacciona ajustando las acciones de control en función de los apartamientos observados
respecto de la condición buscada.

IO
Esta interacción da lugar a un nuevo proceso dinámico. Éste surge de la combinación
entre el proceso a controlar y el controlador, y tendrá un comportamiento diferente al
que tienen sus componentes de forma aislada. Se trata de un sistema realimentado,

C
esquematizado en la figura 1.2, al que identificamos como sistema a lazo cerrado.

C
RU
ST

Figura 1.2: Sistema realimentado


N

De las capacidades sensoriales disponibles y de la capacidad de reacción (es decir,


de ajustar las acciones de control) del controlador dependerá la aptitud del mismo
O

para poder equilibrar el proceso en la condición deseada, sostenerla ante cambios


en el contexto y lograr que el sistema a lazo cerrado tenga caracterı́sticas dinámicas
aceptables.
C

En tareas que implican interactuar con el medio fı́sico los humanos aprendemos formas
adecuadas de reacción mediante el entrenamiento.
Conducir un vehı́culo, por ejemplo, es una tarea resuelta por el sistema lı́mbico de
EN

nuestro cerebro, en contraste con los procesos de carácter intelectual que resolvemos en
la corteza cerebral. Lo mismo ocurre en la práctica deportiva o en la expresión corporal.
Nuestras capacidades de control son reflejos que solo podemos adquirir mediante un
tiempo adecuado de práctica.

versión (preliminar) 0.2 - pág.4


Sistemas de Control Automático
Un sistema de control automático realiza las tareas del controlador sin intervención
humana. Posee los elementos necesarios para observar el proceso (sensores),
manipular las acciones de control (actuadores) y reaccionar adecuadamente accionando
los actuadores en función de la información obtenida mediante los sensores.

Un sistema de control automático en general se configura mediante un proceso


matemático para reaccionar adecuadamente al interactuar con un determinado proceso

N
dinámico, lo cual sustituye el entrenamiento; aunque existen algoritmos para “aprender”
las reacciones correctas de forma experimental (controles adaptables).

IO
C
C
RU
Figura 1.3: Lazo de control a lazo cerrado
ST

1.2.1. Control a Lazo Abierto y Lazo Cerrado


Cuando hablamos de sistemas de control normalmente nos referimos a aquellos que
funcionan a lazo cerrado, como el representado en la figura 1.3.
N

En control automático se suele designar como planta al proceso dinámico a controlar.


La observación se realiza a través de sensores y las acciones de control se ejercen
mediante actuadores.
O

En problemas de economı́a, sociologı́a o epidemiologı́a por ejemplo estos elementos no


son dispositivos fı́sicos sino acciones humanas, pero cumplen el mismo rol.
C

Es posible concebir estrategias de control a lazo abierto, las cuales prescinden de la


observación. Pero estas no tienen la capacidad necesaria para contrarrestar cambios en
las propiedades dinámicas de la planta o variaciones en las perturbaciones actuantes
sobre la misma, ya que no manejan información sobre la situación real del proceso.
EN

Solo es posible plantear una estrategia de este tipo contando con un conocimiento
significativo de las propiedades dinámicas de la planta y de la condición en la cual se
encontrará en el momento de actuar sobre ella.

versión (preliminar) 0.2 - pág.5


Por ejemplo, llenar un vaso con agua manteniendo los ojos cerrados es una estrategia
de control a lazo abierto para ajustar el nivel de lı́quido en el vaso.
Al abrir los ojos y observar el nivel mientras agregamos agua convertimos la tarea en
una de control a lazo cerrado.

1.2.2. Entradas y Salidas

N
En control automático llamamos entradas a las acciones de control y perturbaciones que
actúan sobre la planta (el proceso dinámico a controlar), y salidas a las observaciones.

IO
Cuando nos referimos a un control SISO, el acrónimo SI (Single Input) hace referencia
al caso en el cual hay una única entrada que podemos manipular (acción de control).
Serı́a el caso si por ejemplo en un control térmico solo podemos actuar sobre una único
calefactor.
De forma análoga, el acrónimo SO (Single Output) se refriere a disponer datos de una

C
única variable escalar para monitorear el proceso. En el ejemplo del control térmico este
serı́a el caso si contamos con capacidad para medir temperatura en un único punto.

C
Naturalmente MI y MO hace referencia a los casos en los cuales se cuenta con entradas
y salidas múltiples. Un ejemplo claro de sistema MIMO es el del control de vuelo de un
RU
helicóptero, en donde las acciones de control son el paso cı́clico, colectivo y rotor de
cola; mientras que las entradas serán diferentes ángulos y velocidades.

Estrategias Comunes de Control


ST

Muchos problemas de control automático pueden resolverse con “leyes de control”


simples. Nos referimos a las estrategias que usamos para ajustar las acciones de control
en función de la evolución del proceso.
El trabajo básico en ingenierı́a de control es seleccionar y ajustar estas leyes para un
dado problema, o bien diseñar otras más refinadas en casos más exigentes.
N

1.3.1. Control ON/OFF


O

Los controles ON/OFF (o bang-bang) son aquellos sistemas de control SISO en


los cuales la acción de control puede tomar solo dos estados (encendido/apagado,
abierto/cerrado, etc.). En estos casos la representación matemática de la acción de
C

control se realiza a través de una variable booleana.


Esto es muy común a nivel doméstico. Podemos citar como ejemplos los equipos de
aire-acondicionado (excepto los denominados inverter ), los calentadores eléctricos para
el agua o para planchar la ropa, el control de nivel del reservorio de agua potable, etc.
EN

Para el suministro de agua caliente se puede contar con un termotanque, que también
constituye un control ON/OFF; o con un calefón, el cual funciona como control a lazo
abierto (no cuenta con sensor de temperatura).

La ventaja de este tipo de estrategia es su simplicidad, llegando inclusive a utilizarse


masivamente en vehı́culos espaciales para el control térmico de sus componentes.

versión (preliminar) 0.2 - pág.6


N
IO
(a) regulador de gas para una garrafa (b) esquema de funcionamiento del regulador de gas

C
El control ON/OFF no permite en general ajustar la condición de equilibrio con alta
precisión, excepto que la conmutación pueda realizarse a alta frecuencia, como es el

C
caso de las fuentes eléctricas de tipo switching.
Cuando esto no es posible resulta necesario establecer una banda de tolerancia
alrededor del valor nominal deseado dentro de la cual no se realiza ninguna acción.
RU
La conmutación ocurre unicamente al traspasar los lı́mites de esta banda.

1.3.2. Control Proporcional


Hablamos de control proporcional cuando las acciones de control pueden variar de
ST

forma continua. Las representamos matemáticamente con números reales, más allá de
cual sea su naturaleza fı́sica (la temperatura, la concentración de glucosa en sangre, la
cotización de una divisa extranjera, etc.).

Un ejemplo doméstico de control proporcional es el regulador de gas, el cual proporciona


N

una presión constante a la salida aunque la presión de entrada fluctúe (siempre que se
mantenga por encima del valor deseado para la salida).
En la figura 1.4b se muestra un esquema del dispositivo. Un diafragma actúa como
O

sensor. Una aguja obtura proporcionalmente el paso de gas, operando como actuador.
El controlador serı́an los resortes, que establecen una apertura proporcional del paso de
gas en función de la presión diferencia entre la presión a la salida y el valor deseado
C

establecido por la compresión del resorte superior.


EN

1.3.3. Control PID


En el ejemplo del regulador de gas la reacción (variación de la acción de control) a
los apartamientos del proceso es proporcional al desvı́o de la salida respecto del valor
deseado. En muchos casos esto no resulta en un comportamiento aceptable del sistema
a lazo cerrado.

versión (preliminar) 0.2 - pág.7


N
IO
Figura 1.5: Diagrama en bloques de un sistema realimentado con un compensador PID

Frecuentemente es necesario considerar la velocidad con la cual la salida se aparta o

C
se acerca al valor deseado, incluyendo una acción proporcional a ese cambio. Esto se
denomina control derivativo, y tiene la propiedad de anticiparse a los cambios.
Por otra, en muchos casos un sistema de control logra equilibrar la planta pero con un

C
cierto error en relación al valor deseado. Esto se compensa automáticamente con una
acción integral.
RU
La combinación de las tres acciones: proporcional + integral + derivativa se conoce como
control PID, y es la estrategia más común en los sistemas de control a lazo cerrado.
La intensidad de estas acciones se puede ajustar de forma empı́rica o semi-empı́rica.

En situaciones más complejas se recurre a un estudio matemático del problema, siendo


necesario en ocasiones diseñar otras estrategias alternativas a la PID. Para esto la
ST

Teorı́a de Control Automático provee diferentes enfoques y herramientas, siendo esta


una disciplina en permanente desarrollo.

1.3.4. Automatización y Control


N

Existe en general una confusión entre lo que entendemos aquı́ como control automático
y los automatismos.
Es muy común utilizar enclavamientos lógicos para coordinar acciones de todo tipo.
O

Se trata de manipular variables de tipo booleano cuando se cumplen ciertas condiciones


lógicas.
C

En muchos casos de observan zonas grises para realizar esta discriminación. Por
ejemplo, un control ON/OFF podrı́a interpretarse como un enclavamiento lógico.
Al mismo tiempo en común que los sistemas de control automático incluyan enclava-
mientos lógicos para dar señales de alarma en situaciones anormales, e incluso llevar el
EN

proceso controlado a una condición segura cuando las condiciones se tornan peligrosas.

versión (preliminar) 0.2 - pág.8


N
IO
Figura 1.6: En esta imágen vemos arriba inverters de diferente potencia (a la izquierda) para control de motores eléctricos, un
interfaz de operador (a la derecha) y varios modelos de PLCs al centro y debajo

C
C
RU
ST

Figura 1.7: Sistema SCADA en una sala de control


N

Ingenierı́a de Control
De lo dicho precedentemente puede deducirse que el control automático tiene aplicación
O

en muchas disciplinas.
Como ingenieros aeroespaciales estamos interesados principalmente en las aplicacio-
nes industriales, transporte y sistemas espaciales.
C

1.4.1. Control Industrial


Actualmente la industria manufacturera hace un uso extensivo tanto de la automatización
EN

(omnipresente) y el control automático, esto último en los procesos de producción


continua como la petroquı́mica y la metal-mecánica.

Los enclavamientos lógicos suelen implementarse en dispositivos de hardware denomi-


nados PLCs (Programable Logic Controller, ver figura 1.6).
Se trata de computadoras sin interfaz humana diseñados para digitalizar datos de
sensores discretos (ON/OFF con contactos secos, sensores inductivos y capacitivos,

versión (preliminar) 0.2 - pág.9


N
IO
Figura 1.8: Primer autopiloto Sperry (derecha) y su demostración en Francia (izquierda), en el año 1914

C
etc.) y analógicos (normalmente señales de 0-10V o 4-20mA generadas por diversos
tipos de sensores); y generar señales de salida de ambos tipos; aunque también

C
pueden utilizarse redes de datos informáticas estándar (RS232, Ethernet, WiFi) o de
tipo industrial (FieldBus, Profibus, etc.).
RU
La programación de estos dispositivos se realiza con interfaces gráficas desde una
computadora conectada en red con el PLC, y para su uso pueden conectarse interfaces
de operador en el piso de planta o con computadoras en una sala de control (sistemas
SCADA: Supervisory Control and Data Aquisition) para visualización, registro de datos,
realizar ajustes y enviar comandos al equipo (figura 1.7).
En control industrial la estrategia habitual es la PID, y existen dispositivos de hardware
ST

especı́ficos para ello; aunque también pueden programarse estas funciones en un PLC o
en computadoras conectadas en red con estos dispositivos (para procesos de alto nivel).
Solo en casos muy especı́ficos o para el control de procesos multi-variable se utilizan
otras estrategias.
Los sistemas de control realimentados son imprescindibles para la operación de
N

generadores eléctricos y turbinas eólicas, posicionamiento dinámico de plataformas off-


shore, reactores nucleares, etc.
O

1.4.2. Pilotos Automáticos


En la actualidad existen pilotos automáticos para automóviles, embarcaciones, aerona-
C

ves y vehı́culos espaciales. Sus funciones van desde controlar una única variable (por
ejemplo la velocidad en el control de crucero de un automóvil) hasta la de realizar una
misión completa de forma autónoma para descender en otro planeta.
Un piloto automático es un sistema de control diseñado para realizar tareas que realiza
EN

un piloto humano de forma desatendida.

El primer auto-piloto en el campo aeronáutico fue desarrollado por Lawrence Burst


Sperry, exhibido por primera vez en 1914 durante una competencia de innovación en
Francia (figura 1.8). Este era completamente mecánico y utilizaba giróscopos para medir
la actitud (orientación) del avión, los cuales se conectaban mediante cables y palancas
a las superficies de control aerodinámico.

versión (preliminar) 0.2 - pág.10


Durante su estadı́a en Francia Sperry, que no hablaba
francés, contrató como mecánico a Emil Cachin, que no
hablaba inglés. Aun ası́ formaron un sólido equipo y se
presentaron a la exhibición. En la primer pasada ante el
público Sperry, al mando de la aeronave, levantando los
brazos para mostrar que los comando estaban libres y
el avión volaba solo. En una segunda pasada Cachin
abandonó su puesto y caminó por una de las alas

N
mientras Sperry nuevamente mantenı́a los brazos en
alto.
Durante la tercer pasada ambos abandonaron el cockpit mientras el avión mantenı́a su

IO
vuelo en lı́nea recta.
Naturalmente, ganaron la competencia.

C
En 1945, motivados por los riesgos que se experimentaban
en época invernal debido a las condiciones climáticas
desfavorables de las islas británicas combinadas con los

C
altos niveles de contaminación con carbón existentes en
aquellos años, se creó la unidad de desarrollo BLEU (Blind
Landing Experimental Unit) para trabajar sobre soluciones
RU
para el aterrizaje con baja visibilidad. Esto condujo en poco
tiempo al desarrollo de un sistema de aterrizaje automático,
precursor de lo que hoy conocemos como autoland.
Estos desarrollos evolucionaron aplicándose en aeronaves
militares como el English Electric Canberra y el Avro Vulcan;
ST

y posteriormente en aeronaves comerciales como Hawker


Siddley Trident (imagen a la izquierda).
Actualmente los pilotos automáticos para aeronaves comerciales son capaces de
realizar todas las maniobras de vuelo de forma autónoma, incluyendo el despegue y
aterrizaje; aunque se opera siempre bajo supervisión humana. En general dependen de
N

la disponibilidad de radio ayudas para detectar los desvı́os respecto de la trayectoria


deseada, aunque progresivamente van ganando terreno los sistemas de navegación
global satelital (GNSS) para obtener esta información.
O

En la aviación existen además sistemas de control para mejorar el comportamiento de


una aeronave, categorizados como sistemas de aumento de estabilidad (SAS).
C

Estos van desde casos simples como el amortiguador de guiñada presentes en los
reactores multimotor, hasta sistemas de control de vuelo completo para aeronaves
intrı́nsecamente inestables. En particular, los aviones de combate de 4ta generación
y posteriores dependen fuertemente del SAS para poder volar.
EN

También se utilizan sistemas de control auxiliares, por ejemplo para regular la presión de
cabina. Los motores a reacción modernos cuentan con el FADEC (Full Authority Digital
Engine Controller ), que monitorea y regula completamente la operación del motor.
Los motores alternativos por su parte incluyen una unidad electrónica denominada
ECU (Engine Control Unit), que incluye lazos de control para optimizar la combustión
ajustando la inyección de combustible y la entrada de gases al turbocompresor.

versión (preliminar) 0.2 - pág.11


N
IO
(a) Panel de interfaz del piloto automático en un Boeing 737NG

C
C
RU
(b) Interfaz de comando para las funciones de un piloto automático

En los helicópteros se incluye un controlador denominado governor, que mantiene


constante el régimen de giro de los rotores, de forma análoga al control de crucero de
un automóvil.
ST

1.4.3. Control en el Campo Espacial


Los sistemas espaciales no podrı́an existir sin el desarrollo del control automático, dado
que en su mayorı́a se trata de vehı́culos no tripulados. Y en el caso que lo sean, se
N

requiere proveer asistencia a la tripulación debido a la complejidad y requerimientos de


precisión de las tareas a realizar.
O

Los vehı́culos lanzadores cuentan con el equivalente al autopiloto de un avión, además


de todos los lazos de control auxiliares para diferentes subsistemas.
Actualmente los vehı́culos espaciales reutilizables como el Falcon 9 de SpaceX (figura
C

1.10a) operan de forma completamente autónoma desde su lanzamiento hasta el


aterrizaje.
El primer sistema reutilizable con esta capacidad fue el transbordador soviético Buran
(figura 1.10b), que hizo su primer y único vuelo el 15 de noviembre de 1988, antes del
EN

colapso de la URSS.

En la mayor parte de los vehı́culos orbitales existe un sistema esencial denominado


AOCS (Attitude and Orbit Control System). Una de las funciones principales es la de
permitir ajustar la orientación (actitud) de la nave (ver figura 1.10c), lo cual permite
apuntar el sistema de propulsión durante las maniobras de control orbital; y ajustar la

versión (preliminar) 0.2 - pág.12


N
(a) Aterrizaje del Falcon 9 (SpaceX ) (b) Transbordador Buran acoplado al lanzador Energı́a

IO
C
C
RU
(c) Actitud de un satélite en órbita terrestre (d) Satélites de la CONAE

orientación de los instrumentos en el “modo ciencia” (estado del satélite cuando opera
ST

sus instrumentos cientı́ficos).

1.4.4. Sistemas Autónomos y Robótica


La robótica incluye varias áreas de aplicación. La primera en desarrollarse fue la
N

robótica industrial, convirtiéndose en una herramienta indispensable para la producción


automotriz, electrónica y muchas más.
Los principales desafı́os se presentan en los campos de la mecánica y la instrumenta-
O

ción, utilizándose el control automático fundamentalmente para el movimiento.


Actualmente se combinan manipuladores robóticos, sistemas de reconocimiento de
imágenes y otras tecnologı́as de sensado para optimizar los procesos de fabricación
C

y los sistemas de operación remota. Estos no son sistemas completamente autónomos,


ya que para la toma de decisiones sobre situaciones no programadas en su mayorı́a
dependen de la intervención humana.
EN

En las últimas décadas se experimentó un fuerte crecimiento en el campo de la


robótica móvil. Se trata de un área en fuerte desarrollo a la par de los avances
en inteligencia artificial e ingenierı́a de control. Abarca desde vehı́culos autónomos
aéreos (VANTs/UAVs), terrestres y submarinos (AUVs), hasta robots “bio-inspirados” y
humanoides.

Los vehı́culos terrestres autónomos se diseñan para desplazarse en un medio

versión (preliminar) 0.2 - pág.13


N
IO
(a) Manipulador robótico (b) Vehı́culo Aéreo No Tripulado Ikhana, operado por la NASA

C
C
RU
ST

(a) Vehı́culo submarino autónomo (b) Mars Exploration Rovers (MER), que operaron en
Marte entre 2004 y 2019

especı́fico; ya sea que se trate de terrenos abiertos, zonas rocosas, conductos, etc.
Puede tratarse de vehı́culos comunes, articulados, caminadores, etc.
N

El control automático en estos casos es relativamente sencillo, siendo más importantes


los aspectos asociados a la navegación y la coordinación de múltiples funciones de
detección y decisión.
O

Vehı́culos de esta clase (denominados rovers) se han desempeñado satisfactoriamente


en la exploración de la Luna y Marte; pero también existen en el mercado modelos
C

comerciales para tareas domésticas y usos industriales especı́ficos.


En esta lı́nea mencionemos que en el campo automotriz los pilotos automáticos para
automóviles tienden hacia la robotización, permitiendo en la actualidad la conducción
completamente autónoma bajo ciertas condiciones (BWM, Tesla, etc.).
EN

En aeronáutica la tecnologı́a de los UAVs se encuentra muy desarrollada a nivel militar,


pero existen muchas otras aplicaciones como la inspección aérea y la agricultura; y es
posible que en un futuro cercano se experimente un desarrollo importante de la mobilidad
urbana utilizando aeronaves de despegue y aterrizaje vertical (VTOL : Vertical TakeOff
and Landing) robotizadas.

versión (preliminar) 0.2 - pág.14


N
IO
(a) Robot bio-inspirado Spot Mini, de la firma americana Boston Dynamics (b) Robot humanoide Asimo, de la japonesa
Honda

C
En estos casos control automático cubre la mismas funciones que las del auto-piloto

C
en las aeronaves tripuladas; aunque se trabaja activamente en paralelo al desarrollo de
nuevas configuraciones y mecánicas de vuelo.
En cuanto a vehı́culos submarinos, en la actualidad existen muchos modelos comercia-
RU
les operados de forma remota para realizar operaciones submarinas y modelos autóno-
mos de investigación.

Finalmente mencionemos el desarrollo de robots bio-inspirados. Los robots humanoides


han tenido un fuerte desarrollo en Japón, fundamentalmente como lı́neas de investiga-
ST

ción tecnológica. Aunque se han sumado otras empresas, por el momento solo se co-
mercializan robots humanoides con fines lúdicos y publicitarios; pero lamentablemente
también hay desarrollos militares en este sector.
N

Control PID
Para aclarar a que clase de sistema nos referimos al hablar de un controlador
O

analizaremos el caso del control PID desde un enfoque intuitivo.

En la sección 1.3.3 hemos realizado una introducción para esta estrategia, que es la más
C

extendida. Su masiva utilización es especialmente destacable en el campo del control


industrial. Allı́ se identifica la referencia como “set point” (SP) y la salida como “point
value” (PV). La diferencia entre referencia y salida es el error (de seguimiento):
EN

e(t) = r(t) − y(t)

1.5.1. Ley de Control


La estructura de control PID, representada en la figura 1.5 del capı́tulo precedente, es la
suma de tres términos dependientes del error:

versión (preliminar) 0.2 - pág.15


acción proporcional P (t) = kp e(t)
de
acción derivativa D(t) = kd (t)
dt
Z t
acción integral I(t) = ki e(t)dt
0

La ley de control resultante es:


t

N
Z
de
u(t) = kp e(t) + kd (t) + ki e(t)dt (1.1)
dt 0

IO
Que también puede expresarse como

1 t
 Z 
de
u(t) = kc e(t) + Td (t) + e(t)dt (1.2)
dt Ti 0

C
donde Td y Ti tienen unidades de tiempo.

C
Para intentar comprender el efecto de cada uno de estos términos vamos a considerar
como ejemplo el caso de un actuador lineal.
Este puede consistir en motor eléctrico y una transmisión (tornillo y corona) o un pistón
RU
hidráulico accionado mediante una servo-válvula.
En ambos casos el servomotor permite aplicar una fuerza o torque para posicionar
(lineal o angularmente) una carga inercial, y en general para neutralizar perturbaciones
constituidas por otras fuerzas o momentos aplicados independientemente.
ST

Entre los muchos ejemplos de esta clase de sistemas tenemos el utilizado en los
lanzadores satelitales para orientar el vector de empuje de un motor cohete (ver figura
1.14a), subsistema conocido como TVC (Thrust Vector Control).

Si modelamos conceptualmente este problema como la rotación de un “cuerpo rı́gido”


N

alrededor de un punto fijo se puede plantear que:

J δ̈ = Ma (t) + P (δ, t)
O

donde δ es el ángulo de desvı́o del eje de la tobera (y por lo tanto del empuje) respecto
del eje del fuselaje y Ma es el momento aplicado por el actuador. Dado que el punto de
giro (gimbal del motor) en realidad está acelerado por ser solidario al cohete, incluimos
C

una perturbación P (t) que dependerı́a de la aceleración y velocidad angular del cohete.

Mas adelante veremos un modelo más completo incluyendo la dinámica del actuador.
EN

Por el momento el modelo conceptual equivale al siguiente esquema:

versión (preliminar) 0.2 - pág.16


N
IO
(b) Esquema de actuación para el control del vector de empuje de un

C
motor cohete. El motor se encuentra montado en una unión cardánica
(a) Actuador lineal (color azul) para el control del vector de empuje de un (gimbal) y el actuador permite desviar el eje de la tobera en relación al
motor cohete. El actuador puede ser hidráulico o electro-mecánico. eje del fuselaje.

C
donde u se corresponde con Ma (la acción de control), x serı́a el desvı́o δ (variable de
salida) y F se corresponde a P (la perturbación).
RU
Acción Proporcional
La acción proporcional tiene un efecto equivalente al resorte de un sistema masa-
ST

resorte-amortiguador:
N

En este sistema el resorte aplica una fuerza Fr “proporcional” al desplazamiento Fr (t) =


−k · x(t), lo cual fuerza a la masa a retornar a su posición de equilibrio.
O

Si se sustituye el resorte por un actuador capaz de aplicar una fuerza u(t) sobre la masa,
y se instala un sensor capaz de medir el desplazamiento x(t); mediante algún dispositivo
C

fı́sicamente compatible con el sensor y el actuador (electrónico, neumático, hidráulico,


etc.) serı́a posible regular la acción del actuador con una ley de control u(t) = −kp · x(t)
que tendrı́a idéntico efecto al resorte si se ajusta kp = k .
EN

Esto constituirı́a un control proporcional, y mediante un ajuste de la ganancia


proporcional kp se podrı́a regular la velocidad (asociada a la frecuencia natural) con la

versión (preliminar) 0.2 - pág.17


que reaccionará el sistema ante cualquier perturbación externa F (t), y también cuanto
efecto tendrá dicha perturbación sobre la posición (cuanto se apartará del equilibrio).

Una ventaja respecto del resorte es la posibilidad de ajustar la “rigidez” variando kp , pero
además con el control proporcional serı́a posible hacer:

up (t) = kp · e(t) = kp · r(t) − kp · x(t)

Esto permite ajustar la posición de reposo (equilibrio) a cualquier valor x deseado; lo cual

N
serı́a equivalente a mover el anclaje del resorte en el caso del modelo masa-resorte.
Pero sabemos que sin amortiguador la dinámica de lazo cerrado serı́a oscilatoria
no amortiguada, y por lo tanto no serı́a posible alcanzar el equilibrio luego de una

IO
perturbación. Veamos como resolver este problema.

Acción Derivativa
La acción derivativa corresponde a:

C
ud (t) = kd · ė(t) = kd · ṙ(t) − kd · ẋ(t)

C
El segundo término del lado derecho, −kd · ẋ, es equivalente al efecto que produce el
amortiguador. El primer término, kd · ṙ, implica una anticipación a los cambios o valores
futuros de la referencia (ṙ define la “tendencia” de la referencia).
RU
Para el caso de la masa libre, con el actuador podrı́amos combinar la acción proporcional
con la derivativa para sustituir el conjunto resorte-amortiguador, agregando la capacidad
de variar la respuesta del sistema tanto en velocidad (frecuencia natural) como en
relación a su factor de amortiguamiento. El control proporcional-derivativo (PD) serı́a:
ST

u(t) = up (t) + ud (t) = kp e(t) + kd ė(t)

Si se aplicase una perturbación externa constante F (t), con el control PD se alcanzará


una condición de equilibrio con error en estado estacionario:
N

1
ess = F
kp
O

La acción derivativa solo es efectiva durante la respuesta transitoria, ya que en equilibrio


ė = 0.
Podemos achicar ese error en estado estacionario ess aumentando la constante
C

proporcional kp , pero nunca será posible anularlo totalmente, dado que sin error no hay
acción de control para cancelar la perturbación. Esto también tiene solución.

Sesgo y Acción Integral


EN

Para eliminar el error en estado estacionario podrı́amos agregar a la ley PD un valor


constante ū de sesgo o desvı́o (bias u offset en inglés) para neutralizar la perturbación:

u(t) = kp e(t) + kd ė(t) + ū

Pero serı́a necesario ajustar este valor de forma manual (ū = F ), y deberı́a ser
reajustado cada vez que cambie la perturbación.

versión (preliminar) 0.2 - pág.18


Esto es análogo al comando de “trim” para la actitud del avión. Los pilotos ajustan el trim
hasta lograr que la aeronave quede equilibrada en la actitud correcta cuando se dejan
los comandos en su posición neutral.
Z t
La acción acción integral ui (t) = ki e(t)dt es equivalente a un “bias autoajustable”.
0

Esta acción solo alcanza el equilibrio cuando e(t) = 0. Por lo tanto, si ajustando
adecuadamente los parámetros de la ley de control logramos que el sistema a lazo

N
cerrado resulte estable, aun bajo la acción de una perturbación constante el sistema
a lazo cerrado siempre convergerá a la condición de equilibrio con error nulo.

IO
El término integral es el único que permite aplicar una acción de control no-nula aunque
el error sea nulo, y por lo tanto permitirı́a neutralizar perturbaciones sin error de estado
estacionario. Pero debe advertirse que es perjudicial para la respuesta transitoria,
ya que tiende a desestabilizar el sistema y por lo tanto en muchos casos debe ser

C
compensada mediante las acciones PD. De todas formas, en procesos con dinámicas
sobre-amortiguadas (como lo es el caso de los procesos térmicos) muchas veces es
suficiente con una combinación proporcional-integral (PI).

C
1.5.2. Ajuste de Parámetros (Sintonización)
RU
Objetivos y Limitaciones
Con el ajuste de los parámetros de un controlador se busca:

Reducir los errores transitorios


Reducir o eliminar los errores en estado estacionario
ST

Hacer un uso “razonable” de la acción de control


Lograr una respuesta bien amortiguada
Lograr que el sistema realimentado tenga la menor sensibilidad posible ante
cambios en la dinámica de la planta a controlar (robustez)
N

Todo ajuste para un sistema de control es el resultado de una relación de compromiso


entre los objetivos antes planteados y las limitaciones que impone el proceso a controlar.
O

Actuación Máxima Los errores transitorios dependen inversamente de la velocidad de


respuesta, que se regula mediante la ganancia kc en la forma (1.2), a lo cual llamaremos
ganancia del lazo. Pero se debe tener presente que esta no puede aumentarse de forma
C

ilimitada.
La acción de control u(t) siempre tiene lı́mites para sus valores máximos y mı́nimos,
y frecuentemente también hay lı́mites para su velocidad de cambio (rate limit o slew
rate en inglés). En general lo razonable es que estos lı́mites se alcancen solo de forma
EN

excepcional, dado que en esta condición (saturación) el control deja de ser efectivo
y el sistema a lazo cerrado se comporta como si estuviese a lazo abierto con una
perturbación constante u(t) = umax o u(t) = umin .

versión (preliminar) 0.2 - pág.19


Ruido de Medición Debe tenerse presente que en toda realización la acción de control
se determina a partir de la función de error medida:

ẽ(t) = r − ỹ(t)

donde ỹ(t) es la señal entregada por el sensor, que se supone se corresponde con un
valor real y . En general podemos descomponer la medición en:

ỹ = y + η

N
donde η es lo que denominamos ruido de medición, que en general es una señal
aleatoria mediante aunque en casos puntuales puede ser determinı́stica, pero siempre
con valor medio nulo.

IO
Considerando por ejemplo una ley PD, para la acción de control real se tendrı́a:
˙ = [kp e(t) + kd ė(t)] + kp η(t) + kd η̇(t)
u(t) = kp ẽ(t) + kd ẽ(t)

Vemos entonces que el ruido de medición se propaga a la acción de control de forma

C
directa con ganancia kp , y por medio de su derivada a través de kd .
Si el ruido de medición es periódico, para cualquiera de sus componentes armónicas

C
η(t) = A sin ωη t la derivada serı́a η̇(t) = ωη A sin ωη t. Resulta evidente que la acción
derivativa realzará la propagación del ruido de medición con un factor kd ωη , lo cual será
más intenso cuando mayor sea la frecuencia de la señal de ruido (más allá de que esta
RU
sea periódica o aleatoria).

En general la propagación del ruido de medición a la variable de salida y es mı́nima,


porque normalmente la dinámica del proceso “filtra” las componentes de alta frecuencia
que pudiera haber en la acción de control. Sin embargo, esto sı́ será visible en la señal
u(t), y podrı́a ocasionar problemas de desgaste de los actuadores, consumo innecesario
ST

de energı́a, o problemas secundarios tales como disconfort en el caso de vehı́culos


tripulados.

Sintonización
Banda Proporcional En general existe cierta tolerancia ±etol para el error. Por otra
N

parte, como dijimos la acción de control u(t) tiene lı́mites máximos umax y mı́nimos
umin .
Un ajuste razonable para la ganancia proporcional es el de aplicar la máxima acción de
O

control cuando se alcanza el lı́mite del error. Si la tolerancia para el error es razonable
para la capacidad de actuación disponible, un ajuste lógico para la ganancia proporcional
serı́a:
C

1 umax − umin
kp =
2 etol
Esto define una “banda proporcional” para el uso del rango de control.
EN

La respuesta será más rápida y los errores serán menores si aumentamos kp , pero esto
implicará que los ruidos de medición se propaguen a la acción de control (verı́amos una
acción de control “ruidosa” aun en ausencia de perturbaciones), lo cual en algún punto
podrı́a resultar indeseable.
A su vez la respuesta en situaciones normales podrı́a resultar demasiado “intensa”,
exigiendo en exceso al actuador, y finalmente podrı́amos observar problemas de
estabilidad que con ganancias más bajas no se producen.

versión (preliminar) 0.2 - pág.20


Con valores pequeños tendremos una respuesta lenta y errores mayores en la respuesta
transitoria, y también en estado estacionario si no incluimos acción integral.

Podemos comenzar el ajuste de kp con un valor significativamente menor al de la


banda proporcional, y a partir de este realizar correcciones hasta lograr una respuesta
aceptable en cuanto a desempeño sin incurrir en problemas por actuación máxima y
sensibilidad al ruido de medición. Si al aumentar la ganancia empezamos a notar una
respuesta oscilatoria será necesario agregar acción derivativa.

N
Tiempo Integral La acción integral se puede escribir como:
Z t

IO
ui (t) = ki e(t)dt
0

que también puede expresarse como


t

C
Z
1
ui (t) = kc e(t)dt
Ti 0

C
donde llamamos tiempo integral al parámetro Ti . Si el error se mantuviese constante, Ti
serı́a el tiempo que tardarı́a la integral en alcanzar el valor del error.
En un control proporcional-integral (PI):
RU
1 t
 Z 
upi (t) = up (t) + ui (t) = kp e(t) + e(t)dt
Ti 0

Si el error es constante e(t) = ē, la acción de control se duplicarı́a luego de un tiempo


Ti :
ST

upi (0) = kp ē
 
1
upi (Ti ) = kp ē + ē Ti = 2kp ē
Ti
N

Naturalmente el error muy raramente se mantiene constante mientras varı́a la acción


integral, pero este experimento imaginario indica que Ti deberı́a de un orden de
magnitud similar al tiempo de establecimiento (el necesario para alcanzar el equilibrio).
O

La constante integral para la forma (1.1) serı́a ki = kp /Ti .

Es muy importante tener en cuenta que la acción integral tiende a desestabilizar el


C

sistema, por lo cual solo se la utiliza en aquellas situaciones en las cuales es necesario
lograr errores nulos en estado estacionario.
LO aconsejable serı́a ajustar primero la acción proporcional y luego agregar acción
integral comenzando con valores pequeños de ki , incrementándolo hasta alcanzar el
EN

error nulo en un tiempo razonable. Si al incrementar la ganancia integral comienza


a experimentarse un comportamiento oscilatorio será necesario recurrir a la acción
derivativa.

Tiempo Derivativo Debido a valores altos de la ganancia proporcional o por efecto de


la acción integral, la respuesta del sistema a lazo cerrado podrı́a resultar excesivamente
oscilatoria; e incluso podrı́a ocurrir que esta resulte inestable.

versión (preliminar) 0.2 - pág.21


La acción derivativa tiene un efecto estabilizante, y permite introducir amortiguamiento
en la respuesta transitoria. En equilibrio no tiene ningún efecto.

La combinación entre la acción proporcional y la derivativa constituye un control


proporcional-derivativo (PD). Esto puede escribirse como:

upd (t) = up (t) + ud (t) = kp (e(t) + Td ė(t)dt)

Si el error crece linealmente e(t) = d · t, la presencia de una acción derivativa con tiempo

N
derivativo Td = 1/d duplicará la acción de control del término proporcional cuando
t = Td :
upd (Td ) = kp (d Td + Td d) = 2kp e(Td )

IO
Por lo tanto el tiempo derivativo deberı́a estar en el orden del tiempo de respuesta. Un
valor mayor implicará un efecto amortiguante mayor y viceversa.

La desventaja es que este término amplificará los errores de medición de alta frecuencia.

C
Esto puede mitigarse introduciendo un “filtro pasa-bajos” en la derivada.

C
Consideremos el caso del TVC. El rango de desplazamiento es de ±60 . Supongamos
que se requiere una precisión de 0,020 en el alineamiento del eje de empuje, y que la
señal de control se encuentra normalizada de forma tal que los lı́mites se correspondan
RU
con ±1. La banda proporcional serı́a:

1
BP = = 50
0,02

Pero si el actuador está sobredimensionado, usar este valor de banda proporcional para
ST

definir kp podrı́a resultar excesivo.

Por ser este un sistema mecánico en principio con fenómenos disipativos de baja
intensidad (habrı́a que ver en detalle el actuador para afirmarlo), el lógico asumir que
será necesario incluir acción derivativa para amortiguar la respuesta.
N

Si el vehı́culo realiza una trayectoria curva (diferente a la de un “giro gravitatorio”), el


motor experimentará una aceleración lateral y aparecerá un error de estado estacionario.
Para neutralizar completamente el efecto de esta perturbación necesitamos agregar
O

acción integral.
C

1.5.3. Realización del Controlador PID


La realización fı́sica de un controlador depende de la naturaleza de la aplicación.
En la actualidad predominan las implementaciones digitales, utilizando algún tipo de
EN

microcontrolador (microprocesador diseñado para su uso en sistemas embebidos). Sin


embargo el controlador PID nació a principios del siglo XX, mucho antes del desarrollo
de la electrónica analógica y más aún de la era digital.

Analógica
Podemos reconocer el uso de la acción proporcional ya en el regulador de Watt para
sus máquinas a vapor. Hacia 1907 apareció el primer controlador neumático. Empresas

versión (preliminar) 0.2 - pág.22


N
IO
Figura 1.15: Controlador PID neumático del año 1940

C
C
RU
ST

(a) Controlador PID analógico (b) Posible circuito para un PID analógico
N

muy conocidas en la actualidad como Sperry, Taylor o Foxboro tuvieron sus orı́genes en
O

aquellas épocas.
En esas épocas también se desarrollaron controladores electro-mecánicos, pero hacia
los años ’40 los controladores PID neumáticos se utilizaban a nivel industrial.
C

En la actualidad es posible realizar un control PID analógico utilizando amplificadores


operacionales. Los parámetros se ajustan eligiendo adecuadamente las resistencias y
capacitores del circuito.
EN

Alta Ganancia con el Lazo PID


En el control PID tenemos por un lado un ajuste de la ganancia del lazo abierto dada por
la acción proporcional. Podrı́amos utilizar valores elevados de kp para aproximarnos al
control perfecto, pero sabemos que un valor excesivo puede acarrear problemas.

versión (preliminar) 0.2 - pág.23


Los términos integral y derivativo tienen ganancias diferentes según se trate de
movimientos rápidos o lentos.

Respecto del término integral podemos notar que si por ejemplo tenemos una
señal de error senoidal e(t) = A sin ωt, el integrador genera como salida ui (t) =
ki ω −1 A cos ω (t − π). La ganancia serı́a ki ω −1 .
Podemos decir que el término integral impone una ganancia variable, que tiene a infinito
para señales lentas. Esto explica por que en estado estacionario se logra el control
perfecto (error nulo para cualquier perturbación constante).

N
Naturalmente esto se pierde progresivamente cuando la referencia varı́a de forma cada
vez más rápida.

IO
Para la acción derivativa ud (t) = kd ωA cos ωt, y por lo tanto podemos realizar el
razonamiento inverso.. Pero lograr el control perfecto para señales rápidas también
genera problemas y en general no es necesario.

C
Realización Digital
Un controlador digital es una implementación de la ley de control utilizando un micro-
procesador con la electrónica necesaria (conversores A/D) para convertir las señales de

C
los sensores en números digitales y a partir de las acciones de control calculadas desde
su representación digital generar las señales analógicas correspondientes (conversores
RU
D/A).

En muchos casos los sensores dan información digital de forma directa, y los actuadores
pueden ser comandados mediante señales digitales sin requerir el uso de conversores
D/A, aunque en última instancia en problemas de ingenierı́a casi siempre habrá una
conversión D/A para que las acciones de control incidan en el mundo fı́sico.
ST

Para la implementación digital de la ley PID realizamos una discretización de la ecuación


(1.1) o la (1.2) obteniendo una en diferencias. Con el término proporcional no hay
cambios, pero sı́ es necesario esto para la derivada y la integral. Por ejemplo:
N

n
e(k) − e(k − 1) X
u(k) = kp e(k) + kd + ki e(h) (1.3)
ts
h=0
O

donde k ∈ N es un número entero que representa un instante de muestreo t = kts ,


mientras que ts es el intervalo entre muestras (tanto para las entradas como para las
salidas) que llamamos tiempo de muestreo; siendo la frecuencia de muestreo su inversa
C

fs = 1/ts .

Mediante un reloj interno el procesador computa la (1.3) una vez cada ts segundos
para actualizar el valor de la acción de control (salida) con la última medición disponible
EN

(entrada) y su correspondiente referencia. En general la acción de control se mantiene


constante hasta el próximo intante de muestreo mediante un dispositivo de retención de
orden cero.

Es fundamental elegir un tiempo de muestreo adecuado, aunque su valor exacto no es


relevante. Si este tiempo es demasiado grande, es imposible reaccionar adecuadamente
a la evolución del proceso a controlar. Si es demasiado chico, en el cálculo de la

versión (preliminar) 0.2 - pág.24


diferencia e(k) − e(k − 1) para la acción derivativa los resultados podrı́an resultar
muy pequeños y perderse por errores numéricos, dado que en sistema digital la
representación numérica siempre tiene resolución acotada.

Un tiempo de muestreo razonable es aquel que permitirı́a tomar entre 4 y 8 muestras


durante el tiempo de crecimiento en la respuesta transitoria, que por ahora definiremos
como aquel necesario para pasar del 10 % al 90 % del valor final de equilibrio al aplicar
una perturbación constante o un cambio de referencia de forma abrupta.

N
Cómputos

IO
Los cómputos asociados a los ejemplos que se presentarán pueden realizarse mediante
MatlabTM o GNU Octave. En ambos casos se requiere tener instalado el paquete con
funciones especı́ficas para control.

C
En el caso de MatlabTM nos referimos al paquete denominado control toolbox.
En el caso de GNU Octave 2 es necesario descargar el paquete control y luego instalarlo
desde la ventana de comando con el comando pkg, aunque la opción -forge para

C
descargar e instalar un paquete con un solo comando:
pkg i n s t a l l − f o r g e c o n t r o l
RU
El paquete control debe ser cargado en cada sesión en la cual sea requerido:
pkg load c o n t r o l

Es posible realizar ajustes para que esto ocurra de forma automática al inicio.
ST

El paquete de control de GNU Octave es compatible con el control toolbox de Matlab,


auqnue no todas las fucniones se encuentran implementadas (ver el listado de funciones
correspondiente).
N
O
C
EN

versión (preliminar) 0.2 - pág.25


EN
C
O
N
ST
RU
C
C
IO
N
N
2

IO
C
Objetivos del Control

C
RU
ST
N
O
C
EN

Requerimientos
No es posible hacer un desarrollo de ingenierı́a sin contar previamente con una
especificación de requerimientos que permita orientar dicho desarrollo.
En esta sección daremos un panorama introductorio en relación a los requerimientos

27
para un sistema de controla automático.

Debe quedar en claro que la interacción entre el controlador y el proceso a controlar o


planta produce un nuevo sistema dinámico con caracterı́sticas propias. Por el momento
le llamaremos proceso controlado.
Todos los requerimientos están relacionados con la dinámica del proceso controlado,
pero dado que para el diseño se asume que la dinámica de la planta no se puede
modificar, satisfacer los requerimientos dependerá exclusivamente de la dinámica del
controlador.

N
2.1.1. Seguimiento de Referencias

IO
En general el objetivo básico de un sistema de control es el de lograr que ciertas variables
de un determinado proceso se ajusten a valores deseados.

Por ejemplo, en una máquina de CNC la posición y la velocidad de la herramienta de

C
corte tienen que seguir una evolución predeterminada para mecanizar la pieza requerida.
En el caso de un manipulador para operación remota, el “efector” del brazo robótico tiene
que “copiar” los movimientos de la mano del operador.

C
RU
En todos los casos existirán tolerancias en cuanto a la diferencia entre los valores
deseados o referencias y los valores realmente alcanzados (que consideramos salidas),
a lo que llamamos errores de seguimiento.

2.1.2. Rechazo de Perturbaciones


ST

En muchos casos el seguimiento de referencias debe lograrse aun bajo la acción de


otros fenómenos que perturban la evolución del proceso controlado.

Por ejemplo, en el aterrizaje de una aeronave por instrumentos el objetivo del piloto
(automático o humano) es el de mantener los indicadores de error de trayectoria en cero,
N

es decir, centrar las barras de senda de planeo (glide slope) y eje de pista (localizer ) en
el indicador del ILS (ver figura 2.1) .
En condiciones climáticas adversas el seguimiento exacto será imposible, pero se espera
O

que el piloto logre mantener acotado los errores a la mitad del intervalo de la escala del
indicador.
C

A esta clase de requerimientos nos referiremos cuando hablamos de rechazo de


perturbaciones.
EN

2.1.3. Dinámica del Sistema Controlado


Un requerimiento implı́cito en control automático es el de lograr que el sistema controlado
tenga una dinámica estable. En general esta es condición necesaria pero no suficiente
para satisfacer los requerimientos.

Ante cambios abruptos en las referencias o en las perturbaciones existirán perı́odos


de respuesta transitoria en el proceso controlado hasta alcanzar las tolerancias

versión (preliminar) 0.2 - pág.28


N
IO
C
C
Figura 2.1: Aterrizaje por instrumentos. Indicador del ILS
RU
especificadas. Se espera que esta evolución sea lo suficientemente “rápida” y “suave”
en relación a los requerimientos del problema puntual.

La rapidez puede especificarse en términos de tiempo de crecimiento ante una variación


escalón en la referencia (o en la perturbación), o en función del ancho de banda de dicha
respuesta.
ST

La suavidad está asociada a la inexistencia de comportamientos oscilatorios, que en


general no son admisibles. Esto se logra imponiendo un cierto amortiguamiento mı́nimo
para los polos que caracterizan la dinámica del proceso controlado, o acotando los picos
resonantes de su respuesta en frecuencia.
N

Por otra parte existen sistemas diseñados especı́ficamente para lograr ciertas mejoras
en la dinámica del proceso controlado respecto de la del proceso sin controlar. Es el
caso de los sistemas de estabilidad artificial: amortiguadores de guiñada en aeronaves
O

de trasnporte, suspensión activa en automóviles de alta gama, control de rolido en


embarcaciones de gran porte, etc.
C

En sı́ntesis podemos decir que para cualquier aplicación en el diseño de las estrategias
de control es necesario poner énfasis en la dinámica resultante del proceso controlado,
y veremos que tanto la capacidad de seguimiento de referencias como de rechazo de
perturbaciones (si son requeridas) dependen de ella.
EN

2.1.4. Robustez
Los procesos dinámicos reales en general varı́an con el transcurso del tiempo
(envejecimiento, desgaste, etc.), o bien varı́an al operar en diferentes condiciones.

versión (preliminar) 0.2 - pág.29


N
IO
C
(a) respuesta en frecuencia entre elevador y ángulo de (b) variación en la ubicación de polos y ceros de la dinámica longitudinal (izquierda) y
cabeceo de polos de la dinámica latero-direccional (derecha)

C
Figura 2.2: Variaciones en la dinámica longitudinal de una avión bireactor de 8 plazas durante la aproximación final
RU
Por ejemplo, la dinámica de una aeronave depende fuertemente de la presión dinámica
y el número de Mach; por lo cual su comportamiento es diferente en una condición de
aproximación final respecto del vuelo en crucero.

En la figura 2.2 vemos los cambios en la dinámica de una aeronave para diferentes
ST

condiciones de vuelo en régimen subsónico durante la aproximación final. Un sistema


de aterrizaje automático (autoland) debe ser capaz de manejar diversos requerimientos
en cualquiera de estas condiciones.

Un sistema de control automático debe ser capaz de cumplir con los requerimientos del
N

diseño aun bajo cambios (acotados) en la dinámica del proceso sobre el cual opera.
Llamamos a esto desempeño robusto.
O

Control a Lazo Cerrado


C

2.2.1. Control por Inversión


Un control “perfecto” serı́a aquel lograra que la salida y(t) siga a la referencia r(t) de
forma exacta independientemente de lo que ocurra con la perturbación d(t) (siempre y
EN

cuando esta esté acotada):

y(t) = r(t) ∀d(t) (2.1)

En la figura 2.3 se muestra una estrategia que en teorı́a podrı́a alcanzar este objetivo. El
bloque f [·] es un operador matemático que representa la respuesta dinámica de la salida
y(t) ante una acción de control u(t), mientras que h[·] corresponde a la ley de control

versión (preliminar) 0.2 - pág.30


N
Figura 2.3: Control por inversión

IO
que regula u(t) en función de r(t) − d(t). Implı́citamente estamos asumiendo que esta
última se mide de alguna manera, aunque en general eso no es posible.

Con el esquema mostrado, que denominamos control a lazo abierto, lograrı́amos el


control perfecto si hacemos que la ley de control sea la inversa de la dinámica de la

C
planta: h[·] = f −1 [·].
Veremos más adelante que esto tampoco es posible por diversas razones, y por lo tanto

C
el control perfecto es “irrealizable”. Sin embargo se puede lograr una aproximación a este
ideal dentro de ciertos lı́mites.
RU
El primer obstáculo para realizar un control por inversión es que toda dinámica implica
una relación integral.
Por ejemplo, desde el punto fı́sico la posición de un rı́gido es la integral de la velocidad
(matemáticamente se puede establecer también la relación inversa), y esta a su vez es
la integral de la aceleración producida por los actuadores y las perturbaciones.
La inversa de la integral es la derivada, y para señales que varı́an rápidamente su
ST

magnitud es grande. El caso lı́mite en el cual la referencia o la perturbación cambian


abruptamente (en forma de escalón) implicarı́a una derivada infinita, lo cual no puede
trasladarse a la acción de control u.
Por lo tanto para invertir la integral necesitamos una derivada, pero esta no es realizable
fı́sicamente de forma exacta. Pero podemos encontrar un esquema que equivalga a la
N

derivada al menos para señales que no cambien demasiado rápido, y por lo tanto lo
mismo puede decirse de la inversa de una dinámica genérica f [·].
O

Una forma de realización de esta inversa es usar un modelo de la dinámica a invertir


fˆ[·] ≈ f [·] en un lazo de realimentación con un término de alta ganancia h[·], según el
esquema mostrado en la figura 2.4. En ese diagrama se observa que:
C

u = h[(r − d) − z]

y como z = fˆ[u]:
u = h[(r − d) − fˆ[u]]
EN

Si aplicamos la inversa del operador h[·] a ambos lados:

h−1 [u] = (r − d) − fˆ[u] → fˆ[u] = (r − d) − h−1 [u]

Aplicamos la inversa del operador fˆ[·] a ambos lados:

u = fˆ−1 [(r − d) − h−1 [u]]

versión (preliminar) 0.2 - pág.31


N
IO
Figura 2.4: Inversión con alta ganancia

Si |h[·]|  1 para su inversa se tiene |h[·]−1 | ≈ 0 y podemos decir que con esto:

C
u ≈ f −1 [r − d]

C
De esta forma vemos que u responde en base a una inversa aproximada de la dinámica
de la planta sin tener que invertir el modelo de forma explı́cita.
Pero se debe destacar que aun quedan otros problemas por resolver:
RU
nunca es posible modelar la dinámica de la planta de forma exacta (fˆ[·] 6= f [·]) y
además |h[·]| < ∞.
normalmente no es posible medir las perturbaciones para incluirlas en la acción
de control.
aunque lo anterior fuera posible, habrı́a que conocer además la condición inicial
ST

del proceso para inicializar el modelo.

2.2.2. Inversión por Realimentación


Podemos notar en la figura 2.4 que si el modelo fuese exacto, z = f [u] = y − d.
N

Planteamos entonces el esquema de la figura 2.5, en donde realimentamos la medición


y en lugar de z , y suprimimos en la suma a d. El resultado sobre u serı́a el mismo.
O
C
EN

Figura 2.5: Inversión por realimentación de alta ganancia

De esta forma se logra una inversión “implı́cita” sin necesidad de conocer la dinámica del
proceso ni tener que medir la perturbación; con la sola condición de que |h[·]|  1, sin

versión (preliminar) 0.2 - pág.32


importar su valor exacto. Por esta razón se recurre de una u otra manera al control por
realimentación, llamado también control a lazo cerrado, en lugar de utilizar un control a
lazo abierto.

Pero debemos advertir que utilizar alta ganancia para la realimentación acarrea una serie
de problemas asociados a la estabilidad del sistema a lazo cerrado, y otros relacionados
con la instrumentación (sensores y actuadores).
Veremos en los próximos capı́tulos que en el diseño de un sistema de control es
necesario alcanzar una relación de compromiso entre la búsqueda del control perfecto

N
y los problemas que implica el uso de alta ganancia por las limitaciones que impone el
proceso a controlar y la instrumentación requerida.

IO
2.2.3. Realimentación y Dinámica de Lazo Cerrado
Podrı́a decirse que la temática central del control automático es en definitiva el diseño
de realimentaciones artificiales sobre algún proceso dinámico (planta) para generar uno

C
con caracterı́sticas dinámicas deseables. Es a este nuevo sistema, que antes llamamos
“proceso controlado”, al cual nos referimos al hablar de sistema a lazo cerrado.

C
Es importante comprender que el sistema de control no cambia la dinámica de la planta.
Es la interacción entre la dinámica del controlador y la de la planta lo que resulta en una
cierta dinámica de lazo cerrado, diferente tanto de la planta como del controlador.
RU
Tomemos el modelo de estados (A.4) (ver apéndice A.1) para la dinámica de la planta
junto con sus salidas (variables medidas):

ẋ = f (x, t) + g u (x, t)u(t) + g d (x, t)d(t)


ST

y = h(x, u)

en donde descomponemos es el vector de variables exógenas entre aquellas se pueden


manipular u (acciones de control) y aquellas que consideramos perturbaciones d.
Desde el punto de vista de las relaciones “causa-efecto” es más consistente plantear la
dinámica como una relación integral:
N

Z t
x(t) = [f (x, t) + g u (x, t)u(t) + g d (x, t)d(t)] dt (2.2)
O

0
y = h(x)

El “efecto” es la evolución del estado (lado izquierdo) mientras que las “causas” de esta
C

evolución son todos los términos que definen ẋ, es decir, el corchete dentro de la integral.
Este modelo se puede graficar como:
EN

versión (preliminar) 0.2 - pág.33


Decimos que un sistema es realimentado cuando los “efectos” influyen en las “causas”,
atenuándolas o amplificándolas según se trate de dinámicas estables o inestables
respectivamente.
Para el modelo de estados (A.4) este rol está implı́cito en el término f (x), ya que el
correspondiente a u(t) queda definido externamente. Los términos g u (·) y g d (·) solo
operan como “mapeos” entre las entradas y la velocidad del estado ẋ. No forma parte
de la dinámica del proceso sino que define su sensibilidad las variables exógenas u y d.

N
Normalmente el término f (x) es no nulo, con lo cual podrı́amos decir que casi todos
los procesos dinámicos son realimentados. Si embargo, en control automático hablamos
de sistemas realimentados cuando alguna componente de u es forzada a depender del

IO
estado. Esto constituye una realimentación artificial, pero en última instancia que sistema
es realimentado y cual no es solo una cuestión de perspectiva (excepto que f (x) = 0).

El esquema de realimentación artificial (en el caso invariante en el tiempo) serı́a:

C
C
RU
ST

Los sensores y actuadores también son sistemas dinámicos, con propiedades que
pueden ser descriptas con modelos matemáticos. En el diagrama precedente esa
N

dinámica quedarı́a absorbida dentro del modelo de estados, es decir, los estados
internos de estos subsistemas serı́an parte del vector x.
O

Diseño del Lazo de Control


C

2.3.1. Sistema SISO


Si tanto la acción de control u como la salida y son escalares decimos que se trata de
un sistema SISO (Single Input Single Output).
EN

Si ambos son vectores en Rn , n > 1 se trata de un caso MIMO (Multiple Input Multiple
Output), siendo obvia la nomenclatura para escalares y vectores combinados.
Para sistemas SISO usando modelos dinámicos lineales se pueden expresar las
relaciones dinámicas entre entrada y salida mediante funciones de transferencia.
La salida en un modelo lineal de la planta será la superposición de los efectos de cada
entrada, y entre ellas la acción de control.

versión (preliminar) 0.2 - pág.34


N
Figura 2.6: Lazo de control general

IO
Si por ejemplo, además de la acción de control hay una perturbación d(t):

Y (s) = G(s)U (s) + F (s)D(s)

C
C
RU
2.3.2. Sensibilidades del Lazo SISO
Podrı́amos sustituir las perturbaciones por señales equivalentes que actúe directamente
ST

sobre la salida:

Y (s) = G(s)U (s) + Do (s) , Do (s) = F (s)D(s)

o bien una que se apliquen a la entrada junto con u:


N

F (s)
Y (s) = G(s) [U (s) + Di (s)] , Di (s) = D(s)
G(s)
O

Dependiendo de la conveniencia, en general incluiremos algunas perturbaciones como


efectos equivalentes a la entrada y otras a la salida.
C

Para construir una estructura genérica para el lazo de control se agrega en el lazo de
realimentación el ruido de medición N (s) y se identifican las tres variables de salida
relevantes para el análisis: Y (s), E(s) y U (s) (ver figura 2.6).
EN

Como ejemplo podemos considerar el control de régimen de giro para el motor de un


helicóptero, comúnmente llamado governor.
En la figura 2.7 se muestra un esquema del caso de un helicóptero con motor de
combustión interna. En este caso, para variar el régimen de giro actuamos sobre la
mariposa del carburador.

versión (preliminar) 0.2 - pág.35


N
IO
Figura 2.7: Esquema del control de régimen de giro (governor ) de un helicóptero con motor de combustión interna

También el rotor principal y el rotor de cola afectan el régimen de giro cuando cambia

C
el paso colectivo de cualquiera de ellos, especialmente el primero. Identifiquemos estas
perturbaciones como dp y dc respectivamente.

C
Dado que el paso colectivo del rotor principal es proporcional al movimiento del comando
de paso colectivo (figura 2.8a), la posición de este mando da información directa de la
RU
perturbación.
Sin embargo, esta no se suma directamente a la entrada o a la salida, como se muestra
en la figura 2.6. Para calcular una perturbación de salida do “equivalente” habrı́a que
considerar la transformación dinámica f1 [·] que hay sobre el paso colectivo antes de
producir un efecto en la salida y (el régimen de giro del motor). Lo mismo puede
decirse para el rotor de cola, con lo cual la perturbación equivalente serı́a de la forma
ST

do = f1 [dp ] + f2 [dc ].

Dado que la dinámica f1 [·] es similar a la que relaciona la apertura de la mariposa u con
la salida f [·], es decir f1 [·] ≈ f [·], es lógico pensar en estos efectos como perturbaciones
de entrada. Más aun, una estrategia común para compensarla al menos parcialmente
N

es la de conectar mecánicamente el comando de paso colectivo con la apertura del


carburador.
Este mecanismo se le llama correlador, y se esquematiza en la figura 2.7 como una
O

señal de “pre-alimentación” (feed-foreward) sumada a la acción de control.


Otra posibilidad es medir la posición de este comando con algún sensor y generar una
correlación dentro del controlador.
C

Reduciendo el diagrama de la figura 2.6 (de acuerdo a lo desarrollado en el apéndice


A.2), vemos que la “sensibilidad” de la salida a cambios en la referencia, que es lo que
normalmente llamamos función de transferencia a lazo cerrado, resulta:
EN

Y (s) K(s)G(s)
T (s) = = (2.3)
R(s) 1 + K(s)G(s)
De la misma forma podemos evaluar la transferencia entre la referencia y el error:

E(s) 1
S(s) = = (2.4)
R(s) 1 + K(s)G(s)

versión (preliminar) 0.2 - pág.36


(a) Comando de paso colectivo del rotor principal. El (b) transmisión del comando de acelerador (c) Accionamiento de la mariposa del carbu-

N
rotor de cola se comanda con pedales y servo-motor del governor rador

IO
Esta misma relación coincide con la sensibilidad de la salida Y (s) a la perturbación de
salida Do (s).

Entre estas dos funciones de sensibilidad existe una restricción fundamental indepen-

C
diente del caso analizado:

S(s) + T (s) = 1 (2.5)

C
Llamamos a S(s) función de sensibilidad y a T (s) sensibilidad complementaria.
RU
Podemos determinar otras funciones de interés identificando las trayectorias directas, ya
que el lazo de realimentación es el mismo en todos los casos:

Y (s) G(s)
Si (s) = = = S(s)G(s) (2.6)
Di (s) 1 + K(s)G(s)
ST

Y (s)
So (s) = ≡ S(s) (2.7)
Do (s)
U (s) K(s)
Su (s) = = = S(s)K(s) (2.8)
N (s) 1 + K(s)G(s)
N

Agrupando todas las sensibilidades en una matriz de transferencia:


 
R(s) 
O

   
 
Y (s) 1 K(s)G(s) G(s) 1 1

Di (s)

= (2.9)
U (s) 1 + K(s)G(s) K(s) K(s)G(s) K(s) K(s) 
Do (s) 
N (s)
 
C

Puede observarse que todas las sensibilidades quedan definidas por cuatro funciones
fundamentales: T (s), S(s), Si (s) y Su (s), que comparten como denominador la
expresión 1 + K(s)G(s).
EN

2.3.3. Ecuación Caracterı́stica de Lazo Cerrado


En un modelo lineal la caracterı́sticas principales de la dinámica del proceso se describen
a través de sus modos naturales, y estos se pueden estudiar analizando los polos de su
matriz de transferencia.

versión (preliminar) 0.2 - pág.37


De la ecuación (2.9) vemos que para el sistema a lazo cerrado los polos serán las raı́ces
de su ecuación caracterı́stica:

1 + G(s)H(s) = 0 (2.10)

Es obvio que las raı́ces quedan definidas por el producto L(s) = G(s)H(s), a lo cual
denominaremos dinámica de lazo abierto; pero normalmente los polos de lazo abierto y
los de lazo cerrado son diferentes.

N
Como L(s) es una función racional (cociente de polinomios), puede representarse como:

IO
B(s)
L(s) =
A(s)

donde A(s) es un polinomio de orden n y B(s) uno de orden ≤ n. Con esto la ecuación

C
caracterı́stica se puede escribir como:

B(s)
1+ =0

C
A(s)

Multiplicando ambos miembros de la ecuación caracterı́stica por el polinomio denomina-


dor la podemos reescribir como:
RU
Alc (s) = A(s) + B(s) = 0 (2.11)

El polinomio Alc (s) naturalmente se denomina polinomio caracterı́stico de lazo cerrado,


ST

y sus raı́ces son las mismas que las de la ecuación (2.10).


Este polinomio será lo que se obtendrı́a construyendo un modelo de estados para el lazo
cerrado, y calculando el polinomio caracterı́stico de su matriz dinámica |sI − Alc |.

Dado que entre las diferentes sensibilidades puede haber cancelaciones entre polos y
N

ceros, la estabilidad no puede evaluarse a partir de una sola de ellas; pero sı́ podemos
afirmar que el lazo es internamente estable si las cuatro sensibilidades mencionadas son
estables.
O

2.3.4. Compromisos del Diseño


C

El control perfecto serı́a aquel en el cual Y (s) = R(s), o bien E(s) = 0;


independientemente de lo que ocurra con cualquiera de las entradas al lazo.
En otras palabras, control perfecto implica seguimiento exacto de las referencias y
rechazo exacto de perturbaciones:
EN

T (s) = 1 , S(s) = 0 (2.12)

Ambas cosas compatibles y de hecho podemos decir “caras de una misma moneda”,
si consideramos la restricción fundamental dada por la ecuación (2.5) que podemos
reescribir como:
S(s) = 1 − T (s) (2.13)

versión (preliminar) 0.2 - pág.38


Sin embargo T (s) = 1 (S(s) = 0) esto solo podrı́a lograrse con K(s)G(s) → ∞, lo cual
no es realizable ni tampoco deseable debido a diferentes restricciones.
Se puede notar que lograr alta ganancia de lazo abierto K(s)G(s) → ∞ es más difı́cil
cuando |G(s)| → 0, lo cual se da en alta frecuencia (toda dinámica real tiene una
frecuencia de corte acotada). Para frecuencias altas (en relación a la dinámica de la
planta) se requerirı́a incrementar progresivamente la ganancia del control, lo cual trae
aparejados problemas con la actuación máxima, los ruidos de medición y la robustez.

Restricciones por Actuación Máxima Ganancias elevadas implican acciones más

N
intensas de control ante una cierta magnitud de error. Esto podrı́a llevar a alcanzar
los valores máximos admisibles de la acción de control (saturación) aun ante errores
pequeños, lo cual suele resultar inaceptable desde el punto de vista práctico.

IO
Restricciones por Ruido de Medición Ganancias elevadas, especialmente a frecuen-
cias altas, tenderán a amplificar y propagar el ruido de medición a la acción de control.
En casos extremos la acción de control podrı́a terminar dominada por los ruidos de me-

C
dición.

C
Restricciones por Incertidumbre Dinámica Las leyes de control se diseñan en base
a un modelo dinámico del proceso a controlar, que por definición no es exacto. En general
este modelo representa correctamente la dinámica del sistema para movimientos lentos,
RU
compatibles con el comportamiento esperado del sistema a lazo cerrado.
Si se pretende de este último una respuesta más rápida será necesario refinar el modelo
para incluir efectos originalmente despreciados. Estos suelen ser difı́ciles de modelar, y
muchas veces implica lidiar con parámetros variables según la condición de operación.

Un control diseñado con un modelo que no represente correctamente la dinámica del


ST

proceso en la escala de tiempos de respuesta que se pretende para el lazo cerrado


tendrá un desempeño poco satisfactorio, es decir, no será robusto.

2.3.5. Errores en Régimen Estacionario


N

Una condición necesaria para la correcta operación de un sistema de control es que


la dinámica de lazo cerrado sea estable. Por lo tanto, si se produce un cambio abrupto
(impulso o escalón) en la referencia o en una perturbación, el sistema a lazo cerrado
O

evolucionará hasta alcanzar una nueva condición de equilibrio.

De hecho, este cambio en las entradas podrı́a tener alguna ley de evolución temporal
C

que no necesariamente implique establecerse en algún valor constante, y aún ası́


observarı́amos un perı́odo de respuesta transitoria para pasar finalmente a un régimen
estacionario (como vemos en el caso de la respuesta a entradas senoidales).
En régimen transitorio la evolución del estado estará fuertemente marcada por la
EN

dinámica de lazo cerrado, pero en régimen estacionario tomará la forma de la referencia


o perturbación (linea, parabólica, senoidal, etc).

Los errores en el régimen transitorio son inevitables, pero se puede trabajar sobre
la dinámica de lazo cerrado para ajustar algunos aspectos de este transitorio,
especialmente su duración (tiempo de establecimiento) y amortiguamiento (es decir,
evitar oscilaciones excesivas).

versión (preliminar) 0.2 - pág.39


En cambio en régimen estacionario, para perturbaciones determinı́sticas, sı́ se puede
lograr error nulo.

Para perturbaciones aleatorias el análisis debe hacerse en frecuencia, evaluando las


distribuciones espectrales de densidad de potencia (PSD) de las perturbaciones y cómo
estas se propagan a las salidas, lo cual dependerá de la dinámica del lazo cerrado como
ocurre con la respuesta transitoria.
En otras palabras, para perturbaciones aleatorias analizamos el lazo cerrado como un
“filtro”.

N
Perturbaciones de Tipo 1/sk
Para determinar el error de estado estacionario a partir de las funciones de transferencia

IO
del lazo podemos recurrir al Teorema del Valor Final, que aplicado al error resulta:

ess = lı́m e(t) = lı́m sE(s) (2.14)


t→∞ s→0

C
Si evaluamos lo que ocurre con este error ante un cambio en la referencia tendremos:
1
ess = lı́m sS(s)R(s) = lı́m s R(s) (2.15)
s→0 s→0 1 + L(s)

C
En el análisis que podemos encontrar en los libros clásicos como [Oga98] o [Kuo]
se considera habitualmente el error de respuesta a una referencia escalón, rampa o
RU
parábola:

1 1 1
R(s) = ess = lı́m s (2.16)
sk s→0 1 + L(s) sk
donde k = 1, 2, 3, · · · se corresponde a escalón, rampa, parábola, etc. Si descompone-
mos la transferencia de lazo abierto en el producto de una función L̄(s) sin polos en el
ST

origen y normalizada con ganancia 1 a frecuencia cero (L̄(0) = 1) y otro término L0 /st
con el resto de la dinámica de lazo abierto (L0 = L(0)):

s 1 st−k+1
ess = lı́m = lı́m
s→0 L0 sk s→0 st + L0
N

1 + t L̄(s)
s
En el caso de una entrada escalón k = 1:
O

 1

st si t = 0
eescalon = lı́m t = 1 + L0 (2.17)
s→0 s + L0
0 si t > 0

C

A la cantidad t de polos en el origen del lazo abierto se la designa como tipo de sistema.
Vemos que un sistema de tipo 0 tendrá un error constante al escalón, tanto más chico
cuanto mayor sea su ganancia a frecuencia cero. Un sistema con tipo mayor a 0 tendrá
error nulo al escalón.
EN

Para una entrada rampa k = 2, con lo cual:


∞ si t = 0



1

erampa = si t = 1 (2.18)
L
 0


0 si t > 1

versión (preliminar) 0.2 - pág.40


Que el error de estado estacionario a una referencia rampa sea ∞ significa que la
pendiente de la variable de salida y es diferente a la de la referencia r, y por lo tanto
la diferencia aumenta sin lı́mite.

Veamos el caso de la respuesta de lazo cerrado para un sistema térmico simple con
control proporcional:

C kp C
G(s) = , K(s) = kp , L(s) = K(s)G(s) =
Ts + 1 Ts + 1

N
El lazo es de tipo 0 (ni G(s) ni K(s) tienen polos en el origen), y la ganancia a frecuencia
cero es L(0) = kp C . La transferencia a lazo cerrado es:

IO
kp C
T (s) =
T s + kp + 1

En la siguiente figura se muestra la respuesta a un cambio abrupto (escalón) en la

C
referencia y a un cambio lineal (rampa):

C
RU
ST
N

Vemos que hay un error en estado estacionario constante, mientras que para la rampa el
error crece sin lı́mite ya que la pendiente de la respuesta tiene una diferencia constante
respecto de la pendiente de la referencia.
O

Para el escalón (en este caso de amplitud el escalón 550 − 100 = 450 y kp C = 10) el
error de estado estacionario es:
C

1 1
ess = 55 = 450 = 4,10
1 + L0 1 + kp C
EN

Podemos ver que los polos y ceros de lazo abierto no tienen ninguna influencia sobre el
estado estacionario, a excepción de aquellos en el origen. En los casos con error no nulo,
este será tanto menor cuando mayor sea la ganancia. Estos resultados se sintetizan en
la tabla 2.1.

Debe destacarse que la acción integral en el control PID incrementa el tipo de sistema
en 1, y por lo tanto garantiza error nulo en estado estacionario a referencias constantes.

versión (preliminar) 0.2 - pág.41


tipo de sistema
0 1 2
1
escalón 0 0
1 + L0
1
rampa ∞ 0
L0
1
parábola ∞ ∞
L0

N
Cuadro 2.1: Errores de estado estacionario para modelos de perturbación 1/sk

IO
Los mismos resultados se obtiene si consideramos el error de estado estacionario
ante una perturbación equivalente a la salida. Desde la perspectiva del error,
tanto la referencia R(s) como la perturbación de salida Do (s) pueden considerarse
genéricamente como una misma perturbación.

C
Pero en el caso de una perturbación de entrada hay una diferencia:
G(s)
ess = lı́m sSi (s)Di (s) = lı́m s Di (s)

C
s→0 s→0 1 + K(s)G(s)
1
= lı́m s Di (s)
s→0 G−1 (s) + K(s)
RU
Si G(s) no tiene ceros en el origen, lı́m G−1 (s) = cte, con lo cual:
s→0

1
ess = lı́m s Di (s)
s→0 c + K(s)
ST

En este caso los polos y ceros de la planta no tienen incidencia sobre el error en estado
estacionario. Solo interesa la ganancia y los polos del controlador K(s).

A partir del diagrama 2.6 para un lazo de control podemos diagramar las sensibilidades
del error a las referencias o perturbaciones de salida por un lado (función S(s)) y a
N

perturbaciones de entrada (Si (s)). Esto se muestra en la figura 2.9.


O
C
EN

Figura 2.9: Replanteo de la figura 2.6 para poner en evidencia las sensibilidades del error a las distintas entradas del lazo SISO

versión (preliminar) 0.2 - pág.42


Podemos notar que en el primer caso tanto el control K(s) como la planta G(s) aparecen
en el lazo de realimentación, mientras que en el segundo solo está el control.
Concluimos entonces que lo que importa es el tipo de sistema de la realimentación.

Principio del Modelo Interno


Como modelo genérico para las perturbaciones (incluyendo en esto cambios en la
referencia) podemos proponer una función racional:

N (s)
P (s) =

N
D(s)
De forma genérica podemos esquematizar la relación entre perturbación y error de la

IO
siguiente forma:

C
C
El error en estado estacionario serı́a:
RU
Ld (s) N (s)
ess = lı́m s ·
s→0 1 + Ld (s)Gr (s) D(s)
Expresando ambas transferencias como funciones racionales Ld (s) = Bd (s)/Ad (s) y
Lr (s) = Br (s)/Ar (s) :
ST

Bd (s)
Ad (s) N (s) Bd (s)Ar (s) N (s)
ess = lı́m s = lı́m s ·
s→0 Bd (s) Br (s) D(s) s→0 Ad (s)Ar (s) + Bd (s)Br (s) D(s)
1+
Ad (s) Ar (s)
N

El denominador de la primer fracción es el polinomio caracecterı́stico de lazo cerrado


Alc (s) que aparece en la ecuación (2.11). Entonces:
Bd (s) N (s)
O

ess = lı́m s · Ar (s)


s→0 Alc (s) D(s)
Si el denominador del modelo de perturbación es un factor del denominador de la
C

realimentación podemos escribir Ar (s) = Ā(s)D(s). En ese caso:

N (s)Bd (s)Ā(s)
ess = lı́m s
s→0 Alc (s)
EN

Si Alc (s) es un polinomio de orden n y el producto de los polinomios del numerador


arroja como resultado uno de orden m, podemos separar este producto en un polinomio
N1 (s) de orden n − 1 multiplicado por otro N2 (s) de orden m − n + 1
Desarrollando en fracciones parciales:
 
r1 r2 rn
ess = lı́m s + + ··· + + N2 (s)
s→0 s + p1 s + p2 s + pn

versión (preliminar) 0.2 - pág.43


Como el lazo cerrado es estable (de lo contrario no habrı́a estado estacionario), en todas
las fracciones pj > 0 y por lo tanto el lı́mite converge a cero.

En palabras esto significa que el error de estado estacionario será nulo si el denominador
del lazo de realimentación incluye un “modelo” de la perturbación, es decir, D(s) es un
factor de A(s).
Esta es una generalización de lo visto para perturbaciones c/sk (escalón, rampa, parábo-
la, etc.) en donde necesitamos un factor sk en el denominador de la realimentación.

N
IO
C
C
RU
ST
N
O
C
EN

versión (preliminar) 0.2 - pág.44


N
3

IO
C
Análisis Clásico de Sistemas SISO

C
RU
ST
N
O
C
EN

En el este capı́tulo veremos los métodos clásicos para evaluar el impacto en la dinámica
de lazo cerrado T (s) de cambios en la dinámica de lazo abierto L(s) enfocándonos en
el análisis de la ecuación caracterı́stica de lazo cerrado (2.10).

45
Lugar de Raı́ces
La ecuación caracterı́stica de lazo cerrado (2.10) puede escribirse también como:

G(s)H(s) = L(s) = −1 (3.1)

Desde el punto de vista de los modos de respuesta de lazo cerrado, que la dinámica esté
distribuida entre G(s) y H(s) es irrelevante.

Dado que L(s) es una función compleja, hay que ver a la constante −1 en la ecuación

N
(3.1) como un número complejo con parte imaginaria nula. Este tiene una magnitud 1
y un argumento ± (2n + 1) π, n ∈ N. Por lo tanto, la ecuación caracterı́stica de lazo
cerrado se puede expresar en término de dos relaciones ecuaciones reales:

IO
|L(s)| = 1 (3.2)
∠L(s) = ± (2n + 1) π n = 0, ±1, ±2, · · · (3.3)

C
donde n ∈ R. Llamamos condición de módulo a la restricción dada por la ecuación (3.2),
y condición de ángulo a la establecida por la ecuación (3.3).

C
Si la ganancia de lazo abierto varı́a en un factor λ ∈ R habrá una afectación sobre la
condición de módulo pero no en la de ángulo.
Para una determinada dinámica de lazo abierto λL(s), cualquier punto del plano s
RU
cumplirá la condición de módulo para algún valor de λ, pero solo un subconjunto de
ellos cumple las condición de ángulo.
Por lo tanto, si cambia el valor de λ los polos de lazo cerrado (raı́ces de la ecuación
caracterı́stica (2.10)) se desplazarán en el plano s sobre un conjunto de curvas que
agrupan aquellos puntos del plano complejo que cumplen la condición de ángulo.
A este subespacio del plano complejo se lo denomina lugar geométrico de las raı́ces
ST

para el lazo cerrado con dinámica de lazo abierto L(s).

Podemos decir que el lugar geométrico de las raı́ces para un sistema realimentado es el
subespacio del plano complejo en donde:
se ubicarı́an los polos de lazo cerrado al modificar la ganancia de lazo abierto con
N

un factor λ : [0 : ∞)
se cumple con la condición de ángulo (3.3)
O

En el ejemplo introductorio del apéndice A.2 para un sistema masa-resorte-amortiguador


se obtuvo la siguiente estructura:
C
EN

Podemos estudiar la dinámica de este modelo analizándolo como un sistema realimen-


tado con lazo abierto:
1 bs + k
L(s) =
m s2

versión (preliminar) 0.2 - pág.46


Podemos tomar λ = m−1 y evaluar el efecto que tendrı́a un cambio en la masa sobre
sus polos. En la siguiente figura se muestra el “diagrama de lugar de raı́ces” para este
caso con k = 40000 y b = 8000 y m : ∞ → 0.

N
IO
C
C
RU
ST

El código para construir esta figura es el siguiente:


k = 40000;
N

b = 8000;
num = [b k ];
den = [1 0 0 ] ;
O

r l o c u s ( num , den )
Hemos remarcado con flechas la dirección de desplazamiento de las raı́ces de la
C

ecuación caracterı́stica (que son los polos de lazo cerrado) cuando se aumenta λ (que
en este caso implica disminuir la masa).
Esto indica que un decremento en la masa (incremento de λ) aumentará el factor
de amortiguamiento y la frecuencia natural de los polos del sistema. Para un valor lo
EN

suficientemente chico tendremos una dinámica con amortiguado crı́tico (un polo doble
en el eje real negativo) y a partir de ahı́ se tendrá una respuesta sobre amortiguada. AL

contrario, si aumentamos la masa (disminuimos de λ) los polos complejos conjugados


se van corriendo hacia el origen, disminuyendo tanto el factor de amortiguamiento como
la frecuencia natural. Con m → ∞ los efectos del resorte y del amortiguador son
despreciables, convirtiéndose prácticamente en un cuerpo rı́gido.

versión (preliminar) 0.2 - pág.47


Se destaca que con una variación de la masa el sistema nunca se tornará inestable,
dado que todo el diagrama de lugar de raı́ces se encuentra en el semiplano izquierdo
del espacio complejo.

La ecuación caracterı́stica que hemos analizado es de la forma:


 
bs + k b k
1+ = 1+ + =0
ms2 ms ms2

N
Si dividimos a ambos lados de la última igualdad por el término entre corchetes
obtenemos:

IO
 −1
k b k
1+ 1 + =1+ =0
ms2 ms s (ms + b)

Podemos tomar ahora:

C
1
L(s) = k
s (ms + b)

C
para analizar el efecto de la rigidez en la dinámica del sistema masa-resorte-
amortiguador.
RU
3.1.1. Análisis de la Ecuación Caracterı́stica de Lazo Cerrado
Como L(s) es una función racional (cociente de polinomios), puede representarse como:
ST

B(s)
L(s) =
A(s)
b0 sn + b1 sn−1 + · · · + bn−1 s + bn
= n
s + a1 sn−1 + · · · + an−1 s + an
(s + z1 )(s + z2 ) · · · (s + zn ) B̄(s)
N

=k =k (3.4)
(s + p1 )(s + p2 ) · · · (s + pn ) A(s)

donde −z1 , −z2 · · · − zn son las raı́ces del numerador o ceros del lazo abierto L(s),
O

mientras que −p1 , −p2 · · ·−pn son las raı́ces de su denominador o polos de lazo abierto.
La constante real k se suele llamar ganancia, aunque también llamamos ganancia al
cociente bn /an , que es la “ganancia a frecuencia cero”.
C

Las raı́ces de (2.11) o (2.10) son equivalentes y cumplen tanto la condición de módulo
como la de ángulo. Con el modelo propuesto para L(s) podemos ver que:
EN

B̄(s)
1 + L(s) = 1 + k =0 → Alc (s) = A(s) + k B̄(s) = 0 (3.5)
A(s)

Queda claro que las raı́ces del polinomio de lazo cerrado Alc (s) cambiarán si cambia k .
Puede notarse que si k → 0, Alc (s) → A(s), con lo cual podemos decir que los polos
de lazo cerrado tienden hacia los polos de lazo abierto para valores pequeños del factor
k . El caso lı́mite es k = 0, que equivale a eliminar la realimentación.

versión (preliminar) 0.2 - pág.48


En el caso k → ∞ se podrı́a decir que A(s) es despreciable frente a k B̄(s), y por lo
tanto Alc (s) → B(s). Entonces para valores muy grandes de k los polos de lazo cerrado
tienen a los ceros de lazo abierto.

Sintetizamos esto diciendo que las ramas del lugar de raı́ces arrancan en los polos de
lazo abierto y terminan en sus ceros. Como en general el la función L(s) es estrictamente
propia (el orden del polinomio numerador es menor que el del denominador), se tienen
mas polos que ceros a lazo abierto. En ese caso hay ramas que terminan en ceros
infinitos z = ∞ejθ .

N
3.1.2. Interpretación de las Condiciones de Módulo y Ángulo

IO
Para evaluar las condiciones (3.2) y (3.3) tenemos que determinar el módulo y argumento
de las expresión (3.4). Para ello es conveniente expresar los números complejos en
forma polar:

C
p
s = a + j b = |s|ej∠s , |s| = x2 + y 2 , ∠s = tan−1
a
La suma de complejos se puede interpretar como suma vectorial en R2 . En la siguiente

C
figura se muestra una interpretación gráfica de un término s+p (tener presente que tanto
s como p son números complejos y pueden ser representados con vectores en el plano
C):
RU
ST
N
O

Para el producto de dos complejos:

A · B = |A||B| ej∠A+∠B
C

Para el cociente:
A |A| j∠A−∠B
= e
B |B|
EN

Entonces podemos reescribir el lazo abierto como:

|B(s)| |s + z1 ||s + z2 | · · · |s + zm |
|L(s)| = =k
|A(s)| |s + p1 ||s + p2 | · · · |s + pn |
B1 B2 · · · Bm
=k
A1 A2 · · · An

versión (preliminar) 0.2 - pág.49


N
IO
C
Figura 3.1: Representación gráfica del cómputo para la condición de ángulo

C
donde Bk = |s + zk | y Ak = |s + pk |; y
RU
∠L(s) = ∠B(s) − ∠A(s)
= ∠(s + z1 ) + ∠(s + z2 ) + · · · ∠(s + zn )
− ∠(s + p1 ) − ∠(s + p2 ) · · · − ∠(s + pn )
Xm Xn
= φk − θk
ST

k=1 k=1

donde φk = ∠(s + zk ) y θk = ∠(s + pk ). En la figura 3.1 se muestra una representación


gráfica de estos términos.
N

En base al razonamiento gráfico propuesto podemos ver que para un lazo abierto:

1
O

L(s) =
s (s + 2)

en donde tenemos dos polos s = 0 y s = −2, es necesario evaluar el argumento de los


C

−−−→
vectores →
−s y s + 2. Ambos son polos y por lo tanto sus argumentos restan.
Para este caso podemos notar que cualquier punto de la recta vertical Re {s} = −1
cumple con la condición de ángulo, ya que −θ1 − θ2 = −1800 . Por lo tanto esa recta es
parte del lugar de raı́ces de este ejemplo.
EN

versión (preliminar) 0.2 - pág.50


N
IO
3.1.3. Reglas para el Trazado del Diagrama
El lugar de raı́ces puede aproximarse mediante reglas relativamente sencillas a partir de

C
la ubicación de polos y ceros de lazo abierto en el plano complejo.
Una de ellas ya ha sido mencionada, y establece que hay una rama de esta gráfica por
cada polo de lazo abierto, que parte desde este y converge hacia algún cero de lazo

C
abierto cuando la ganancia tiende a infinito.
Hemos dicho también que como las funciones de transferencia para sistemas reales
tienen más polos que ceros (son funciones estrictamente propias), algunas de las ramas
RU
convergen a ceros en el infinito siguiendo la dirección de ciertas “ası́ntotas”. La cantidad
de ası́ntotas será igual al grado relativo del lazo abierto, definido como la diferencia entre
cantidad de polos np y cantidad de ceros nz .

Estas ası́ntotas se cortan en un punto sobre el eje real dado por:


ST

P P
pj − zj
σa = (3.6)
np − nz

y forma ángulos
N

± (2n + 1) π
θa = , n = 0, 1, · · · (3.7)
np − nz
O

Esto significa que cuanto mayor sea el grado relativo, mayor será la cantidad de ası́ntotas
y menor será el intervalo angular entre ellas. A su vez, la intersección entre ellas estará
tanto más a la izquierda cuando más a la izquierda estén los polos y más a la derecha
C

estén los ceros.


Al agregar un cero en el lazo abierto (por ejemplo a través de un compensador) se
elimina una ası́ntota, se aumenta el intervalo entre ellas y se corre su intersección hacia
la izquierda. Esto implica que los polos de lazo cerrado estarán más a la izquierda (efecto
EN

“estabilizante”).
Cuando se agrega un polo se da exactamente lo contrario (efecto “desestabilizante”).

Mediante la interpretación geométrica para la condición de ángulo es fácil notar que


cualquier punto sobre el eje real que tenga a la derecha una cantidad impar de polos y
ceros cumplirá esta condición, y por lo tanto será parte del lugar de raı́ces.

versión (preliminar) 0.2 - pág.51


N
IO
C
C
RU
ST
N
O
C
EN

Figura 3.2: Algunos ejemplos de lugar de raı́ces (tomado de [Oga10])

versión (preliminar) 0.2 - pág.52


En la figura 3.2 se muestran algunos ejemplos, en donde se pueden constatar las reglas
mencionadas.
Matlab cuenta con una herramienta interactiva denominada sisotool() que permite
entre otras cosas agregar o desplazar polos de lazo abierto y evaluar en simultáneo el
impacto en la dinámica de lazo cerrado.

3.1.4. Análisis de Estabilidad


Si solo interesa evaluar la estabilidad del lazo cerrado, es posible construir el polinomio

N
Alc (s) y determinar si este tiene raı́ces en el semiplano derecho del espacio complejo
(C+ ).
Para un polinomio concreto esto se puede resolver con el comando roots().

IO
Supongamos que queremos averiguar las raı́ces de A(s) = s3 + 3s2 + 3s + 10.
Podemos hacer el cómputo con el siguiente código:

C
% representamos un p o l i n o m i o colocando sus c o e f i c i e n t e s en un v e c t o r
% comenzando con e l que corresponde a l a mayor p o t e n c i a de s

C
A = [1 3 3 10];
roots (A)
RU
ans =

− 3.0801 + 0.0000 i
0.0400 + 1.8014 i
0.0400 − 1.8014 i

Vemos que hay un par de raı́ces complejas conjugadas en C+ (parte real positiva).
ST

Pero esta forma directa no es útil cuando existen parámetros variables en el polinomio.
Para esos casos existen algunas alternativas.
N

Criterio de Estabilidad de Routh


El Criterio de Estabilidad de Routh puede utilizarse para determinar los rangos de valores
de algún parámetro variable en el lazo abierto para los cuales el lazo cerrado será
O

estable. El método se desarrolla en detalle en [Oga10, sec.5.6].

Una consideración importante que se plantea en este criterio es que cualquier polinomio
C

en donde haya un cambio de signo en sus coeficientes tendrá raı́ces con parte real
positiva. Si el polinomio analizado es Alc , esto equivale a polos inestables de lazo
cerrado.
EN

Supongamos por ejemplo que:

B(s) s−1
L(s) =
A(s) s (s + 1) (s + 2)

versión (preliminar) 0.2 - pág.53


Se tendrá que:

Alc (s) = A(s) + B(s) = s (s + 1) (s + 2) + s − 1


= s3 + 3s2 + 3s−1
= (−1,6300 + j1,0911) (−1,6300 − j1,0911) (s−0,2599)

Vemos que la última raı́z p3 = 0,2599 está en el semiplano C+ .

N
Criterio de Estabilidad de Hurwitz
La inexistencia de cambios de signo es una condición necesaria para que todas

IO
las raı́ces del polinomio estén en C− , pero no es suficiente. El criterio de Routh
complementa esta condición con la construcción de una tabla de evaluación para
determinar la existencia de raı́ces positivas.

C
En contraste, el criterio de estabilidad de Hurtwitz da condiciones suficientes para
cualquier polinomio.
Este se basa en evaluar los menores principales de una matriz construida con los

C
coeficientes del polinomio. Este se presenta en [Oga10, A-5-18, p. 252] y en ediciones
anteriores.
RU
Mencionamos este criterio puntualmente porque es común en la bibliografı́a decir que
un polinomio es “Hurwitz” para indicar que no tiene raı́ces en C+ .

3.1.5. Lugar de Raı́ces Complementario


Normalmente se traza el lugar de raı́ces para valores de ganancia positivos. En algunos
ST

casos puede tener sentido utilizar ganancias negativas. En ese caso la ecuación
caracterı́stica de lazo cerrado (2.10) se transforma en:

1 − G(s)H(s) = 0 (3.8)

Esto transforma la condición de ángulo a:


N

∠L(s) = ±2nπ n = 0, ±1, ±2, · · · (3.9)


O

En la figura 3.3 se muestran ejemplos en donde se ha trazado en lı́neas punteadas los


diagramas de raı́ces complementarios.
C

3.1.6. Lectura Adicional


El tema del lugar geométrico de las raı́ces está desarrollado en detalle en [Oga10] y
en todas sus ediciones anteriores, ası́ como en la mayorı́a de los libros clásicos para la
EN

enseñanza de grado en control automático.


Allı́ se detallan reglas para estimar la forma del lugar de raı́ces a partir de los polos y
ceros en base a diferentes reglas. Estas son de interés no para realizar la gráfica (el
comando rlocus() resuelve rápidamente esta cuestión) sino para poder imaginar como
cambia el diagrama al agregar polos o ceros en el lazo abierto.

6.1 - Introducción
6.2 - Gráficas del lugar geométrico de las raı́ces

versión (preliminar) 0.2 - pág.54


N
IO
C
C
RU
ST
N
O
C
EN

Figura 3.3: Algunos ejemplos de lugar de raı́ces complementario (tomado de [Oga10])

versión (preliminar) 0.2 - pág.55


Conceptos Principales
condiciones de módulo y ángulo
interpretación conceptual del lugar de raı́ces
interpretación matemática del lugar de raı́ces
reglas básicas: lugar de raı́ces en el eje real, ángulo e intersección con el eje real
de las ası́ntotas

Conceptos Interesantes

N
6.3 - Gráfica del lugar de las raı́ces con MATLAB:
• sistemas condicionalmente estables
• sistemas de fase no mı́nima

IO
6.4 - Lugares de raı́ces de sistemas con realimentación positiva.

sistemas condicionalmente estables


sistemas de fase no mı́nima

C
diagrama complementario

C
Criterio de Nyquist
RU
Harry Nyquist (fı́sico e ingeniero sueco-estadounidense) publicó en 1932 un artı́culo
sobre la estabilidad de amplificadores de retroalimentación, en el cual presentó lo que
hoy conocemos como criterio de estabilidad de Nyquist.
Su propuesta es determinar la estabilidad de un sistema a lazo cerrado a partir del
conocimiento de la dinámica de lazo abierto sin realizar un cálculo explı́cito de los polos
de lazo cerrado.
ST

Estabilidad del lazo cerrado implica que todas las raı́ces de su ecuación caracterı́stica
(2.10) estén en el semiplano izquierdo del espacio complejo C− . Ya hemos mencionado
los criterios de Routh y Hurwitz como formas de indagar esto, y también hemos dicho
que en la actualidad es muy fácil computar la dinámica de lazo cerrado y evaluar de
N

forma directa la ubicación de sus polos cuando todos los parámetros están definidos.
Lo que buscamos aquı́ es poner en evidencia el impacto que tendrı́a un cambio en la
dinámica de lazo abierto sobre la estabilidad del lazo cerrado.
O

Veremos que esto se puede determinar de forma gráfica.


Posteriormente partiremos de este criterio para realizar el análisis de robustez de un
sistema de control.
C

3.2.1. Teorema del Encierro


El criterio de Nyquist es una aplicación del Teorema del Encierro. Este teorema establece
EN

que si tomamos una curva cerrada C en el plano complejo C y le aplicamos una


transformación F (s) que sea conforme sobre la curva C (es decir, que sus polos no
caigan sobre la curva), el resultado será una curva también cerrada en otro plano
complejo C0 que encerrará al origen una cantidad N de veces igual a la diferencia entre la
cantidad de zeros Z y polos P que tiene F (s) en la región del plano s original encerrada
por la curva C .

versión (preliminar) 0.2 - pág.56


En la figura 3.4 se muestran ejemplos de diferentes trayectorias cerradas en el plano s
(lazo izquierdo) mapeadas con la función:

s−1
F (s) =
s+1
Esta función tiene un cero en s = 1 y un polo en s = −1.
En las gráficas del lado izquierdo de la figura puede notarse que para trayectos que
encierran solo al polo (a) o al cero (b), el mapeo del trayecto encierra al origen en sentido

N
negativo y positivo respectivamente; mientras que en los otros casos Z − P = 0 y el
mapeo no encierra al origen (N = 0).

IO
3.2.2. Estabilidad del Lazo Cerrado

C
Si tomamos una curva cerrada C+ que encierre todo el semiplano derecho del plano
complejo C+ :

C
RU
ST

y la transformamos con la función F (s) = 1 + L(s) (lado izquierdo de la ecuación


N

caracterı́stica de lazo cerrado (2.10)), los N encierros de la curva transformada en el


nuevo espacio complejo se corresponderán a la diferencia Z−P con Z igual a la cantidad
de raı́ces de F (s) en C+ y P la cantidad de polos en dicho espacio.
O

Como polos F (s) = 1 + L(s) son los polos de L(s), y los ceros o raı́ces de F (s) =
1 + L(s) son los polos de lazo cerrado, vemos que:
C

P es la cantidad de polos inestables de lazo abierto


Z es la cantidad de polos inestables de lazo cerrado

Conociendo P (se asume que sabemos cuantos polos inestables tiene el lazo abierto) y
EN

determinado N podemos ver “cuantos polos inestables tiene el lazo cerrado”:

Z =N +P (3.10)
Por simplicidad podemos hacer una traslación del espacio transformado llevando el
origen al punto −1 y usando como transformación F (s) = L(s).
El resultado es el mismo, pero ahora debemos evaluar los encierros al −1.

versión (preliminar) 0.2 - pág.57


N
IO
C
C
RU
ST
N
O
C
EN

Figura 3.4: Algunos ejemplos del “teorema del encierro” (tomado de [Oga10]). En los casos (a) y (b) hay encierro al origen de la
curva transformada, mientras que en los (c) y (d) no. Observar a la izquierda la cantidad de polos y ceros en la región acotada
por la curva original.

versión (preliminar) 0.2 - pág.58


N
IO
C
C
Figura 3.5: Trayectoria de Nyquist modificada para un lazo abierto con polo en el origen y ejemplo de un posible mapeo (tomado
de [Oga10])
RU
El trayecto de Nyquist C+ está compuesto por dos partes: el eje imaginario Cj y un semi-
cı́rculo de radio infinito C∞ . En otras palabras: C+ = Cj ∪ C∞ .
Cuando transformamos el primer tramo se tiene s = jω , y por lo tanto la curva
transformada es L(jω), que representa la gráfica polar de la respuesta en frecuencia
ST

de lazo abierto.
Al evaluar el tramo C∞ se tiene s = ∞ ejθ . El módulo de la transformación serı́a:

|∞ ejθ + z1 | · · · |∞ ejθ + zm |
|L(∞ ejθ )| = k =0 si np > nz
|∞ ejθ + p1 ||∞ ejθ + p2 | · · · |∞ ejθ + pn |
N

Por lo tanto C∞ se mapea en el origen, y la curva completa C+ se transforma en la gráfica


polar de la respuesta en frecuencia de lazo abierto para ω = (−∞, ∞).
O

Por lo tanto, graficando la respuesta en frecuencia de lazo abierto en forma polar (por
ejemplo usando el comando nyquist()) y observando los encierros al punto F (s) = −1,
podemos determinar la cantidad de polos inestables de lazo cerrado a partir de (3.10).
C

3.2.3. Funciones de Lazo Abierto con Polos en el Eje Imaginario


Para aplicar el teorema del encierro la función de transformación debe ser conforme (no
EN

singular) sobre la trayectoria a transformar.


Este no es el caso al aplicar el criterio de Nyquist a un lazo abierto que tengan polos
sobre el eje imaginario.
En estos casos es necesario modificar el trayecto C+ para excluir estos polos,
incorporando arcos de circunferencia infinitesimales alrededor de ellos para dejarlos
fuera de la curva. Este caso se explica en detalle en [Oga10, p. 452].

versión (preliminar) 0.2 - pág.59


N
IO
C
Figura 3.6: Margenes de estabilidad

C
Para rodear un polo de lazo abierto en jω0 se tiene:
RU
π π
s = jω0 + lı́m  ejθ , θ = (− , + ) (3.11)
→0 2 2
En la figura 3.5 se muestra el caso de un lazo abierto con polo en el origen. Para este
caso la trayectoria de Nyquist es C+ = Cj − ∪ C ∪ Cj + ∪ C∞ .
Al recorrer el arco infinitesimal C el módulo de la transformación es ∞ (lo opuesto a
ST

lo que ocurre al recorrer C∞ ). Esto hace que las trazas de lazo abierto para s = +jω
y s = −jω (Cj + y Cj − respectivamente) se unan con un arco de radio infinito del lado
derecho del plano de Nyquist.
Algo similar se debe hacer con polos complejos conjugados de lazo abierto en cualquier
otra ubicación sobre el eje imaginario.
N

3.2.4. Márgenes de Estabilidad


La cercanı́a al encierro del punto −1 de la respuesta en frecuencia de lazo abierto se
O

puede parametrizar mediante dos cantidades.


En la figura 3.6 vemos una traza de Nyquist de algún lazo abierto para un caso estable
(sin encierro al −1). Se ha trazado una circunferencia de radio 1 centrada en el origen,
C

que se corresponde a puntos con ganancia de lazo abierto unitaria, y se ha marcado


como A la intersección de esta con la traza polar de lazo abierto. Obviamente este
punto se corresponde con una frecuencia ωA para la cual el lazo abierto tiene ganancia
unitaria. El punto B es la intersección con el eje real negativo, y se corresponde con una
EN

frecuencia ωB para la cual el lazo abierto tiene fase −1800 .

Si el lazo abierto tuviese un atraso de fase adicional dado por el arco identificado como
M F , el lazo cerrado quedarı́a en el lı́mite de la inestabilidad (de hecho ya no tendrı́a
estabilidad asintótica). A este arco se lo denomina margen de fase.

versión (preliminar) 0.2 - pág.60


La inestabilidad de lazo cerrado también ocurrirı́a si en lugar del atraso de fase
se experimentase un incremento de ganancia de magnitud M G. Ese incremento se
denomina margen de ganancia.

3.2.5. Lectura Adicional


De [Oga10]:

7.3 - Diagramas polares

N
7.5 - Criterio de estabilidad de Nyquist
7.6 - Análisis de estabilidad
7.7 - Análisis de estabilidad relativa

IO
Conceptos Principales
formas de las gráficas polares para la respuesta en frecuencia
gráfica polar para funciones de transferencia con polos en el eje imaginario

C
teorema del encierro
planteo de Nyquist para evaluar estabilidad de lazo cerrado
resultado de transformar la ”trayectoria de Nyquistçon la función de transferencia

C
de lazo abierto
criterio de estabilidad de Nyquist
márgenes de estabilidad, y relación entre estos y la respuesta de lazo cerrado
RU
Respuesta en Frecuencia de Lazo Cerrado
3.3.1. Realimentación Unitaria
ST

Si la realimentación es unitaria (H(s) = 1), la transferencia entre entrada y salida a lazo


cerrado es:
L(s)
T (s) = (3.12)
1 + L(s)
N

Para el caso general con H(s) 6= 0 podrı́amos considerar:

L(s)
T (s) = H −1 (s) (3.13)
O

1 + L(s)

Esto se muestra en la figura 3.7. Los polos de lazo cerrado quedan definidos por el
término de la izquierda. El término H −1 (s) afecta puntualmente a la variable Y (s), y sus
C

propiedades son conocidas desde el inicio.


En cualquier caso se observa que considerar una realimentación unitaria no es restrictivo
para el análisis de la dinámica de un sistema realimentado. Por lo tanto vamos a
EN

considerar como caso genérico el descripto por la ecuación (3.12).

3.3.2. Ganancia de Lazo Cerrado


Para evaluar la ganancia de lazo cerrado tenemos que computar:

|L(jω)|
|T (jω)| = (3.14)
|1 + L(jω)|

versión (preliminar) 0.2 - pág.61


Figura 3.7: Replanteo del lazo estándar a uno con realimentación unitaria

N
En la siguiente figura 3.8 podemos identificar numerador de la expresión precedente
(longitud del vector azul) y el denominador (longitud del vector verde, que surge de sumar
el rojo con el azul)

IO
Es evidente que en aquellos valores de ω para los cuales Re {L(jω)} = 0,5 la ganancia
del lazo cerrado definida por la ecuación 3.12 será M = |T (jω)| = 1.
Podrı́amos decir que independientemente de la dinámica de lazo abierto considerada, la

C
recta Re {L(jω)} = 0,5 es una curva de ganancia de lazo cerrado M = 1.

Podemos computar como son las curvas para otros valores de M , y con eso hacer una

C
grilla de ganancias constantes de lazo cerrado. Separando parte real e imaginaria:

L(jω) = X(ω) + j(Y ω)


RU
Entonces

|X + jY | X2 + Y 2
M= → M2 =
|1 + X + jY | (1 + X)2 + Y 2
ST

Por lo tanto:

M 2 (1 + 2X + X 2 ) + M 2 Y 2 = X 2 + Y 2

X2 1 − M 2 − 2M 2 X − M 2 + 1 − M 2 Y 2 = 0
 

M2 M2
N

X2 + 2 2
X+ 2 +Y2 =0
M −1 M −1
O
C
EN

Figura 3.8: Interpretación gráfica de los términos de la ecuación (??)

versión (preliminar) 0.2 - pág.62


N
IO
C
(a) curvas de ganancia constante de lazo cerrado (b) curvas de fase constante de lazo cerrado

Figura 3.9: Grillas para la determinación de la respuesta en frecuencia de lazo cerrado a partir de la traza de nyquist del lazo
abierto (tomado de [Oga98])

C
Finalmente:
RU 2
M2 M2

X+ +Y2 = 2
M2 − 1 (M 2 − 1)
Esta es la ecuación de una circunferencia con centro en {C, 0} siendo C = M 2 /(1−M 2 )
y de radio R = |C|/M . El resultado se muestra en la figura 3.9a para diferentes valores
de M .
ST

De forma análoga se puede evaluar el lugar geométrico para el atraso de fase del lazo
cerrado (ver figura 3.9b). El desarrollo detallado puede verse en [Oga98, sec.7-8, p. 477].
N

Pico resonante de lazo cerrado En la figura 3.9a se puede ver que todas las curvas
M a la izquierda de M = 1 (parte real < −0,5) corresponden a ganancias de lazo
cerrado mayores a 1 (0db).
O

Si el lazo abierto se aproxima al punto −1, el lazo cerrado tendrá picos resonantes de
alta ganancia.
Dado que un lazo abierto con buenos márgenes de fase y ganancia implica un buen
C

alejamiento de dicho punto, márgenes de fase y ganancia de al menos 600 y 6db


respectivamente se tendrá un lazo cerrado sin picos resonantes M ≤ 1.

Esto se puede explicar de otra forma. Viendo la ecuación (3.14) podemos notar que:
EN

|L(jω)|
|T (jω)| = = |L(jω)||S(jω)|
|1 + L(jω)|

Por lo tanto se tendrán ganancias |T (jω)| > 1 en aquellas frecuencias para las cuales
|L(jω)| > |S(jω)|−1 . Notando que:

|S(jω)|−1 = |1 + L(jω)|

versión (preliminar) 0.2 - pág.63


podemos decir que las ganancias positivas se dan cuando el módulo del vector verde en
la figura 3.8 es menor al del azul; y esto ocurre en aquellas frecuencias para las cuales
la traza de lazo abierto L(jω) se acerca al punto −1 del plano complejo.

Consideremos como ejemplo un servomecanismo para la posición de una superficie de


control aerodinámico de una aeronave compuesto por un motor eléctrico de corriente
continua y un sistema de transmisión mecánica. Asumiendo que la mecánica es lo
suficientemente rı́gida se llega a un modelo de la forma:

N
Y (s) km
G(s) = = 2
U (s) s (s + q)

IO
donde y representa la posición de la superficie, u es el voltaje de alimentación del motor,
km es una constante que depende de parámetros eléctricos y mecánicos y q el ”polo
eléctrico”.
Con un control PD el lazo abierto resulta:

C
kc (s + z) km
L(s) =
(s + p) s2 (s + q)

C
En la siguiente figura mostramos las funciones de sensibilidad del lazo cerrado a la
izquierda (en escala semi-logarı́tmica, con ganancias en valor absoluto) y el diagrama
RU
de Nyquist de lazo abierto a la derecha para dos ajustes del control PD (lineas gruesa y
finas).
Se observa en el diagrama de Nyquist que con el segundo ajuste (trazo fino) el lazo
abierto se aproxima más al −1, disminuyendo el margen de fase. En consecuencia se
observa en la respuesta en frecuencia de lazo cerrado mayores picos de sensibilidad y
sensibilidad complementaria.
ST
N
O
C
EN

En la siguiente figura se puede observar la relación entre un mayor pico en las funciones
de sensibilidad con el amortiguamiento de las respuestas transitorias.

versión (preliminar) 0.2 - pág.64


N
IO
Frecuencia de Cruce de Lazo Abierto y Ancho de Banda de Lazo Cerrado

C
Del lazo cerrado en general esperamos T (0) = 1 (0 db) y S(0) = 0. Esto equivale a un
control perfecto para referencias o perturbaciones lentas.

C
La función T (jω) se corresponde con un filtro pasa bajos, y como |T (0)| ≈ 0db,
√ se corresponde con la frecuencia ωbw para la cual
por definición el ancho de banda
|T (jωbw )| − |T (0)| = −3db (1/ 2 en valor absoluto).
RU
De forma complementaria, la función T (jω) se corresponde con un filtro pasa altos, y
como |S(j∞)| ≈ 0db, por definición la frecuencia de paso se corresponde con el valor
ωps para la cual |S(jωps )| − |S(j∞)| = −3db.

Llamaremos frecuencia de cruce del lazo abierto a la frecuencia ωc en donde |L(jωc )| =


0db. Es en esta frecuencia en donde la raza de Nyquist de lazo abierto corta el cı́rculo
ST

unitario, y por lo tanto define el margen de fase.

Si asumimos que se ha realizado un buen diseño de control podemos suponer un margen


de fase del orden de 600 . Esto implica que el atraso de fase del lazo abierto en la
frecuencia de cruce es ∠L(jωc ) ≈ 1200 . Por lo tanto:
N

L(jωc ) ≈ 1 · e−j2,1 → |T (jωc )| ≈ 1 = 0db , |S(jωc )| ≈ 1 = 0db


Para T (jω) una ganancia −3db se alcanzará a una frecuencia algo mayor, mientras que
O

para S(jω) se dará a una frecuencia algo menor (dependiendo del margen de fase).
Por lo tanto podemos decir que:
ωps < ωc < ωbw (3.15)
C

Dado que esto es fácil de ajustar con un ajuste en la ganancia de lazo abierto, alterando
la frecuencia de cruce podemos ajustar (al menos en orden de magnitud) el ancho de
banda de T (jω) y la frecuencia de paso de S(jω).
EN

En la siguiente figura vemos para el ejemplo precedente las funciones de sensibilidad


de lazo cerrado T (jω) y S(jω) junto con la correspondiente respuesta en frecuencia de
lazo abierto L(jω)
Se han marcado las frecuencias de paso de S(jω), la de cruce de L(jω) y la de corte
de T (jω); verificándose las desigualdades (3.15).

versión (preliminar) 0.2 - pág.65


N
IO
C
C
3.3.3. Lectura Adicional
RU
De [Oga10]:

7.8 - Respuesta en frecuencia de lazo cerrado para sistemas con realimentación


unitaria

Conceptos Principales
ST

relación entre los márgenes de estabilidad y la respuesta de lazo cerrado


curvas M y N en el diagrama de Nyquist de lazo abierto
ventajas respecto de lo anterior de usar la carta de Nichols
determinación de ancho de banda y pico resonante de lazo cerrado a partir de la
respuesta en frecuencia de lazo abierto
N

identificación de los márgenes de estabilidad en la carta de Nichols

3.3.4. Revisita de la Función de Sensibilidad


O

Podemos calcular una función que describa la variación “relativa” en la dinámica de


lazo cerrado ∂T (s)/T (s) ante una variación “relativa” en la dinámica de lazo abierto
C

∂L(s)/L(s). Derivando (3.12) (usando L(s) en lugar de G(s)) con la regla de la cadena:
∂T (s)/T (s) ∂T (s) L(s) ∂T (s)
S(s) = = = [1 + L(s)]
∂L(s)/L(s) ∂L(s) T (s) ∂L(s)
EN

Derivando con la regla de la cadena:


( )
1 L(s)
S(s) = − [1 + L(s)]
1 + L(s) [1 + L(s)]2
1 + L(s) − L(s) 1
= 2
[1 + L(s)] 1 + L(s)

versión (preliminar) 0.2 - pág.66


de lo cual:
1
S(s) = (3.16)
1 + L(s)
Esta es la misma función de sensibilidad (2.4) definida antes como respuesta del
error a un cambio en la referencia, o respuesta de la salida de lazo cerrado ante una
perturbación de salida.
Ya hemos visto que:
S(s) = 1 − T (s)

N
Si consideramos s = jω , la expresión anterior indica que la dinámica de lazo cerrado
será poco sensible a los cambios en el lazo abierto en el rango frecuencias en donde
T (jω) ≈ 1. Dado que hablamos de una cantidad compleja, esto implica |T (jω)| ≈ 1 y

IO
∠T (jω) ≈ 0.
Esto es ası́ en general hasta una frecuencia una década por debajo del ancho de banda
de lazo cerrado. Para frecuencias en el orden del ancho de banda la sensibilidad crece,
y para altas frecuencias |T (jω)| → 0 y por lo tanto |S(jω)| → 1.

C
Sin embargo, como un cambio porcentual de un valor pequeño es igualmente pequeño
(aunque sea de un 100 %), los cambios que tenga la planta respecto del modelo para
altas frecuencias no es relevante.

C
Concluimos preliminarmente que el lazo cerrado será sensible a cambios en la dinámica
L(s) si estás se manifiestan en frecuencias próximas al ancho de banda de lazo cerrado,
RU
mientras que lo que ocurra una década por encima o por debajo no será muy relevante.

Simplificación de Modelos
Una dinámica G1 (s) de primer orden con un polo p tiene para una frecuencia ω = p una
ganancia de −3db (para este caso p coincide con su ancho de banda) y un atraso de
fase −450 .
ST

Para una frecuencia una octava menor (ω = p/2) la ganancia se aproxima a 1 (0,9) y
el atraso de fase es significativo (≈ −260 ). Pero para una frecuencia una década menor
(ω = p/10) la ganancia es prácticamente 1 y el atraso de fase menor a −60 .
Por lo tanto podemos decir que G1 (jω) ≈ 1 si ω < p/10.
N

Para una dinámica de segundo orden se observa algo similar. En la figura 3.10 se
muestra la respuesta en frecuencia de un modelo de segundo orden prototipo con
amortiguamiento 0,7 y ancho de banda ωbw = 1s−1 (con este factor de amortiguamiento
O

el ancho de banda coincide con ωn ).


Para una frecuencia ωbw /2 (una octava menor al ancho de banda) la ganancia es casi 1
(0,97 → −0,23db), pero el atraso de fase es significativo −430 .
C

A frecuencia ωbw /10 (una década menor al ancho de banda) vemos que la ganancia es
prácticamente 1 (0db), mientras que el atraso de fase es pequeño (≈ −80 ).

En sı́ntesis podemos decir que en general G(jω) ≈ 1 si ω < ωbw /10. Por lo tanto para
EN

el diseño es posible eliminar la dinámica de alta frecuencia del modelo; entendiendo


esto como aquellos polos y ceros cuyas frecuencias sean una década mayor al rango de
frecuencias de interés. En el caso del diseño de un sistema de control, este rango es el
ancho de banda de lazo cerrado pretendido.

Por otra parte, para un sistema de control a lazo cerrado la función de sensibilidad es
pequeña en baja frecuencia.

versión (preliminar) 0.2 - pág.67


N
IO
C
C
RU
ST
N
O

Figura 3.10: Validez de la hipótesis de control perfecto para una dinámica dominante de segundo orden
C
EN

versión (preliminar) 0.2 - pág.68


N
IO
C
Figura 3.11: Parametrización de la respuesta transitoria

C
A partir de lo dicho en la sección precedente podemos decir que cambios en la dinámica
de lazo abierto para frecuencias pequeñas en relación a la frecuencia de paso de
la función de sensibilidad no tendrán un impacto significativo en la dinámica de lazo
RU
cerrado.
Pero un polos p introduce un atraso de fase de −900 para frecuencias ω > 10·p, mientras
que de forma similar un cero aporta un adelanto de 900 . Por lo tanto no podemos eliminar
polos y ceros de baja frecuencia de forma aislada, pero si lo podemos hacer en pares;
dado que los atrasos de fase se compensan.
ST

En sı́ntesis, un conjunto de igual cantidad de polos y ceros con frecuencias una década
por debajo de la frecuencia de cruce ωc tendrá un impacto poco significativo en la
dinámica de lazo cerrado, y por lo tanto podrı́an ser eliminados del modelo para el diseño.

Pico de Sensibilidad
N

En la figura 3.8 se puede notar que la distancia entre un punto de la traza de Nyquist
de lazo abierto y el punto −1 es la inversa de la función de sensibilidad S −1 (jω) (vector
verde).
O

Por lo tanto, la menor distancia entre estos elementos se dará en donde la función de
sensibilidad tenga un máximo, es decir, un pico de sensibilidad.
EL pico de sensibilidad es una medida de robustez mucho más efectiva que los
C

márgenes de ganancia y fase, ya que estos garantizan estabilidad de lazo cerrado


siempre y cuando variaciones de fase y ganancia de lazo abierto no se produzcan de
forma simultánea.
EN

Compensación
3.4.1. Compensación en el “Plano s”
Una vez resuelto el requerimiento de error en estado estacionario es necesario
garantizar no solo la estabilidad del lazo cerrado sino también aquellos asociados a su

versión (preliminar) 0.2 - pág.69


dinámica.

Una forma de definir requerimientos dinámicos es la establecer cotas para la


parametrización de la respuesta transitoria al escalón (figura 3.11).
La respuesta (ya sea el error de seguimiento o la salida) ante un cambio en la referencia
(o una perturbación) se puede obtener por superposición descomponiendo la función de
sensibilidad correspondiente en fracciones parciales (ver [Zum, sec.2.2.3, p. 53]).
Por ejemplo, para la salida ante un cambio en la referencia:

N
 
r1 r2 rn 1
Y (s) = T (s)R(s) = + + ··· +
s + p1 s + p2 s + pn s

IO
donde p1 , p2 , · · · , pn son los polos de lazo cerrado. Anti-transformando:
r1   r 
2
 rn  
y(t) = 1 − e−Re{p1 }t + 1 − e−Re{p2 }t + · · · + 1 − e−Re{pn }t
p1 p2 pn

C
En el caso de polos complejos conjugados agruparemos los términos de segundo cuyas
respuestas al escalón son de la forma:

C
h i
yj (t) = rj 1 − cj e−Re{pj }t · sin (Im {pj } t + φj )

Ver [Zum, sec.2.2.3, p. 56].


RU
El tiempo de establecimiento tss de cada término, es decir, lo que dura su transitorio;
depende solo de la parte real de los polos, ya que es esta la que regula la velocidad
de decaimiento de los términos exponenciales. Para cualquier término del desarrollo:
tss ≈ 4/Re {p}.
ST

El tiempo de establecimiento para la suma que define y(t) estará definida por la fracción
más lenta, lo cual se corresponde con los polos más cercanos al eje imaginario (menor
parte real).
Sin embargo debe tenerse en cuenta que si hay polos lentos pero estos está parcial-
mente cancelados por ceros de lazo cerrado, el residuo de la fracción correspondiente
N

es pequeño y su peso en la sumatoria podrı́a resultar poco significativo.

A modo de ejemplo consideremos tres casos:


O

2
T1 (s) =
s2 + 2s + 2
C

1,8(s + 0,1)
T2 (s) =
(s + 0,09)(s2 + 2s + 2)
0,18
T2 (s) =
(s + 0,09)(s2 + 2s + 2)
EN

Se observa que T2 equivale a T1 con un polo lento adicional cancelado parcialmente con
un cero, mientras que en T3 no hay tal cancelación.
En la siguiente figura vemos la ubicación de polos y ceros a la izquierda junto con la
respuesta al escalón a la derecha:

versión (preliminar) 0.2 - pág.70


N
IO
C
C
La respuesta dominante para T1 y T2 es la misma, y corresponde al término de
RU
segundo orden. Pero puede observarse claramente para T2 la respuesta del modo lento
superpuesta al término dominante.
En el caso de T3 no hay cancelación, y por lo tanto el polo dominante es el polo lento.

Una cota en el tiempo de establecimiento equivale a poner una restricción o zona de


ST

exclusión sobre el espacio complejo (región verde en la figura 3.12) para la ubicación de
polos de lazo cerrado.

La misma lógica puede plantearse con otras restricciones.


Los tiempos de crecimiento tc y retardo tr están directamente asociado a la distancia al
N

origen de los polos. Imponer una cota para este parámetro se traduce en una restricción
de distancia mı́nima al origen (zona roja).
O

Finalmente podemos considerar el sobrepaso Mp , que depende del amortiguamiento


de los polos subamortiguados; o una especificación directa sobre el amortiguamiento
mı́nimo requerido para estos polos.
C

Las curvas de amortiguamiento contante en el plano s son lı́neas radiales. Por lo tanto,
una restricción en el factor de amortiguamiento implicará una cota para el argumento de
los polos complejos (zona azul).
EN

En última instancia, asegurando el cumplimiento de las restricciones para los polos


dominantes de lazo cerrado se tendrı́a una respuesta transitoria aceptable. Los polos
dominantes son lo más cercanos al origen.
En el caso de cancelaciones sobre polos lentos debe tenerse presente que estas podrı́an
estar presentes en algunas sensibilidades pero no en todas; pero no necesariamente se
deben imponer los mismos requerimientos para todas ellas.

versión (preliminar) 0.2 - pág.71


N
IO
Figura 3.12: Mapeo de las especificaciones de respuesta transitoria a regiones admisibles para los polos de lazo cerrado

C
Compensación
Hemos dicho que en primer término es necesario decidir que se debe agregar en el
compensador K(s) para satisfacer los requerimientos de error en estado estacionario.

C
Luego, una vez definida la región admisible en el plano s para los polos de lazo cerrado
se deberán elegir “puntos de prueba” donde se pretende ubicar los polos dominantes de
lazo cerrado.
RU
Si estos puntos de prueba resultan ser finalmente polos de lazo cerrado, allı́ se deberán
cumplir las condiciones de módulo (3.2) y ángulo (3.3).
La primera se logra con un ajuste de ganancia, pero para lograr la segunda en general es
necesario “compensar” la dinámica de lazo abierto existente hasta este punto agregando
polos y ceros en lugares adecuados del plano s.
ST

Esto hará que los puntos de prueba pasen a formar parte del lugar de raı́ces, y por lo
tanto podrán ser polos de lazo cerrado con un simple ajuste de ganancia.

Ajuste de un Compensador en Adelanto


Un compensador en adelanto es una transferencia de la forma:
N

s+z
Kpi (s) = kc (3.17)
s+p
O

El cero z y el polo p se ajustan para cumplir la condición de ángulo en la ubicación


deseada para los polos dominantes de lazo cerrado, mientras que kc se define con la
condición de módulo en dicha posición.
C

En general se busca una respuesta de lazo cerrado un poco más rápida que la de lazo
abierto, dado que mientras la diferencia no sea excesiva este es un objetivo alcanzable
y a mayor velocidad de respuesta mejor capacidad de seguimiento de referencias y
EN

rechazo de perturbaciones.
En estas circunstancias en general en el punto de prueba la condición de ángulo con el
lazo abierto sin compensar arroja un valor menor a −π . Por lo tanto la compensación
debe aportar un ángulo positivo.
Esto se logra agregando ceros al lazo abierto (en el compensador). Sin embargo, un
compensador con más ceros que polos, es decir, con grado relativo negativo (función
racional impropia); no es fı́sicamente realizable. Y si lo fuera, la acción de control tendrı́a

versión (preliminar) 0.2 - pág.72


N
Figura 3.13: Ajuste de un compensador en adelanto mediante el método de la bisectriz (ver [Oga10, p. 315])

IO
una gran sensibilidad a ruidos de medición de alta frecuencia. Por lo tanto lo habitual es
también agregar un polo, pero más alejado del origen que el cero para que la contribución

C
neta sea positiva a la condición de ángulo sea positiva.

Un ejemplo de control impropio es el PD, que en principio se tratarı́a de un cero y una

C
ganancia:
K(s) = kp + Kd s = kc (s + z)
RU
Dado que la derivada pura no es fı́sicamente realizable, la implementación real es de la
forma:
s s+z
K(s) = kp + Kd = kc
Ts + 1 s+p
Llamamos a esto compensación en adelanto, por razones que expondremos al analizar
este compensador en el dominio de la frecuencia.
ST

Es fácil demostrar que el aporte φ a la condición de ángulo de un compensador es el


formado por los segmentos CP y DP en la figura 3.13, donde P es el punto de prueba
elegido para ubicar los polos dominantes de lazo cerrado.
Por lo tanto hay infinitas combinaciones entre un cero y un polo real que permiten un
N

mismo aporte a la condición de ángulo, en tanto el ángulo entre ambos segmentos sea
el mismo.
O

Una forma sistemática de ajustar la ubicación del polo y el cero para obtener un cierto
aporte φ es el llamado método de la bisectriz. El método se presenta de forma detallada
en [Oga10, p. 315] y ediciones precedentes.
C

A partir del punto de prueba P se traza la bisectriz P B del ángulo determinado entre OP
y P A. Luego a cada lazo de esta se proyectan dos rectas desde el punto P , obtenidas
agregando y sustrayendo a la bisectriz la mitad del ángulo φ (el déficit obtenido en
la condición de ángulo con el lazo abierto sin compensar). La intersección de estos
EN

segmentos con el eje real define la ubicación del polo y el cero del compensador.

La ventaja de este ajuste respecto de cualquier otro es que se obtiene la menor


distancia relativa entre el polo y el cero (p/z ) para un compensador en adelanto con
un determinado aporte φ a la condición de ángulo. Se verá más adelante que de esta
manera se minimiza ganancia del compensador en alta frecuencia.

versión (preliminar) 0.2 - pág.73


Si φ es un ángulo muy grande resulta conveniente poner polos y ceros múltiples que
aporten una parte del ángulo φ Por ejemplo podemos considerar un polos y ceros dobles
calculados para realizar cada uno la mitad del aporte.
Si e requiere un aporte mayor es posible que la ubicación seleccionada para los polos de
lazo cerrado sea demasiado exigente en función de la dinámica de lazo abierto, y serı́a
prudente revisar los requerimientos.

Compensación en Atraso
SI colocamos un polo p y un cero z cercanos al origen en relación a los polos dominantes

N
de lazo cerrado, su contribución a la condición de angulo será nula. Sin embargo, si
z < p, la ganancia para cumplir con la condición de módulo se incrementará en un factor
aproximado z/p.

IO
El caso lı́mite del compensador en atraso es el controlador PI.

Ajuste de un Lazo PI
Hemos dicho que la acción integral se introduce en el lazo para neutralizar perturbacio-

C
nes constantes. Combinada con una acción proporcional el compensador es:
1 s+z ki
Kpi (s) = kp + ki = kp , z= (3.18)

C
s s kp
En este caso la compensación es en atraso, dado que el polo (en el origen) siempre
está a la derecha del cero (efecto desestabilizante). Sin embargo, en casos en donde la
RU
condición de ángulo en el punto de prueba es mayor de −π esto serı́a suficiente.
En este caso solo es necesario ajustar z para cumplir con la condición de ángulo en
la ubicación deseada para los polos dominantes, y luego ajustar kp para verificar la
condición de módulo, con lo cual definimos los parámetros del controlador PI.
Si ajustando z no se logra cumplir la condición de ángulo, serı́a necesario agregar un
compensador en adelanto pasando a un control PID (o revisar los requerimientos).
ST

Dinámica no Dominante y Simplificación del Modelo de Planta


Al momento de diseñar el compensador planteamos la condición de ángulo en un punto
de prueba ubicado en la posición deseada para los polos de lazo cerrado. Tomando
como referencia la distancia del punto de prueba al origen podemos catalogar los polos
N

y ceros de lazo abierto entre aquellos próximos y los que se encuentran más lejos (a
distancias en el orden de 10 veces la de referencia.)
O

Podemos notar que los polos y ceros reales de lazo abierto que se encuentran lejos del
origen realizan un aporte pequeño a la condición de ángulo.
C

En el caso de polos y ceros complejos el aporte puede ser grande, pero si se encuentran
lejos del punto de prueba el aporte del par complejo conjugado se aproxima a 3600 , con
lo cual su efecto es nulo.

Y para aquellos polos que se encuentren próximos pero cancelados por ceros, el aporte
EN

neto es nulo.

En sı́ntesis podemos decir que se puede diseñar el compensador con un modelo


simplificado de la planta, eliminando los polos y ceros no dominantes, ya sean de alta
frecuencia (reales o complejos conjugados pero lejos del origen en relación a la distancia
al origen del punto de prueba), o por cancelación en el caso de polos y ceros próximos
entre sı́ (en relación a la misma distancia de referencia).

versión (preliminar) 0.2 - pág.74


Lectura Adicional
De [Oga10]:

6.5 - Diseño de sistemas de control mediante el método del lugar de las raı́ces
6.6 - Compensación de adelanto
6.7 - Compensación de retardo

3.4.2. Compensación en Frecuencia

N
En muchos problemas de control la respuesta transitoria al escalón no resulta apropiada
como forma de definir requerimientos.
Esto es generalmente ası́ en el caso de sistemas de control de vuelo, que son diseñados

IO
para seguir referencias continuamente variables (por ejemplo, los sistemas para control
de actitud) o para rechazar perturbaciones (sistemas de control de trayectoria).
Para esta clase de problemas es más significativo pensar en los anchos de banda de las
funciones de sensibilidad para definir velocidad de respuesta, imponiendo cotas para los

C
picos resonantes, asociados al amortiguamiento de los modos oscilatorios.
Esto no es contradictorio con la especificación de parámetros de respuesta transitoria,
ya que es posible establecer relaciones entre está y la respuesta en frecuencia.

C
Podemos plantear los requerimientos para la dinámica de lazo cerrado en términos del
ancho de banda (en realidad frecuencia de corte) de la sensibilidad complementaria
RU
T (s), y márgenes de fase y ganancia para lograr picos resonantes de lazo cerrado lo
suficientemente acotados.
Si la dinámica dominante de lazo cerrado puede caracterizarse por un par de polos
complejos conjugados; el ancho de banda de la sensibilidad complementaria se
relaciona directamente con la distancia al origen de los polos dominantes en el plano
ST

s, mientras que su pico resonante (y por lo tanto los márgenes de estabilidad relativa) se
conectan directamente con el factor de amortiguamiento de estos polos.
Si la dinámica dominante es sobre-amortiguada, el polo real que la caracteriza define el
ancho de banda y el margen de fase es del orden de los 900 .
N

Si la ganancia a frecuencia cero de la sensibilidad complementaria es T (0) = 1, su


ancho de banda quedará determinado por la frecuencia ωbw en donde |T (jωbw )| =
−3db.
O

En importante remarcar que el valor exacto de estos parámetros no es relevante, ya que


siempre trabajamos con “modelos” del proceso real.
C

En la sección 3.3.2 hemos visto que esta frecuencia se encuentra levemente por encima
del cruce ωc del lazo abierto (en el orden de una octava). Por lo tanto, ajustando la
frecuencia de cruce de lazo abierto podemos establecer el ancho de banda de T (jω).
Para cumplir las especificaciones de diseño restarı́a agregar un compensador para
EN

cumplir con los márgenes de fase y ganancia.


Podemos decir que en general lograr el margen de fase requerido implica también
cumplir con el de ganancia, excepto que la dinámica de lazo abierto en el entorno de
la frecuencia de cruce sea muy compleja. En tal caso deberı́a revisarse el requerimiento
de ancho de banda, y de ser posible, disminuirlo.

versión (preliminar) 0.2 - pág.75


Como procedimiento podemos definir la frecuencia de cruce, determinar el atraso de fase
del lazo abierto sin compensar y agregar un compensador en adelanto para alcanzar el
margen de fase requerido.

Ya hemos visto para la compensación en el plano s que un compensador en adelanto


está constituido por un polo p y un cero z con p > z :
s+z
K(s) = k
s+k

N
Por conveniencia re-escribimos esta expresión de la siguiente forma:
Ts + 1
K(s) = kc (3.19)

IO
αT s + 1
donde 0 < α < 1, resultando que z = 1/T , p = 1/αT y kc = k · z/p. La respuesta
en frecuencia del compensador tiene la siguiente forma (ejemplo tomado de [Oga10] en
donde α = 0,1):

C
C
RU
ST

Podemos ver que este compensador introduce un “adelanto de fase” cuyo valor máximo
resulta:
N

1−α
φm = sin−1 (3.20)
1+α
Claramente se observa que cuanto menor sea α, mayor será φm ; siendo el valor máximo
O

posible de 900 con α → 0. Este máximo adelanto de fase se produce a una frecuencia

ωm = α/T , que es el punto medio entre el polo y el cero del compensador en la escala
logarı́tmica de frecuencias.
C

Ajustando α podemos establecer el adelanto de fase máximo, y ajustando T podemos


fijar la frecuencia en donde esto se produce.
Logramos maximizar el margen de fase del lazo haciendo coincidir la frecuencia ωm con
EN

la frecuencia de cruce ωc establecida mediante el requerimiento de ancho de banda.


El valor de α resulta de calcular el adelanto de fase necesario para lograr el margen de
fase requerido.

En la gráfica precedente puede notarse que el compensador en adelanto tiene alta


ganancia en alta frecuencia. Este incremento de ganancia es tanto mayor cuando menor
es alpha.

versión (preliminar) 0.2 - pág.76


Si la compensación requerida es mayor de unos 600 , serı́a conveniente colocar dos
compensadores calculados para realizar la mitad del aporte total:
2
(T s + 1)
K(s) = kc 2
(αT s + 1)

La ganancia kc del compensador se ajusta para establecer la frecuencia de cruce del


lazo abierto compensado en el valor establecido al inicio.

N
Compensación en Atraso
Si colocamos un polo p y un cero z en baja frecuencia respecto del cruce de ganancia del
lazo abierto, si p < z podemos aumentar la ganancia de lazo abierto a baja frecuencia

IO
sin impactar significativamente en el margen de fase.
Como hemos mencionado para la compensación en el plano s, el caso lı́mite del
compensador en atraso es el controlador PI.

C
Lectura Adicional
De [Oga10]:

C
7.10 - Diseño de sistemas de control por el método de la respuesta en frecuencia
7.11 - Compensación de adelanto
RU
7.12 - Compensación de retardo

3.4.3. Ceros del Lazo Cerrado y Filtro de Referencia


Puede notarse que para un lazo cerrado con la siguiente estructura:
ST
N

los ceros de la transferencia entre entrada y salida son los ceros de G(s) y los polos de
H(s):
NG (s) NH (s)
O

G(s) = , H(s) = →
DG (s) DH (s)
C

NG (s)
Y (s) DG (s) NG (s)DH (s)
T (s) = = =
X(s) NG (s) NH (s) DG (s)DH (s) + NG (s)NH (s)
1+
DG (s) DH (s)
EN

Los ceros cercanos al origen tienden a aumentar el ancho de banda. También provocan
un aumento del sobrepaso en la respuesta al escalón, como se observa en la siguiente
figura. En esta se muestra la respuesta al escalón de una dinámica de segundo con un
cero a diferentes distancias del origen:

versión (preliminar) 0.2 - pág.77


N
IO
C
En el caso de un sistema de control, para la sensibilidad complementaria T (s) es posible
modificar estos efectos mediante un filtro de referencia Fr (s) como se muestra en la
siguiente figura:

C
RU
ST

Es evidente que:

Y (s) Y (s)
N

= Fr (s) = Fr (s)T (s)


R(s) R̄(s)

Podemos incluir polos en el filtro para cancelar los ceros de T (s) cercanos al origen y
O

evitar sobrepasos excesivos; aunque igualmente implicará una reducción en el ancho de


banda para el seguimiento de la referencia.
Pero debe notarse que el filtro no es parte del lazo cerrado, y por lo tanto no tiene ningún
C

efecto sobre las sensibilidades para las otras entradas del sistema.
EN

versión (preliminar) 0.2 - pág.78


N
4

IO
C
Control Moderno de Sistemas SISO

C
RU
ST
N
O
C
EN

79
Especificaciones de Diseño
4.1.1. Respuesta Transitoria
En la subsección 2.3.5 hemos visto que el desempeño en estado estacionario depende
solo de algunos aspectos de la dinámica de lazo abierto, sintetizado en el principio del
modelo interno.
Respecto de la respuesta de lazo cerrado, en la subsección 3.4.1 hemos planteado los
objetivos de la compensación en el plano s a partir de especificaciones de respuesta

N
transitoria al escalón; lo que se traduce en la ubicación deseada para los polos
dominantes de lazo cerrado. Esta es una aproximación razonable para aquellos casos
en los cuales las referencias y perturbaciones cambian solo ocasionalmente.

IO
Tiempos de Respuesta
Hemos considerado en la sección 3.4.1 tres parámetros temporales para la respuesta
transitoria:

C
tiempo de establecimiento
tiempo de crecimiento

C
tiempo de retardo

Los dos últimos cuantifican velocidad de respuesta (asociada al ancho de banda),


RU
mientras que el tiempo de establecimiento depende no solo de la velocidad sino también
del amortiguamiento de los polos dominantes y de la presencia de polos lentos no
dominantes.

Oscilación
ST

En general tendemos a considerar la oscilación de la respuesta como una figura de


calidad.
Algunos autores también proponen cotas para el sobrepaso como especificación de
respuesta transitoria; que sabemos está asociado al amortiguamiento, pero que también
depende de los ceros.
N

Además, el amortiguamiento está asociado a la robustez del lazo cerrado, y suele


tomarse como un parámetro para caracterizar el tipo de respuesta.
O

Se suelte considerar un factor de amortiguamiento superior a 0,7 como una respuesta


bien amortiguada, que en muchos casos es deseable; pero no necesariamente debe
considerarse un criterio universal.
C

Siegler y Nichols presentaron en 1942 [ZN42] un método de ajuste semi-empı́rico para


controladores PID, en donde postulan como objetivo una tasa de decaimiento de la
amplitud de la oscilación del 25 %, esto es, la amplitud de una oscilación debı́a ser un
25 % de la precedente. Esto claramente implica un factor de amortiguamiento mucho
EN

menor a 0,7.

versión (preliminar) 0.2 - pág.80


N
Una forma directa de cuantificar la oscilación de la respuesta al escalón independien-

IO
temente de los modos naturales del lazo cerrado es la variación total, que equivale a
la suma de las amplitudes de todas las oscilaciones de la respuesta transitoria [SP01,
p. 29]:

X

C
TV = vk (4.1)
k=0

C
RU
ST

La relación entre la variación total y la amplitud final se denomina exceso de variación,


que deberı́a ser lo más próxima a 1 posible.
Por otra parte, si planteamos el exceso de variación para la acción de control podrı́amos
N

tener una forma de cuantificar la “eficiencia” del diseño en relación al esfuerzo de control.

Indices de Desempeño
O

Otra forma de evaluar la “calidad” de la respuesta transitoria de forma “cuantitativa” es


mediante el uso de ı́ndices de desempeño.
En matemáticas un ı́ndice de desempeño es una cantidad escalar que califica la solución
C

a un determinado problema. Por conveniencia en general los ı́ndices de desempeño


lo son en realidad de mal desempeño o demérito, y deben ser cantidades positivas
definidas. Lo deseable es que el ı́ndice sea lo mas chico posible.
EN

Para el diseño de sistemas de control considerando la respuesta transitoria se definen


ı́ndices de desempeño para el error en la respuesta al escalón.
Un ı́ndice de este tipo es el definido por la integral del error cuadrático o ISE (Integral of
Squared Error ):
Z T
ISE = e2 (t)dt (4.2)
0

versión (preliminar) 0.2 - pág.81


Un ı́ndice similar se obtiene de la integral del valor absoluto del error :
Z T
IAE = |e(t)|dt (4.3)
0

En relación al IAE, el ISE penaliza más aquellas soluciones con excursiones mayores
del error (por ejemplo, los sobrepasos).
Dado que el error inicial al escalón es 1 para t = 0 cualquiera sea la respuesta, serı́a
lógico darle más peso en el ı́ndice al error tardı́o (cuando el tiempo crece). Con esta

N
consideración se define el ı́ndice ITAE: integral del tiempo por el valor absoluto del error :
Z T
IT AE = t|e(t)|dt (4.4)

IO
0

Respuestas Optimas
Al momento de decidir especificaciones de diseño se combinan distintos requerimientos

C
de acuerdo al problema particular abordado, pero en muchas ocasiones quedan
aspectos sin definir de forma explı́cita.
Puede plantearse como objetivo la idea de buscar el mejor “resultado posible”, que

C
identificamos como “solución óptima”.

El adjetivo “óptimo” implica algo ası́ como “insuperable”, lo que es muy difı́cil de plantear
RU
en cualquier caso real.
El concepto de “solución óptima” solo tiene sentido en planteos matemáticos muy
concretos, y solo en relación a un ı́ndice de desempeño en particular.
Para afirmar que una solución es óptima debemos demostrar de forma rigurosa que con
esta se obtiene el mı́nimo posible para el ı́ndice de desempeño elegido. Y debe notarse
que si se cambia el ı́ndice de desempeño, la solución óptima podrı́a dejar de serlo para
ST

el nuevo ı́ndice.

A modo de ejemplos podemos citar dos casos clásicos:


N

la curva que minimiza la distancia entre dos puntos en un espacio euclidiano es


la recta que pasa por ellos
la superficie que minimiza el área para contener un determinado volumen es la
O

esfera

En el primer caso la solución es una determinada curva, y el ı́ndice es la distancia


C

euclidiana. En el segundo caso la solución es una superficie, y el ı́ndice es el área.


Pero en ambos casos hay una restricción, en el primero la obligatoriedad de pasar por
dos puntos determinados y en la segunda la de contener un determinado volumen.
EN

Para una dinámica de segundo orden con tiempo normalizado t̂ = ωn t (lo cual define de
forma implı́cita una restricción), el óptimo ITAE es el caso con factor de amortiguamiento
0,7.
Diferentes trabajos han computado funciones de lazo cerrado sin ceros de diferente
orden que serı́an óptimas para el ı́ndice ITAE (aunque hay cierta controversia sobre
esos resultados). Los polinomios denominadores para las respuestas óptimas ITAE son
los siguientes:

versión (preliminar) 0.2 - pág.82


s + ωn
s2 + 1,4ωn s + ωn2
s3 + 1,75ωn s2 + 2,15ωn2 s + ωn3
s4 + 2,1ωn s3 + 3,4ωn2 s2 + 2,7ωn3 s + ωn4
s5 + 2,8ωn s4 + 5,0ωn2 s3 + 5,5ωn3 s2 + 3,4ωn4 s + ωn5

N
s6 + 3,25ωn s5 + 6,60ωn2 s4 + 8,60ωn3 s3 + 7,45ωn4 s2 + 3,95ωn5 s + ωn6

Es importante notar que el hecho de ser óptimo para un determinado ı́ndice de

IO
desempeño puede ser algo relevante o no en un determinado caso concreto. EN el caso
ITAE, las respuestas de orden elevado resultan bastante oscilatorias.

4.1.2. Respuesta en Frecuencia

C
Para la compensación en frecuencia planteada en la subsección 3.4.2 los objetivos se
establecieron en términos de ancho de banda y pico resonante de lazo cerrado, lo cual
nos conduce a la elección de una frecuencia de cruce de ganancia para el lazo abierto y

C
cotas inferiores para margenes de estabilidad relativa, especialmente el de fase.
RU
El análisis en frecuencia es más razonable para referencias o perturbaciones inciertas,
y permite considerar de forma más directa los compromisos en el diseño. Podemos
plantear los requerimientos estableciendo una cota inferior para el “nivel de rechazo”
(del error a las referencias y las perturbaciones).

Cuantificar este “nivel” de rechazo, o la “magnitud” de cualquier otro elemento


ST

matemático, exige elegir una cierta norma para definir a que nos referimos al hablar
de magnitud.
Por ejemplo, para un número complejo podemos usar el módulo como medida de
magnitud. Habitualmente extendemos esto a cualquier vector de dimensión finita n, que
calculamos tomando la raı́z cuadrada del producto escalar de este por si mismo.
N

En el caso de señales (d(t), y(t), etc.) tenemos que cuantificar la “magnitud” de


funciones continuas, que como veremos se realiza con el mismo criterio que en el caso
de vectores de dimensión finita.
O

Normas Vectoriales
Cualquier operador || · || que arroje como resultado una cantidad escalar puede ser
C

utilizado como una norma si posee las siguientes caracterı́sticas:

el resultado es no negativo: || · || ≥ 0
es un operador positivo: ||x|| = 0 ⇐⇒ x = 0
EN

es homogéneo: ||αx|| = α||x||


verifica la desigualdad triangular: ||x1 + x2 || ≤ ||x1 || + ||x1 ||

en donde x es un elemento del espacio vectorial sobre el que opera (ver [SP01, apéndice
A.5, p. 526]).

versión (preliminar) 0.2 - pág.83


Para vectores en Rn podemos construir diferentes normas mediante la expresión:

n
!1/p
X
kxkp , |xk |p (4.5)
k=1

La norma 2 se corresponde con la norma euclı́dea (módulo del vector), mientras que la
norma ∞ se corresponde con la componente de mayor valor absoluto (valor máximo).

Para funciones continuas la sumatoria se convierte en integral:

N
Z ∞ 1/p
p
kx(t)kp , |x(τ )| dτ (4.6)

IO
−∞

La norma 2 para este caso es la raı́z cuadrada de la energı́a, mientras que la norma ∞
es el pico de su valor absoluto.
Para señales con energı́a no acotada no es posible calcular la norma 2, pero podemos

C
considerar su potencia:
s Z T
1

C
kx(t)kpwr , lı́m |x(τ )|2 dτ (4.7)
T →∞ 2T −T
RU
Estrictamente hablando esta es una semi-norma, por no cumplir todas las propiedades
para de las normas (ver [SP01, apéndice A.5.6, p. 536]).

Teorema de Parseval Según este teorema, si Y (ω) es la transformada de Fourier de


y(t) se verifica que:
ST

Z ∞ Z ∞ Z ∞
2 1 2
y 2 (t)dt = |Y (f )| df = |Y (ω)| dω (4.8)
−∞ −∞ 2π −∞

donde ω es frecuencia angular y f = ω/2π .


Dado que la trasnformada de Fourier equivale a la de Laplace con s = jω , incluyendo
N


el término 1/ 2π para la definición de la norma cuadrática en frecuencia (angular)
podemos decir que:
ky(t)k2 = kY (jω)k2 (4.9)
O

Este es uno de los aspectos de la dualidad entre el análisis temporal y el frecuencial.


C

Supongamos que y(t) = e−at ∀ t ≥ 0, y que y(t) = 0 ∀ t < 0. La norma cuadrática


resulta:
sZ sZ
∞ ∞
EN

2
ky(t)k2 = |e−at | dt = e−2at dt
0 0
s ∞ r
1 −2at 1
= e = 2a
2a 0

versión (preliminar) 0.2 - pág.84


Si tomamos la transformada de Fourier y calculamos la norma cuadrática deberı́amos
llegar al mismo resultado:
s s
∞ 1 2 ∞
Z Z
1 1 1
kY (ω)k2 = dω = dω
2π −∞
jω + a 2π −∞ ω2 + a2
s ∞ r
1 ω 1
= tan−1 =
2πa a −∞ 2a

N
lo cual confirma lo expresado por el teorema de Parseval.

IO
Escalado y Normalización
Vamos a considerar en lo sucesivo que en el modelo G(s) tanto la entrada como la salida
han sido normalizadas de la forma:

C
G(s) = e−1
tol Ḡ(s)umax

C
donde etol es la tolerancia para el error de seguimiento, umax es el valor máximo de la
acción de control y Ḡ(s) la transferencia considerando unidades de ingenierı́a.
De esta forma los rangos para la acción de control y la salida estarı́an normalizados al
RU
rango operativo. En otras palabras, en condiciones normales |y| y |u| estarán en el rango
(−1 : 1).

Para el análisis es recomendable realizar esto con todas las entradas y salidas de interés
en el lazo.
ST

El concepto de escalado aquı́ planteado puede profundizarse en [SP01, sec.1.4, p. 5].

Control Perfecto
En la subsección 2.2.1 se introdujo el concepto de control perfecto, que podrı́amos
sintentizar como “rechazo exacto de perturbaciones”: S(s) = 0 (T (s) = 1), lo cual hemos
N

dicho no es fı́sicamente realizable.


El objetivo principal del diseño es entonces logar T (s) ≈ 1 y S(s) ≈ 0 en un cierto “rango
de frecuencias de interés” para la aplicación [0 : ω1 ), aunque en ocasiones simplemente
O

tratamos de lograr el mayor rango posible.

Siendo T (s) un filtro pasa-bajos, podemos caracterizarlo con su frecuencia de corte ωbw
C

(que coincide con su ancho de banda), y como S(s) + T (s) = 1, la sensibilidad S(s) es
pasa-altos caracterizada por una cierta frecuencia de paso ωps .
En el apartado 3.3.2 se mostró que ωps < ωc < ωbw , donde ωc el la frecuencia de cruce
de ganancia del lazo abierto: |K(jωc )G(jωc )| = 1.
EN

Es claro que estos objetivos se cumplen en tanto |K(s)G(s)|  1, y esto se logra si


ω1 < ωps < ωc < ωbw .
Ampliar el rango ω1 a un valor ω1 + δω implica incrementar la frecuencia de cruce ωc , y
esto solo puede llevarse a cabo aumentando la ganancia del compensador al menos en
el rango [ωc : ωc + δω]; lo cual introduce varios conflictos en el diseño que veremos más
adelante.

versión (preliminar) 0.2 - pág.85


Especificaciones para la Sensibilidad Complementaria
La sensibilidad complementaria T (s) define el seguimiento de referencias.
Algunos métodos de sı́ntesis (ver 4.4.2) permiten especificar la sensibilidad complemen-
taria como objetivo de diseño.
Existen dos prototipos usados frecuentemente por sus caracterı́sticas de respuesta en
frecuencia: el filtro de Butterworth y el filtro de Bessel (denominado ası́ por la estructura
del polinomio denominador).

El filtro de Butterworth se caracteriza por tener para un determinado orden la respuesta

N
en frecuencia más plana posible en la banda de paso y la mayor pendiente en la banda
de corte, como se observa a la izquierda en la figura 4.1. Se podrı́a decir que como filtro,

IO
a los efectos de absorber la energı́a de la señal de entrada en la banda de corte es ideal;
e introduce la mı́nima distorsión posible en la distribución espectral de energı́a dentro de
la banda de paso.

El filtro de Bessel en cambio se caracteriza por tener la un atraso de fase lineal en la

C
banda de paso. Esto significa que el atraso traducido a tiempo de retardo es el mismo
para todas las armónicas en la banda de paso, y con ello la distorsión en la forma
temporal de la señal es mı́nima.

C
En el lado derecho de la figura 4.1 se observa que la respuesta transitoria del filtro
de butterworth es algo oscilatoria, mientras que la del filtro de Bessel es mucho más
RU
parecida a la forma de la entrada (un escalón).

Puede observarse que en el caso de Butterworth los polos tienen una distribución circular
(la distancia al origen para todos los polos es la misma), mientras que en el caso de
Bessel la distribución es elı́ptica.
ST

Especificaciones para la Sensibilidad


Para cuantificar la capacidad de seguimiento de referencias podemos evaluar la norma
del error para un cierto valor de la norma de la referencia. De acuerdo al Teorema de
Parseval podemos decir que ke(t)k2 = kE(jω)k2 (uno de los aspectos de la dualidad
entre el análisis temporal y el frecuencial). Por lo tanto:
N

ke(t)k2 = kE(jω)k2 = kS(jω)R(jω)k2


O

En el caso de referencias inciertas (aleatorias) realizamos el análisis directamente en


frecuencia pero considerando la potencia de las señales (o nivel rms).
La misma expresión surge al considerar los efectos de una perturbación de salida do (t)
C

sobre la salida y(t), con lo cual los planteos para seguimiento de referencias y rechazo
de perturbaciones son equivalentes.
Desde el punto de vista del error, la referencia puede considerarse como una
perturbación que debe ser rechazada.
EN

Como las entradas tienen una cierta distribución espectral W̄ (jω), lo razonable serı́a
usar esta distribución como “función de peso” al evaluar la capacidad de rechazo
requerida a lo largo del espectro de frecuencias:

|S(jω)||W̄ (jω)| < 1/f

versión (preliminar) 0.2 - pág.86


N
IO
C
C
RU
Figura 4.1: Respuesta en frecuencia y transitoria al escalón de filtros de los filtros de Butterworth y Bessel de orden 4

Podemos normalizar el factor de rechazo f absorbiendo su magnitud en la función de


ST

peso (lo cual equivale a normalizar la perturbación equivalente), y establecer como


requerimiento:
|S0 (jω)||WS (jω)| < 1 (4.10)

Podemos replantear la ecuación (4.10):


N

|S0 (jω)| < |WS (jω)|−1 (4.11)

y analizarla en el diagrama de bode de la sensibilidad nominal como se observa en la


O

figura 4.2.

Para seguimiento de referencias WS se obtendrı́a de la distribución espectral de


C

la referencia (raı́z de su PSD). Para rechazo de perturbaciones debemos combinar


la distribución espectral de la perturbación con la sensibilidad de la salida a esta
entrada, para obtener la distribución espectral de la perturbación equivalente de salida
correspondiente. En ambos casos se puede dividir el resultado por algún factor de
EN

rechazo deseado.

Lectura Adicional
De [SP01]:

5.10 - Pefomance requeirements imposed by disturbances and commands

versión (preliminar) 0.2 - pág.87


N
IO
Figura 4.2: Análisis de desempeño en relación a la sensibilidad

C
Restricciones en el Diseño

C
En el capı́tulo precedente hemos visto las formas clásicas para la sı́ntesis de un
compensador SISO. En este capı́tulo veremos algunas alternativas, pero en todos los
RU
casos el proceso de sı́ntesis requiere de la definición de especificaciones de diseño, las
cuales de una u otra manera imponen una cierta velocidad de respuesta o ancho de
banda para el lazo cerrado.
Al momento de determinar esta caracterı́stica es necesario analizar las limitaciones en
el diseño que impone la dinámica del proceso a controlar; algunas de las cuales tienen
que ver con la instrumentación (sensores y actuadores) pero otras son estructurales.
ST

4.2.1. Limitaciones Asociadas a la Instrumentación


Actuación Máxima
N

Supongamos que ωg es la frecuencia de cruce de ganancia de la planta, |G(jωg )| = 1.


Podemos decir que en general se cumple que |T (jωg )| ≈ 1 y |S(jωg )| ≈ 1. La
aproximación al control perfecto se obtiene hasta frecuencias ω1 < ωg /10
O

Para lograr ω1 > ωg será necesario que en el rango (ω1 : ωc ) el compensador tenga alta
ganancia: |K(jω)|  1.
Esto significa que las acciones de control serán grandes ante perturbaciones equiva-
C

lentes de salida o cambios en la referencia con frecuencias mayores a la frecuencia de


corte. Si estas fueran significativas, las acciones de control alcanzarı́an rápidamente sus
valores máximos (saturación).
Por lo tanto el nivel de actuación máximo impone un lı́mite superior para el ancho de
EN

banda alcanzable, aunque debemos aclarar que no se trata de un lı́mite exacto sino más
bien un orden de magnitud.

Ruidos de Medición
La sensibilidad del control al ruido de medición es:
U (s) K(s)
Su (s) = = = K(s)S(s)
N (s) 1 + K(s)G(s)

versión (preliminar) 0.2 - pág.88


N
Figura 4.3: Lazo de control general

IO
Lograr una ganancia elevada en el control para frecuencias altas implicarı́a una
amplificación del ruido de medición en ese rango de frecuencia, lo cual normalmente
se traduce en un alto nivel de ruido en la acción de control; llegando en ocasiones a

C
responder al ruido de medición con buena parte del rango de actuación.
Por lo tanto el ruido de medición en alta frecuencia impone también un lı́mite superior
para el ancho de banda alcanzable.

C
4.2.2. Restricciones Estructurales
RU
Estabilidad Interna
Cuando hablamos del lazo cerrado solemos pensar en la función de transferencia entre
referencia y salida T (s). Pero debe tenerse en cuenta que en el lazo cerrado hay varias
entradas, siendo la referencia solo una de ellas.
Debemos considerar perturbaciones y ruido de medición, y analizar también las
ST

exigencias del diseño sobre las acciones de control (pensando también a u(t) como
una salida de interés).
En la subsección 2.3.2 se han definido las sensibilidades del lazo SISO estándar, cuya
estructura repetimos en la figura 4.3.
N

En particular debe tenerse en cuenta que la estabilidad de lazo cerrado no implica solo
la ausencia de polos en el semiplano derecho en T (s) y S(s).
Podrı́an existir modos inestables de lazo cerrado no ser visibles en estas sensibilidades.
O

El diseño debe garantizar que el lazo cerrado sea internamente estable (ver [GGS01,
def.5.1, p. 125]).
C

Diremos que el lazo SISO es internamente estable si las sensibilidades básicas S(s),
Si (s) = S(s)G(s) y Su (s) = S(s)K(s) son todas funciones de transferencia estables.
Este concepto se torna particularmente importante la plantear un control por inversión
para sistemas de fase no mı́nima.
EN

Sistemas de Fase No Mı́nima Los sistemas de fase no-mı́nima son aquellos que
tienen polos y/o ceros en el semiplano-derecho.
La designación surge por el hecho de que en su respuesta en frecuencia la gráfica de
ganancia coincide con la del sistema equivalente con todos sus polos y ceros en el
semiplano izquierdo, pero el atraso de fase es mucho mayor al de este último. En la
figura 4.4 se ilustra esto con un ejemplo.

versión (preliminar) 0.2 - pág.89


Esto incluye también a los sistemas con retardo de transporte D(s) = e−τ s , ya que para
el retardo se tiene que |D(jω)| = 1 (equivale a una constante unitaria) pero el atraso de
fase es ∠D(jω) = e−jωτ .

Cancelaciones en el Semiplano Derecho Para dinámicas complejas pareciera


razonable colocar ceros en el compensador para eliminar los polos de la planta más
cercanos al origen, y colocar igual cantidad de polos en el compensador más a la
izquierda para llevar los polos de lazo cerrado a las regiones deseadas del plano s
manteniendo el compensador bipropio.

N
Lo que estamos planteando al hacer esto es que parte del control “invierta” una parte de
la dinámica de la planta.

IO
Si bien este es un recurso viable, debe usarse con precaución al trabajar con plantas de
fase no mı́nima.
Supongamos que p sea un polo de la planta y un cero del control; es decir G(p) = ∞
y K(p) = 0. Entonces podemos escribir las funciones de transferencia de la planta y el

C
compensador de la siguiente forma:

1 B(s) P̄ (s)

C
G(p) = , K(p) = (s − p)
s − p Ā(s) L(s)

La función de sensibilidad para el lazo cerrado resulta:


RU
1 L(s)Ā(s)
S(s) = =
P̄ (s) 1 B(s) L(s)Ā + P̄ (s)B(s)
1 + (s − p)
L(s) (s − p) Ā(s)
ST
N
O
C
EN

s + 0,8 −s + 0,8
Figura 4.4: Polos-ceros y respuesta en frecuencia para G1 (s) = 7,5 (azul) y G2 (s) = 7,5 (rojo)
(s + 2)(s + 3) (s + 2)(s + 3)

versión (preliminar) 0.2 - pág.90


mientras que su sensibilidad complementaria será:

P̄ (s) 1 B(s)
(s − p)
L(s) (s − p) Ā(s) P (s)B(s)
T (s) = =
P̄ (s) 1 B(s) L(s)Ā + P̄ (s)B(s)
1 + (s − p)
L(s) (s − p) Ā(s)

Vemos que el polo cancelado no impacta ni en S(s) ni en T (s).


Pero el polinomio de lazo cerrado resulta:

N
(s − p)P̄ (s)B(s) + L(s)(s − p)Ā(s) = 0

IO
o bien:  
(s − p) P̄ (s)B(s) + L(s)Ā(s) = 0
Aunque en las funciones de sensibilidad S(s) y T (s) este polo no sea visible, el lazo
cerrado tendrá un polo en p.

C
Por lo tanto la estrategia de control con cancelación es válida en tanto p sea un polo
estable para eliminarlo de S(s) y T (s), pero no desaparece del lazo cerrado. Por ejemplo:

C
Y (s) B(s)
Si (s) = = G(s)S(s) =  
Di (s) (s − p) L(s)Ā + P̄ (s)B(s)
RU
Si p es un polo inestable (p > 0), la cancelación no es válida porque el lazo cerrado
no serı́a internamente estable. Por lo tanto podemos afirmar que si el lazo cerrado es
estable, no puede haber cancelaciones entre polos y ceros en el semiplano derecho.

Restricciones entre S(s) y T(s)


ST

Las sensibilidades principales del lazo son:

1
S(s) =
1 + K(s)G(s)

y la sensibilidad complementaria es:


N

Y (s) K(s)G(s)
T (s) = =
R(s) 1 + K(s)G(s)
O

Ya hemos destacado en la sección 2.3.2 la restricción fundamental entre estas funciones


a través de la ecuación (2.5):
C

S(s) + T (s) = 1

Esto se cumple independientemente de la dinámica de lazo abierto. Veremos a


continuación que existen otras restricciones estructurales de este tipo.
EN

Limitaciones por Dinámica de Fase No-Mı́nima


Supongamos que p sea un polo de la planta, es decir G(p) = ∞. En principio se podrı́a
decir que S(p) = 0 y T (p) = 1, ya que:

1 1
S(p) = = =0 , T (p) = 1 − S(p) = 1
1 + K(p)G(p) 1 + K(p) ∞ ejθ

versión (preliminar) 0.2 - pág.91


Sin embargo, si K(p) = 0 (que p sea un cero del control) se cumplirı́a que K(p)G(p) 6= 0
y por lo tanto S(p) 6= 0 y T (p) 6= 1. Pero esto no puede ocurrir para la dinámica de fase no
mı́nima del lazo abierto si el lazo cerrado es internamente estable. Por lo tanto podemos
asegurar que para un sistema a lazo cerrado es estable, si p es un polo inestable de lazo
abierto:
p > 0 , G(p) = ∞ → T (p) = 1 , S(p) = 0 (4.12)
De la misma forma, si z es un cero de fase no mı́nima de lazo abierto:

N
z > 0 , G(z) = 0 → T (z) = 0 , S(z) = 1 (4.13)
Estas son restricciones de interpolación impuestas para la dinámica de lazo cerrado con
dinámicas de fase no mı́nima en el lazo abierto.

IO
Control de Sistemas Inestables La transformada de Laplace del error es:
Z ∞
E(s) = L {e(t)} = e(t)e−st dt = S(s)R(s)

C
0

Supongamos que el lazo abierto tenga un polo inestable p (p > 0), con lo cual S(p) = 0.
Entonces, independientemente del control se verifica que:

C
Z ∞
E(p) = S(p)R(p) = 0 → e(t)e−pt dt = 0
0
RU
Como e−pt > 0 ∀t > 0, para que la integral sea nula el error e(t) necesariamente tiene
cambiar de signo. Si consideramos una referencia escalón, la respuesta necesariamente
tendrá sobrepaso.

Además, como la exponencial decae con constante de tiempo Tp = 1/p, el sobrepaso


necesario para balancear la integral será pequeño si se produce tempranamente
ST

en relación a Tp , cuando la exponencial no decayó significativamente; y será


necesariamente mayor si se produce tardı́amente cuando la exponencial se ha reducido.
En otras palabras, si la respuesta es lenta en relación a Tp el sobrepaso deberá ser
grande; con lo cual el proceso podrı́a alejarse mucho de su condición de equilibrio.
N

Concluimos que en el caso de plantas inestables, la dinámica dominante de lazo cerrado


deberá ser más rápida que la inestabilidad para evitar sobrepasos exagerados.
En otras palabras, las inestabilidades de la planta introducen un lı́mite inferior para el
O

ancho de banda de lazo cerrado.

Supongamos que:
C

1
G(s) =
(s − 1)(s + 2)
Analicemos dos casos, el segundo con ancho de banda igual al doble del primero:
EN

8,2(s + 1)(s + 0,2439) 8,2(s + 0,2439)


K1 (s) = → T1 (s) =
s(s + 4,4) (s + 2)(s2 + 1,4s + 1)
23(s + 1)(s + 0,6957) 23(s + 0,6957)
K2 (s) = → T2 (s) =
s(s + 7,8) (s + 4)(s2 + 2,8s + 4)
En la siguientes figuras se ven las respuestas al escalón.

versión (preliminar) 0.2 - pág.92


N
IO
C
C
RU
Puede notarse el mayor sobrepaso de la respuesta lenta en relación a la más rápida.

Control de Sistemas con Ceros de Fase No Mı́nima La transformada de Laplace de


la salida es:
ST

Z ∞
Y (s) = L {y(t)} = e(t)e−st dt = T (s)R(s)
0

Supongamos que el lazo abierto tenga un cero de fase no mı́nima z (z > 0), con lo cual
N

T (z) = 0. Entonces:
Z ∞
Y (z) = T (z)R(z) = 0 → y(t)e−zt dt = 0
O

Como e−zt > 0 ∀t > 0, para que la integral sea nula la salida y(t) necesariamente tiene
cambiar de signo, independientemente de lo que sea el control. Si consideramos una
C

referencia escalón, la respuesta necesariamente tendrá un subvalor.

Además como la exponencial decae con constante de tiempo Tz = 1/z , si la respuesta


es rápida en relación a Tz el subvalor deberá ser grande. Por lo tanto, la respuesta
EN

dominante de lazo cerrado debe ser más lenta que los ceros de fase no mı́nima del lazo
abierto para evitar subvalores exagerados.

En otras palabras, la ceros de fase no-mı́nima y retardo presentes en la planta introducen


un lı́mite superior para el ancho de banda de lazo cerrado.

versión (preliminar) 0.2 - pág.93


Supongamos que:
−2s + 1
G(s) =
(s + 2)(s + 3)
Analicemos dos casos, el segundo con el doble de ancho de banda respecto al primero:

1,25(s + 3)(s + 2) −1,25(s − 0,8)


K1 (s) = → T1 (s) =
s(s + 3,25) (s + 1)2
0,3125(s + 3)(s + 2) −0,3125(s − 0,8)

N
K2 (s) = → T2 (s) =
s(s + 1,312) (s + 0,5)2

En la siguientes figuras se ven las respuestas al escalón.

IO
C
C
RU
ST
N

Puede notarse el mayor subvalor de la respuesta rápida respecto de la más lenta.


O

Si la planta tuviera ceros de fase no mı́nima lentos y polos inestables rápidos, el control
se torna inviable. En esos casos es necesario recurrir a estructuras de control con más
C

de un grado de libertad.

Integrales de la Sensibilidad
EN

Además de la restricción estructural entre S y T de la ecuación (2.5) existen otras


restricciones estructurales que deben destacarse si se pretende lograr lazos cerrados
estables.

Primera Integral de Bode Una de estas restricciones es la primer integral de Bode


para la sensibilidad, que establece para sistemas realimentados estables se cumple la

versión (preliminar) 0.2 - pág.94


siguiente relación:
Z ∞ np
X π
ln |S(jω)|dω = π Re {pk } − lı́m sL(s) (4.14)
0 2 s→0
k=1

donde pk son los polos inestables de lazo abierto. La integral del lado derecho se anula
si el lazo abierto es de grado relativo 2 o superior .
Evidentemente en el caso de plantas estables de grado relativo mayor a 1:

N
Z ∞
ln |S(jω)|dω = 0 (4.15)
0

IO
De esto surge que todo intento de disminuir la sensibilidad en una cierta banda de
frecuencia tendrá siempre su correlato como incremento en otra. Esto se conoce como
“efecto de la cama de agua” (waterbed effect).

C
Como la función de sensibilidad se corresponde con un filtro pasa-altos, en baja
frecuencia el logaritmo natural de su magnitud es negativo. Por lo tanto en alguna región
de la banda de paso su ganancia deberá ser mayor de 1 (amplificación), y esto será más

C
severo si el lazo abierto tiene polos inestables.
Naturalmente el balance de la integral ante una disminución de la sensibilidad en alguna
banda se podrı́a lograr con un incremento pequeño pero sostenido de la sensibilidad en
RU
alta frecuencia, ya que la parte positiva de la integral se extiende hasta el infinito.

Supongamos que se diseña un compensador para un proceso con dinámica de fase


mı́nima y grado relativo tres.
Podemos resolver esto mediante parametrización afı́n (4.4.2), y para ello proponemos
ST

dos alternativas para la elección del lazo cerrado T (s): Un filtro de Butterworth y uno de
Bessel, ambos de orden 3 y con el mismo ancho de banda. Por ejemplo, para un ancho
de banda de 2s−1 :
8 21,95
Fbutt (s) = , Fbess (s) =
(s + 2)(s2 + 2s + 4) (s + 2,64)(s2 + 4,18s + 8,33)
N

Podemos fácilmente evaluar como quedarı́a la función de sensibilidad para cada caso
con el siguiente código:
O

clear ; clc
[ B , A ] = b u t t e r ( 3 , 2 , ’ s ’ ) ; F1 = t f ( B , A ) ; S1 = 1 − F1 ;
[ B , A ] = b e s s e l f ( 3 , 2 . 8 ) ; F2 = t f ( B , A ) ; S2 = 1 − F2 ;
C

Luego graficamos la sensibilidad y sensibilidad complementaria para ambos casos en


escala absoluta con escala logarı́tmica para las frecuencias, y el logaritmo natural de
las funciones de sensibilidad con escala lineal para las frecuencias, para visualizar la
EN

restricción integral:

versión (preliminar) 0.2 - pág.95


N
IO
C
C
RU
ST

Puede observarse que la pendiente en la zona de corte es mayor para el filtro de


Butterworth, con lo cual la sensibilidad resulta más concentrada. El filtro de Bessel tiene
la sensibilidad más distribuida, y por ello el pico de sensibilidad es menor.
N

Segunda Integral de Bode Para lazos abiertos con un cero de fase no-mı́nima z se
verifica que:
O

Z ∞ np
Y pk + z
ln |S(jω)|w(z, ω)dω = π (4.16)
0 p̄k − z
k=1
C

donde pk son los polos inestables de lazo abierto y p̄k sus complejos conjugados,
mientras que si z es un cero real:
2z
w(z, ω) = (4.17)
z2 + ω2
EN

mientras que si se trata de un par complejo conjugado (z = x ± jy ):


x x
w(z, ω) = 2 + 2 2 (4.18)
2
x + (y − ω) x + (y + ω)
La función w(z, ω) decae rápidamente para ω > z , lo cual evidencia la dificultad de llevar
la frecuencia de paso a valores superiores al cero de fase no mı́nima.
El tema puede profundizarse en [SP01, sec.5.3.2,p. 164]

versión (preliminar) 0.2 - pág.96


Lectura Adicional
En [SP01]:

Cap 5 - Limitations on Performance in SISO Systems

Robustez
En el diseño de sistemas de control automático trabajamos con modelos de la dinámica

N
de la planta para realizar la sı́ntesis de los parámetros del controlador.
Estos modelos excluyen deliberadamente las caracterı́sticas dinámicas que asumimos

IO
irrelevantes para el diseño. Pero en muchas ocasiones se presentan otros aspecto de la
dinámica real que no podemos modelar, o que solo puede hacerse de forma aproximada.
Debemos asumir que siempre existirá un cierto nivel de incertidumbre en el modelo.
Aun ası́ pretendemos que el sistema de control sea capaz de garantizar mı́nimamente

C
estabilidad de lazo cerrado, y de ser posible también un desempeño mı́nimo para cumplir
los requerimientos del diseño.
La Teorı́a de Control Robusto aborda esta problemática de forma explı́cita, estableciendo

C
pruebas para garantizar la estabilidad robusta y el desempeño robusto; y métodos de
sı́ntesis para intentar alcanzar estos objetivos.
RU
4.3.1. Incertidumbre en el Modelo
En [SP01] se listan algunos orı́genes de esta incertidumbre:
parámetros en el modelo que solo se conocen de forma aproximada
parámetros en los modelos lineales que cambian para diferentes condiciones de
ST

equilibrio
en modelos temporalmente invariantes para dinámicas que no lo son habrá
parámetros que cambian con el tiempo
distorsiones relacionadas con sensores y actuadores
dinámica de alta frecuencia desconocida o difı́cil de modelar
N

distorsiones en la implementación del controlador


Las diferentes fuentes de incertidumbre pueden clasificarse como:
O

incertidumbre paramétrica, cuando se conoce la estructura del modelo, pero se


cuenta solo con valores aproximados para algunos de sus parámetros
dinámica no modelada, ya sea porque se trata de dinámica no conocida o
C

deliberadamente no-modelada, lo cual implica un modelo nominal de orden


reducido
incertidumbre concentrada, cuando se combinan varias fuentes de incertidum-
bre paramétrica y/o dinámica no-modelada en un elemento puntual dentro de la
EN

estructura del modelo

4.3.2. Modelos de Incertidumbre


El primer paso para el análisis explı́cito de robustez es modelar la incertidumbre.
En la Teorı́a de Control Robusto se plantean dos casos: incertidumbre global e
incertidumbre estructurada.

versión (preliminar) 0.2 - pág.97


N
IO
C
C
Figura 4.5: Análisis de estabilidad robusta
RU
En ambos consideramos un “modelo nominal” y un “modelo de incertidumbre” que se
combina con el anterior para definir una “familia de modelos” que incluya todos los casos
que pudieran experimentarse en la práctica.
El modelo de incertidumbre global más común es el multiplicativo, que surge de la
siguiente expresión:
ST

G(s) = G0 (s) [1 + δW∆ (s)] , |δ| < 1 (4.19)

donde G0 (s) es el modelo nominal, W∆ (s) es el modelo de incertidumbre y δ es


un escalar complejo arbitrario pero con módulo acotado que permite generar distintos
N

componentes de la familia de modelos (δ = 0 para el modelo nominal).

Cuando la incertidumbre está asociada a los polos de un proceso SISO puede resultar
O

conveniente usar un modelo multiplicativo inverso:

1
G(s) = G0 (s) , |δ| < 1 (4.20)
1 + δW∆ (s)
C

En lo posible se debe seleccionar el modelo más ajustado al caso analizado. Un modelo


demasiado amplio incluirá casos que nunca se darán en la realidad, y con ello el análisis
será conservativo.
EN

4.3.3. Estabilidad Robusta


La robustez en la estabilidad de lazo cerrado se puede analizar a través del criterio de
Nyquist. En la figura 4.5 vemos la representación en el diagrama de Nyquist del lazo
abierto nominal L0 (jω) = K(s)G0 (s) y una envolvente (|δ| = 1) para la familia de
modelos L(jω) = K(s)G(s) con incertidumbre multiplicativa W∆ (jω):

versión (preliminar) 0.2 - pág.98


N
IO
C
Figura 4.6: Análisis de estabilidad robusta con el ı́ndice de robustez

C
L(s) = L0 (s) [1 + δW∆ (s)] = L0 (s) + |1|ejθδ L0 (s)W∆ (s)
RU
De la gráfica vemos que se tendrá estabilidad para toda la familia de modelos (estabilidad
robusta) si se cumple que:

|1 + L0 (s)| = |S0−1 (jω)| > |L0 (s)W∆ (s)|

Esto puede escribirse como:


ST

|L0 (s)|
1> |W∆ (s)|
|1 + L0 (s)|

Por lo tanto podemos decir que la condición de estabilidad robusta para un modelo con
N

incertidumbre multiplicativa global es:

|T0 (jω)W∆ (s)| < 1 (4.21)


O

Podemos replantear esto como:

|W∆ (s)| < |T0 (jω)|−1 (4.22)


C

La inversa de la magnitud de la sensibilidad complementaria puede interpretarse como


un indice de robustez. El sistema tendrá estabilidad robusta si la incertidumbre se
mantiene por debajo del ı́ndice de robustez, como se muestra en el diagrama de Bode
EN

de la figura 4.6.
Para otros modelos de robustez debe utilizarse la condición de estabilidad robusta
correspondiente (ver [Peñ92, p. 36]).

De esta figura resulta evidente que la incertidumbre dinámica W∆ impone un lı́mite


superior para el máximo ancho de banda alcanzable a lazo cerrado.

versión (preliminar) 0.2 - pág.99


N
IO
C
C
Figura 4.7: Análisis de desempeño robusto
RU
4.3.4. Desempeño Robusto
Desempeño robusto implica cumplir con la condición (4.10) para cualquier elemento de
la familia de modelos.
Asegurar desempeño robusto implica garantizar que la sensibilidad para toda la familia
ST

de modelos tendrá una magnitud menor o igual a una cierta cota WS (jω), lo cual implica
una restricción mayor a la condición de estabilidad robusta.

(
La inversa de la función de peso WS jω) impone una cota superior para la función de
sensibilidad, y sabemos que la inversa de la sensibilidad es la distancia entre la traza de
N

Nyquist de lazo abierto y el punto −1.


Por lo tanto para lograr desempeño robusto es necesario que para una dada frecuencia
ω toda la famila de modelos se encuentre a una distancia mayor a WS (jω) respecto del
O

−1. Podemos pensar la función de peso como un radio de exclusión centrado en el −1


para la traza de lazo abierto, como se muestra en la figura 4.7.
C

Para evaluar desempeño robusto podemos modificar la condición de estabilidad robusta


exigiendo no una distancia mayor a 0 respecto del −1 en la gráfico de Nyquist, sino
mayor a |WS (jω)|:

|T0 (jω)W∆ (s)| < 1 − |WS−1 (jω)S0 (jω)|


EN

lo cual equivale a:

|T0 (jω)W∆ (s)| + |S0 (jω)WS (jω)| < 1 (4.23)

El primer término es la condición de estabilidad robusta, mientras que el segundo se


corresponde con la condición de desempeño nominal.

versión (preliminar) 0.2 - pág.100


Lectura Adicional
En [SP01]:

Cap 7 - Uncertainty and Robustness for SISO Systems

Sı́ntesis de Compensadores

N
4.4.1. Asignación de Polos
ssec:polinomial
A continuación proponemos ajustar un compensador bipropio de orden n − 1 para una

IO
planta de orden n, a fin de obtener un polinomio de lazo cerrado de orden 2n − 1 elegido
de forma arbitraria. Este enfoque se desarrolla en [GGS01, sec.7.2, p. 177].
Denotemos las funciones de transferencia para el compensador y la planta de la
siguiente forma:

C
P (s) B(s)
K(s) = , G(s) =
L(s) A(s)

C
donde A(s) es un polinomio de orden n y B(s) es uno de orden menor; mientras que
P (s) y L(s) son polinomios de orden n − 1:
RU
P (s) = pn−1 sn−1 + pn−2 sn−2 + · · · + p1 s + p0
L(s) = ln−1 sn−1 + pn−2 sn−2 + · · · + l1 s + l0
B(s) = nn−1 sn−1 + pn−2 sn−2 + · · · + b1 s + b0
A(s) = an ss + an−1 sn−1 + an−2 sn−2 + · · · + a1 s + a0
ST

El polinomio de lazo cerrado será:

Alc = L(s)A(s) + P (s)B(s) = sm + c1 sm−1 + · · · + cm−1 s + cm (4.24)


N

Igualando coeficientes obtenemos un conjunto de 2(n − 1) ecuaciones lineales para


definir los coeficientes del compensador.
O

Veamos el ejemplo 7.1 de [GGS01]:

1
G(s) =
C

s2 + 3s + 2
El compensador será de orden 1. Entonces:

Alc = s2 + 3s + 2 (l1 s + l0 ) + (p1 s + p0 )



EN

= l1 s3 + (3l1 + l0 ) s2 + (2l1 + 3l0 + p1 ) s + (2l0 + p0 )

Dado que el modelo de planta es de orden 2, necesitamos elegir un polinomio de lazo


cerrado de orden 3:
Alc = s3 + 3s2 + 3s + 1

versión (preliminar) 0.2 - pág.101


Igualando coeficientes:

l1 = 1
3l1 + l0 = 3
2l1 + 3l0 + p1 = 3
2l0 + p0 = 1

lo cual puede expresarse en notación matricial como:

N
    
1 0 0 0  l1   1
3    
 
1 0 0 l
 0 = 3

IO

2 3 1 0 p1   3

   
 
0 2 0 1 p0 1

De esto obtenemos l1 = 1, l0 = 0, p1 = 1, p0 = 1:

C
s+1
K(s) =
s

C
que equivale a un controlador PI.
RU
El esquema de sı́ntesis, que permite ubicar todos los polos de lazo cerrado, se puede
generalizar de la siguiente forma:
 

 ln−1  

 .. 
. 
   
c2n−1 

 
  

l0
 
ST

..
M̄e (A, B) = . (4.25)
 pn−1    
c0
  

 .. 

 . 

 

 
p0
 
N

en donde M̄e es una matriz que obtenemos eliminando la fila 1 y las columnas 1 y n + 1
de la matriz eliminante de Silvester Me para los poliniomios A(s) y B(s):
 
an 0 ··· 0 bn 0 ··· 0
O

an−1
 an ··· 0 bn−1 bn ··· 0 

 .. .. .. .. .. .. .. .. 
 . . . . . . . . 
C

 
 a0
Me (A, B) =  a1 ··· an b0 b1 ··· bn  (4.26)
 0
 a0 ··· an−1 0 b0 ··· bn−1 

 . .. .. .. .. .. .. .. 
 .. . . . . . . . 
0 0 ··· a0 0 0 ··· b0
EN

Podemos construir la matriz eliminante de Sylvester usando el siguiente código:


function M = sylm ( A , B )
n = length ( A ) ;
m = 2∗ n ;

versión (preliminar) 0.2 - pág.102


Me = zeros (m−1, m) ;
f o r k =1: n
Me( k : n+k −1, k ) = A’;
Me( k : n+k −1, n+k ) = B ’ ;
end
end

Para el enfoque polinomial solo necesitamos ajustar la matriz eliminante y resolver el


sistema de ecuaciones:

N
function [ P, L ] = polynomial (B, A, Alc )
n = length (A ) ;

IO
Me = sylm ( A , B ) ;
Me = [Me( 2 : end , 2 : n ) Me( 2 : end , n +2: end ) ] ;
K = Me\ A l c ;
L = K( 1 : n−1) ’;
P = K( n : end ) ’ ;

C
end

C
Si queremos forzar un polo de lazo abierto (por ejemplo un integrador o un filtro)
podemos combinarlo con el denominador de la planta y diseñar el compensador para
ese modelo aumentado.
RU
El compensador resultante será estrictamente propio, ya que al denominador del
compensador bipropio computado con este enfoque deberá ser convolucionardo con
el polo adicional.

4.4.2. Inversión Dinámica


ST

Parametrización Afı́n
La alternativa es plantear de forma explı́cita el control por inversión para el lazo cerrado.
Supongamos que tenemos una función objetivo Fq (s) para la sensibilidad complemen-
taria T (s) del lazo cerrado. Debemos sintetizar un compensador K(s) tal que:
N

K(s)G(s)
T (s) = = Fq (s)
1 + K(s)G(s)
O

Despejando:

K(s)G(s) = Fq (s) [1 + K(s)G(s)]


C

= Fq (s) + Fq (s)K(s)G(s) → K(s) [G(s) − Fq (s)G(s)] = Fq (s)

Finalmente:
Fq (s) 1
EN

K(s) = (4.27)
1 − Fq (s) G(s)

Si:
B(s) N (s) N (s)/D(s) A(s)
G(s) = , Fq (s) = → K(s) =
A(s) D(s) 1 − N (s)/D(s) B(s)

versión (preliminar) 0.2 - pág.103


y por lo tanto:
N (s) A(s)
K(s) = (4.28)
D(s) − N (s) B(s)
Para que el compensador sea bipropio, el grado relativo de Fq (s) debe ser igual al de la
planta. Y si este es mayor, el compensador será estrictamente propio.
Para plantas de fase mı́nima, salvo por esta consideración existe completa libertad para
elegir Fq (s).

N
De la ecuación (4.28) puede notarse que con este enfoque el compensador tendrá como
ceros los polos de G(s) y los ceros de Fq (s), mientras que sus polos serán los ceros
de G(s) y las raı́ces de D(s) − N (s). Vemos que de forma indirecta esto nos lleva

IO
normalmente a un control por cancelación.
La dimensión de la dinámica cancelada dependerá del orden de la función Fq (s) elegida.
Para que no exista cancelación Fq (s) deberá duplicar el orden de la planta.

Si la planta es inestable habrá ceros en el semiplano derecho de K(s) cancelando polos

C
inestables de la planta. De forma similar habrá cancelaciones entre el control y la planta
cuando esta tenga ceros en el semiplano derecho.
Por lo tanto, para plantas de fase no mı́nima habrá que elegir funciones Fq (s) que

C
aseguren la estabilidad interna del lazo.
Esto implica que los ceros de fase no mı́nima de la planta deberán ser ceros de Fq (s)
(raı́ces del polinomio N (s)), mientras que los polos inestables de la planta deberán ser
RU
raı́ces del polinomio D(s) − N (s).
Esto es algo que ya sabı́amos de la subsección 4.2.2, y que sintetizamos en las
ecuaciones (4.12) y (4.12).

Este tema se encuentra desarrollado, con otro enfoque, en [GGS01, cap.15].


Allı́ se plantea el control como una inversión:
ST

K(s)G(s)
T (s) = = Q(s)G(s)
1 + K(s)G(s)
Por lo tanto, el control para obtener una dinámica inversa Q(s) es:
N

K(s) = Q(s) [1 + K(s)G(s)] = Q(s) + K(s)G(s)Q(s)


de lo cual:
Q(s)
O

K(s) =
1 − Q(s)G(s)
Podrı́a usarse Q(s) como un control con modelo predictivo, en el cual solo realimentamos
el error de predicción:
C
EN

versión (preliminar) 0.2 - pág.104


Si queremos que T (s) se ajuste a un modelo de lazo cerrado Fq (s) se tendrı́a:

Q(s)G(s) = Fq (s) → Q(s) = Fq (s)G−1 (s)

Entonces a partir de elegir Fq (s) determinamos la dinámica inversa Q(s), y con esta el
control K(s) para implementar una realimentación de la salida.

Podemos notar que las sensibilidades del lazo resultan:

N
T (s) = Q(s)G(s) = Fq (s)

S(s) = 1 − T (s) = 1 − Q(s)G(s) = 1 − Fq (s)

IO
Si (s) = G(s)S(s) = G(s) [1 − Q(s)G(s)] = G(s) [1 − Fq (s)]
Q(s)
Su (s) = K(s)S(s) = [1 − Q(s)G(s)] = Q(s) = Fq (s)G−1 (s)
1 − Q(s)G(s)

C
Claramente resulta necesario elegir Fq (s) estable, con lo cual T (s) y S(s) resultan
estables.

C
Pero en la tercer ecuación se observa que si la planta tiene un polo inestable p, es
necesario elegir Fq (s) tal que S(p) = 0, o bien Fq (p) = 1.
Y de la cuarta ecuación se observa que para lograr estabilidad interna Su (s) = Q(s)
RU
debe ser estable. Por lo tanto, todo cero de fase no mı́nima de G(s) deberá ser cero de
Fq (s) para que no aparezca como polo de Q(s).
En sı́ntesis, para polos p y ceros z de fase no mı́nima de la planta se debe cumplir que:

Fq (p) = 1 , Fq (z) = 0
ST

que es lo mencionado previamente.

Plantas con Integrador Si la planta es de la forma:

B(s) B(s)
G(s) = = k
N

A(s) s Ā(s)

donde el polinomio Ā(s) no tiene polos en el origen. El control resulta:


O

N (s) sk Ā(s)
K(s) =
D(s) − N (s) B(s)
C

Para que el control no tenga ceros en el origen es necesario que el polinomio D(s)−N (s)
tenga k raı́ces en el origen, lo cual implica que los últimos k coeficientes deben ser nulos.
Esto implica que Fq (s) se debe elegir de forma tal que el numerador coincida con los
últimos k términos del denominador.
EN

Supongamos que la planta es un integrador doble:

1
G(s) =
s2

versión (preliminar) 0.2 - pág.105


y elegimos:
a0
Fq (s) =
s2 + a1 s + a0
en donde el numerador es igual al último término del denominador, de forma tal que
Fq (0) = 1. El control resulta:
a0 a0
K(s) = s2 = s
s2 + a1 s + a0 − a0 s + a1

N
Esto implicarı́a una incapacidad para rechazar perturbaciones constantes a la entrada
(o eliminar una condición inicial de error), ya que la función de sensibilidad de entrada
resulta:

IO
1 s (s + a1 ) s + a1 1
S(s) = = 2 → Si (s) = G(s)S(s) =
a0 s 1 s + a1 s + a0 s2 + a1 s + a0 s
1+
s + a1 s2

C
Vemos que el lazo no solamente es incapaz de rechazar perturbaciones de entrada, sino
que además no es internamente estable.

C
Para evitar esto elegimos para el numerador los últimos dos términos del denominador,
y aumentamos el orden de este último para mantener el grado relativo de Fq igual al de
RU
la planta:
a1 s + a0
Fq (s) =
s3 + a2 s2 + a1 s + a0
con lo cual
a1 s + a0 a1 s + a0
K(s) = s2 =
ST

s3 + a2 s2 + a1 s + a0 − a1 s − a0 s + a2
Con esto:

1 s2 (s + a2 )
S(s) = = 3
a1 s + a0 1 s + a2 s2 + a1 s + a0
N

1+ 2
s + a2 s
y entonces
O

s2 (s + a2 ) 1 s + a2
Si (s) = = 3
s3 2
+ a2 s + a1 s + a0 s2 s + a2 s2 + a1 s + a0
C

Si queremos forzar acción integral para rechazar perturbaciones constantes de entrada


serı́a necesario agregar un término adicional en el numerador y expandir en un orden el
denominador.
EN

Polos Indeseables Se puede notar que lo dicho anteriormente es equivalente a


considerar los polos en el origen de la planta como dinámica de fase no mı́nima, aunque
no lo sea.
Podemos aplicar el mismo tratamiento para los polos inestables a la dinámica lenta de la
planta o cualquier polo que por alguna razón sea indeseable para el lazo cerrado.

versión (preliminar) 0.2 - pág.106


Esto implica que si p es un polo indeseable (inestable o no), para que no aparezca en el
lazo cerrado será necesario elegir Fq tal que Fq (p) = 1.
Y si p tiene multiplicidad k , entonces será necesario elegir Fq tal que Sq (s) = 1 − Fq (s)
tenga un cero en p con la misma multiplicidad k .

En el ejemplo anterior el polo indeseable es p = 0 con multiplicidad 2. Se puede


notar que con la última Fq elegida la sensibilidad tiene un cero z = 0 con esa misma
multiplicidad.

N
4.4.3. Loop-Shaping

IO
En la subsección 3.4.2 se ha presentado la compensación en frecuencia clásica.
Podemos sintetizar la estrategia considerando que:

un compensador en atraso o PI permite mejorar el desempeño en baja frecuencia

C
el ajuste final de ganancia permite establecer la frecuencia de cruce de lazo
abierto, determinando el ancho de banda del lazo cerrado
en la frecuencia de cruce utilizamos un compensador en adelanto para obtener

C
buenos margenes de fase y ganancia
de ser necesario podrı́amos agregar filtro (polos) de alta frecuencia para mitigar
los efectos del ruido de medición (de alta frecuencia). Esto implica además mayor
RU
robustez en relación a la incertidumbre dinámica de alta frecuencia.

Podemos observar que la compensación se traduce en una técnica de “conformado


del lazo abierto” (loop shaping) para lograr alta ganancia en baja frecuencia, un atraso
moderado en la frecuencia de cruce, y baja ganancia en frecuencias superiores.
ST

Si tenemos en cuenta las referencias r(t), la perturbación d y el ruido de medición n


tenemos para el error:

E(s) = S(s) R(s) + S(s) Gd (s) D(s) − T (s) N (s)

que en función del lazo abierto resulta:


N

1 1 L
E= R(s) + Gd D − N
1+L 1+L 1+L
O

El control perfecto requerirı́a:

e=0·r+0·d+0·n
C

lo que implica |L|  1 para los primeros dos términos y |L| = 0 para el tercero.
Evidentemente esto genera un conflicto, pero lo salvamos tratando de lograr lo primero
en baja frecuencia y lo segundo en alta.
EN

Además de los requerimientos por desempeño debemos cumplir con los de estabilidad
relativa.
El atraso de fase para una determinada frecuencia ω se encuentra estrechamente
relacionada con la pendiente de la curva de ganancia a esa frecuencia. Podemos
decir que si para una frecuencia ω la pendiente de |L(jω)| es n, el atraso de fase es
aproximadamente −n · 900 [SP01, p. 20].

versión (preliminar) 0.2 - pág.107


En la siguiente gráfica se muestran los valores asintóticos de pendiente y atraso de fase
para la función de transferencia, donde se comprueba la afirmación anterior:

30(s + 1)
G(s) =
(s + 10)(s + 0,01)2

N
IO
C
C
RU
ST

Una pendiente −1 (−20 db/dec) implica un atraso de fase de 900 , mientras que una
pendiente −2 se corresponde con un atraso de 1800 .
En la frecuencia de cruce el atraso deberı́a ser del orden de los 1200 o menor, lo cual
implica una pendiente mayor que −1,5, pero nula porque de lo contrario no habrı́a cruce.
N

Para lograr alta ganancia en baja frecuencia, la pendiente para frecuencias menores a la
de cruce deberı́a ser más negativa; pero obviamente no podrá ser mas negativa de −2.
O

Esto es deseable también para alta frecuencia, a fin de mejorar la robustez y el rechazo
de ruidos.

Desde esta perspectiva es posible definir las especificaciones de diseño estableciendo


C

la forma deseada para el lazo abierto, combinando los requerimientos de desempeño


(bajas frecuencias), estabilidad relativa (frecuencias medias) y robustez (alta frecuencia).
Pero con dinámicas complejas puede ser difı́cil ajustar la solución, por lo cual se recurre
a herramientas de optimización para sintetizar el compensador.
EN

Un método de este tipo es el propuesto por McFarlane y Glover en 1990; en el cual se


busca ajustar un compensador para aproximar la forma deseada para el lazo abierto
maximizando la robustez de la solución. Esta estrategia se conoce como loop shaping
H∞ y se encuentra desarrollado en [SP01, sec.9.4, p. 382] para el caso multivariable.

El controlador óptimo H∞ se puede obtener mediante el comando loopsyn de la librerı́a


de control robusto de Matlab, o ncfsyn de GNU Octave.

versión (preliminar) 0.2 - pág.108


N
(a) Se calienta agua usando quemador de gas natural y se (b) Se usa vapor para calentar y evaporar el agua del jugo de caña Se controlan los
mide la temperatura del agua a la salida niveles en cada evaporador

IO
Sistemas con Retardo
4.5.1. Dinámicas con Retardo

C
El retardo está presente en la mayorı́a de los sistemas reales. Este puede ser causado
por: transporte de masa, energı́a o información, efecto causado por varios sistemas de

C
bajo orden conectados en serie, tiempo de procesamiento en sensores o controladores,
etc.
Un retardo importante implica una dificultad para el sistema de control. Las dificultades
RU
son provocadas principalmente porque el efecto de las perturbaciones demora para ser
sentido, la acción de control demora para causar efecto en la variable controlada y porque
la acción de control se calcula con base en un error pasado.

4.5.2. Modelado
ST

La respuesta de un sistema con retardo puede describirse como

Y (s)
P (s) = = G(s)e−sL (4.29)
U (s)
N

donde G(s) es la respuesta libre de retardos y L puede representar un retardo real o


aparente, como el que se observa en la figura 4.9b.
Si G(s) es una dinámica sobre-amortiguada, lo cual es tı́pico en la industria de procesos
O

(donde los retardos en general son relevantes); la respuesta al escalón del sistema con
retardo será de la forma:
C
EN

versión (preliminar) 0.2 - pág.109


N
IO
C
C
(a) En una torre de destilación se usa vapor para calentar
la mezcla en el fondo. Se controlan las temperaturas de
platos para controlar la concentración de las extracciones
RU
(b) Si en un semáforo solo el primer conductor responde a la señal
mientras el resto lo hace en base al movimiento de quien lo precede,
la respuesta del último es sobreamortiguada de alto orden
ST
N
O
C

El retardo de transporte es un operador lineal, pero a diferencia de otros operadores


lineales su transformada de Laplace no es una función racional:
EN

DL {y(t)} = y(t − L) , D(s) = e−sL (4.30)

Es obvio que la ganancia de este operador es 1 para todo valor de frecuencia ω , pero a
diferencia de los otros modelos el atraso de fase no está acotado:

|D(jω)| = 1 , ∠D(jω) = −Lω (4.31)

Puede notarse que el atraso es de 1800 para una frecuencia ω = π/L, duplicándose

versión (preliminar) 0.2 - pág.110


con cada octava. El retardo de transporte es una dinámica de fase no-mı́nima
correspondiente al caso de fase mı́nima es G(s) = 1.

Una aproximación simple para la transformada de Laplace del retardo es utilizar un polo
o un cero:
1
e−sL ≈ Dp (s) = , e−sL ≈ Dz (s) = 1 − L s (4.32)
Ls + 1
Sin embargo, esto sirve para ω  L. Es posible lograr una aproximación exacta para

N
la ganancia, y más ajustada para la fase recurriendo a una expansión de Padè. La
expresión genérica para expandir una función f (x) es:

IO
a0 + b1 x + b2 x2 + · · · + pm xm
f (x) ≈ R(x) = (4.33)
1 + a1 x + a2 x2 + · · · + an xn
ajustando los coeficientes a partir de:

C
R(0) = f (0)
R0 (0) = f 0 (0)

C
R00 (0) = f 00 (0)
..
.
RU
R(m+n) (0) = f (m+n) (0)

Esta aproximación se puede computar con el comando pade( ).


Para aproximar la función exponencial resulta:
ST

1 + 1/2 x + 1/9 x2 + 1/72 x3 + 1/1008 x4 + 1/30240 x5 · · ·


ex ≈ (4.34)
1 − 1/2 x + 1/9 x2 − 1/72 x3 + 1/1008 x4 − 1/30240 x5 · · ·

D esto se deduce que la aproximación de Padè de primer orden para el retardo es:
N

2 − sL
e−sL ≈ (4.35)
2 + sL
O

Al igual que el retardo, esta función racional tiene ganancia unitaria en todo el espectro
de frecuencias, y da una aproximación razonable para el atraso de fase mientras la
frecuencia no sea demasiado grande, como se puede observar en la figura 4.10.
C

En la figura 4.11 se comparan las respuestas al escalón de estas aproximaciones. Puede


notarse que para el análisis de respuesta transitoria no es tan buena.

Debe destacarse que en tiempo discreto la aproximación es exacta si el retardo es un


EN

múltiplo entero del tiempo de muestreo:


L
D(z) = z − ts (4.36)

A las limitaciones para el control asociadas a las caracterı́sticas de fase no-mı́nima


debemos agregar aquellas asociadas a la incertidumbre dinámica por variación del

versión (preliminar) 0.2 - pág.111


N
IO
C
C
Figura 4.10: Atraso de fase para el retardo de transporte (L = 1s) y sus aproximaciones mediante la expansión de Padè
RU
ST
N
O
C
EN

Figura 4.11: Respuesta al escalón para el retardo de transporte (L = 1s) y sus aproximaciones mediante la expansión de Padè

versión (preliminar) 0.2 - pág.112


tiempo de retardo. Esta puede modelarse de forma ajustada mediante un modelo
multiplicativo global dado por:

e−(L0 +∆L) s
WL (s) = −1
e−L0 s
= e−∆L s − 1 (4.37)

Para ω = 1/∆L la incertidumbre tiene magnitud 0,7. Debido al incremento exponencial


es prácticamente imposible alcanzar un ancho de banda de este orden o mayor.

N
4.5.3. Predictor de Smith

IO
Para una planta descripta por el modelo (4.29) proponemos como esquema de control
ideal el mostrado en la siguiente figura:

C
C
RU
En este la transferencia entre entrada y salida resulta:

Y (s) C(s)G(s) −sL


= e (4.38)
R(s) 1 + C(s)G(s)
ST

Puede notarse que el retardo no aparece en la ecuación caracterı́stica de lazo cerrado,


y por lo tanto el control C(s) puede diseñarse con un modelo para la planta sin retardo
G(s).

Supongamos que contamos con un modelo nominal para la dinámica de la planta es


N

Pn (s) = Gn (s)e−sLn . Podemos obtener el control ideal propuesto en el caso nominal


(Pn (s) = P (s)) si para la realimentación en lugar de la salida usamos una predicción
de la respuesta de la planta al control sin retardo ŷ(t + Ln ) sumando a ello el error en
O

la predicción ep (t) = y(t) − ŷ(t) (siendo y(t) la salida real y ŷ(t) la predicción con el
modelo Pn (s)):
C
EN

versión (preliminar) 0.2 - pág.113


El error de predicción en el caso ideal surge por la acción de perturbaciones sobre la
planta que no pueden incluirse en la predicción y errores en la condición inicial. En el
caso real Pn (s) 6= P (s) debemos incluir también la incertidumbre dinámica.

Si el error de predicción es nulo, la acción de control se computará con el modelo sin


retardo y la respuesta será la que se planteó en la ecuación (4.38).

N
IO
C
Para analizar lo que ocurre en el caso real vamos a computar el control equivalente

C
Ceq (s), que surge del control nominal C(s) combinado con el predictor:
RU
ST

Para llegar a esto reestructuremos el diagrama del control con predictor de la siguiente
forma:
N
O
C
EN

donde puede deducirse que:

C(s)
C 0 (s) =
1 + C(s)Gn (s)

versión (preliminar) 0.2 - pág.114


Entonces:
C(s)
C 0 (s) 1 + C(s)Gn (s)
Ceq (s) = =
1 − C 0 (s)Pn (s) C(s)
1− Pn (s)
1 + C(s)Gn (s)
C(s)
=
1 + C(s)Gn (s) − C(s)Pn (s)

N
lo que arroja finalmente:

C(s)
Ceq (s) = (4.39)
1 + C(s) [Gn (s) − Pn (s)]

IO
que también puede escribirse como:

C(s)
Ceq (s) = (4.40)

C
1 + C(s)Gn (s) [1 − e−sLn (s)]

El compensador puede implementarse con el compensador para la planta sin retardo y el

C
predictor, o con el modelo de control equivalente; pero este último incluye internamente
un retardo (que de ser pequeño eventualmente podrı́a sustituirse por una aproximación
racional).
RU
4.5.4. Predictor de Smith Filtrado
Es importante remarcar que el predictor de Smith es su forma original no puede usarse
con plantas inestables, y no tiene buenas propiedades de robustez.
La respuesta de lazo cerrado en el caso general es:
ST

Y (s) C(s)G(s)
= e−sL (4.41)
R(s) 1 + C(s)Gn (s) + C(s) [P (s) − Pn (s)]
de donde surge la ecuación caracterı́stica de lazo cerrado:
N

1 + C(s)Gn (s) + C(s) [P (s) − Pn (s)] = 0 (4.42)

Aunque el control pueda diseñarse para que 1 + C(s)Gn (s) sea un polinomio Hurwitz
(todas sus raı́ces en el semiplano izquierdo), tendiendo en cuenta que Pn (s) 6= P (s) los
O

polos inestables de P (s) serán raı́ces en el semiplano derecho de (4.42), ya que en un


lazo internamente estables estas no pueden ser canceladas por el control.
C

Además tiene un desempeño pobre en cuanto a rechazo de perturbaciones no medidas


con dinámicas lentas de lazo abierto:
C(s)Gn (s) 1 − e−sLn (s)
 
Y (s)
= P (s) (4.43)
EN

Q(s) 1 + C(s)Gn (s) + C(s) [P (s) − Pn (s)]


Puede notarse que los polos lentos de P (s) también lo serán para la respuesta a la
perturbación.

Para manejar estas limitaciones se ha desarrollado el Predictor de Smith Filtrado


[JENR09], el cual consiste en agregar un filtro de robustez antes de realimentar el error
de predicción ep (t):

versión (preliminar) 0.2 - pág.115


N
En este caso se tiene:

IO
Y (s) C(s)G(s)
= e−sL (4.44)
R(s) 1 + C(s)Gn (s) + C(s)Fr (s) [P (s) − Pn (s)]

C
Y (s) C(s)G(s) [Gn (s) − Pn (s)Fr (s)]
= e−sL (4.45)
Q(s) 1 + C(s)Gn (s) + C(s)Fr (s) [P (s) − Pn (s)]

C
La ecuación caracterı́stica de lazo cerrado es:

1 + C(s)Gn (s) + C(s)Fr (s) [P (s) − Pn (s)] = 0 (4.46)


RU
El filtro agrega el grado de libertad necesario para lograr mayor robustez y estabilidad
interna. El control C(s) se diseña igual que antes para la planta sin retardo, mientras que
el filtro Fr (s) se diseña para la respuesta ante una perturbación (ver [JENR09]).
ST

Estructuras Especiales
4.6.1. Anti-Windup
Al implementar un sistema de control que incluya acción integral es necesario considerar
N

el efecto denominado “wind-up del integrador”, e incluir formas de mitigarlo en caso que
esto pudiera ser un inconveniente.
Veamos primero cual es el problema.
O

Windup de la Acción Integral


Sabemos que la inclusión de acción integral en el lazo tiene como efecto positivo lograr
C

ganancia infinita de lazo abierto a frecuencia cero, pero esto va acompañado de un efecto
negativo que es el de introducir −900 de atraso de fase en este lazo. Sin embargo, esto
se puede manejar mediante un compensador adecuado, y con ello lograr una respuesta
aceptable de lazo cerrado.
EN

Pero la presencia de un integrador en el lazo introduce otra complicación cuando se


experimenta saturación en la acción de control, lo cual en casi todos los casos representa
un escenario no habitual pero posible.

versión (preliminar) 0.2 - pág.116


En la siguiente figura

N
IO
C
C
RU
ST

Anti-Windup Mediante Realimentación de Salida


Es posible reestructurar el compensador para evitar incluir de forma explı́cita un
integrador, utilizando la arquitectura de la siguiente figura:
N
O
C

donde:
k∞ = lı́m K(s) , H(s) = K(s)−1 − k∞
−1
(4.47)
s→∞

Si calculamos el bloque equivalente de la parte recuadrada en celeste tenemos que:


EN

k∞ k∞ k∞
K̄(s) = = = ≡ K(s)
1

1 + k∞ H(s) 1 1
1 + k∞ − 1 + k ∞ − 1
K(s) k∞ K(s)

Podemos decir que esta estructura es equivalente al compensador original mientras no


sature la acción de control, pero cuando esto ocurra no habrá windup de la integral

versión (preliminar) 0.2 - pág.117


porque en esta estructura no incluye ningún integrador de forma explı́cita; la acción
integral está implı́cita en la realimentación.

En la siguiente figura se observa en rojo la respuesta original con saturación en rojo y la


respuesta con anti-windup en azul:

N
IO
C
C
RU
Se puede observar que la respuesta con anti-windup no tiene sobrepaso, aun con
saturación.
ST

Esto es realizable solo si el compensador original es bipropio. Su fuese estrictamente


propio habrı́a que descomponerlo en el producto de un prefiltro con los polos en exceso
y post-multiplicarlo por el esquema de antiwindup construido con el remanente (que debe
incluir el integrador).
N

4.6.2. Control con Dos Grados de Libertad


O

Filtro de Referencia
Ya hemos mencionado en la subsección 3.4.3 que la sensibilidad complementaria T (s)
se puede ajustar mediante un filtro de referencia Fr (s) como se muestra en la siguiente
C

figura:
EN

versión (preliminar) 0.2 - pág.118


Es evidente que:

Y (s) Y (s)
= Fr (s) = Fr (s)T (s)
R(s) R̄(s)

Podemos incluir polos en el filtro para cancelar los ceros de T (s) cercanos al origen y
evitar sobrepasos excesivos; aunque igualmente implicará una reducción en el ancho de
banda para el seguimiento de la referencia.
Pero debe notarse que el filtro no es parte del lazo cerrado, y por lo tanto no tiene ningún

N
efecto sobre las sensibilidades para las otras entradas del sistema.

Pre-Alimentación de Referencias y Perturbaciones

IO
C
Control en Cascada

C
RU
ST
N
O
C
EN

versión (preliminar) 0.2 - pág.119


EN
C
O
N
ST
RU
C
C
IO
N
N
5

IO
C
Realimentación de Estado

C
RU
ST
N
O
C
EN

121
Figura 5.1: regulador por realimentación de estados

Introducción

N
Supongamos que contamos con un modelo de estados para describir la dinámica del
proceso a controlar:

IO
ẋ = Ax + Bu + Bv v (5.1)
donde x ∈ Rn , u ∈ Rm es la acción de control y v ∈ Rp es el vector de perturbación.
Un control por realimentación de estados es aquel en el cual el vector de control u surge
de un mapeo estático del vector de estados x. En el caso lineal:

C
u = −Kx (5.2)

C
donde K ∈ Rm×n es la denominada matriz de realimentación de estados.
Obtenemos la dinámica de lazo cerrado reemplazando (5.2) en (5.1):
RU
ẋ = [A − BK] x + Bv v (5.3)

La dinámica de lazo cerrado queda definida por la matriz:

Ā = [A − BK] (5.4)
ST

Esto puede plantearse también para sistemas que varı́an en el tiempo (caso en el cual
las matrices en (5.1) dependen explı́citamente de t).

Con este planteo tenemos un regulador que en ausencia de perturbaciones (v = 0)


llevará el estado a su condición de equilibrio x = 0, si elegimos K de forma tal que
N

todos los autovalores de Ā tengan parte real negativa.


Esto es posible si el sistema es completamente controlable, o bien si los modos no
controlables son estables.
O

Controlabilidad
C

Formalmente se dice que “un sistema es completamente controlable en tiempo t0 si


por medio de un vector de control no restringido es posible transferir el sistema desde
cualquier estado inicial x(t0 ) a cualquier otro estado en un tiempo finito”.
Si el sistema es invariante en el tiempo, el instante t0 para el cual se plantea el análisis
EN

es irrelevante.

Para entender que significa esto vamos a considerar que significa que el sistema no sea
completamente controlable.

versión (preliminar) 0.2 - pág.122


Supongamos por ejemplo el caso de una vehı́culo propulsado por un cohete para el cual
solo tenemos control de la dirección del vector de empuje (TVC: Thrust Vector Control),
como se ilustra en la figura 5.2a, pero no de su magnitud. Por simplicidad consideremos
el análisis en un plano.

Al desviar el empuje se produce un momento respecto del CG que permite cambiar la


actitud θ del vehı́culo.

N
θ̇ = ω
l
ω̇ = T sin δ
J

IO
Por otra parte, para la posición respecto de una terna geográfica:

ẋ = u

C
ż = w
T
u̇ = fx , fx = sin (θ + δ)
m

C
T
ẇ = fz − g , fz = cos (θ + δ)
m
RU
Linealizando para θ ≈ 0:
        

 ẋ  0 0 0 1 0 0  x  0  0 
 ż       
0 0 0 0 1 0 z 0 0 
  
 
 
 
 
 
 

       
   0
     
θ̇ 0 0 0 0 1 θ 0 0
      
=
0 + δ +
u̇  0 f 0 0 0 
 u  f 0 
ST


    
     
ẇ
0 0 0 0 0 0  w 0 f − g

 
 
 
 
 
 
  
  
  
  
  

ω̇ 0 0 0 0 0 0 ω τ 0
    

donde f = T /m es el empuje especı́fico (fuerza por unidad de masa) y τ = lT /J .


N

Si la acción de control es unicamente δ , el sistema no es completamente controlable.


Podemos notar que con esta única acción de control podemos afectar de forma directa
a la velocidad vertical y a la angular. Esto a su vez por acoplamiento dinámico impactará
O

de forma indirecta en la actitud y en la posición lateral.


Pero no podemos hacer nada para modificar la altura y su derivada.
C

En casos como este, mediante una transformación T adecuada, podemos separar la


dinámica en una parte controlable y otra que no lo és:
      
ẋc Ac Acu xc Bc
EN

= + u
ẋu 0 Au xu 0

donde xc = {x, θ, u, ω} son los estados controlables y xu = {z, w} son los no


controlables (no incluimos las perturbaciones porque no es relevante para este análisis).

El bloque nulo en la matriz de entrada indica que no hay efecto directo del control u
sobre ẋu , mientras que el bloque nulo en la matriz dinámica de debe al desacoplamiento

versión (preliminar) 0.2 - pág.123


N
IO
C
(a) (b)

C
dinámico de xu respecto de xc (que sı́ es afectado por el control), por lo cual tampoco
hay efecto indirecto.
RU
El sistema serı́a completamente controlable si podemos manipular el empuje del motor
T , con lo cual la parte inferior de la matriz de entrada no serı́a nula.

Matriz de Controlabilidad
Se puede demostrar que un sistema es completamente controlable si y solo si la matriz:
ST

B | AB | A2 B | · · · | An−1 B
 
(5.5)

es de rango n, siendo esta la dimensión del vector de estados.


N

Para el ejemplo anterior planteamos:


f = 15;
r = 100; % v a l o r a r b i t r a r i o
O

A = [ zeros ( 3 ) eye ( 3 ) ; zeros ( 3 , 6 ) ] ; A ( 4 , 3 ) = f ;


B = [0 0 0 f 0 r ] ’ ;
C

rank ( c t r b ( A , B ) )

lo cual arroja como resultado un valor 4, lo cual se corresponde a los cuatro estados
controlables antes mencionados.
EN

Regulación y Seguimiento de Referencias


Para el problema del regulador, a partir del lazo abierto (5.1) el modelo de lazo cerrado
serı́a:
ẋ = [A − BK] x + Bv v (5.6)
En este las entradas son las perturbaciones.

versión (preliminar) 0.2 - pág.124


Figura 5.3: servo-sistema por realimentación de estados

Si queremos que nuestro regulador además siga referencias (convertirlo en un

N
servosistema), podemos llevar el origen del espacio de estados al estado de referencia
deseado, lo cual equivale a realimentar la diferencia entre el estado original y el de
referencia, en lugar de usar el vector de estados directamente:

IO
u = −K [x − xr ]
Si solo nos interesa un subconjunto de la variables de estado, para el estado de
referencia podemos plantear una relación de la forma:

C
xr = Br r
donde Br será una matriz con valores nulos para los estados no relevantes. Podrı́a

C
inclusive plantearse una ecuación de salida para definir las variables de interés y a partir
de esto definir Br :
RU
y r = Cr x , Br = C+
r

donde C+
r es la “pseudo-inversa” de Cr .

Con un vector de referencias la realimentación de estados tomará la forma:

u = −K [x − Br r]
ST

Sustituyendo en el modelo de lazo abierto obtenemos para el lazo cerrado:

ẋ = [A − BK] x + [BKBr ] r + Bv v (5.7)


N

Supongamos que planteamos el control de actitud θ en un plano para el ejemplo


precedente usando el modelo:
O

θ̇ = ω
l
ω̇ = T sin δ
J
C

Tomando u = sin δ :
      
θ̇ 0 1 θ 0
= + u
EN

ω̇ 0 0 ω T l/J

Con una referencia r para el ángulo de cabeceo θ:


   
r 1
xr = θ = Br rθ → Br =
0 0

versión (preliminar) 0.2 - pág.125


N
Figura 5.4: servo-sistema por realimentación de estados con acción integral

IO
Acción Integral
En la realimentación de estados es posible incluir acción integral expandiendo el vector
de estados.
Si tenemos un vector de referencias r para ciertas salidas y r = Cr x, podemos definir

C
el error de seguimiento como:

er = r − y r = r − Cr x

C
Si agregamos al modelo una nueva variable de estado:
RU Z t
ζ= er dτ
0

El estado expandido resulta:


       
ẋ A 0 x B 0 u
= +
ST

ζ̇ −Cr 0 ζ 0 I r

En equilibrio ζ̇ = er = 0, por lo cual cualquier realimentación que estabilice el modelo


aumentado garantiza error nulo en estado estacionario.
La acción de control puede escribirse como:
N

 
  x
u = Kp Ki
ζ
O

donde Ki es la matriz de ganancias para la acción integral, mientras que Kp es la matriz


de ganancias para la acción proporcional.
C

5.1.1. Ubicación de Polos


Una forma de definir la matriz de ganancias para una realimetación de estados lineal es
la ubicación de polos. Si se tiene un sistema (5.1) completamente controlable, siempre es
EN

posible elegir K tal que la matriz dinámica de lazo cerrado (5.4) tenga cualquier conjunto
de autovalores que se desee.
Esto es muy simple para una planta de segundo orden con una acción de control escalar:
      
ẋ1 a a12 x1 b
= 11 + 1 u
ẋ2 a21 a22 x2 b2

versión (preliminar) 0.2 - pág.126


En este caso n = 2 y m = 1, por lo cual la matriz de realimentación de estados será de
1 × 2. La ley de control es:
 
  x1
u = − k1 k2
x2

La dinámica de lazo cerrado resulta:


       
a11 a12 b  a a12 b k b1 k 2
− 1 k1 k2 = 11 − 1 1

Ā = [A − BK] =
a21 a22 b2 a21 a22 b2 k 1 b2 k 2

N
 
a − b1 k1 a12 − b1 k2
= 11
a21 − b2 k1 a22 − b2 k2

IO
Los polos de lazo cerrado son los autovalores de Ā, es decir, las raı́ces de su ecuación
caracterı́stica:
 
sI − Ā = s + b1 k1 − a11 b1 k2 − a12

C
b2 k1 − a21 s + b2 k2 − a22
= (s + b1 k1 − a11 ) (s + b2 k2 − a22 ) − (b1 k2 − a12 ) (b2 k1 − a21 )

C
= s2 + (b1 k1 + b2 k2 − a11 − a22 ) s − (b1 k2 − a12 ) (b2 k1 a21 )

Si elegimos n = 2 polos de lazo cerrado p1 y p2 , la ecuaciób caracterı́stica de lazo


RU
cerrado deberı́a ser:

(s − p1 ) (s − p2 ) = s2 − (p1 + p2 ) s + p1 p2

Igualando obtenemos un sistema de dos ecuaciones para ajustar las dos ganancias de
la matriz de realimentación de estados:
ST

b1 k1 + b2 k2 = a11 + a22 − (p1 + p2 )


(b1 k2 − a12 ) (b2 k1 − a21 ) = p1 p2

Control Escalar - Forma Canónica Controlable


N

El cómputo de las ganancias de realimentación para el caso de una acción de control


escalar es simple si el modelo de estados se expresa en la forma canónica controlable.
Por ejemplo, para el caso de segundo orden la forma canónica controlable serı́a:
O

      
ż1 0 1 z1 0
= + u
ż2 a1 a2 z2 b
C

en donde a1 y a2 son los coeficientes del polinomio caracterı́stico de la matriz dinámica:

A(s) = s2 + a1 s + a2
EN

Para esta forma, el polinomio de lazo cerrado con realimentación de estados [k1 k2 ]
resulta:
Alc (s) = s2 + (a1 + k2 ) s + (a1 + k2 )
Si el polinomio deseado es:

Ar (s) = s2 + α1 s + α2

versión (preliminar) 0.2 - pág.127


igualando ambas expresiones tenemos para la realimentación de estados:
k2 = α1 − a1
k1 = α2 − a2
Esto se puede extender a cualquier caso de orden n.
kn = α1 − a1
kn−1 = α2 − a2
..

N
.
k2 = αn−1 − an−1

IO
k1 = αn − an
Como se detalla en [? , cap.10, p. 831], la transformación Tc para llevar cualquier
matriz arbitraria a la forma canónica controlable puede obtenerse mediante la siguiente
composición:

C
Tc = MW (5.8)
donde M se construye de la siguiente forma:

C
M = B | AB | A2 B | · · · | An−1 B
 
(5.9)
donde B es una matriz columna (en este caso arbitraria pero no nula); y la matriz T se
RU
construye de la forma:
 
an−1 an−2 ··· a1 1
an−2
 an−3 ··· 1 0 
W =  ... .. .. .. .. 
(5.10)

 . . . .
 a1 1 ··· 0 0
ST

1 0 ··· 0 0
siendo ak los coeficientes del polinomio caracterı́stico de la matriz A:
|sI − A| = s2 + a1 sn−1 + +a2 sn−2 + · · · + an−1 s + an (5.11)
N

La realimentación de estados K̂ computada para la forma canónica se puede llevar a la


definición original del vector de estados mediante la transformación inversa:
u = K̂z = K̂T−1 x → K = K̂T−1
O

(5.12)
Para el caso de acción de control escalar existe una orma alternativa para este cómputo
denominada formula de Ackermann [Oga10, p. 730].
C

Control Vectorial
En el caso de que el control no sea escalar existen infinitas soluciones para el problema
de la asignación de polos.
EN

En algunos casos es posible obtener soluciones imponiendo relaciones entre las


diferentes componentes del vector de control (por ejemplo, cuando se dan condiciones
de simetrı́a).
Para el caso general podemos usar el comando place(), que implementa el algoritmo
definido en [KND]. En este se aprovechan los grados de libertad en exceso para mejorar
la robustez del lazo minimizando la sensibilidad del lazo cerrado a variaciones en las
matrices de la ecuación de estados.

versión (preliminar) 0.2 - pág.128


5.1.2. Control Optimo Cuadrático
Una estrategia muy usada en el campo aeroespacial es la del control óptimo cuadrático.
Antes de avanzar en el tema se debe advertir que la palabra ”óptimo” deberı́a
descartarse del vocabulario del ingeniero, dado que tal concepto indefectiblemente se
torna abstracto en cualquier aplicación práctica, y en general solo es aplicable en el
campo de las matemáticas.
El control óptimo no produce estrategias ”insuperables” desde el punto de vista práctico
como su nombre podrı́a sugerir, dado que tal cosa es imposible de cuantificar. Lo que

N
ofrece es una herramienta que se usa de forma iterativa para obtener soluciones con un
balance adecuado entre ”velocidad de respuesta” y ”esfuerzo de control”, lo cual resulta
generalmente en soluciones ”robustas”.

IO
Índice de Desempeño Cuadrático
Como en todo problema de optimización, la cuestión central es la de definir un ı́ndice
de desempeño adecuado. Este debe ser una cantidad definida positiva que resulte

C
fı́sicamente significativa y matemáticamente tratable.
En control automático el objetivo general es el de llevar la planta a una determinada
condición estacionaria con el menor esfuerzo posible. Esto puede cuantificarse mediante

C
un ı́ndice de desempeño cuadrático de la forma:
Z t
xT Qx + uT Ru dt

RU
J(t) = (5.13)
0

en donde las matrices Q y R deben ser definidas positivas1 .

Realimentación Óptima para el Caso Lineal


ST

Para un modelo lineal de la forma:

ẋ = Ax + Bu (5.14)

en el caso general con horizonte infinito (t → ∞) la ley de control óptima es de la forma:


N

u = −Kx

siendo:
O

K = R−1 BT P (5.15)
donde la matriz P es solución de la siguiente ecuación algebraica de Ricatti:
C

h i
AT P + PA − P BR−1 BT P + Q = 0 (5.16)
EN

1 Una matriz H es positiva definida si la forma cuadrática V (x) = xT Hx > 0 ∀x 6= 0. Esto se cumple si es real simétrica

con todos sus menores principales son positivos (y en consecuencia todos sus autovalores son positivos)

versión (preliminar) 0.2 - pág.129


Si sustituimos la realimentación de estados en el ı́ndice de desempeño cuadrático (5.21)
tenemos:
Z t 
J(t) = xT Qx + xT KT RKx dt
0
Z t  
= xT Q + KT RKx dt
0

N
El término entre paréntesis es una forma cuadrática que podemos reescribir de la
siguiente forma:

IO
  d
xT Q + KT RK x = − xT Px (5.17)
dt
Con lo cual:
J(t) = −xT Px (5.18)

C
Desarrollando el lado derecho de la ecuación (5.17), y teniendo en cuenta que a lazo
cerrado ẋ = (A − BK) x:

C
d T
− x Px = −ẋT Px − xT Pẋ
dt
RU
T
= −xT (A − BK) Px − xT P (A − BK) x
h i
T
= −xT (A − BK) P + P (A − BK) x

Sustituyendo en (5.17) vemos que:


 
T
(A − BK) P + P (A − BK) = − Q + KT RK (5.19)
ST

Como el lado derecho es una matriz negativa definida (el término dentro del paı́s por
definición es positivo definido) y el lazo cerrado es estable, esta ecuación de Liapunov
tiene una solución P positiva definida.
Por otra parte, como R es una matriz real simétrica, se puede escribir como R = TT T,
N

y con esto:
T
(A − BK) P + P (A − BK) + Q + KT TT TK = 0
O

desarrollando y reagrupando:
h i
AT P + PA + Q + KT TT TK − KT BT P − PBK = 0
C

La parte que depende de la realimentación de estados es el término entre corchetes,


que se puede expresar como:
T 
EN

  −1  −1 
T T T T
TK − T B P TK − T B P

Sustituyendo en (5.18) se deduce que K debe minimizar la expresión:


  −1 T   −1 
xT TK − TT BT P TK − TT BT P x

versión (preliminar) 0.2 - pág.130


ya que los otros términos no dependen de K. Como se trata de una cantidad positiva
definida, el mı́nimo posible es 0. Para lograr el valor nulo:
 −1  −1
TK − TT BT P = 0 → K = T−1 TT BT P = R−1 BT P

que es lo expresado por la ecuación (5.15). Sustituyendo (5.19) se obtiene la expresión


(5.15).

N
En la práctica los coeficientes en las matrices del ı́ndice de desempeño suelen ser
arbitrarios, dado que en general no hay razones sólidas para establecerlos. Pero si

IO
hay criterios para ajustarlos de forma iterativa hasta alcanzar una solución satisfactoria;
entendiendo esto último como lazos cerrados robustos que muestren respuestas rápidas
a los desequilibrios con acciones de control dentro del rango admisible.

C
Selección de las Matrices para el Índice de Desempeño
Si Q y R son matrices diagonales con coeficientes qj , j = 1 : n y rj , j = 1 : m
respectivamente, el ı́ndice será de la forma:

C
Z t
q1 x21 + q2 x22 + · · · + qn x2n + r1 u21 + r2 u22 + · · · + rn u2n dt

J(t) =
RU
0
= q1 I12 + q2 I22 + · · · + qn In2 + r1 J12 + · · · + r1 Jm
2
(5.20)

donde hemos usado las siguientes sustituciones:


Z t Z t
Ik2 = x2k dt , Jk2 = u2k dt (5.21)
ST

0 0

El mı́nimo se alcanza cuando todos los sumandos qk Ik2 y rk Jk2 en (5.20) son iguales, lo
que pone en evidencia el balance entre desequilibrio (x 6= 0) y acción de control (u 6= 0)
que se alcanza minimizando este ı́ndice.
N

Podemos partir considerando matrices diagonales con coeficientes inicializados en


función de los valores máximos que se espera tomen las variables de estado y las
O

acciones de control en situaciones normales (amplitudes máximas esperables en los


estados y lı́mites por actuación máxima para las acciones de control):

1 1
C

qj = , rj = (5.22)
|xj |2max |uj |2max

Estas reglas fueron propuestas por Bryson y Ho en 1975. Si en el modelo (5.14)


los vectores x y u son normalizados con los valores mencionados, Q y R serı́an
EN

inicializadas como diagonales unitarias.


Para la aplicación de la sı́ntesis LQR podemos partir de los valores iniciales dados por
la regla de Bryson, calcular una primer matriz de realimentación óptima con (5.16) y
(5.15), y luego evaluar la respuesta de lazo cerrado resultante (en general tomando una
condición inicial de desequilibrio razonable). En función de este resultado se reajustan
los coeficientes, y se repite el procedimiento de forma iterativa hasta lograr una respuesta
adecuada.

versión (preliminar) 0.2 - pág.131


En cada iteración deberı́amos verificar si la respuesta de lazo cerrado cumple con las
expectativas. Probamos esto viendo la respuesta a una condición inicial con un error en
el lı́mite de la tolerancia, verificando que la respuesta resultante resulte bien amortiguada
sin exigir acciones de control superiores a los lı́mites e actuación máxima:

% Supongamos que est án d e f i n i d a s l a s m a t r i c e s d e l modelo


% de l a p l a n t a [ A B ; C D ]
M = ss ( A , B , C, D ) ;

N
Q = diag ( [ ... ]);
R = diag ( [ ... ]);

IO
K = l q r (M, Q, R ) ;

% Lazo c e r r a d o
% Deberı́amos c o n t a r con una m a t r i z Br para mapear l a s r e f e r e n c i a s
% a l o s estados , aunque para e l comando ’ i n i c i a l ’ l a m a t r i z B

C
% es i r r e l e v a n t e
Ac = A − B∗K ;
Bc = K∗ Br ;

C
% Ecuaci ón de s a l i d a , que muestre l o s estados r e l e v a n t e s para
% e l problema y l a s acciones de c o n t r o l
RU
Cc = [ Br ’ ; −K ] ;
Dc = zeros ( s i z e ( Cc , 1 ) , s i z e ( Bc , 2 ) ) ;

LC = ss ( Ac , Bc , Cc , Dc ) ;
xo = [ . . . . ] ; % c o n d i c i ó n i n i c i a l
ST

i n i t i a l ( LC , xo ) ;

Luego podemos calcular la ubicación de polos de lazo cerrado y las funciones de


sensibilidad que resulten relevantes.
N

Observador de Estados
O

5.2.1. Observador de Luenberger


Observador de Orden Completo
C

Consideremos nuevamente un modelo de estados lineal para la planta, pero ahora con
su correspondiente ecuación de salidas:

ẋ = Ax + Bu + Bv v (5.23)
EN

y = Cx + Du + η (5.24)

Si y 6= x, podemos obtener una estimación del estado x̂ construyendo un sistema


paralelo que responda con la misma dinámica del modelo anterior, en el cual todas las
variables de estado estén accesibles; al cual llamaremos estimador:

x̂˙ = Ax̂ + Bu

versión (preliminar) 0.2 - pág.132


Este podrı́a ser por ejemplo un circuito analógico que responda con la misma esta
dinámica de la planta, y por lo tanto podrı́amos suponer que su estado interno x̂(t)
evolucionará de la misma forma que el estado de la planta x(t).
Si embargo solo podremos decir que x̂ ≈ x si se cumplen las siguientes condiciones:

En el instante inicial x̂(0) = x(0)


Las perturbaciones no medibles son nulas (v = 0)
El modelo utilizado para la estimación es exacto

N
En algunos casos lo primero puede realizarse (un ejemplo son los navegadores
inerciales), pero los puntos restantes rara vez se verifican

IO
Podemos notar que existen discrepancias entre el estimador y la realidad es evaluar con
la estimación lo que se deberı́a medir y comparar esto con la medición real:

C
ŷ = Cx̂ + Du

La solución para el error de del estimador consiste en agregar un término de corrección

C
proporcional a la diferencia y − ŷ :

x̂˙ = Ax̂ + Bu + L (y + η − ŷ)


RU
ŷ = Cx̂ + Du

Esta es la estructura del observador de estado completo propuesto por David Luenberger
en 1966. Veamos si con esto es posible lograr que la estimación converja al estado real.

Definimos el error de estimación como:


ST

e = x − x̂

La dinámica de este error será:

ė = ẋ − x̂˙
N

Sustituyendo:
O

ė = Ax + Bu + Bv v − Ax̂ − Bu − L (y + η − ŷ)
= A (x − x̂) − Ax̂ + Bu − LC (x − x̂) + Bv v + LCη
C

ė = [A − LC] e + Bv v + LCη (5.25)

Se puede elegir la ganancia del observador para ajustar la matriz dinámica del error de
EN

estimación, y con ello asegurar que este error converga a su condición de equilibrio lo
suficientemente rápido.
Ajustar la dinámica del error de estimación es equivalente a diseñar una realimentación
de estados para el denominado sistema dual, definido como:

ż = AT z + CT v (5.26)
T
v = −L z

versión (preliminar) 0.2 - pág.133


En este caso la acción de control no es real, y por lo tanto no estarı́a limitada. Sin
embargo, si se ajusta para lograr una dinámica muy rápida, el modelo deberá ser válido
en un rango de frecuencia muy amplio. Por lo tanto la velocidad de error de estimación
estará limitada por la incertidumbre dinámica del modelo utilizado.

Esta realimentación de estados puede resolverse de forma arbitraria si el sistema dual


es completamente controlable. Sin embargo, se trata de un problema ficticio, en donde
la acción de control no es real. Si embargo la controlabilidad del sistema dual implica
algo que sı́ tiene relación con la fı́sica del problema, que es lo que denominamos

N
observabilidad.

Observabilidad

IO
Se dice que “un sistema es completamente observable si cualquier estado x(t0 ) puede
ser determinado a partir de la observación de la salida y(t) durante un intervalo de
tiempo finito t0 ≤ t ≤ t1 ”.
Si el sistema es invariante en el tiempo, el instante t0 para el cual se plantea el análisis

C
es irrelevante.

En [Zum, sec.2.2.4, p. 60] se realiza un análisis de los ceros de la matriz de transferencia.

C
Entre los conceptos mencionados se destaca que en algunos casos existen modos
naturales del proceso que no son visibles a través de las salidas disponibles. En estos
RU
casos decimos que el sistema no es completamente observable, porque al menos una
parte del estado no afecta las salidas y por lo tanto no puede reconstruirse.
Esto tiene que ver con la dinámica de la planta (a través de la matriz A) y de la relación
entre los estados y las variables medidas (a través de la matriz C).
Al igual que con la controlabilidad, en el caso de observabilidad de orden reducido es
posible separa el estado en una parte observable y otra que no lo es.
ST

Matriz de Observabilidad
Se puede demostrar que un sistema es completamente observable si y solo si la matriz:
 
C
N

 CA 
CA2
 
(5.27)
 
 
..
O

 
 . 
n−1
CA
C

es de rango n, siendo esta la dimensión del vector de estados. Se puede verificar que
la matriz de observabilidad es equivalente a la controlabilidad del sistema dual dado por
(5.26).
EN

Un ejemplo clásico de sistema no observable es el de la navegación inercial.


Supongamos por simplicidad que se desea conocer la posición de un móvil a partir de la
medición de su aceleración en coordenadas inerciales (algo posible si los acelerómetros
se montan en una plataforma giro-estabilizada). En este caso se tendrı́a:

versión (preliminar) 0.2 - pág.134


      
ṗ 0 I p 0
= + u
v̇ 0 0 v I
 
  p
y= 0 0 +u
v

A = [ zeros ( 3 ) eye ( 3 ) ; zeros ( 3 , 6 ) ] ;

N
C = zeros ( 3 , 6 ) ;

rank ( obsv ( A ,C ) )

IO
lo cual arroja como resultado un valor 0, lo cual indica que ninguno de los estados
es observable. Es cierto que la velocidad puede obtenerse integrando la aceleración,
y mediante una nueva integración obtener la posición; pero en este proceso nunca se
puede reconstruir la posición y velocidad inicial a partir de las mediciones.

C
Observador de Orden Reducido

C
Cuando algunas de las variables de estado son accesibles, es posible diseñar un
observador para estimar solo aquellos estados no medibles.
Para ello se puede realizar una transformación T para separar los estados medibles de
RU
aquellos que no lo son:
  
F y
x̂ =
T z
ż = Fz + TBu + Ly
ST

La matriz F ∈ R(n−q)×(n−q) se elige de forma arbitraria pero con autovalores en el


semiplano izquierdo, siendo q la dimensión del vector de salidas. Con esta se elige una
matriz L ∈ R(n−q)×q tal que el par {F, F} sea controlable. Con estas dos matrices se
determina la matriz de transformación T como solución de la ecuación LA − FL = LC.
N

Si la matriz {C T}T resulta singular hay que realizar una nueva elección de L, dado que
para la estimación necesitamos contar con su inversa.
O

El Observador como Filtro


en la ecuación (5.25) se observa que ese mismo ruido de medición afecta directamente
a la derivada del error. Por lo tanto, el efecto sobre el error de estimación estará filtrado
C

por la dinámica del error definida por Ae = A − LC. Esto resulta más eficiente que
un filtro SISO, dado que la medición se combina con la predicción, permitiendo utilizar
mayor información a la hora de filtrar las mediciones.
EN

Esto ofrece un fuerte argumento para utilizar un observador, aun en aquellos casos en
que todo el estado es medible. La contraparte es que los efectos de la perturbación
también serán filtrados con esta misma dinámica, introduciendo cierto atraso para el
rechazo de perturbaciones.

versión (preliminar) 0.2 - pág.135


Observador en Tiempo Discreto
En tiempo discreto implementamos el observador de Luenberger utilizando el modelo de
tiempo discreto para la dinámica de la planta:
xk = Fxk−1 + Guk−1
El observador serı́a:
x̂k = Fx̂k−1 + Guk−1 + L (y h − ŷ)
Si queremos usar y h = y k necesitamos computar ŷ k , pero para eso necesitamos x̂k .

N
Esto hace el cómputo engorroso. Veremos dos opciones:

IO
Observador de Predicción Lo más simple consiste en usar la medición del instante
de muestreo previo para el término de corrección:

x̂k = Fx̂k−1 + Guk−1 + L y k−1 − ŷ k−1

C
El problema en este caso es que existe un retardo de un intervalo de muestreo en la
propagación de la medición.
La dinámica del error estará dada por:

C
ek = xk − x̂k = Fxk−1 + Guk−1 − [Fx̂k−1 + Guk−1 ]
− L (Cxk−1 + Duk−2 − Cx̂k−1 − Duk−2 )
RU
= F (xk−1 − x̂k−1 ) − LC (xk−1 − Cx̂k−1 )
Resultando que:
ek = (F − LC) ek−1
Vemos que matemáticamente esto es análogo al planteo en tiempo continuo, y como en
ST

ese caso puede resolverse como realimentación de estados de un sistema dual.

Observador Actual Para usar la medición actual k podemos usar una estimación “a
priori” del estado actual sin usar el término de corrección para computar la medición
esperada:
N

x̂−
k = Fx̂k−1 + Guk−1
ŷ − −
k = Cx̂k + Duk−1
O


x̂k = x−

k − L y k − ŷ k

El error de predicción resulta:


C

ek = xk − x̂k = Fxk−1 + Guk−1 − [Fx̂k−1 + Guk−1 ]


− L Cxk + Duk−1 − Cx̂−

k − Duk−1
= F (xk−1 − x̂k−1 ) − L [Cxk − C (Fx̂k−1 + Guk−1 )]
EN

= Fek−1 − L [C (Fxk−1 + Guk−1 ) − C (Fx̂k−1 + Guk−1 )]


= (F − LCF) ek−1
Por lo tanto:
ek = (F − LCF) ek−1
Este caso también puede resolverse como realimentación de estados de un sistema
dual, pero en este caso con B = FT CT .

versión (preliminar) 0.2 - pág.136


5.2.2. Realimentación de Estados Observados
Al realimentar estados observados se tendrá para el vector de control:
u = Kx̂
Por lo tanto la dinámica de lazo cerrado será la combinación de la de lazo abierto con la
realimentación de estados precedente y la ecuación del observador:
ẋ = Ax + Bu

N
˙ = Ax̂ + Bu + L (y − ŷ)

u = Kx̂
y = Cx + Du

IO
ŷ = Cx̂ + Du
Sustituyendo:
ẋ = Ax − BKx̂

C
˙ = [A − BK] x̂ + LC (x − x̂)

C
o bien:     
ẋ A −BK x
˙ = LC
x̂ A − BK − LC x̂
RU
Para tener una visión más clara de este resultado realizamos un cambio de coordenadas,
teniendo en cuenta que por la definición del error de estimación:
e = x − x̂ → x̂ = x − e
Entonces podemos replantear la dinámica de lazo cerrado como:
ST

    
ẋ A − BK BK x
=
ė 0 A − LC e
El polinomio caracterı́stico para esta dinámica es:
Alc (s) = |sI − (A − BK)| |sI − (A − LC)|
N

Vemos entonces que los autovalores o polos de lazo cerrado son los de la realimentación
de estados reales combinados con los de la dinámica del error de estimación. Por lo tanto
O

el diseño de la realimentación de estados y el del observador son independientes entre


sı́.
Naturalmente se deberı́a procurar que la dinámica de lazo cerrado esté dominada por
C

los autovalores de A − BK, por lo cual el error de estimación deberı́a ser en general
más rápido.

5.2.3. Filtro de Kalman


EN

Estimación Óptima
Sean dos estimaciones x1 y x2 de una variable real x con error n1 y n2 de media nula y
varianza v1 y v2 respectivamente:
E n21 = v1

x1 = x + n1 , E {n1 } = 0 ,
E n22 = v2

x2 = x + n2 , E {n2 } = 0 , (5.28)

versión (preliminar) 0.2 - pág.137


Asumimos que los errores no están correlacionados entre sı́:
E {n1 n2 } = 0 (5.29)
Proponemos combinar ambas estimaciones para obtener una más precisa:
x̂ = αx1 + βx2 , β =1−α
El error de estimación será:
e = x̂ − x

N
El valor medio de este error es nulo, como ocurre con las estimaciones originales:
E {e} = E {x̂} − E {x}
= αE {x1 } + βE {x2 } − x

IO
= [α + β − 1] x + αE {n1 } + βE {n2 }
=0
La varianza serı́a por definición:

C
n o
2
E e = E (x̂ − x) = E x̂2 + E x2 − 2E {x̂x} = E x̂2 + x2 − 2xE {x̂}
 2   

C
Expandiendo el cuadrado de la estimación:
x̂2 = α2 x21 + β 2 x22 + 2αβx1 x2
RU
= α2 x2 + n21 + 2xn1 + β 2 x2 + n22 + 2xn2 + 2αβ x2 + (n1 + n2 ) x + n1 n2
   

= α2 + β 2 + 2αβ x2 + α2 n21 + β 2 n22 + 2 α2 n1 + β 2 n2 + αβ (n1 + n2 ) x + 2αβn1 n2


  

2
= (α + β) x2 + α2 n21 + β 2 n22 + 2α (α + β) xn1 + 2β (α + β) xn2 + 2αβn1 n2
= x2 + α2 n21 + β 2 n22 + 2 (αn1 + βn2 ) x + 2αβn1 n2
ST

El valor esperado de este cuadrado serı́a:


E x̂2 = x2 + α2 E n21 + β 2 E n22 + 2 (αE {n1 } + βE {n2 }) x + 2αβE {n1 n2 }
  

= x2 + α2 E n21 + β 2 E n22
 

en donde se han tenido en cuenta lo planteado en (5.28) y (5.29).


N

2
E e2 = α2 v1 + (1 − α) v2 = α2 (v1 + v2 ) − 2αv2 + v2


Buscamos el valor de α que minimice la varianza de la estimación:


O


∂E e2 v2
= 2α (v1 + v2 ) − 2v2 = 0 → α=
∂α v1 + v2
C

con lo cual:
v1 v2
E e2 = v̂ =

v1 + v2
que es la media geométrica de las varianzas originales.
EN

Puede notarse que:


v̂ v̂
α= , β=
v1 v2
Esto se puede aplicar de forma recursiva para incluir mediciones adicionales. Con tres
muestras:
v 1 v2 v 3 v̂ v̂ v̂
E e2 =

, α= , β= , γ=
v1 v2 + v2 v3 + v1 v3 v1 v2 v3

versión (preliminar) 0.2 - pág.138


Varianza en el caso de Vectores
covarianza La covarianza es el valor esperado de la desviación simultánea de dos
variables aleatorias respecto de sus valores medios:

cov(x, y) = E {(x − x̄) (y − ȳ)} = E {x · y} − x̄ȳ (5.30)

Cuando las variables son vectores de media nula:

cov(x, y) = E x y T

(5.31)

N
lo cual da como resultado una matriz simétrica. En el caso de un único vector, la varianza
es la matriz de covarianza dada por:

IO
cov(x) = E x xT

(5.32)

en donde los elementos de la diagonal se corresponden a las varianzas de cada


componente del vector; y los elementos restantes corresponden a covarianzas entre

C
las diferentes componentes del vector.
Si no hay relación estadı́stica entre las diferentes componentes, los elementos no
diagonales serán nulos. Es fácil por lo tanto intuir el significado de los autovalores y

C
autovectores de dicha matriz.

propagación Veamos como computar la covarianza de un vector luego de aplicar un


RU
operador matricial:

y = Ax , cov(x) = P

Considerando la definición de covarianza:


n o n o
ST

T
cov(y) = E y y T = E Ax [Ax] = E Ax xT AT = APAT

(5.33)

Estructura del Filtro


Para implementar una realimentación de estados se requiere de un proceso de
observación, aun cuando todo el estado sea medible. Incluso debe notarse que el
N

proceso de observación no es un simple accesorio de la realimentación de estados,


sino que trasciende incluso el campo del control automático.
Es conocido el hecho de que la sı́ntesis de un observador puede plantearse como el
O

control de un sistema dual, pero conceptualmente el objetivo del diseño es diferente.


Más allá de estas consideraciones, el proceso equivalente de la sı́ntesis LQR para el
observador es el filtro de Kalman.
C

Sea el modelo lineal:

ẋ = Ax + Bu + Bw w (5.34)
EN

y = Cx + Du + v (5.35)

en donde x ∈ Rn , u ∈ Rm y y ∈ Rl . Los vectores w ∈ Rw y v ∈ Rl son ruidos


blancos gausianos con media nula; denominados ruido de proceso y ruido de medición
respectivamente:

w = N (0, W) , v = N (0, R)

versión (preliminar) 0.2 - pág.139


donde N (y, Y) denota un proceso aleatorio con función de densidad de probabilidad
normal de valor medio y y matriz de covarianza Y .
El último término del lado derecho de (5.34) se puede sustituir por un vector w̄ =
Bw w ∈ Rn . La covarianza para w̄ será:
   
T
E w̄w̄T = E Bw w [Bw w] = E Bw wwT BTw


= Bw E wwT BTw = Bw WBTw = Q




El objetivo es obtener la mejor estimación en función de Q y R, entendido esto como la

N
minimización de la covarianza en el error de estimación P:

e = x − x̂ = N (0, P)

IO
En general este algoritmo se implementa en tiempo discreto:

C
xk+1 = Fxk + Guk + w̄k
y k = Cxk + Duk + v k

C
donde F y G son las matrices del modelo de tiempo discreto:
n o Z ts
−1 −1
F = Φ(ts) = L [sI − A] , G= Φ(t − τ )B dτ
RU
t=ts 0

Para tiempo discreto Q = Gw WGTw .

El proceso de observación normalmente se implementa en un primer paso de predicción:

x̂−
k+1 = Fx̂k + Guk
ST

Esta predicción será más incierta que la estimación previa x̂k debido a los ruidos de
proceso que no pueden incluirse en esta etapa por ser desconocidos.
La covarianza de dicha estimación a priori x̂−
k+1 será:

P− T
k = FPk−1 F + Q (5.36)
N

La estimación a posteriori surge de utilizar la estimación a priori con una corrección


pesada por esta ganancia:
O

ŷ k = Cx̂−
k + Duk
x̂k = x̂−
k + Kk (y k − ŷ k )
C

Para esta fase de corrección primero se debe calcular la matriz de ganancias de Kalman,
que minimiza la covarianza de la estimación ası́ obtenida:
 −1
Kk = P− C T
C P − T
C + R (5.37)
EN

k k

La covarianza para el error de esta estimación es:

Pk = (I − Kk C) P−
k (5.38)

Si el modelo es completamente observable, tanto Kk como Pk convergen a valores


de estado estacionario; que pueden utilizarse para implementar un control por
realimentación de estados invariante en el tiempo.

versión (preliminar) 0.2 - pág.140


Estado estacionario
En el caso de sistemas observables la ganancia de Kalman converge a un valor de
estado estacionario.
En tiempo continuo esta ganancia se puede obtener por optimización cuadrática del
sistema “dual”, tomando para el ı́ndice de desempeño cuadrático las matrices Q y R de
covarianza para el ruido de proceso y medición respectivamente.
En otras palabras, el filtro de Kalman invariante en el tiempo es el dual del regulador
LQR ([Tew11, pág. 81]).

N
Esto implica que podemos obtener la ganancia de estado estacionario computando un
regulador LQR para el sistema dual:

IO
ż = AT z + CT y

con un ı́ndice de desempeño definido con la convarianza del ruido de proceso Q y la del
ruido de medición R.

C
5.2.4. Control Optimo Gausiano

C
Control LQG/LTR
La combinación de un regulador LQR con un filtro de Kalman se conoce como control
RU
LQG (Linear Cuadratic Gausian). Aunque ambos son algoritmos óptimos en cierto
sentido y el regulador LQR tiene buenas propiedades de robustez.
Si bien es cierto que el diseño del regulador y el del observador son problemas
independientes, esta combinación no resulta necesariamente robusta [SP01, Tew11].
ST
N
O
C
EN

versión (preliminar) 0.2 - pág.141


EN
C
O
N
ST
RU
C
C
IO
N
N
A

IO
C
Apéndices

C
RU
Modelos Dinámicos
ST

A.1.1. Modelos de Estado


Un modelo matemático general para un proceso dinámico es la ecuación de estados de
la forma:
N

ẋ = f (x, u, t) (A.1)
donde x ∈ Rn es el vector de estado, u ∈ Rm es un vector de acciones exógenas
O

independientes del estado y t ∈ R es el tiempo. Este es un modelo general no-lineal y


variante en el tiempo.
Sin embargo, en la mayor parte de los problemas en ingenierı́a se puede plantear algo
C

un poco más restrictivo sin perder demasiada generalidad:

ẋ = f (x, t) + g(x, t)u(t) (A.2)

Este modelo es “afı́n”(lineal) respecto de la entrada u.


EN

En ingenierı́a es importante también modelar la relación entre la información disponible


(salidas) y el estado. De forma general esto se describe mediante un mapeo no-lineal
entre el vector de estados y el vector de salidas y ∈ Rl que normalmente refiere a las
variables medidas:
y = h(x, u) (A.3)

143
El modelo completo resulta:

ẋ = f (x, t) + g(x, t)u(t) (A.4)


y = h(x, u)

A.1.2. Modelos Lineales


Podemos obtener una aproximación lineal del modelo (A.4) truncando su desarrollo en
serie de Taylor alrededor de una condición de equilibrio: f (x0 , u0 ) = 0.

N
El modelo lineal resulta:

ẋ = A∆x + B∆u (A.5)

IO
y = C∆x + D∆u

donde:

∂f
A= , ∆x = x − x0

C
∂x x0 ,u0

∂f
B= , ∆u = u − u0

C
∂u x0 ,u0

∂h
C=
∂x x0 ,u0
RU

∂h
D=
∂u x0 ,u0

Si reciclamos las letras x y u para sustituir a ∆x y ∆u respectivamente llegamos a la


ST

notación habitual de la ecuación de estados lineal:

ẋ = Ax + Bu (A.6)
y = Cx + Du (A.7)
N

Podemos aplicar la transformada e Laplace para obtener una solución del modelo lineal:

X(s) = Φ(s) [x(0) + BU (s)] (A.8)


O

Y (s) = CX(s) + DU (s)

siendo Φ(s) la transformada de Laplace de la matriz de transición de estados:


C

 
φ11 (s) φ12 (s) ··· φ1n (s)
−1
 φ21 (s) φ22 (s) ··· φ2n (s) 
Φ(s) = [sI − A] = . (A.9)
 
.. .. .. 
 .. . . . 
EN

φn1 (s) φn2 (s) · · · φnn (s)


Esta es la solución de la ecuación de estados en el dominio de la variable s. Anti-
transformando llegamos a la solución general de la ecuación de estados lineal en el
dominio del tiempo:
Z t
x(t) = Φ(t)x(0) + Φ(t − τ )Bu(τ )dτ (A.10)
0

versión (preliminar) 0.2 - pág.144


siendo: n o
−1
Φ(t) = L −1 [sI − A] = eAt (A.11)

El modelo lineal se puede sintetizar en una única matriz de la forma:


    
ẋ A B x
= (A.12)
y C D u

Modelos de Procesos con Dinámica de Sensores y Actuadores

N
Frecuentemente en control automático se plantean modelos para la dinámica de los
procesos a controlar, identificando las acciones de control u y las variables medidas
y , asumiendo que estas tienen una relación estática (instantánea) con las salidas y

IO
entradas del sistema de control. Sin embargo en general esta interacción entre el
proceso y el controlador se da por medio de sensores y actuadores cuyas dinámicas
no aparecen inicialmente en el modelo del proceso.

C
Esto se da por ejemplo al analizar la dinámica del avión, al asumir que la deflexión de
las susperficies de control aerodinámico o el empuje son acciones de control (pueden
ser manipuladas directamente), cuando el realidad las acciones de control son señales

C
enviadas a un actuador (servomecanismos en el caso de las superficies aerodinámicas)
que se encarga de ejecutar este movimiento.
RU
En tanto la dinámica de estos actuadores resulta rápida respecto de la dinámica de lazo
cerrado que se pretende lograr, no incluirlos en el modelo es admisible. Algo similar
puede decirse de los sensores.
Cuando esto no es ası́ se requiere contar al menos con un modelo de la dinámica
dominante de los actuadores y de los sensores, para fusionarlo con el modelo del
ST

proceso principal.

Supongamos que tenemos un modelo de estados (A.6) para el proceso. Si llamamos xa


al vector de estados de estos últimos, y consideramos que la salida de los mismos y a
son las acciones de control, podemos modelar su dinámica como:
N

ẋa = Aa xa + Ba v
y a = Ca xa + Da v ≡ u
O

donde v es el vector de comandos (entradas) para los actuadores.


Por sustitución obtenemos un modelos para el proceso “aumentado” con la dinámica de
C

los actuadores:
      
ẋ A BCa x BDa
= + v (A.13)
ẋa 0 Aa xa Ba
EN

 
  x
y = C DCa + DDa v
xa

De la misma forma podemos incluir la dinámica de los sensores:

ẋs = As xs + Bs y
y s = Cs xs + Ds y

versión (preliminar) 0.2 - pág.145


Incorporando esto al modelo anterior:
      
 ẋ  A BCa 0 x BDa
ẋa =  0 Aa 0  xa +  Ba  v (A.14)
ẋs Bs C Bs DCa As xs Bs DDa
   
 
  x 
y = Ds C Ds DCa Cs xa + Ds DDa v
xs
 

N
A.1.3. Matriz de Transferencia
A partir de la solución en Laplace (A.8) podemos despejar una relación entre entradas y

IO
salidas:
−1 −1
Y (s) = {C [sI − A] B + D}U (s) + C [sI − A] x(0) (A.15)

El término entre llaves es lo que se denomina matriz de transferencia, que relaciona

C
el efecto de las entradas sobre las salidas partiendo de condiciones iniciales nulas
(equilibrio):
−1

C
G(s) = C [sI − A] B+D (A.16)
En sı́ntesis podemos decir que:
RU
Y (s) = [CΦ(s)] x(0) + G(s)U (s)

De forma expandida:
 
     U1 (s) 
Y1 (s) G11 (s) G12 (s) · · · G1m (s)  
 U2 (s)
   

..  .. .. .. ..
ST

. = . . . .  ..
 . 
  
Yl (s) Gl1(s) Gl2(s) · · · Gln (s) 
   
Um (s)

Función de Transferencia
N

Cada elemento Gij (s) es una función racional cuyo denominador es el polinomio
caracterı́stico de la matriz A, de orden n, y el numerador es un polinomio como máximo
de orden n, si D 6= 0, o a lo sumo n − 1 si D = 0.
O

Esta función relaciona la transformada de Laplace una determinada variable de salida


Yi (s) respecto de la transformada de Laplace de una entrada Uj (s):

Yi (s) b0 sn + b1 sn−1 + · · · + bn−1 s + bn


C

Gij (s) = = n (A.17)


Uj (s) s + a1 sn−1 + · · · + an−1 s + an

Respuesta en Frecuencia
EN

Para entradas senoidales la respuesta en régimen estacionario también es senoidal y


con la misma frecuencia ω que la entrada, pero con amplitud amplificada o atenuada y un
desfasaje que depende resulta del módulo y el argumento de la función de transferencia
entre entrada y salida evaluada en s = jω (a lo que llamamos respuesta en frecuencia):

yss = B sin (ωt + φ) , B = |G(jω)| A , φ = ∠G(jω)

versión (preliminar) 0.2 - pág.146


A.1.4. Modelos en Tiempo Discreto
Al diseñar controles digitales es necesario considerar el hecho de que estos sistemas
solo operan sobre un muestreo de las señales de salida.
Necesitamos por lo tanto un modelo que describa la dinámica desde esa perspectiva.
Matemáticamente usamos un modelo de tiempo discreto (o “estroboscópico”), que
muestre la relación entre los estados o salidas del sistema entre diferentes instante de
muestreo.

N
Modelo de Estados
Podemos evaluar la solución de la ecuación de estados (A.10) entre dos instantes de
muestreo consecutivos ta = kts y tb = (k + 1)ts :

IO
Z tb
x(tb ) = Φ(tb − ta )x(ta ) + Φ(t − τ )Bu(τ )dτ
ta

C
Como el sistema es invariante en el tiempo podemos decir que:
Z ts
x(tb ) = Φ(ts )x(ta ) + Φ(t − τ )Bu(τ )dτ

C
0

Si asumimos que entre intervalos de muestreo el vector de entradas no cambia


(retención de orden cero - ZOH):
RU
Z ts 
xk+1 = Φ(ts )xk + Φ(t − τ )dτ Buk
0

donde xk = x(kts ) y uk = u(kts ). Ma matriz de transición de estados Φ(t) evaluada en


el intervalo t = ts es una matriz de constantes F ∈ Rn×n , La integral evaluada en dicho
ST

intervalo es una matriz constante H ∈ Rn×m .


La ecuación de salida no cambia en tiempo discreto, dado que no es una relación
dinámica.

El modelo de estados en tiempo discreto resulta:


N

xk+1 = Fxk + Huk (A.18)


O

y k = Cxk + Duk
donde Z ts
C

F = Φ(ts ) , H= Φ(t − τ )B
0

El modelo (A.18) es una ecuación en diferencias que relaciona el estado en un instante


de muestreo con su valor en un tiempo de muestreo precedente y las perturbaciones
EN

aplicadas en dicho intervalo.

Transformada Z
De la misma forma que ocurre con el modelo de tiempo continuo (A.6), la solución para
una ecuación en diferencias como lo és el modelo de tiempo discreto (A.18) no puede
obtenerse de forma algebraica. Pero al igual que en el caso continuo es posible convertir
el modelo discreto en una expresión algebraica aplicando la transformada Z.

versión (preliminar) 0.2 - pág.147


Podemos llegar a esta aplicando la transformada de Laplace al muestreo de una señal.
Este muestreo puede expresarse matemáticamente como la convolución de esta señal
con un tren de impulsos unitarios:

X
s(t) = δ(t − nts )
n=0

La señal muestreada y ∗ en el dominio del tiempo continuo resulta:


∞ ∞

N
X X
y ∗ (t) = y(t)δ(t − nts ) = y(nts)δ(t − nts)
n=0 n=0

IO
Aplicando Laplace:

" #
Z ∞ X
L {y ∗ (t)} = y(nts )δ(t − ns ) e−st dt
0 n=0

C
∞ Z
X ∞
y(nts)δ(t − nts ) e−nts s dt

=
n=0 0

C
Como s(t) = 0∀t 6= nts , podemos sustituir st por nts s en el exponente y reemplazar la
integral por la sucesión y(n · ts):
RU

X
L {y ∗ (t)} = y(nts ) e−nts s
n=0

Definimos un nuevo espacio complejo z :


ST

z = e−ts s (A.19)

con lo cual obtenemos la transformada Z de la señal muestreada:



X
Z {y(t)} = Y (z) = y(nts ) z −n
N

(A.20)
n=0

Puede notarse que la expansión de la transformada Z es la serie:


O

Z {y(t)} = y(0) + y(ts )z −1 + y(2ts )z −2 + y(3ts )z −3 + · · ·


= y0 + y1 z −1 + y2 z −2 + y3 z −3 + · · ·
C

que los coeficientes de la serie se corresponden con el muestreo de la señal.

Puede notarse que, al igual que la transformada de Laplace, la transformada Z es un


EN

operador lineal:

X
Z {x(t) + y(t)} = [x(nts ) + y(nts )] z −n = Z {x(t)} + Z {y(t)}
n=0
X∞
Z {αy(t)} = αy(nts ) z −n = αZ {y(t)}
n=0

versión (preliminar) 0.2 - pág.148


La propiedad mas importante para nosotros está relacionada con el desplazamiento en
el tiempo:

X
Z {y(t + ts )} = y(nts + ts ) z −n
n=0
Si definimos k = n + 1 podemos reescribir esto de la forma:

X ∞
X
Z {y(t + ts )} = y(kts ) z −k+1 = y(kts ) z −k z
k=1 k=1

N
Por lo tanto:
Z {y(t + ts )} = z Z {y(t)} − y(0)z (A.21)
Usando un razonamiento similar se demuestra que:

IO
Z {y(t − ts )} = z −1 Z {y(t)} (A.22)
Podemos notar en esto un paralelismo con la transformada de Laplace. Para esta la
variable compleja s representa al operador derivada en el tiempo, y s−1 la integral.

C
Para la transformada Z la variable compleja z representa un operador de desplazamiento
hacia adelante en el tiempo de magnitud ts , y su inversa z −1 un atraso temporal de igual
amplitud.

C
Solución del Modelo de Estados Discreto
De forma similar a la solución del modelo de tiempo continuo con Laplace, podemos
RU
aplicar la transformada z al modelo de tiempo discreto (A.18) recurriendo a la propiedad
(A.21) para convertirlo en una expresión algebraica:
zX(z) − zx0 = FX(z) + HU (z)
por lo tanto
ST

[zI − F] X(z) = zx0 + HU (z)


con lo cual obtenemos una solución en el espacio z:
X(z) = φ(z) [zx0 + HU (z)]
donde
N

−1
φ(z) = [zI − F]
Esto es matemáticamente igual a la solución de tiempo continuo A.8. Dado que se trata
de un operador lineal, la transformada Z inversa se puede calcular de forma directa a
O

través de tablas como se hace con Laplace.


Esta solución es exacta para perturbaciones con retención de orden cero (si no lo son se
puede buscar una función equivalente) y coincide en ese caso con la solución de tiempo
C

continuo, aunque solo arroja información para los instantes de muestreo.

Matriz de Transferencia
Aplicando también la transformada Z a la ecuación de salida y despejando para
EN

condiciones iniciales nulas encontramos la matriz de transferencia discreta; que tiene


la misma estructura que la de tiempo continuo:
−1
G(z) = C [sI − F] H+D (A.23)
Los elementos de esta matriz son funciones de transferencia discretas, y relacionan
muestreos de una entrada con los muestreos de una salida. Son funciones racionales de
la forma (A.17) y se pueden descomponer en fracciones parciales en la forma habitual.

versión (preliminar) 0.2 - pág.149


N
IO
C
Figura A.1: curvas de frecuencia natural y amortiguamiento constantes en el plano z

C
Estabilidad del Modelo Discreto y Mapeo s-z
La ecuación (A.19) define un “mapeo” entre el pano s y el plano z:
RU
z = e−ts s = e−ts Re{s}−ts jIm{s} = e−ts Re{s} e−jts Im{s} (A.24)
Es evidente que:
|z| = e−ts Re{s} , ∠z = e−jts Im{s} (A.25)
ST

Por lo tanto una recta Re {s} = cte (vertical) en el plano s es una circunsferencia de
radio e−ts Re{s} en el plano z , mientras que una recta Im {s} = cte (horizontal) en el
plano s es una radial con ángulo e−ts Im{s} en el plano z . Debe tenerse presente que la
parte real en s define el tiempo de establecimiento en el caso estable, o el tiempo para
duplicar la amplitud en el inestable. Esto en el plano z queda entonces asociado a la
N

distancia al origen.
A su vez, la parte imaginaria en s define la frecuencia de oscilación en el caso sub-
amortiguado. En el plano z esto se mapea a una lı́nea radial.
O

En particular, el eje imaginario Re {s} = 0, que es el lı́mite de estabilidad para el


modelo continuo, se mapea en el cı́rculo unitario en el plano z . La totalidad de semiplano
izquierdo C− en s se mapea en un disco de radio 1, mientras que el semiplano derecho
C

C+ en s se transforma en el exterior del circulo unitario en z .

A su vez las lineas radiales y las circunsferencias en el plano s son particularmente


por representar lugares de amortiguamiento y frecuencia natural constante para polos
EN

complejos conjugados. El mapeo al plano z se muestra en la figura A.1. Puede notarse


que las radiales y circunsferencias en s se intersectan con ángulos de 900 , al igual
que lo hacen los correspondientes mapeos en z , dado que la transformación (A.19) es
conforme.

Finalmente mencionemos un punto especial, s = 0 que está asociado a una integración


temporal. Este punto se mapea a z = +1.

versión (preliminar) 0.2 - pág.150


N
Figura A.2: Cómputo de respuesta al escalón con el modelo continuo y uno de tiempo discreto con retención de orden cero

IO
El caso más simple es el de una dinámica de primer orden:

C
ẋ = −a x + b u
y = cx

C
La matriz de transición de estados para este caso es escalar:
1
RU
φ(s) = → φ(t) = e−at
s+a
Si a > 0 es una dinámica estable sobre-amortiguada.
La matriz de transferencia también es escalar:
Y (s) b
=
ST

U (s) s+a
El modelo en tiempo discreto será:

xk+1 = ā xk + b̄ uk
yk = c xk
N

donde
b
ā = e−ats 1 − e−ats
  
→ b̄ =
O

a
La matriz de transición de estados discreta es:
1
C

φ(z) =
s − ā
y la función de transferencia discreta resulta:
EN

Y (z) b̄
=
U (z) s − ā
El polo en el modelo continuo está en s = −a (semiplano izquierdo) mientras que para
el modelo discreto es z = e−ats (interior del circulo unitario).
En la figura A.2 se ve la respuesta al escalón calculada con el modelo continuo y con el
discreto.

versión (preliminar) 0.2 - pág.151


En las librerı́as de control existe un comando c2d() que permite obtener un modelo
discreto a partir de un continuo.

Estado Estacionario
Los valores de una señal en estado estacionario para el modelo de tiempo contı́nuo se
pueden determinar a partir del teorema del valor final. Para modelos de tiempo continuo
se tiene:
yss = lı́m y(t) = lı́m s Y (s)
t→∞ s→0

N
En tiempo discreto este teorema toma la siguiente forma [Oga96, p.6]:

yss = lı́m y(k) = lı́m−1 (z − 1) Y (z) (A.26)


k→∞ 1→z

IO
lo cual es consistente con el hecho de que el modelo discreto del escalón unitario es
−1
1 − z −1 .
Esto implica que para determinar la ganancia a frecuencia cero a partir de una función

C
de transferencia discreta G(z) debemos computar G(1).

Respuesta en Frecuencia

C
La respuesta en frecuencia del proceso operando en tiempo discreto puede obtenerse
reemplazando z = ejωt en la función discreta, en concordancia con el mapeo en el plano
s y el plano z .
RU
Debe observarse que para un determinado modelo continuo, la respuesta en frecuencia
discreta no coincide con la continua; dado que para el modelo discreto hay un dispositivo
de retención a la entrada. Podrı́amos decir que la respuesta en frecuencia discreta se
corresponde con la respuesta en régimen estacionario del proceso continuo con una
entrada senoidal procesada por una retención de orden cero.
ST

Con la retención, a la frecuencia de Nyquist la senoidal se convierte en una onda


cuadrada.

Se puede notar que al sustituir z = ejωt , la expresión resultante ya no es una función


racional de la variable ω . Esto hace que las caracterı́sticas de superposición de la
respuesta en frecuencia continua no se repliquen en la discreta, complicando el análisis
N

en frecuencia.

Para lidiar con este inconveniente se puede aplicar una segunda transformación al
O

modelo continuo, esto es, mapear el plano z a otro plano que denominaremos w
mediante la transformada bilineal, también conocida como método de Tustin; definida
como [Oga96, p.228]:
C

ts
1+ w 2 z−1
z= 2 → w= (A.27)
ts ts z + 1
1− w
EN

2
Esta transformada mapea el interior del cı́rculo unitario del plano z en el semiplano
izquierdo del plano w, llevando el cı́rculo unitario en z al eje imaginario en w.
En el plano w la respuesta en frecuencia vuelve a ser una función racional, pero en
términos de una frecuencia ficticia ν relacionada no-linealmente con la frecuencia real ω :
2 ts
Im {w} = ν = tan ω (A.28)
ts 2

versión (preliminar) 0.2 - pág.152


Se puede verificar que el rango {−ωs /2 : ωs /2} para ω se mapea en {−∞ : +∞} para
ν . Por lo tanto ν = ∞ se corresponde con la frecuencia de Nyquist.

Desde el punto de vista de las gráficas de bode, la respuesta discreta expresada en


términos de la frecuencia ficticia ν tiene las mismas propiedades que la respuesta en
frecuencia continua en cuanto a trazas asintóticas y superposición de términos en serie.

A.1.5. Aproximación Discreta de Controles Continuos

N
Ver [sW04, cap.8, p. 293].

IO
C
C
RU
ST
N
O
C
EN

versión (preliminar) 0.2 - pág.153


Diagramas en Bloques
Para el control automático los diagramas en bloques son representaciones gráficas de la
dinámica de los sistemas, y se construyen con tres tipo de elementos:
señales
bloques
puntos de suma
Las señales representan variables escalares o vectoriales que evolucionan en el tiempo.

N
Los bloques son transformaciones aplicadas sobre las señales, y los puntos de suma
son bloques especiales que representan adición sustracción de señales.

IO
Un ejemplo muy simple es el de un modelo masa-resorte-amortiguador:

C
C
mv̇ = f − fr − fb ṗ = v fr = k · p fb = b · v (A.29)
donde f es una fuerza externa, mientras que las expresiones para fr y fb son modelos
RU
para los fenómenos elásticos y disipativos respectivamente.
La ecuación diferencial puede escribirse de forma más significativa dejando en claro las
relaciones causa-efecto de la siguiente forma:
Z t Z t
v= (fr + fb + fp ) dt p= vdt (A.30)
0 0
ST

Partiendo de esto podemos describir el modelo dinámico mediante el siguiente diagrama:


N
O
C

Como en este caso el modelo es lineal, podemos aplicar la transformada de Laplace para
obtener expresiones algebraicas. De esta forma es posible operar para encontrar alguna
relación entre una variable de entrada y cualquiera de las señales. Con la transformada
de Laplace convertimos el operador derivada en un producto por la variable s:
EN

versión (preliminar) 0.2 - pág.154


Los bloques enmarcados en azul están conectados en serie, y por lo tanto se pueden
sustituir por un solo equivalente al producto de ambos: 1/ms. Este podrá luego
combinarse con el integrador a su la derecha, pero antes será necesario tomar la señal
V (s) que entra al bloque b de otro lugar. Si tomamos V (s) de la salida del integrador de
la derecha cometemos un error, pero este puede ser corregido multiplicando la señal por
su inversa s.

N
IO
El bloque del recuadro verde incluye dos términos que toman una misma señal de
entrada (P (s)) y la suman (o restan) a una misma señal resultante. Estos bloques en

C
paralelo pueden ser sustituidos por uno que equivalga a la suma de ambos:

C
RU
El resultado tiene una estructura genérica de la forma:
ST

En este caso G(s) = 1/ms2 y H(s) = bs + k .


Si llamamos Z(s) al término emergente del punto de suma (que es entrada de G(s))
N

tenemos que:
Z(s) = X(s) − H(s)Y (s)
O

y además:
Y (s) = G(s)Z(s)
Despejando Z(s) y sustituyendo en lo anterior:
C

Y (s) = G(s) [X(s) − H(s)Y (s)] = G(s)X(s) − G(s)H(s)Y (s)


Despejando:
Y (s) G(s)
EN

= (A.31)
X(s) 1 + G(s)H(s)
Para nuestro ejemplo:
1
P (s) ms2 1
= =
F (s) bs + k ms2 + bs + k
1+
ms2

versión (preliminar) 0.2 - pág.155


N
IO
C
C
RU
ST
N
O
C
EN

Figura A.3: Reducción del diagrama en bloques para el modelo de 1/4 de auto con 2 grados de libertad

versión (preliminar) 0.2 - pág.156


En casos complejos la reducción de un diagrama en bloques puede ser mucho más
directa que sustituir y despejar.

Por ejemplo, para un modelo de 1/4 de auto para la suspensión con dos grados de
libertad:

N
IO
C
Con modelos lineales de elasticidad y amortiguamiento:

C
M ẇ = f1 f1 = k + b˙
RU
mẇr = f2 − f1 f2 = kr δ + br δ̇
ż = w , żr = wr ,  = z − zr , δ = zr − h

siendo h la altura del terreno, z y zr son las alturas de la carrocerı́a y la masa de la


rueda medidas desde su posición de reposo bajo la acción de la gravedad. Aplicando la
transformada de Laplace:
ST

1
M s2 Z(s) = F1 (s) → Z(s) = F1 (s)
M s2
1
ms2 Zr (s) = F2 (s) − F1 (s) → Zr (s) = [F2 (s) − F1 (s)]
ms2
N

F1 (s) = (bs + k) [Z(s) − Zr (s)]


F2 (s) = (br s + kr ) [Zr (s) − H(s)]
O

Con esto planteamos el diagrama superior de la figura A.3. Luego reducimos el diagrama
hasta obtener un solo bloque que transforme la señal de entrda (en este caso la altura
del terreno) con la de salida (la altura de la carrocerı́a).
C

Hacemos una simplificación del último bloque para obtener una función racional:

Z(s) (br s + kr ) (bs + k)


=
H(s) (ms + br s + kr ) (M s2 + bs + k) + (br k + bkr ) s + kr k
2
EN

bbr s2 + (br k + bkr ) s + kr k


=
mM s + (mb + M br + bM ) s3 + (kr M + mk + kM ) s2 + (br k + bkr ) s + kr k
4

versión (preliminar) 0.2 - pág.157


A.2.1. Lectura Adicional
La reducción de diagramas en bloques está desarrollado en detalle en casi todos los
libros para cursos de grado en control automático. En particular se puede consultar en
[Oga93, sec.1.7, p. 46], [Oga98, sec.3.3, p. 63], [Oga10, sec.2.3, p. 17].

Conceptos Principales
Representación gráfica de ecuaciones algebraicas
Reducción de diagramas en bloques

N
IO
C
C
RU
ST
N
O
C
EN

versión (preliminar) 0.2 - pág.158


Casos de Estudio
A.3.1. Misión Apollo - Control de Descenso
Las misiones Apolo tenı́an por objeto transportar hasta una órbita lunar una nave
denominada módulo de comando (CSM) con tres tripulantes y un módulo de alunizaje
(LEM: Lunar Excursion Module) para dos pasajeros; efectuar un descenso sobre la
superficie lunar con este para la ejecución de experimentos sobre la misma; regresar
el LEM al módulo de comando y efectuar el retorno a la tierra en este último.

N
El LEM fue construido por la Grumman, por un contrato de u$s 350 M. Estaba compuesto
de dos etapas, una de descenso y otra de ascenso.

IO
Los módulos de descenso contenı́an el tren de aterrizaje, la antena del radio-altı́metro,
el motor de descenso y el combustible para el alunizaje. También tenı́a varios
compartimientos de carga usados para llevar entre otras cosas, los paquetes de los
experimentos de la misión, un carro móvil para el equipo (un carro tirado a mano para

C
los equipo llevado en la misión Apolo 14), el Lunar Rover (un vehı́culo lunar eléctrico
llevado en las misiones Apolo 15, 16 y 17), una cámara de televisión, herramientas y
cajas para la recolección de muestras de la superficie lunar.

C
El módulo de ascenso contenı́a la cabina para la tripulación, los tableros de instrumentos,
el puerto y escotilla de acople (al CSM), la escotilla delantera, el sistema de control
RU
de reacción, las antenas del radar y de comunicaciones, el motor de ascenso y el
combustible para volver a la órbita lunar y encontrarse con el CSM.
ST
N
O
C

(a) Imagen del Lunar Excursion Module (LEM)


(b) Infografı́a de los subsistemas del LEM
EN

versión (preliminar) 0.2 - pág.159


N
IO
C
Figura A.5: Fases de la maniobra de alunizaje de ?as misiones Apollo de la NASA

C
Dimensiones
Altura 6,37m
RU
Diámetro 4,27m
Envergadura en el tren de aterrizaje 9,07m
Volumen 6,65m3

Masas
Módulo de Ascenso (con combustible) 4670kg
ST

Módulo de Descenso 10334kg


Propelente del módulo de Descenso 8165kg

Propulsión
RCS: Reaction Control System (N2O4/UDMH) 16x441N
N

Propulsión de Ascenso: (N2O4/Aerozine 50) 15,6kN


Propulsión de Descenso (N2O4/Aerozine 50) 44,40kN
O

Autonomı́a 3 dı́as, 72hs


Apogeo 160km
Perigeo superficie lunar
C

Variación de velocidad en descenso 2470m/s

Referencia: APOLLO LUNAR-DESCENT GUIDANCE, Allan R. Klumpp. MIT, Junio 1971


EN

El descenso en la luna se realiza mediante una trayectoria nominalmente plana


organizada en tres fases:

1. Una fase de frenado (Programa 63, o P63) iniciada mediante un teclado unos 10
minutos antes del momento nominal de ignición. P63 primero computa el momento
preciso y la actitud para la ignición. Luego, tı́picamente a 492-km del sitio de alunizaje,

versión (preliminar) 0.2 - pág.160


N
IO
Figura A.6: Esquema del ajuste del vector de empuje para control de trayectoria

C
P63 enciende el DPS (Descent Propulsion System). Finalmente, P63 transfiere el
LM al estado terminal requerido como condición inicial para la fase de aproximación

C
subsiguiente. La transferencia toma tı́picamente 514 segundos y es casi óptima.

2. La fase de aproximación (P64) el guiado comienza con condiciones iniciales


RU
consistentes tı́picamente en, a) 2.2km de altitud y 7.5 km de rango en superficie y b) 44
m/s de velocidad vertical y 129 m/s de velocidad hacia adelante. En unos146 segundos,
P64 transfiere el LM a un punto prácticamente arriba del sitio de aterrizaje. P64 provee
visibilidad continua de la superficie lunar, y especı́ficamente, del sitio de alunizaje hasta
unos cinco segundos antes de la finalización. Durante P64 el comandante puede indicar
ST

al LGC (Landing Guidance Computer) a alunizar en cualquier punto elegido visualmente


en la superficie lunar mediante un procedimiento de re-designación que puede ser
continuado hasta el inicio de la fase de descenso terminal.

3. La fase de descenso terminal (P66) comienza automáticamente a unos 30m de


altitud y 11m de distancia al sitio de aterrizaje, o puede ser iniciado por el comandante
N

en cualquier momento durante P64. El algoritmo de guiado de P66 controla solo


la velocidad; no hay control de posición. P66 anula las componentes de velocidad
horizontales para produce una aproximación vertical a la superficie luna, un objetivo
O

que no puede ser alcanzado mediante indicaciones visuales cuando la superficie es


oscurecida mediante una capa de polvo moviéndose radialmente. P66 controla la
velocidad de descenso en función de un valor de referencia que puede ser incrementado
C

o decrementado en pasos de 0.3 m/s cada vez que el comandante sube o baja un switch
de control (ROD: rate-of-descent) control ubicado cerca de su mano izquierda.
EN

Control de Descenso
Supongamos que nuestra tarea es automatizar al menos la fase de descenso final, dado
que se debe optimizar el uso de combustible y evitar que el vehı́culo quede desnivelado
sobre la superficie, lo cual impedirı́a el posterior despegue del módulo de ascenso. Esto

implicará tomar contacto con la superficie de forma suave, pero sin pérdidas de tiempo
innecesarias durante el descenso.

versión (preliminar) 0.2 - pág.161


La maniobra requiere implementar dos funciones:

A - poder apuntar correctamente el vehı́culo (control de actitud)


B - comandar adecuadamente el motor para regular el descenso.

Vamos a considerar la fase de descenso terminal (P66). Suponiendo que existe un


control de actitud mantiene el motor de descenso (DPS) correctamente alineado con
la trayectoria; podemos concebir un sistema independiente que controle el descenso
regulando el empuje de este motor. Dicho motor fue diseñado para permitir un cierto

N
nivel de control de empuje, lo cual no es sencillo debido a las inestabilidades que pueden
experimentarse en la cámara de combustión de un motor cohete por cuestiones termo-
fluidodinámicas.

IO
El DPS permitı́a regular empuje solo en el rango 10 60 %, lo cual define entonces el
rango admisible para nuestra acción de control.

C
Para automatizar el descenso podemos plantear al menos dos estrategias: A - Seguir un

perfil de altura vs tiempo pre-programado

C
B - Ajustar la velocidad de descenso en función de la altura, en base a una curva o
mapeo altura ¿velocidad predefinido
RU
Si vamos a controlar altura podemos plantear el siguiente modelo:

d dh
{m × w} = ṁw + mẇ = F − mg , =w
dt dt
en donde g es la atracción gravitatoria, F es el empuje del motor y m es la masa del
ST

vehı́culo, que varı́a en el tiempo por el consumo del combustible. Asumiendo que el
consumo es proporcional al empuje:

ṁ = cf F → mẇ = (1 − cf w) F − mg

ṁ = cf F → mẇ = (1 − cf w) F − mg
N

Linealizando:
O

mẇ = (1 − cf w) ∆F − cf F0 w − mg , ∆F = F − F0
Tomando w0 = 0 y F0 = mg :
C

1
∆F − cf gw − q
ẇ =
m
Dado que el sistema de propulsión no reacciona de forma instantánea a un comando,
proponemos un modelo de primer orden para la relación entre comando y empuje:
EN

Tdps Ḟ + F = u;
en donde Tdps serı́a la constante de tiempo del motor.
Aplicando Laplace:

1 g
(s + cf g) W (s) = ∆F (s) − , sH(s) = W (s)
m s

versión (preliminar) 0.2 - pág.162


(Tdps s + 1) F (s) = U (s)
Podemos expresar esto de varias formas. Desde un punto de vista fı́sico podemos
considerar que el nuestra acción de control introduce una aceleración que se combina
con el efecto gravitatorio:
 
1 1/m g
H(s) = U (s) −
s (s + cf g) Tdps s + 1 s

N
El diagrama en bloques de la planta serı́a:

IO
C
El problema de esta perspectiva es que para encontrar una relación entre acción

C
de control y salida debemos eliminar la perturbación gravitatoria, pero esta puede
conservarse como una perturbación equivalente a la entrada Di o a la salida Do .
RU
Perturbación Equivalente a la Entrada
 
1/m Tdps s + 1
H(s) = U (s) − mg
s (s + cf g) (Tdps s + 1) s
ST
N
O

Perturbación Equivalente a la Salida


C

1/m 1
H(s) = U (s) − 2 g
s (s + cf g) (Tdps s + 1) s (s + cf g)
EN

versión (preliminar) 0.2 - pág.163


En estado estacionario las perturbaciones equivalentes son:

mg 1/cf
Di (s) = , Do (s) = 2
s s
mientras que la función de transferencia de la planta resulta:

H(s) 1/m
G(s) = =
U (s) s (s + cf g) (Tdps s + 1)
La planta es de tipo 1, por lo cual tendrá error nulo a una referencia constante y error

N
finito para una referencia de tipo rampa.
Sin embargo la perturbación de entrada en estado estacionario es de tipo constante y
el lazo de realimentación para esta perturbación incluye solo el controlador, por lo cual

IO
este deberı́a tener acción integral.

C
C
Si lo analizamos como perturbación de salida, el lazo de realimentación en este caso
RU
incluye a la planta, que ya tiene un polo en el origen; pero la perturbación de salida en
estado estacionario serı́a de tipo rampa, por lo cual nuevamente vemos la necesidad de
incluir acción integral en el controlador:
ST

Entonces el problema de control pasarı́a a ser:


N
O

Ya no consideramos la perturbación, porque al incluir el integrador en el control sabemos


C

que tendremos un rechazo exacto en estado estacionario. Por otra parte en este caso
no habrá un transitorio como respuesta a la perturbación, dado que la gravedad actúa
permanentemente con la misma intensidad. .
Tomando m = 15000, cf = 3,28,10−4 , g = 1,62, Tdps = 1 y normalizando la
EN

acción de control con la cuarta parte del empuje máximo del DPS (11677N , que serı́a
aproximadamente el rango de nuestra acción de control que va del 10 al 50 % del empuje
máximo) la planta es:
m = 15000;
cf = 3.2787e − 4;
g = 1.62;
Tdps = 1;

versión (preliminar) 0.2 - pág.164


den = conv ( [ 1 c f ∗ g 0 ] , [ Tdps 1 ] ) ;
G = t f ( 1 /m, den ) ;
zpk (G)

N
IO
C
C
RU
H(s) 6,67 × 10−5
G(s) = =
U (s) s (s + 5,3 × 10−1 ) (s + 1)
No podemos esperar que el lazo cerrado sea más rápido que el actuador, que en este
caso es el DPS y tiene una constante de tiempo de 1s. Por lo tanto podemos asumir
ST

con tranquilidad que el polo en está prácticamente en el origen, con lo que el modelo se
reduce a:
H(s) 6,67 × 10−5
G(s) = = 2
U (s) s (s + 1)
Incluyendo el integrador del compensador el diagrama de lugar de raı́ces es:
N

G = t f ( 6 . 6 7 e −5, [ 1 1 0 0 ] ) ;
r l o c u s (G ) ;
O

sgrid ;

Es claro que se requiere de un compensador, dado que con un control integral puro, que
es lo que tenemos hasta ahora; el lazo cerrado será inestable.
C

Debemos preguntarnos qué clase de respuesta a lazo cerrado estamos buscando.


Queremos una respuesta sobre-amortiguada (polos dominantes reales) o sub-
amortiguada (polos dominantes complejos conjugados?
La elección depende de las particularidades del problema a resolver. Debe tenerse en
EN

cuenta que si la respuesta oscila, también oscila la acción de control.


En este caso acciones de control de carácter oscilatorio no parecen recomendables
cuando el actuador es un motor cohete. Sin embargo no es mandatorio una respuesta
sobre-amortiguada; con un ?buen amortiguamiento? serı́a suficiente.
¿Que esté bien amortiguada implica que oscile poco?...¿cuanto es poco?....
Que el transitorio se extinga en un solo ciclo implica un factor de amortiguamiento 0.7.
Asociado a esto también hay un cierto sobre-paso:

versión (preliminar) 0.2 - pág.165


N
IO
Puede notarse que con amortiguamiento 0,8 el sobrepaso es mı́nimo pero se obtiene una

C
convergencia más rápida que para el caso de amortiguamiento crı́tico o una respuesta
sobre-amortiguada, y podrı́amos adoptarlo.
El otro punto a definir es: ¿cuan rápida queremos que sea la respuesta?

C
La maniobra de descenso final tendrı́a una duración del orden de los 30s. Está claro que
la respuesta transitoria deberı́a extinguirse en un tiempo mucho menor.
Por otra parte tenemos un actuador con una constante de tiempo de un segundo, y
RU
no podemos pretender una respuesta de lazo más rápida que la del actuador. En caso
contrario durante cualquier transitorio habrá frecuentemente saturación de la acción de
control (motor al máximo o a cero empuje) y la respuesta no se corresponderá con lo
que podrı́a suponerse a partir del modelo lineal.
Tentativamente tomemos como objetivo tiempo de establecimiento ts s < 4 y
ST

amortiguamiento η > 0,8. Los polos dominantes de lazo cerrado podrı́an ubicarse en
s = −2 ± j1,2.

En la ubicación desdeada de los polos de lazo cerrado dominantes (punto de prueba) la


condición de ángulo da aproximadamente −4280 :
N
O
C
EN

versión (preliminar) 0.2 - pág.166


N
IO
C
C
RU
Para compensar el lazo abierto debemos sumar +248◦ , y no hay forma de ubicar un
único cero para lograr este objetivo. Por lo tanto necesitamos al menos dos ceros, y
tenemos infinitas combinaciones posibles para esto.
Sin más argumentos podrı́amos pensar en un cero doble (dos ceros en el mismo lugar),
en donde cada uno aporte la mitad del ángulo requerido (+124◦ ). Hasta este punto el
ST

controlador serı́a:
2
(s + z)
K(s) = kc
s
con z = 1,19. Restarı́a calcular kc para cumplir con la condición de módulo, lo cual da
N

un valor aproximado de 5,6.


2
(s + 1,19)
O

K(s) = 5,6
s

Verificación Para realizar una verificación calculamos la función de transferencia de


C

lazo cerrado y vemos donde quedan sus polos.


Hacemos los cálculos con la función de transferencia simplificada y luego con la original.
figure
EN

% objetivo
p l o t ( r e a l ( p ) , imag ( p ) , ’ s ’ ) ;
hold on ;

% l a z o c e r r a d o con e l modelo s i m p l i f i c a d o
To = m i n r e a l (K∗Go/ ( 1 +K∗Go ) ) ;
p = roots ( To . den { 1 } ) ;

versión (preliminar) 0.2 - pág.167


p l o t ( r e a l ( p ) , imag ( p ) , ’ xg ’ , ’ LineWidth ’ , 2 )

% l a z o c e r r a d o con e l modelo s i n s i m p l i f i c a
T = m i n r e a l (K∗G/ ( 1 +K∗G ) ) ;
zpk ( T )
p = roots ( T . den { 1 } ) ;
p l o t ( r e a l ( p ) , imag ( p ) , ’ x r ’ , ’ LineWidth ’ , 2 )

axis ([ − 3.5 0 . 5 −2 2 ] ) ;
legend ( ’ p o l o s deseados a l a z o c e r r a d o ’ . . .

N
, ’ polos con e l modelo s i m p l i f i c a d o ’ . . .
, ’ polos con e l modelo completo ’ ) ;
sgrid ;

IO
C
C
RU
ST

Un aspecto adicional que deberı́amos verificar es que pasa al variar la masa entre el
N

valor al inicio del descenso y el caso lı́mite de consumir la totalidad del combustible.

A.3.2. Turbogenerador Hidráulico


O

La Central Hidroeléctrica Binacional de Salto Grande (ver http://www.saltogrande.org)


está equipada con 14 turbo-generadores de procedencia soviética, dispuestos en dos
C

grupos de 7 con sus correspondientes salas de mando, y un vertedero central de 19


compuertas radiales de accionamiento hidráulico.
Posee dos descargadores de fondo, uno en cada margen, para crecidas excepcionales.
La capacidad total de evacuación de la presa es de 64,000m3 /seg .
EN

Cada turbo-generador se compone de un generador eléctrico de 135MW movido por una


turbina hidráulica de tipo Kaplan, la cual gira a 75 rpm.

Modelo Matemático
En primer término proponemos un modelo de dos grados de libertad, considerando el
rotor del generador y la turbina como dos cuerpos rı́gidos vinculados mediante un eje

versión (preliminar) 0.2 - pág.168


flexible. Planteando conservación de momento cinético en ambos rı́gidos:

Jt ω̇t = Tt − Te , Jg ω̇g = Te − bωg + Tc

donde Jt y Jg son los momentos de inercia de la turbina y del generador respectivamen-


te, ωt y ωg sus velocidades de giro, Tf el torque generado por la turbina, Te el torque
elástico del eje, Tc el torque de carga en el generador y b un coeficiente de disipación
viscosa.
Para el torque de la turbina y el elástico proponemos lo siguiente:

N
Tt = cα [β − cω ωt ] , Te = ke φ , φ̇ = ωt − ωg

IO
donde β es el ángulo de paso de las palas, cα y cω son coeficientes hidrodinámicos y ke
es la rigidez a torsión del eje.

El rotor del generador tiene 40 pares de polos magnéticos, 650 toneladas de peso y
13,50 metros de diámetro. El eje de la turbina tiene 11,00 metros de largo, 95 toneladas

C
de peso y 1,50 metros de diámetro. La turbina es de 6 palas y tiene un diámetro de 8,5m.
Considerando además la potencia del equipo y algunas suposiciones básicas obtenemos
los siguientes valores aproximados para este ejercicio:

C
Jt 0,9 × 106 kgm2 momento de inercia de la turbina
29,6 × 106 kgm2
RU
Jg momento de inercia del rotor del generador
b (despreciable) amortiguamiento por lubricación de los mecanismos de transmisión
ke 194 × 106 N m rigidez del árbol de transmisión
cω 0,129 variación del torque asociada a la velocidad de giro
cα 87,1 × 106 N m variación del torque asociada al ángulo de ataque
ST

Con esto obtenemos la siguiente función de transferencia:

ω(s) 631,8
G(s) = = (A.32)
β(s) (s + 0,376)(s2 + 12,07s + 216,8)
N
O
C
EN

(a) Represa de Salto grande

(b) Turbina Kaplan

versión (preliminar) 0.2 - pág.169


Sı́ntesis del Compensador
Proponemos un enfoque polinomial para la sı́ntesis del compensador. Con el modelo
(A.32) de tercer orden deberı́amos elegir para el lazo cerrado un polinomio de orden 5.
Pero si requerimos error nulo en estado estacionario ante referencias o perturbaciones
constantes debemos elevar el polinomio denominador de lazo abierto a 4 para incluir el
integrador del control, lo cual impone la elección de un polinomio de orden 7 para el lazo
cerrado.

Si observamos la respuesta en frecuencia del modelo (A.32) vemos que su ancho de

N
banda está definido por el polo real p = −0,376, respecto del cual el par complejo
conjugado asociado a la dinámica elástica con ωn = 14,72 puede considerarse como
rápido.

IO
Proponemos un modelo nominal dado por:
7,749
Go (s) = (A.33)
2,659s + 1
que tiene la misma ganancia a frecuencia cero que (A.32) pero solo conserva el polo

C
real.
En la figura XX vemos que el modelo simplificado da una buena aproximación para

C
frecuencias una década por encima del ancho de banda de lazo abierto.
Entre los modelos (A.32) y (A.33) podemos computar un modelo de incertidumbre
multiplicativa global:
RU
G(s) −s(s + 12,07)
G∆ (s) = −1= 2 (A.34)
Go (s) s + 12,07s + 216,8
Con el modelo simplificado el polinomio de lazo cerrado incluyendo el integrador del
control es de orden 3.
De acuerdo al ancho de banda de lazo abierto partimos de un ancho de banda de lazo
ST

cerrado del orden de 1 rad/s.


Consideramos tres casos: polinomio de Butterworth Ab (s), polinomio de Bessel As (s) y
un par complejo dominante Ad (s).

Ab (s) = s3 + 2s2 + 2s + 1
N

As (s) = s3 + 2,4329s2 + 2,4662s + 1


Ad (s) = s2 + 1,12s + 0,64 (s + 2,4)

O

Sin considerar los ceros que pudieran aparecer en la función T (s) aportados por el
compensador tendrı́amos con estos polinomio las respuestas en frecuencia y al escalón
mostradas en la siguiente figura.
C
EN

versión (preliminar) 0.2 - pág.170


Calculamos los controles con el enfoque polinomial (ver sección ??) considerando como
polinomio de lazo abierto:

A0 = s (2,659s + 1)

donde el polo en el origen corresponde al integrador del control. Los compensadores


para cada caso resultan:
0,4768(s + 0,7198) 0,58094(s + 0,5907) 0,7364(s + 0,7158)
Kb = , Ks = , Kd =
s(s + 1,624) s(s + 2,057) s(s + 3,144)

N
donde el polo en el origen se agregó manualmente al compensador obtenido del ajuste
polinomial.

IO
Las dinámicas de lazo cerrado para cada caso se muestran en la figura siguiente,
considerando tanto el modelo nominal (gráficos superiores) y como el modelo completo
(gráficas inferiores). Puede notarse que no se manifiestan diferencias significativas.

C
C
RU
ST
N

En la próxima figura evaluamos la condición de estabilidad robusta para el modelo de


incertidumbre obtenido en (A.34) graficando el ı́ndice de robustez (1/T0 (s)) obtenido
O

con cada polinomio de lazo cerrado.


Claramente el margen de estabilidad robusta es amplio, y por lo tanto también es
esperable un desempeño robusto como el observado en la gráfica precedente:
C
EN

versión (preliminar) 0.2 - pág.171


Si estresamos el diseño aumentando el ancho de banda, las respuestas de lazo cerrado
deberı́an tener la misma forma pero con una escala de tiempo proporcionalmente
menores; más allá de los problemas que pudieran surgir por limitaciones de actuación
máxima.
Esto es ası́ para el modelo nominal, pero a modo de ejemplo con un factor 7 sobre el
ancho de banda los resultados con el modelo nominal (arriba) y el completo (abajo) son
muy diferentes a los esperados:

N
IO
C
C
RU
Aunque la situación empeoró en todos los casos, el menor impacto se obtuvo para el
polinomio con polos dominantes de segundo orden.
ST

Todo esto era previsible evaluando el margen de robustez resultante con este ancho de
banda:
N
O
C
EN

versión (preliminar) 0.2 - pág.172


N
Índice de figuras

IO
C
C
1.1. superficies de control aerodinámico en un avión . . . . . . . . . . . . . . . . . . . . . 3
1.2. Sistema realimentado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
RU
1.3. Lazo de control a lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5. Diagrama en bloques de un sistema realimentado con un compensador PID . . . . . . 8
1.6. En esta imágen vemos arriba inverters de diferente potencia (a la izquierda) para control
de motores eléctricos, un interfaz de operador (a la derecha) y varios modelos de PLCs
al centro y debajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.7. Sistema SCADA en una sala de control . . . . . . . . . . . . . . . . . . . . . . . . . . 9
ST

1.8. Primer autopiloto Sperry (derecha) y su demostración en Francia (izquierda), en el año


1914 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.15.Controlador PID neumático del año 1940 . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.1. Aterrizaje por instrumentos. Indicador del ILS . . . . . . . . . . . . . . . . . . . . . . . 29


N

2.2. Variaciones en la dinámica longitudinal de una avión bireactor de 8 plazas durante la


aproximación final . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3. Control por inversión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
O

2.4. Inversión con alta ganancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32


2.5. Inversión por realimentación de alta ganancia . . . . . . . . . . . . . . . . . . . . . . . 32
2.6. Lazo de control general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
C

2.7. Esquema del control de régimen de giro (governor ) de un helicóptero con motor de
combustión interna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.9. Replanteo de la figura 2.6 para poner en evidencia las sensibilidades del error a las
distintas entradas del lazo SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
EN

3.1. Representación gráfica del cómputo para la condición de ángulo . . . . . . . . . . . . 50


3.2. Algunos ejemplos de lugar de raı́ces (tomado de [Oga10]) . . . . . . . . . . . . . . . . 52
3.3. Algunos ejemplos de lugar de raı́ces complementario (tomado de [Oga10]) . . . . . . . 55

173
3.4. Algunos ejemplos del “teorema del encierro” (tomado de [Oga10]). En los casos (a) y
(b) hay encierro al origen de la curva transformada, mientras que en los (c) y (d) no.
Observar a la izquierda la cantidad de polos y ceros en la región acotada por la curva
original. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.5. Trayectoria de Nyquist modificada para un lazo abierto con polo en el origen y ejemplo
de un posible mapeo (tomado de [Oga10]) . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6. Margenes de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.7. Replanteo del lazo estándar a uno con realimentación unitaria . . . . . . . . . . . . . . 62
3.8. Interpretación gráfica de los términos de la ecuación (??) . . . . . . . . . . . . . . . . 62

N
3.9. Grillas para la determinación de la respuesta en frecuencia de lazo cerrado a partir de
la traza de nyquist del lazo abierto (tomado de [Oga98]) . . . . . . . . . . . . . . . . . 63
3.10.Validez de la hipótesis de control perfecto para una dinámica dominante de segundo

IO
orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.11.Parametrización de la respuesta transitoria . . . . . . . . . . . . . . . . . . . . . . . . 69
3.12.Mapeo de las especificaciones de respuesta transitoria a regiones admisibles para los
polos de lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

C
3.13.Ajuste de un compensador en adelanto mediante el método de la bisectriz (ver [Oga10,
p. 315]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

C
4.1. Respuesta en frecuencia y transitoria al escalón de filtros de los filtros de Butterworth y
Bessel de orden 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.2. Análisis de desempeño en relación a la sensibilidad . . . . . . . . . . . . . . . . . . . 88
RU
4.3. Lazo de control general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
s + 0,8
4.4. Polos-ceros y respuesta en frecuencia para G1 (s) = 7,5 (azul) y G2 (s) =
(s + 2)(s + 3)
−s + 0,8
7,5 (rojo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
(s + 2)(s + 3)
4.5. Análisis de estabilidad robusta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
ST

4.6. Análisis de estabilidad robusta con el ı́ndice de robustez . . . . . . . . . . . . . . . . . 99


4.7. Análisis de desempeño robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.10.Atraso de fase para el retardo de transporte (L = 1s) y sus aproximaciones mediante la
expansión de Padè . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.11.Respuesta al escalón para el retardo de transporte (L = 1s) y sus aproximaciones
N

mediante la expansión de Padè . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

5.1. regulador por realimentación de estados . . . . . . . . . . . . . . . . . . . . . . . . . . 122


O

5.3. servo-sistema por realimentación de estados . . . . . . . . . . . . . . . . . . . . . . . 125


5.4. servo-sistema por realimentación de estados con acción integral . . . . . . . . . . . . 126
C

A.1. curvas de frecuencia natural y amortiguamiento constantes en el plano z . . . . . . . . 150


A.2. Cómputo de respuesta al escalón con el modelo continuo y uno de tiempo discreto con
retención de orden cero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
A.3. Reducción del diagrama en bloques para el modelo de 1/4 de auto con 2 grados de
EN

libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
A.5. Fases de la maniobra de alunizaje de ?as misiones Apollo de la NASA . . . . . . . . . 160
A.6. Esquema del ajuste del vector de empuje para control de trayectoria . . . . . . . . . . 161

versión (preliminar) 0.2 - pág.174


N
Bibliografı́a

IO
C
C
[GGS01] Graham C. Goodwin, Stefan F. Graebe, and Mario E. Salgado. Control System Design.
Prentice Hall, 2001.

[JENR09] Eduardo F. Camacho Julio E. Normey-Rico. Unified approach for robust dead-time
RU
compensator design. Journal of Process Control, (19):38–47, 2009.

[KND] J. Kautsky, N.K. Nichols, and P. Van Dooren. Robust pole assignment in linear state
feedback.

[Kuo] Benjamin C. Kuo. Sistemas de Control Automático. Prentice Hall, 7 edition.


ST

[Oga93] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 2 edition, 1993.

[Oga96] Katsuhiko Ogata. Sistemas de Control en Tiempo Discreto. Prentice Hall, 2 edition, 1996.

[Oga98] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 3 edition, 1998.
N

[Oga10] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 5 edition, 2010.

[Peñ92] Ricardo S. Sánchez Peña. Introducción a los Teorı́a de Control Robusto. AADECA, 1992.
O

[SP01] Sigurd Skogestad and Ian Postlethwaite. Multivariable Feedback Control - Analysis and
Design. John Wiley & Sons, 2 edition, 2001.
C

[sW04] Karl J. Äström and Björn Wittenmark. Computer Controlled Systems - Theory and Design.
Prentice Hall, 3 edition, 2004.

[Tew11] Ashish Tewari. Advanced Control of Aircraft, Spacecraft and Rockets. John Wiley and Sons,
EN

2011.

[ZN42] J.G. Ziegler and N.B. Nichols. Optimum settings for automatic controllers. 1942.

[Zum] Augusto J. Zumarraga. Sistemas Dinámicos. 0 edition.

175

También podría gustarte