Control PDF

N
IO
C
C
RU
ST
N
O
C
Control y Guiado
EN
Ingenierı́a Aeroespacial - Edición 2020

EN
C
O
N
ST
RU
C
C
IO
N
N
Índice general
IO
C
C
1. Introducción 1
1.1. Sistemas Realimentados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
RU
1.2. Sistemas de Control Automático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1. Control a Lazo Abierto y Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2. Entradas y Salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Estrategias Comunes de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.1. Control ON/OFF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.2. Control Proporcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
ST
1.3.3. Control PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3.4. Automatización y Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4. Ingenierı́a de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.1. Control Industrial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.2. Pilotos Automáticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
N
1.4.3. Control en el Campo Espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4.4. Sistemas Autónomos y Robótica . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5. Control PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
O
1.5.1. Ley de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.5.2. Ajuste de Parámetros (Sintonización) . . . . . . . . . . . . . . . . . . . . . . . 19
1.5.3. Realización del Controlador PID . . . . . . . . . . . . . . . . . . . . . . . . . . 22
C
1.6. Cómputos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2. Objetivos del Control 27

2.1. Requerimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
EN
2.1.1. Seguimiento de Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.1.2. Rechazo de Perturbaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.1.3. Dinámica del Sistema Controlado . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.1.4. Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2. Control a Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.1. Control por Inversión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.2. Inversión por Realimentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2.3. Realimentación y Dinámica de Lazo Cerrado . . . . . . . . . . . . . . . . . . . 33
2.3. Diseño del Lazo de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.1. Sistema SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.2. Sensibilidades del Lazo SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.3. Ecuación Caracterı́stica de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . 37
2.3.4. Compromisos del Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.3.5. Errores en Régimen Estacionario . . . . . . . . . . . . . . . . . . . . . . . . . 39
3. Análisis Clásico de Sistemas SISO 45
N
3.1. Lugar de Raı́ces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1.1. Análisis de la Ecuación Caracterı́stica de Lazo Cerrado . . . . . . . . . . . . . 48
3.1.2. Interpretación de las Condiciones de Módulo y Ángulo . . . . . . . . . . . . . . 49
IO
3.1.3. Reglas para el Trazado del Diagrama . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.4. Análisis de Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.1.5. Lugar de Raı́ces Complementario . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.1.6. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
C
3.2. Criterio de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1. Teorema del Encierro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.2. Estabilidad del Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
C
3.2.3. Funciones de Lazo Abierto con Polos en el Eje Imaginario . . . . . . . . . . . . 59
3.2.4. Márgenes de Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
RU
3.3. Respuesta en Frecuencia de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.1. Realimentación Unitaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.2. Ganancia de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.4. Revisita de la Función de Sensibilidad . . . . . . . . . . . . . . . . . . . . . . . 66
3.4. Compensación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
ST
3.4.1. Compensación en el “Plano s” . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

3.4.2. Compensación en Frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.4.3. Ceros del Lazo Cerrado y Filtro de Referencia . . . . . . . . . . . . . . . . . . . 77
4. Control Moderno de Sistemas SISO 79

N
4.1. Especificaciones de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4.1.1. Respuesta Transitoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.1.2. Respuesta en Frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
O
4.2. Restricciones en el Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.2.1. Limitaciones Asociadas a la Instrumentación . . . . . . . . . . . . . . . . . . . 88
4.2.2. Restricciones Estructurales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
C
4.3. Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3.1. Incertidumbre en el Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3.2. Modelos de Incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3.3. Estabilidad Robusta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
EN
4.3.4. Desempeño Robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

4.4. Sı́ntesis de Compensadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.4.1. Asignación de Polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.4.2. Inversión Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.4.3. Loop-Shaping . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.5. Sistemas con Retardo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
versión (preliminar) 0.2 - pág.

4.5.1. Dinámicas con Retardo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.5.2. Modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.5.3. Predictor de Smith . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.5.4. Predictor de Smith Filtrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.6. Estructuras Especiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.6.1. Anti-Windup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.6.2. Control con Dos Grados de Libertad . . . . . . . . . . . . . . . . . . . . . . . . 118
5. Realimentación de Estado 121
N
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.1.1. Ubicación de Polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.1.2. Control Optimo Cuadrático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
IO
5.2. Observador de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.1. Observador de Luenberger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.2. Realimentación de Estados Observados . . . . . . . . . . . . . . . . . . . . . . 137
5.2.3. Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
C
5.2.4. Control Optimo Gausiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
A. Apéndices 143
C
A.1. Modelos Dinámicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
A.1.1. Modelos de Estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
A.1.2. Modelos Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
RU
A.1.3. Matriz de Transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
A.1.4. Modelos en Tiempo Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
A.1.5. Aproximación Discreta de Controles Continuos . . . . . . . . . . . . . . . . . . 153
A.2. Diagramas en Bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
A.2.1. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
A.3. Casos de Estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
ST
A.3.1. Misión Apollo - Control de Descenso . . . . . . . . . . . . . . . . . . . . . . . . 159

A.3.2. Turbogenerador Hidráulico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
N
O
C
EN
versión (preliminar) 0.2 - pág.

EN
C
O
N
ST
RU
C
C
IO
N
EN
C
O
N
1
ST
RU
C
C
IO
N
N
1
IO
C
Introducción
C
RU
ST
N
O
C
EN
versión (preliminar) 0.2 - pág.2

N
IO
Figura 1.1: superficies de control aerodinámico en un avión
Sistemas Realimentados
C
Los seres vivos interactúan permanentemente sobre su entorno, perturbando procesos
C
dinámicos de forma apropiada para llevarlos a condiciones de equilibrio deseables.
Esto es particularmente frecuente y deliberado en el caso de los humanos; en
situaciones que van desde la manipulación de objetos hasta la conducción de sistemas
RU
complejos, ya sean estos de carácter tecnológico, social, económico, biológico, etc.
A modo de ejemplo podemos reflexionar respecto de los elementos presentes y la forma

en que estos interactúan cuando:
un piloto conduce una aeronave

ST
un equipo económico de gobierno (por ejemplo el Banco Central de un Paı́s)

interviene para ajustar variables macro económicas
un médico diagnostica, trata y monitorea la salud de un paciente
un equipo de trabajo social interviene de paliar problemas de una comunidad
···
N
Pero también observamos esta clase de interacciones cuando simplemente llevamos

objetos de un lugar a otro, o cuando hacemos “equilibrio” sosteniendo un bastón con la
O
palma de la mano.
C
La intervención se produce por medio del ajuste de ciertas perturbaciones que pueden
ser manipuladas de forma directa cuando sea necesario. Denominamos a estas acciones
de control, para diferenciarlas respecto de aquellas perturbaciones que están fuera de
nuestro alcance.
EN
Por ejemplo, el médico ajusta la dosis de un medicamento, el piloto acciona los

comandos de la aeronave (figura 1.1), el Banco Central inyecta o retiene divisas en el
mercado financiero, etc.
En general la intervención no necesariamente finaliza al alcanzar la condición deseada.

Frecuentemente es necesario mantener un proceso de supervisión continuo, para ajustar
las acciones de control al menos por dos razones:
porque debido a su comportamiento el proceso no tiende a mantenerse en la

condición deseada por si mismo (porque dicha condición es inestable)
porque las perturbaciones fluctúan, alterando el equilibrio alcanzado
Para desarrollar estas actividades es necesario poder observar la evolución del proceso,
y para ello se requiere de ciertas capacidades sensoriales.
N
El ente que intenta controlar el proceso (el controlador) lo observa permanentemente y
reacciona ajustando las acciones de control en función de los apartamientos observados
respecto de la condición buscada.
IO
Esta interacción da lugar a un nuevo proceso dinámico. Éste surge de la combinación
entre el proceso a controlar y el controlador, y tendrá un comportamiento diferente al
que tienen sus componentes de forma aislada. Se trata de un sistema realimentado,
C
esquematizado en la figura 1.2, al que identificamos como sistema a lazo cerrado.
C
RU
ST
Figura 1.2: Sistema realimentado

N
De las capacidades sensoriales disponibles y de la capacidad de reacción (es decir,

de ajustar las acciones de control) del controlador dependerá la aptitud del mismo
O
para poder equilibrar el proceso en la condición deseada, sostenerla ante cambios

en el contexto y lograr que el sistema a lazo cerrado tenga caracterı́sticas dinámicas
aceptables.
C
En tareas que implican interactuar con el medio fı́sico los humanos aprendemos formas
adecuadas de reacción mediante el entrenamiento.
Conducir un vehı́culo, por ejemplo, es una tarea resuelta por el sistema lı́mbico de
EN
nuestro cerebro, en contraste con los procesos de carácter intelectual que resolvemos en
la corteza cerebral. Lo mismo ocurre en la práctica deportiva o en la expresión corporal.
Nuestras capacidades de control son reflejos que solo podemos adquirir mediante un
tiempo adecuado de práctica.

Sistemas de Control Automático
Un sistema de control automático realiza las tareas del controlador sin intervención
humana. Posee los elementos necesarios para observar el proceso (sensores),
manipular las acciones de control (actuadores) y reaccionar adecuadamente accionando
los actuadores en función de la información obtenida mediante los sensores.
Un sistema de control automático en general se configura mediante un proceso

matemático para reaccionar adecuadamente al interactuar con un determinado proceso
N
dinámico, lo cual sustituye el entrenamiento; aunque existen algoritmos para “aprender”
las reacciones correctas de forma experimental (controles adaptables).
IO
C
C
RU
Figura 1.3: Lazo de control a lazo cerrado
ST
1.2.1. Control a Lazo Abierto y Lazo Cerrado

Cuando hablamos de sistemas de control normalmente nos referimos a aquellos que
funcionan a lazo cerrado, como el representado en la figura 1.3.
N
En control automático se suele designar como planta al proceso dinámico a controlar.

La observación se realiza a través de sensores y las acciones de control se ejercen
mediante actuadores.
O
En problemas de economı́a, sociologı́a o epidemiologı́a por ejemplo estos elementos no

son dispositivos fı́sicos sino acciones humanas, pero cumplen el mismo rol.
C
Es posible concebir estrategias de control a lazo abierto, las cuales prescinden de la

observación. Pero estas no tienen la capacidad necesaria para contrarrestar cambios en
las propiedades dinámicas de la planta o variaciones en las perturbaciones actuantes
sobre la misma, ya que no manejan información sobre la situación real del proceso.
EN
Solo es posible plantear una estrategia de este tipo contando con un conocimiento
significativo de las propiedades dinámicas de la planta y de la condición en la cual se
encontrará en el momento de actuar sobre ella.

Por ejemplo, llenar un vaso con agua manteniendo los ojos cerrados es una estrategia
de control a lazo abierto para ajustar el nivel de lı́quido en el vaso.
Al abrir los ojos y observar el nivel mientras agregamos agua convertimos la tarea en
una de control a lazo cerrado.
1.2.2. Entradas y Salidas
N
En control automático llamamos entradas a las acciones de control y perturbaciones que
actúan sobre la planta (el proceso dinámico a controlar), y salidas a las observaciones.
IO
Cuando nos referimos a un control SISO, el acrónimo SI (Single Input) hace referencia
al caso en el cual hay una única entrada que podemos manipular (acción de control).
Serı́a el caso si por ejemplo en un control térmico solo podemos actuar sobre una único
calefactor.
De forma análoga, el acrónimo SO (Single Output) se refriere a disponer datos de una
C
única variable escalar para monitorear el proceso. En el ejemplo del control térmico este
serı́a el caso si contamos con capacidad para medir temperatura en un único punto.
C
Naturalmente MI y MO hace referencia a los casos en los cuales se cuenta con entradas
y salidas múltiples. Un ejemplo claro de sistema MIMO es el del control de vuelo de un
RU
helicóptero, en donde las acciones de control son el paso cı́clico, colectivo y rotor de
cola; mientras que las entradas serán diferentes ángulos y velocidades.
Estrategias Comunes de Control

ST
Muchos problemas de control automático pueden resolverse con “leyes de control”

simples. Nos referimos a las estrategias que usamos para ajustar las acciones de control
en función de la evolución del proceso.
El trabajo básico en ingenierı́a de control es seleccionar y ajustar estas leyes para un
dado problema, o bien diseñar otras más refinadas en casos más exigentes.
N
1.3.1. Control ON/OFF

O
Los controles ON/OFF (o bang-bang) son aquellos sistemas de control SISO en

los cuales la acción de control puede tomar solo dos estados (encendido/apagado,
abierto/cerrado, etc.). En estos casos la representación matemática de la acción de
C
control se realiza a través de una variable booleana.

Esto es muy común a nivel doméstico. Podemos citar como ejemplos los equipos de
aire-acondicionado (excepto los denominados inverter ), los calentadores eléctricos para
el agua o para planchar la ropa, el control de nivel del reservorio de agua potable, etc.
EN
Para el suministro de agua caliente se puede contar con un termotanque, que también
constituye un control ON/OFF; o con un calefón, el cual funciona como control a lazo
abierto (no cuenta con sensor de temperatura).
La ventaja de este tipo de estrategia es su simplicidad, llegando inclusive a utilizarse

masivamente en vehı́culos espaciales para el control térmico de sus componentes.

N
IO
(a) regulador de gas para una garrafa (b) esquema de funcionamiento del regulador de gas
C
El control ON/OFF no permite en general ajustar la condición de equilibrio con alta
precisión, excepto que la conmutación pueda realizarse a alta frecuencia, como es el
C
caso de las fuentes eléctricas de tipo switching.
Cuando esto no es posible resulta necesario establecer una banda de tolerancia
alrededor del valor nominal deseado dentro de la cual no se realiza ninguna acción.
RU
La conmutación ocurre unicamente al traspasar los lı́mites de esta banda.
1.3.2. Control Proporcional

Hablamos de control proporcional cuando las acciones de control pueden variar de
ST
forma continua. Las representamos matemáticamente con números reales, más allá de
cual sea su naturaleza fı́sica (la temperatura, la concentración de glucosa en sangre, la
cotización de una divisa extranjera, etc.).
Un ejemplo doméstico de control proporcional es el regulador de gas, el cual proporciona

N
una presión constante a la salida aunque la presión de entrada fluctúe (siempre que se
mantenga por encima del valor deseado para la salida).
En la figura 1.4b se muestra un esquema del dispositivo. Un diafragma actúa como
O
sensor. Una aguja obtura proporcionalmente el paso de gas, operando como actuador.
El controlador serı́an los resortes, que establecen una apertura proporcional del paso de
gas en función de la presión diferencia entre la presión a la salida y el valor deseado
C
establecido por la compresión del resorte superior.

EN
1.3.3. Control PID

En el ejemplo del regulador de gas la reacción (variación de la acción de control) a
los apartamientos del proceso es proporcional al desvı́o de la salida respecto del valor
deseado. En muchos casos esto no resulta en un comportamiento aceptable del sistema
a lazo cerrado.

N
IO
Figura 1.5: Diagrama en bloques de un sistema realimentado con un compensador PID
Frecuentemente es necesario considerar la velocidad con la cual la salida se aparta o
C
se acerca al valor deseado, incluyendo una acción proporcional a ese cambio. Esto se
denomina control derivativo, y tiene la propiedad de anticiparse a los cambios.
Por otra, en muchos casos un sistema de control logra equilibrar la planta pero con un
C
cierto error en relación al valor deseado. Esto se compensa automáticamente con una
acción integral.
RU
La combinación de las tres acciones: proporcional + integral + derivativa se conoce como
control PID, y es la estrategia más común en los sistemas de control a lazo cerrado.
La intensidad de estas acciones se puede ajustar de forma empı́rica o semi-empı́rica.
En situaciones más complejas se recurre a un estudio matemático del problema, siendo

necesario en ocasiones diseñar otras estrategias alternativas a la PID. Para esto la
ST
Teorı́a de Control Automático provee diferentes enfoques y herramientas, siendo esta

una disciplina en permanente desarrollo.
1.3.4. Automatización y Control

N
Existe en general una confusión entre lo que entendemos aquı́ como control automático
y los automatismos.
Es muy común utilizar enclavamientos lógicos para coordinar acciones de todo tipo.
O
Se trata de manipular variables de tipo booleano cuando se cumplen ciertas condiciones

lógicas.
C
En muchos casos de observan zonas grises para realizar esta discriminación. Por
ejemplo, un control ON/OFF podrı́a interpretarse como un enclavamiento lógico.
Al mismo tiempo en común que los sistemas de control automático incluyan enclava-
mientos lógicos para dar señales de alarma en situaciones anormales, e incluso llevar el
EN
proceso controlado a una condición segura cuando las condiciones se tornan peligrosas.

N
IO
Figura 1.6: En esta imágen vemos arriba inverters de diferente potencia (a la izquierda) para control de motores eléctricos, un
interfaz de operador (a la derecha) y varios modelos de PLCs al centro y debajo
C
C
RU
ST
Figura 1.7: Sistema SCADA en una sala de control

N
Ingenierı́a de Control
De lo dicho precedentemente puede deducirse que el control automático tiene aplicación
O
en muchas disciplinas.
Como ingenieros aeroespaciales estamos interesados principalmente en las aplicacio-
nes industriales, transporte y sistemas espaciales.
C
1.4.1. Control Industrial

Actualmente la industria manufacturera hace un uso extensivo tanto de la automatización
EN
(omnipresente) y el control automático, esto último en los procesos de producción

continua como la petroquı́mica y la metal-mecánica.
Los enclavamientos lógicos suelen implementarse en dispositivos de hardware denomi-

nados PLCs (Programable Logic Controller, ver figura 1.6).
Se trata de computadoras sin interfaz humana diseñados para digitalizar datos de
sensores discretos (ON/OFF con contactos secos, sensores inductivos y capacitivos,

N
IO
Figura 1.8: Primer autopiloto Sperry (derecha) y su demostración en Francia (izquierda), en el año 1914
C
etc.) y analógicos (normalmente señales de 0-10V o 4-20mA generadas por diversos
tipos de sensores); y generar señales de salida de ambos tipos; aunque también
C
pueden utilizarse redes de datos informáticas estándar (RS232, Ethernet, WiFi) o de
tipo industrial (FieldBus, Profibus, etc.).
RU
La programación de estos dispositivos se realiza con interfaces gráficas desde una
computadora conectada en red con el PLC, y para su uso pueden conectarse interfaces
de operador en el piso de planta o con computadoras en una sala de control (sistemas
SCADA: Supervisory Control and Data Aquisition) para visualización, registro de datos,
realizar ajustes y enviar comandos al equipo (figura 1.7).
En control industrial la estrategia habitual es la PID, y existen dispositivos de hardware
ST
especı́ficos para ello; aunque también pueden programarse estas funciones en un PLC o
en computadoras conectadas en red con estos dispositivos (para procesos de alto nivel).
Solo en casos muy especı́ficos o para el control de procesos multi-variable se utilizan
otras estrategias.
Los sistemas de control realimentados son imprescindibles para la operación de
N
generadores eléctricos y turbinas eólicas, posicionamiento dinámico de plataformas off-

shore, reactores nucleares, etc.
O
1.4.2. Pilotos Automáticos

En la actualidad existen pilotos automáticos para automóviles, embarcaciones, aerona-
C
ves y vehı́culos espaciales. Sus funciones van desde controlar una única variable (por
ejemplo la velocidad en el control de crucero de un automóvil) hasta la de realizar una
misión completa de forma autónoma para descender en otro planeta.
Un piloto automático es un sistema de control diseñado para realizar tareas que realiza
EN
un piloto humano de forma desatendida.
El primer auto-piloto en el campo aeronáutico fue desarrollado por Lawrence Burst

Sperry, exhibido por primera vez en 1914 durante una competencia de innovación en
Francia (figura 1.8). Este era completamente mecánico y utilizaba giróscopos para medir
la actitud (orientación) del avión, los cuales se conectaban mediante cables y palancas
a las superficies de control aerodinámico.

Durante su estadı́a en Francia Sperry, que no hablaba
francés, contrató como mecánico a Emil Cachin, que no
hablaba inglés. Aun ası́ formaron un sólido equipo y se
presentaron a la exhibición. En la primer pasada ante el
público Sperry, al mando de la aeronave, levantando los
brazos para mostrar que los comando estaban libres y
el avión volaba solo. En una segunda pasada Cachin
abandonó su puesto y caminó por una de las alas
N
mientras Sperry nuevamente mantenı́a los brazos en
alto.
Durante la tercer pasada ambos abandonaron el cockpit mientras el avión mantenı́a su
IO
vuelo en lı́nea recta.
Naturalmente, ganaron la competencia.
C
En 1945, motivados por los riesgos que se experimentaban
en época invernal debido a las condiciones climáticas
desfavorables de las islas británicas combinadas con los
C
altos niveles de contaminación con carbón existentes en
aquellos años, se creó la unidad de desarrollo BLEU (Blind
Landing Experimental Unit) para trabajar sobre soluciones
RU
para el aterrizaje con baja visibilidad. Esto condujo en poco
tiempo al desarrollo de un sistema de aterrizaje automático,
precursor de lo que hoy conocemos como autoland.
Estos desarrollos evolucionaron aplicándose en aeronaves
militares como el English Electric Canberra y el Avro Vulcan;
ST
y posteriormente en aeronaves comerciales como Hawker

Siddley Trident (imagen a la izquierda).
Actualmente los pilotos automáticos para aeronaves comerciales son capaces de
realizar todas las maniobras de vuelo de forma autónoma, incluyendo el despegue y
aterrizaje; aunque se opera siempre bajo supervisión humana. En general dependen de
N
la disponibilidad de radio ayudas para detectar los desvı́os respecto de la trayectoria

deseada, aunque progresivamente van ganando terreno los sistemas de navegación
global satelital (GNSS) para obtener esta información.
O
En la aviación existen además sistemas de control para mejorar el comportamiento de

una aeronave, categorizados como sistemas de aumento de estabilidad (SAS).
C
Estos van desde casos simples como el amortiguador de guiñada presentes en los
reactores multimotor, hasta sistemas de control de vuelo completo para aeronaves
intrı́nsecamente inestables. En particular, los aviones de combate de 4ta generación
y posteriores dependen fuertemente del SAS para poder volar.
EN
También se utilizan sistemas de control auxiliares, por ejemplo para regular la presión de
cabina. Los motores a reacción modernos cuentan con el FADEC (Full Authority Digital
Engine Controller ), que monitorea y regula completamente la operación del motor.
Los motores alternativos por su parte incluyen una unidad electrónica denominada
ECU (Engine Control Unit), que incluye lazos de control para optimizar la combustión
ajustando la inyección de combustible y la entrada de gases al turbocompresor.

N
IO
(a) Panel de interfaz del piloto automático en un Boeing 737NG
C
C
RU
(b) Interfaz de comando para las funciones de un piloto automático
En los helicópteros se incluye un controlador denominado governor, que mantiene

constante el régimen de giro de los rotores, de forma análoga al control de crucero de
un automóvil.
ST
1.4.3. Control en el Campo Espacial

Los sistemas espaciales no podrı́an existir sin el desarrollo del control automático, dado
que en su mayorı́a se trata de vehı́culos no tripulados. Y en el caso que lo sean, se
N
requiere proveer asistencia a la tripulación debido a la complejidad y requerimientos de

precisión de las tareas a realizar.
O
Los vehı́culos lanzadores cuentan con el equivalente al autopiloto de un avión, además

de todos los lazos de control auxiliares para diferentes subsistemas.
Actualmente los vehı́culos espaciales reutilizables como el Falcon 9 de SpaceX (figura
C
1.10a) operan de forma completamente autónoma desde su lanzamiento hasta el

aterrizaje.
El primer sistema reutilizable con esta capacidad fue el transbordador soviético Buran
(figura 1.10b), que hizo su primer y único vuelo el 15 de noviembre de 1988, antes del
EN
colapso de la URSS.
En la mayor parte de los vehı́culos orbitales existe un sistema esencial denominado

AOCS (Attitude and Orbit Control System). Una de las funciones principales es la de
permitir ajustar la orientación (actitud) de la nave (ver figura 1.10c), lo cual permite
apuntar el sistema de propulsión durante las maniobras de control orbital; y ajustar la

N
(a) Aterrizaje del Falcon 9 (SpaceX ) (b) Transbordador Buran acoplado al lanzador Energı́a
IO
C
C
RU
(c) Actitud de un satélite en órbita terrestre (d) Satélites de la CONAE
orientación de los instrumentos en el “modo ciencia” (estado del satélite cuando opera
ST
sus instrumentos cientı́ficos).
1.4.4. Sistemas Autónomos y Robótica

La robótica incluye varias áreas de aplicación. La primera en desarrollarse fue la
N
robótica industrial, convirtiéndose en una herramienta indispensable para la producción

automotriz, electrónica y muchas más.
Los principales desafı́os se presentan en los campos de la mecánica y la instrumenta-
O
ción, utilizándose el control automático fundamentalmente para el movimiento.

Actualmente se combinan manipuladores robóticos, sistemas de reconocimiento de
imágenes y otras tecnologı́as de sensado para optimizar los procesos de fabricación
C
y los sistemas de operación remota. Estos no son sistemas completamente autónomos,

ya que para la toma de decisiones sobre situaciones no programadas en su mayorı́a
dependen de la intervención humana.
EN
En las últimas décadas se experimentó un fuerte crecimiento en el campo de la

robótica móvil. Se trata de un área en fuerte desarrollo a la par de los avances
en inteligencia artificial e ingenierı́a de control. Abarca desde vehı́culos autónomos
aéreos (VANTs/UAVs), terrestres y submarinos (AUVs), hasta robots “bio-inspirados” y
humanoides.
Los vehı́culos terrestres autónomos se diseñan para desplazarse en un medio

N
IO
(a) Manipulador robótico (b) Vehı́culo Aéreo No Tripulado Ikhana, operado por la NASA
C
C
RU
ST
(a) Vehı́culo submarino autónomo (b) Mars Exploration Rovers (MER), que operaron en
Marte entre 2004 y 2019
especı́fico; ya sea que se trate de terrenos abiertos, zonas rocosas, conductos, etc.
Puede tratarse de vehı́culos comunes, articulados, caminadores, etc.
N
El control automático en estos casos es relativamente sencillo, siendo más importantes

los aspectos asociados a la navegación y la coordinación de múltiples funciones de
detección y decisión.
O
Vehı́culos de esta clase (denominados rovers) se han desempeñado satisfactoriamente

en la exploración de la Luna y Marte; pero también existen en el mercado modelos
C
comerciales para tareas domésticas y usos industriales especı́ficos.

En esta lı́nea mencionemos que en el campo automotriz los pilotos automáticos para
automóviles tienden hacia la robotización, permitiendo en la actualidad la conducción
completamente autónoma bajo ciertas condiciones (BWM, Tesla, etc.).
EN
En aeronáutica la tecnologı́a de los UAVs se encuentra muy desarrollada a nivel militar,

pero existen muchas otras aplicaciones como la inspección aérea y la agricultura; y es
posible que en un futuro cercano se experimente un desarrollo importante de la mobilidad
urbana utilizando aeronaves de despegue y aterrizaje vertical (VTOL : Vertical TakeOff
and Landing) robotizadas.

N
IO
(a) Robot bio-inspirado Spot Mini, de la firma americana Boston Dynamics (b) Robot humanoide Asimo, de la japonesa
Honda
C
En estos casos control automático cubre la mismas funciones que las del auto-piloto
C
en las aeronaves tripuladas; aunque se trabaja activamente en paralelo al desarrollo de
nuevas configuraciones y mecánicas de vuelo.
En cuanto a vehı́culos submarinos, en la actualidad existen muchos modelos comercia-
RU
les operados de forma remota para realizar operaciones submarinas y modelos autóno-
mos de investigación.
Finalmente mencionemos el desarrollo de robots bio-inspirados. Los robots humanoides

han tenido un fuerte desarrollo en Japón, fundamentalmente como lı́neas de investiga-
ST
ción tecnológica. Aunque se han sumado otras empresas, por el momento solo se co-
mercializan robots humanoides con fines lúdicos y publicitarios; pero lamentablemente
también hay desarrollos militares en este sector.
N
Control PID
Para aclarar a que clase de sistema nos referimos al hablar de un controlador
O
analizaremos el caso del control PID desde un enfoque intuitivo.
En la sección 1.3.3 hemos realizado una introducción para esta estrategia, que es la más
C
extendida. Su masiva utilización es especialmente destacable en el campo del control

industrial. Allı́ se identifica la referencia como “set point” (SP) y la salida como “point
value” (PV). La diferencia entre referencia y salida es el error (de seguimiento):
EN
e(t) = r(t) − y(t)
1.5.1. Ley de Control

La estructura de control PID, representada en la figura 1.5 del capı́tulo precedente, es la
suma de tres términos dependientes del error:

acción proporcional P (t) = kp e(t)
de
acción derivativa D(t) = kd (t)
dt
Z t
acción integral I(t) = ki e(t)dt
0
La ley de control resultante es:

t
N
Z
de
u(t) = kp e(t) + kd (t) + ki e(t)dt (1.1)
dt 0
IO
Que también puede expresarse como
1 t
Z
de
u(t) = kc e(t) + Td (t) + e(t)dt (1.2)
dt Ti 0
C
donde Td y Ti tienen unidades de tiempo.
C
Para intentar comprender el efecto de cada uno de estos términos vamos a considerar
como ejemplo el caso de un actuador lineal.
Este puede consistir en motor eléctrico y una transmisión (tornillo y corona) o un pistón
RU
hidráulico accionado mediante una servo-válvula.
En ambos casos el servomotor permite aplicar una fuerza o torque para posicionar
(lineal o angularmente) una carga inercial, y en general para neutralizar perturbaciones
constituidas por otras fuerzas o momentos aplicados independientemente.
ST
Entre los muchos ejemplos de esta clase de sistemas tenemos el utilizado en los
lanzadores satelitales para orientar el vector de empuje de un motor cohete (ver figura
1.14a), subsistema conocido como TVC (Thrust Vector Control).
Si modelamos conceptualmente este problema como la rotación de un “cuerpo rı́gido”

N
alrededor de un punto fijo se puede plantear que:
J δ̈ = Ma (t) + P (δ, t)
O
donde δ es el ángulo de desvı́o del eje de la tobera (y por lo tanto del empuje) respecto
del eje del fuselaje y Ma es el momento aplicado por el actuador. Dado que el punto de
giro (gimbal del motor) en realidad está acelerado por ser solidario al cohete, incluimos
C
una perturbación P (t) que dependerı́a de la aceleración y velocidad angular del cohete.
Mas adelante veremos un modelo más completo incluyendo la dinámica del actuador.
EN
Por el momento el modelo conceptual equivale al siguiente esquema:

N
IO
(b) Esquema de actuación para el control del vector de empuje de un
C
motor cohete. El motor se encuentra montado en una unión cardánica
(a) Actuador lineal (color azul) para el control del vector de empuje de un (gimbal) y el actuador permite desviar el eje de la tobera en relación al
motor cohete. El actuador puede ser hidráulico o electro-mecánico. eje del fuselaje.
C
donde u se corresponde con Ma (la acción de control), x serı́a el desvı́o δ (variable de
salida) y F se corresponde a P (la perturbación).
RU
Acción Proporcional
La acción proporcional tiene un efecto equivalente al resorte de un sistema masa-
ST
resorte-amortiguador:
N
En este sistema el resorte aplica una fuerza Fr “proporcional” al desplazamiento Fr (t) =

−k · x(t), lo cual fuerza a la masa a retornar a su posición de equilibrio.
O
Si se sustituye el resorte por un actuador capaz de aplicar una fuerza u(t) sobre la masa,
y se instala un sensor capaz de medir el desplazamiento x(t); mediante algún dispositivo
C
fı́sicamente compatible con el sensor y el actuador (electrónico, neumático, hidráulico,

etc.) serı́a posible regular la acción del actuador con una ley de control u(t) = −kp · x(t)
que tendrı́a idéntico efecto al resorte si se ajusta kp = k .
EN
Esto constituirı́a un control proporcional, y mediante un ajuste de la ganancia

proporcional kp se podrı́a regular la velocidad (asociada a la frecuencia natural) con la

que reaccionará el sistema ante cualquier perturbación externa F (t), y también cuanto
efecto tendrá dicha perturbación sobre la posición (cuanto se apartará del equilibrio).
Una ventaja respecto del resorte es la posibilidad de ajustar la “rigidez” variando kp , pero
además con el control proporcional serı́a posible hacer:
up (t) = kp · e(t) = kp · r(t) − kp · x(t)
Esto permite ajustar la posición de reposo (equilibrio) a cualquier valor x deseado; lo cual
N
serı́a equivalente a mover el anclaje del resorte en el caso del modelo masa-resorte.
Pero sabemos que sin amortiguador la dinámica de lazo cerrado serı́a oscilatoria
no amortiguada, y por lo tanto no serı́a posible alcanzar el equilibrio luego de una
IO
perturbación. Veamos como resolver este problema.
Acción Derivativa
La acción derivativa corresponde a:
C
ud (t) = kd · ė(t) = kd · ṙ(t) − kd · ẋ(t)
C
El segundo término del lado derecho, −kd · ẋ, es equivalente al efecto que produce el
amortiguador. El primer término, kd · ṙ, implica una anticipación a los cambios o valores
futuros de la referencia (ṙ define la “tendencia” de la referencia).
RU
Para el caso de la masa libre, con el actuador podrı́amos combinar la acción proporcional
con la derivativa para sustituir el conjunto resorte-amortiguador, agregando la capacidad
de variar la respuesta del sistema tanto en velocidad (frecuencia natural) como en
relación a su factor de amortiguamiento. El control proporcional-derivativo (PD) serı́a:
ST
u(t) = up (t) + ud (t) = kp e(t) + kd ė(t)
Si se aplicase una perturbación externa constante F (t), con el control PD se alcanzará

una condición de equilibrio con error en estado estacionario:
N
1
ess = F
kp
O
La acción derivativa solo es efectiva durante la respuesta transitoria, ya que en equilibrio

ė = 0.
Podemos achicar ese error en estado estacionario ess aumentando la constante
C
proporcional kp , pero nunca será posible anularlo totalmente, dado que sin error no hay
acción de control para cancelar la perturbación. Esto también tiene solución.
Sesgo y Acción Integral

EN
Para eliminar el error en estado estacionario podrı́amos agregar a la ley PD un valor

constante ū de sesgo o desvı́o (bias u offset en inglés) para neutralizar la perturbación:
u(t) = kp e(t) + kd ė(t) + ū
Pero serı́a necesario ajustar este valor de forma manual (ū = F ), y deberı́a ser
reajustado cada vez que cambie la perturbación.

Esto es análogo al comando de “trim” para la actitud del avión. Los pilotos ajustan el trim
hasta lograr que la aeronave quede equilibrada en la actitud correcta cuando se dejan
los comandos en su posición neutral.
Z t
La acción acción integral ui (t) = ki e(t)dt es equivalente a un “bias autoajustable”.
0
Esta acción solo alcanza el equilibrio cuando e(t) = 0. Por lo tanto, si ajustando
adecuadamente los parámetros de la ley de control logramos que el sistema a lazo
N
cerrado resulte estable, aun bajo la acción de una perturbación constante el sistema
a lazo cerrado siempre convergerá a la condición de equilibrio con error nulo.
IO
El término integral es el único que permite aplicar una acción de control no-nula aunque
el error sea nulo, y por lo tanto permitirı́a neutralizar perturbaciones sin error de estado
estacionario. Pero debe advertirse que es perjudicial para la respuesta transitoria,
ya que tiende a desestabilizar el sistema y por lo tanto en muchos casos debe ser
C
compensada mediante las acciones PD. De todas formas, en procesos con dinámicas
sobre-amortiguadas (como lo es el caso de los procesos térmicos) muchas veces es
suficiente con una combinación proporcional-integral (PI).
C
1.5.2. Ajuste de Parámetros (Sintonización)
RU
Objetivos y Limitaciones
Con el ajuste de los parámetros de un controlador se busca:
Reducir los errores transitorios

Reducir o eliminar los errores en estado estacionario
ST
Hacer un uso “razonable” de la acción de control

Lograr una respuesta bien amortiguada
Lograr que el sistema realimentado tenga la menor sensibilidad posible ante
cambios en la dinámica de la planta a controlar (robustez)
N
Todo ajuste para un sistema de control es el resultado de una relación de compromiso

entre los objetivos antes planteados y las limitaciones que impone el proceso a controlar.
O
Actuación Máxima Los errores transitorios dependen inversamente de la velocidad de

respuesta, que se regula mediante la ganancia kc en la forma (1.2), a lo cual llamaremos
ganancia del lazo. Pero se debe tener presente que esta no puede aumentarse de forma
C
ilimitada.
La acción de control u(t) siempre tiene lı́mites para sus valores máximos y mı́nimos,
y frecuentemente también hay lı́mites para su velocidad de cambio (rate limit o slew
rate en inglés). En general lo razonable es que estos lı́mites se alcancen solo de forma
EN
excepcional, dado que en esta condición (saturación) el control deja de ser efectivo
y el sistema a lazo cerrado se comporta como si estuviese a lazo abierto con una
perturbación constante u(t) = umax o u(t) = umin .

Ruido de Medición Debe tenerse presente que en toda realización la acción de control
se determina a partir de la función de error medida:
ẽ(t) = r − ỹ(t)
donde ỹ(t) es la señal entregada por el sensor, que se supone se corresponde con un
valor real y . En general podemos descomponer la medición en:
ỹ = y + η
N
donde η es lo que denominamos ruido de medición, que en general es una señal
aleatoria mediante aunque en casos puntuales puede ser determinı́stica, pero siempre
con valor medio nulo.
IO
Considerando por ejemplo una ley PD, para la acción de control real se tendrı́a:
˙ = [kp e(t) + kd ė(t)] + kp η(t) + kd η̇(t)
u(t) = kp ẽ(t) + kd ẽ(t)
Vemos entonces que el ruido de medición se propaga a la acción de control de forma
C
directa con ganancia kp , y por medio de su derivada a través de kd .
Si el ruido de medición es periódico, para cualquiera de sus componentes armónicas
C
η(t) = A sin ωη t la derivada serı́a η̇(t) = ωη A sin ωη t. Resulta evidente que la acción
derivativa realzará la propagación del ruido de medición con un factor kd ωη , lo cual será
más intenso cuando mayor sea la frecuencia de la señal de ruido (más allá de que esta
RU
sea periódica o aleatoria).
En general la propagación del ruido de medición a la variable de salida y es mı́nima,

porque normalmente la dinámica del proceso “filtra” las componentes de alta frecuencia
que pudiera haber en la acción de control. Sin embargo, esto sı́ será visible en la señal
u(t), y podrı́a ocasionar problemas de desgaste de los actuadores, consumo innecesario
ST
de energı́a, o problemas secundarios tales como disconfort en el caso de vehı́culos

tripulados.
Sintonización
Banda Proporcional En general existe cierta tolerancia ±etol para el error. Por otra
N
parte, como dijimos la acción de control u(t) tiene lı́mites máximos umax y mı́nimos
umin .
Un ajuste razonable para la ganancia proporcional es el de aplicar la máxima acción de
O
control cuando se alcanza el lı́mite del error. Si la tolerancia para el error es razonable
para la capacidad de actuación disponible, un ajuste lógico para la ganancia proporcional
serı́a:
C
1 umax − umin
kp =
2 etol
Esto define una “banda proporcional” para el uso del rango de control.
EN
La respuesta será más rápida y los errores serán menores si aumentamos kp , pero esto
implicará que los ruidos de medición se propaguen a la acción de control (verı́amos una
acción de control “ruidosa” aun en ausencia de perturbaciones), lo cual en algún punto
podrı́a resultar indeseable.
A su vez la respuesta en situaciones normales podrı́a resultar demasiado “intensa”,
exigiendo en exceso al actuador, y finalmente podrı́amos observar problemas de
estabilidad que con ganancias más bajas no se producen.

Con valores pequeños tendremos una respuesta lenta y errores mayores en la respuesta
transitoria, y también en estado estacionario si no incluimos acción integral.
Podemos comenzar el ajuste de kp con un valor significativamente menor al de la

banda proporcional, y a partir de este realizar correcciones hasta lograr una respuesta
aceptable en cuanto a desempeño sin incurrir en problemas por actuación máxima y
sensibilidad al ruido de medición. Si al aumentar la ganancia empezamos a notar una
respuesta oscilatoria será necesario agregar acción derivativa.
N
Tiempo Integral La acción integral se puede escribir como:
Z t
IO
ui (t) = ki e(t)dt
0
que también puede expresarse como

t
C
Z
1
ui (t) = kc e(t)dt
Ti 0
C
donde llamamos tiempo integral al parámetro Ti . Si el error se mantuviese constante, Ti
serı́a el tiempo que tardarı́a la integral en alcanzar el valor del error.
En un control proporcional-integral (PI):
RU
1 t
Z
upi (t) = up (t) + ui (t) = kp e(t) + e(t)dt
Ti 0
Si el error es constante e(t) = ē, la acción de control se duplicarı́a luego de un tiempo

Ti :
ST
upi (0) = kp ē

1
upi (Ti ) = kp ē + ē Ti = 2kp ē
Ti
N
Naturalmente el error muy raramente se mantiene constante mientras varı́a la acción

integral, pero este experimento imaginario indica que Ti deberı́a de un orden de
magnitud similar al tiempo de establecimiento (el necesario para alcanzar el equilibrio).
O
La constante integral para la forma (1.1) serı́a ki = kp /Ti .
Es muy importante tener en cuenta que la acción integral tiende a desestabilizar el

C
sistema, por lo cual solo se la utiliza en aquellas situaciones en las cuales es necesario
lograr errores nulos en estado estacionario.
LO aconsejable serı́a ajustar primero la acción proporcional y luego agregar acción
integral comenzando con valores pequeños de ki , incrementándolo hasta alcanzar el
EN
error nulo en un tiempo razonable. Si al incrementar la ganancia integral comienza

a experimentarse un comportamiento oscilatorio será necesario recurrir a la acción
derivativa.
Tiempo Derivativo Debido a valores altos de la ganancia proporcional o por efecto de

la acción integral, la respuesta del sistema a lazo cerrado podrı́a resultar excesivamente
oscilatoria; e incluso podrı́a ocurrir que esta resulte inestable.

La acción derivativa tiene un efecto estabilizante, y permite introducir amortiguamiento
en la respuesta transitoria. En equilibrio no tiene ningún efecto.
La combinación entre la acción proporcional y la derivativa constituye un control

proporcional-derivativo (PD). Esto puede escribirse como:
upd (t) = up (t) + ud (t) = kp (e(t) + Td ė(t)dt)
Si el error crece linealmente e(t) = d · t, la presencia de una acción derivativa con tiempo
N
derivativo Td = 1/d duplicará la acción de control del término proporcional cuando
t = Td :
upd (Td ) = kp (d Td + Td d) = 2kp e(Td )
IO
Por lo tanto el tiempo derivativo deberı́a estar en el orden del tiempo de respuesta. Un
valor mayor implicará un efecto amortiguante mayor y viceversa.
La desventaja es que este término amplificará los errores de medición de alta frecuencia.
C
Esto puede mitigarse introduciendo un “filtro pasa-bajos” en la derivada.
C
Consideremos el caso del TVC. El rango de desplazamiento es de ±60 . Supongamos
que se requiere una precisión de 0,020 en el alineamiento del eje de empuje, y que la
señal de control se encuentra normalizada de forma tal que los lı́mites se correspondan
RU
con ±1. La banda proporcional serı́a:
1
BP = = 50
0,02
Pero si el actuador está sobredimensionado, usar este valor de banda proporcional para
ST
definir kp podrı́a resultar excesivo.
Por ser este un sistema mecánico en principio con fenómenos disipativos de baja
intensidad (habrı́a que ver en detalle el actuador para afirmarlo), el lógico asumir que
será necesario incluir acción derivativa para amortiguar la respuesta.
N
Si el vehı́culo realiza una trayectoria curva (diferente a la de un “giro gravitatorio”), el

motor experimentará una aceleración lateral y aparecerá un error de estado estacionario.
Para neutralizar completamente el efecto de esta perturbación necesitamos agregar
O
acción integral.
C
1.5.3. Realización del Controlador PID

La realización fı́sica de un controlador depende de la naturaleza de la aplicación.
En la actualidad predominan las implementaciones digitales, utilizando algún tipo de
EN
microcontrolador (microprocesador diseñado para su uso en sistemas embebidos). Sin

embargo el controlador PID nació a principios del siglo XX, mucho antes del desarrollo
de la electrónica analógica y más aún de la era digital.
Analógica
Podemos reconocer el uso de la acción proporcional ya en el regulador de Watt para
sus máquinas a vapor. Hacia 1907 apareció el primer controlador neumático. Empresas

N
IO
Figura 1.15: Controlador PID neumático del año 1940
C
C
RU
ST
(a) Controlador PID analógico (b) Posible circuito para un PID analógico
N
muy conocidas en la actualidad como Sperry, Taylor o Foxboro tuvieron sus orı́genes en
O
aquellas épocas.
En esas épocas también se desarrollaron controladores electro-mecánicos, pero hacia
los años ’40 los controladores PID neumáticos se utilizaban a nivel industrial.
C
En la actualidad es posible realizar un control PID analógico utilizando amplificadores

operacionales. Los parámetros se ajustan eligiendo adecuadamente las resistencias y
capacitores del circuito.
EN
Alta Ganancia con el Lazo PID

En el control PID tenemos por un lado un ajuste de la ganancia del lazo abierto dada por
la acción proporcional. Podrı́amos utilizar valores elevados de kp para aproximarnos al
control perfecto, pero sabemos que un valor excesivo puede acarrear problemas.

Los términos integral y derivativo tienen ganancias diferentes según se trate de
movimientos rápidos o lentos.
Respecto del término integral podemos notar que si por ejemplo tenemos una
señal de error senoidal e(t) = A sin ωt, el integrador genera como salida ui (t) =
ki ω −1 A cos ω (t − π). La ganancia serı́a ki ω −1 .
Podemos decir que el término integral impone una ganancia variable, que tiene a infinito
para señales lentas. Esto explica por que en estado estacionario se logra el control
perfecto (error nulo para cualquier perturbación constante).
N
Naturalmente esto se pierde progresivamente cuando la referencia varı́a de forma cada
vez más rápida.
IO
Para la acción derivativa ud (t) = kd ωA cos ωt, y por lo tanto podemos realizar el
razonamiento inverso.. Pero lograr el control perfecto para señales rápidas también
genera problemas y en general no es necesario.
C
Realización Digital
Un controlador digital es una implementación de la ley de control utilizando un micro-
procesador con la electrónica necesaria (conversores A/D) para convertir las señales de
C
los sensores en números digitales y a partir de las acciones de control calculadas desde
su representación digital generar las señales analógicas correspondientes (conversores
RU
D/A).
En muchos casos los sensores dan información digital de forma directa, y los actuadores
pueden ser comandados mediante señales digitales sin requerir el uso de conversores
D/A, aunque en última instancia en problemas de ingenierı́a casi siempre habrá una
conversión D/A para que las acciones de control incidan en el mundo fı́sico.
ST
Para la implementación digital de la ley PID realizamos una discretización de la ecuación

(1.1) o la (1.2) obteniendo una en diferencias. Con el término proporcional no hay
cambios, pero sı́ es necesario esto para la derivada y la integral. Por ejemplo:
N
n
e(k) − e(k − 1) X
u(k) = kp e(k) + kd + ki e(h) (1.3)
ts
h=0
O
donde k ∈ N es un número entero que representa un instante de muestreo t = kts ,

mientras que ts es el intervalo entre muestras (tanto para las entradas como para las
salidas) que llamamos tiempo de muestreo; siendo la frecuencia de muestreo su inversa
C
fs = 1/ts .
Mediante un reloj interno el procesador computa la (1.3) una vez cada ts segundos
para actualizar el valor de la acción de control (salida) con la última medición disponible
EN
(entrada) y su correspondiente referencia. En general la acción de control se mantiene

constante hasta el próximo intante de muestreo mediante un dispositivo de retención de
orden cero.
Es fundamental elegir un tiempo de muestreo adecuado, aunque su valor exacto no es

relevante. Si este tiempo es demasiado grande, es imposible reaccionar adecuadamente
a la evolución del proceso a controlar. Si es demasiado chico, en el cálculo de la

diferencia e(k) − e(k − 1) para la acción derivativa los resultados podrı́an resultar
muy pequeños y perderse por errores numéricos, dado que en sistema digital la
representación numérica siempre tiene resolución acotada.
Un tiempo de muestreo razonable es aquel que permitirı́a tomar entre 4 y 8 muestras

durante el tiempo de crecimiento en la respuesta transitoria, que por ahora definiremos
como aquel necesario para pasar del 10 % al 90 % del valor final de equilibrio al aplicar
una perturbación constante o un cambio de referencia de forma abrupta.
N
Cómputos
IO
Los cómputos asociados a los ejemplos que se presentarán pueden realizarse mediante
MatlabTM o GNU Octave. En ambos casos se requiere tener instalado el paquete con
funciones especı́ficas para control.
C
En el caso de MatlabTM nos referimos al paquete denominado control toolbox.
En el caso de GNU Octave 2 es necesario descargar el paquete control y luego instalarlo
desde la ventana de comando con el comando pkg, aunque la opción -forge para
C
descargar e instalar un paquete con un solo comando:
pkg i n s t a l l − f o r g e c o n t r o l
RU
El paquete control debe ser cargado en cada sesión en la cual sea requerido:
pkg load c o n t r o l
Es posible realizar ajustes para que esto ocurra de forma automática al inicio.
ST
El paquete de control de GNU Octave es compatible con el control toolbox de Matlab,

auqnue no todas las fucniones se encuentran implementadas (ver el listado de funciones
correspondiente).
N
O
C
EN

EN
C
O
N
ST
RU
C
C
IO
N
N
2
IO
C
Objetivos del Control
C
RU
ST
N
O
C
EN
Requerimientos
No es posible hacer un desarrollo de ingenierı́a sin contar previamente con una
especificación de requerimientos que permita orientar dicho desarrollo.
En esta sección daremos un panorama introductorio en relación a los requerimientos
27
para un sistema de controla automático.
Debe quedar en claro que la interacción entre el controlador y el proceso a controlar o

planta produce un nuevo sistema dinámico con caracterı́sticas propias. Por el momento
le llamaremos proceso controlado.
Todos los requerimientos están relacionados con la dinámica del proceso controlado,
pero dado que para el diseño se asume que la dinámica de la planta no se puede
modificar, satisfacer los requerimientos dependerá exclusivamente de la dinámica del
controlador.
N
2.1.1. Seguimiento de Referencias
IO
En general el objetivo básico de un sistema de control es el de lograr que ciertas variables
de un determinado proceso se ajusten a valores deseados.
Por ejemplo, en una máquina de CNC la posición y la velocidad de la herramienta de
C
corte tienen que seguir una evolución predeterminada para mecanizar la pieza requerida.
En el caso de un manipulador para operación remota, el “efector” del brazo robótico tiene
que “copiar” los movimientos de la mano del operador.
C
RU
En todos los casos existirán tolerancias en cuanto a la diferencia entre los valores
deseados o referencias y los valores realmente alcanzados (que consideramos salidas),
a lo que llamamos errores de seguimiento.
2.1.2. Rechazo de Perturbaciones

ST
En muchos casos el seguimiento de referencias debe lograrse aun bajo la acción de

otros fenómenos que perturban la evolución del proceso controlado.
Por ejemplo, en el aterrizaje de una aeronave por instrumentos el objetivo del piloto
(automático o humano) es el de mantener los indicadores de error de trayectoria en cero,
N
es decir, centrar las barras de senda de planeo (glide slope) y eje de pista (localizer ) en
el indicador del ILS (ver figura 2.1) .
En condiciones climáticas adversas el seguimiento exacto será imposible, pero se espera
O
que el piloto logre mantener acotado los errores a la mitad del intervalo de la escala del
indicador.
C
A esta clase de requerimientos nos referiremos cuando hablamos de rechazo de

perturbaciones.
EN
2.1.3. Dinámica del Sistema Controlado

Un requerimiento implı́cito en control automático es el de lograr que el sistema controlado
tenga una dinámica estable. En general esta es condición necesaria pero no suficiente
para satisfacer los requerimientos.
Ante cambios abruptos en las referencias o en las perturbaciones existirán perı́odos

de respuesta transitoria en el proceso controlado hasta alcanzar las tolerancias

N
IO
C
C
Figura 2.1: Aterrizaje por instrumentos. Indicador del ILS
RU
especificadas. Se espera que esta evolución sea lo suficientemente “rápida” y “suave”
en relación a los requerimientos del problema puntual.
La rapidez puede especificarse en términos de tiempo de crecimiento ante una variación

escalón en la referencia (o en la perturbación), o en función del ancho de banda de dicha
respuesta.
ST
La suavidad está asociada a la inexistencia de comportamientos oscilatorios, que en

general no son admisibles. Esto se logra imponiendo un cierto amortiguamiento mı́nimo
para los polos que caracterizan la dinámica del proceso controlado, o acotando los picos
resonantes de su respuesta en frecuencia.
N
Por otra parte existen sistemas diseñados especı́ficamente para lograr ciertas mejoras
en la dinámica del proceso controlado respecto de la del proceso sin controlar. Es el
caso de los sistemas de estabilidad artificial: amortiguadores de guiñada en aeronaves
O
de trasnporte, suspensión activa en automóviles de alta gama, control de rolido en

embarcaciones de gran porte, etc.
C
En sı́ntesis podemos decir que para cualquier aplicación en el diseño de las estrategias
de control es necesario poner énfasis en la dinámica resultante del proceso controlado,
y veremos que tanto la capacidad de seguimiento de referencias como de rechazo de
perturbaciones (si son requeridas) dependen de ella.
EN
2.1.4. Robustez
Los procesos dinámicos reales en general varı́an con el transcurso del tiempo
(envejecimiento, desgaste, etc.), o bien varı́an al operar en diferentes condiciones.

N
IO
C
(a) respuesta en frecuencia entre elevador y ángulo de (b) variación en la ubicación de polos y ceros de la dinámica longitudinal (izquierda) y
cabeceo de polos de la dinámica latero-direccional (derecha)
C
Figura 2.2: Variaciones en la dinámica longitudinal de una avión bireactor de 8 plazas durante la aproximación final
RU
Por ejemplo, la dinámica de una aeronave depende fuertemente de la presión dinámica
y el número de Mach; por lo cual su comportamiento es diferente en una condición de
aproximación final respecto del vuelo en crucero.
En la figura 2.2 vemos los cambios en la dinámica de una aeronave para diferentes
ST
condiciones de vuelo en régimen subsónico durante la aproximación final. Un sistema

de aterrizaje automático (autoland) debe ser capaz de manejar diversos requerimientos
en cualquiera de estas condiciones.
Un sistema de control automático debe ser capaz de cumplir con los requerimientos del
N
diseño aun bajo cambios (acotados) en la dinámica del proceso sobre el cual opera.
Llamamos a esto desempeño robusto.
O
Control a Lazo Cerrado

C
2.2.1. Control por Inversión

Un control “perfecto” serı́a aquel lograra que la salida y(t) siga a la referencia r(t) de
forma exacta independientemente de lo que ocurra con la perturbación d(t) (siempre y
EN
cuando esta esté acotada):
y(t) = r(t) ∀d(t) (2.1)
En la figura 2.3 se muestra una estrategia que en teorı́a podrı́a alcanzar este objetivo. El
bloque f [·] es un operador matemático que representa la respuesta dinámica de la salida
y(t) ante una acción de control u(t), mientras que h[·] corresponde a la ley de control

N
Figura 2.3: Control por inversión
IO
que regula u(t) en función de r(t) − d(t). Implı́citamente estamos asumiendo que esta
última se mide de alguna manera, aunque en general eso no es posible.
Con el esquema mostrado, que denominamos control a lazo abierto, lograrı́amos el

control perfecto si hacemos que la ley de control sea la inversa de la dinámica de la
C
planta: h[·] = f −1 [·].
Veremos más adelante que esto tampoco es posible por diversas razones, y por lo tanto
C
el control perfecto es “irrealizable”. Sin embargo se puede lograr una aproximación a este
ideal dentro de ciertos lı́mites.
RU
El primer obstáculo para realizar un control por inversión es que toda dinámica implica
una relación integral.
Por ejemplo, desde el punto fı́sico la posición de un rı́gido es la integral de la velocidad
(matemáticamente se puede establecer también la relación inversa), y esta a su vez es
la integral de la aceleración producida por los actuadores y las perturbaciones.
La inversa de la integral es la derivada, y para señales que varı́an rápidamente su
ST
magnitud es grande. El caso lı́mite en el cual la referencia o la perturbación cambian

abruptamente (en forma de escalón) implicarı́a una derivada infinita, lo cual no puede
trasladarse a la acción de control u.
Por lo tanto para invertir la integral necesitamos una derivada, pero esta no es realizable
fı́sicamente de forma exacta. Pero podemos encontrar un esquema que equivalga a la
N
derivada al menos para señales que no cambien demasiado rápido, y por lo tanto lo
mismo puede decirse de la inversa de una dinámica genérica f [·].
O
Una forma de realización de esta inversa es usar un modelo de la dinámica a invertir

fˆ[·] ≈ f [·] en un lazo de realimentación con un término de alta ganancia h[·], según el
esquema mostrado en la figura 2.4. En ese diagrama se observa que:
C
u = h[(r − d) − z]
y como z = fˆ[u]:
u = h[(r − d) − fˆ[u]]
EN
Si aplicamos la inversa del operador h[·] a ambos lados:
h−1 [u] = (r − d) − fˆ[u] → fˆ[u] = (r − d) − h−1 [u]
Aplicamos la inversa del operador fˆ[·] a ambos lados:
u = fˆ−1 [(r − d) − h−1 [u]]

N
IO
Figura 2.4: Inversión con alta ganancia
Si |h[·]| 1 para su inversa se tiene |h[·]−1 | ≈ 0 y podemos decir que con esto:
C
u ≈ f −1 [r − d]
C
De esta forma vemos que u responde en base a una inversa aproximada de la dinámica
de la planta sin tener que invertir el modelo de forma explı́cita.
Pero se debe destacar que aun quedan otros problemas por resolver:
RU
nunca es posible modelar la dinámica de la planta de forma exacta (fˆ[·] 6= f [·]) y
además |h[·]| < ∞.
normalmente no es posible medir las perturbaciones para incluirlas en la acción
de control.
aunque lo anterior fuera posible, habrı́a que conocer además la condición inicial
ST
del proceso para inicializar el modelo.
2.2.2. Inversión por Realimentación

Podemos notar en la figura 2.4 que si el modelo fuese exacto, z = f [u] = y − d.
N
Planteamos entonces el esquema de la figura 2.5, en donde realimentamos la medición

y en lugar de z , y suprimimos en la suma a d. El resultado sobre u serı́a el mismo.
O
C
EN
Figura 2.5: Inversión por realimentación de alta ganancia
De esta forma se logra una inversión “implı́cita” sin necesidad de conocer la dinámica del
proceso ni tener que medir la perturbación; con la sola condición de que |h[·]| 1, sin

importar su valor exacto. Por esta razón se recurre de una u otra manera al control por
realimentación, llamado también control a lazo cerrado, en lugar de utilizar un control a
lazo abierto.
Pero debemos advertir que utilizar alta ganancia para la realimentación acarrea una serie
de problemas asociados a la estabilidad del sistema a lazo cerrado, y otros relacionados
con la instrumentación (sensores y actuadores).
Veremos en los próximos capı́tulos que en el diseño de un sistema de control es
necesario alcanzar una relación de compromiso entre la búsqueda del control perfecto
N
y los problemas que implica el uso de alta ganancia por las limitaciones que impone el
proceso a controlar y la instrumentación requerida.
IO
2.2.3. Realimentación y Dinámica de Lazo Cerrado
Podrı́a decirse que la temática central del control automático es en definitiva el diseño
de realimentaciones artificiales sobre algún proceso dinámico (planta) para generar uno
C
con caracterı́sticas dinámicas deseables. Es a este nuevo sistema, que antes llamamos
“proceso controlado”, al cual nos referimos al hablar de sistema a lazo cerrado.
C
Es importante comprender que el sistema de control no cambia la dinámica de la planta.
Es la interacción entre la dinámica del controlador y la de la planta lo que resulta en una
cierta dinámica de lazo cerrado, diferente tanto de la planta como del controlador.
RU
Tomemos el modelo de estados (A.4) (ver apéndice A.1) para la dinámica de la planta
junto con sus salidas (variables medidas):
ẋ = f (x, t) + g u (x, t)u(t) + g d (x, t)d(t)

ST
y = h(x, u)
en donde descomponemos es el vector de variables exógenas entre aquellas se pueden

manipular u (acciones de control) y aquellas que consideramos perturbaciones d.
Desde el punto de vista de las relaciones “causa-efecto” es más consistente plantear la
dinámica como una relación integral:
N
Z t
x(t) = [f (x, t) + g u (x, t)u(t) + g d (x, t)d(t)] dt (2.2)
O
0
y = h(x)
El “efecto” es la evolución del estado (lado izquierdo) mientras que las “causas” de esta
C
evolución son todos los términos que definen ẋ, es decir, el corchete dentro de la integral.
Este modelo se puede graficar como:
EN

Decimos que un sistema es realimentado cuando los “efectos” influyen en las “causas”,
atenuándolas o amplificándolas según se trate de dinámicas estables o inestables
respectivamente.
Para el modelo de estados (A.4) este rol está implı́cito en el término f (x), ya que el
correspondiente a u(t) queda definido externamente. Los términos g u (·) y g d (·) solo
operan como “mapeos” entre las entradas y la velocidad del estado ẋ. No forma parte
de la dinámica del proceso sino que define su sensibilidad las variables exógenas u y d.
N
Normalmente el término f (x) es no nulo, con lo cual podrı́amos decir que casi todos
los procesos dinámicos son realimentados. Si embargo, en control automático hablamos
de sistemas realimentados cuando alguna componente de u es forzada a depender del
IO
estado. Esto constituye una realimentación artificial, pero en última instancia que sistema
es realimentado y cual no es solo una cuestión de perspectiva (excepto que f (x) = 0).
El esquema de realimentación artificial (en el caso invariante en el tiempo) serı́a:
C
C
RU
ST
Los sensores y actuadores también son sistemas dinámicos, con propiedades que
pueden ser descriptas con modelos matemáticos. En el diagrama precedente esa
N
dinámica quedarı́a absorbida dentro del modelo de estados, es decir, los estados
internos de estos subsistemas serı́an parte del vector x.
O
Diseño del Lazo de Control

C
2.3.1. Sistema SISO

Si tanto la acción de control u como la salida y son escalares decimos que se trata de
un sistema SISO (Single Input Single Output).
EN
Si ambos son vectores en Rn , n > 1 se trata de un caso MIMO (Multiple Input Multiple
Output), siendo obvia la nomenclatura para escalares y vectores combinados.
Para sistemas SISO usando modelos dinámicos lineales se pueden expresar las
relaciones dinámicas entre entrada y salida mediante funciones de transferencia.
La salida en un modelo lineal de la planta será la superposición de los efectos de cada
entrada, y entre ellas la acción de control.

N
Figura 2.6: Lazo de control general
IO
Si por ejemplo, además de la acción de control hay una perturbación d(t):
Y (s) = G(s)U (s) + F (s)D(s)
C
C
RU
2.3.2. Sensibilidades del Lazo SISO
Podrı́amos sustituir las perturbaciones por señales equivalentes que actúe directamente
ST
sobre la salida:
Y (s) = G(s)U (s) + Do (s) , Do (s) = F (s)D(s)
o bien una que se apliquen a la entrada junto con u:

N
F (s)
Y (s) = G(s) [U (s) + Di (s)] , Di (s) = D(s)
G(s)
O
Dependiendo de la conveniencia, en general incluiremos algunas perturbaciones como

efectos equivalentes a la entrada y otras a la salida.
C
Para construir una estructura genérica para el lazo de control se agrega en el lazo de
realimentación el ruido de medición N (s) y se identifican las tres variables de salida
relevantes para el análisis: Y (s), E(s) y U (s) (ver figura 2.6).
EN
Como ejemplo podemos considerar el control de régimen de giro para el motor de un

helicóptero, comúnmente llamado governor.
En la figura 2.7 se muestra un esquema del caso de un helicóptero con motor de
combustión interna. En este caso, para variar el régimen de giro actuamos sobre la
mariposa del carburador.

N
IO
Figura 2.7: Esquema del control de régimen de giro (governor ) de un helicóptero con motor de combustión interna
También el rotor principal y el rotor de cola afectan el régimen de giro cuando cambia
C
el paso colectivo de cualquiera de ellos, especialmente el primero. Identifiquemos estas
perturbaciones como dp y dc respectivamente.
C
Dado que el paso colectivo del rotor principal es proporcional al movimiento del comando
de paso colectivo (figura 2.8a), la posición de este mando da información directa de la
RU
perturbación.
Sin embargo, esta no se suma directamente a la entrada o a la salida, como se muestra
en la figura 2.6. Para calcular una perturbación de salida do “equivalente” habrı́a que
considerar la transformación dinámica f1 [·] que hay sobre el paso colectivo antes de
producir un efecto en la salida y (el régimen de giro del motor). Lo mismo puede
decirse para el rotor de cola, con lo cual la perturbación equivalente serı́a de la forma
ST
do = f1 [dp ] + f2 [dc ].
Dado que la dinámica f1 [·] es similar a la que relaciona la apertura de la mariposa u con
la salida f [·], es decir f1 [·] ≈ f [·], es lógico pensar en estos efectos como perturbaciones
de entrada. Más aun, una estrategia común para compensarla al menos parcialmente
N
es la de conectar mecánicamente el comando de paso colectivo con la apertura del

carburador.
Este mecanismo se le llama correlador, y se esquematiza en la figura 2.7 como una
O
señal de “pre-alimentación” (feed-foreward) sumada a la acción de control.

Otra posibilidad es medir la posición de este comando con algún sensor y generar una
correlación dentro del controlador.
C
Reduciendo el diagrama de la figura 2.6 (de acuerdo a lo desarrollado en el apéndice

A.2), vemos que la “sensibilidad” de la salida a cambios en la referencia, que es lo que
normalmente llamamos función de transferencia a lazo cerrado, resulta:
EN
Y (s) K(s)G(s)
T (s) = = (2.3)
R(s) 1 + K(s)G(s)
De la misma forma podemos evaluar la transferencia entre la referencia y el error:
E(s) 1
S(s) = = (2.4)
R(s) 1 + K(s)G(s)

(a) Comando de paso colectivo del rotor principal. El (b) transmisión del comando de acelerador (c) Accionamiento de la mariposa del carbu-
N
rotor de cola se comanda con pedales y servo-motor del governor rador
IO
Esta misma relación coincide con la sensibilidad de la salida Y (s) a la perturbación de
salida Do (s).
Entre estas dos funciones de sensibilidad existe una restricción fundamental indepen-
C
diente del caso analizado:
S(s) + T (s) = 1 (2.5)
C
Llamamos a S(s) función de sensibilidad y a T (s) sensibilidad complementaria.
RU
Podemos determinar otras funciones de interés identificando las trayectorias directas, ya
que el lazo de realimentación es el mismo en todos los casos:
Y (s) G(s)
Si (s) = = = S(s)G(s) (2.6)
Di (s) 1 + K(s)G(s)
ST
Y (s)
So (s) = ≡ S(s) (2.7)
Do (s)
U (s) K(s)
Su (s) = = = S(s)K(s) (2.8)
N (s) 1 + K(s)G(s)
N
Agrupando todas las sensibilidades en una matriz de transferencia:

 
R(s) 
O

 
Y (s) 1 K(s)G(s) G(s) 1 1

Di (s)

= (2.9)
U (s) 1 + K(s)G(s) K(s) K(s)G(s) K(s) K(s) 
Do (s) 
N (s)
 
C
Puede observarse que todas las sensibilidades quedan definidas por cuatro funciones
fundamentales: T (s), S(s), Si (s) y Su (s), que comparten como denominador la
expresión 1 + K(s)G(s).
EN
2.3.3. Ecuación Caracterı́stica de Lazo Cerrado

En un modelo lineal la caracterı́sticas principales de la dinámica del proceso se describen
a través de sus modos naturales, y estos se pueden estudiar analizando los polos de su
matriz de transferencia.

De la ecuación (2.9) vemos que para el sistema a lazo cerrado los polos serán las raı́ces
de su ecuación caracterı́stica:
1 + G(s)H(s) = 0 (2.10)
Es obvio que las raı́ces quedan definidas por el producto L(s) = G(s)H(s), a lo cual
denominaremos dinámica de lazo abierto; pero normalmente los polos de lazo abierto y
los de lazo cerrado son diferentes.
N
Como L(s) es una función racional (cociente de polinomios), puede representarse como:
IO
B(s)
L(s) =
A(s)
donde A(s) es un polinomio de orden n y B(s) uno de orden ≤ n. Con esto la ecuación
C
caracterı́stica se puede escribir como:
B(s)
1+ =0
C
A(s)
Multiplicando ambos miembros de la ecuación caracterı́stica por el polinomio denomina-

dor la podemos reescribir como:
RU
Alc (s) = A(s) + B(s) = 0 (2.11)
El polinomio Alc (s) naturalmente se denomina polinomio caracterı́stico de lazo cerrado,

ST
y sus raı́ces son las mismas que las de la ecuación (2.10).

Este polinomio será lo que se obtendrı́a construyendo un modelo de estados para el lazo
cerrado, y calculando el polinomio caracterı́stico de su matriz dinámica |sI − Alc |.
Dado que entre las diferentes sensibilidades puede haber cancelaciones entre polos y
N
ceros, la estabilidad no puede evaluarse a partir de una sola de ellas; pero sı́ podemos
afirmar que el lazo es internamente estable si las cuatro sensibilidades mencionadas son
estables.
O
2.3.4. Compromisos del Diseño

C
El control perfecto serı́a aquel en el cual Y (s) = R(s), o bien E(s) = 0;

independientemente de lo que ocurra con cualquiera de las entradas al lazo.
En otras palabras, control perfecto implica seguimiento exacto de las referencias y
rechazo exacto de perturbaciones:
EN
T (s) = 1 , S(s) = 0 (2.12)
Ambas cosas compatibles y de hecho podemos decir “caras de una misma moneda”,
si consideramos la restricción fundamental dada por la ecuación (2.5) que podemos
reescribir como:
S(s) = 1 − T (s) (2.13)

Sin embargo T (s) = 1 (S(s) = 0) esto solo podrı́a lograrse con K(s)G(s) → ∞, lo cual
no es realizable ni tampoco deseable debido a diferentes restricciones.
Se puede notar que lograr alta ganancia de lazo abierto K(s)G(s) → ∞ es más difı́cil
cuando |G(s)| → 0, lo cual se da en alta frecuencia (toda dinámica real tiene una
frecuencia de corte acotada). Para frecuencias altas (en relación a la dinámica de la
planta) se requerirı́a incrementar progresivamente la ganancia del control, lo cual trae
aparejados problemas con la actuación máxima, los ruidos de medición y la robustez.
Restricciones por Actuación Máxima Ganancias elevadas implican acciones más
N
intensas de control ante una cierta magnitud de error. Esto podrı́a llevar a alcanzar
los valores máximos admisibles de la acción de control (saturación) aun ante errores
pequeños, lo cual suele resultar inaceptable desde el punto de vista práctico.
IO
Restricciones por Ruido de Medición Ganancias elevadas, especialmente a frecuen-
cias altas, tenderán a amplificar y propagar el ruido de medición a la acción de control.
En casos extremos la acción de control podrı́a terminar dominada por los ruidos de me-
C
dición.
C
Restricciones por Incertidumbre Dinámica Las leyes de control se diseñan en base
a un modelo dinámico del proceso a controlar, que por definición no es exacto. En general
este modelo representa correctamente la dinámica del sistema para movimientos lentos,
RU
compatibles con el comportamiento esperado del sistema a lazo cerrado.
Si se pretende de este último una respuesta más rápida será necesario refinar el modelo
para incluir efectos originalmente despreciados. Estos suelen ser difı́ciles de modelar, y
muchas veces implica lidiar con parámetros variables según la condición de operación.
Un control diseñado con un modelo que no represente correctamente la dinámica del

ST
proceso en la escala de tiempos de respuesta que se pretende para el lazo cerrado

tendrá un desempeño poco satisfactorio, es decir, no será robusto.
2.3.5. Errores en Régimen Estacionario

N
Una condición necesaria para la correcta operación de un sistema de control es que

la dinámica de lazo cerrado sea estable. Por lo tanto, si se produce un cambio abrupto
(impulso o escalón) en la referencia o en una perturbación, el sistema a lazo cerrado
O
evolucionará hasta alcanzar una nueva condición de equilibrio.
De hecho, este cambio en las entradas podrı́a tener alguna ley de evolución temporal
C
que no necesariamente implique establecerse en algún valor constante, y aún ası́

observarı́amos un perı́odo de respuesta transitoria para pasar finalmente a un régimen
estacionario (como vemos en el caso de la respuesta a entradas senoidales).
En régimen transitorio la evolución del estado estará fuertemente marcada por la
EN
dinámica de lazo cerrado, pero en régimen estacionario tomará la forma de la referencia

o perturbación (linea, parabólica, senoidal, etc).
Los errores en el régimen transitorio son inevitables, pero se puede trabajar sobre
la dinámica de lazo cerrado para ajustar algunos aspectos de este transitorio,
especialmente su duración (tiempo de establecimiento) y amortiguamiento (es decir,
evitar oscilaciones excesivas).

En cambio en régimen estacionario, para perturbaciones determinı́sticas, sı́ se puede
lograr error nulo.
Para perturbaciones aleatorias el análisis debe hacerse en frecuencia, evaluando las

distribuciones espectrales de densidad de potencia (PSD) de las perturbaciones y cómo
estas se propagan a las salidas, lo cual dependerá de la dinámica del lazo cerrado como
ocurre con la respuesta transitoria.
En otras palabras, para perturbaciones aleatorias analizamos el lazo cerrado como un
“filtro”.
N
Perturbaciones de Tipo 1/sk
Para determinar el error de estado estacionario a partir de las funciones de transferencia
IO
del lazo podemos recurrir al Teorema del Valor Final, que aplicado al error resulta:
ess = lı́m e(t) = lı́m sE(s) (2.14)

t→∞ s→0
C
Si evaluamos lo que ocurre con este error ante un cambio en la referencia tendremos:
1
ess = lı́m sS(s)R(s) = lı́m s R(s) (2.15)
s→0 s→0 1 + L(s)
C
En el análisis que podemos encontrar en los libros clásicos como [Oga98] o [Kuo]
se considera habitualmente el error de respuesta a una referencia escalón, rampa o
RU
parábola:
1 1 1
R(s) = ess = lı́m s (2.16)
sk s→0 1 + L(s) sk
donde k = 1, 2, 3, · · · se corresponde a escalón, rampa, parábola, etc. Si descompone-
mos la transferencia de lazo abierto en el producto de una función L̄(s) sin polos en el
ST
origen y normalizada con ganancia 1 a frecuencia cero (L̄(0) = 1) y otro término L0 /st
con el resto de la dinámica de lazo abierto (L0 = L(0)):
s 1 st−k+1
ess = lı́m = lı́m
s→0 L0 sk s→0 st + L0
N
1 + t L̄(s)
s
En el caso de una entrada escalón k = 1:
O
 1

st si t = 0
eescalon = lı́m t = 1 + L0 (2.17)
s→0 s + L0
0 si t > 0

C
A la cantidad t de polos en el origen del lazo abierto se la designa como tipo de sistema.
Vemos que un sistema de tipo 0 tendrá un error constante al escalón, tanto más chico
cuanto mayor sea su ganancia a frecuencia cero. Un sistema con tipo mayor a 0 tendrá
error nulo al escalón.
EN
Para una entrada rampa k = 2, con lo cual:

∞ si t = 0



1

erampa = si t = 1 (2.18)
L
 0


0 si t > 1

Que el error de estado estacionario a una referencia rampa sea ∞ significa que la
pendiente de la variable de salida y es diferente a la de la referencia r, y por lo tanto
la diferencia aumenta sin lı́mite.
Veamos el caso de la respuesta de lazo cerrado para un sistema térmico simple con
control proporcional:
C kp C
G(s) = , K(s) = kp , L(s) = K(s)G(s) =
Ts + 1 Ts + 1
N
El lazo es de tipo 0 (ni G(s) ni K(s) tienen polos en el origen), y la ganancia a frecuencia
cero es L(0) = kp C . La transferencia a lazo cerrado es:
IO
kp C
T (s) =
T s + kp + 1
En la siguiente figura se muestra la respuesta a un cambio abrupto (escalón) en la
C
referencia y a un cambio lineal (rampa):
C
RU
ST
N
Vemos que hay un error en estado estacionario constante, mientras que para la rampa el
error crece sin lı́mite ya que la pendiente de la respuesta tiene una diferencia constante
respecto de la pendiente de la referencia.
O
Para el escalón (en este caso de amplitud el escalón 550 − 100 = 450 y kp C = 10) el
error de estado estacionario es:
C
1 1
ess = 55 = 450 = 4,10
1 + L0 1 + kp C
EN
Podemos ver que los polos y ceros de lazo abierto no tienen ninguna influencia sobre el
estado estacionario, a excepción de aquellos en el origen. En los casos con error no nulo,
este será tanto menor cuando mayor sea la ganancia. Estos resultados se sintetizan en
la tabla 2.1.
Debe destacarse que la acción integral en el control PID incrementa el tipo de sistema
en 1, y por lo tanto garantiza error nulo en estado estacionario a referencias constantes.

tipo de sistema
0 1 2
1
escalón 0 0
1 + L0
1
rampa ∞ 0
L0
1
parábola ∞ ∞
L0
N
Cuadro 2.1: Errores de estado estacionario para modelos de perturbación 1/sk
IO
Los mismos resultados se obtiene si consideramos el error de estado estacionario
ante una perturbación equivalente a la salida. Desde la perspectiva del error,
tanto la referencia R(s) como la perturbación de salida Do (s) pueden considerarse
genéricamente como una misma perturbación.
C
Pero en el caso de una perturbación de entrada hay una diferencia:
G(s)
ess = lı́m sSi (s)Di (s) = lı́m s Di (s)
C
s→0 s→0 1 + K(s)G(s)
1
= lı́m s Di (s)
s→0 G−1 (s) + K(s)
RU
Si G(s) no tiene ceros en el origen, lı́m G−1 (s) = cte, con lo cual:
s→0
1
ess = lı́m s Di (s)
s→0 c + K(s)
ST
En este caso los polos y ceros de la planta no tienen incidencia sobre el error en estado
estacionario. Solo interesa la ganancia y los polos del controlador K(s).
A partir del diagrama 2.6 para un lazo de control podemos diagramar las sensibilidades
del error a las referencias o perturbaciones de salida por un lado (función S(s)) y a
N
perturbaciones de entrada (Si (s)). Esto se muestra en la figura 2.9.

O
C
EN
Figura 2.9: Replanteo de la figura 2.6 para poner en evidencia las sensibilidades del error a las distintas entradas del lazo SISO

Podemos notar que en el primer caso tanto el control K(s) como la planta G(s) aparecen
en el lazo de realimentación, mientras que en el segundo solo está el control.
Concluimos entonces que lo que importa es el tipo de sistema de la realimentación.
Principio del Modelo Interno

Como modelo genérico para las perturbaciones (incluyendo en esto cambios en la
referencia) podemos proponer una función racional:
N (s)
P (s) =
N
D(s)
De forma genérica podemos esquematizar la relación entre perturbación y error de la
IO
siguiente forma:
C
C
El error en estado estacionario serı́a:
RU
Ld (s) N (s)
ess = lı́m s ·
s→0 1 + Ld (s)Gr (s) D(s)
Expresando ambas transferencias como funciones racionales Ld (s) = Bd (s)/Ad (s) y
Lr (s) = Br (s)/Ar (s) :
ST
Bd (s)
Ad (s) N (s) Bd (s)Ar (s) N (s)
ess = lı́m s = lı́m s ·
s→0 Bd (s) Br (s) D(s) s→0 Ad (s)Ar (s) + Bd (s)Br (s) D(s)
1+
Ad (s) Ar (s)
N
El denominador de la primer fracción es el polinomio caracecterı́stico de lazo cerrado

Alc (s) que aparece en la ecuación (2.11). Entonces:
Bd (s) N (s)
O
ess = lı́m s · Ar (s)

s→0 Alc (s) D(s)
Si el denominador del modelo de perturbación es un factor del denominador de la
C
realimentación podemos escribir Ar (s) = Ā(s)D(s). En ese caso:
N (s)Bd (s)Ā(s)
ess = lı́m s
s→0 Alc (s)
EN
Si Alc (s) es un polinomio de orden n y el producto de los polinomios del numerador

arroja como resultado uno de orden m, podemos separar este producto en un polinomio
N1 (s) de orden n − 1 multiplicado por otro N2 (s) de orden m − n + 1
Desarrollando en fracciones parciales:

r1 r2 rn
ess = lı́m s + + ··· + + N2 (s)
s→0 s + p1 s + p2 s + pn

Como el lazo cerrado es estable (de lo contrario no habrı́a estado estacionario), en todas
las fracciones pj > 0 y por lo tanto el lı́mite converge a cero.
En palabras esto significa que el error de estado estacionario será nulo si el denominador
del lazo de realimentación incluye un “modelo” de la perturbación, es decir, D(s) es un
factor de A(s).
Esta es una generalización de lo visto para perturbaciones c/sk (escalón, rampa, parábo-
la, etc.) en donde necesitamos un factor sk en el denominador de la realimentación.
N
IO
C
C
RU
ST
N
O
C
EN

N
3
IO
C
Análisis Clásico de Sistemas SISO
C
RU
ST
N
O
C
EN
En el este capı́tulo veremos los métodos clásicos para evaluar el impacto en la dinámica
de lazo cerrado T (s) de cambios en la dinámica de lazo abierto L(s) enfocándonos en
el análisis de la ecuación caracterı́stica de lazo cerrado (2.10).
45
Lugar de Raı́ces
La ecuación caracterı́stica de lazo cerrado (2.10) puede escribirse también como:
G(s)H(s) = L(s) = −1 (3.1)
Desde el punto de vista de los modos de respuesta de lazo cerrado, que la dinámica esté
distribuida entre G(s) y H(s) es irrelevante.
Dado que L(s) es una función compleja, hay que ver a la constante −1 en la ecuación
N
(3.1) como un número complejo con parte imaginaria nula. Este tiene una magnitud 1
y un argumento ± (2n + 1) π, n ∈ N. Por lo tanto, la ecuación caracterı́stica de lazo
cerrado se puede expresar en término de dos relaciones ecuaciones reales:
IO
|L(s)| = 1 (3.2)
∠L(s) = ± (2n + 1) π n = 0, ±1, ±2, · · · (3.3)
C
donde n ∈ R. Llamamos condición de módulo a la restricción dada por la ecuación (3.2),
y condición de ángulo a la establecida por la ecuación (3.3).
C
Si la ganancia de lazo abierto varı́a en un factor λ ∈ R habrá una afectación sobre la
condición de módulo pero no en la de ángulo.
Para una determinada dinámica de lazo abierto λL(s), cualquier punto del plano s
RU
cumplirá la condición de módulo para algún valor de λ, pero solo un subconjunto de
ellos cumple las condición de ángulo.
Por lo tanto, si cambia el valor de λ los polos de lazo cerrado (raı́ces de la ecuación
caracterı́stica (2.10)) se desplazarán en el plano s sobre un conjunto de curvas que
agrupan aquellos puntos del plano complejo que cumplen la condición de ángulo.
A este subespacio del plano complejo se lo denomina lugar geométrico de las raı́ces
ST
para el lazo cerrado con dinámica de lazo abierto L(s).
Podemos decir que el lugar geométrico de las raı́ces para un sistema realimentado es el
subespacio del plano complejo en donde:
se ubicarı́an los polos de lazo cerrado al modificar la ganancia de lazo abierto con
N
un factor λ : [0 : ∞)
se cumple con la condición de ángulo (3.3)
O
En el ejemplo introductorio del apéndice A.2 para un sistema masa-resorte-amortiguador

se obtuvo la siguiente estructura:
C
EN
Podemos estudiar la dinámica de este modelo analizándolo como un sistema realimen-

tado con lazo abierto:
1 bs + k
L(s) =
m s2

Podemos tomar λ = m−1 y evaluar el efecto que tendrı́a un cambio en la masa sobre
sus polos. En la siguiente figura se muestra el “diagrama de lugar de raı́ces” para este
caso con k = 40000 y b = 8000 y m : ∞ → 0.
N
IO
C
C
RU
ST
El código para construir esta figura es el siguiente:

k = 40000;
N
b = 8000;
num = [b k ];
den = [1 0 0 ] ;
O
r l o c u s ( num , den )
Hemos remarcado con flechas la dirección de desplazamiento de las raı́ces de la
C
ecuación caracterı́stica (que son los polos de lazo cerrado) cuando se aumenta λ (que
en este caso implica disminuir la masa).
Esto indica que un decremento en la masa (incremento de λ) aumentará el factor
de amortiguamiento y la frecuencia natural de los polos del sistema. Para un valor lo
EN
suficientemente chico tendremos una dinámica con amortiguado crı́tico (un polo doble
en el eje real negativo) y a partir de ahı́ se tendrá una respuesta sobre amortiguada. AL
contrario, si aumentamos la masa (disminuimos de λ) los polos complejos conjugados

se van corriendo hacia el origen, disminuyendo tanto el factor de amortiguamiento como
la frecuencia natural. Con m → ∞ los efectos del resorte y del amortiguador son
despreciables, convirtiéndose prácticamente en un cuerpo rı́gido.

Se destaca que con una variación de la masa el sistema nunca se tornará inestable,
dado que todo el diagrama de lugar de raı́ces se encuentra en el semiplano izquierdo
del espacio complejo.
La ecuación caracterı́stica que hemos analizado es de la forma:

bs + k b k
1+ = 1+ + =0
ms2 ms ms2
N
Si dividimos a ambos lados de la última igualdad por el término entre corchetes
obtenemos:
IO
−1
k b k
1+ 1 + =1+ =0
ms2 ms s (ms + b)
Podemos tomar ahora:
C
1
L(s) = k
s (ms + b)
C
para analizar el efecto de la rigidez en la dinámica del sistema masa-resorte-
amortiguador.
RU
3.1.1. Análisis de la Ecuación Caracterı́stica de Lazo Cerrado
Como L(s) es una función racional (cociente de polinomios), puede representarse como:
ST
B(s)
L(s) =
A(s)
b0 sn + b1 sn−1 + · · · + bn−1 s + bn
= n
s + a1 sn−1 + · · · + an−1 s + an
(s + z1 )(s + z2 ) · · · (s + zn ) B̄(s)
N
=k =k (3.4)
(s + p1 )(s + p2 ) · · · (s + pn ) A(s)
donde −z1 , −z2 · · · − zn son las raı́ces del numerador o ceros del lazo abierto L(s),
O
mientras que −p1 , −p2 · · ·−pn son las raı́ces de su denominador o polos de lazo abierto.
La constante real k se suele llamar ganancia, aunque también llamamos ganancia al
cociente bn /an , que es la “ganancia a frecuencia cero”.
C
Las raı́ces de (2.11) o (2.10) son equivalentes y cumplen tanto la condición de módulo
como la de ángulo. Con el modelo propuesto para L(s) podemos ver que:
EN
B̄(s)
1 + L(s) = 1 + k =0 → Alc (s) = A(s) + k B̄(s) = 0 (3.5)
A(s)
Queda claro que las raı́ces del polinomio de lazo cerrado Alc (s) cambiarán si cambia k .
Puede notarse que si k → 0, Alc (s) → A(s), con lo cual podemos decir que los polos
de lazo cerrado tienden hacia los polos de lazo abierto para valores pequeños del factor
k . El caso lı́mite es k = 0, que equivale a eliminar la realimentación.

En el caso k → ∞ se podrı́a decir que A(s) es despreciable frente a k B̄(s), y por lo
tanto Alc (s) → B(s). Entonces para valores muy grandes de k los polos de lazo cerrado
tienen a los ceros de lazo abierto.
Sintetizamos esto diciendo que las ramas del lugar de raı́ces arrancan en los polos de
lazo abierto y terminan en sus ceros. Como en general el la función L(s) es estrictamente
propia (el orden del polinomio numerador es menor que el del denominador), se tienen
mas polos que ceros a lazo abierto. En ese caso hay ramas que terminan en ceros
infinitos z = ∞ejθ .
N
3.1.2. Interpretación de las Condiciones de Módulo y Ángulo
IO
Para evaluar las condiciones (3.2) y (3.3) tenemos que determinar el módulo y argumento
de las expresión (3.4). Para ello es conveniente expresar los números complejos en
forma polar:
C
p
s = a + j b = |s|ej∠s , |s| = x2 + y 2 , ∠s = tan−1
a
La suma de complejos se puede interpretar como suma vectorial en R2 . En la siguiente
C
figura se muestra una interpretación gráfica de un término s+p (tener presente que tanto
s como p son números complejos y pueden ser representados con vectores en el plano
C):
RU
ST
N
O
Para el producto de dos complejos:
A · B = |A||B| ej∠A+∠B
C
Para el cociente:
A |A| j∠A−∠B
= e
B |B|
EN
Entonces podemos reescribir el lazo abierto como:
|B(s)| |s + z1 ||s + z2 | · · · |s + zm |
|L(s)| = =k
|A(s)| |s + p1 ||s + p2 | · · · |s + pn |
B1 B2 · · · Bm
=k
A1 A2 · · · An

N
IO
C
Figura 3.1: Representación gráfica del cómputo para la condición de ángulo
C
donde Bk = |s + zk | y Ak = |s + pk |; y
RU
∠L(s) = ∠B(s) − ∠A(s)
= ∠(s + z1 ) + ∠(s + z2 ) + · · · ∠(s + zn )
− ∠(s + p1 ) − ∠(s + p2 ) · · · − ∠(s + pn )
Xm Xn
= φk − θk
ST
k=1 k=1
donde φk = ∠(s + zk ) y θk = ∠(s + pk ). En la figura 3.1 se muestra una representación

gráfica de estos términos.
N
En base al razonamiento gráfico propuesto podemos ver que para un lazo abierto:
1
O
L(s) =
s (s + 2)
en donde tenemos dos polos s = 0 y s = −2, es necesario evaluar el argumento de los

C
−−−→
vectores →
−s y s + 2. Ambos son polos y por lo tanto sus argumentos restan.
Para este caso podemos notar que cualquier punto de la recta vertical Re {s} = −1
cumple con la condición de ángulo, ya que −θ1 − θ2 = −1800 . Por lo tanto esa recta es
parte del lugar de raı́ces de este ejemplo.
EN

N
IO
3.1.3. Reglas para el Trazado del Diagrama
El lugar de raı́ces puede aproximarse mediante reglas relativamente sencillas a partir de
C
la ubicación de polos y ceros de lazo abierto en el plano complejo.
Una de ellas ya ha sido mencionada, y establece que hay una rama de esta gráfica por
cada polo de lazo abierto, que parte desde este y converge hacia algún cero de lazo
C
abierto cuando la ganancia tiende a infinito.
Hemos dicho también que como las funciones de transferencia para sistemas reales
tienen más polos que ceros (son funciones estrictamente propias), algunas de las ramas
RU
convergen a ceros en el infinito siguiendo la dirección de ciertas “ası́ntotas”. La cantidad
de ası́ntotas será igual al grado relativo del lazo abierto, definido como la diferencia entre
cantidad de polos np y cantidad de ceros nz .
Estas ası́ntotas se cortan en un punto sobre el eje real dado por:

ST
P P
pj − zj
σa = (3.6)
np − nz
y forma ángulos
N
± (2n + 1) π
θa = , n = 0, 1, · · · (3.7)
np − nz
O
Esto significa que cuanto mayor sea el grado relativo, mayor será la cantidad de ası́ntotas
y menor será el intervalo angular entre ellas. A su vez, la intersección entre ellas estará
tanto más a la izquierda cuando más a la izquierda estén los polos y más a la derecha
C
estén los ceros.

Al agregar un cero en el lazo abierto (por ejemplo a través de un compensador) se
elimina una ası́ntota, se aumenta el intervalo entre ellas y se corre su intersección hacia
la izquierda. Esto implica que los polos de lazo cerrado estarán más a la izquierda (efecto
EN
“estabilizante”).
Cuando se agrega un polo se da exactamente lo contrario (efecto “desestabilizante”).
Mediante la interpretación geométrica para la condición de ángulo es fácil notar que

cualquier punto sobre el eje real que tenga a la derecha una cantidad impar de polos y
ceros cumplirá esta condición, y por lo tanto será parte del lugar de raı́ces.

N
IO
C
C
RU
ST
N
O
C
EN
Figura 3.2: Algunos ejemplos de lugar de raı́ces (tomado de [Oga10])

En la figura 3.2 se muestran algunos ejemplos, en donde se pueden constatar las reglas
mencionadas.
Matlab cuenta con una herramienta interactiva denominada sisotool() que permite
entre otras cosas agregar o desplazar polos de lazo abierto y evaluar en simultáneo el
impacto en la dinámica de lazo cerrado.
3.1.4. Análisis de Estabilidad

Si solo interesa evaluar la estabilidad del lazo cerrado, es posible construir el polinomio
N
Alc (s) y determinar si este tiene raı́ces en el semiplano derecho del espacio complejo
(C+ ).
Para un polinomio concreto esto se puede resolver con el comando roots().
IO
Supongamos que queremos averiguar las raı́ces de A(s) = s3 + 3s2 + 3s + 10.
Podemos hacer el cómputo con el siguiente código:
C
% representamos un p o l i n o m i o colocando sus c o e f i c i e n t e s en un v e c t o r
% comenzando con e l que corresponde a l a mayor p o t e n c i a de s
C
A = [1 3 3 10];
roots (A)
RU
ans =
− 3.0801 + 0.0000 i
0.0400 + 1.8014 i
0.0400 − 1.8014 i
Vemos que hay un par de raı́ces complejas conjugadas en C+ (parte real positiva).
ST
Pero esta forma directa no es útil cuando existen parámetros variables en el polinomio.
Para esos casos existen algunas alternativas.
N
Criterio de Estabilidad de Routh

El Criterio de Estabilidad de Routh puede utilizarse para determinar los rangos de valores
de algún parámetro variable en el lazo abierto para los cuales el lazo cerrado será
O
estable. El método se desarrolla en detalle en [Oga10, sec.5.6].
Una consideración importante que se plantea en este criterio es que cualquier polinomio
C
en donde haya un cambio de signo en sus coeficientes tendrá raı́ces con parte real
positiva. Si el polinomio analizado es Alc , esto equivale a polos inestables de lazo
cerrado.
EN
Supongamos por ejemplo que:
B(s) s−1
L(s) =
A(s) s (s + 1) (s + 2)

Se tendrá que:
Alc (s) = A(s) + B(s) = s (s + 1) (s + 2) + s − 1

= s3 + 3s2 + 3s−1
= (−1,6300 + j1,0911) (−1,6300 − j1,0911) (s−0,2599)
Vemos que la última raı́z p3 = 0,2599 está en el semiplano C+ .
N
Criterio de Estabilidad de Hurwitz
La inexistencia de cambios de signo es una condición necesaria para que todas
IO
las raı́ces del polinomio estén en C− , pero no es suficiente. El criterio de Routh
complementa esta condición con la construcción de una tabla de evaluación para
determinar la existencia de raı́ces positivas.
C
En contraste, el criterio de estabilidad de Hurtwitz da condiciones suficientes para
cualquier polinomio.
Este se basa en evaluar los menores principales de una matriz construida con los
C
coeficientes del polinomio. Este se presenta en [Oga10, A-5-18, p. 252] y en ediciones
anteriores.
RU
Mencionamos este criterio puntualmente porque es común en la bibliografı́a decir que
un polinomio es “Hurwitz” para indicar que no tiene raı́ces en C+ .
3.1.5. Lugar de Raı́ces Complementario

Normalmente se traza el lugar de raı́ces para valores de ganancia positivos. En algunos
ST
casos puede tener sentido utilizar ganancias negativas. En ese caso la ecuación
caracterı́stica de lazo cerrado (2.10) se transforma en:
1 − G(s)H(s) = 0 (3.8)
Esto transforma la condición de ángulo a:

N
∠L(s) = ±2nπ n = 0, ±1, ±2, · · · (3.9)

O
En la figura 3.3 se muestran ejemplos en donde se ha trazado en lı́neas punteadas los

diagramas de raı́ces complementarios.
C
3.1.6. Lectura Adicional

El tema del lugar geométrico de las raı́ces está desarrollado en detalle en [Oga10] y
en todas sus ediciones anteriores, ası́ como en la mayorı́a de los libros clásicos para la
EN
enseñanza de grado en control automático.

Allı́ se detallan reglas para estimar la forma del lugar de raı́ces a partir de los polos y
ceros en base a diferentes reglas. Estas son de interés no para realizar la gráfica (el
comando rlocus() resuelve rápidamente esta cuestión) sino para poder imaginar como
cambia el diagrama al agregar polos o ceros en el lazo abierto.
6.1 - Introducción
6.2 - Gráficas del lugar geométrico de las raı́ces

N
IO
C
C
RU
ST
N
O
C
EN
Figura 3.3: Algunos ejemplos de lugar de raı́ces complementario (tomado de [Oga10])

Conceptos Principales
condiciones de módulo y ángulo
interpretación conceptual del lugar de raı́ces
interpretación matemática del lugar de raı́ces
reglas básicas: lugar de raı́ces en el eje real, ángulo e intersección con el eje real
de las ası́ntotas
Conceptos Interesantes
N
6.3 - Gráfica del lugar de las raı́ces con MATLAB:
• sistemas condicionalmente estables
• sistemas de fase no mı́nima
IO
6.4 - Lugares de raı́ces de sistemas con realimentación positiva.
sistemas condicionalmente estables

sistemas de fase no mı́nima
C
diagrama complementario
C
Criterio de Nyquist
RU
Harry Nyquist (fı́sico e ingeniero sueco-estadounidense) publicó en 1932 un artı́culo
sobre la estabilidad de amplificadores de retroalimentación, en el cual presentó lo que
hoy conocemos como criterio de estabilidad de Nyquist.
Su propuesta es determinar la estabilidad de un sistema a lazo cerrado a partir del
conocimiento de la dinámica de lazo abierto sin realizar un cálculo explı́cito de los polos
de lazo cerrado.
ST
Estabilidad del lazo cerrado implica que todas las raı́ces de su ecuación caracterı́stica
(2.10) estén en el semiplano izquierdo del espacio complejo C− . Ya hemos mencionado
los criterios de Routh y Hurwitz como formas de indagar esto, y también hemos dicho
que en la actualidad es muy fácil computar la dinámica de lazo cerrado y evaluar de
N
forma directa la ubicación de sus polos cuando todos los parámetros están definidos.
Lo que buscamos aquı́ es poner en evidencia el impacto que tendrı́a un cambio en la
dinámica de lazo abierto sobre la estabilidad del lazo cerrado.
O
Veremos que esto se puede determinar de forma gráfica.

Posteriormente partiremos de este criterio para realizar el análisis de robustez de un
sistema de control.
C
3.2.1. Teorema del Encierro

El criterio de Nyquist es una aplicación del Teorema del Encierro. Este teorema establece
EN
que si tomamos una curva cerrada C en el plano complejo C y le aplicamos una

transformación F (s) que sea conforme sobre la curva C (es decir, que sus polos no
caigan sobre la curva), el resultado será una curva también cerrada en otro plano
complejo C0 que encerrará al origen una cantidad N de veces igual a la diferencia entre la
cantidad de zeros Z y polos P que tiene F (s) en la región del plano s original encerrada
por la curva C .

En la figura 3.4 se muestran ejemplos de diferentes trayectorias cerradas en el plano s
(lazo izquierdo) mapeadas con la función:
s−1
F (s) =
s+1
Esta función tiene un cero en s = 1 y un polo en s = −1.
En las gráficas del lado izquierdo de la figura puede notarse que para trayectos que
encierran solo al polo (a) o al cero (b), el mapeo del trayecto encierra al origen en sentido
N
negativo y positivo respectivamente; mientras que en los otros casos Z − P = 0 y el
mapeo no encierra al origen (N = 0).
IO
3.2.2. Estabilidad del Lazo Cerrado
C
Si tomamos una curva cerrada C+ que encierre todo el semiplano derecho del plano
complejo C+ :
C
RU
ST
y la transformamos con la función F (s) = 1 + L(s) (lado izquierdo de la ecuación

N
caracterı́stica de lazo cerrado (2.10)), los N encierros de la curva transformada en el

nuevo espacio complejo se corresponderán a la diferencia Z−P con Z igual a la cantidad
de raı́ces de F (s) en C+ y P la cantidad de polos en dicho espacio.
O
Como polos F (s) = 1 + L(s) son los polos de L(s), y los ceros o raı́ces de F (s) =
1 + L(s) son los polos de lazo cerrado, vemos que:
C
P es la cantidad de polos inestables de lazo abierto

Z es la cantidad de polos inestables de lazo cerrado
Conociendo P (se asume que sabemos cuantos polos inestables tiene el lazo abierto) y
EN
determinado N podemos ver “cuantos polos inestables tiene el lazo cerrado”:
Z =N +P (3.10)
Por simplicidad podemos hacer una traslación del espacio transformado llevando el
origen al punto −1 y usando como transformación F (s) = L(s).
El resultado es el mismo, pero ahora debemos evaluar los encierros al −1.

N
IO
C
C
RU
ST
N
O
C
EN
Figura 3.4: Algunos ejemplos del “teorema del encierro” (tomado de [Oga10]). En los casos (a) y (b) hay encierro al origen de la
curva transformada, mientras que en los (c) y (d) no. Observar a la izquierda la cantidad de polos y ceros en la región acotada
por la curva original.

N
IO
C
C
Figura 3.5: Trayectoria de Nyquist modificada para un lazo abierto con polo en el origen y ejemplo de un posible mapeo (tomado
de [Oga10])
RU
El trayecto de Nyquist C+ está compuesto por dos partes: el eje imaginario Cj y un semi-
cı́rculo de radio infinito C∞ . En otras palabras: C+ = Cj ∪ C∞ .
Cuando transformamos el primer tramo se tiene s = jω , y por lo tanto la curva
transformada es L(jω), que representa la gráfica polar de la respuesta en frecuencia
ST
de lazo abierto.
Al evaluar el tramo C∞ se tiene s = ∞ ejθ . El módulo de la transformación serı́a:
|∞ ejθ + z1 | · · · |∞ ejθ + zm |
|L(∞ ejθ )| = k =0 si np > nz
|∞ ejθ + p1 ||∞ ejθ + p2 | · · · |∞ ejθ + pn |
N
Por lo tanto C∞ se mapea en el origen, y la curva completa C+ se transforma en la gráfica

polar de la respuesta en frecuencia de lazo abierto para ω = (−∞, ∞).
O
Por lo tanto, graficando la respuesta en frecuencia de lazo abierto en forma polar (por
ejemplo usando el comando nyquist()) y observando los encierros al punto F (s) = −1,
podemos determinar la cantidad de polos inestables de lazo cerrado a partir de (3.10).
C
3.2.3. Funciones de Lazo Abierto con Polos en el Eje Imaginario

Para aplicar el teorema del encierro la función de transformación debe ser conforme (no
EN
singular) sobre la trayectoria a transformar.

Este no es el caso al aplicar el criterio de Nyquist a un lazo abierto que tengan polos
sobre el eje imaginario.
En estos casos es necesario modificar el trayecto C+ para excluir estos polos,
incorporando arcos de circunferencia infinitesimales alrededor de ellos para dejarlos
fuera de la curva. Este caso se explica en detalle en [Oga10, p. 452].

N
IO
C
Figura 3.6: Margenes de estabilidad
C
Para rodear un polo de lazo abierto en jω0 se tiene:
RU
π π
s = jω0 + lı́m ejθ , θ = (− , + ) (3.11)
→0 2 2
En la figura 3.5 se muestra el caso de un lazo abierto con polo en el origen. Para este
caso la trayectoria de Nyquist es C+ = Cj − ∪ C ∪ Cj + ∪ C∞ .
Al recorrer el arco infinitesimal C el módulo de la transformación es ∞ (lo opuesto a
ST
lo que ocurre al recorrer C∞ ). Esto hace que las trazas de lazo abierto para s = +jω
y s = −jω (Cj + y Cj − respectivamente) se unan con un arco de radio infinito del lado
derecho del plano de Nyquist.
Algo similar se debe hacer con polos complejos conjugados de lazo abierto en cualquier
otra ubicación sobre el eje imaginario.
N
3.2.4. Márgenes de Estabilidad

La cercanı́a al encierro del punto −1 de la respuesta en frecuencia de lazo abierto se
O
puede parametrizar mediante dos cantidades.

En la figura 3.6 vemos una traza de Nyquist de algún lazo abierto para un caso estable
(sin encierro al −1). Se ha trazado una circunferencia de radio 1 centrada en el origen,
C
que se corresponde a puntos con ganancia de lazo abierto unitaria, y se ha marcado

como A la intersección de esta con la traza polar de lazo abierto. Obviamente este
punto se corresponde con una frecuencia ωA para la cual el lazo abierto tiene ganancia
unitaria. El punto B es la intersección con el eje real negativo, y se corresponde con una
EN
frecuencia ωB para la cual el lazo abierto tiene fase −1800 .
Si el lazo abierto tuviese un atraso de fase adicional dado por el arco identificado como
M F , el lazo cerrado quedarı́a en el lı́mite de la inestabilidad (de hecho ya no tendrı́a
estabilidad asintótica). A este arco se lo denomina margen de fase.

La inestabilidad de lazo cerrado también ocurrirı́a si en lugar del atraso de fase
se experimentase un incremento de ganancia de magnitud M G. Ese incremento se
denomina margen de ganancia.

De [Oga10]:
7.3 - Diagramas polares
N
7.5 - Criterio de estabilidad de Nyquist
7.6 - Análisis de estabilidad
7.7 - Análisis de estabilidad relativa
IO
formas de las gráficas polares para la respuesta en frecuencia
gráfica polar para funciones de transferencia con polos en el eje imaginario
C
teorema del encierro
planteo de Nyquist para evaluar estabilidad de lazo cerrado
resultado de transformar la ”trayectoria de Nyquistçon la función de transferencia
C
de lazo abierto
criterio de estabilidad de Nyquist
márgenes de estabilidad, y relación entre estos y la respuesta de lazo cerrado
RU
Respuesta en Frecuencia de Lazo Cerrado
3.3.1. Realimentación Unitaria
ST
Si la realimentación es unitaria (H(s) = 1), la transferencia entre entrada y salida a lazo

cerrado es:
L(s)
T (s) = (3.12)
1 + L(s)
N
Para el caso general con H(s) 6= 0 podrı́amos considerar:
L(s)
T (s) = H −1 (s) (3.13)
O
1 + L(s)
Esto se muestra en la figura 3.7. Los polos de lazo cerrado quedan definidos por el
término de la izquierda. El término H −1 (s) afecta puntualmente a la variable Y (s), y sus
C
propiedades son conocidas desde el inicio.

En cualquier caso se observa que considerar una realimentación unitaria no es restrictivo
para el análisis de la dinámica de un sistema realimentado. Por lo tanto vamos a
EN
considerar como caso genérico el descripto por la ecuación (3.12).
3.3.2. Ganancia de Lazo Cerrado

Para evaluar la ganancia de lazo cerrado tenemos que computar:
|L(jω)|
|T (jω)| = (3.14)
|1 + L(jω)|

Figura 3.7: Replanteo del lazo estándar a uno con realimentación unitaria
N
En la siguiente figura 3.8 podemos identificar numerador de la expresión precedente
(longitud del vector azul) y el denominador (longitud del vector verde, que surge de sumar
el rojo con el azul)
IO
Es evidente que en aquellos valores de ω para los cuales Re {L(jω)} = 0,5 la ganancia
del lazo cerrado definida por la ecuación 3.12 será M = |T (jω)| = 1.
Podrı́amos decir que independientemente de la dinámica de lazo abierto considerada, la
C
recta Re {L(jω)} = 0,5 es una curva de ganancia de lazo cerrado M = 1.
Podemos computar como son las curvas para otros valores de M , y con eso hacer una
C
grilla de ganancias constantes de lazo cerrado. Separando parte real e imaginaria:
L(jω) = X(ω) + j(Y ω)

RU
Entonces
|X + jY | X2 + Y 2
M= → M2 =
|1 + X + jY | (1 + X)2 + Y 2
ST
Por lo tanto:
M 2 (1 + 2X + X 2 ) + M 2 Y 2 = X 2 + Y 2
X2 1 − M 2 − 2M 2 X − M 2 + 1 − M 2 Y 2 = 0

M2 M2
N
X2 + 2 2
X+ 2 +Y2 =0
M −1 M −1
O
C
EN
Figura 3.8: Interpretación gráfica de los términos de la ecuación (??)

N
IO
C
(a) curvas de ganancia constante de lazo cerrado (b) curvas de fase constante de lazo cerrado
Figura 3.9: Grillas para la determinación de la respuesta en frecuencia de lazo cerrado a partir de la traza de nyquist del lazo
abierto (tomado de [Oga98])
C
Finalmente:
RU 2
M2 M2

X+ +Y2 = 2
M2 − 1 (M 2 − 1)
Esta es la ecuación de una circunferencia con centro en {C, 0} siendo C = M 2 /(1−M 2 )
y de radio R = |C|/M . El resultado se muestra en la figura 3.9a para diferentes valores
de M .
ST
De forma análoga se puede evaluar el lugar geométrico para el atraso de fase del lazo
cerrado (ver figura 3.9b). El desarrollo detallado puede verse en [Oga98, sec.7-8, p. 477].
N
Pico resonante de lazo cerrado En la figura 3.9a se puede ver que todas las curvas
M a la izquierda de M = 1 (parte real < −0,5) corresponden a ganancias de lazo
cerrado mayores a 1 (0db).
O
Si el lazo abierto se aproxima al punto −1, el lazo cerrado tendrá picos resonantes de
alta ganancia.
Dado que un lazo abierto con buenos márgenes de fase y ganancia implica un buen
C
alejamiento de dicho punto, márgenes de fase y ganancia de al menos 600 y 6db

respectivamente se tendrá un lazo cerrado sin picos resonantes M ≤ 1.
Esto se puede explicar de otra forma. Viendo la ecuación (3.14) podemos notar que:
EN
|L(jω)|
|T (jω)| = = |L(jω)||S(jω)|
|1 + L(jω)|
Por lo tanto se tendrán ganancias |T (jω)| > 1 en aquellas frecuencias para las cuales
|L(jω)| > |S(jω)|−1 . Notando que:
|S(jω)|−1 = |1 + L(jω)|

podemos decir que las ganancias positivas se dan cuando el módulo del vector verde en
la figura 3.8 es menor al del azul; y esto ocurre en aquellas frecuencias para las cuales
la traza de lazo abierto L(jω) se acerca al punto −1 del plano complejo.
Consideremos como ejemplo un servomecanismo para la posición de una superficie de

control aerodinámico de una aeronave compuesto por un motor eléctrico de corriente
continua y un sistema de transmisión mecánica. Asumiendo que la mecánica es lo
suficientemente rı́gida se llega a un modelo de la forma:
N
Y (s) km
G(s) = = 2
U (s) s (s + q)
IO
donde y representa la posición de la superficie, u es el voltaje de alimentación del motor,
km es una constante que depende de parámetros eléctricos y mecánicos y q el ”polo
eléctrico”.
Con un control PD el lazo abierto resulta:
C
kc (s + z) km
L(s) =
(s + p) s2 (s + q)
C
En la siguiente figura mostramos las funciones de sensibilidad del lazo cerrado a la
izquierda (en escala semi-logarı́tmica, con ganancias en valor absoluto) y el diagrama
RU
de Nyquist de lazo abierto a la derecha para dos ajustes del control PD (lineas gruesa y
finas).
Se observa en el diagrama de Nyquist que con el segundo ajuste (trazo fino) el lazo
abierto se aproxima más al −1, disminuyendo el margen de fase. En consecuencia se
observa en la respuesta en frecuencia de lazo cerrado mayores picos de sensibilidad y
sensibilidad complementaria.
ST
N
O
C
EN
En la siguiente figura se puede observar la relación entre un mayor pico en las funciones
de sensibilidad con el amortiguamiento de las respuestas transitorias.

N
IO
Frecuencia de Cruce de Lazo Abierto y Ancho de Banda de Lazo Cerrado
C
Del lazo cerrado en general esperamos T (0) = 1 (0 db) y S(0) = 0. Esto equivale a un
control perfecto para referencias o perturbaciones lentas.
C
La función T (jω) se corresponde con un filtro pasa bajos, y como |T (0)| ≈ 0db,
√ se corresponde con la frecuencia ωbw para la cual
por definición el ancho de banda
|T (jωbw )| − |T (0)| = −3db (1/ 2 en valor absoluto).
RU
De forma complementaria, la función T (jω) se corresponde con un filtro pasa altos, y
como |S(j∞)| ≈ 0db, por definición la frecuencia de paso se corresponde con el valor
ωps para la cual |S(jωps )| − |S(j∞)| = −3db.
Llamaremos frecuencia de cruce del lazo abierto a la frecuencia ωc en donde |L(jωc )| =

0db. Es en esta frecuencia en donde la raza de Nyquist de lazo abierto corta el cı́rculo
ST
unitario, y por lo tanto define el margen de fase.
Si asumimos que se ha realizado un buen diseño de control podemos suponer un margen

de fase del orden de 600 . Esto implica que el atraso de fase del lazo abierto en la
frecuencia de cruce es ∠L(jωc ) ≈ 1200 . Por lo tanto:
N
L(jωc ) ≈ 1 · e−j2,1 → |T (jωc )| ≈ 1 = 0db , |S(jωc )| ≈ 1 = 0db

Para T (jω) una ganancia −3db se alcanzará a una frecuencia algo mayor, mientras que
O
para S(jω) se dará a una frecuencia algo menor (dependiendo del margen de fase).
Por lo tanto podemos decir que:
ωps < ωc < ωbw (3.15)
C
Dado que esto es fácil de ajustar con un ajuste en la ganancia de lazo abierto, alterando
la frecuencia de cruce podemos ajustar (al menos en orden de magnitud) el ancho de
banda de T (jω) y la frecuencia de paso de S(jω).
EN
En la siguiente figura vemos para el ejemplo precedente las funciones de sensibilidad

de lazo cerrado T (jω) y S(jω) junto con la correspondiente respuesta en frecuencia de
lazo abierto L(jω)
Se han marcado las frecuencias de paso de S(jω), la de cruce de L(jω) y la de corte
de T (jω); verificándose las desigualdades (3.15).

N
IO
C
C
RU
De [Oga10]:
7.8 - Respuesta en frecuencia de lazo cerrado para sistemas con realimentación

unitaria
ST
relación entre los márgenes de estabilidad y la respuesta de lazo cerrado

curvas M y N en el diagrama de Nyquist de lazo abierto
ventajas respecto de lo anterior de usar la carta de Nichols
determinación de ancho de banda y pico resonante de lazo cerrado a partir de la
respuesta en frecuencia de lazo abierto
N
identificación de los márgenes de estabilidad en la carta de Nichols
3.3.4. Revisita de la Función de Sensibilidad

O
Podemos calcular una función que describa la variación “relativa” en la dinámica de

lazo cerrado ∂T (s)/T (s) ante una variación “relativa” en la dinámica de lazo abierto
C
∂L(s)/L(s). Derivando (3.12) (usando L(s) en lugar de G(s)) con la regla de la cadena:
∂T (s)/T (s) ∂T (s) L(s) ∂T (s)
S(s) = = = [1 + L(s)]
∂L(s)/L(s) ∂L(s) T (s) ∂L(s)
EN
Derivando con la regla de la cadena:

( )
1 L(s)
S(s) = − [1 + L(s)]
1 + L(s) [1 + L(s)]2
1 + L(s) − L(s) 1
= 2
[1 + L(s)] 1 + L(s)

de lo cual:
1
S(s) = (3.16)
1 + L(s)
Esta es la misma función de sensibilidad (2.4) definida antes como respuesta del
error a un cambio en la referencia, o respuesta de la salida de lazo cerrado ante una
perturbación de salida.
Ya hemos visto que:
S(s) = 1 − T (s)
N
Si consideramos s = jω , la expresión anterior indica que la dinámica de lazo cerrado
será poco sensible a los cambios en el lazo abierto en el rango frecuencias en donde
T (jω) ≈ 1. Dado que hablamos de una cantidad compleja, esto implica |T (jω)| ≈ 1 y
IO
∠T (jω) ≈ 0.
Esto es ası́ en general hasta una frecuencia una década por debajo del ancho de banda
de lazo cerrado. Para frecuencias en el orden del ancho de banda la sensibilidad crece,
y para altas frecuencias |T (jω)| → 0 y por lo tanto |S(jω)| → 1.
C
Sin embargo, como un cambio porcentual de un valor pequeño es igualmente pequeño
(aunque sea de un 100 %), los cambios que tenga la planta respecto del modelo para
altas frecuencias no es relevante.
C
Concluimos preliminarmente que el lazo cerrado será sensible a cambios en la dinámica
L(s) si estás se manifiestan en frecuencias próximas al ancho de banda de lazo cerrado,
RU
mientras que lo que ocurra una década por encima o por debajo no será muy relevante.
Simplificación de Modelos
Una dinámica G1 (s) de primer orden con un polo p tiene para una frecuencia ω = p una
ganancia de −3db (para este caso p coincide con su ancho de banda) y un atraso de
fase −450 .
ST
Para una frecuencia una octava menor (ω = p/2) la ganancia se aproxima a 1 (0,9) y
el atraso de fase es significativo (≈ −260 ). Pero para una frecuencia una década menor
(ω = p/10) la ganancia es prácticamente 1 y el atraso de fase menor a −60 .
Por lo tanto podemos decir que G1 (jω) ≈ 1 si ω < p/10.
N
Para una dinámica de segundo orden se observa algo similar. En la figura 3.10 se
muestra la respuesta en frecuencia de un modelo de segundo orden prototipo con
amortiguamiento 0,7 y ancho de banda ωbw = 1s−1 (con este factor de amortiguamiento
O
el ancho de banda coincide con ωn ).

Para una frecuencia ωbw /2 (una octava menor al ancho de banda) la ganancia es casi 1
(0,97 → −0,23db), pero el atraso de fase es significativo −430 .
C
A frecuencia ωbw /10 (una década menor al ancho de banda) vemos que la ganancia es
prácticamente 1 (0db), mientras que el atraso de fase es pequeño (≈ −80 ).
En sı́ntesis podemos decir que en general G(jω) ≈ 1 si ω < ωbw /10. Por lo tanto para
EN
el diseño es posible eliminar la dinámica de alta frecuencia del modelo; entendiendo

esto como aquellos polos y ceros cuyas frecuencias sean una década mayor al rango de
frecuencias de interés. En el caso del diseño de un sistema de control, este rango es el
ancho de banda de lazo cerrado pretendido.
Por otra parte, para un sistema de control a lazo cerrado la función de sensibilidad es
pequeña en baja frecuencia.

N
IO
C
C
RU
ST
N
O
Figura 3.10: Validez de la hipótesis de control perfecto para una dinámica dominante de segundo orden
C
EN

N
IO
C
Figura 3.11: Parametrización de la respuesta transitoria
C
A partir de lo dicho en la sección precedente podemos decir que cambios en la dinámica
de lazo abierto para frecuencias pequeñas en relación a la frecuencia de paso de
la función de sensibilidad no tendrán un impacto significativo en la dinámica de lazo
RU
cerrado.
Pero un polos p introduce un atraso de fase de −900 para frecuencias ω > 10·p, mientras
que de forma similar un cero aporta un adelanto de 900 . Por lo tanto no podemos eliminar
polos y ceros de baja frecuencia de forma aislada, pero si lo podemos hacer en pares;
dado que los atrasos de fase se compensan.
ST
En sı́ntesis, un conjunto de igual cantidad de polos y ceros con frecuencias una década
por debajo de la frecuencia de cruce ωc tendrá un impacto poco significativo en la
dinámica de lazo cerrado, y por lo tanto podrı́an ser eliminados del modelo para el diseño.
Pico de Sensibilidad
N
En la figura 3.8 se puede notar que la distancia entre un punto de la traza de Nyquist
de lazo abierto y el punto −1 es la inversa de la función de sensibilidad S −1 (jω) (vector
verde).
O
Por lo tanto, la menor distancia entre estos elementos se dará en donde la función de
sensibilidad tenga un máximo, es decir, un pico de sensibilidad.
EL pico de sensibilidad es una medida de robustez mucho más efectiva que los
C
márgenes de ganancia y fase, ya que estos garantizan estabilidad de lazo cerrado

siempre y cuando variaciones de fase y ganancia de lazo abierto no se produzcan de
forma simultánea.
EN
Compensación
3.4.1. Compensación en el “Plano s”
Una vez resuelto el requerimiento de error en estado estacionario es necesario
garantizar no solo la estabilidad del lazo cerrado sino también aquellos asociados a su

dinámica.
Una forma de definir requerimientos dinámicos es la establecer cotas para la

parametrización de la respuesta transitoria al escalón (figura 3.11).
La respuesta (ya sea el error de seguimiento o la salida) ante un cambio en la referencia
(o una perturbación) se puede obtener por superposición descomponiendo la función de
sensibilidad correspondiente en fracciones parciales (ver [Zum, sec.2.2.3, p. 53]).
Por ejemplo, para la salida ante un cambio en la referencia:
N

r1 r2 rn 1
Y (s) = T (s)R(s) = + + ··· +
s + p1 s + p2 s + pn s
IO
donde p1 , p2 , · · · , pn son los polos de lazo cerrado. Anti-transformando:
r1 r
2
rn
y(t) = 1 − e−Re{p1 }t + 1 − e−Re{p2 }t + · · · + 1 − e−Re{pn }t
p1 p2 pn
C
En el caso de polos complejos conjugados agruparemos los términos de segundo cuyas
respuestas al escalón son de la forma:
C
h i
yj (t) = rj 1 − cj e−Re{pj }t · sin (Im {pj } t + φj )
Ver [Zum, sec.2.2.3, p. 56].

RU
El tiempo de establecimiento tss de cada término, es decir, lo que dura su transitorio;
depende solo de la parte real de los polos, ya que es esta la que regula la velocidad
de decaimiento de los términos exponenciales. Para cualquier término del desarrollo:
tss ≈ 4/Re {p}.
ST
El tiempo de establecimiento para la suma que define y(t) estará definida por la fracción
más lenta, lo cual se corresponde con los polos más cercanos al eje imaginario (menor
parte real).
Sin embargo debe tenerse en cuenta que si hay polos lentos pero estos está parcial-
mente cancelados por ceros de lazo cerrado, el residuo de la fracción correspondiente
N
es pequeño y su peso en la sumatoria podrı́a resultar poco significativo.
A modo de ejemplo consideremos tres casos:

O
2
T1 (s) =
s2 + 2s + 2
C
1,8(s + 0,1)
T2 (s) =
(s + 0,09)(s2 + 2s + 2)
0,18
T2 (s) =
(s + 0,09)(s2 + 2s + 2)
EN
Se observa que T2 equivale a T1 con un polo lento adicional cancelado parcialmente con
un cero, mientras que en T3 no hay tal cancelación.
En la siguiente figura vemos la ubicación de polos y ceros a la izquierda junto con la
respuesta al escalón a la derecha:

N
IO
C
C
La respuesta dominante para T1 y T2 es la misma, y corresponde al término de
RU
segundo orden. Pero puede observarse claramente para T2 la respuesta del modo lento
superpuesta al término dominante.
En el caso de T3 no hay cancelación, y por lo tanto el polo dominante es el polo lento.
Una cota en el tiempo de establecimiento equivale a poner una restricción o zona de

ST
exclusión sobre el espacio complejo (región verde en la figura 3.12) para la ubicación de
polos de lazo cerrado.
La misma lógica puede plantearse con otras restricciones.

Los tiempos de crecimiento tc y retardo tr están directamente asociado a la distancia al
N
origen de los polos. Imponer una cota para este parámetro se traduce en una restricción
de distancia mı́nima al origen (zona roja).
O
Finalmente podemos considerar el sobrepaso Mp , que depende del amortiguamiento

de los polos subamortiguados; o una especificación directa sobre el amortiguamiento
mı́nimo requerido para estos polos.
C
Las curvas de amortiguamiento contante en el plano s son lı́neas radiales. Por lo tanto,
una restricción en el factor de amortiguamiento implicará una cota para el argumento de
los polos complejos (zona azul).
EN
En última instancia, asegurando el cumplimiento de las restricciones para los polos

dominantes de lazo cerrado se tendrı́a una respuesta transitoria aceptable. Los polos
dominantes son lo más cercanos al origen.
En el caso de cancelaciones sobre polos lentos debe tenerse presente que estas podrı́an
estar presentes en algunas sensibilidades pero no en todas; pero no necesariamente se
deben imponer los mismos requerimientos para todas ellas.

N
IO
Figura 3.12: Mapeo de las especificaciones de respuesta transitoria a regiones admisibles para los polos de lazo cerrado
C
Compensación
Hemos dicho que en primer término es necesario decidir que se debe agregar en el
compensador K(s) para satisfacer los requerimientos de error en estado estacionario.
C
Luego, una vez definida la región admisible en el plano s para los polos de lazo cerrado
se deberán elegir “puntos de prueba” donde se pretende ubicar los polos dominantes de
lazo cerrado.
RU
Si estos puntos de prueba resultan ser finalmente polos de lazo cerrado, allı́ se deberán
cumplir las condiciones de módulo (3.2) y ángulo (3.3).
La primera se logra con un ajuste de ganancia, pero para lograr la segunda en general es
necesario “compensar” la dinámica de lazo abierto existente hasta este punto agregando
polos y ceros en lugares adecuados del plano s.
ST
Esto hará que los puntos de prueba pasen a formar parte del lugar de raı́ces, y por lo
tanto podrán ser polos de lazo cerrado con un simple ajuste de ganancia.
Ajuste de un Compensador en Adelanto

Un compensador en adelanto es una transferencia de la forma:
N
s+z
Kpi (s) = kc (3.17)
s+p
O
El cero z y el polo p se ajustan para cumplir la condición de ángulo en la ubicación

deseada para los polos dominantes de lazo cerrado, mientras que kc se define con la
condición de módulo en dicha posición.
C
En general se busca una respuesta de lazo cerrado un poco más rápida que la de lazo
abierto, dado que mientras la diferencia no sea excesiva este es un objetivo alcanzable
y a mayor velocidad de respuesta mejor capacidad de seguimiento de referencias y
EN
rechazo de perturbaciones.
En estas circunstancias en general en el punto de prueba la condición de ángulo con el
lazo abierto sin compensar arroja un valor menor a −π . Por lo tanto la compensación
debe aportar un ángulo positivo.
Esto se logra agregando ceros al lazo abierto (en el compensador). Sin embargo, un
compensador con más ceros que polos, es decir, con grado relativo negativo (función
racional impropia); no es fı́sicamente realizable. Y si lo fuera, la acción de control tendrı́a

N
Figura 3.13: Ajuste de un compensador en adelanto mediante el método de la bisectriz (ver [Oga10, p. 315])
IO
una gran sensibilidad a ruidos de medición de alta frecuencia. Por lo tanto lo habitual es
también agregar un polo, pero más alejado del origen que el cero para que la contribución
C
neta sea positiva a la condición de ángulo sea positiva.
Un ejemplo de control impropio es el PD, que en principio se tratarı́a de un cero y una
C
ganancia:
K(s) = kp + Kd s = kc (s + z)
RU
Dado que la derivada pura no es fı́sicamente realizable, la implementación real es de la
forma:
s s+z
K(s) = kp + Kd = kc
Ts + 1 s+p
Llamamos a esto compensación en adelanto, por razones que expondremos al analizar
este compensador en el dominio de la frecuencia.
ST
Es fácil demostrar que el aporte φ a la condición de ángulo de un compensador es el

formado por los segmentos CP y DP en la figura 3.13, donde P es el punto de prueba
elegido para ubicar los polos dominantes de lazo cerrado.
Por lo tanto hay infinitas combinaciones entre un cero y un polo real que permiten un
N
mismo aporte a la condición de ángulo, en tanto el ángulo entre ambos segmentos sea
el mismo.
O
Una forma sistemática de ajustar la ubicación del polo y el cero para obtener un cierto
aporte φ es el llamado método de la bisectriz. El método se presenta de forma detallada
en [Oga10, p. 315] y ediciones precedentes.
C
A partir del punto de prueba P se traza la bisectriz P B del ángulo determinado entre OP
y P A. Luego a cada lazo de esta se proyectan dos rectas desde el punto P , obtenidas
agregando y sustrayendo a la bisectriz la mitad del ángulo φ (el déficit obtenido en
la condición de ángulo con el lazo abierto sin compensar). La intersección de estos
EN
segmentos con el eje real define la ubicación del polo y el cero del compensador.
La ventaja de este ajuste respecto de cualquier otro es que se obtiene la menor

distancia relativa entre el polo y el cero (p/z ) para un compensador en adelanto con
un determinado aporte φ a la condición de ángulo. Se verá más adelante que de esta
manera se minimiza ganancia del compensador en alta frecuencia.

Si φ es un ángulo muy grande resulta conveniente poner polos y ceros múltiples que
aporten una parte del ángulo φ Por ejemplo podemos considerar un polos y ceros dobles
calculados para realizar cada uno la mitad del aporte.
Si e requiere un aporte mayor es posible que la ubicación seleccionada para los polos de
lazo cerrado sea demasiado exigente en función de la dinámica de lazo abierto, y serı́a
prudente revisar los requerimientos.
Compensación en Atraso
SI colocamos un polo p y un cero z cercanos al origen en relación a los polos dominantes
N
de lazo cerrado, su contribución a la condición de angulo será nula. Sin embargo, si
z < p, la ganancia para cumplir con la condición de módulo se incrementará en un factor
aproximado z/p.
IO
El caso lı́mite del compensador en atraso es el controlador PI.
Ajuste de un Lazo PI
Hemos dicho que la acción integral se introduce en el lazo para neutralizar perturbacio-
C
nes constantes. Combinada con una acción proporcional el compensador es:
1 s+z ki
Kpi (s) = kp + ki = kp , z= (3.18)
C
s s kp
En este caso la compensación es en atraso, dado que el polo (en el origen) siempre
está a la derecha del cero (efecto desestabilizante). Sin embargo, en casos en donde la
RU
condición de ángulo en el punto de prueba es mayor de −π esto serı́a suficiente.
En este caso solo es necesario ajustar z para cumplir con la condición de ángulo en
la ubicación deseada para los polos dominantes, y luego ajustar kp para verificar la
condición de módulo, con lo cual definimos los parámetros del controlador PI.
Si ajustando z no se logra cumplir la condición de ángulo, serı́a necesario agregar un
compensador en adelanto pasando a un control PID (o revisar los requerimientos).
ST
Dinámica no Dominante y Simplificación del Modelo de Planta

Al momento de diseñar el compensador planteamos la condición de ángulo en un punto
de prueba ubicado en la posición deseada para los polos de lazo cerrado. Tomando
como referencia la distancia del punto de prueba al origen podemos catalogar los polos
N
y ceros de lazo abierto entre aquellos próximos y los que se encuentran más lejos (a
distancias en el orden de 10 veces la de referencia.)
O
Podemos notar que los polos y ceros reales de lazo abierto que se encuentran lejos del
origen realizan un aporte pequeño a la condición de ángulo.
C
En el caso de polos y ceros complejos el aporte puede ser grande, pero si se encuentran
lejos del punto de prueba el aporte del par complejo conjugado se aproxima a 3600 , con
lo cual su efecto es nulo.
Y para aquellos polos que se encuentren próximos pero cancelados por ceros, el aporte
EN
neto es nulo.
En sı́ntesis podemos decir que se puede diseñar el compensador con un modelo

simplificado de la planta, eliminando los polos y ceros no dominantes, ya sean de alta
frecuencia (reales o complejos conjugados pero lejos del origen en relación a la distancia
al origen del punto de prueba), o por cancelación en el caso de polos y ceros próximos
entre sı́ (en relación a la misma distancia de referencia).

Lectura Adicional
De [Oga10]:
6.5 - Diseño de sistemas de control mediante el método del lugar de las raı́ces
6.6 - Compensación de adelanto
6.7 - Compensación de retardo
3.4.2. Compensación en Frecuencia
N
En muchos problemas de control la respuesta transitoria al escalón no resulta apropiada
como forma de definir requerimientos.
Esto es generalmente ası́ en el caso de sistemas de control de vuelo, que son diseñados
IO
para seguir referencias continuamente variables (por ejemplo, los sistemas para control
de actitud) o para rechazar perturbaciones (sistemas de control de trayectoria).
Para esta clase de problemas es más significativo pensar en los anchos de banda de las
funciones de sensibilidad para definir velocidad de respuesta, imponiendo cotas para los
C
picos resonantes, asociados al amortiguamiento de los modos oscilatorios.
Esto no es contradictorio con la especificación de parámetros de respuesta transitoria,
ya que es posible establecer relaciones entre está y la respuesta en frecuencia.
C
Podemos plantear los requerimientos para la dinámica de lazo cerrado en términos del
ancho de banda (en realidad frecuencia de corte) de la sensibilidad complementaria
RU
T (s), y márgenes de fase y ganancia para lograr picos resonantes de lazo cerrado lo
suficientemente acotados.
Si la dinámica dominante de lazo cerrado puede caracterizarse por un par de polos
complejos conjugados; el ancho de banda de la sensibilidad complementaria se
relaciona directamente con la distancia al origen de los polos dominantes en el plano
ST
s, mientras que su pico resonante (y por lo tanto los márgenes de estabilidad relativa) se
conectan directamente con el factor de amortiguamiento de estos polos.
Si la dinámica dominante es sobre-amortiguada, el polo real que la caracteriza define el
ancho de banda y el margen de fase es del orden de los 900 .
N
Si la ganancia a frecuencia cero de la sensibilidad complementaria es T (0) = 1, su

ancho de banda quedará determinado por la frecuencia ωbw en donde |T (jωbw )| =
−3db.
O
En importante remarcar que el valor exacto de estos parámetros no es relevante, ya que

siempre trabajamos con “modelos” del proceso real.
C
En la sección 3.3.2 hemos visto que esta frecuencia se encuentra levemente por encima
del cruce ωc del lazo abierto (en el orden de una octava). Por lo tanto, ajustando la
frecuencia de cruce de lazo abierto podemos establecer el ancho de banda de T (jω).
Para cumplir las especificaciones de diseño restarı́a agregar un compensador para
EN
cumplir con los márgenes de fase y ganancia.

Podemos decir que en general lograr el margen de fase requerido implica también
cumplir con el de ganancia, excepto que la dinámica de lazo abierto en el entorno de
la frecuencia de cruce sea muy compleja. En tal caso deberı́a revisarse el requerimiento
de ancho de banda, y de ser posible, disminuirlo.

Como procedimiento podemos definir la frecuencia de cruce, determinar el atraso de fase
del lazo abierto sin compensar y agregar un compensador en adelanto para alcanzar el
margen de fase requerido.
Ya hemos visto para la compensación en el plano s que un compensador en adelanto

está constituido por un polo p y un cero z con p > z :
s+z
K(s) = k
s+k
N
Por conveniencia re-escribimos esta expresión de la siguiente forma:
Ts + 1
K(s) = kc (3.19)
IO
αT s + 1
donde 0 < α < 1, resultando que z = 1/T , p = 1/αT y kc = k · z/p. La respuesta
en frecuencia del compensador tiene la siguiente forma (ejemplo tomado de [Oga10] en
donde α = 0,1):
C
C
RU
ST
Podemos ver que este compensador introduce un “adelanto de fase” cuyo valor máximo
resulta:
N
1−α
φm = sin−1 (3.20)
1+α
Claramente se observa que cuanto menor sea α, mayor será φm ; siendo el valor máximo
O
posible de 900 con α → 0. Este máximo adelanto de fase se produce a una frecuencia
√
ωm = α/T , que es el punto medio entre el polo y el cero del compensador en la escala
logarı́tmica de frecuencias.
C
Ajustando α podemos establecer el adelanto de fase máximo, y ajustando T podemos

fijar la frecuencia en donde esto se produce.
Logramos maximizar el margen de fase del lazo haciendo coincidir la frecuencia ωm con
EN
la frecuencia de cruce ωc establecida mediante el requerimiento de ancho de banda.

El valor de α resulta de calcular el adelanto de fase necesario para lograr el margen de
fase requerido.
En la gráfica precedente puede notarse que el compensador en adelanto tiene alta

ganancia en alta frecuencia. Este incremento de ganancia es tanto mayor cuando menor
es alpha.

Si la compensación requerida es mayor de unos 600 , serı́a conveniente colocar dos
compensadores calculados para realizar la mitad del aporte total:
2
(T s + 1)
K(s) = kc 2
(αT s + 1)
La ganancia kc del compensador se ajusta para establecer la frecuencia de cruce del

lazo abierto compensado en el valor establecido al inicio.
N
Compensación en Atraso
Si colocamos un polo p y un cero z en baja frecuencia respecto del cruce de ganancia del
lazo abierto, si p < z podemos aumentar la ganancia de lazo abierto a baja frecuencia
IO
sin impactar significativamente en el margen de fase.
Como hemos mencionado para la compensación en el plano s, el caso lı́mite del
compensador en atraso es el controlador PI.
C
Lectura Adicional
De [Oga10]:
C
7.10 - Diseño de sistemas de control por el método de la respuesta en frecuencia
7.11 - Compensación de adelanto
RU
7.12 - Compensación de retardo
3.4.3. Ceros del Lazo Cerrado y Filtro de Referencia

Puede notarse que para un lazo cerrado con la siguiente estructura:
ST
N
los ceros de la transferencia entre entrada y salida son los ceros de G(s) y los polos de
H(s):
NG (s) NH (s)
O
G(s) = , H(s) = →
DG (s) DH (s)
C
NG (s)
Y (s) DG (s) NG (s)DH (s)
T (s) = = =
X(s) NG (s) NH (s) DG (s)DH (s) + NG (s)NH (s)
1+
DG (s) DH (s)
EN
Los ceros cercanos al origen tienden a aumentar el ancho de banda. También provocan
un aumento del sobrepaso en la respuesta al escalón, como se observa en la siguiente
figura. En esta se muestra la respuesta al escalón de una dinámica de segundo con un
cero a diferentes distancias del origen:

N
IO
C
En el caso de un sistema de control, para la sensibilidad complementaria T (s) es posible
modificar estos efectos mediante un filtro de referencia Fr (s) como se muestra en la
siguiente figura:
C
RU
ST
Es evidente que:
Y (s) Y (s)
N
= Fr (s) = Fr (s)T (s)

R(s) R̄(s)
Podemos incluir polos en el filtro para cancelar los ceros de T (s) cercanos al origen y
O
evitar sobrepasos excesivos; aunque igualmente implicará una reducción en el ancho de

banda para el seguimiento de la referencia.
Pero debe notarse que el filtro no es parte del lazo cerrado, y por lo tanto no tiene ningún
C
efecto sobre las sensibilidades para las otras entradas del sistema.
EN

N
4
IO
C
Control Moderno de Sistemas SISO
C
RU
ST
N
O
C
EN
79
Especificaciones de Diseño
4.1.1. Respuesta Transitoria
En la subsección 2.3.5 hemos visto que el desempeño en estado estacionario depende
solo de algunos aspectos de la dinámica de lazo abierto, sintetizado en el principio del
modelo interno.
Respecto de la respuesta de lazo cerrado, en la subsección 3.4.1 hemos planteado los
objetivos de la compensación en el plano s a partir de especificaciones de respuesta
N
transitoria al escalón; lo que se traduce en la ubicación deseada para los polos
dominantes de lazo cerrado. Esta es una aproximación razonable para aquellos casos
en los cuales las referencias y perturbaciones cambian solo ocasionalmente.
IO
Tiempos de Respuesta
Hemos considerado en la sección 3.4.1 tres parámetros temporales para la respuesta
transitoria:
C
tiempo de establecimiento
tiempo de crecimiento
C
tiempo de retardo
Los dos últimos cuantifican velocidad de respuesta (asociada al ancho de banda),

RU
mientras que el tiempo de establecimiento depende no solo de la velocidad sino también
del amortiguamiento de los polos dominantes y de la presencia de polos lentos no
dominantes.
Oscilación
ST
En general tendemos a considerar la oscilación de la respuesta como una figura de

calidad.
Algunos autores también proponen cotas para el sobrepaso como especificación de
respuesta transitoria; que sabemos está asociado al amortiguamiento, pero que también
depende de los ceros.
N
Además, el amortiguamiento está asociado a la robustez del lazo cerrado, y suele

tomarse como un parámetro para caracterizar el tipo de respuesta.
O
Se suelte considerar un factor de amortiguamiento superior a 0,7 como una respuesta

bien amortiguada, que en muchos casos es deseable; pero no necesariamente debe
considerarse un criterio universal.
C
Siegler y Nichols presentaron en 1942 [ZN42] un método de ajuste semi-empı́rico para

controladores PID, en donde postulan como objetivo una tasa de decaimiento de la
amplitud de la oscilación del 25 %, esto es, la amplitud de una oscilación debı́a ser un
25 % de la precedente. Esto claramente implica un factor de amortiguamiento mucho
EN
menor a 0,7.

N
Una forma directa de cuantificar la oscilación de la respuesta al escalón independien-
IO
temente de los modos naturales del lazo cerrado es la variación total, que equivale a
la suma de las amplitudes de todas las oscilaciones de la respuesta transitoria [SP01,
p. 29]:
∞
X
C
TV = vk (4.1)
k=0
C
RU
ST
La relación entre la variación total y la amplitud final se denomina exceso de variación,

que deberı́a ser lo más próxima a 1 posible.
Por otra parte, si planteamos el exceso de variación para la acción de control podrı́amos
N
tener una forma de cuantificar la “eficiencia” del diseño en relación al esfuerzo de control.
Indices de Desempeño
O
Otra forma de evaluar la “calidad” de la respuesta transitoria de forma “cuantitativa” es

mediante el uso de ı́ndices de desempeño.
En matemáticas un ı́ndice de desempeño es una cantidad escalar que califica la solución
C
a un determinado problema. Por conveniencia en general los ı́ndices de desempeño

lo son en realidad de mal desempeño o demérito, y deben ser cantidades positivas
definidas. Lo deseable es que el ı́ndice sea lo mas chico posible.
EN
Para el diseño de sistemas de control considerando la respuesta transitoria se definen

ı́ndices de desempeño para el error en la respuesta al escalón.
Un ı́ndice de este tipo es el definido por la integral del error cuadrático o ISE (Integral of
Squared Error ):
Z T
ISE = e2 (t)dt (4.2)
0

Un ı́ndice similar se obtiene de la integral del valor absoluto del error :
Z T
IAE = |e(t)|dt (4.3)
0
En relación al IAE, el ISE penaliza más aquellas soluciones con excursiones mayores
del error (por ejemplo, los sobrepasos).
Dado que el error inicial al escalón es 1 para t = 0 cualquiera sea la respuesta, serı́a
lógico darle más peso en el ı́ndice al error tardı́o (cuando el tiempo crece). Con esta
N
consideración se define el ı́ndice ITAE: integral del tiempo por el valor absoluto del error :
Z T
IT AE = t|e(t)|dt (4.4)
IO
0
Respuestas Optimas
Al momento de decidir especificaciones de diseño se combinan distintos requerimientos
C
de acuerdo al problema particular abordado, pero en muchas ocasiones quedan
aspectos sin definir de forma explı́cita.
Puede plantearse como objetivo la idea de buscar el mejor “resultado posible”, que
C
identificamos como “solución óptima”.
El adjetivo “óptimo” implica algo ası́ como “insuperable”, lo que es muy difı́cil de plantear
RU
en cualquier caso real.
El concepto de “solución óptima” solo tiene sentido en planteos matemáticos muy
concretos, y solo en relación a un ı́ndice de desempeño en particular.
Para afirmar que una solución es óptima debemos demostrar de forma rigurosa que con
esta se obtiene el mı́nimo posible para el ı́ndice de desempeño elegido. Y debe notarse
que si se cambia el ı́ndice de desempeño, la solución óptima podrı́a dejar de serlo para
ST
el nuevo ı́ndice.
A modo de ejemplos podemos citar dos casos clásicos:

N
la curva que minimiza la distancia entre dos puntos en un espacio euclidiano es

la recta que pasa por ellos
la superficie que minimiza el área para contener un determinado volumen es la
O
esfera
En el primer caso la solución es una determinada curva, y el ı́ndice es la distancia

C
euclidiana. En el segundo caso la solución es una superficie, y el ı́ndice es el área.

Pero en ambos casos hay una restricción, en el primero la obligatoriedad de pasar por
dos puntos determinados y en la segunda la de contener un determinado volumen.
EN
Para una dinámica de segundo orden con tiempo normalizado t̂ = ωn t (lo cual define de
forma implı́cita una restricción), el óptimo ITAE es el caso con factor de amortiguamiento
0,7.
Diferentes trabajos han computado funciones de lazo cerrado sin ceros de diferente
orden que serı́an óptimas para el ı́ndice ITAE (aunque hay cierta controversia sobre
esos resultados). Los polinomios denominadores para las respuestas óptimas ITAE son
los siguientes:

s + ωn
s2 + 1,4ωn s + ωn2
s3 + 1,75ωn s2 + 2,15ωn2 s + ωn3
s4 + 2,1ωn s3 + 3,4ωn2 s2 + 2,7ωn3 s + ωn4
s5 + 2,8ωn s4 + 5,0ωn2 s3 + 5,5ωn3 s2 + 3,4ωn4 s + ωn5
N
s6 + 3,25ωn s5 + 6,60ωn2 s4 + 8,60ωn3 s3 + 7,45ωn4 s2 + 3,95ωn5 s + ωn6
Es importante notar que el hecho de ser óptimo para un determinado ı́ndice de
IO
desempeño puede ser algo relevante o no en un determinado caso concreto. EN el caso
ITAE, las respuestas de orden elevado resultan bastante oscilatorias.
4.1.2. Respuesta en Frecuencia
C
Para la compensación en frecuencia planteada en la subsección 3.4.2 los objetivos se
establecieron en términos de ancho de banda y pico resonante de lazo cerrado, lo cual
nos conduce a la elección de una frecuencia de cruce de ganancia para el lazo abierto y
C
cotas inferiores para margenes de estabilidad relativa, especialmente el de fase.
RU
El análisis en frecuencia es más razonable para referencias o perturbaciones inciertas,
y permite considerar de forma más directa los compromisos en el diseño. Podemos
plantear los requerimientos estableciendo una cota inferior para el “nivel de rechazo”
(del error a las referencias y las perturbaciones).
Cuantificar este “nivel” de rechazo, o la “magnitud” de cualquier otro elemento

ST
matemático, exige elegir una cierta norma para definir a que nos referimos al hablar
de magnitud.
Por ejemplo, para un número complejo podemos usar el módulo como medida de
magnitud. Habitualmente extendemos esto a cualquier vector de dimensión finita n, que
calculamos tomando la raı́z cuadrada del producto escalar de este por si mismo.
N
En el caso de señales (d(t), y(t), etc.) tenemos que cuantificar la “magnitud” de

funciones continuas, que como veremos se realiza con el mismo criterio que en el caso
de vectores de dimensión finita.
O
Normas Vectoriales
Cualquier operador || · || que arroje como resultado una cantidad escalar puede ser
C
utilizado como una norma si posee las siguientes caracterı́sticas:
el resultado es no negativo: || · || ≥ 0
es un operador positivo: ||x|| = 0 ⇐⇒ x = 0
EN
es homogéneo: ||αx|| = α||x||

verifica la desigualdad triangular: ||x1 + x2 || ≤ ||x1 || + ||x1 ||
en donde x es un elemento del espacio vectorial sobre el que opera (ver [SP01, apéndice
A.5, p. 526]).

Para vectores en Rn podemos construir diferentes normas mediante la expresión:
n
!1/p
X
kxkp , |xk |p (4.5)
k=1
La norma 2 se corresponde con la norma euclı́dea (módulo del vector), mientras que la
norma ∞ se corresponde con la componente de mayor valor absoluto (valor máximo).
Para funciones continuas la sumatoria se convierte en integral:
N
Z ∞ 1/p
p
kx(t)kp , |x(τ )| dτ (4.6)
IO
−∞
La norma 2 para este caso es la raı́z cuadrada de la energı́a, mientras que la norma ∞
es el pico de su valor absoluto.
Para señales con energı́a no acotada no es posible calcular la norma 2, pero podemos
C
considerar su potencia:
s Z T
1
C
kx(t)kpwr , lı́m |x(τ )|2 dτ (4.7)
T →∞ 2T −T
RU
Estrictamente hablando esta es una semi-norma, por no cumplir todas las propiedades
para de las normas (ver [SP01, apéndice A.5.6, p. 536]).
Teorema de Parseval Según este teorema, si Y (ω) es la transformada de Fourier de

y(t) se verifica que:
ST
Z ∞ Z ∞ Z ∞
2 1 2
y 2 (t)dt = |Y (f )| df = |Y (ω)| dω (4.8)
−∞ −∞ 2π −∞
donde ω es frecuencia angular y f = ω/2π .

Dado que la trasnformada de Fourier equivale a la de Laplace con s = jω , incluyendo
N
√
el término 1/ 2π para la definición de la norma cuadrática en frecuencia (angular)
podemos decir que:
ky(t)k2 = kY (jω)k2 (4.9)
O
Este es uno de los aspectos de la dualidad entre el análisis temporal y el frecuencial.

C
Supongamos que y(t) = e−at ∀ t ≥ 0, y que y(t) = 0 ∀ t < 0. La norma cuadrática

resulta:
sZ sZ
∞ ∞
EN
2
ky(t)k2 = |e−at | dt = e−2at dt
0 0
s ∞ r
1 −2at 1
= e = 2a
2a 0

Si tomamos la transformada de Fourier y calculamos la norma cuadrática deberı́amos
llegar al mismo resultado:
s s
∞ 1 2 ∞
Z Z
1 1 1
kY (ω)k2 = dω = dω
2π −∞
jω + a 2π −∞ ω2 + a2
s ∞ r
1 ω 1
= tan−1 =
2πa a −∞ 2a
N
lo cual confirma lo expresado por el teorema de Parseval.
IO
Escalado y Normalización
Vamos a considerar en lo sucesivo que en el modelo G(s) tanto la entrada como la salida
han sido normalizadas de la forma:
C
G(s) = e−1
tol Ḡ(s)umax
C
donde etol es la tolerancia para el error de seguimiento, umax es el valor máximo de la
acción de control y Ḡ(s) la transferencia considerando unidades de ingenierı́a.
De esta forma los rangos para la acción de control y la salida estarı́an normalizados al
RU
rango operativo. En otras palabras, en condiciones normales |y| y |u| estarán en el rango
(−1 : 1).
Para el análisis es recomendable realizar esto con todas las entradas y salidas de interés
en el lazo.
ST
El concepto de escalado aquı́ planteado puede profundizarse en [SP01, sec.1.4, p. 5].
Control Perfecto
En la subsección 2.2.1 se introdujo el concepto de control perfecto, que podrı́amos
sintentizar como “rechazo exacto de perturbaciones”: S(s) = 0 (T (s) = 1), lo cual hemos
N
dicho no es fı́sicamente realizable.

El objetivo principal del diseño es entonces logar T (s) ≈ 1 y S(s) ≈ 0 en un cierto “rango
de frecuencias de interés” para la aplicación [0 : ω1 ), aunque en ocasiones simplemente
O
tratamos de lograr el mayor rango posible.
Siendo T (s) un filtro pasa-bajos, podemos caracterizarlo con su frecuencia de corte ωbw
C
(que coincide con su ancho de banda), y como S(s) + T (s) = 1, la sensibilidad S(s) es
pasa-altos caracterizada por una cierta frecuencia de paso ωps .
En el apartado 3.3.2 se mostró que ωps < ωc < ωbw , donde ωc el la frecuencia de cruce
de ganancia del lazo abierto: |K(jωc )G(jωc )| = 1.
EN
Es claro que estos objetivos se cumplen en tanto |K(s)G(s)| 1, y esto se logra si

ω1 < ωps < ωc < ωbw .
Ampliar el rango ω1 a un valor ω1 + δω implica incrementar la frecuencia de cruce ωc , y
esto solo puede llevarse a cabo aumentando la ganancia del compensador al menos en
el rango [ωc : ωc + δω]; lo cual introduce varios conflictos en el diseño que veremos más
adelante.

Especificaciones para la Sensibilidad Complementaria
La sensibilidad complementaria T (s) define el seguimiento de referencias.
Algunos métodos de sı́ntesis (ver 4.4.2) permiten especificar la sensibilidad complemen-
taria como objetivo de diseño.
Existen dos prototipos usados frecuentemente por sus caracterı́sticas de respuesta en
frecuencia: el filtro de Butterworth y el filtro de Bessel (denominado ası́ por la estructura
del polinomio denominador).
El filtro de Butterworth se caracteriza por tener para un determinado orden la respuesta
N
en frecuencia más plana posible en la banda de paso y la mayor pendiente en la banda
de corte, como se observa a la izquierda en la figura 4.1. Se podrı́a decir que como filtro,
IO
a los efectos de absorber la energı́a de la señal de entrada en la banda de corte es ideal;
e introduce la mı́nima distorsión posible en la distribución espectral de energı́a dentro de
la banda de paso.
El filtro de Bessel en cambio se caracteriza por tener la un atraso de fase lineal en la
C
banda de paso. Esto significa que el atraso traducido a tiempo de retardo es el mismo
para todas las armónicas en la banda de paso, y con ello la distorsión en la forma
temporal de la señal es mı́nima.
C
En el lado derecho de la figura 4.1 se observa que la respuesta transitoria del filtro
de butterworth es algo oscilatoria, mientras que la del filtro de Bessel es mucho más
RU
parecida a la forma de la entrada (un escalón).
Puede observarse que en el caso de Butterworth los polos tienen una distribución circular
(la distancia al origen para todos los polos es la misma), mientras que en el caso de
Bessel la distribución es elı́ptica.
ST
Especificaciones para la Sensibilidad

Para cuantificar la capacidad de seguimiento de referencias podemos evaluar la norma
del error para un cierto valor de la norma de la referencia. De acuerdo al Teorema de
Parseval podemos decir que ke(t)k2 = kE(jω)k2 (uno de los aspectos de la dualidad
entre el análisis temporal y el frecuencial). Por lo tanto:
N
ke(t)k2 = kE(jω)k2 = kS(jω)R(jω)k2

O
En el caso de referencias inciertas (aleatorias) realizamos el análisis directamente en

frecuencia pero considerando la potencia de las señales (o nivel rms).
La misma expresión surge al considerar los efectos de una perturbación de salida do (t)
C
sobre la salida y(t), con lo cual los planteos para seguimiento de referencias y rechazo
de perturbaciones son equivalentes.
Desde el punto de vista del error, la referencia puede considerarse como una
perturbación que debe ser rechazada.
EN
Como las entradas tienen una cierta distribución espectral W̄ (jω), lo razonable serı́a
usar esta distribución como “función de peso” al evaluar la capacidad de rechazo
requerida a lo largo del espectro de frecuencias:
|S(jω)||W̄ (jω)| < 1/f

N
IO
C
C
RU
Figura 4.1: Respuesta en frecuencia y transitoria al escalón de filtros de los filtros de Butterworth y Bessel de orden 4
Podemos normalizar el factor de rechazo f absorbiendo su magnitud en la función de

ST
peso (lo cual equivale a normalizar la perturbación equivalente), y establecer como

requerimiento:
|S0 (jω)||WS (jω)| < 1 (4.10)
Podemos replantear la ecuación (4.10):

N
|S0 (jω)| < |WS (jω)|−1 (4.11)
y analizarla en el diagrama de bode de la sensibilidad nominal como se observa en la

O
figura 4.2.
Para seguimiento de referencias WS se obtendrı́a de la distribución espectral de

C
la referencia (raı́z de su PSD). Para rechazo de perturbaciones debemos combinar

la distribución espectral de la perturbación con la sensibilidad de la salida a esta
entrada, para obtener la distribución espectral de la perturbación equivalente de salida
correspondiente. En ambos casos se puede dividir el resultado por algún factor de
EN
rechazo deseado.
Lectura Adicional
De [SP01]:
5.10 - Pefomance requeirements imposed by disturbances and commands

N
IO
Figura 4.2: Análisis de desempeño en relación a la sensibilidad
C
Restricciones en el Diseño
C
En el capı́tulo precedente hemos visto las formas clásicas para la sı́ntesis de un
compensador SISO. En este capı́tulo veremos algunas alternativas, pero en todos los
RU
casos el proceso de sı́ntesis requiere de la definición de especificaciones de diseño, las
cuales de una u otra manera imponen una cierta velocidad de respuesta o ancho de
banda para el lazo cerrado.
Al momento de determinar esta caracterı́stica es necesario analizar las limitaciones en
el diseño que impone la dinámica del proceso a controlar; algunas de las cuales tienen
que ver con la instrumentación (sensores y actuadores) pero otras son estructurales.
ST
4.2.1. Limitaciones Asociadas a la Instrumentación

Actuación Máxima
N
Supongamos que ωg es la frecuencia de cruce de ganancia de la planta, |G(jωg )| = 1.

Podemos decir que en general se cumple que |T (jωg )| ≈ 1 y |S(jωg )| ≈ 1. La
aproximación al control perfecto se obtiene hasta frecuencias ω1 < ωg /10
O
Para lograr ω1 > ωg será necesario que en el rango (ω1 : ωc ) el compensador tenga alta
ganancia: |K(jω)| 1.
Esto significa que las acciones de control serán grandes ante perturbaciones equiva-
C
lentes de salida o cambios en la referencia con frecuencias mayores a la frecuencia de

corte. Si estas fueran significativas, las acciones de control alcanzarı́an rápidamente sus
valores máximos (saturación).
Por lo tanto el nivel de actuación máximo impone un lı́mite superior para el ancho de
EN
banda alcanzable, aunque debemos aclarar que no se trata de un lı́mite exacto sino más
bien un orden de magnitud.
Ruidos de Medición
La sensibilidad del control al ruido de medición es:
U (s) K(s)
Su (s) = = = K(s)S(s)
N (s) 1 + K(s)G(s)

N
Figura 4.3: Lazo de control general
IO
Lograr una ganancia elevada en el control para frecuencias altas implicarı́a una
amplificación del ruido de medición en ese rango de frecuencia, lo cual normalmente
se traduce en un alto nivel de ruido en la acción de control; llegando en ocasiones a
C
responder al ruido de medición con buena parte del rango de actuación.
Por lo tanto el ruido de medición en alta frecuencia impone también un lı́mite superior
para el ancho de banda alcanzable.
C
4.2.2. Restricciones Estructurales
RU
Estabilidad Interna
Cuando hablamos del lazo cerrado solemos pensar en la función de transferencia entre
referencia y salida T (s). Pero debe tenerse en cuenta que en el lazo cerrado hay varias
entradas, siendo la referencia solo una de ellas.
Debemos considerar perturbaciones y ruido de medición, y analizar también las
ST
exigencias del diseño sobre las acciones de control (pensando también a u(t) como
una salida de interés).
En la subsección 2.3.2 se han definido las sensibilidades del lazo SISO estándar, cuya
estructura repetimos en la figura 4.3.
N
En particular debe tenerse en cuenta que la estabilidad de lazo cerrado no implica solo
la ausencia de polos en el semiplano derecho en T (s) y S(s).
Podrı́an existir modos inestables de lazo cerrado no ser visibles en estas sensibilidades.
O
El diseño debe garantizar que el lazo cerrado sea internamente estable (ver [GGS01,
def.5.1, p. 125]).
C
Diremos que el lazo SISO es internamente estable si las sensibilidades básicas S(s),
Si (s) = S(s)G(s) y Su (s) = S(s)K(s) son todas funciones de transferencia estables.
Este concepto se torna particularmente importante la plantear un control por inversión
para sistemas de fase no mı́nima.
EN
Sistemas de Fase No Mı́nima Los sistemas de fase no-mı́nima son aquellos que
tienen polos y/o ceros en el semiplano-derecho.
La designación surge por el hecho de que en su respuesta en frecuencia la gráfica de
ganancia coincide con la del sistema equivalente con todos sus polos y ceros en el
semiplano izquierdo, pero el atraso de fase es mucho mayor al de este último. En la
figura 4.4 se ilustra esto con un ejemplo.

Esto incluye también a los sistemas con retardo de transporte D(s) = e−τ s , ya que para
el retardo se tiene que |D(jω)| = 1 (equivale a una constante unitaria) pero el atraso de
fase es ∠D(jω) = e−jωτ .
Cancelaciones en el Semiplano Derecho Para dinámicas complejas pareciera

razonable colocar ceros en el compensador para eliminar los polos de la planta más
cercanos al origen, y colocar igual cantidad de polos en el compensador más a la
izquierda para llevar los polos de lazo cerrado a las regiones deseadas del plano s
manteniendo el compensador bipropio.
N
Lo que estamos planteando al hacer esto es que parte del control “invierta” una parte de
la dinámica de la planta.
IO
Si bien este es un recurso viable, debe usarse con precaución al trabajar con plantas de
fase no mı́nima.
Supongamos que p sea un polo de la planta y un cero del control; es decir G(p) = ∞
y K(p) = 0. Entonces podemos escribir las funciones de transferencia de la planta y el
C
compensador de la siguiente forma:
1 B(s) P̄ (s)
C
G(p) = , K(p) = (s − p)
s − p Ā(s) L(s)
La función de sensibilidad para el lazo cerrado resulta:

RU
1 L(s)Ā(s)
S(s) = =
P̄ (s) 1 B(s) L(s)Ā + P̄ (s)B(s)
1 + (s − p)
L(s) (s − p) Ā(s)
ST
N
O
C
EN
s + 0,8 −s + 0,8
Figura 4.4: Polos-ceros y respuesta en frecuencia para G1 (s) = 7,5 (azul) y G2 (s) = 7,5 (rojo)
(s + 2)(s + 3) (s + 2)(s + 3)

mientras que su sensibilidad complementaria será:
P̄ (s) 1 B(s)
(s − p)
L(s) (s − p) Ā(s) P (s)B(s)
T (s) = =
P̄ (s) 1 B(s) L(s)Ā + P̄ (s)B(s)
1 + (s − p)
L(s) (s − p) Ā(s)
Vemos que el polo cancelado no impacta ni en S(s) ni en T (s).

Pero el polinomio de lazo cerrado resulta:
N
(s − p)P̄ (s)B(s) + L(s)(s − p)Ā(s) = 0
IO
o bien:
(s − p) P̄ (s)B(s) + L(s)Ā(s) = 0
Aunque en las funciones de sensibilidad S(s) y T (s) este polo no sea visible, el lazo
cerrado tendrá un polo en p.
C
Por lo tanto la estrategia de control con cancelación es válida en tanto p sea un polo
estable para eliminarlo de S(s) y T (s), pero no desaparece del lazo cerrado. Por ejemplo:
C
Y (s) B(s)
Si (s) = = G(s)S(s) =
Di (s) (s − p) L(s)Ā + P̄ (s)B(s)
RU
Si p es un polo inestable (p > 0), la cancelación no es válida porque el lazo cerrado
no serı́a internamente estable. Por lo tanto podemos afirmar que si el lazo cerrado es
estable, no puede haber cancelaciones entre polos y ceros en el semiplano derecho.
Restricciones entre S(s) y T(s)

ST
Las sensibilidades principales del lazo son:
1
S(s) =
1 + K(s)G(s)
y la sensibilidad complementaria es:

N
Y (s) K(s)G(s)
T (s) = =
R(s) 1 + K(s)G(s)
O
Ya hemos destacado en la sección 2.3.2 la restricción fundamental entre estas funciones

a través de la ecuación (2.5):
C
S(s) + T (s) = 1
Esto se cumple independientemente de la dinámica de lazo abierto. Veremos a

continuación que existen otras restricciones estructurales de este tipo.
EN
Limitaciones por Dinámica de Fase No-Mı́nima

Supongamos que p sea un polo de la planta, es decir G(p) = ∞. En principio se podrı́a
decir que S(p) = 0 y T (p) = 1, ya que:
1 1
S(p) = = =0 , T (p) = 1 − S(p) = 1
1 + K(p)G(p) 1 + K(p) ∞ ejθ

Sin embargo, si K(p) = 0 (que p sea un cero del control) se cumplirı́a que K(p)G(p) 6= 0
y por lo tanto S(p) 6= 0 y T (p) 6= 1. Pero esto no puede ocurrir para la dinámica de fase no
mı́nima del lazo abierto si el lazo cerrado es internamente estable. Por lo tanto podemos
asegurar que para un sistema a lazo cerrado es estable, si p es un polo inestable de lazo
abierto:
p > 0 , G(p) = ∞ → T (p) = 1 , S(p) = 0 (4.12)
De la misma forma, si z es un cero de fase no mı́nima de lazo abierto:
N
z > 0 , G(z) = 0 → T (z) = 0 , S(z) = 1 (4.13)
Estas son restricciones de interpolación impuestas para la dinámica de lazo cerrado con
dinámicas de fase no mı́nima en el lazo abierto.
IO
Control de Sistemas Inestables La transformada de Laplace del error es:
Z ∞
E(s) = L {e(t)} = e(t)e−st dt = S(s)R(s)
C
0
Supongamos que el lazo abierto tenga un polo inestable p (p > 0), con lo cual S(p) = 0.
Entonces, independientemente del control se verifica que:
C
Z ∞
E(p) = S(p)R(p) = 0 → e(t)e−pt dt = 0
0
RU
Como e−pt > 0 ∀t > 0, para que la integral sea nula el error e(t) necesariamente tiene
cambiar de signo. Si consideramos una referencia escalón, la respuesta necesariamente
tendrá sobrepaso.
Además, como la exponencial decae con constante de tiempo Tp = 1/p, el sobrepaso

necesario para balancear la integral será pequeño si se produce tempranamente
ST
en relación a Tp , cuando la exponencial no decayó significativamente; y será

necesariamente mayor si se produce tardı́amente cuando la exponencial se ha reducido.
En otras palabras, si la respuesta es lenta en relación a Tp el sobrepaso deberá ser
grande; con lo cual el proceso podrı́a alejarse mucho de su condición de equilibrio.
N
Concluimos que en el caso de plantas inestables, la dinámica dominante de lazo cerrado

deberá ser más rápida que la inestabilidad para evitar sobrepasos exagerados.
En otras palabras, las inestabilidades de la planta introducen un lı́mite inferior para el
O
ancho de banda de lazo cerrado.
Supongamos que:
C
1
G(s) =
(s − 1)(s + 2)
Analicemos dos casos, el segundo con ancho de banda igual al doble del primero:
EN
8,2(s + 1)(s + 0,2439) 8,2(s + 0,2439)

K1 (s) = → T1 (s) =
s(s + 4,4) (s + 2)(s2 + 1,4s + 1)
23(s + 1)(s + 0,6957) 23(s + 0,6957)
K2 (s) = → T2 (s) =
s(s + 7,8) (s + 4)(s2 + 2,8s + 4)
En la siguientes figuras se ven las respuestas al escalón.

N
IO
C
C
RU
Puede notarse el mayor sobrepaso de la respuesta lenta en relación a la más rápida.
Control de Sistemas con Ceros de Fase No Mı́nima La transformada de Laplace de

la salida es:
ST
Z ∞
Y (s) = L {y(t)} = e(t)e−st dt = T (s)R(s)
0
Supongamos que el lazo abierto tenga un cero de fase no mı́nima z (z > 0), con lo cual
N
T (z) = 0. Entonces:
Z ∞
Y (z) = T (z)R(z) = 0 → y(t)e−zt dt = 0
O
Como e−zt > 0 ∀t > 0, para que la integral sea nula la salida y(t) necesariamente tiene
cambiar de signo, independientemente de lo que sea el control. Si consideramos una
C
referencia escalón, la respuesta necesariamente tendrá un subvalor.
Además como la exponencial decae con constante de tiempo Tz = 1/z , si la respuesta

es rápida en relación a Tz el subvalor deberá ser grande. Por lo tanto, la respuesta
EN
dominante de lazo cerrado debe ser más lenta que los ceros de fase no mı́nima del lazo
abierto para evitar subvalores exagerados.
En otras palabras, la ceros de fase no-mı́nima y retardo presentes en la planta introducen

un lı́mite superior para el ancho de banda de lazo cerrado.

Supongamos que:
−2s + 1
G(s) =
(s + 2)(s + 3)
Analicemos dos casos, el segundo con el doble de ancho de banda respecto al primero:
1,25(s + 3)(s + 2) −1,25(s − 0,8)

K1 (s) = → T1 (s) =
s(s + 3,25) (s + 1)2
0,3125(s + 3)(s + 2) −0,3125(s − 0,8)
N
K2 (s) = → T2 (s) =
s(s + 1,312) (s + 0,5)2
En la siguientes figuras se ven las respuestas al escalón.
IO
C
C
RU
ST
N
Puede notarse el mayor subvalor de la respuesta rápida respecto de la más lenta.

O
Si la planta tuviera ceros de fase no mı́nima lentos y polos inestables rápidos, el control
se torna inviable. En esos casos es necesario recurrir a estructuras de control con más
C
de un grado de libertad.
Integrales de la Sensibilidad
EN
Además de la restricción estructural entre S y T de la ecuación (2.5) existen otras

restricciones estructurales que deben destacarse si se pretende lograr lazos cerrados
estables.
Primera Integral de Bode Una de estas restricciones es la primer integral de Bode

para la sensibilidad, que establece para sistemas realimentados estables se cumple la

siguiente relación:
Z ∞ np
X π
ln |S(jω)|dω = π Re {pk } − lı́m sL(s) (4.14)
0 2 s→0
k=1
donde pk son los polos inestables de lazo abierto. La integral del lado derecho se anula
si el lazo abierto es de grado relativo 2 o superior .
Evidentemente en el caso de plantas estables de grado relativo mayor a 1:
N
Z ∞
ln |S(jω)|dω = 0 (4.15)
0
IO
De esto surge que todo intento de disminuir la sensibilidad en una cierta banda de
frecuencia tendrá siempre su correlato como incremento en otra. Esto se conoce como
“efecto de la cama de agua” (waterbed effect).
C
Como la función de sensibilidad se corresponde con un filtro pasa-altos, en baja
frecuencia el logaritmo natural de su magnitud es negativo. Por lo tanto en alguna región
de la banda de paso su ganancia deberá ser mayor de 1 (amplificación), y esto será más
C
severo si el lazo abierto tiene polos inestables.
Naturalmente el balance de la integral ante una disminución de la sensibilidad en alguna
banda se podrı́a lograr con un incremento pequeño pero sostenido de la sensibilidad en
RU
alta frecuencia, ya que la parte positiva de la integral se extiende hasta el infinito.
Supongamos que se diseña un compensador para un proceso con dinámica de fase

mı́nima y grado relativo tres.
Podemos resolver esto mediante parametrización afı́n (4.4.2), y para ello proponemos
ST
dos alternativas para la elección del lazo cerrado T (s): Un filtro de Butterworth y uno de
Bessel, ambos de orden 3 y con el mismo ancho de banda. Por ejemplo, para un ancho
de banda de 2s−1 :
8 21,95
Fbutt (s) = , Fbess (s) =
(s + 2)(s2 + 2s + 4) (s + 2,64)(s2 + 4,18s + 8,33)
N
Podemos fácilmente evaluar como quedarı́a la función de sensibilidad para cada caso
con el siguiente código:
O
clear ; clc
[ B , A ] = b u t t e r ( 3 , 2 , ’ s ’ ) ; F1 = t f ( B , A ) ; S1 = 1 − F1 ;
[ B , A ] = b e s s e l f ( 3 , 2 . 8 ) ; F2 = t f ( B , A ) ; S2 = 1 − F2 ;
C
Luego graficamos la sensibilidad y sensibilidad complementaria para ambos casos en

escala absoluta con escala logarı́tmica para las frecuencias, y el logaritmo natural de
las funciones de sensibilidad con escala lineal para las frecuencias, para visualizar la
EN
restricción integral:

N
IO
C
C
RU
ST
Puede observarse que la pendiente en la zona de corte es mayor para el filtro de

Butterworth, con lo cual la sensibilidad resulta más concentrada. El filtro de Bessel tiene
la sensibilidad más distribuida, y por ello el pico de sensibilidad es menor.
N
Segunda Integral de Bode Para lazos abiertos con un cero de fase no-mı́nima z se
verifica que:
O
Z ∞ np
Y pk + z
ln |S(jω)|w(z, ω)dω = π (4.16)
0 p̄k − z
k=1
C
donde pk son los polos inestables de lazo abierto y p̄k sus complejos conjugados,
mientras que si z es un cero real:
2z
w(z, ω) = (4.17)
z2 + ω2
EN
mientras que si se trata de un par complejo conjugado (z = x ± jy ):

x x
w(z, ω) = 2 + 2 2 (4.18)
2
x + (y − ω) x + (y + ω)
La función w(z, ω) decae rápidamente para ω > z , lo cual evidencia la dificultad de llevar
la frecuencia de paso a valores superiores al cero de fase no mı́nima.
El tema puede profundizarse en [SP01, sec.5.3.2,p. 164]

Lectura Adicional
En [SP01]:
Cap 5 - Limitations on Performance in SISO Systems
Robustez
En el diseño de sistemas de control automático trabajamos con modelos de la dinámica
N
de la planta para realizar la sı́ntesis de los parámetros del controlador.
Estos modelos excluyen deliberadamente las caracterı́sticas dinámicas que asumimos
IO
irrelevantes para el diseño. Pero en muchas ocasiones se presentan otros aspecto de la
dinámica real que no podemos modelar, o que solo puede hacerse de forma aproximada.
Debemos asumir que siempre existirá un cierto nivel de incertidumbre en el modelo.
Aun ası́ pretendemos que el sistema de control sea capaz de garantizar mı́nimamente
C
estabilidad de lazo cerrado, y de ser posible también un desempeño mı́nimo para cumplir
los requerimientos del diseño.
La Teorı́a de Control Robusto aborda esta problemática de forma explı́cita, estableciendo
C
pruebas para garantizar la estabilidad robusta y el desempeño robusto; y métodos de
sı́ntesis para intentar alcanzar estos objetivos.
RU
4.3.1. Incertidumbre en el Modelo
En [SP01] se listan algunos orı́genes de esta incertidumbre:
parámetros en el modelo que solo se conocen de forma aproximada
parámetros en los modelos lineales que cambian para diferentes condiciones de
ST
equilibrio
en modelos temporalmente invariantes para dinámicas que no lo son habrá
parámetros que cambian con el tiempo
distorsiones relacionadas con sensores y actuadores
dinámica de alta frecuencia desconocida o difı́cil de modelar
N
distorsiones en la implementación del controlador

Las diferentes fuentes de incertidumbre pueden clasificarse como:
O
incertidumbre paramétrica, cuando se conoce la estructura del modelo, pero se

cuenta solo con valores aproximados para algunos de sus parámetros
dinámica no modelada, ya sea porque se trata de dinámica no conocida o
C
deliberadamente no-modelada, lo cual implica un modelo nominal de orden

reducido
incertidumbre concentrada, cuando se combinan varias fuentes de incertidum-
bre paramétrica y/o dinámica no-modelada en un elemento puntual dentro de la
EN
estructura del modelo
4.3.2. Modelos de Incertidumbre

El primer paso para el análisis explı́cito de robustez es modelar la incertidumbre.
En la Teorı́a de Control Robusto se plantean dos casos: incertidumbre global e
incertidumbre estructurada.

N
IO
C
C
Figura 4.5: Análisis de estabilidad robusta
RU
En ambos consideramos un “modelo nominal” y un “modelo de incertidumbre” que se
combina con el anterior para definir una “familia de modelos” que incluya todos los casos
que pudieran experimentarse en la práctica.
El modelo de incertidumbre global más común es el multiplicativo, que surge de la
siguiente expresión:
ST
G(s) = G0 (s) [1 + δW∆ (s)] , |δ| < 1 (4.19)
donde G0 (s) es el modelo nominal, W∆ (s) es el modelo de incertidumbre y δ es

un escalar complejo arbitrario pero con módulo acotado que permite generar distintos
N
componentes de la familia de modelos (δ = 0 para el modelo nominal).
Cuando la incertidumbre está asociada a los polos de un proceso SISO puede resultar
O
conveniente usar un modelo multiplicativo inverso:
1
G(s) = G0 (s) , |δ| < 1 (4.20)
1 + δW∆ (s)
C
En lo posible se debe seleccionar el modelo más ajustado al caso analizado. Un modelo

demasiado amplio incluirá casos que nunca se darán en la realidad, y con ello el análisis
será conservativo.
EN
4.3.3. Estabilidad Robusta

La robustez en la estabilidad de lazo cerrado se puede analizar a través del criterio de
Nyquist. En la figura 4.5 vemos la representación en el diagrama de Nyquist del lazo
abierto nominal L0 (jω) = K(s)G0 (s) y una envolvente (|δ| = 1) para la familia de
modelos L(jω) = K(s)G(s) con incertidumbre multiplicativa W∆ (jω):

N
IO
C
Figura 4.6: Análisis de estabilidad robusta con el ı́ndice de robustez
C
L(s) = L0 (s) [1 + δW∆ (s)] = L0 (s) + |1|ejθδ L0 (s)W∆ (s)
RU
De la gráfica vemos que se tendrá estabilidad para toda la familia de modelos (estabilidad
robusta) si se cumple que:
|1 + L0 (s)| = |S0−1 (jω)| > |L0 (s)W∆ (s)|
Esto puede escribirse como:

ST
|L0 (s)|
1> |W∆ (s)|
|1 + L0 (s)|
Por lo tanto podemos decir que la condición de estabilidad robusta para un modelo con
N
incertidumbre multiplicativa global es:
|T0 (jω)W∆ (s)| < 1 (4.21)

O
Podemos replantear esto como:
|W∆ (s)| < |T0 (jω)|−1 (4.22)

C
La inversa de la magnitud de la sensibilidad complementaria puede interpretarse como

un indice de robustez. El sistema tendrá estabilidad robusta si la incertidumbre se
mantiene por debajo del ı́ndice de robustez, como se muestra en el diagrama de Bode
EN
de la figura 4.6.
Para otros modelos de robustez debe utilizarse la condición de estabilidad robusta
correspondiente (ver [Peñ92, p. 36]).
De esta figura resulta evidente que la incertidumbre dinámica W∆ impone un lı́mite

superior para el máximo ancho de banda alcanzable a lazo cerrado.

N
IO
C
C
Figura 4.7: Análisis de desempeño robusto
RU
4.3.4. Desempeño Robusto
Desempeño robusto implica cumplir con la condición (4.10) para cualquier elemento de
la familia de modelos.
Asegurar desempeño robusto implica garantizar que la sensibilidad para toda la familia
ST
de modelos tendrá una magnitud menor o igual a una cierta cota WS (jω), lo cual implica
una restricción mayor a la condición de estabilidad robusta.
(
La inversa de la función de peso WS jω) impone una cota superior para la función de
sensibilidad, y sabemos que la inversa de la sensibilidad es la distancia entre la traza de
N
Nyquist de lazo abierto y el punto −1.

Por lo tanto para lograr desempeño robusto es necesario que para una dada frecuencia
ω toda la famila de modelos se encuentre a una distancia mayor a WS (jω) respecto del
O
−1. Podemos pensar la función de peso como un radio de exclusión centrado en el −1

para la traza de lazo abierto, como se muestra en la figura 4.7.
C
Para evaluar desempeño robusto podemos modificar la condición de estabilidad robusta

exigiendo no una distancia mayor a 0 respecto del −1 en la gráfico de Nyquist, sino
mayor a |WS (jω)|:
|T0 (jω)W∆ (s)| < 1 − |WS−1 (jω)S0 (jω)|

EN
lo cual equivale a:
|T0 (jω)W∆ (s)| + |S0 (jω)WS (jω)| < 1 (4.23)
El primer término es la condición de estabilidad robusta, mientras que el segundo se

corresponde con la condición de desempeño nominal.

Lectura Adicional
En [SP01]:
Cap 7 - Uncertainty and Robustness for SISO Systems
Sı́ntesis de Compensadores
N
4.4.1. Asignación de Polos
ssec:polinomial
A continuación proponemos ajustar un compensador bipropio de orden n − 1 para una
IO
planta de orden n, a fin de obtener un polinomio de lazo cerrado de orden 2n − 1 elegido
de forma arbitraria. Este enfoque se desarrolla en [GGS01, sec.7.2, p. 177].
Denotemos las funciones de transferencia para el compensador y la planta de la
siguiente forma:
C
P (s) B(s)
K(s) = , G(s) =
L(s) A(s)
C
donde A(s) es un polinomio de orden n y B(s) es uno de orden menor; mientras que
P (s) y L(s) son polinomios de orden n − 1:
RU
P (s) = pn−1 sn−1 + pn−2 sn−2 + · · · + p1 s + p0
L(s) = ln−1 sn−1 + pn−2 sn−2 + · · · + l1 s + l0
B(s) = nn−1 sn−1 + pn−2 sn−2 + · · · + b1 s + b0
A(s) = an ss + an−1 sn−1 + an−2 sn−2 + · · · + a1 s + a0
ST
El polinomio de lazo cerrado será:
Alc = L(s)A(s) + P (s)B(s) = sm + c1 sm−1 + · · · + cm−1 s + cm (4.24)

N
Igualando coeficientes obtenemos un conjunto de 2(n − 1) ecuaciones lineales para

definir los coeficientes del compensador.
O
Veamos el ejemplo 7.1 de [GGS01]:
1
G(s) =
C
s2 + 3s + 2
El compensador será de orden 1. Entonces:
Alc = s2 + 3s + 2 (l1 s + l0 ) + (p1 s + p0 )

EN
= l1 s3 + (3l1 + l0 ) s2 + (2l1 + 3l0 + p1 ) s + (2l0 + p0 )
Dado que el modelo de planta es de orden 2, necesitamos elegir un polinomio de lazo

cerrado de orden 3:
Alc = s3 + 3s2 + 3s + 1

Igualando coeficientes:
l1 = 1
3l1 + l0 = 3
2l1 + 3l0 + p1 = 3
2l0 + p0 = 1
lo cual puede expresarse en notación matricial como:
N
    
1 0 0 0  l1   1
3    
 
1 0 0 l
 0 = 3

IO

2 3 1 0 p1   3

   
 
0 2 0 1 p0 1

De esto obtenemos l1 = 1, l0 = 0, p1 = 1, p0 = 1:
C
s+1
K(s) =
s
C
que equivale a un controlador PI.
RU
El esquema de sı́ntesis, que permite ubicar todos los polos de lazo cerrado, se puede
generalizar de la siguiente forma:
 

 ln−1  

 .. 
. 
   
c2n−1 

 
  

l0
 
ST
..
M̄e (A, B) = . (4.25)
 pn−1    
c0
  

 .. 

 . 

 

 
p0
 
N
en donde M̄e es una matriz que obtenemos eliminando la fila 1 y las columnas 1 y n + 1
de la matriz eliminante de Silvester Me para los poliniomios A(s) y B(s):
 
an 0 ··· 0 bn 0 ··· 0
O
an−1
 an ··· 0 bn−1 bn ··· 0 

 .. .. .. .. .. .. .. .. 
 . . . . . . . . 
C
 
 a0
Me (A, B) =  a1 ··· an b0 b1 ··· bn  (4.26)
 0
 a0 ··· an−1 0 b0 ··· bn−1 

 . .. .. .. .. .. .. .. 
 .. . . . . . . . 
0 0 ··· a0 0 0 ··· b0
EN
Podemos construir la matriz eliminante de Sylvester usando el siguiente código:

function M = sylm ( A , B )
n = length ( A ) ;
m = 2∗ n ;

Me = zeros (m−1, m) ;
f o r k =1: n
Me( k : n+k −1, k ) = A’;
Me( k : n+k −1, n+k ) = B ’ ;
end
end
Para el enfoque polinomial solo necesitamos ajustar la matriz eliminante y resolver el

sistema de ecuaciones:
N
function [ P, L ] = polynomial (B, A, Alc )
n = length (A ) ;
IO
Me = sylm ( A , B ) ;
Me = [Me( 2 : end , 2 : n ) Me( 2 : end , n +2: end ) ] ;
K = Me\ A l c ;
L = K( 1 : n−1) ’;
P = K( n : end ) ’ ;
C
end
C
Si queremos forzar un polo de lazo abierto (por ejemplo un integrador o un filtro)
podemos combinarlo con el denominador de la planta y diseñar el compensador para
ese modelo aumentado.
RU
El compensador resultante será estrictamente propio, ya que al denominador del
compensador bipropio computado con este enfoque deberá ser convolucionardo con
el polo adicional.
4.4.2. Inversión Dinámica

ST
Parametrización Afı́n
La alternativa es plantear de forma explı́cita el control por inversión para el lazo cerrado.
Supongamos que tenemos una función objetivo Fq (s) para la sensibilidad complemen-
taria T (s) del lazo cerrado. Debemos sintetizar un compensador K(s) tal que:
N
K(s)G(s)
T (s) = = Fq (s)
1 + K(s)G(s)
O
Despejando:
K(s)G(s) = Fq (s) [1 + K(s)G(s)]

C
= Fq (s) + Fq (s)K(s)G(s) → K(s) [G(s) − Fq (s)G(s)] = Fq (s)
Finalmente:
Fq (s) 1
EN
K(s) = (4.27)
1 − Fq (s) G(s)
Si:
B(s) N (s) N (s)/D(s) A(s)
G(s) = , Fq (s) = → K(s) =
A(s) D(s) 1 − N (s)/D(s) B(s)

y por lo tanto:
N (s) A(s)
K(s) = (4.28)
D(s) − N (s) B(s)
Para que el compensador sea bipropio, el grado relativo de Fq (s) debe ser igual al de la
planta. Y si este es mayor, el compensador será estrictamente propio.
Para plantas de fase mı́nima, salvo por esta consideración existe completa libertad para
elegir Fq (s).
N
De la ecuación (4.28) puede notarse que con este enfoque el compensador tendrá como
ceros los polos de G(s) y los ceros de Fq (s), mientras que sus polos serán los ceros
de G(s) y las raı́ces de D(s) − N (s). Vemos que de forma indirecta esto nos lleva
IO
normalmente a un control por cancelación.
La dimensión de la dinámica cancelada dependerá del orden de la función Fq (s) elegida.
Para que no exista cancelación Fq (s) deberá duplicar el orden de la planta.
Si la planta es inestable habrá ceros en el semiplano derecho de K(s) cancelando polos
C
inestables de la planta. De forma similar habrá cancelaciones entre el control y la planta
cuando esta tenga ceros en el semiplano derecho.
Por lo tanto, para plantas de fase no mı́nima habrá que elegir funciones Fq (s) que
C
aseguren la estabilidad interna del lazo.
Esto implica que los ceros de fase no mı́nima de la planta deberán ser ceros de Fq (s)
(raı́ces del polinomio N (s)), mientras que los polos inestables de la planta deberán ser
RU
raı́ces del polinomio D(s) − N (s).
Esto es algo que ya sabı́amos de la subsección 4.2.2, y que sintetizamos en las
ecuaciones (4.12) y (4.12).
Este tema se encuentra desarrollado, con otro enfoque, en [GGS01, cap.15].

Allı́ se plantea el control como una inversión:
ST
K(s)G(s)
T (s) = = Q(s)G(s)
1 + K(s)G(s)
Por lo tanto, el control para obtener una dinámica inversa Q(s) es:
N
K(s) = Q(s) [1 + K(s)G(s)] = Q(s) + K(s)G(s)Q(s)

de lo cual:
Q(s)
O
K(s) =
1 − Q(s)G(s)
Podrı́a usarse Q(s) como un control con modelo predictivo, en el cual solo realimentamos
el error de predicción:
C
EN

Si queremos que T (s) se ajuste a un modelo de lazo cerrado Fq (s) se tendrı́a:
Q(s)G(s) = Fq (s) → Q(s) = Fq (s)G−1 (s)
Entonces a partir de elegir Fq (s) determinamos la dinámica inversa Q(s), y con esta el
control K(s) para implementar una realimentación de la salida.
Podemos notar que las sensibilidades del lazo resultan:
N
T (s) = Q(s)G(s) = Fq (s)
S(s) = 1 − T (s) = 1 − Q(s)G(s) = 1 − Fq (s)
IO
Si (s) = G(s)S(s) = G(s) [1 − Q(s)G(s)] = G(s) [1 − Fq (s)]
Q(s)
Su (s) = K(s)S(s) = [1 − Q(s)G(s)] = Q(s) = Fq (s)G−1 (s)
1 − Q(s)G(s)
C
Claramente resulta necesario elegir Fq (s) estable, con lo cual T (s) y S(s) resultan
estables.
C
Pero en la tercer ecuación se observa que si la planta tiene un polo inestable p, es
necesario elegir Fq (s) tal que S(p) = 0, o bien Fq (p) = 1.
Y de la cuarta ecuación se observa que para lograr estabilidad interna Su (s) = Q(s)
RU
debe ser estable. Por lo tanto, todo cero de fase no mı́nima de G(s) deberá ser cero de
Fq (s) para que no aparezca como polo de Q(s).
En sı́ntesis, para polos p y ceros z de fase no mı́nima de la planta se debe cumplir que:
Fq (p) = 1 , Fq (z) = 0
ST
que es lo mencionado previamente.
Plantas con Integrador Si la planta es de la forma:
B(s) B(s)
G(s) = = k
N
A(s) s Ā(s)
donde el polinomio Ā(s) no tiene polos en el origen. El control resulta:

O
N (s) sk Ā(s)
K(s) =
D(s) − N (s) B(s)
C
Para que el control no tenga ceros en el origen es necesario que el polinomio D(s)−N (s)
tenga k raı́ces en el origen, lo cual implica que los últimos k coeficientes deben ser nulos.
Esto implica que Fq (s) se debe elegir de forma tal que el numerador coincida con los
últimos k términos del denominador.
EN
Supongamos que la planta es un integrador doble:
1
G(s) =
s2

y elegimos:
a0
Fq (s) =
s2 + a1 s + a0
en donde el numerador es igual al último término del denominador, de forma tal que
Fq (0) = 1. El control resulta:
a0 a0
K(s) = s2 = s
s2 + a1 s + a0 − a0 s + a1
N
Esto implicarı́a una incapacidad para rechazar perturbaciones constantes a la entrada
(o eliminar una condición inicial de error), ya que la función de sensibilidad de entrada
resulta:
IO
1 s (s + a1 ) s + a1 1
S(s) = = 2 → Si (s) = G(s)S(s) =
a0 s 1 s + a1 s + a0 s2 + a1 s + a0 s
1+
s + a1 s2
C
Vemos que el lazo no solamente es incapaz de rechazar perturbaciones de entrada, sino
que además no es internamente estable.
C
Para evitar esto elegimos para el numerador los últimos dos términos del denominador,
y aumentamos el orden de este último para mantener el grado relativo de Fq igual al de
RU
la planta:
a1 s + a0
Fq (s) =
s3 + a2 s2 + a1 s + a0
con lo cual
a1 s + a0 a1 s + a0
K(s) = s2 =
ST
s3 + a2 s2 + a1 s + a0 − a1 s − a0 s + a2
Con esto:
1 s2 (s + a2 )
S(s) = = 3
a1 s + a0 1 s + a2 s2 + a1 s + a0
N
1+ 2
s + a2 s
y entonces
O
s2 (s + a2 ) 1 s + a2
Si (s) = = 3
s3 2
+ a2 s + a1 s + a0 s2 s + a2 s2 + a1 s + a0
C
Si queremos forzar acción integral para rechazar perturbaciones constantes de entrada

serı́a necesario agregar un término adicional en el numerador y expandir en un orden el
denominador.
EN
Polos Indeseables Se puede notar que lo dicho anteriormente es equivalente a

considerar los polos en el origen de la planta como dinámica de fase no mı́nima, aunque
no lo sea.
Podemos aplicar el mismo tratamiento para los polos inestables a la dinámica lenta de la
planta o cualquier polo que por alguna razón sea indeseable para el lazo cerrado.

Esto implica que si p es un polo indeseable (inestable o no), para que no aparezca en el
lazo cerrado será necesario elegir Fq tal que Fq (p) = 1.
Y si p tiene multiplicidad k , entonces será necesario elegir Fq tal que Sq (s) = 1 − Fq (s)
tenga un cero en p con la misma multiplicidad k .
En el ejemplo anterior el polo indeseable es p = 0 con multiplicidad 2. Se puede

notar que con la última Fq elegida la sensibilidad tiene un cero z = 0 con esa misma
multiplicidad.
N
4.4.3. Loop-Shaping
IO
En la subsección 3.4.2 se ha presentado la compensación en frecuencia clásica.
Podemos sintetizar la estrategia considerando que:
un compensador en atraso o PI permite mejorar el desempeño en baja frecuencia
C
el ajuste final de ganancia permite establecer la frecuencia de cruce de lazo
abierto, determinando el ancho de banda del lazo cerrado
en la frecuencia de cruce utilizamos un compensador en adelanto para obtener
C
buenos margenes de fase y ganancia
de ser necesario podrı́amos agregar filtro (polos) de alta frecuencia para mitigar
los efectos del ruido de medición (de alta frecuencia). Esto implica además mayor
RU
robustez en relación a la incertidumbre dinámica de alta frecuencia.
Podemos observar que la compensación se traduce en una técnica de “conformado

del lazo abierto” (loop shaping) para lograr alta ganancia en baja frecuencia, un atraso
moderado en la frecuencia de cruce, y baja ganancia en frecuencias superiores.
ST
Si tenemos en cuenta las referencias r(t), la perturbación d y el ruido de medición n

tenemos para el error:
E(s) = S(s) R(s) + S(s) Gd (s) D(s) − T (s) N (s)
que en función del lazo abierto resulta:

N
1 1 L
E= R(s) + Gd D − N
1+L 1+L 1+L
O
El control perfecto requerirı́a:
e=0·r+0·d+0·n
C
lo que implica |L| 1 para los primeros dos términos y |L| = 0 para el tercero.
Evidentemente esto genera un conflicto, pero lo salvamos tratando de lograr lo primero
en baja frecuencia y lo segundo en alta.
EN
Además de los requerimientos por desempeño debemos cumplir con los de estabilidad
relativa.
El atraso de fase para una determinada frecuencia ω se encuentra estrechamente
relacionada con la pendiente de la curva de ganancia a esa frecuencia. Podemos
decir que si para una frecuencia ω la pendiente de |L(jω)| es n, el atraso de fase es
aproximadamente −n · 900 [SP01, p. 20].

En la siguiente gráfica se muestran los valores asintóticos de pendiente y atraso de fase
para la función de transferencia, donde se comprueba la afirmación anterior:
30(s + 1)
G(s) =
(s + 10)(s + 0,01)2
N
IO
C
C
RU
ST
Una pendiente −1 (−20 db/dec) implica un atraso de fase de 900 , mientras que una
pendiente −2 se corresponde con un atraso de 1800 .
En la frecuencia de cruce el atraso deberı́a ser del orden de los 1200 o menor, lo cual
implica una pendiente mayor que −1,5, pero nula porque de lo contrario no habrı́a cruce.
N
Para lograr alta ganancia en baja frecuencia, la pendiente para frecuencias menores a la
de cruce deberı́a ser más negativa; pero obviamente no podrá ser mas negativa de −2.
O
Esto es deseable también para alta frecuencia, a fin de mejorar la robustez y el rechazo
de ruidos.
Desde esta perspectiva es posible definir las especificaciones de diseño estableciendo

C
la forma deseada para el lazo abierto, combinando los requerimientos de desempeño

(bajas frecuencias), estabilidad relativa (frecuencias medias) y robustez (alta frecuencia).
Pero con dinámicas complejas puede ser difı́cil ajustar la solución, por lo cual se recurre
a herramientas de optimización para sintetizar el compensador.
EN
Un método de este tipo es el propuesto por McFarlane y Glover en 1990; en el cual se

busca ajustar un compensador para aproximar la forma deseada para el lazo abierto
maximizando la robustez de la solución. Esta estrategia se conoce como loop shaping
H∞ y se encuentra desarrollado en [SP01, sec.9.4, p. 382] para el caso multivariable.
El controlador óptimo H∞ se puede obtener mediante el comando loopsyn de la librerı́a

de control robusto de Matlab, o ncfsyn de GNU Octave.

N
(a) Se calienta agua usando quemador de gas natural y se (b) Se usa vapor para calentar y evaporar el agua del jugo de caña Se controlan los
mide la temperatura del agua a la salida niveles en cada evaporador
IO
Sistemas con Retardo
4.5.1. Dinámicas con Retardo
C
El retardo está presente en la mayorı́a de los sistemas reales. Este puede ser causado
por: transporte de masa, energı́a o información, efecto causado por varios sistemas de
C
bajo orden conectados en serie, tiempo de procesamiento en sensores o controladores,
etc.
Un retardo importante implica una dificultad para el sistema de control. Las dificultades
RU
son provocadas principalmente porque el efecto de las perturbaciones demora para ser
sentido, la acción de control demora para causar efecto en la variable controlada y porque
la acción de control se calcula con base en un error pasado.
4.5.2. Modelado
ST
La respuesta de un sistema con retardo puede describirse como
Y (s)
P (s) = = G(s)e−sL (4.29)
U (s)
N
donde G(s) es la respuesta libre de retardos y L puede representar un retardo real o

aparente, como el que se observa en la figura 4.9b.
Si G(s) es una dinámica sobre-amortiguada, lo cual es tı́pico en la industria de procesos
O
(donde los retardos en general son relevantes); la respuesta al escalón del sistema con
retardo será de la forma:
C
EN

N
IO
C
C
(a) En una torre de destilación se usa vapor para calentar
la mezcla en el fondo. Se controlan las temperaturas de
platos para controlar la concentración de las extracciones
RU
(b) Si en un semáforo solo el primer conductor responde a la señal
mientras el resto lo hace en base al movimiento de quien lo precede,
la respuesta del último es sobreamortiguada de alto orden
ST
N
O
C
El retardo de transporte es un operador lineal, pero a diferencia de otros operadores

lineales su transformada de Laplace no es una función racional:
EN
DL {y(t)} = y(t − L) , D(s) = e−sL (4.30)
Es obvio que la ganancia de este operador es 1 para todo valor de frecuencia ω , pero a
diferencia de los otros modelos el atraso de fase no está acotado:
|D(jω)| = 1 , ∠D(jω) = −Lω (4.31)
Puede notarse que el atraso es de 1800 para una frecuencia ω = π/L, duplicándose

con cada octava. El retardo de transporte es una dinámica de fase no-mı́nima
correspondiente al caso de fase mı́nima es G(s) = 1.
Una aproximación simple para la transformada de Laplace del retardo es utilizar un polo
o un cero:
1
e−sL ≈ Dp (s) = , e−sL ≈ Dz (s) = 1 − L s (4.32)
Ls + 1
Sin embargo, esto sirve para ω L. Es posible lograr una aproximación exacta para
N
la ganancia, y más ajustada para la fase recurriendo a una expansión de Padè. La
expresión genérica para expandir una función f (x) es:
IO
a0 + b1 x + b2 x2 + · · · + pm xm
f (x) ≈ R(x) = (4.33)
1 + a1 x + a2 x2 + · · · + an xn
ajustando los coeficientes a partir de:
C
R(0) = f (0)
R0 (0) = f 0 (0)
C
R00 (0) = f 00 (0)
..
.
RU
R(m+n) (0) = f (m+n) (0)
Esta aproximación se puede computar con el comando pade( ).

Para aproximar la función exponencial resulta:
ST
1 + 1/2 x + 1/9 x2 + 1/72 x3 + 1/1008 x4 + 1/30240 x5 · · ·

ex ≈ (4.34)
1 − 1/2 x + 1/9 x2 − 1/72 x3 + 1/1008 x4 − 1/30240 x5 · · ·
D esto se deduce que la aproximación de Padè de primer orden para el retardo es:
N
2 − sL
e−sL ≈ (4.35)
2 + sL
O
Al igual que el retardo, esta función racional tiene ganancia unitaria en todo el espectro
de frecuencias, y da una aproximación razonable para el atraso de fase mientras la
frecuencia no sea demasiado grande, como se puede observar en la figura 4.10.
C
En la figura 4.11 se comparan las respuestas al escalón de estas aproximaciones. Puede

notarse que para el análisis de respuesta transitoria no es tan buena.
Debe destacarse que en tiempo discreto la aproximación es exacta si el retardo es un

EN
múltiplo entero del tiempo de muestreo:

L
D(z) = z − ts (4.36)
A las limitaciones para el control asociadas a las caracterı́sticas de fase no-mı́nima

debemos agregar aquellas asociadas a la incertidumbre dinámica por variación del

N
IO
C
C
Figura 4.10: Atraso de fase para el retardo de transporte (L = 1s) y sus aproximaciones mediante la expansión de Padè
RU
ST
N
O
C
EN
Figura 4.11: Respuesta al escalón para el retardo de transporte (L = 1s) y sus aproximaciones mediante la expansión de Padè

tiempo de retardo. Esta puede modelarse de forma ajustada mediante un modelo
multiplicativo global dado por:
e−(L0 +∆L) s
WL (s) = −1
e−L0 s
= e−∆L s − 1 (4.37)
Para ω = 1/∆L la incertidumbre tiene magnitud 0,7. Debido al incremento exponencial

es prácticamente imposible alcanzar un ancho de banda de este orden o mayor.
N
4.5.3. Predictor de Smith
IO
Para una planta descripta por el modelo (4.29) proponemos como esquema de control
ideal el mostrado en la siguiente figura:
C
C
RU
En este la transferencia entre entrada y salida resulta:
Y (s) C(s)G(s) −sL

= e (4.38)
R(s) 1 + C(s)G(s)
ST
Puede notarse que el retardo no aparece en la ecuación caracterı́stica de lazo cerrado,

y por lo tanto el control C(s) puede diseñarse con un modelo para la planta sin retardo
G(s).
Supongamos que contamos con un modelo nominal para la dinámica de la planta es

N
Pn (s) = Gn (s)e−sLn . Podemos obtener el control ideal propuesto en el caso nominal

(Pn (s) = P (s)) si para la realimentación en lugar de la salida usamos una predicción
de la respuesta de la planta al control sin retardo ŷ(t + Ln ) sumando a ello el error en
O
la predicción ep (t) = y(t) − ŷ(t) (siendo y(t) la salida real y ŷ(t) la predicción con el
modelo Pn (s)):
C
EN

El error de predicción en el caso ideal surge por la acción de perturbaciones sobre la
planta que no pueden incluirse en la predicción y errores en la condición inicial. En el
caso real Pn (s) 6= P (s) debemos incluir también la incertidumbre dinámica.
Si el error de predicción es nulo, la acción de control se computará con el modelo sin

retardo y la respuesta será la que se planteó en la ecuación (4.38).
N
IO
C
Para analizar lo que ocurre en el caso real vamos a computar el control equivalente
C
Ceq (s), que surge del control nominal C(s) combinado con el predictor:
RU
ST
Para llegar a esto reestructuremos el diagrama del control con predictor de la siguiente
forma:
N
O
C
EN
donde puede deducirse que:
C(s)
C 0 (s) =
1 + C(s)Gn (s)

Entonces:
C(s)
C 0 (s) 1 + C(s)Gn (s)
Ceq (s) = =
1 − C 0 (s)Pn (s) C(s)
1− Pn (s)
1 + C(s)Gn (s)
C(s)
=
1 + C(s)Gn (s) − C(s)Pn (s)
N
lo que arroja finalmente:
C(s)
Ceq (s) = (4.39)
1 + C(s) [Gn (s) − Pn (s)]
IO
que también puede escribirse como:
C(s)
Ceq (s) = (4.40)
C
1 + C(s)Gn (s) [1 − e−sLn (s)]
El compensador puede implementarse con el compensador para la planta sin retardo y el
C
predictor, o con el modelo de control equivalente; pero este último incluye internamente
un retardo (que de ser pequeño eventualmente podrı́a sustituirse por una aproximación
racional).
RU
4.5.4. Predictor de Smith Filtrado
Es importante remarcar que el predictor de Smith es su forma original no puede usarse
con plantas inestables, y no tiene buenas propiedades de robustez.
La respuesta de lazo cerrado en el caso general es:
ST
Y (s) C(s)G(s)
= e−sL (4.41)
R(s) 1 + C(s)Gn (s) + C(s) [P (s) − Pn (s)]
de donde surge la ecuación caracterı́stica de lazo cerrado:
N
1 + C(s)Gn (s) + C(s) [P (s) − Pn (s)] = 0 (4.42)
Aunque el control pueda diseñarse para que 1 + C(s)Gn (s) sea un polinomio Hurwitz
(todas sus raı́ces en el semiplano izquierdo), tendiendo en cuenta que Pn (s) 6= P (s) los
O
polos inestables de P (s) serán raı́ces en el semiplano derecho de (4.42), ya que en un

lazo internamente estables estas no pueden ser canceladas por el control.
C
Además tiene un desempeño pobre en cuanto a rechazo de perturbaciones no medidas

con dinámicas lentas de lazo abierto:
C(s)Gn (s) 1 − e−sLn (s)

Y (s)
= P (s) (4.43)
EN
Q(s) 1 + C(s)Gn (s) + C(s) [P (s) − Pn (s)]

Puede notarse que los polos lentos de P (s) también lo serán para la respuesta a la
perturbación.
Para manejar estas limitaciones se ha desarrollado el Predictor de Smith Filtrado

[JENR09], el cual consiste en agregar un filtro de robustez antes de realimentar el error
de predicción ep (t):

N
En este caso se tiene:
IO
Y (s) C(s)G(s)
= e−sL (4.44)
R(s) 1 + C(s)Gn (s) + C(s)Fr (s) [P (s) − Pn (s)]
C
Y (s) C(s)G(s) [Gn (s) − Pn (s)Fr (s)]
= e−sL (4.45)
Q(s) 1 + C(s)Gn (s) + C(s)Fr (s) [P (s) − Pn (s)]
C
La ecuación caracterı́stica de lazo cerrado es:
1 + C(s)Gn (s) + C(s)Fr (s) [P (s) − Pn (s)] = 0 (4.46)

RU
El filtro agrega el grado de libertad necesario para lograr mayor robustez y estabilidad
interna. El control C(s) se diseña igual que antes para la planta sin retardo, mientras que
el filtro Fr (s) se diseña para la respuesta ante una perturbación (ver [JENR09]).
ST
Estructuras Especiales
4.6.1. Anti-Windup
Al implementar un sistema de control que incluya acción integral es necesario considerar
N
el efecto denominado “wind-up del integrador”, e incluir formas de mitigarlo en caso que
esto pudiera ser un inconveniente.
Veamos primero cual es el problema.
O
Windup de la Acción Integral

Sabemos que la inclusión de acción integral en el lazo tiene como efecto positivo lograr
C
ganancia infinita de lazo abierto a frecuencia cero, pero esto va acompañado de un efecto
negativo que es el de introducir −900 de atraso de fase en este lazo. Sin embargo, esto
se puede manejar mediante un compensador adecuado, y con ello lograr una respuesta
aceptable de lazo cerrado.
EN
Pero la presencia de un integrador en el lazo introduce otra complicación cuando se

experimenta saturación en la acción de control, lo cual en casi todos los casos representa
un escenario no habitual pero posible.

En la siguiente figura
N
IO
C
C
RU
ST
Anti-Windup Mediante Realimentación de Salida

Es posible reestructurar el compensador para evitar incluir de forma explı́cita un
integrador, utilizando la arquitectura de la siguiente figura:
N
O
C
donde:
k∞ = lı́m K(s) , H(s) = K(s)−1 − k∞
−1
(4.47)
s→∞
Si calculamos el bloque equivalente de la parte recuadrada en celeste tenemos que:

EN
k∞ k∞ k∞
K̄(s) = = = ≡ K(s)
1

1 + k∞ H(s) 1 1
1 + k∞ − 1 + k ∞ − 1
K(s) k∞ K(s)
Podemos decir que esta estructura es equivalente al compensador original mientras no

sature la acción de control, pero cuando esto ocurra no habrá windup de la integral

porque en esta estructura no incluye ningún integrador de forma explı́cita; la acción
integral está implı́cita en la realimentación.
En la siguiente figura se observa en rojo la respuesta original con saturación en rojo y la

respuesta con anti-windup en azul:
N
IO
C
C
RU
Se puede observar que la respuesta con anti-windup no tiene sobrepaso, aun con
saturación.
ST
Esto es realizable solo si el compensador original es bipropio. Su fuese estrictamente

propio habrı́a que descomponerlo en el producto de un prefiltro con los polos en exceso
y post-multiplicarlo por el esquema de antiwindup construido con el remanente (que debe
incluir el integrador).
N
4.6.2. Control con Dos Grados de Libertad

O
Filtro de Referencia
Ya hemos mencionado en la subsección 3.4.3 que la sensibilidad complementaria T (s)
se puede ajustar mediante un filtro de referencia Fr (s) como se muestra en la siguiente
C
figura:
EN

Es evidente que:
Y (s) Y (s)
= Fr (s) = Fr (s)T (s)
R(s) R̄(s)
Podemos incluir polos en el filtro para cancelar los ceros de T (s) cercanos al origen y
evitar sobrepasos excesivos; aunque igualmente implicará una reducción en el ancho de
banda para el seguimiento de la referencia.
Pero debe notarse que el filtro no es parte del lazo cerrado, y por lo tanto no tiene ningún
N
efecto sobre las sensibilidades para las otras entradas del sistema.
Pre-Alimentación de Referencias y Perturbaciones
IO
C
Control en Cascada
C
RU
ST
N
O
C
EN

EN
C
O
N
ST
RU
C
C
IO
N
N
5
IO
C
Realimentación de Estado
C
RU
ST
N
O
C
EN
121
Figura 5.1: regulador por realimentación de estados
Introducción
N
Supongamos que contamos con un modelo de estados para describir la dinámica del
proceso a controlar:
IO
ẋ = Ax + Bu + Bv v (5.1)
donde x ∈ Rn , u ∈ Rm es la acción de control y v ∈ Rp es el vector de perturbación.
Un control por realimentación de estados es aquel en el cual el vector de control u surge
de un mapeo estático del vector de estados x. En el caso lineal:
C
u = −Kx (5.2)
C
donde K ∈ Rm×n es la denominada matriz de realimentación de estados.
Obtenemos la dinámica de lazo cerrado reemplazando (5.2) en (5.1):
RU
ẋ = [A − BK] x + Bv v (5.3)
La dinámica de lazo cerrado queda definida por la matriz:
Ā = [A − BK] (5.4)
ST
Esto puede plantearse también para sistemas que varı́an en el tiempo (caso en el cual
las matrices en (5.1) dependen explı́citamente de t).
Con este planteo tenemos un regulador que en ausencia de perturbaciones (v = 0)

llevará el estado a su condición de equilibrio x = 0, si elegimos K de forma tal que
N
todos los autovalores de Ā tengan parte real negativa.

Esto es posible si el sistema es completamente controlable, o bien si los modos no
controlables son estables.
O
Controlabilidad
C
Formalmente se dice que “un sistema es completamente controlable en tiempo t0 si

por medio de un vector de control no restringido es posible transferir el sistema desde
cualquier estado inicial x(t0 ) a cualquier otro estado en un tiempo finito”.
Si el sistema es invariante en el tiempo, el instante t0 para el cual se plantea el análisis
EN
es irrelevante.
Para entender que significa esto vamos a considerar que significa que el sistema no sea
completamente controlable.

Supongamos por ejemplo el caso de una vehı́culo propulsado por un cohete para el cual
solo tenemos control de la dirección del vector de empuje (TVC: Thrust Vector Control),
como se ilustra en la figura 5.2a, pero no de su magnitud. Por simplicidad consideremos
el análisis en un plano.
Al desviar el empuje se produce un momento respecto del CG que permite cambiar la

actitud θ del vehı́culo.
N
θ̇ = ω
l
ω̇ = T sin δ
J
IO
Por otra parte, para la posición respecto de una terna geográfica:
ẋ = u
C
ż = w
T
u̇ = fx , fx = sin (θ + δ)
m
C
T
ẇ = fz − g , fz = cos (θ + δ)
m
RU
Linealizando para θ ≈ 0:
        

 ẋ  0 0 0 1 0 0  x  0  0 
 ż       
0 0 0 0 1 0 z 0 0 
  
 
 
 
 
 
 

       
   0
     
θ̇ 0 0 0 0 1 θ 0 0
      
=
0 + δ +
u̇  0 f 0 0 0 
 u  f 0 
ST

    
     
ẇ
0 0 0 0 0 0  w 0 f − g

 
 
 
 
 
 
  
  
  
  
  

ω̇ 0 0 0 0 0 0 ω τ 0
    
donde f = T /m es el empuje especı́fico (fuerza por unidad de masa) y τ = lT /J .

N
Si la acción de control es unicamente δ , el sistema no es completamente controlable.

Podemos notar que con esta única acción de control podemos afectar de forma directa
a la velocidad vertical y a la angular. Esto a su vez por acoplamiento dinámico impactará
O
de forma indirecta en la actitud y en la posición lateral.

Pero no podemos hacer nada para modificar la altura y su derivada.
C
En casos como este, mediante una transformación T adecuada, podemos separar la

dinámica en una parte controlable y otra que no lo és:

ẋc Ac Acu xc Bc
EN
= + u
ẋu 0 Au xu 0
donde xc = {x, θ, u, ω} son los estados controlables y xu = {z, w} son los no

controlables (no incluimos las perturbaciones porque no es relevante para este análisis).
El bloque nulo en la matriz de entrada indica que no hay efecto directo del control u
sobre ẋu , mientras que el bloque nulo en la matriz dinámica de debe al desacoplamiento

N
IO
C
(a) (b)
C
dinámico de xu respecto de xc (que sı́ es afectado por el control), por lo cual tampoco
hay efecto indirecto.
RU
El sistema serı́a completamente controlable si podemos manipular el empuje del motor
T , con lo cual la parte inferior de la matriz de entrada no serı́a nula.
Matriz de Controlabilidad
Se puede demostrar que un sistema es completamente controlable si y solo si la matriz:
ST
B | AB | A2 B | · · · | An−1 B

(5.5)
es de rango n, siendo esta la dimensión del vector de estados.

N
Para el ejemplo anterior planteamos:

f = 15;
r = 100; % v a l o r a r b i t r a r i o
O
A = [ zeros ( 3 ) eye ( 3 ) ; zeros ( 3 , 6 ) ] ; A ( 4 , 3 ) = f ;

B = [0 0 0 f 0 r ] ’ ;
C
rank ( c t r b ( A , B ) )
lo cual arroja como resultado un valor 4, lo cual se corresponde a los cuatro estados
controlables antes mencionados.
EN
Regulación y Seguimiento de Referencias

Para el problema del regulador, a partir del lazo abierto (5.1) el modelo de lazo cerrado
serı́a:
ẋ = [A − BK] x + Bv v (5.6)
En este las entradas son las perturbaciones.

Figura 5.3: servo-sistema por realimentación de estados
Si queremos que nuestro regulador además siga referencias (convertirlo en un
N
servosistema), podemos llevar el origen del espacio de estados al estado de referencia
deseado, lo cual equivale a realimentar la diferencia entre el estado original y el de
referencia, en lugar de usar el vector de estados directamente:
IO
u = −K [x − xr ]
Si solo nos interesa un subconjunto de la variables de estado, para el estado de
referencia podemos plantear una relación de la forma:
C
xr = Br r
donde Br será una matriz con valores nulos para los estados no relevantes. Podrı́a
C
inclusive plantearse una ecuación de salida para definir las variables de interés y a partir
de esto definir Br :
RU
y r = Cr x , Br = C+
r
donde C+
r es la “pseudo-inversa” de Cr .
Con un vector de referencias la realimentación de estados tomará la forma:
u = −K [x − Br r]
ST
Sustituyendo en el modelo de lazo abierto obtenemos para el lazo cerrado:
ẋ = [A − BK] x + [BKBr ] r + Bv v (5.7)

N
Supongamos que planteamos el control de actitud θ en un plano para el ejemplo

precedente usando el modelo:
O
θ̇ = ω
l
ω̇ = T sin δ
J
C
Tomando u = sin δ :

θ̇ 0 1 θ 0
= + u
EN
ω̇ 0 0 ω T l/J
Con una referencia r para el ángulo de cabeceo θ:

r 1
xr = θ = Br rθ → Br =
0 0

N
Figura 5.4: servo-sistema por realimentación de estados con acción integral
IO
Acción Integral
En la realimentación de estados es posible incluir acción integral expandiendo el vector
de estados.
Si tenemos un vector de referencias r para ciertas salidas y r = Cr x, podemos definir
C
el error de seguimiento como:
er = r − y r = r − Cr x
C
Si agregamos al modelo una nueva variable de estado:
RU Z t
ζ= er dτ
0
El estado expandido resulta:

ẋ A 0 x B 0 u
= +
ST
ζ̇ −Cr 0 ζ 0 I r
En equilibrio ζ̇ = er = 0, por lo cual cualquier realimentación que estabilice el modelo

aumentado garantiza error nulo en estado estacionario.
La acción de control puede escribirse como:
N

x
u = Kp Ki
ζ
O
donde Ki es la matriz de ganancias para la acción integral, mientras que Kp es la matriz

de ganancias para la acción proporcional.
C
5.1.1. Ubicación de Polos

Una forma de definir la matriz de ganancias para una realimetación de estados lineal es
la ubicación de polos. Si se tiene un sistema (5.1) completamente controlable, siempre es
EN
posible elegir K tal que la matriz dinámica de lazo cerrado (5.4) tenga cualquier conjunto
de autovalores que se desee.
Esto es muy simple para una planta de segundo orden con una acción de control escalar:

ẋ1 a a12 x1 b
= 11 + 1 u
ẋ2 a21 a22 x2 b2

En este caso n = 2 y m = 1, por lo cual la matriz de realimentación de estados será de
1 × 2. La ley de control es:

x1
u = − k1 k2
x2
La dinámica de lazo cerrado resulta:

a11 a12 b a a12 b k b1 k 2
− 1 k1 k2 = 11 − 1 1

Ā = [A − BK] =
a21 a22 b2 a21 a22 b2 k 1 b2 k 2
N

a − b1 k1 a12 − b1 k2
= 11
a21 − b2 k1 a22 − b2 k2
IO
Los polos de lazo cerrado son los autovalores de Ā, es decir, las raı́ces de su ecuación
caracterı́stica:

sI − Ā = s + b1 k1 − a11 b1 k2 − a12

C
b2 k1 − a21 s + b2 k2 − a22
= (s + b1 k1 − a11 ) (s + b2 k2 − a22 ) − (b1 k2 − a12 ) (b2 k1 − a21 )
C
= s2 + (b1 k1 + b2 k2 − a11 − a22 ) s − (b1 k2 − a12 ) (b2 k1 a21 )
Si elegimos n = 2 polos de lazo cerrado p1 y p2 , la ecuaciób caracterı́stica de lazo

RU
cerrado deberı́a ser:
(s − p1 ) (s − p2 ) = s2 − (p1 + p2 ) s + p1 p2
Igualando obtenemos un sistema de dos ecuaciones para ajustar las dos ganancias de
la matriz de realimentación de estados:
ST
b1 k1 + b2 k2 = a11 + a22 − (p1 + p2 )

(b1 k2 − a12 ) (b2 k1 − a21 ) = p1 p2
Control Escalar - Forma Canónica Controlable

N
El cómputo de las ganancias de realimentación para el caso de una acción de control

escalar es simple si el modelo de estados se expresa en la forma canónica controlable.
Por ejemplo, para el caso de segundo orden la forma canónica controlable serı́a:
O

ż1 0 1 z1 0
= + u
ż2 a1 a2 z2 b
C
en donde a1 y a2 son los coeficientes del polinomio caracterı́stico de la matriz dinámica:
A(s) = s2 + a1 s + a2
EN
Para esta forma, el polinomio de lazo cerrado con realimentación de estados [k1 k2 ]
resulta:
Alc (s) = s2 + (a1 + k2 ) s + (a1 + k2 )
Si el polinomio deseado es:
Ar (s) = s2 + α1 s + α2

igualando ambas expresiones tenemos para la realimentación de estados:
k2 = α1 − a1
k1 = α2 − a2
Esto se puede extender a cualquier caso de orden n.
kn = α1 − a1
kn−1 = α2 − a2
..
N
.
k2 = αn−1 − an−1
IO
k1 = αn − an
Como se detalla en [? , cap.10, p. 831], la transformación Tc para llevar cualquier
matriz arbitraria a la forma canónica controlable puede obtenerse mediante la siguiente
composición:
C
Tc = MW (5.8)
donde M se construye de la siguiente forma:
C
M = B | AB | A2 B | · · · | An−1 B

(5.9)
donde B es una matriz columna (en este caso arbitraria pero no nula); y la matriz T se
RU
construye de la forma:
 
an−1 an−2 ··· a1 1
an−2
 an−3 ··· 1 0 
W =  ... .. .. .. .. 
(5.10)

 . . . .
 a1 1 ··· 0 0
ST
1 0 ··· 0 0
siendo ak los coeficientes del polinomio caracterı́stico de la matriz A:
|sI − A| = s2 + a1 sn−1 + +a2 sn−2 + · · · + an−1 s + an (5.11)
N
La realimentación de estados K̂ computada para la forma canónica se puede llevar a la

definición original del vector de estados mediante la transformación inversa:
u = K̂z = K̂T−1 x → K = K̂T−1
O
(5.12)
Para el caso de acción de control escalar existe una orma alternativa para este cómputo
denominada formula de Ackermann [Oga10, p. 730].
C
Control Vectorial
En el caso de que el control no sea escalar existen infinitas soluciones para el problema
de la asignación de polos.
EN
En algunos casos es posible obtener soluciones imponiendo relaciones entre las

diferentes componentes del vector de control (por ejemplo, cuando se dan condiciones
de simetrı́a).
Para el caso general podemos usar el comando place(), que implementa el algoritmo
definido en [KND]. En este se aprovechan los grados de libertad en exceso para mejorar
la robustez del lazo minimizando la sensibilidad del lazo cerrado a variaciones en las
matrices de la ecuación de estados.

5.1.2. Control Optimo Cuadrático
Una estrategia muy usada en el campo aeroespacial es la del control óptimo cuadrático.
Antes de avanzar en el tema se debe advertir que la palabra ”óptimo” deberı́a
descartarse del vocabulario del ingeniero, dado que tal concepto indefectiblemente se
torna abstracto en cualquier aplicación práctica, y en general solo es aplicable en el
campo de las matemáticas.
El control óptimo no produce estrategias ”insuperables” desde el punto de vista práctico
como su nombre podrı́a sugerir, dado que tal cosa es imposible de cuantificar. Lo que
N
ofrece es una herramienta que se usa de forma iterativa para obtener soluciones con un
balance adecuado entre ”velocidad de respuesta” y ”esfuerzo de control”, lo cual resulta
generalmente en soluciones ”robustas”.
IO
Índice de Desempeño Cuadrático
Como en todo problema de optimización, la cuestión central es la de definir un ı́ndice
de desempeño adecuado. Este debe ser una cantidad definida positiva que resulte
C
fı́sicamente significativa y matemáticamente tratable.
En control automático el objetivo general es el de llevar la planta a una determinada
condición estacionaria con el menor esfuerzo posible. Esto puede cuantificarse mediante
C
un ı́ndice de desempeño cuadrático de la forma:
Z t
xT Qx + uT Ru dt

RU
J(t) = (5.13)
0
en donde las matrices Q y R deben ser definidas positivas1 .
Realimentación Óptima para el Caso Lineal

ST
Para un modelo lineal de la forma:
ẋ = Ax + Bu (5.14)
en el caso general con horizonte infinito (t → ∞) la ley de control óptima es de la forma:

N
u = −Kx
siendo:
O
K = R−1 BT P (5.15)
donde la matriz P es solución de la siguiente ecuación algebraica de Ricatti:
C
h i
AT P + PA − P BR−1 BT P + Q = 0 (5.16)
EN
1 Una matriz H es positiva definida si la forma cuadrática V (x) = xT Hx > 0 ∀x 6= 0. Esto se cumple si es real simétrica
con todos sus menores principales son positivos (y en consecuencia todos sus autovalores son positivos)

Si sustituimos la realimentación de estados en el ı́ndice de desempeño cuadrático (5.21)
tenemos:
Z t
J(t) = xT Qx + xT KT RKx dt
0
Z t
= xT Q + KT RKx dt
0
N
El término entre paréntesis es una forma cuadrática que podemos reescribir de la
siguiente forma:
IO
d
xT Q + KT RK x = − xT Px (5.17)
dt
Con lo cual:
J(t) = −xT Px (5.18)
C
Desarrollando el lado derecho de la ecuación (5.17), y teniendo en cuenta que a lazo
cerrado ẋ = (A − BK) x:
C
d T
− x Px = −ẋT Px − xT Pẋ
dt
RU
T
= −xT (A − BK) Px − xT P (A − BK) x
h i
T
= −xT (A − BK) P + P (A − BK) x
Sustituyendo en (5.17) vemos que:

T
(A − BK) P + P (A − BK) = − Q + KT RK (5.19)
ST
Como el lado derecho es una matriz negativa definida (el término dentro del paı́s por
definición es positivo definido) y el lazo cerrado es estable, esta ecuación de Liapunov
tiene una solución P positiva definida.
Por otra parte, como R es una matriz real simétrica, se puede escribir como R = TT T,
N
y con esto:
T
(A − BK) P + P (A − BK) + Q + KT TT TK = 0
O
desarrollando y reagrupando:
h i
AT P + PA + Q + KT TT TK − KT BT P − PBK = 0
C
La parte que depende de la realimentación de estados es el término entre corchetes,

que se puede expresar como:
T
EN
−1 −1
T T T T
TK − T B P TK − T B P
Sustituyendo en (5.18) se deduce que K debe minimizar la expresión:

−1 T −1
xT TK − TT BT P TK − TT BT P x

ya que los otros términos no dependen de K. Como se trata de una cantidad positiva
definida, el mı́nimo posible es 0. Para lograr el valor nulo:
−1 −1
TK − TT BT P = 0 → K = T−1 TT BT P = R−1 BT P
que es lo expresado por la ecuación (5.15). Sustituyendo (5.19) se obtiene la expresión

(5.15).
N
En la práctica los coeficientes en las matrices del ı́ndice de desempeño suelen ser
arbitrarios, dado que en general no hay razones sólidas para establecerlos. Pero si
IO
hay criterios para ajustarlos de forma iterativa hasta alcanzar una solución satisfactoria;
entendiendo esto último como lazos cerrados robustos que muestren respuestas rápidas
a los desequilibrios con acciones de control dentro del rango admisible.
C
Selección de las Matrices para el Índice de Desempeño
Si Q y R son matrices diagonales con coeficientes qj , j = 1 : n y rj , j = 1 : m
respectivamente, el ı́ndice será de la forma:
C
Z t
q1 x21 + q2 x22 + · · · + qn x2n + r1 u21 + r2 u22 + · · · + rn u2n dt

J(t) =
RU
0
= q1 I12 + q2 I22 + · · · + qn In2 + r1 J12 + · · · + r1 Jm
2
(5.20)
donde hemos usado las siguientes sustituciones:

Z t Z t
Ik2 = x2k dt , Jk2 = u2k dt (5.21)
ST
0 0
El mı́nimo se alcanza cuando todos los sumandos qk Ik2 y rk Jk2 en (5.20) son iguales, lo
que pone en evidencia el balance entre desequilibrio (x 6= 0) y acción de control (u 6= 0)
que se alcanza minimizando este ı́ndice.
N
Podemos partir considerando matrices diagonales con coeficientes inicializados en

función de los valores máximos que se espera tomen las variables de estado y las
O
acciones de control en situaciones normales (amplitudes máximas esperables en los

estados y lı́mites por actuación máxima para las acciones de control):
1 1
C
qj = , rj = (5.22)
|xj |2max |uj |2max
Estas reglas fueron propuestas por Bryson y Ho en 1975. Si en el modelo (5.14)

los vectores x y u son normalizados con los valores mencionados, Q y R serı́an
EN
inicializadas como diagonales unitarias.

Para la aplicación de la sı́ntesis LQR podemos partir de los valores iniciales dados por
la regla de Bryson, calcular una primer matriz de realimentación óptima con (5.16) y
(5.15), y luego evaluar la respuesta de lazo cerrado resultante (en general tomando una
condición inicial de desequilibrio razonable). En función de este resultado se reajustan
los coeficientes, y se repite el procedimiento de forma iterativa hasta lograr una respuesta
adecuada.

En cada iteración deberı́amos verificar si la respuesta de lazo cerrado cumple con las
expectativas. Probamos esto viendo la respuesta a una condición inicial con un error en
el lı́mite de la tolerancia, verificando que la respuesta resultante resulte bien amortiguada
sin exigir acciones de control superiores a los lı́mites e actuación máxima:
% Supongamos que est án d e f i n i d a s l a s m a t r i c e s d e l modelo

% de l a p l a n t a [ A B ; C D ]
M = ss ( A , B , C, D ) ;
N
Q = diag ( [ ... ]);
R = diag ( [ ... ]);
IO
K = l q r (M, Q, R ) ;
% Lazo c e r r a d o
% Deberı́amos c o n t a r con una m a t r i z Br para mapear l a s r e f e r e n c i a s
% a l o s estados , aunque para e l comando ’ i n i c i a l ’ l a m a t r i z B
C
% es i r r e l e v a n t e
Ac = A − B∗K ;
Bc = K∗ Br ;
C
% Ecuaci ón de s a l i d a , que muestre l o s estados r e l e v a n t e s para
% e l problema y l a s acciones de c o n t r o l
RU
Cc = [ Br ’ ; −K ] ;
Dc = zeros ( s i z e ( Cc , 1 ) , s i z e ( Bc , 2 ) ) ;
LC = ss ( Ac , Bc , Cc , Dc ) ;
xo = [ . . . . ] ; % c o n d i c i ó n i n i c i a l
ST
i n i t i a l ( LC , xo ) ;
Luego podemos calcular la ubicación de polos de lazo cerrado y las funciones de

sensibilidad que resulten relevantes.
N
Observador de Estados
O
5.2.1. Observador de Luenberger

Observador de Orden Completo
C
Consideremos nuevamente un modelo de estados lineal para la planta, pero ahora con
su correspondiente ecuación de salidas:
ẋ = Ax + Bu + Bv v (5.23)
EN
y = Cx + Du + η (5.24)
Si y 6= x, podemos obtener una estimación del estado x̂ construyendo un sistema

paralelo que responda con la misma dinámica del modelo anterior, en el cual todas las
variables de estado estén accesibles; al cual llamaremos estimador:
x̂˙ = Ax̂ + Bu

Este podrı́a ser por ejemplo un circuito analógico que responda con la misma esta
dinámica de la planta, y por lo tanto podrı́amos suponer que su estado interno x̂(t)
evolucionará de la misma forma que el estado de la planta x(t).
Si embargo solo podremos decir que x̂ ≈ x si se cumplen las siguientes condiciones:
En el instante inicial x̂(0) = x(0)

Las perturbaciones no medibles son nulas (v = 0)
El modelo utilizado para la estimación es exacto
N
En algunos casos lo primero puede realizarse (un ejemplo son los navegadores
inerciales), pero los puntos restantes rara vez se verifican
IO
Podemos notar que existen discrepancias entre el estimador y la realidad es evaluar con
la estimación lo que se deberı́a medir y comparar esto con la medición real:
C
ŷ = Cx̂ + Du
La solución para el error de del estimador consiste en agregar un término de corrección
C
proporcional a la diferencia y − ŷ :
x̂˙ = Ax̂ + Bu + L (y + η − ŷ)

RU
ŷ = Cx̂ + Du
Esta es la estructura del observador de estado completo propuesto por David Luenberger
en 1966. Veamos si con esto es posible lograr que la estimación converja al estado real.
Definimos el error de estimación como:

ST
e = x − x̂
La dinámica de este error será:
ė = ẋ − x̂˙
N
Sustituyendo:
O
ė = Ax + Bu + Bv v − Ax̂ − Bu − L (y + η − ŷ)
= A (x − x̂) − Ax̂ + Bu − LC (x − x̂) + Bv v + LCη
C
ė = [A − LC] e + Bv v + LCη (5.25)
Se puede elegir la ganancia del observador para ajustar la matriz dinámica del error de
EN
estimación, y con ello asegurar que este error converga a su condición de equilibrio lo
suficientemente rápido.
Ajustar la dinámica del error de estimación es equivalente a diseñar una realimentación
de estados para el denominado sistema dual, definido como:
ż = AT z + CT v (5.26)
T
v = −L z

En este caso la acción de control no es real, y por lo tanto no estarı́a limitada. Sin
embargo, si se ajusta para lograr una dinámica muy rápida, el modelo deberá ser válido
en un rango de frecuencia muy amplio. Por lo tanto la velocidad de error de estimación
estará limitada por la incertidumbre dinámica del modelo utilizado.
Esta realimentación de estados puede resolverse de forma arbitraria si el sistema dual

es completamente controlable. Sin embargo, se trata de un problema ficticio, en donde
la acción de control no es real. Si embargo la controlabilidad del sistema dual implica
algo que sı́ tiene relación con la fı́sica del problema, que es lo que denominamos
N
observabilidad.
Observabilidad
IO
Se dice que “un sistema es completamente observable si cualquier estado x(t0 ) puede
ser determinado a partir de la observación de la salida y(t) durante un intervalo de
tiempo finito t0 ≤ t ≤ t1 ”.
Si el sistema es invariante en el tiempo, el instante t0 para el cual se plantea el análisis
C
es irrelevante.
En [Zum, sec.2.2.4, p. 60] se realiza un análisis de los ceros de la matriz de transferencia.
C
Entre los conceptos mencionados se destaca que en algunos casos existen modos
naturales del proceso que no son visibles a través de las salidas disponibles. En estos
RU
casos decimos que el sistema no es completamente observable, porque al menos una
parte del estado no afecta las salidas y por lo tanto no puede reconstruirse.
Esto tiene que ver con la dinámica de la planta (a través de la matriz A) y de la relación
entre los estados y las variables medidas (a través de la matriz C).
Al igual que con la controlabilidad, en el caso de observabilidad de orden reducido es
posible separa el estado en una parte observable y otra que no lo es.
ST
Matriz de Observabilidad
Se puede demostrar que un sistema es completamente observable si y solo si la matriz:
 
C
N
 CA 
CA2
 
(5.27)
 
 
..
O
 
 . 
n−1
CA
C
es de rango n, siendo esta la dimensión del vector de estados. Se puede verificar que
la matriz de observabilidad es equivalente a la controlabilidad del sistema dual dado por
(5.26).
EN
Un ejemplo clásico de sistema no observable es el de la navegación inercial.

Supongamos por simplicidad que se desea conocer la posición de un móvil a partir de la
medición de su aceleración en coordenadas inerciales (algo posible si los acelerómetros
se montan en una plataforma giro-estabilizada). En este caso se tendrı́a:

ṗ 0 I p 0
= + u
v̇ 0 0 v I

p
y= 0 0 +u
v
A = [ zeros ( 3 ) eye ( 3 ) ; zeros ( 3 , 6 ) ] ;
N
C = zeros ( 3 , 6 ) ;
rank ( obsv ( A ,C ) )
IO
lo cual arroja como resultado un valor 0, lo cual indica que ninguno de los estados
es observable. Es cierto que la velocidad puede obtenerse integrando la aceleración,
y mediante una nueva integración obtener la posición; pero en este proceso nunca se
puede reconstruir la posición y velocidad inicial a partir de las mediciones.
C
Observador de Orden Reducido
C
Cuando algunas de las variables de estado son accesibles, es posible diseñar un
observador para estimar solo aquellos estados no medibles.
Para ello se puede realizar una transformación T para separar los estados medibles de
RU
aquellos que no lo son:

F y
x̂ =
T z
ż = Fz + TBu + Ly
ST
La matriz F ∈ R(n−q)×(n−q) se elige de forma arbitraria pero con autovalores en el

semiplano izquierdo, siendo q la dimensión del vector de salidas. Con esta se elige una
matriz L ∈ R(n−q)×q tal que el par {F, F} sea controlable. Con estas dos matrices se
determina la matriz de transformación T como solución de la ecuación LA − FL = LC.
N
Si la matriz {C T}T resulta singular hay que realizar una nueva elección de L, dado que
para la estimación necesitamos contar con su inversa.
O
El Observador como Filtro

en la ecuación (5.25) se observa que ese mismo ruido de medición afecta directamente
a la derivada del error. Por lo tanto, el efecto sobre el error de estimación estará filtrado
C
por la dinámica del error definida por Ae = A − LC. Esto resulta más eficiente que
un filtro SISO, dado que la medición se combina con la predicción, permitiendo utilizar
mayor información a la hora de filtrar las mediciones.
EN
Esto ofrece un fuerte argumento para utilizar un observador, aun en aquellos casos en
que todo el estado es medible. La contraparte es que los efectos de la perturbación
también serán filtrados con esta misma dinámica, introduciendo cierto atraso para el
rechazo de perturbaciones.

Observador en Tiempo Discreto
En tiempo discreto implementamos el observador de Luenberger utilizando el modelo de
tiempo discreto para la dinámica de la planta:
xk = Fxk−1 + Guk−1
El observador serı́a:
x̂k = Fx̂k−1 + Guk−1 + L (y h − ŷ)
Si queremos usar y h = y k necesitamos computar ŷ k , pero para eso necesitamos x̂k .
N
Esto hace el cómputo engorroso. Veremos dos opciones:
IO
Observador de Predicción Lo más simple consiste en usar la medición del instante
de muestreo previo para el término de corrección:

x̂k = Fx̂k−1 + Guk−1 + L y k−1 − ŷ k−1
C
El problema en este caso es que existe un retardo de un intervalo de muestreo en la
propagación de la medición.
La dinámica del error estará dada por:
C
ek = xk − x̂k = Fxk−1 + Guk−1 − [Fx̂k−1 + Guk−1 ]
− L (Cxk−1 + Duk−2 − Cx̂k−1 − Duk−2 )
RU
= F (xk−1 − x̂k−1 ) − LC (xk−1 − Cx̂k−1 )
Resultando que:
ek = (F − LC) ek−1
Vemos que matemáticamente esto es análogo al planteo en tiempo continuo, y como en
ST
ese caso puede resolverse como realimentación de estados de un sistema dual.
Observador Actual Para usar la medición actual k podemos usar una estimación “a
priori” del estado actual sin usar el término de corrección para computar la medición
esperada:
N
x̂−
k = Fx̂k−1 + Guk−1
ŷ − −
k = Cx̂k + Duk−1
O
−
x̂k = x−

k − L y k − ŷ k
El error de predicción resulta:

C
ek = xk − x̂k = Fxk−1 + Guk−1 − [Fx̂k−1 + Guk−1 ]

− L Cxk + Duk−1 − Cx̂−

k − Duk−1
= F (xk−1 − x̂k−1 ) − L [Cxk − C (Fx̂k−1 + Guk−1 )]
EN
= Fek−1 − L [C (Fxk−1 + Guk−1 ) − C (Fx̂k−1 + Guk−1 )]

= (F − LCF) ek−1
Por lo tanto:
ek = (F − LCF) ek−1
Este caso también puede resolverse como realimentación de estados de un sistema
dual, pero en este caso con B = FT CT .

5.2.2. Realimentación de Estados Observados
Al realimentar estados observados se tendrá para el vector de control:
u = Kx̂
Por lo tanto la dinámica de lazo cerrado será la combinación de la de lazo abierto con la
realimentación de estados precedente y la ecuación del observador:
ẋ = Ax + Bu
N
˙ = Ax̂ + Bu + L (y − ŷ)
x̂
u = Kx̂
y = Cx + Du
IO
ŷ = Cx̂ + Du
Sustituyendo:
ẋ = Ax − BKx̂
C
˙ = [A − BK] x̂ + LC (x − x̂)
x̂
C
o bien:
ẋ A −BK x
˙ = LC
x̂ A − BK − LC x̂
RU
Para tener una visión más clara de este resultado realizamos un cambio de coordenadas,
teniendo en cuenta que por la definición del error de estimación:
e = x − x̂ → x̂ = x − e
Entonces podemos replantear la dinámica de lazo cerrado como:
ST

ẋ A − BK BK x
=
ė 0 A − LC e
El polinomio caracterı́stico para esta dinámica es:
Alc (s) = |sI − (A − BK)| |sI − (A − LC)|
N
Vemos entonces que los autovalores o polos de lazo cerrado son los de la realimentación
de estados reales combinados con los de la dinámica del error de estimación. Por lo tanto
O
el diseño de la realimentación de estados y el del observador son independientes entre

sı́.
Naturalmente se deberı́a procurar que la dinámica de lazo cerrado esté dominada por
C
los autovalores de A − BK, por lo cual el error de estimación deberı́a ser en general
más rápido.
5.2.3. Filtro de Kalman

EN
Estimación Óptima
Sean dos estimaciones x1 y x2 de una variable real x con error n1 y n2 de media nula y
varianza v1 y v2 respectivamente:
E n21 = v1

x1 = x + n1 , E {n1 } = 0 ,
E n22 = v2

x2 = x + n2 , E {n2 } = 0 , (5.28)

Asumimos que los errores no están correlacionados entre sı́:
E {n1 n2 } = 0 (5.29)
Proponemos combinar ambas estimaciones para obtener una más precisa:
x̂ = αx1 + βx2 , β =1−α
El error de estimación será:
e = x̂ − x
N
El valor medio de este error es nulo, como ocurre con las estimaciones originales:
E {e} = E {x̂} − E {x}
= αE {x1 } + βE {x2 } − x
IO
= [α + β − 1] x + αE {n1 } + βE {n2 }
=0
La varianza serı́a por definición:
C
n o
2
E e = E (x̂ − x) = E x̂2 + E x2 − 2E {x̂x} = E x̂2 + x2 − 2xE {x̂}
2
C
Expandiendo el cuadrado de la estimación:
x̂2 = α2 x21 + β 2 x22 + 2αβx1 x2
RU
= α2 x2 + n21 + 2xn1 + β 2 x2 + n22 + 2xn2 + 2αβ x2 + (n1 + n2 ) x + n1 n2

= α2 + β 2 + 2αβ x2 + α2 n21 + β 2 n22 + 2 α2 n1 + β 2 n2 + αβ (n1 + n2 ) x + 2αβn1 n2

2
= (α + β) x2 + α2 n21 + β 2 n22 + 2α (α + β) xn1 + 2β (α + β) xn2 + 2αβn1 n2
= x2 + α2 n21 + β 2 n22 + 2 (αn1 + βn2 ) x + 2αβn1 n2
ST
El valor esperado de este cuadrado serı́a:

E x̂2 = x2 + α2 E n21 + β 2 E n22 + 2 (αE {n1 } + βE {n2 }) x + 2αβE {n1 n2 }

= x2 + α2 E n21 + β 2 E n22

en donde se han tenido en cuenta lo planteado en (5.28) y (5.29).

N
2
E e2 = α2 v1 + (1 − α) v2 = α2 (v1 + v2 ) − 2αv2 + v2

Buscamos el valor de α que minimice la varianza de la estimación:

O

∂E e2 v2
= 2α (v1 + v2 ) − 2v2 = 0 → α=
∂α v1 + v2
C
con lo cual:
v1 v2
E e2 = v̂ =

v1 + v2
que es la media geométrica de las varianzas originales.
EN
Puede notarse que:

v̂ v̂
α= , β=
v1 v2
Esto se puede aplicar de forma recursiva para incluir mediciones adicionales. Con tres
muestras:
v 1 v2 v 3 v̂ v̂ v̂
E e2 =

, α= , β= , γ=
v1 v2 + v2 v3 + v1 v3 v1 v2 v3

Varianza en el caso de Vectores
covarianza La covarianza es el valor esperado de la desviación simultánea de dos
variables aleatorias respecto de sus valores medios:
cov(x, y) = E {(x − x̄) (y − ȳ)} = E {x · y} − x̄ȳ (5.30)
Cuando las variables son vectores de media nula:
cov(x, y) = E x y T

(5.31)
N
lo cual da como resultado una matriz simétrica. En el caso de un único vector, la varianza
es la matriz de covarianza dada por:
IO
cov(x) = E x xT

(5.32)
en donde los elementos de la diagonal se corresponden a las varianzas de cada

componente del vector; y los elementos restantes corresponden a covarianzas entre
C
las diferentes componentes del vector.
Si no hay relación estadı́stica entre las diferentes componentes, los elementos no
diagonales serán nulos. Es fácil por lo tanto intuir el significado de los autovalores y
C
autovectores de dicha matriz.
propagación Veamos como computar la covarianza de un vector luego de aplicar un

RU
operador matricial:
y = Ax , cov(x) = P
Considerando la definición de covarianza:

n o n o
ST
T
cov(y) = E y y T = E Ax [Ax] = E Ax xT AT = APAT

(5.33)
Estructura del Filtro

Para implementar una realimentación de estados se requiere de un proceso de
observación, aun cuando todo el estado sea medible. Incluso debe notarse que el
N
proceso de observación no es un simple accesorio de la realimentación de estados,

sino que trasciende incluso el campo del control automático.
Es conocido el hecho de que la sı́ntesis de un observador puede plantearse como el
O
control de un sistema dual, pero conceptualmente el objetivo del diseño es diferente.

Más allá de estas consideraciones, el proceso equivalente de la sı́ntesis LQR para el
observador es el filtro de Kalman.
C
Sea el modelo lineal:
ẋ = Ax + Bu + Bw w (5.34)
EN
y = Cx + Du + v (5.35)
en donde x ∈ Rn , u ∈ Rm y y ∈ Rl . Los vectores w ∈ Rw y v ∈ Rl son ruidos

blancos gausianos con media nula; denominados ruido de proceso y ruido de medición
respectivamente:
w = N (0, W) , v = N (0, R)

donde N (y, Y) denota un proceso aleatorio con función de densidad de probabilidad
normal de valor medio y y matriz de covarianza Y .
El último término del lado derecho de (5.34) se puede sustituir por un vector w̄ =
Bw w ∈ Rn . La covarianza para w̄ será:

T
E w̄w̄T = E Bw w [Bw w] = E Bw wwT BTw

= Bw E wwT BTw = Bw WBTw = Q

El objetivo es obtener la mejor estimación en función de Q y R, entendido esto como la
N
minimización de la covarianza en el error de estimación P:
e = x − x̂ = N (0, P)
IO
En general este algoritmo se implementa en tiempo discreto:
C
xk+1 = Fxk + Guk + w̄k
y k = Cxk + Duk + v k
C
donde F y G son las matrices del modelo de tiempo discreto:
n o Z ts
−1 −1
F = Φ(ts) = L [sI − A] , G= Φ(t − τ )B dτ
RU
t=ts 0
Para tiempo discreto Q = Gw WGTw .
El proceso de observación normalmente se implementa en un primer paso de predicción:
x̂−
k+1 = Fx̂k + Guk
ST
Esta predicción será más incierta que la estimación previa x̂k debido a los ruidos de
proceso que no pueden incluirse en esta etapa por ser desconocidos.
La covarianza de dicha estimación a priori x̂−
k+1 será:
P− T
k = FPk−1 F + Q (5.36)
N
La estimación a posteriori surge de utilizar la estimación a priori con una corrección

pesada por esta ganancia:
O
ŷ k = Cx̂−
k + Duk
x̂k = x̂−
k + Kk (y k − ŷ k )
C
Para esta fase de corrección primero se debe calcular la matriz de ganancias de Kalman,
que minimiza la covarianza de la estimación ası́ obtenida:
−1
Kk = P− C T
C P − T
C + R (5.37)
EN
k k
La covarianza para el error de esta estimación es:
Pk = (I − Kk C) P−
k (5.38)
Si el modelo es completamente observable, tanto Kk como Pk convergen a valores

de estado estacionario; que pueden utilizarse para implementar un control por
realimentación de estados invariante en el tiempo.

Estado estacionario
En el caso de sistemas observables la ganancia de Kalman converge a un valor de
estado estacionario.
En tiempo continuo esta ganancia se puede obtener por optimización cuadrática del
sistema “dual”, tomando para el ı́ndice de desempeño cuadrático las matrices Q y R de
covarianza para el ruido de proceso y medición respectivamente.
En otras palabras, el filtro de Kalman invariante en el tiempo es el dual del regulador
LQR ([Tew11, pág. 81]).
N
Esto implica que podemos obtener la ganancia de estado estacionario computando un
regulador LQR para el sistema dual:
IO
ż = AT z + CT y
con un ı́ndice de desempeño definido con la convarianza del ruido de proceso Q y la del
ruido de medición R.
C
5.2.4. Control Optimo Gausiano
C
Control LQG/LTR
La combinación de un regulador LQR con un filtro de Kalman se conoce como control
RU
LQG (Linear Cuadratic Gausian). Aunque ambos son algoritmos óptimos en cierto
sentido y el regulador LQR tiene buenas propiedades de robustez.
Si bien es cierto que el diseño del regulador y el del observador son problemas
independientes, esta combinación no resulta necesariamente robusta [SP01, Tew11].
ST
N
O
C
EN

EN
C
O
N
ST
RU
C
C
IO
N
N
A
IO
C
Apéndices
C
RU
Modelos Dinámicos
ST
A.1.1. Modelos de Estado

Un modelo matemático general para un proceso dinámico es la ecuación de estados de
la forma:
N
ẋ = f (x, u, t) (A.1)
donde x ∈ Rn es el vector de estado, u ∈ Rm es un vector de acciones exógenas
O
independientes del estado y t ∈ R es el tiempo. Este es un modelo general no-lineal y

variante en el tiempo.
Sin embargo, en la mayor parte de los problemas en ingenierı́a se puede plantear algo
C
un poco más restrictivo sin perder demasiada generalidad:
ẋ = f (x, t) + g(x, t)u(t) (A.2)
Este modelo es “afı́n”(lineal) respecto de la entrada u.

EN
En ingenierı́a es importante también modelar la relación entre la información disponible

(salidas) y el estado. De forma general esto se describe mediante un mapeo no-lineal
entre el vector de estados y el vector de salidas y ∈ Rl que normalmente refiere a las
variables medidas:
y = h(x, u) (A.3)
143
El modelo completo resulta:
ẋ = f (x, t) + g(x, t)u(t) (A.4)

y = h(x, u)
A.1.2. Modelos Lineales

Podemos obtener una aproximación lineal del modelo (A.4) truncando su desarrollo en
serie de Taylor alrededor de una condición de equilibrio: f (x0 , u0 ) = 0.
N
El modelo lineal resulta:
ẋ = A∆x + B∆u (A.5)
IO
y = C∆x + D∆u
donde:

∂f
A= , ∆x = x − x0
C
∂x x0 ,u0

∂f
B= , ∆u = u − u0
C
∂u x0 ,u0

∂h
C=
∂x x0 ,u0
RU

∂h
D=
∂u x0 ,u0
Si reciclamos las letras x y u para sustituir a ∆x y ∆u respectivamente llegamos a la

ST
notación habitual de la ecuación de estados lineal:
ẋ = Ax + Bu (A.6)
y = Cx + Du (A.7)
N
Podemos aplicar la transformada e Laplace para obtener una solución del modelo lineal:
X(s) = Φ(s) [x(0) + BU (s)] (A.8)

O
Y (s) = CX(s) + DU (s)
siendo Φ(s) la transformada de Laplace de la matriz de transición de estados:

C
 
φ11 (s) φ12 (s) ··· φ1n (s)
−1
 φ21 (s) φ22 (s) ··· φ2n (s) 
Φ(s) = [sI − A] = . (A.9)
 
.. .. .. 
 .. . . . 
EN
φn1 (s) φn2 (s) · · · φnn (s)

Esta es la solución de la ecuación de estados en el dominio de la variable s. Anti-
transformando llegamos a la solución general de la ecuación de estados lineal en el
dominio del tiempo:
Z t
x(t) = Φ(t)x(0) + Φ(t − τ )Bu(τ )dτ (A.10)
0

siendo: n o
−1
Φ(t) = L −1 [sI − A] = eAt (A.11)
El modelo lineal se puede sintetizar en una única matriz de la forma:

ẋ A B x
= (A.12)
y C D u
Modelos de Procesos con Dinámica de Sensores y Actuadores
N
Frecuentemente en control automático se plantean modelos para la dinámica de los
procesos a controlar, identificando las acciones de control u y las variables medidas
y , asumiendo que estas tienen una relación estática (instantánea) con las salidas y
IO
entradas del sistema de control. Sin embargo en general esta interacción entre el
proceso y el controlador se da por medio de sensores y actuadores cuyas dinámicas
no aparecen inicialmente en el modelo del proceso.
C
Esto se da por ejemplo al analizar la dinámica del avión, al asumir que la deflexión de
las susperficies de control aerodinámico o el empuje son acciones de control (pueden
ser manipuladas directamente), cuando el realidad las acciones de control son señales
C
enviadas a un actuador (servomecanismos en el caso de las superficies aerodinámicas)
que se encarga de ejecutar este movimiento.
RU
En tanto la dinámica de estos actuadores resulta rápida respecto de la dinámica de lazo
cerrado que se pretende lograr, no incluirlos en el modelo es admisible. Algo similar
puede decirse de los sensores.
Cuando esto no es ası́ se requiere contar al menos con un modelo de la dinámica
dominante de los actuadores y de los sensores, para fusionarlo con el modelo del
ST
proceso principal.
Supongamos que tenemos un modelo de estados (A.6) para el proceso. Si llamamos xa

al vector de estados de estos últimos, y consideramos que la salida de los mismos y a
son las acciones de control, podemos modelar su dinámica como:
N
ẋa = Aa xa + Ba v
y a = Ca xa + Da v ≡ u
O
donde v es el vector de comandos (entradas) para los actuadores.

Por sustitución obtenemos un modelos para el proceso “aumentado” con la dinámica de
C
los actuadores:

ẋ A BCa x BDa
= + v (A.13)
ẋa 0 Aa xa Ba
EN

x
y = C DCa + DDa v
xa
De la misma forma podemos incluir la dinámica de los sensores:
ẋs = As xs + Bs y
y s = Cs xs + Ds y

Incorporando esto al modelo anterior:
      
 ẋ  A BCa 0 x BDa
ẋa =  0 Aa 0  xa +  Ba  v (A.14)
ẋs Bs C Bs DCa As xs Bs DDa
   
 
 x 
y = Ds C Ds DCa Cs xa + Ds DDa v
xs
 
N
A.1.3. Matriz de Transferencia
A partir de la solución en Laplace (A.8) podemos despejar una relación entre entradas y
IO
salidas:
−1 −1
Y (s) = {C [sI − A] B + D}U (s) + C [sI − A] x(0) (A.15)
El término entre llaves es lo que se denomina matriz de transferencia, que relaciona
C
el efecto de las entradas sobre las salidas partiendo de condiciones iniciales nulas
(equilibrio):
−1
C
G(s) = C [sI − A] B+D (A.16)
En sı́ntesis podemos decir que:
RU
Y (s) = [CΦ(s)] x(0) + G(s)U (s)
De forma expandida:
 
     U1 (s) 
Y1 (s) G11 (s) G12 (s) · · · G1m (s)  
 U2 (s)
   

..  .. .. .. ..
ST
. = . . . .  ..
 . 
  
Yl (s) Gl1(s) Gl2(s) · · · Gln (s) 
   
Um (s)

Función de Transferencia
N
Cada elemento Gij (s) es una función racional cuyo denominador es el polinomio
caracterı́stico de la matriz A, de orden n, y el numerador es un polinomio como máximo
de orden n, si D 6= 0, o a lo sumo n − 1 si D = 0.
O
Esta función relaciona la transformada de Laplace una determinada variable de salida

Yi (s) respecto de la transformada de Laplace de una entrada Uj (s):
Yi (s) b0 sn + b1 sn−1 + · · · + bn−1 s + bn

C
Gij (s) = = n (A.17)

Uj (s) s + a1 sn−1 + · · · + an−1 s + an
Respuesta en Frecuencia
EN
Para entradas senoidales la respuesta en régimen estacionario también es senoidal y

con la misma frecuencia ω que la entrada, pero con amplitud amplificada o atenuada y un
desfasaje que depende resulta del módulo y el argumento de la función de transferencia
entre entrada y salida evaluada en s = jω (a lo que llamamos respuesta en frecuencia):
yss = B sin (ωt + φ) , B = |G(jω)| A , φ = ∠G(jω)

A.1.4. Modelos en Tiempo Discreto
Al diseñar controles digitales es necesario considerar el hecho de que estos sistemas
solo operan sobre un muestreo de las señales de salida.
Necesitamos por lo tanto un modelo que describa la dinámica desde esa perspectiva.
Matemáticamente usamos un modelo de tiempo discreto (o “estroboscópico”), que
muestre la relación entre los estados o salidas del sistema entre diferentes instante de
muestreo.
N
Modelo de Estados
Podemos evaluar la solución de la ecuación de estados (A.10) entre dos instantes de
muestreo consecutivos ta = kts y tb = (k + 1)ts :
IO
Z tb
x(tb ) = Φ(tb − ta )x(ta ) + Φ(t − τ )Bu(τ )dτ
ta
C
Como el sistema es invariante en el tiempo podemos decir que:
Z ts
x(tb ) = Φ(ts )x(ta ) + Φ(t − τ )Bu(τ )dτ
C
0
Si asumimos que entre intervalos de muestreo el vector de entradas no cambia

(retención de orden cero - ZOH):
RU
Z ts
xk+1 = Φ(ts )xk + Φ(t − τ )dτ Buk
0
donde xk = x(kts ) y uk = u(kts ). Ma matriz de transición de estados Φ(t) evaluada en

el intervalo t = ts es una matriz de constantes F ∈ Rn×n , La integral evaluada en dicho
ST
intervalo es una matriz constante H ∈ Rn×m .

La ecuación de salida no cambia en tiempo discreto, dado que no es una relación
dinámica.
El modelo de estados en tiempo discreto resulta:

N
xk+1 = Fxk + Huk (A.18)

O
y k = Cxk + Duk
donde Z ts
C
F = Φ(ts ) , H= Φ(t − τ )B
0
El modelo (A.18) es una ecuación en diferencias que relaciona el estado en un instante

de muestreo con su valor en un tiempo de muestreo precedente y las perturbaciones
EN
aplicadas en dicho intervalo.
Transformada Z
De la misma forma que ocurre con el modelo de tiempo continuo (A.6), la solución para
una ecuación en diferencias como lo és el modelo de tiempo discreto (A.18) no puede
obtenerse de forma algebraica. Pero al igual que en el caso continuo es posible convertir
el modelo discreto en una expresión algebraica aplicando la transformada Z.

Podemos llegar a esta aplicando la transformada de Laplace al muestreo de una señal.
Este muestreo puede expresarse matemáticamente como la convolución de esta señal
con un tren de impulsos unitarios:
∞
X
s(t) = δ(t − nts )
n=0
La señal muestreada y ∗ en el dominio del tiempo continuo resulta:

∞ ∞
N
X X
y ∗ (t) = y(t)δ(t − nts ) = y(nts)δ(t − nts)
n=0 n=0
IO
Aplicando Laplace:
∞
" #
Z ∞ X
L {y ∗ (t)} = y(nts )δ(t − ns ) e−st dt
0 n=0
C
∞ Z
X ∞
y(nts)δ(t − nts ) e−nts s dt

=
n=0 0
C
Como s(t) = 0∀t 6= nts , podemos sustituir st por nts s en el exponente y reemplazar la
integral por la sucesión y(n · ts):
RU
∞
X
L {y ∗ (t)} = y(nts ) e−nts s
n=0
Definimos un nuevo espacio complejo z :

ST
z = e−ts s (A.19)
con lo cual obtenemos la transformada Z de la señal muestreada:

∞
X
Z {y(t)} = Y (z) = y(nts ) z −n
N
(A.20)
n=0
Puede notarse que la expansión de la transformada Z es la serie:

O
Z {y(t)} = y(0) + y(ts )z −1 + y(2ts )z −2 + y(3ts )z −3 + · · ·

= y0 + y1 z −1 + y2 z −2 + y3 z −3 + · · ·
C
que los coeficientes de la serie se corresponden con el muestreo de la señal.
Puede notarse que, al igual que la transformada de Laplace, la transformada Z es un

EN
operador lineal:
∞
X
Z {x(t) + y(t)} = [x(nts ) + y(nts )] z −n = Z {x(t)} + Z {y(t)}
n=0
X∞
Z {αy(t)} = αy(nts ) z −n = αZ {y(t)}
n=0

La propiedad mas importante para nosotros está relacionada con el desplazamiento en
el tiempo:
∞
X
Z {y(t + ts )} = y(nts + ts ) z −n
n=0
Si definimos k = n + 1 podemos reescribir esto de la forma:
∞
X ∞
X
Z {y(t + ts )} = y(kts ) z −k+1 = y(kts ) z −k z
k=1 k=1
N
Por lo tanto:
Z {y(t + ts )} = z Z {y(t)} − y(0)z (A.21)
Usando un razonamiento similar se demuestra que:
IO
Z {y(t − ts )} = z −1 Z {y(t)} (A.22)
Podemos notar en esto un paralelismo con la transformada de Laplace. Para esta la
variable compleja s representa al operador derivada en el tiempo, y s−1 la integral.
C
Para la transformada Z la variable compleja z representa un operador de desplazamiento
hacia adelante en el tiempo de magnitud ts , y su inversa z −1 un atraso temporal de igual
amplitud.
C
Solución del Modelo de Estados Discreto
De forma similar a la solución del modelo de tiempo continuo con Laplace, podemos
RU
aplicar la transformada z al modelo de tiempo discreto (A.18) recurriendo a la propiedad
(A.21) para convertirlo en una expresión algebraica:
zX(z) − zx0 = FX(z) + HU (z)
por lo tanto
ST
[zI − F] X(z) = zx0 + HU (z)

con lo cual obtenemos una solución en el espacio z:
X(z) = φ(z) [zx0 + HU (z)]
donde
N
−1
φ(z) = [zI − F]
Esto es matemáticamente igual a la solución de tiempo continuo A.8. Dado que se trata
de un operador lineal, la transformada Z inversa se puede calcular de forma directa a
O
través de tablas como se hace con Laplace.

Esta solución es exacta para perturbaciones con retención de orden cero (si no lo son se
puede buscar una función equivalente) y coincide en ese caso con la solución de tiempo
C
continuo, aunque solo arroja información para los instantes de muestreo.
Matriz de Transferencia
Aplicando también la transformada Z a la ecuación de salida y despejando para
EN
condiciones iniciales nulas encontramos la matriz de transferencia discreta; que tiene

la misma estructura que la de tiempo continuo:
−1
G(z) = C [sI − F] H+D (A.23)
Los elementos de esta matriz son funciones de transferencia discretas, y relacionan
muestreos de una entrada con los muestreos de una salida. Son funciones racionales de
la forma (A.17) y se pueden descomponer en fracciones parciales en la forma habitual.

N
IO
C
Figura A.1: curvas de frecuencia natural y amortiguamiento constantes en el plano z
C
Estabilidad del Modelo Discreto y Mapeo s-z
La ecuación (A.19) define un “mapeo” entre el pano s y el plano z:
RU
z = e−ts s = e−ts Re{s}−ts jIm{s} = e−ts Re{s} e−jts Im{s} (A.24)
Es evidente que:
|z| = e−ts Re{s} , ∠z = e−jts Im{s} (A.25)
ST
Por lo tanto una recta Re {s} = cte (vertical) en el plano s es una circunsferencia de
radio e−ts Re{s} en el plano z , mientras que una recta Im {s} = cte (horizontal) en el
plano s es una radial con ángulo e−ts Im{s} en el plano z . Debe tenerse presente que la
parte real en s define el tiempo de establecimiento en el caso estable, o el tiempo para
duplicar la amplitud en el inestable. Esto en el plano z queda entonces asociado a la
N
distancia al origen.
A su vez, la parte imaginaria en s define la frecuencia de oscilación en el caso sub-
amortiguado. En el plano z esto se mapea a una lı́nea radial.
O
En particular, el eje imaginario Re {s} = 0, que es el lı́mite de estabilidad para el

modelo continuo, se mapea en el cı́rculo unitario en el plano z . La totalidad de semiplano
izquierdo C− en s se mapea en un disco de radio 1, mientras que el semiplano derecho
C
C+ en s se transforma en el exterior del circulo unitario en z .
A su vez las lineas radiales y las circunsferencias en el plano s son particularmente

por representar lugares de amortiguamiento y frecuencia natural constante para polos
EN
complejos conjugados. El mapeo al plano z se muestra en la figura A.1. Puede notarse

que las radiales y circunsferencias en s se intersectan con ángulos de 900 , al igual
que lo hacen los correspondientes mapeos en z , dado que la transformación (A.19) es
conforme.
Finalmente mencionemos un punto especial, s = 0 que está asociado a una integración

temporal. Este punto se mapea a z = +1.

N
Figura A.2: Cómputo de respuesta al escalón con el modelo continuo y uno de tiempo discreto con retención de orden cero
IO
El caso más simple es el de una dinámica de primer orden:
C
ẋ = −a x + b u
y = cx
C
La matriz de transición de estados para este caso es escalar:
1
RU
φ(s) = → φ(t) = e−at
s+a
Si a > 0 es una dinámica estable sobre-amortiguada.
La matriz de transferencia también es escalar:
Y (s) b
=
ST
U (s) s+a
El modelo en tiempo discreto será:
xk+1 = ā xk + b̄ uk
yk = c xk
N
donde
b
ā = e−ats 1 − e−ats

→ b̄ =
O
a
La matriz de transición de estados discreta es:
1
C
φ(z) =
s − ā
y la función de transferencia discreta resulta:
EN
Y (z) b̄
=
U (z) s − ā
El polo en el modelo continuo está en s = −a (semiplano izquierdo) mientras que para
el modelo discreto es z = e−ats (interior del circulo unitario).
En la figura A.2 se ve la respuesta al escalón calculada con el modelo continuo y con el
discreto.

En las librerı́as de control existe un comando c2d() que permite obtener un modelo
discreto a partir de un continuo.
Estado Estacionario
Los valores de una señal en estado estacionario para el modelo de tiempo contı́nuo se
pueden determinar a partir del teorema del valor final. Para modelos de tiempo continuo
se tiene:
yss = lı́m y(t) = lı́m s Y (s)
t→∞ s→0
N
En tiempo discreto este teorema toma la siguiente forma [Oga96, p.6]:
yss = lı́m y(k) = lı́m−1 (z − 1) Y (z) (A.26)

k→∞ 1→z
IO
lo cual es consistente con el hecho de que el modelo discreto del escalón unitario es
−1
1 − z −1 .
Esto implica que para determinar la ganancia a frecuencia cero a partir de una función
C
de transferencia discreta G(z) debemos computar G(1).
Respuesta en Frecuencia
C
La respuesta en frecuencia del proceso operando en tiempo discreto puede obtenerse
reemplazando z = ejωt en la función discreta, en concordancia con el mapeo en el plano
s y el plano z .
RU
Debe observarse que para un determinado modelo continuo, la respuesta en frecuencia
discreta no coincide con la continua; dado que para el modelo discreto hay un dispositivo
de retención a la entrada. Podrı́amos decir que la respuesta en frecuencia discreta se
corresponde con la respuesta en régimen estacionario del proceso continuo con una
entrada senoidal procesada por una retención de orden cero.
ST
Con la retención, a la frecuencia de Nyquist la senoidal se convierte en una onda

cuadrada.
Se puede notar que al sustituir z = ejωt , la expresión resultante ya no es una función

racional de la variable ω . Esto hace que las caracterı́sticas de superposición de la
respuesta en frecuencia continua no se repliquen en la discreta, complicando el análisis
N
en frecuencia.
Para lidiar con este inconveniente se puede aplicar una segunda transformación al
O
modelo continuo, esto es, mapear el plano z a otro plano que denominaremos w
mediante la transformada bilineal, también conocida como método de Tustin; definida
como [Oga96, p.228]:
C
ts
1+ w 2 z−1
z= 2 → w= (A.27)
ts ts z + 1
1− w
EN
2
Esta transformada mapea el interior del cı́rculo unitario del plano z en el semiplano
izquierdo del plano w, llevando el cı́rculo unitario en z al eje imaginario en w.
En el plano w la respuesta en frecuencia vuelve a ser una función racional, pero en
términos de una frecuencia ficticia ν relacionada no-linealmente con la frecuencia real ω :
2 ts
Im {w} = ν = tan ω (A.28)
ts 2

Se puede verificar que el rango {−ωs /2 : ωs /2} para ω se mapea en {−∞ : +∞} para
ν . Por lo tanto ν = ∞ se corresponde con la frecuencia de Nyquist.
Desde el punto de vista de las gráficas de bode, la respuesta discreta expresada en

términos de la frecuencia ficticia ν tiene las mismas propiedades que la respuesta en
frecuencia continua en cuanto a trazas asintóticas y superposición de términos en serie.
A.1.5. Aproximación Discreta de Controles Continuos
N
Ver [sW04, cap.8, p. 293].
IO
C
C
RU
ST
N
O
C
EN

Diagramas en Bloques
Para el control automático los diagramas en bloques son representaciones gráficas de la
dinámica de los sistemas, y se construyen con tres tipo de elementos:
señales
bloques
puntos de suma
Las señales representan variables escalares o vectoriales que evolucionan en el tiempo.
N
Los bloques son transformaciones aplicadas sobre las señales, y los puntos de suma
son bloques especiales que representan adición sustracción de señales.
IO
Un ejemplo muy simple es el de un modelo masa-resorte-amortiguador:
C
C
mv̇ = f − fr − fb ṗ = v fr = k · p fb = b · v (A.29)
donde f es una fuerza externa, mientras que las expresiones para fr y fb son modelos
RU
para los fenómenos elásticos y disipativos respectivamente.
La ecuación diferencial puede escribirse de forma más significativa dejando en claro las
relaciones causa-efecto de la siguiente forma:
Z t Z t
v= (fr + fb + fp ) dt p= vdt (A.30)
0 0
ST
Partiendo de esto podemos describir el modelo dinámico mediante el siguiente diagrama:

N
O
C
Como en este caso el modelo es lineal, podemos aplicar la transformada de Laplace para
obtener expresiones algebraicas. De esta forma es posible operar para encontrar alguna
relación entre una variable de entrada y cualquiera de las señales. Con la transformada
de Laplace convertimos el operador derivada en un producto por la variable s:
EN

Los bloques enmarcados en azul están conectados en serie, y por lo tanto se pueden
sustituir por un solo equivalente al producto de ambos: 1/ms. Este podrá luego
combinarse con el integrador a su la derecha, pero antes será necesario tomar la señal
V (s) que entra al bloque b de otro lugar. Si tomamos V (s) de la salida del integrador de
la derecha cometemos un error, pero este puede ser corregido multiplicando la señal por
su inversa s.
N
IO
El bloque del recuadro verde incluye dos términos que toman una misma señal de
entrada (P (s)) y la suman (o restan) a una misma señal resultante. Estos bloques en
C
paralelo pueden ser sustituidos por uno que equivalga a la suma de ambos:
C
RU
El resultado tiene una estructura genérica de la forma:
ST
En este caso G(s) = 1/ms2 y H(s) = bs + k .

Si llamamos Z(s) al término emergente del punto de suma (que es entrada de G(s))
N
tenemos que:
Z(s) = X(s) − H(s)Y (s)
O
y además:
Y (s) = G(s)Z(s)
Despejando Z(s) y sustituyendo en lo anterior:
C
Y (s) = G(s) [X(s) − H(s)Y (s)] = G(s)X(s) − G(s)H(s)Y (s)

Despejando:
Y (s) G(s)
EN
= (A.31)
X(s) 1 + G(s)H(s)
Para nuestro ejemplo:
1
P (s) ms2 1
= =
F (s) bs + k ms2 + bs + k
1+
ms2

N
IO
C
C
RU
ST
N
O
C
EN
Figura A.3: Reducción del diagrama en bloques para el modelo de 1/4 de auto con 2 grados de libertad

En casos complejos la reducción de un diagrama en bloques puede ser mucho más
directa que sustituir y despejar.
Por ejemplo, para un modelo de 1/4 de auto para la suspensión con dos grados de
libertad:
N
IO
C
Con modelos lineales de elasticidad y amortiguamiento:
C
M ẇ = f1 f1 = k + b˙
RU
mẇr = f2 − f1 f2 = kr δ + br δ̇
ż = w , żr = wr , = z − zr , δ = zr − h
siendo h la altura del terreno, z y zr son las alturas de la carrocerı́a y la masa de la

rueda medidas desde su posición de reposo bajo la acción de la gravedad. Aplicando la
transformada de Laplace:
ST
1
M s2 Z(s) = F1 (s) → Z(s) = F1 (s)
M s2
1
ms2 Zr (s) = F2 (s) − F1 (s) → Zr (s) = [F2 (s) − F1 (s)]
ms2
N
F1 (s) = (bs + k) [Z(s) − Zr (s)]

F2 (s) = (br s + kr ) [Zr (s) − H(s)]
O
Con esto planteamos el diagrama superior de la figura A.3. Luego reducimos el diagrama
hasta obtener un solo bloque que transforme la señal de entrda (en este caso la altura
del terreno) con la de salida (la altura de la carrocerı́a).
C
Hacemos una simplificación del último bloque para obtener una función racional:
Z(s) (br s + kr ) (bs + k)

=
H(s) (ms + br s + kr ) (M s2 + bs + k) + (br k + bkr ) s + kr k
2
EN
bbr s2 + (br k + bkr ) s + kr k

=
mM s + (mb + M br + bM ) s3 + (kr M + mk + kM ) s2 + (br k + bkr ) s + kr k
4

A.2.1. Lectura Adicional
La reducción de diagramas en bloques está desarrollado en detalle en casi todos los
libros para cursos de grado en control automático. En particular se puede consultar en
[Oga93, sec.1.7, p. 46], [Oga98, sec.3.3, p. 63], [Oga10, sec.2.3, p. 17].
Representación gráfica de ecuaciones algebraicas
Reducción de diagramas en bloques
N
IO
C
C
RU
ST
N
O
C
EN

Casos de Estudio
A.3.1. Misión Apollo - Control de Descenso
Las misiones Apolo tenı́an por objeto transportar hasta una órbita lunar una nave
denominada módulo de comando (CSM) con tres tripulantes y un módulo de alunizaje
(LEM: Lunar Excursion Module) para dos pasajeros; efectuar un descenso sobre la
superficie lunar con este para la ejecución de experimentos sobre la misma; regresar
el LEM al módulo de comando y efectuar el retorno a la tierra en este último.
N
El LEM fue construido por la Grumman, por un contrato de u$s 350 M. Estaba compuesto
de dos etapas, una de descenso y otra de ascenso.
IO
Los módulos de descenso contenı́an el tren de aterrizaje, la antena del radio-altı́metro,
el motor de descenso y el combustible para el alunizaje. También tenı́a varios
compartimientos de carga usados para llevar entre otras cosas, los paquetes de los
experimentos de la misión, un carro móvil para el equipo (un carro tirado a mano para
C
los equipo llevado en la misión Apolo 14), el Lunar Rover (un vehı́culo lunar eléctrico
llevado en las misiones Apolo 15, 16 y 17), una cámara de televisión, herramientas y
cajas para la recolección de muestras de la superficie lunar.
C
El módulo de ascenso contenı́a la cabina para la tripulación, los tableros de instrumentos,
el puerto y escotilla de acople (al CSM), la escotilla delantera, el sistema de control
RU
de reacción, las antenas del radar y de comunicaciones, el motor de ascenso y el
combustible para volver a la órbita lunar y encontrarse con el CSM.
ST
N
O
C
(a) Imagen del Lunar Excursion Module (LEM)

(b) Infografı́a de los subsistemas del LEM
EN

N
IO
C
Figura A.5: Fases de la maniobra de alunizaje de ?as misiones Apollo de la NASA
C
Dimensiones
Altura 6,37m
RU
Diámetro 4,27m
Envergadura en el tren de aterrizaje 9,07m
Volumen 6,65m3
Masas
Módulo de Ascenso (con combustible) 4670kg
ST
Módulo de Descenso 10334kg

Propelente del módulo de Descenso 8165kg
Propulsión
RCS: Reaction Control System (N2O4/UDMH) 16x441N
N
Propulsión de Ascenso: (N2O4/Aerozine 50) 15,6kN

Propulsión de Descenso (N2O4/Aerozine 50) 44,40kN
O
Autonomı́a 3 dı́as, 72hs

Apogeo 160km
Perigeo superficie lunar
C
Variación de velocidad en descenso 2470m/s
Referencia: APOLLO LUNAR-DESCENT GUIDANCE, Allan R. Klumpp. MIT, Junio 1971

EN
El descenso en la luna se realiza mediante una trayectoria nominalmente plana

organizada en tres fases:
1. Una fase de frenado (Programa 63, o P63) iniciada mediante un teclado unos 10
minutos antes del momento nominal de ignición. P63 primero computa el momento
preciso y la actitud para la ignición. Luego, tı́picamente a 492-km del sitio de alunizaje,

N
IO
Figura A.6: Esquema del ajuste del vector de empuje para control de trayectoria
C
P63 enciende el DPS (Descent Propulsion System). Finalmente, P63 transfiere el
LM al estado terminal requerido como condición inicial para la fase de aproximación
C
subsiguiente. La transferencia toma tı́picamente 514 segundos y es casi óptima.
2. La fase de aproximación (P64) el guiado comienza con condiciones iniciales

RU
consistentes tı́picamente en, a) 2.2km de altitud y 7.5 km de rango en superficie y b) 44
m/s de velocidad vertical y 129 m/s de velocidad hacia adelante. En unos146 segundos,
P64 transfiere el LM a un punto prácticamente arriba del sitio de aterrizaje. P64 provee
visibilidad continua de la superficie lunar, y especı́ficamente, del sitio de alunizaje hasta
unos cinco segundos antes de la finalización. Durante P64 el comandante puede indicar
ST
al LGC (Landing Guidance Computer) a alunizar en cualquier punto elegido visualmente

en la superficie lunar mediante un procedimiento de re-designación que puede ser
continuado hasta el inicio de la fase de descenso terminal.
3. La fase de descenso terminal (P66) comienza automáticamente a unos 30m de

altitud y 11m de distancia al sitio de aterrizaje, o puede ser iniciado por el comandante
N
en cualquier momento durante P64. El algoritmo de guiado de P66 controla solo

la velocidad; no hay control de posición. P66 anula las componentes de velocidad
horizontales para produce una aproximación vertical a la superficie luna, un objetivo
O
que no puede ser alcanzado mediante indicaciones visuales cuando la superficie es

oscurecida mediante una capa de polvo moviéndose radialmente. P66 controla la
velocidad de descenso en función de un valor de referencia que puede ser incrementado
C
o decrementado en pasos de 0.3 m/s cada vez que el comandante sube o baja un switch
de control (ROD: rate-of-descent) control ubicado cerca de su mano izquierda.
EN
Control de Descenso
Supongamos que nuestra tarea es automatizar al menos la fase de descenso final, dado
que se debe optimizar el uso de combustible y evitar que el vehı́culo quede desnivelado
sobre la superficie, lo cual impedirı́a el posterior despegue del módulo de ascenso. Esto
implicará tomar contacto con la superficie de forma suave, pero sin pérdidas de tiempo
innecesarias durante el descenso.

La maniobra requiere implementar dos funciones:
A - poder apuntar correctamente el vehı́culo (control de actitud)

B - comandar adecuadamente el motor para regular el descenso.
Vamos a considerar la fase de descenso terminal (P66). Suponiendo que existe un

control de actitud mantiene el motor de descenso (DPS) correctamente alineado con
la trayectoria; podemos concebir un sistema independiente que controle el descenso
regulando el empuje de este motor. Dicho motor fue diseñado para permitir un cierto
N
nivel de control de empuje, lo cual no es sencillo debido a las inestabilidades que pueden
experimentarse en la cámara de combustión de un motor cohete por cuestiones termo-
fluidodinámicas.
IO
El DPS permitı́a regular empuje solo en el rango 10 60 %, lo cual define entonces el
rango admisible para nuestra acción de control.
C
Para automatizar el descenso podemos plantear al menos dos estrategias: A - Seguir un
perfil de altura vs tiempo pre-programado
C
B - Ajustar la velocidad de descenso en función de la altura, en base a una curva o
mapeo altura ¿velocidad predefinido
RU
Si vamos a controlar altura podemos plantear el siguiente modelo:
d dh
{m × w} = ṁw + mẇ = F − mg , =w
dt dt
en donde g es la atracción gravitatoria, F es el empuje del motor y m es la masa del
ST
vehı́culo, que varı́a en el tiempo por el consumo del combustible. Asumiendo que el
consumo es proporcional al empuje:
ṁ = cf F → mẇ = (1 − cf w) F − mg
ṁ = cf F → mẇ = (1 − cf w) F − mg
N
Linealizando:
O
mẇ = (1 − cf w) ∆F − cf F0 w − mg , ∆F = F − F0
Tomando w0 = 0 y F0 = mg :
C
1
∆F − cf gw − q
ẇ =
m
Dado que el sistema de propulsión no reacciona de forma instantánea a un comando,
proponemos un modelo de primer orden para la relación entre comando y empuje:
EN
Tdps Ḟ + F = u;
en donde Tdps serı́a la constante de tiempo del motor.
Aplicando Laplace:
1 g
(s + cf g) W (s) = ∆F (s) − , sH(s) = W (s)
m s

(Tdps s + 1) F (s) = U (s)
Podemos expresar esto de varias formas. Desde un punto de vista fı́sico podemos
considerar que el nuestra acción de control introduce una aceleración que se combina
con el efecto gravitatorio:

1 1/m g
H(s) = U (s) −
s (s + cf g) Tdps s + 1 s
N
El diagrama en bloques de la planta serı́a:
IO
C
El problema de esta perspectiva es que para encontrar una relación entre acción
C
de control y salida debemos eliminar la perturbación gravitatoria, pero esta puede
conservarse como una perturbación equivalente a la entrada Di o a la salida Do .
RU
Perturbación Equivalente a la Entrada

1/m Tdps s + 1
H(s) = U (s) − mg
s (s + cf g) (Tdps s + 1) s
ST
N
O
Perturbación Equivalente a la Salida

C
1/m 1
H(s) = U (s) − 2 g
s (s + cf g) (Tdps s + 1) s (s + cf g)
EN

En estado estacionario las perturbaciones equivalentes son:
mg 1/cf
Di (s) = , Do (s) = 2
s s
mientras que la función de transferencia de la planta resulta:
H(s) 1/m
G(s) = =
U (s) s (s + cf g) (Tdps s + 1)
La planta es de tipo 1, por lo cual tendrá error nulo a una referencia constante y error
N
finito para una referencia de tipo rampa.
Sin embargo la perturbación de entrada en estado estacionario es de tipo constante y
el lazo de realimentación para esta perturbación incluye solo el controlador, por lo cual
IO
este deberı́a tener acción integral.
C
C
Si lo analizamos como perturbación de salida, el lazo de realimentación en este caso
RU
incluye a la planta, que ya tiene un polo en el origen; pero la perturbación de salida en
estado estacionario serı́a de tipo rampa, por lo cual nuevamente vemos la necesidad de
incluir acción integral en el controlador:
ST
Entonces el problema de control pasarı́a a ser:

N
O
Ya no consideramos la perturbación, porque al incluir el integrador en el control sabemos

C
que tendremos un rechazo exacto en estado estacionario. Por otra parte en este caso
no habrá un transitorio como respuesta a la perturbación, dado que la gravedad actúa
permanentemente con la misma intensidad. .
Tomando m = 15000, cf = 3,28,10−4 , g = 1,62, Tdps = 1 y normalizando la
EN
acción de control con la cuarta parte del empuje máximo del DPS (11677N , que serı́a
aproximadamente el rango de nuestra acción de control que va del 10 al 50 % del empuje
máximo) la planta es:
m = 15000;
cf = 3.2787e − 4;
g = 1.62;
Tdps = 1;

den = conv ( [ 1 c f ∗ g 0 ] , [ Tdps 1 ] ) ;
G = t f ( 1 /m, den ) ;
zpk (G)
N
IO
C
C
RU
H(s) 6,67 × 10−5
G(s) = =
U (s) s (s + 5,3 × 10−1 ) (s + 1)
No podemos esperar que el lazo cerrado sea más rápido que el actuador, que en este
caso es el DPS y tiene una constante de tiempo de 1s. Por lo tanto podemos asumir
ST
con tranquilidad que el polo en está prácticamente en el origen, con lo que el modelo se
reduce a:
H(s) 6,67 × 10−5
G(s) = = 2
U (s) s (s + 1)
Incluyendo el integrador del compensador el diagrama de lugar de raı́ces es:
N
G = t f ( 6 . 6 7 e −5, [ 1 1 0 0 ] ) ;
r l o c u s (G ) ;
O
sgrid ;
Es claro que se requiere de un compensador, dado que con un control integral puro, que
es lo que tenemos hasta ahora; el lazo cerrado será inestable.
C
Debemos preguntarnos qué clase de respuesta a lazo cerrado estamos buscando.

Queremos una respuesta sobre-amortiguada (polos dominantes reales) o sub-
amortiguada (polos dominantes complejos conjugados?
La elección depende de las particularidades del problema a resolver. Debe tenerse en
EN
cuenta que si la respuesta oscila, también oscila la acción de control.

En este caso acciones de control de carácter oscilatorio no parecen recomendables
cuando el actuador es un motor cohete. Sin embargo no es mandatorio una respuesta
sobre-amortiguada; con un ?buen amortiguamiento? serı́a suficiente.
¿Que esté bien amortiguada implica que oscile poco?...¿cuanto es poco?....
Que el transitorio se extinga en un solo ciclo implica un factor de amortiguamiento 0.7.
Asociado a esto también hay un cierto sobre-paso:

N
IO
Puede notarse que con amortiguamiento 0,8 el sobrepaso es mı́nimo pero se obtiene una
C
convergencia más rápida que para el caso de amortiguamiento crı́tico o una respuesta
sobre-amortiguada, y podrı́amos adoptarlo.
El otro punto a definir es: ¿cuan rápida queremos que sea la respuesta?
C
La maniobra de descenso final tendrı́a una duración del orden de los 30s. Está claro que
la respuesta transitoria deberı́a extinguirse en un tiempo mucho menor.
Por otra parte tenemos un actuador con una constante de tiempo de un segundo, y
RU
no podemos pretender una respuesta de lazo más rápida que la del actuador. En caso
contrario durante cualquier transitorio habrá frecuentemente saturación de la acción de
control (motor al máximo o a cero empuje) y la respuesta no se corresponderá con lo
que podrı́a suponerse a partir del modelo lineal.
Tentativamente tomemos como objetivo tiempo de establecimiento ts s < 4 y
ST
amortiguamiento η > 0,8. Los polos dominantes de lazo cerrado podrı́an ubicarse en
s = −2 ± j1,2.
En la ubicación desdeada de los polos de lazo cerrado dominantes (punto de prueba) la

condición de ángulo da aproximadamente −4280 :
N
O
C
EN

N
IO
C
C
RU
Para compensar el lazo abierto debemos sumar +248◦ , y no hay forma de ubicar un
único cero para lograr este objetivo. Por lo tanto necesitamos al menos dos ceros, y
tenemos infinitas combinaciones posibles para esto.
Sin más argumentos podrı́amos pensar en un cero doble (dos ceros en el mismo lugar),
en donde cada uno aporte la mitad del ángulo requerido (+124◦ ). Hasta este punto el
ST
controlador serı́a:
2
(s + z)
K(s) = kc
s
con z = 1,19. Restarı́a calcular kc para cumplir con la condición de módulo, lo cual da
N
un valor aproximado de 5,6.

2
(s + 1,19)
O
K(s) = 5,6
s
Verificación Para realizar una verificación calculamos la función de transferencia de

C
lazo cerrado y vemos donde quedan sus polos.

Hacemos los cálculos con la función de transferencia simplificada y luego con la original.
figure
EN
% objetivo
p l o t ( r e a l ( p ) , imag ( p ) , ’ s ’ ) ;
hold on ;
% l a z o c e r r a d o con e l modelo s i m p l i f i c a d o
To = m i n r e a l (K∗Go/ ( 1 +K∗Go ) ) ;
p = roots ( To . den { 1 } ) ;

p l o t ( r e a l ( p ) , imag ( p ) , ’ xg ’ , ’ LineWidth ’ , 2 )
% l a z o c e r r a d o con e l modelo s i n s i m p l i f i c a
T = m i n r e a l (K∗G/ ( 1 +K∗G ) ) ;
zpk ( T )
p = roots ( T . den { 1 } ) ;
p l o t ( r e a l ( p ) , imag ( p ) , ’ x r ’ , ’ LineWidth ’ , 2 )
axis ([ − 3.5 0 . 5 −2 2 ] ) ;
legend ( ’ p o l o s deseados a l a z o c e r r a d o ’ . . .
N
, ’ polos con e l modelo s i m p l i f i c a d o ’ . . .
, ’ polos con e l modelo completo ’ ) ;
sgrid ;
IO
C
C
RU
ST
Un aspecto adicional que deberı́amos verificar es que pasa al variar la masa entre el
N
valor al inicio del descenso y el caso lı́mite de consumir la totalidad del combustible.
A.3.2. Turbogenerador Hidráulico

O
La Central Hidroeléctrica Binacional de Salto Grande (ver http://www.saltogrande.org)

está equipada con 14 turbo-generadores de procedencia soviética, dispuestos en dos
C
grupos de 7 con sus correspondientes salas de mando, y un vertedero central de 19

compuertas radiales de accionamiento hidráulico.
Posee dos descargadores de fondo, uno en cada margen, para crecidas excepcionales.
La capacidad total de evacuación de la presa es de 64,000m3 /seg .
EN
Cada turbo-generador se compone de un generador eléctrico de 135MW movido por una

turbina hidráulica de tipo Kaplan, la cual gira a 75 rpm.
Modelo Matemático
En primer término proponemos un modelo de dos grados de libertad, considerando el
rotor del generador y la turbina como dos cuerpos rı́gidos vinculados mediante un eje

flexible. Planteando conservación de momento cinético en ambos rı́gidos:
Jt ω̇t = Tt − Te , Jg ω̇g = Te − bωg + Tc
donde Jt y Jg son los momentos de inercia de la turbina y del generador respectivamen-

te, ωt y ωg sus velocidades de giro, Tf el torque generado por la turbina, Te el torque
elástico del eje, Tc el torque de carga en el generador y b un coeficiente de disipación
viscosa.
Para el torque de la turbina y el elástico proponemos lo siguiente:
N
Tt = cα [β − cω ωt ] , Te = ke φ , φ̇ = ωt − ωg
IO
donde β es el ángulo de paso de las palas, cα y cω son coeficientes hidrodinámicos y ke
es la rigidez a torsión del eje.
El rotor del generador tiene 40 pares de polos magnéticos, 650 toneladas de peso y
13,50 metros de diámetro. El eje de la turbina tiene 11,00 metros de largo, 95 toneladas
C
de peso y 1,50 metros de diámetro. La turbina es de 6 palas y tiene un diámetro de 8,5m.
Considerando además la potencia del equipo y algunas suposiciones básicas obtenemos
los siguientes valores aproximados para este ejercicio:
C
Jt 0,9 × 106 kgm2 momento de inercia de la turbina
29,6 × 106 kgm2
RU
Jg momento de inercia del rotor del generador
b (despreciable) amortiguamiento por lubricación de los mecanismos de transmisión
ke 194 × 106 N m rigidez del árbol de transmisión
cω 0,129 variación del torque asociada a la velocidad de giro
cα 87,1 × 106 N m variación del torque asociada al ángulo de ataque
ST
Con esto obtenemos la siguiente función de transferencia:
ω(s) 631,8
G(s) = = (A.32)
β(s) (s + 0,376)(s2 + 12,07s + 216,8)
N
O
C
EN
(a) Represa de Salto grande
(b) Turbina Kaplan

Sı́ntesis del Compensador
Proponemos un enfoque polinomial para la sı́ntesis del compensador. Con el modelo
(A.32) de tercer orden deberı́amos elegir para el lazo cerrado un polinomio de orden 5.
Pero si requerimos error nulo en estado estacionario ante referencias o perturbaciones
constantes debemos elevar el polinomio denominador de lazo abierto a 4 para incluir el
integrador del control, lo cual impone la elección de un polinomio de orden 7 para el lazo
cerrado.
Si observamos la respuesta en frecuencia del modelo (A.32) vemos que su ancho de
N
banda está definido por el polo real p = −0,376, respecto del cual el par complejo
conjugado asociado a la dinámica elástica con ωn = 14,72 puede considerarse como
rápido.
IO
Proponemos un modelo nominal dado por:
7,749
Go (s) = (A.33)
2,659s + 1
que tiene la misma ganancia a frecuencia cero que (A.32) pero solo conserva el polo
C
real.
En la figura XX vemos que el modelo simplificado da una buena aproximación para
C
frecuencias una década por encima del ancho de banda de lazo abierto.
Entre los modelos (A.32) y (A.33) podemos computar un modelo de incertidumbre
multiplicativa global:
RU
G(s) −s(s + 12,07)
G∆ (s) = −1= 2 (A.34)
Go (s) s + 12,07s + 216,8
Con el modelo simplificado el polinomio de lazo cerrado incluyendo el integrador del
control es de orden 3.
De acuerdo al ancho de banda de lazo abierto partimos de un ancho de banda de lazo
ST
cerrado del orden de 1 rad/s.

Consideramos tres casos: polinomio de Butterworth Ab (s), polinomio de Bessel As (s) y
un par complejo dominante Ad (s).
Ab (s) = s3 + 2s2 + 2s + 1
N
As (s) = s3 + 2,4329s2 + 2,4662s + 1

Ad (s) = s2 + 1,12s + 0,64 (s + 2,4)

O
Sin considerar los ceros que pudieran aparecer en la función T (s) aportados por el
compensador tendrı́amos con estos polinomio las respuestas en frecuencia y al escalón
mostradas en la siguiente figura.
C
EN

Calculamos los controles con el enfoque polinomial (ver sección ??) considerando como
polinomio de lazo abierto:
A0 = s (2,659s + 1)
donde el polo en el origen corresponde al integrador del control. Los compensadores

para cada caso resultan:
0,4768(s + 0,7198) 0,58094(s + 0,5907) 0,7364(s + 0,7158)
Kb = , Ks = , Kd =
s(s + 1,624) s(s + 2,057) s(s + 3,144)
N
donde el polo en el origen se agregó manualmente al compensador obtenido del ajuste
polinomial.
IO
Las dinámicas de lazo cerrado para cada caso se muestran en la figura siguiente,
considerando tanto el modelo nominal (gráficos superiores) y como el modelo completo
(gráficas inferiores). Puede notarse que no se manifiestan diferencias significativas.
C
C
RU
ST
N
En la próxima figura evaluamos la condición de estabilidad robusta para el modelo de

incertidumbre obtenido en (A.34) graficando el ı́ndice de robustez (1/T0 (s)) obtenido
O
con cada polinomio de lazo cerrado.

Claramente el margen de estabilidad robusta es amplio, y por lo tanto también es
esperable un desempeño robusto como el observado en la gráfica precedente:
C
EN

Si estresamos el diseño aumentando el ancho de banda, las respuestas de lazo cerrado
deberı́an tener la misma forma pero con una escala de tiempo proporcionalmente
menores; más allá de los problemas que pudieran surgir por limitaciones de actuación
máxima.
Esto es ası́ para el modelo nominal, pero a modo de ejemplo con un factor 7 sobre el
ancho de banda los resultados con el modelo nominal (arriba) y el completo (abajo) son
muy diferentes a los esperados:
N
IO
C
C
RU
Aunque la situación empeoró en todos los casos, el menor impacto se obtuvo para el
polinomio con polos dominantes de segundo orden.
ST
Todo esto era previsible evaluando el margen de robustez resultante con este ancho de
banda:
N
O
C
EN

N
Índice de figuras
IO
C
C
1.1. superficies de control aerodinámico en un avión . . . . . . . . . . . . . . . . . . . . . 3
1.2. Sistema realimentado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
RU
1.3. Lazo de control a lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5. Diagrama en bloques de un sistema realimentado con un compensador PID . . . . . . 8
1.6. En esta imágen vemos arriba inverters de diferente potencia (a la izquierda) para control
de motores eléctricos, un interfaz de operador (a la derecha) y varios modelos de PLCs
al centro y debajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.7. Sistema SCADA en una sala de control . . . . . . . . . . . . . . . . . . . . . . . . . . 9
ST
1.8. Primer autopiloto Sperry (derecha) y su demostración en Francia (izquierda), en el año

1914 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.15.Controlador PID neumático del año 1940 . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.1. Aterrizaje por instrumentos. Indicador del ILS . . . . . . . . . . . . . . . . . . . . . . . 29

N
2.2. Variaciones en la dinámica longitudinal de una avión bireactor de 8 plazas durante la

aproximación final . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3. Control por inversión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
O
2.4. Inversión con alta ganancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.5. Inversión por realimentación de alta ganancia . . . . . . . . . . . . . . . . . . . . . . . 32
2.6. Lazo de control general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
C
2.7. Esquema del control de régimen de giro (governor ) de un helicóptero con motor de
combustión interna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.9. Replanteo de la figura 2.6 para poner en evidencia las sensibilidades del error a las
distintas entradas del lazo SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
EN
3.1. Representación gráfica del cómputo para la condición de ángulo . . . . . . . . . . . . 50

3.2. Algunos ejemplos de lugar de raı́ces (tomado de [Oga10]) . . . . . . . . . . . . . . . . 52
3.3. Algunos ejemplos de lugar de raı́ces complementario (tomado de [Oga10]) . . . . . . . 55
173
3.4. Algunos ejemplos del “teorema del encierro” (tomado de [Oga10]). En los casos (a) y
(b) hay encierro al origen de la curva transformada, mientras que en los (c) y (d) no.
Observar a la izquierda la cantidad de polos y ceros en la región acotada por la curva
original. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.5. Trayectoria de Nyquist modificada para un lazo abierto con polo en el origen y ejemplo
de un posible mapeo (tomado de [Oga10]) . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6. Margenes de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.7. Replanteo del lazo estándar a uno con realimentación unitaria . . . . . . . . . . . . . . 62
3.8. Interpretación gráfica de los términos de la ecuación (??) . . . . . . . . . . . . . . . . 62
N
3.9. Grillas para la determinación de la respuesta en frecuencia de lazo cerrado a partir de
la traza de nyquist del lazo abierto (tomado de [Oga98]) . . . . . . . . . . . . . . . . . 63
3.10.Validez de la hipótesis de control perfecto para una dinámica dominante de segundo
IO
orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.11.Parametrización de la respuesta transitoria . . . . . . . . . . . . . . . . . . . . . . . . 69
3.12.Mapeo de las especificaciones de respuesta transitoria a regiones admisibles para los
polos de lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
C
3.13.Ajuste de un compensador en adelanto mediante el método de la bisectriz (ver [Oga10,
p. 315]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
C
4.1. Respuesta en frecuencia y transitoria al escalón de filtros de los filtros de Butterworth y
Bessel de orden 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.2. Análisis de desempeño en relación a la sensibilidad . . . . . . . . . . . . . . . . . . . 88
RU
4.3. Lazo de control general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
s + 0,8
4.4. Polos-ceros y respuesta en frecuencia para G1 (s) = 7,5 (azul) y G2 (s) =
(s + 2)(s + 3)
−s + 0,8
7,5 (rojo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
(s + 2)(s + 3)
4.5. Análisis de estabilidad robusta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
ST
4.6. Análisis de estabilidad robusta con el ı́ndice de robustez . . . . . . . . . . . . . . . . . 99

4.7. Análisis de desempeño robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.10.Atraso de fase para el retardo de transporte (L = 1s) y sus aproximaciones mediante la
expansión de Padè . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.11.Respuesta al escalón para el retardo de transporte (L = 1s) y sus aproximaciones
N
mediante la expansión de Padè . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.1. regulador por realimentación de estados . . . . . . . . . . . . . . . . . . . . . . . . . . 122

O
5.3. servo-sistema por realimentación de estados . . . . . . . . . . . . . . . . . . . . . . . 125

5.4. servo-sistema por realimentación de estados con acción integral . . . . . . . . . . . . 126
C
A.1. curvas de frecuencia natural y amortiguamiento constantes en el plano z . . . . . . . . 150

A.2. Cómputo de respuesta al escalón con el modelo continuo y uno de tiempo discreto con
retención de orden cero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
A.3. Reducción del diagrama en bloques para el modelo de 1/4 de auto con 2 grados de
EN
libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
A.5. Fases de la maniobra de alunizaje de ?as misiones Apollo de la NASA . . . . . . . . . 160
A.6. Esquema del ajuste del vector de empuje para control de trayectoria . . . . . . . . . . 161

N
Bibliografı́a
IO
C
C
[GGS01] Graham C. Goodwin, Stefan F. Graebe, and Mario E. Salgado. Control System Design.
Prentice Hall, 2001.
[JENR09] Eduardo F. Camacho Julio E. Normey-Rico. Unified approach for robust dead-time
RU
compensator design. Journal of Process Control, (19):38–47, 2009.
[KND] J. Kautsky, N.K. Nichols, and P. Van Dooren. Robust pole assignment in linear state
feedback.
[Kuo] Benjamin C. Kuo. Sistemas de Control Automático. Prentice Hall, 7 edition.

ST
[Oga93] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 2 edition, 1993.
[Oga96] Katsuhiko Ogata. Sistemas de Control en Tiempo Discreto. Prentice Hall, 2 edition, 1996.
N
[Peñ92] Ricardo S. Sánchez Peña. Introducción a los Teorı́a de Control Robusto. AADECA, 1992.
O
[SP01] Sigurd Skogestad and Ian Postlethwaite. Multivariable Feedback Control - Analysis and
Design. John Wiley & Sons, 2 edition, 2001.
C
[sW04] Karl J. Äström and Björn Wittenmark. Computer Controlled Systems - Theory and Design.
Prentice Hall, 3 edition, 2004.
[Tew11] Ashish Tewari. Advanced Control of Aircraft, Spacecraft and Rockets. John Wiley and Sons,
EN
2011.
[ZN42] J.G. Ziegler and N.B. Nichols. Optimum settings for automatic controllers. 1942.
[Zum] Augusto J. Zumarraga. Sistemas Dinámicos. 0 edition.
175

Control PDF

Cargado por

Copyright:

Formatos disponibles

Control PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Control PDF

Cargado por

Copyright:

Formatos disponibles

N

Ingenierı́a Aeroespacial - Edición 2020

1.3.3. Control PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.3. Control en el Campo Espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.5.1. Ley de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2. Objetivos del Control 27

2.1.1. Seguimiento de Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3. Análisis Clásico de Sistemas SISO 45

3.4.1. Compensación en el “Plano s” . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

4. Control Moderno de Sistemas SISO 79

4.1. Especificaciones de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4.2. Restricciones en el Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.3.4. Desempeño Robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

versión (preliminar) 0.2 - pág.

5. Realimentación de Estado 121

A.3.1. Misión Apollo - Control de Descenso . . . . . . . . . . . . . . . . . . . . . . . . 159

versión (preliminar) 0.2 - pág.

versión (preliminar) 0.2 - pág.2

A modo de ejemplo podemos reflexionar respecto de los elementos presentes y la forma

un piloto conduce una aeronave

un equipo económico de gobierno (por ejemplo el Banco Central de un Paı́s)

Pero también observamos esta clase de interacciones cuando simplemente llevamos

Por ejemplo, el médico ajusta la dosis de un medicamento, el piloto acciona los

En general la intervención no necesariamente finaliza al alcanzar la condición deseada.

versión (preliminar) 0.2 - pág.3

porque debido a su comportamiento el proceso no tiende a mantenerse en la

Figura 1.2: Sistema realimentado

De las capacidades sensoriales disponibles y de la capacidad de reacción (es decir,

para poder equilibrar el proceso en la condición deseada, sostenerla ante cambios

versión (preliminar) 0.2 - pág.4

Un sistema de control automático en general se configura mediante un proceso

1.2.1. Control a Lazo Abierto y Lazo Cerrado

En control automático se suele designar como planta al proceso dinámico a controlar.

En problemas de economı́a, sociologı́a o epidemiologı́a por ejemplo estos elementos no

Es posible concebir estrategias de control a lazo abierto, las cuales prescinden de la

versión (preliminar) 0.2 - pág.5

1.2.2. Entradas y Salidas

Estrategias Comunes de Control

Muchos problemas de control automático pueden resolverse con “leyes de control”

1.3.1. Control ON/OFF

Los controles ON/OFF (o bang-bang) son aquellos sistemas de control SISO en

control se realiza a través de una variable booleana.

La ventaja de este tipo de estrategia es su simplicidad, llegando inclusive a utilizarse

versión (preliminar) 0.2 - pág.6

1.3.2. Control Proporcional

Un ejemplo doméstico de control proporcional es el regulador de gas, el cual proporciona

establecido por la compresión del resorte superior.

1.3.3. Control PID

versión (preliminar) 0.2 - pág.7

Frecuentemente es necesario considerar la velocidad con la cual la salida se aparta o

En situaciones más complejas se recurre a un estudio matemático del problema, siendo

Teorı́a de Control Automático provee diferentes enfoques y herramientas, siendo esta

1.3.4. Automatización y Control

Se trata de manipular variables de tipo booleano cuando se cumplen ciertas condiciones

versión (preliminar) 0.2 - pág.8

Figura 1.7: Sistema SCADA en una sala de control

1.4.1. Control Industrial

(omnipresente) y el control automático, esto último en los procesos de producción

Los enclavamientos lógicos suelen implementarse en dispositivos de hardware denomi-