Control PDF
Control PDF
Control PDF
IO
C
C
RU
ST
N
O
C
Control y Guiado
EN
IO
C
C
1. Introducción 1
1.1. Sistemas Realimentados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
RU
1.2. Sistemas de Control Automático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1. Control a Lazo Abierto y Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2. Entradas y Salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Estrategias Comunes de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.1. Control ON/OFF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.2. Control Proporcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
ST
1.6. Cómputos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
N
3.1. Lugar de Raı́ces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1.1. Análisis de la Ecuación Caracterı́stica de Lazo Cerrado . . . . . . . . . . . . . 48
3.1.2. Interpretación de las Condiciones de Módulo y Ángulo . . . . . . . . . . . . . . 49
IO
3.1.3. Reglas para el Trazado del Diagrama . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.4. Análisis de Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.1.5. Lugar de Raı́ces Complementario . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.1.6. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
C
3.2. Criterio de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1. Teorema del Encierro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.2. Estabilidad del Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
C
3.2.3. Funciones de Lazo Abierto con Polos en el Eje Imaginario . . . . . . . . . . . . 59
3.2.4. Márgenes de Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.2.5. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
RU
3.3. Respuesta en Frecuencia de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.1. Realimentación Unitaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.2. Ganancia de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.3. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.3.4. Revisita de la Función de Sensibilidad . . . . . . . . . . . . . . . . . . . . . . . 66
3.4. Compensación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
ST
4.3. Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3.1. Incertidumbre en el Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3.2. Modelos de Incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3.3. Estabilidad Robusta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
EN
N
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.1.1. Ubicación de Polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.1.2. Control Optimo Cuadrático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
IO
5.2. Observador de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.1. Observador de Luenberger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.2. Realimentación de Estados Observados . . . . . . . . . . . . . . . . . . . . . . 137
5.2.3. Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
C
5.2.4. Control Optimo Gausiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
A. Apéndices 143
C
A.1. Modelos Dinámicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
A.1.1. Modelos de Estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
A.1.2. Modelos Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
RU
A.1.3. Matriz de Transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
A.1.4. Modelos en Tiempo Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
A.1.5. Aproximación Discreta de Controles Continuos . . . . . . . . . . . . . . . . . . 153
A.2. Diagramas en Bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
A.2.1. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
A.3. Casos de Estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
ST
1
ST
RU
C
C
IO
N
N
1
IO
C
Introducción
C
RU
ST
N
O
C
EN
Sistemas Realimentados
C
Los seres vivos interactúan permanentemente sobre su entorno, perturbando procesos
C
dinámicos de forma apropiada para llevarlos a condiciones de equilibrio deseables.
Esto es particularmente frecuente y deliberado en el caso de los humanos; en
situaciones que van desde la manipulación de objetos hasta la conducción de sistemas
RU
complejos, ya sean estos de carácter tecnológico, social, económico, biológico, etc.
palma de la mano.
C
La intervención se produce por medio del ajuste de ciertas perturbaciones que pueden
ser manipuladas de forma directa cuando sea necesario. Denominamos a estas acciones
de control, para diferenciarlas respecto de aquellas perturbaciones que están fuera de
nuestro alcance.
EN
Para desarrollar estas actividades es necesario poder observar la evolución del proceso,
y para ello se requiere de ciertas capacidades sensoriales.
N
El ente que intenta controlar el proceso (el controlador) lo observa permanentemente y
reacciona ajustando las acciones de control en función de los apartamientos observados
respecto de la condición buscada.
IO
Esta interacción da lugar a un nuevo proceso dinámico. Éste surge de la combinación
entre el proceso a controlar y el controlador, y tendrá un comportamiento diferente al
que tienen sus componentes de forma aislada. Se trata de un sistema realimentado,
C
esquematizado en la figura 1.2, al que identificamos como sistema a lazo cerrado.
C
RU
ST
En tareas que implican interactuar con el medio fı́sico los humanos aprendemos formas
adecuadas de reacción mediante el entrenamiento.
Conducir un vehı́culo, por ejemplo, es una tarea resuelta por el sistema lı́mbico de
EN
nuestro cerebro, en contraste con los procesos de carácter intelectual que resolvemos en
la corteza cerebral. Lo mismo ocurre en la práctica deportiva o en la expresión corporal.
Nuestras capacidades de control son reflejos que solo podemos adquirir mediante un
tiempo adecuado de práctica.
N
dinámico, lo cual sustituye el entrenamiento; aunque existen algoritmos para “aprender”
las reacciones correctas de forma experimental (controles adaptables).
IO
C
C
RU
Figura 1.3: Lazo de control a lazo cerrado
ST
Solo es posible plantear una estrategia de este tipo contando con un conocimiento
significativo de las propiedades dinámicas de la planta y de la condición en la cual se
encontrará en el momento de actuar sobre ella.
N
En control automático llamamos entradas a las acciones de control y perturbaciones que
actúan sobre la planta (el proceso dinámico a controlar), y salidas a las observaciones.
IO
Cuando nos referimos a un control SISO, el acrónimo SI (Single Input) hace referencia
al caso en el cual hay una única entrada que podemos manipular (acción de control).
Serı́a el caso si por ejemplo en un control térmico solo podemos actuar sobre una único
calefactor.
De forma análoga, el acrónimo SO (Single Output) se refriere a disponer datos de una
C
única variable escalar para monitorear el proceso. En el ejemplo del control térmico este
serı́a el caso si contamos con capacidad para medir temperatura en un único punto.
C
Naturalmente MI y MO hace referencia a los casos en los cuales se cuenta con entradas
y salidas múltiples. Un ejemplo claro de sistema MIMO es el del control de vuelo de un
RU
helicóptero, en donde las acciones de control son el paso cı́clico, colectivo y rotor de
cola; mientras que las entradas serán diferentes ángulos y velocidades.
Para el suministro de agua caliente se puede contar con un termotanque, que también
constituye un control ON/OFF; o con un calefón, el cual funciona como control a lazo
abierto (no cuenta con sensor de temperatura).
C
El control ON/OFF no permite en general ajustar la condición de equilibrio con alta
precisión, excepto que la conmutación pueda realizarse a alta frecuencia, como es el
C
caso de las fuentes eléctricas de tipo switching.
Cuando esto no es posible resulta necesario establecer una banda de tolerancia
alrededor del valor nominal deseado dentro de la cual no se realiza ninguna acción.
RU
La conmutación ocurre unicamente al traspasar los lı́mites de esta banda.
forma continua. Las representamos matemáticamente con números reales, más allá de
cual sea su naturaleza fı́sica (la temperatura, la concentración de glucosa en sangre, la
cotización de una divisa extranjera, etc.).
una presión constante a la salida aunque la presión de entrada fluctúe (siempre que se
mantenga por encima del valor deseado para la salida).
En la figura 1.4b se muestra un esquema del dispositivo. Un diafragma actúa como
O
sensor. Una aguja obtura proporcionalmente el paso de gas, operando como actuador.
El controlador serı́an los resortes, que establecen una apertura proporcional del paso de
gas en función de la presión diferencia entre la presión a la salida y el valor deseado
C
C
se acerca al valor deseado, incluyendo una acción proporcional a ese cambio. Esto se
denomina control derivativo, y tiene la propiedad de anticiparse a los cambios.
Por otra, en muchos casos un sistema de control logra equilibrar la planta pero con un
C
cierto error en relación al valor deseado. Esto se compensa automáticamente con una
acción integral.
RU
La combinación de las tres acciones: proporcional + integral + derivativa se conoce como
control PID, y es la estrategia más común en los sistemas de control a lazo cerrado.
La intensidad de estas acciones se puede ajustar de forma empı́rica o semi-empı́rica.
Existe en general una confusión entre lo que entendemos aquı́ como control automático
y los automatismos.
Es muy común utilizar enclavamientos lógicos para coordinar acciones de todo tipo.
O
En muchos casos de observan zonas grises para realizar esta discriminación. Por
ejemplo, un control ON/OFF podrı́a interpretarse como un enclavamiento lógico.
Al mismo tiempo en común que los sistemas de control automático incluyan enclava-
mientos lógicos para dar señales de alarma en situaciones anormales, e incluso llevar el
EN
proceso controlado a una condición segura cuando las condiciones se tornan peligrosas.
C
C
RU
ST
Ingenierı́a de Control
De lo dicho precedentemente puede deducirse que el control automático tiene aplicación
O
en muchas disciplinas.
Como ingenieros aeroespaciales estamos interesados principalmente en las aplicacio-
nes industriales, transporte y sistemas espaciales.
C
C
etc.) y analógicos (normalmente señales de 0-10V o 4-20mA generadas por diversos
tipos de sensores); y generar señales de salida de ambos tipos; aunque también
C
pueden utilizarse redes de datos informáticas estándar (RS232, Ethernet, WiFi) o de
tipo industrial (FieldBus, Profibus, etc.).
RU
La programación de estos dispositivos se realiza con interfaces gráficas desde una
computadora conectada en red con el PLC, y para su uso pueden conectarse interfaces
de operador en el piso de planta o con computadoras en una sala de control (sistemas
SCADA: Supervisory Control and Data Aquisition) para visualización, registro de datos,
realizar ajustes y enviar comandos al equipo (figura 1.7).
En control industrial la estrategia habitual es la PID, y existen dispositivos de hardware
ST
especı́ficos para ello; aunque también pueden programarse estas funciones en un PLC o
en computadoras conectadas en red con estos dispositivos (para procesos de alto nivel).
Solo en casos muy especı́ficos o para el control de procesos multi-variable se utilizan
otras estrategias.
Los sistemas de control realimentados son imprescindibles para la operación de
N
ves y vehı́culos espaciales. Sus funciones van desde controlar una única variable (por
ejemplo la velocidad en el control de crucero de un automóvil) hasta la de realizar una
misión completa de forma autónoma para descender en otro planeta.
Un piloto automático es un sistema de control diseñado para realizar tareas que realiza
EN
N
mientras Sperry nuevamente mantenı́a los brazos en
alto.
Durante la tercer pasada ambos abandonaron el cockpit mientras el avión mantenı́a su
IO
vuelo en lı́nea recta.
Naturalmente, ganaron la competencia.
C
En 1945, motivados por los riesgos que se experimentaban
en época invernal debido a las condiciones climáticas
desfavorables de las islas británicas combinadas con los
C
altos niveles de contaminación con carbón existentes en
aquellos años, se creó la unidad de desarrollo BLEU (Blind
Landing Experimental Unit) para trabajar sobre soluciones
RU
para el aterrizaje con baja visibilidad. Esto condujo en poco
tiempo al desarrollo de un sistema de aterrizaje automático,
precursor de lo que hoy conocemos como autoland.
Estos desarrollos evolucionaron aplicándose en aeronaves
militares como el English Electric Canberra y el Avro Vulcan;
ST
Estos van desde casos simples como el amortiguador de guiñada presentes en los
reactores multimotor, hasta sistemas de control de vuelo completo para aeronaves
intrı́nsecamente inestables. En particular, los aviones de combate de 4ta generación
y posteriores dependen fuertemente del SAS para poder volar.
EN
También se utilizan sistemas de control auxiliares, por ejemplo para regular la presión de
cabina. Los motores a reacción modernos cuentan con el FADEC (Full Authority Digital
Engine Controller ), que monitorea y regula completamente la operación del motor.
Los motores alternativos por su parte incluyen una unidad electrónica denominada
ECU (Engine Control Unit), que incluye lazos de control para optimizar la combustión
ajustando la inyección de combustible y la entrada de gases al turbocompresor.
C
C
RU
(b) Interfaz de comando para las funciones de un piloto automático
colapso de la URSS.
IO
C
C
RU
(c) Actitud de un satélite en órbita terrestre (d) Satélites de la CONAE
orientación de los instrumentos en el “modo ciencia” (estado del satélite cuando opera
ST
C
C
RU
ST
(a) Vehı́culo submarino autónomo (b) Mars Exploration Rovers (MER), que operaron en
Marte entre 2004 y 2019
especı́fico; ya sea que se trate de terrenos abiertos, zonas rocosas, conductos, etc.
Puede tratarse de vehı́culos comunes, articulados, caminadores, etc.
N
C
En estos casos control automático cubre la mismas funciones que las del auto-piloto
C
en las aeronaves tripuladas; aunque se trabaja activamente en paralelo al desarrollo de
nuevas configuraciones y mecánicas de vuelo.
En cuanto a vehı́culos submarinos, en la actualidad existen muchos modelos comercia-
RU
les operados de forma remota para realizar operaciones submarinas y modelos autóno-
mos de investigación.
ción tecnológica. Aunque se han sumado otras empresas, por el momento solo se co-
mercializan robots humanoides con fines lúdicos y publicitarios; pero lamentablemente
también hay desarrollos militares en este sector.
N
Control PID
Para aclarar a que clase de sistema nos referimos al hablar de un controlador
O
En la sección 1.3.3 hemos realizado una introducción para esta estrategia, que es la más
C
N
Z
de
u(t) = kp e(t) + kd (t) + ki e(t)dt (1.1)
dt 0
IO
Que también puede expresarse como
1 t
Z
de
u(t) = kc e(t) + Td (t) + e(t)dt (1.2)
dt Ti 0
C
donde Td y Ti tienen unidades de tiempo.
C
Para intentar comprender el efecto de cada uno de estos términos vamos a considerar
como ejemplo el caso de un actuador lineal.
Este puede consistir en motor eléctrico y una transmisión (tornillo y corona) o un pistón
RU
hidráulico accionado mediante una servo-válvula.
En ambos casos el servomotor permite aplicar una fuerza o torque para posicionar
(lineal o angularmente) una carga inercial, y en general para neutralizar perturbaciones
constituidas por otras fuerzas o momentos aplicados independientemente.
ST
Entre los muchos ejemplos de esta clase de sistemas tenemos el utilizado en los
lanzadores satelitales para orientar el vector de empuje de un motor cohete (ver figura
1.14a), subsistema conocido como TVC (Thrust Vector Control).
J δ̈ = Ma (t) + P (δ, t)
O
donde δ es el ángulo de desvı́o del eje de la tobera (y por lo tanto del empuje) respecto
del eje del fuselaje y Ma es el momento aplicado por el actuador. Dado que el punto de
giro (gimbal del motor) en realidad está acelerado por ser solidario al cohete, incluimos
C
una perturbación P (t) que dependerı́a de la aceleración y velocidad angular del cohete.
Mas adelante veremos un modelo más completo incluyendo la dinámica del actuador.
EN
C
motor cohete. El motor se encuentra montado en una unión cardánica
(a) Actuador lineal (color azul) para el control del vector de empuje de un (gimbal) y el actuador permite desviar el eje de la tobera en relación al
motor cohete. El actuador puede ser hidráulico o electro-mecánico. eje del fuselaje.
C
donde u se corresponde con Ma (la acción de control), x serı́a el desvı́o δ (variable de
salida) y F se corresponde a P (la perturbación).
RU
Acción Proporcional
La acción proporcional tiene un efecto equivalente al resorte de un sistema masa-
ST
resorte-amortiguador:
N
Si se sustituye el resorte por un actuador capaz de aplicar una fuerza u(t) sobre la masa,
y se instala un sensor capaz de medir el desplazamiento x(t); mediante algún dispositivo
C
Una ventaja respecto del resorte es la posibilidad de ajustar la “rigidez” variando kp , pero
además con el control proporcional serı́a posible hacer:
Esto permite ajustar la posición de reposo (equilibrio) a cualquier valor x deseado; lo cual
N
serı́a equivalente a mover el anclaje del resorte en el caso del modelo masa-resorte.
Pero sabemos que sin amortiguador la dinámica de lazo cerrado serı́a oscilatoria
no amortiguada, y por lo tanto no serı́a posible alcanzar el equilibrio luego de una
IO
perturbación. Veamos como resolver este problema.
Acción Derivativa
La acción derivativa corresponde a:
C
ud (t) = kd · ė(t) = kd · ṙ(t) − kd · ẋ(t)
C
El segundo término del lado derecho, −kd · ẋ, es equivalente al efecto que produce el
amortiguador. El primer término, kd · ṙ, implica una anticipación a los cambios o valores
futuros de la referencia (ṙ define la “tendencia” de la referencia).
RU
Para el caso de la masa libre, con el actuador podrı́amos combinar la acción proporcional
con la derivativa para sustituir el conjunto resorte-amortiguador, agregando la capacidad
de variar la respuesta del sistema tanto en velocidad (frecuencia natural) como en
relación a su factor de amortiguamiento. El control proporcional-derivativo (PD) serı́a:
ST
1
ess = F
kp
O
proporcional kp , pero nunca será posible anularlo totalmente, dado que sin error no hay
acción de control para cancelar la perturbación. Esto también tiene solución.
Pero serı́a necesario ajustar este valor de forma manual (ū = F ), y deberı́a ser
reajustado cada vez que cambie la perturbación.
Esta acción solo alcanza el equilibrio cuando e(t) = 0. Por lo tanto, si ajustando
adecuadamente los parámetros de la ley de control logramos que el sistema a lazo
N
cerrado resulte estable, aun bajo la acción de una perturbación constante el sistema
a lazo cerrado siempre convergerá a la condición de equilibrio con error nulo.
IO
El término integral es el único que permite aplicar una acción de control no-nula aunque
el error sea nulo, y por lo tanto permitirı́a neutralizar perturbaciones sin error de estado
estacionario. Pero debe advertirse que es perjudicial para la respuesta transitoria,
ya que tiende a desestabilizar el sistema y por lo tanto en muchos casos debe ser
C
compensada mediante las acciones PD. De todas formas, en procesos con dinámicas
sobre-amortiguadas (como lo es el caso de los procesos térmicos) muchas veces es
suficiente con una combinación proporcional-integral (PI).
C
1.5.2. Ajuste de Parámetros (Sintonización)
RU
Objetivos y Limitaciones
Con el ajuste de los parámetros de un controlador se busca:
ilimitada.
La acción de control u(t) siempre tiene lı́mites para sus valores máximos y mı́nimos,
y frecuentemente también hay lı́mites para su velocidad de cambio (rate limit o slew
rate en inglés). En general lo razonable es que estos lı́mites se alcancen solo de forma
EN
excepcional, dado que en esta condición (saturación) el control deja de ser efectivo
y el sistema a lazo cerrado se comporta como si estuviese a lazo abierto con una
perturbación constante u(t) = umax o u(t) = umin .
ẽ(t) = r − ỹ(t)
donde ỹ(t) es la señal entregada por el sensor, que se supone se corresponde con un
valor real y . En general podemos descomponer la medición en:
ỹ = y + η
N
donde η es lo que denominamos ruido de medición, que en general es una señal
aleatoria mediante aunque en casos puntuales puede ser determinı́stica, pero siempre
con valor medio nulo.
IO
Considerando por ejemplo una ley PD, para la acción de control real se tendrı́a:
˙ = [kp e(t) + kd ė(t)] + kp η(t) + kd η̇(t)
u(t) = kp ẽ(t) + kd ẽ(t)
C
directa con ganancia kp , y por medio de su derivada a través de kd .
Si el ruido de medición es periódico, para cualquiera de sus componentes armónicas
C
η(t) = A sin ωη t la derivada serı́a η̇(t) = ωη A sin ωη t. Resulta evidente que la acción
derivativa realzará la propagación del ruido de medición con un factor kd ωη , lo cual será
más intenso cuando mayor sea la frecuencia de la señal de ruido (más allá de que esta
RU
sea periódica o aleatoria).
Sintonización
Banda Proporcional En general existe cierta tolerancia ±etol para el error. Por otra
N
parte, como dijimos la acción de control u(t) tiene lı́mites máximos umax y mı́nimos
umin .
Un ajuste razonable para la ganancia proporcional es el de aplicar la máxima acción de
O
control cuando se alcanza el lı́mite del error. Si la tolerancia para el error es razonable
para la capacidad de actuación disponible, un ajuste lógico para la ganancia proporcional
serı́a:
C
1 umax − umin
kp =
2 etol
Esto define una “banda proporcional” para el uso del rango de control.
EN
La respuesta será más rápida y los errores serán menores si aumentamos kp , pero esto
implicará que los ruidos de medición se propaguen a la acción de control (verı́amos una
acción de control “ruidosa” aun en ausencia de perturbaciones), lo cual en algún punto
podrı́a resultar indeseable.
A su vez la respuesta en situaciones normales podrı́a resultar demasiado “intensa”,
exigiendo en exceso al actuador, y finalmente podrı́amos observar problemas de
estabilidad que con ganancias más bajas no se producen.
N
Tiempo Integral La acción integral se puede escribir como:
Z t
IO
ui (t) = ki e(t)dt
0
C
Z
1
ui (t) = kc e(t)dt
Ti 0
C
donde llamamos tiempo integral al parámetro Ti . Si el error se mantuviese constante, Ti
serı́a el tiempo que tardarı́a la integral en alcanzar el valor del error.
En un control proporcional-integral (PI):
RU
1 t
Z
upi (t) = up (t) + ui (t) = kp e(t) + e(t)dt
Ti 0
upi (0) = kp ē
1
upi (Ti ) = kp ē + ē Ti = 2kp ē
Ti
N
sistema, por lo cual solo se la utiliza en aquellas situaciones en las cuales es necesario
lograr errores nulos en estado estacionario.
LO aconsejable serı́a ajustar primero la acción proporcional y luego agregar acción
integral comenzando con valores pequeños de ki , incrementándolo hasta alcanzar el
EN
Si el error crece linealmente e(t) = d · t, la presencia de una acción derivativa con tiempo
N
derivativo Td = 1/d duplicará la acción de control del término proporcional cuando
t = Td :
upd (Td ) = kp (d Td + Td d) = 2kp e(Td )
IO
Por lo tanto el tiempo derivativo deberı́a estar en el orden del tiempo de respuesta. Un
valor mayor implicará un efecto amortiguante mayor y viceversa.
La desventaja es que este término amplificará los errores de medición de alta frecuencia.
C
Esto puede mitigarse introduciendo un “filtro pasa-bajos” en la derivada.
C
Consideremos el caso del TVC. El rango de desplazamiento es de ±60 . Supongamos
que se requiere una precisión de 0,020 en el alineamiento del eje de empuje, y que la
señal de control se encuentra normalizada de forma tal que los lı́mites se correspondan
RU
con ±1. La banda proporcional serı́a:
1
BP = = 50
0,02
Pero si el actuador está sobredimensionado, usar este valor de banda proporcional para
ST
Por ser este un sistema mecánico en principio con fenómenos disipativos de baja
intensidad (habrı́a que ver en detalle el actuador para afirmarlo), el lógico asumir que
será necesario incluir acción derivativa para amortiguar la respuesta.
N
acción integral.
C
Analógica
Podemos reconocer el uso de la acción proporcional ya en el regulador de Watt para
sus máquinas a vapor. Hacia 1907 apareció el primer controlador neumático. Empresas
C
C
RU
ST
(a) Controlador PID analógico (b) Posible circuito para un PID analógico
N
muy conocidas en la actualidad como Sperry, Taylor o Foxboro tuvieron sus orı́genes en
O
aquellas épocas.
En esas épocas también se desarrollaron controladores electro-mecánicos, pero hacia
los años ’40 los controladores PID neumáticos se utilizaban a nivel industrial.
C
Respecto del término integral podemos notar que si por ejemplo tenemos una
señal de error senoidal e(t) = A sin ωt, el integrador genera como salida ui (t) =
ki ω −1 A cos ω (t − π). La ganancia serı́a ki ω −1 .
Podemos decir que el término integral impone una ganancia variable, que tiene a infinito
para señales lentas. Esto explica por que en estado estacionario se logra el control
perfecto (error nulo para cualquier perturbación constante).
N
Naturalmente esto se pierde progresivamente cuando la referencia varı́a de forma cada
vez más rápida.
IO
Para la acción derivativa ud (t) = kd ωA cos ωt, y por lo tanto podemos realizar el
razonamiento inverso.. Pero lograr el control perfecto para señales rápidas también
genera problemas y en general no es necesario.
C
Realización Digital
Un controlador digital es una implementación de la ley de control utilizando un micro-
procesador con la electrónica necesaria (conversores A/D) para convertir las señales de
C
los sensores en números digitales y a partir de las acciones de control calculadas desde
su representación digital generar las señales analógicas correspondientes (conversores
RU
D/A).
En muchos casos los sensores dan información digital de forma directa, y los actuadores
pueden ser comandados mediante señales digitales sin requerir el uso de conversores
D/A, aunque en última instancia en problemas de ingenierı́a casi siempre habrá una
conversión D/A para que las acciones de control incidan en el mundo fı́sico.
ST
n
e(k) − e(k − 1) X
u(k) = kp e(k) + kd + ki e(h) (1.3)
ts
h=0
O
fs = 1/ts .
Mediante un reloj interno el procesador computa la (1.3) una vez cada ts segundos
para actualizar el valor de la acción de control (salida) con la última medición disponible
EN
N
Cómputos
IO
Los cómputos asociados a los ejemplos que se presentarán pueden realizarse mediante
MatlabTM o GNU Octave. En ambos casos se requiere tener instalado el paquete con
funciones especı́ficas para control.
C
En el caso de MatlabTM nos referimos al paquete denominado control toolbox.
En el caso de GNU Octave 2 es necesario descargar el paquete control y luego instalarlo
desde la ventana de comando con el comando pkg, aunque la opción -forge para
C
descargar e instalar un paquete con un solo comando:
pkg i n s t a l l − f o r g e c o n t r o l
RU
El paquete control debe ser cargado en cada sesión en la cual sea requerido:
pkg load c o n t r o l
Es posible realizar ajustes para que esto ocurra de forma automática al inicio.
ST
IO
C
Objetivos del Control
C
RU
ST
N
O
C
EN
Requerimientos
No es posible hacer un desarrollo de ingenierı́a sin contar previamente con una
especificación de requerimientos que permita orientar dicho desarrollo.
En esta sección daremos un panorama introductorio en relación a los requerimientos
27
para un sistema de controla automático.
N
2.1.1. Seguimiento de Referencias
IO
En general el objetivo básico de un sistema de control es el de lograr que ciertas variables
de un determinado proceso se ajusten a valores deseados.
C
corte tienen que seguir una evolución predeterminada para mecanizar la pieza requerida.
En el caso de un manipulador para operación remota, el “efector” del brazo robótico tiene
que “copiar” los movimientos de la mano del operador.
C
RU
En todos los casos existirán tolerancias en cuanto a la diferencia entre los valores
deseados o referencias y los valores realmente alcanzados (que consideramos salidas),
a lo que llamamos errores de seguimiento.
Por ejemplo, en el aterrizaje de una aeronave por instrumentos el objetivo del piloto
(automático o humano) es el de mantener los indicadores de error de trayectoria en cero,
N
es decir, centrar las barras de senda de planeo (glide slope) y eje de pista (localizer ) en
el indicador del ILS (ver figura 2.1) .
En condiciones climáticas adversas el seguimiento exacto será imposible, pero se espera
O
que el piloto logre mantener acotado los errores a la mitad del intervalo de la escala del
indicador.
C
Por otra parte existen sistemas diseñados especı́ficamente para lograr ciertas mejoras
en la dinámica del proceso controlado respecto de la del proceso sin controlar. Es el
caso de los sistemas de estabilidad artificial: amortiguadores de guiñada en aeronaves
O
En sı́ntesis podemos decir que para cualquier aplicación en el diseño de las estrategias
de control es necesario poner énfasis en la dinámica resultante del proceso controlado,
y veremos que tanto la capacidad de seguimiento de referencias como de rechazo de
perturbaciones (si son requeridas) dependen de ella.
EN
2.1.4. Robustez
Los procesos dinámicos reales en general varı́an con el transcurso del tiempo
(envejecimiento, desgaste, etc.), o bien varı́an al operar en diferentes condiciones.
C
Figura 2.2: Variaciones en la dinámica longitudinal de una avión bireactor de 8 plazas durante la aproximación final
RU
Por ejemplo, la dinámica de una aeronave depende fuertemente de la presión dinámica
y el número de Mach; por lo cual su comportamiento es diferente en una condición de
aproximación final respecto del vuelo en crucero.
En la figura 2.2 vemos los cambios en la dinámica de una aeronave para diferentes
ST
Un sistema de control automático debe ser capaz de cumplir con los requerimientos del
N
diseño aun bajo cambios (acotados) en la dinámica del proceso sobre el cual opera.
Llamamos a esto desempeño robusto.
O
En la figura 2.3 se muestra una estrategia que en teorı́a podrı́a alcanzar este objetivo. El
bloque f [·] es un operador matemático que representa la respuesta dinámica de la salida
y(t) ante una acción de control u(t), mientras que h[·] corresponde a la ley de control
IO
que regula u(t) en función de r(t) − d(t). Implı́citamente estamos asumiendo que esta
última se mide de alguna manera, aunque en general eso no es posible.
C
planta: h[·] = f −1 [·].
Veremos más adelante que esto tampoco es posible por diversas razones, y por lo tanto
C
el control perfecto es “irrealizable”. Sin embargo se puede lograr una aproximación a este
ideal dentro de ciertos lı́mites.
RU
El primer obstáculo para realizar un control por inversión es que toda dinámica implica
una relación integral.
Por ejemplo, desde el punto fı́sico la posición de un rı́gido es la integral de la velocidad
(matemáticamente se puede establecer también la relación inversa), y esta a su vez es
la integral de la aceleración producida por los actuadores y las perturbaciones.
La inversa de la integral es la derivada, y para señales que varı́an rápidamente su
ST
derivada al menos para señales que no cambien demasiado rápido, y por lo tanto lo
mismo puede decirse de la inversa de una dinámica genérica f [·].
O
u = h[(r − d) − z]
y como z = fˆ[u]:
u = h[(r − d) − fˆ[u]]
EN
Si |h[·]| 1 para su inversa se tiene |h[·]−1 | ≈ 0 y podemos decir que con esto:
C
u ≈ f −1 [r − d]
C
De esta forma vemos que u responde en base a una inversa aproximada de la dinámica
de la planta sin tener que invertir el modelo de forma explı́cita.
Pero se debe destacar que aun quedan otros problemas por resolver:
RU
nunca es posible modelar la dinámica de la planta de forma exacta (fˆ[·] 6= f [·]) y
además |h[·]| < ∞.
normalmente no es posible medir las perturbaciones para incluirlas en la acción
de control.
aunque lo anterior fuera posible, habrı́a que conocer además la condición inicial
ST
De esta forma se logra una inversión “implı́cita” sin necesidad de conocer la dinámica del
proceso ni tener que medir la perturbación; con la sola condición de que |h[·]| 1, sin
Pero debemos advertir que utilizar alta ganancia para la realimentación acarrea una serie
de problemas asociados a la estabilidad del sistema a lazo cerrado, y otros relacionados
con la instrumentación (sensores y actuadores).
Veremos en los próximos capı́tulos que en el diseño de un sistema de control es
necesario alcanzar una relación de compromiso entre la búsqueda del control perfecto
N
y los problemas que implica el uso de alta ganancia por las limitaciones que impone el
proceso a controlar y la instrumentación requerida.
IO
2.2.3. Realimentación y Dinámica de Lazo Cerrado
Podrı́a decirse que la temática central del control automático es en definitiva el diseño
de realimentaciones artificiales sobre algún proceso dinámico (planta) para generar uno
C
con caracterı́sticas dinámicas deseables. Es a este nuevo sistema, que antes llamamos
“proceso controlado”, al cual nos referimos al hablar de sistema a lazo cerrado.
C
Es importante comprender que el sistema de control no cambia la dinámica de la planta.
Es la interacción entre la dinámica del controlador y la de la planta lo que resulta en una
cierta dinámica de lazo cerrado, diferente tanto de la planta como del controlador.
RU
Tomemos el modelo de estados (A.4) (ver apéndice A.1) para la dinámica de la planta
junto con sus salidas (variables medidas):
y = h(x, u)
Z t
x(t) = [f (x, t) + g u (x, t)u(t) + g d (x, t)d(t)] dt (2.2)
O
0
y = h(x)
El “efecto” es la evolución del estado (lado izquierdo) mientras que las “causas” de esta
C
evolución son todos los términos que definen ẋ, es decir, el corchete dentro de la integral.
Este modelo se puede graficar como:
EN
N
Normalmente el término f (x) es no nulo, con lo cual podrı́amos decir que casi todos
los procesos dinámicos son realimentados. Si embargo, en control automático hablamos
de sistemas realimentados cuando alguna componente de u es forzada a depender del
IO
estado. Esto constituye una realimentación artificial, pero en última instancia que sistema
es realimentado y cual no es solo una cuestión de perspectiva (excepto que f (x) = 0).
C
C
RU
ST
Los sensores y actuadores también son sistemas dinámicos, con propiedades que
pueden ser descriptas con modelos matemáticos. En el diagrama precedente esa
N
dinámica quedarı́a absorbida dentro del modelo de estados, es decir, los estados
internos de estos subsistemas serı́an parte del vector x.
O
Si ambos son vectores en Rn , n > 1 se trata de un caso MIMO (Multiple Input Multiple
Output), siendo obvia la nomenclatura para escalares y vectores combinados.
Para sistemas SISO usando modelos dinámicos lineales se pueden expresar las
relaciones dinámicas entre entrada y salida mediante funciones de transferencia.
La salida en un modelo lineal de la planta será la superposición de los efectos de cada
entrada, y entre ellas la acción de control.
IO
Si por ejemplo, además de la acción de control hay una perturbación d(t):
C
C
RU
2.3.2. Sensibilidades del Lazo SISO
Podrı́amos sustituir las perturbaciones por señales equivalentes que actúe directamente
ST
sobre la salida:
F (s)
Y (s) = G(s) [U (s) + Di (s)] , Di (s) = D(s)
G(s)
O
Para construir una estructura genérica para el lazo de control se agrega en el lazo de
realimentación el ruido de medición N (s) y se identifican las tres variables de salida
relevantes para el análisis: Y (s), E(s) y U (s) (ver figura 2.6).
EN
También el rotor principal y el rotor de cola afectan el régimen de giro cuando cambia
C
el paso colectivo de cualquiera de ellos, especialmente el primero. Identifiquemos estas
perturbaciones como dp y dc respectivamente.
C
Dado que el paso colectivo del rotor principal es proporcional al movimiento del comando
de paso colectivo (figura 2.8a), la posición de este mando da información directa de la
RU
perturbación.
Sin embargo, esta no se suma directamente a la entrada o a la salida, como se muestra
en la figura 2.6. Para calcular una perturbación de salida do “equivalente” habrı́a que
considerar la transformación dinámica f1 [·] que hay sobre el paso colectivo antes de
producir un efecto en la salida y (el régimen de giro del motor). Lo mismo puede
decirse para el rotor de cola, con lo cual la perturbación equivalente serı́a de la forma
ST
do = f1 [dp ] + f2 [dc ].
Dado que la dinámica f1 [·] es similar a la que relaciona la apertura de la mariposa u con
la salida f [·], es decir f1 [·] ≈ f [·], es lógico pensar en estos efectos como perturbaciones
de entrada. Más aun, una estrategia común para compensarla al menos parcialmente
N
Y (s) K(s)G(s)
T (s) = = (2.3)
R(s) 1 + K(s)G(s)
De la misma forma podemos evaluar la transferencia entre la referencia y el error:
E(s) 1
S(s) = = (2.4)
R(s) 1 + K(s)G(s)
N
rotor de cola se comanda con pedales y servo-motor del governor rador
IO
Esta misma relación coincide con la sensibilidad de la salida Y (s) a la perturbación de
salida Do (s).
Entre estas dos funciones de sensibilidad existe una restricción fundamental indepen-
C
diente del caso analizado:
C
Llamamos a S(s) función de sensibilidad y a T (s) sensibilidad complementaria.
RU
Podemos determinar otras funciones de interés identificando las trayectorias directas, ya
que el lazo de realimentación es el mismo en todos los casos:
Y (s) G(s)
Si (s) = = = S(s)G(s) (2.6)
Di (s) 1 + K(s)G(s)
ST
Y (s)
So (s) = ≡ S(s) (2.7)
Do (s)
U (s) K(s)
Su (s) = = = S(s)K(s) (2.8)
N (s) 1 + K(s)G(s)
N
Y (s) 1 K(s)G(s) G(s) 1 1
Di (s)
= (2.9)
U (s) 1 + K(s)G(s) K(s) K(s)G(s) K(s) K(s)
Do (s)
N (s)
C
Puede observarse que todas las sensibilidades quedan definidas por cuatro funciones
fundamentales: T (s), S(s), Si (s) y Su (s), que comparten como denominador la
expresión 1 + K(s)G(s).
EN
1 + G(s)H(s) = 0 (2.10)
Es obvio que las raı́ces quedan definidas por el producto L(s) = G(s)H(s), a lo cual
denominaremos dinámica de lazo abierto; pero normalmente los polos de lazo abierto y
los de lazo cerrado son diferentes.
N
Como L(s) es una función racional (cociente de polinomios), puede representarse como:
IO
B(s)
L(s) =
A(s)
donde A(s) es un polinomio de orden n y B(s) uno de orden ≤ n. Con esto la ecuación
C
caracterı́stica se puede escribir como:
B(s)
1+ =0
C
A(s)
Dado que entre las diferentes sensibilidades puede haber cancelaciones entre polos y
N
ceros, la estabilidad no puede evaluarse a partir de una sola de ellas; pero sı́ podemos
afirmar que el lazo es internamente estable si las cuatro sensibilidades mencionadas son
estables.
O
Ambas cosas compatibles y de hecho podemos decir “caras de una misma moneda”,
si consideramos la restricción fundamental dada por la ecuación (2.5) que podemos
reescribir como:
S(s) = 1 − T (s) (2.13)
N
intensas de control ante una cierta magnitud de error. Esto podrı́a llevar a alcanzar
los valores máximos admisibles de la acción de control (saturación) aun ante errores
pequeños, lo cual suele resultar inaceptable desde el punto de vista práctico.
IO
Restricciones por Ruido de Medición Ganancias elevadas, especialmente a frecuen-
cias altas, tenderán a amplificar y propagar el ruido de medición a la acción de control.
En casos extremos la acción de control podrı́a terminar dominada por los ruidos de me-
C
dición.
C
Restricciones por Incertidumbre Dinámica Las leyes de control se diseñan en base
a un modelo dinámico del proceso a controlar, que por definición no es exacto. En general
este modelo representa correctamente la dinámica del sistema para movimientos lentos,
RU
compatibles con el comportamiento esperado del sistema a lazo cerrado.
Si se pretende de este último una respuesta más rápida será necesario refinar el modelo
para incluir efectos originalmente despreciados. Estos suelen ser difı́ciles de modelar, y
muchas veces implica lidiar con parámetros variables según la condición de operación.
De hecho, este cambio en las entradas podrı́a tener alguna ley de evolución temporal
C
Los errores en el régimen transitorio son inevitables, pero se puede trabajar sobre
la dinámica de lazo cerrado para ajustar algunos aspectos de este transitorio,
especialmente su duración (tiempo de establecimiento) y amortiguamiento (es decir,
evitar oscilaciones excesivas).
N
Perturbaciones de Tipo 1/sk
Para determinar el error de estado estacionario a partir de las funciones de transferencia
IO
del lazo podemos recurrir al Teorema del Valor Final, que aplicado al error resulta:
C
Si evaluamos lo que ocurre con este error ante un cambio en la referencia tendremos:
1
ess = lı́m sS(s)R(s) = lı́m s R(s) (2.15)
s→0 s→0 1 + L(s)
C
En el análisis que podemos encontrar en los libros clásicos como [Oga98] o [Kuo]
se considera habitualmente el error de respuesta a una referencia escalón, rampa o
RU
parábola:
1 1 1
R(s) = ess = lı́m s (2.16)
sk s→0 1 + L(s) sk
donde k = 1, 2, 3, · · · se corresponde a escalón, rampa, parábola, etc. Si descompone-
mos la transferencia de lazo abierto en el producto de una función L̄(s) sin polos en el
ST
origen y normalizada con ganancia 1 a frecuencia cero (L̄(0) = 1) y otro término L0 /st
con el resto de la dinámica de lazo abierto (L0 = L(0)):
s 1 st−k+1
ess = lı́m = lı́m
s→0 L0 sk s→0 st + L0
N
1 + t L̄(s)
s
En el caso de una entrada escalón k = 1:
O
1
st si t = 0
eescalon = lı́m t = 1 + L0 (2.17)
s→0 s + L0
0 si t > 0
C
A la cantidad t de polos en el origen del lazo abierto se la designa como tipo de sistema.
Vemos que un sistema de tipo 0 tendrá un error constante al escalón, tanto más chico
cuanto mayor sea su ganancia a frecuencia cero. Un sistema con tipo mayor a 0 tendrá
error nulo al escalón.
EN
Veamos el caso de la respuesta de lazo cerrado para un sistema térmico simple con
control proporcional:
C kp C
G(s) = , K(s) = kp , L(s) = K(s)G(s) =
Ts + 1 Ts + 1
N
El lazo es de tipo 0 (ni G(s) ni K(s) tienen polos en el origen), y la ganancia a frecuencia
cero es L(0) = kp C . La transferencia a lazo cerrado es:
IO
kp C
T (s) =
T s + kp + 1
C
referencia y a un cambio lineal (rampa):
C
RU
ST
N
Vemos que hay un error en estado estacionario constante, mientras que para la rampa el
error crece sin lı́mite ya que la pendiente de la respuesta tiene una diferencia constante
respecto de la pendiente de la referencia.
O
Para el escalón (en este caso de amplitud el escalón 550 − 100 = 450 y kp C = 10) el
error de estado estacionario es:
C
1 1
ess = 55 = 450 = 4,10
1 + L0 1 + kp C
EN
Podemos ver que los polos y ceros de lazo abierto no tienen ninguna influencia sobre el
estado estacionario, a excepción de aquellos en el origen. En los casos con error no nulo,
este será tanto menor cuando mayor sea la ganancia. Estos resultados se sintetizan en
la tabla 2.1.
Debe destacarse que la acción integral en el control PID incrementa el tipo de sistema
en 1, y por lo tanto garantiza error nulo en estado estacionario a referencias constantes.
N
Cuadro 2.1: Errores de estado estacionario para modelos de perturbación 1/sk
IO
Los mismos resultados se obtiene si consideramos el error de estado estacionario
ante una perturbación equivalente a la salida. Desde la perspectiva del error,
tanto la referencia R(s) como la perturbación de salida Do (s) pueden considerarse
genéricamente como una misma perturbación.
C
Pero en el caso de una perturbación de entrada hay una diferencia:
G(s)
ess = lı́m sSi (s)Di (s) = lı́m s Di (s)
C
s→0 s→0 1 + K(s)G(s)
1
= lı́m s Di (s)
s→0 G−1 (s) + K(s)
RU
Si G(s) no tiene ceros en el origen, lı́m G−1 (s) = cte, con lo cual:
s→0
1
ess = lı́m s Di (s)
s→0 c + K(s)
ST
En este caso los polos y ceros de la planta no tienen incidencia sobre el error en estado
estacionario. Solo interesa la ganancia y los polos del controlador K(s).
A partir del diagrama 2.6 para un lazo de control podemos diagramar las sensibilidades
del error a las referencias o perturbaciones de salida por un lado (función S(s)) y a
N
Figura 2.9: Replanteo de la figura 2.6 para poner en evidencia las sensibilidades del error a las distintas entradas del lazo SISO
N (s)
P (s) =
N
D(s)
De forma genérica podemos esquematizar la relación entre perturbación y error de la
IO
siguiente forma:
C
C
El error en estado estacionario serı́a:
RU
Ld (s) N (s)
ess = lı́m s ·
s→0 1 + Ld (s)Gr (s) D(s)
Expresando ambas transferencias como funciones racionales Ld (s) = Bd (s)/Ad (s) y
Lr (s) = Br (s)/Ar (s) :
ST
Bd (s)
Ad (s) N (s) Bd (s)Ar (s) N (s)
ess = lı́m s = lı́m s ·
s→0 Bd (s) Br (s) D(s) s→0 Ad (s)Ar (s) + Bd (s)Br (s) D(s)
1+
Ad (s) Ar (s)
N
N (s)Bd (s)Ā(s)
ess = lı́m s
s→0 Alc (s)
EN
En palabras esto significa que el error de estado estacionario será nulo si el denominador
del lazo de realimentación incluye un “modelo” de la perturbación, es decir, D(s) es un
factor de A(s).
Esta es una generalización de lo visto para perturbaciones c/sk (escalón, rampa, parábo-
la, etc.) en donde necesitamos un factor sk en el denominador de la realimentación.
N
IO
C
C
RU
ST
N
O
C
EN
IO
C
Análisis Clásico de Sistemas SISO
C
RU
ST
N
O
C
EN
En el este capı́tulo veremos los métodos clásicos para evaluar el impacto en la dinámica
de lazo cerrado T (s) de cambios en la dinámica de lazo abierto L(s) enfocándonos en
el análisis de la ecuación caracterı́stica de lazo cerrado (2.10).
45
Lugar de Raı́ces
La ecuación caracterı́stica de lazo cerrado (2.10) puede escribirse también como:
Desde el punto de vista de los modos de respuesta de lazo cerrado, que la dinámica esté
distribuida entre G(s) y H(s) es irrelevante.
Dado que L(s) es una función compleja, hay que ver a la constante −1 en la ecuación
N
(3.1) como un número complejo con parte imaginaria nula. Este tiene una magnitud 1
y un argumento ± (2n + 1) π, n ∈ N. Por lo tanto, la ecuación caracterı́stica de lazo
cerrado se puede expresar en término de dos relaciones ecuaciones reales:
IO
|L(s)| = 1 (3.2)
∠L(s) = ± (2n + 1) π n = 0, ±1, ±2, · · · (3.3)
C
donde n ∈ R. Llamamos condición de módulo a la restricción dada por la ecuación (3.2),
y condición de ángulo a la establecida por la ecuación (3.3).
C
Si la ganancia de lazo abierto varı́a en un factor λ ∈ R habrá una afectación sobre la
condición de módulo pero no en la de ángulo.
Para una determinada dinámica de lazo abierto λL(s), cualquier punto del plano s
RU
cumplirá la condición de módulo para algún valor de λ, pero solo un subconjunto de
ellos cumple las condición de ángulo.
Por lo tanto, si cambia el valor de λ los polos de lazo cerrado (raı́ces de la ecuación
caracterı́stica (2.10)) se desplazarán en el plano s sobre un conjunto de curvas que
agrupan aquellos puntos del plano complejo que cumplen la condición de ángulo.
A este subespacio del plano complejo se lo denomina lugar geométrico de las raı́ces
ST
Podemos decir que el lugar geométrico de las raı́ces para un sistema realimentado es el
subespacio del plano complejo en donde:
se ubicarı́an los polos de lazo cerrado al modificar la ganancia de lazo abierto con
N
un factor λ : [0 : ∞)
se cumple con la condición de ángulo (3.3)
O
N
IO
C
C
RU
ST
b = 8000;
num = [b k ];
den = [1 0 0 ] ;
O
r l o c u s ( num , den )
Hemos remarcado con flechas la dirección de desplazamiento de las raı́ces de la
C
ecuación caracterı́stica (que son los polos de lazo cerrado) cuando se aumenta λ (que
en este caso implica disminuir la masa).
Esto indica que un decremento en la masa (incremento de λ) aumentará el factor
de amortiguamiento y la frecuencia natural de los polos del sistema. Para un valor lo
EN
suficientemente chico tendremos una dinámica con amortiguado crı́tico (un polo doble
en el eje real negativo) y a partir de ahı́ se tendrá una respuesta sobre amortiguada. AL
N
Si dividimos a ambos lados de la última igualdad por el término entre corchetes
obtenemos:
IO
−1
k b k
1+ 1 + =1+ =0
ms2 ms s (ms + b)
C
1
L(s) = k
s (ms + b)
C
para analizar el efecto de la rigidez en la dinámica del sistema masa-resorte-
amortiguador.
RU
3.1.1. Análisis de la Ecuación Caracterı́stica de Lazo Cerrado
Como L(s) es una función racional (cociente de polinomios), puede representarse como:
ST
B(s)
L(s) =
A(s)
b0 sn + b1 sn−1 + · · · + bn−1 s + bn
= n
s + a1 sn−1 + · · · + an−1 s + an
(s + z1 )(s + z2 ) · · · (s + zn ) B̄(s)
N
=k =k (3.4)
(s + p1 )(s + p2 ) · · · (s + pn ) A(s)
donde −z1 , −z2 · · · − zn son las raı́ces del numerador o ceros del lazo abierto L(s),
O
mientras que −p1 , −p2 · · ·−pn son las raı́ces de su denominador o polos de lazo abierto.
La constante real k se suele llamar ganancia, aunque también llamamos ganancia al
cociente bn /an , que es la “ganancia a frecuencia cero”.
C
Las raı́ces de (2.11) o (2.10) son equivalentes y cumplen tanto la condición de módulo
como la de ángulo. Con el modelo propuesto para L(s) podemos ver que:
EN
B̄(s)
1 + L(s) = 1 + k =0 → Alc (s) = A(s) + k B̄(s) = 0 (3.5)
A(s)
Queda claro que las raı́ces del polinomio de lazo cerrado Alc (s) cambiarán si cambia k .
Puede notarse que si k → 0, Alc (s) → A(s), con lo cual podemos decir que los polos
de lazo cerrado tienden hacia los polos de lazo abierto para valores pequeños del factor
k . El caso lı́mite es k = 0, que equivale a eliminar la realimentación.
Sintetizamos esto diciendo que las ramas del lugar de raı́ces arrancan en los polos de
lazo abierto y terminan en sus ceros. Como en general el la función L(s) es estrictamente
propia (el orden del polinomio numerador es menor que el del denominador), se tienen
mas polos que ceros a lazo abierto. En ese caso hay ramas que terminan en ceros
infinitos z = ∞ejθ .
N
3.1.2. Interpretación de las Condiciones de Módulo y Ángulo
IO
Para evaluar las condiciones (3.2) y (3.3) tenemos que determinar el módulo y argumento
de las expresión (3.4). Para ello es conveniente expresar los números complejos en
forma polar:
C
p
s = a + j b = |s|ej∠s , |s| = x2 + y 2 , ∠s = tan−1
a
La suma de complejos se puede interpretar como suma vectorial en R2 . En la siguiente
C
figura se muestra una interpretación gráfica de un término s+p (tener presente que tanto
s como p son números complejos y pueden ser representados con vectores en el plano
C):
RU
ST
N
O
A · B = |A||B| ej∠A+∠B
C
Para el cociente:
A |A| j∠A−∠B
= e
B |B|
EN
|B(s)| |s + z1 ||s + z2 | · · · |s + zm |
|L(s)| = =k
|A(s)| |s + p1 ||s + p2 | · · · |s + pn |
B1 B2 · · · Bm
=k
A1 A2 · · · An
C
donde Bk = |s + zk | y Ak = |s + pk |; y
RU
∠L(s) = ∠B(s) − ∠A(s)
= ∠(s + z1 ) + ∠(s + z2 ) + · · · ∠(s + zn )
− ∠(s + p1 ) − ∠(s + p2 ) · · · − ∠(s + pn )
Xm Xn
= φk − θk
ST
k=1 k=1
En base al razonamiento gráfico propuesto podemos ver que para un lazo abierto:
1
O
L(s) =
s (s + 2)
−−−→
vectores →
−s y s + 2. Ambos son polos y por lo tanto sus argumentos restan.
Para este caso podemos notar que cualquier punto de la recta vertical Re {s} = −1
cumple con la condición de ángulo, ya que −θ1 − θ2 = −1800 . Por lo tanto esa recta es
parte del lugar de raı́ces de este ejemplo.
EN
C
la ubicación de polos y ceros de lazo abierto en el plano complejo.
Una de ellas ya ha sido mencionada, y establece que hay una rama de esta gráfica por
cada polo de lazo abierto, que parte desde este y converge hacia algún cero de lazo
C
abierto cuando la ganancia tiende a infinito.
Hemos dicho también que como las funciones de transferencia para sistemas reales
tienen más polos que ceros (son funciones estrictamente propias), algunas de las ramas
RU
convergen a ceros en el infinito siguiendo la dirección de ciertas “ası́ntotas”. La cantidad
de ası́ntotas será igual al grado relativo del lazo abierto, definido como la diferencia entre
cantidad de polos np y cantidad de ceros nz .
P P
pj − zj
σa = (3.6)
np − nz
y forma ángulos
N
± (2n + 1) π
θa = , n = 0, 1, · · · (3.7)
np − nz
O
Esto significa que cuanto mayor sea el grado relativo, mayor será la cantidad de ası́ntotas
y menor será el intervalo angular entre ellas. A su vez, la intersección entre ellas estará
tanto más a la izquierda cuando más a la izquierda estén los polos y más a la derecha
C
“estabilizante”).
Cuando se agrega un polo se da exactamente lo contrario (efecto “desestabilizante”).
N
Alc (s) y determinar si este tiene raı́ces en el semiplano derecho del espacio complejo
(C+ ).
Para un polinomio concreto esto se puede resolver con el comando roots().
IO
Supongamos que queremos averiguar las raı́ces de A(s) = s3 + 3s2 + 3s + 10.
Podemos hacer el cómputo con el siguiente código:
C
% representamos un p o l i n o m i o colocando sus c o e f i c i e n t e s en un v e c t o r
% comenzando con e l que corresponde a l a mayor p o t e n c i a de s
C
A = [1 3 3 10];
roots (A)
RU
ans =
− 3.0801 + 0.0000 i
0.0400 + 1.8014 i
0.0400 − 1.8014 i
Vemos que hay un par de raı́ces complejas conjugadas en C+ (parte real positiva).
ST
Pero esta forma directa no es útil cuando existen parámetros variables en el polinomio.
Para esos casos existen algunas alternativas.
N
Una consideración importante que se plantea en este criterio es que cualquier polinomio
C
en donde haya un cambio de signo en sus coeficientes tendrá raı́ces con parte real
positiva. Si el polinomio analizado es Alc , esto equivale a polos inestables de lazo
cerrado.
EN
B(s) s−1
L(s) =
A(s) s (s + 1) (s + 2)
N
Criterio de Estabilidad de Hurwitz
La inexistencia de cambios de signo es una condición necesaria para que todas
IO
las raı́ces del polinomio estén en C− , pero no es suficiente. El criterio de Routh
complementa esta condición con la construcción de una tabla de evaluación para
determinar la existencia de raı́ces positivas.
C
En contraste, el criterio de estabilidad de Hurtwitz da condiciones suficientes para
cualquier polinomio.
Este se basa en evaluar los menores principales de una matriz construida con los
C
coeficientes del polinomio. Este se presenta en [Oga10, A-5-18, p. 252] y en ediciones
anteriores.
RU
Mencionamos este criterio puntualmente porque es común en la bibliografı́a decir que
un polinomio es “Hurwitz” para indicar que no tiene raı́ces en C+ .
casos puede tener sentido utilizar ganancias negativas. En ese caso la ecuación
caracterı́stica de lazo cerrado (2.10) se transforma en:
1 − G(s)H(s) = 0 (3.8)
6.1 - Introducción
6.2 - Gráficas del lugar geométrico de las raı́ces
Conceptos Interesantes
N
6.3 - Gráfica del lugar de las raı́ces con MATLAB:
• sistemas condicionalmente estables
• sistemas de fase no mı́nima
IO
6.4 - Lugares de raı́ces de sistemas con realimentación positiva.
C
diagrama complementario
C
Criterio de Nyquist
RU
Harry Nyquist (fı́sico e ingeniero sueco-estadounidense) publicó en 1932 un artı́culo
sobre la estabilidad de amplificadores de retroalimentación, en el cual presentó lo que
hoy conocemos como criterio de estabilidad de Nyquist.
Su propuesta es determinar la estabilidad de un sistema a lazo cerrado a partir del
conocimiento de la dinámica de lazo abierto sin realizar un cálculo explı́cito de los polos
de lazo cerrado.
ST
Estabilidad del lazo cerrado implica que todas las raı́ces de su ecuación caracterı́stica
(2.10) estén en el semiplano izquierdo del espacio complejo C− . Ya hemos mencionado
los criterios de Routh y Hurwitz como formas de indagar esto, y también hemos dicho
que en la actualidad es muy fácil computar la dinámica de lazo cerrado y evaluar de
N
forma directa la ubicación de sus polos cuando todos los parámetros están definidos.
Lo que buscamos aquı́ es poner en evidencia el impacto que tendrı́a un cambio en la
dinámica de lazo abierto sobre la estabilidad del lazo cerrado.
O
s−1
F (s) =
s+1
Esta función tiene un cero en s = 1 y un polo en s = −1.
En las gráficas del lado izquierdo de la figura puede notarse que para trayectos que
encierran solo al polo (a) o al cero (b), el mapeo del trayecto encierra al origen en sentido
N
negativo y positivo respectivamente; mientras que en los otros casos Z − P = 0 y el
mapeo no encierra al origen (N = 0).
IO
3.2.2. Estabilidad del Lazo Cerrado
C
Si tomamos una curva cerrada C+ que encierre todo el semiplano derecho del plano
complejo C+ :
C
RU
ST
Como polos F (s) = 1 + L(s) son los polos de L(s), y los ceros o raı́ces de F (s) =
1 + L(s) son los polos de lazo cerrado, vemos que:
C
Conociendo P (se asume que sabemos cuantos polos inestables tiene el lazo abierto) y
EN
Z =N +P (3.10)
Por simplicidad podemos hacer una traslación del espacio transformado llevando el
origen al punto −1 y usando como transformación F (s) = L(s).
El resultado es el mismo, pero ahora debemos evaluar los encierros al −1.
Figura 3.4: Algunos ejemplos del “teorema del encierro” (tomado de [Oga10]). En los casos (a) y (b) hay encierro al origen de la
curva transformada, mientras que en los (c) y (d) no. Observar a la izquierda la cantidad de polos y ceros en la región acotada
por la curva original.
de lazo abierto.
Al evaluar el tramo C∞ se tiene s = ∞ ejθ . El módulo de la transformación serı́a:
|∞ ejθ + z1 | · · · |∞ ejθ + zm |
|L(∞ ejθ )| = k =0 si np > nz
|∞ ejθ + p1 ||∞ ejθ + p2 | · · · |∞ ejθ + pn |
N
Por lo tanto, graficando la respuesta en frecuencia de lazo abierto en forma polar (por
ejemplo usando el comando nyquist()) y observando los encierros al punto F (s) = −1,
podemos determinar la cantidad de polos inestables de lazo cerrado a partir de (3.10).
C
C
Para rodear un polo de lazo abierto en jω0 se tiene:
RU
π π
s = jω0 + lı́m ejθ , θ = (− , + ) (3.11)
→0 2 2
En la figura 3.5 se muestra el caso de un lazo abierto con polo en el origen. Para este
caso la trayectoria de Nyquist es C+ = Cj − ∪ C ∪ Cj + ∪ C∞ .
Al recorrer el arco infinitesimal C el módulo de la transformación es ∞ (lo opuesto a
ST
lo que ocurre al recorrer C∞ ). Esto hace que las trazas de lazo abierto para s = +jω
y s = −jω (Cj + y Cj − respectivamente) se unan con un arco de radio infinito del lado
derecho del plano de Nyquist.
Algo similar se debe hacer con polos complejos conjugados de lazo abierto en cualquier
otra ubicación sobre el eje imaginario.
N
Si el lazo abierto tuviese un atraso de fase adicional dado por el arco identificado como
M F , el lazo cerrado quedarı́a en el lı́mite de la inestabilidad (de hecho ya no tendrı́a
estabilidad asintótica). A este arco se lo denomina margen de fase.
N
7.5 - Criterio de estabilidad de Nyquist
7.6 - Análisis de estabilidad
7.7 - Análisis de estabilidad relativa
IO
Conceptos Principales
formas de las gráficas polares para la respuesta en frecuencia
gráfica polar para funciones de transferencia con polos en el eje imaginario
C
teorema del encierro
planteo de Nyquist para evaluar estabilidad de lazo cerrado
resultado de transformar la ”trayectoria de Nyquistçon la función de transferencia
C
de lazo abierto
criterio de estabilidad de Nyquist
márgenes de estabilidad, y relación entre estos y la respuesta de lazo cerrado
RU
Respuesta en Frecuencia de Lazo Cerrado
3.3.1. Realimentación Unitaria
ST
L(s)
T (s) = H −1 (s) (3.13)
O
1 + L(s)
Esto se muestra en la figura 3.7. Los polos de lazo cerrado quedan definidos por el
término de la izquierda. El término H −1 (s) afecta puntualmente a la variable Y (s), y sus
C
|L(jω)|
|T (jω)| = (3.14)
|1 + L(jω)|
N
En la siguiente figura 3.8 podemos identificar numerador de la expresión precedente
(longitud del vector azul) y el denominador (longitud del vector verde, que surge de sumar
el rojo con el azul)
IO
Es evidente que en aquellos valores de ω para los cuales Re {L(jω)} = 0,5 la ganancia
del lazo cerrado definida por la ecuación 3.12 será M = |T (jω)| = 1.
Podrı́amos decir que independientemente de la dinámica de lazo abierto considerada, la
C
recta Re {L(jω)} = 0,5 es una curva de ganancia de lazo cerrado M = 1.
Podemos computar como son las curvas para otros valores de M , y con eso hacer una
C
grilla de ganancias constantes de lazo cerrado. Separando parte real e imaginaria:
|X + jY | X2 + Y 2
M= → M2 =
|1 + X + jY | (1 + X)2 + Y 2
ST
Por lo tanto:
M 2 (1 + 2X + X 2 ) + M 2 Y 2 = X 2 + Y 2
X2 1 − M 2 − 2M 2 X − M 2 + 1 − M 2 Y 2 = 0
M2 M2
N
X2 + 2 2
X+ 2 +Y2 =0
M −1 M −1
O
C
EN
Figura 3.9: Grillas para la determinación de la respuesta en frecuencia de lazo cerrado a partir de la traza de nyquist del lazo
abierto (tomado de [Oga98])
C
Finalmente:
RU 2
M2 M2
X+ +Y2 = 2
M2 − 1 (M 2 − 1)
Esta es la ecuación de una circunferencia con centro en {C, 0} siendo C = M 2 /(1−M 2 )
y de radio R = |C|/M . El resultado se muestra en la figura 3.9a para diferentes valores
de M .
ST
De forma análoga se puede evaluar el lugar geométrico para el atraso de fase del lazo
cerrado (ver figura 3.9b). El desarrollo detallado puede verse en [Oga98, sec.7-8, p. 477].
N
Pico resonante de lazo cerrado En la figura 3.9a se puede ver que todas las curvas
M a la izquierda de M = 1 (parte real < −0,5) corresponden a ganancias de lazo
cerrado mayores a 1 (0db).
O
Si el lazo abierto se aproxima al punto −1, el lazo cerrado tendrá picos resonantes de
alta ganancia.
Dado que un lazo abierto con buenos márgenes de fase y ganancia implica un buen
C
Esto se puede explicar de otra forma. Viendo la ecuación (3.14) podemos notar que:
EN
|L(jω)|
|T (jω)| = = |L(jω)||S(jω)|
|1 + L(jω)|
Por lo tanto se tendrán ganancias |T (jω)| > 1 en aquellas frecuencias para las cuales
|L(jω)| > |S(jω)|−1 . Notando que:
|S(jω)|−1 = |1 + L(jω)|
N
Y (s) km
G(s) = = 2
U (s) s (s + q)
IO
donde y representa la posición de la superficie, u es el voltaje de alimentación del motor,
km es una constante que depende de parámetros eléctricos y mecánicos y q el ”polo
eléctrico”.
Con un control PD el lazo abierto resulta:
C
kc (s + z) km
L(s) =
(s + p) s2 (s + q)
C
En la siguiente figura mostramos las funciones de sensibilidad del lazo cerrado a la
izquierda (en escala semi-logarı́tmica, con ganancias en valor absoluto) y el diagrama
RU
de Nyquist de lazo abierto a la derecha para dos ajustes del control PD (lineas gruesa y
finas).
Se observa en el diagrama de Nyquist que con el segundo ajuste (trazo fino) el lazo
abierto se aproxima más al −1, disminuyendo el margen de fase. En consecuencia se
observa en la respuesta en frecuencia de lazo cerrado mayores picos de sensibilidad y
sensibilidad complementaria.
ST
N
O
C
EN
En la siguiente figura se puede observar la relación entre un mayor pico en las funciones
de sensibilidad con el amortiguamiento de las respuestas transitorias.
C
Del lazo cerrado en general esperamos T (0) = 1 (0 db) y S(0) = 0. Esto equivale a un
control perfecto para referencias o perturbaciones lentas.
C
La función T (jω) se corresponde con un filtro pasa bajos, y como |T (0)| ≈ 0db,
√ se corresponde con la frecuencia ωbw para la cual
por definición el ancho de banda
|T (jωbw )| − |T (0)| = −3db (1/ 2 en valor absoluto).
RU
De forma complementaria, la función T (jω) se corresponde con un filtro pasa altos, y
como |S(j∞)| ≈ 0db, por definición la frecuencia de paso se corresponde con el valor
ωps para la cual |S(jωps )| − |S(j∞)| = −3db.
para S(jω) se dará a una frecuencia algo menor (dependiendo del margen de fase).
Por lo tanto podemos decir que:
ωps < ωc < ωbw (3.15)
C
Dado que esto es fácil de ajustar con un ajuste en la ganancia de lazo abierto, alterando
la frecuencia de cruce podemos ajustar (al menos en orden de magnitud) el ancho de
banda de T (jω) y la frecuencia de paso de S(jω).
EN
Conceptos Principales
ST
∂L(s)/L(s). Derivando (3.12) (usando L(s) en lugar de G(s)) con la regla de la cadena:
∂T (s)/T (s) ∂T (s) L(s) ∂T (s)
S(s) = = = [1 + L(s)]
∂L(s)/L(s) ∂L(s) T (s) ∂L(s)
EN
N
Si consideramos s = jω , la expresión anterior indica que la dinámica de lazo cerrado
será poco sensible a los cambios en el lazo abierto en el rango frecuencias en donde
T (jω) ≈ 1. Dado que hablamos de una cantidad compleja, esto implica |T (jω)| ≈ 1 y
IO
∠T (jω) ≈ 0.
Esto es ası́ en general hasta una frecuencia una década por debajo del ancho de banda
de lazo cerrado. Para frecuencias en el orden del ancho de banda la sensibilidad crece,
y para altas frecuencias |T (jω)| → 0 y por lo tanto |S(jω)| → 1.
C
Sin embargo, como un cambio porcentual de un valor pequeño es igualmente pequeño
(aunque sea de un 100 %), los cambios que tenga la planta respecto del modelo para
altas frecuencias no es relevante.
C
Concluimos preliminarmente que el lazo cerrado será sensible a cambios en la dinámica
L(s) si estás se manifiestan en frecuencias próximas al ancho de banda de lazo cerrado,
RU
mientras que lo que ocurra una década por encima o por debajo no será muy relevante.
Simplificación de Modelos
Una dinámica G1 (s) de primer orden con un polo p tiene para una frecuencia ω = p una
ganancia de −3db (para este caso p coincide con su ancho de banda) y un atraso de
fase −450 .
ST
Para una frecuencia una octava menor (ω = p/2) la ganancia se aproxima a 1 (0,9) y
el atraso de fase es significativo (≈ −260 ). Pero para una frecuencia una década menor
(ω = p/10) la ganancia es prácticamente 1 y el atraso de fase menor a −60 .
Por lo tanto podemos decir que G1 (jω) ≈ 1 si ω < p/10.
N
Para una dinámica de segundo orden se observa algo similar. En la figura 3.10 se
muestra la respuesta en frecuencia de un modelo de segundo orden prototipo con
amortiguamiento 0,7 y ancho de banda ωbw = 1s−1 (con este factor de amortiguamiento
O
A frecuencia ωbw /10 (una década menor al ancho de banda) vemos que la ganancia es
prácticamente 1 (0db), mientras que el atraso de fase es pequeño (≈ −80 ).
En sı́ntesis podemos decir que en general G(jω) ≈ 1 si ω < ωbw /10. Por lo tanto para
EN
Por otra parte, para un sistema de control a lazo cerrado la función de sensibilidad es
pequeña en baja frecuencia.
Figura 3.10: Validez de la hipótesis de control perfecto para una dinámica dominante de segundo orden
C
EN
C
A partir de lo dicho en la sección precedente podemos decir que cambios en la dinámica
de lazo abierto para frecuencias pequeñas en relación a la frecuencia de paso de
la función de sensibilidad no tendrán un impacto significativo en la dinámica de lazo
RU
cerrado.
Pero un polos p introduce un atraso de fase de −900 para frecuencias ω > 10·p, mientras
que de forma similar un cero aporta un adelanto de 900 . Por lo tanto no podemos eliminar
polos y ceros de baja frecuencia de forma aislada, pero si lo podemos hacer en pares;
dado que los atrasos de fase se compensan.
ST
En sı́ntesis, un conjunto de igual cantidad de polos y ceros con frecuencias una década
por debajo de la frecuencia de cruce ωc tendrá un impacto poco significativo en la
dinámica de lazo cerrado, y por lo tanto podrı́an ser eliminados del modelo para el diseño.
Pico de Sensibilidad
N
En la figura 3.8 se puede notar que la distancia entre un punto de la traza de Nyquist
de lazo abierto y el punto −1 es la inversa de la función de sensibilidad S −1 (jω) (vector
verde).
O
Por lo tanto, la menor distancia entre estos elementos se dará en donde la función de
sensibilidad tenga un máximo, es decir, un pico de sensibilidad.
EL pico de sensibilidad es una medida de robustez mucho más efectiva que los
C
Compensación
3.4.1. Compensación en el “Plano s”
Una vez resuelto el requerimiento de error en estado estacionario es necesario
garantizar no solo la estabilidad del lazo cerrado sino también aquellos asociados a su
N
r1 r2 rn 1
Y (s) = T (s)R(s) = + + ··· +
s + p1 s + p2 s + pn s
IO
donde p1 , p2 , · · · , pn son los polos de lazo cerrado. Anti-transformando:
r1 r
2
rn
y(t) = 1 − e−Re{p1 }t + 1 − e−Re{p2 }t + · · · + 1 − e−Re{pn }t
p1 p2 pn
C
En el caso de polos complejos conjugados agruparemos los términos de segundo cuyas
respuestas al escalón son de la forma:
C
h i
yj (t) = rj 1 − cj e−Re{pj }t · sin (Im {pj } t + φj )
El tiempo de establecimiento para la suma que define y(t) estará definida por la fracción
más lenta, lo cual se corresponde con los polos más cercanos al eje imaginario (menor
parte real).
Sin embargo debe tenerse en cuenta que si hay polos lentos pero estos está parcial-
mente cancelados por ceros de lazo cerrado, el residuo de la fracción correspondiente
N
2
T1 (s) =
s2 + 2s + 2
C
1,8(s + 0,1)
T2 (s) =
(s + 0,09)(s2 + 2s + 2)
0,18
T2 (s) =
(s + 0,09)(s2 + 2s + 2)
EN
Se observa que T2 equivale a T1 con un polo lento adicional cancelado parcialmente con
un cero, mientras que en T3 no hay tal cancelación.
En la siguiente figura vemos la ubicación de polos y ceros a la izquierda junto con la
respuesta al escalón a la derecha:
exclusión sobre el espacio complejo (región verde en la figura 3.12) para la ubicación de
polos de lazo cerrado.
origen de los polos. Imponer una cota para este parámetro se traduce en una restricción
de distancia mı́nima al origen (zona roja).
O
Las curvas de amortiguamiento contante en el plano s son lı́neas radiales. Por lo tanto,
una restricción en el factor de amortiguamiento implicará una cota para el argumento de
los polos complejos (zona azul).
EN
C
Compensación
Hemos dicho que en primer término es necesario decidir que se debe agregar en el
compensador K(s) para satisfacer los requerimientos de error en estado estacionario.
C
Luego, una vez definida la región admisible en el plano s para los polos de lazo cerrado
se deberán elegir “puntos de prueba” donde se pretende ubicar los polos dominantes de
lazo cerrado.
RU
Si estos puntos de prueba resultan ser finalmente polos de lazo cerrado, allı́ se deberán
cumplir las condiciones de módulo (3.2) y ángulo (3.3).
La primera se logra con un ajuste de ganancia, pero para lograr la segunda en general es
necesario “compensar” la dinámica de lazo abierto existente hasta este punto agregando
polos y ceros en lugares adecuados del plano s.
ST
Esto hará que los puntos de prueba pasen a formar parte del lugar de raı́ces, y por lo
tanto podrán ser polos de lazo cerrado con un simple ajuste de ganancia.
s+z
Kpi (s) = kc (3.17)
s+p
O
En general se busca una respuesta de lazo cerrado un poco más rápida que la de lazo
abierto, dado que mientras la diferencia no sea excesiva este es un objetivo alcanzable
y a mayor velocidad de respuesta mejor capacidad de seguimiento de referencias y
EN
rechazo de perturbaciones.
En estas circunstancias en general en el punto de prueba la condición de ángulo con el
lazo abierto sin compensar arroja un valor menor a −π . Por lo tanto la compensación
debe aportar un ángulo positivo.
Esto se logra agregando ceros al lazo abierto (en el compensador). Sin embargo, un
compensador con más ceros que polos, es decir, con grado relativo negativo (función
racional impropia); no es fı́sicamente realizable. Y si lo fuera, la acción de control tendrı́a
IO
una gran sensibilidad a ruidos de medición de alta frecuencia. Por lo tanto lo habitual es
también agregar un polo, pero más alejado del origen que el cero para que la contribución
C
neta sea positiva a la condición de ángulo sea positiva.
C
ganancia:
K(s) = kp + Kd s = kc (s + z)
RU
Dado que la derivada pura no es fı́sicamente realizable, la implementación real es de la
forma:
s s+z
K(s) = kp + Kd = kc
Ts + 1 s+p
Llamamos a esto compensación en adelanto, por razones que expondremos al analizar
este compensador en el dominio de la frecuencia.
ST
mismo aporte a la condición de ángulo, en tanto el ángulo entre ambos segmentos sea
el mismo.
O
Una forma sistemática de ajustar la ubicación del polo y el cero para obtener un cierto
aporte φ es el llamado método de la bisectriz. El método se presenta de forma detallada
en [Oga10, p. 315] y ediciones precedentes.
C
A partir del punto de prueba P se traza la bisectriz P B del ángulo determinado entre OP
y P A. Luego a cada lazo de esta se proyectan dos rectas desde el punto P , obtenidas
agregando y sustrayendo a la bisectriz la mitad del ángulo φ (el déficit obtenido en
la condición de ángulo con el lazo abierto sin compensar). La intersección de estos
EN
segmentos con el eje real define la ubicación del polo y el cero del compensador.
Compensación en Atraso
SI colocamos un polo p y un cero z cercanos al origen en relación a los polos dominantes
N
de lazo cerrado, su contribución a la condición de angulo será nula. Sin embargo, si
z < p, la ganancia para cumplir con la condición de módulo se incrementará en un factor
aproximado z/p.
IO
El caso lı́mite del compensador en atraso es el controlador PI.
Ajuste de un Lazo PI
Hemos dicho que la acción integral se introduce en el lazo para neutralizar perturbacio-
C
nes constantes. Combinada con una acción proporcional el compensador es:
1 s+z ki
Kpi (s) = kp + ki = kp , z= (3.18)
C
s s kp
En este caso la compensación es en atraso, dado que el polo (en el origen) siempre
está a la derecha del cero (efecto desestabilizante). Sin embargo, en casos en donde la
RU
condición de ángulo en el punto de prueba es mayor de −π esto serı́a suficiente.
En este caso solo es necesario ajustar z para cumplir con la condición de ángulo en
la ubicación deseada para los polos dominantes, y luego ajustar kp para verificar la
condición de módulo, con lo cual definimos los parámetros del controlador PI.
Si ajustando z no se logra cumplir la condición de ángulo, serı́a necesario agregar un
compensador en adelanto pasando a un control PID (o revisar los requerimientos).
ST
y ceros de lazo abierto entre aquellos próximos y los que se encuentran más lejos (a
distancias en el orden de 10 veces la de referencia.)
O
Podemos notar que los polos y ceros reales de lazo abierto que se encuentran lejos del
origen realizan un aporte pequeño a la condición de ángulo.
C
En el caso de polos y ceros complejos el aporte puede ser grande, pero si se encuentran
lejos del punto de prueba el aporte del par complejo conjugado se aproxima a 3600 , con
lo cual su efecto es nulo.
Y para aquellos polos que se encuentren próximos pero cancelados por ceros, el aporte
EN
neto es nulo.
6.5 - Diseño de sistemas de control mediante el método del lugar de las raı́ces
6.6 - Compensación de adelanto
6.7 - Compensación de retardo
N
En muchos problemas de control la respuesta transitoria al escalón no resulta apropiada
como forma de definir requerimientos.
Esto es generalmente ası́ en el caso de sistemas de control de vuelo, que son diseñados
IO
para seguir referencias continuamente variables (por ejemplo, los sistemas para control
de actitud) o para rechazar perturbaciones (sistemas de control de trayectoria).
Para esta clase de problemas es más significativo pensar en los anchos de banda de las
funciones de sensibilidad para definir velocidad de respuesta, imponiendo cotas para los
C
picos resonantes, asociados al amortiguamiento de los modos oscilatorios.
Esto no es contradictorio con la especificación de parámetros de respuesta transitoria,
ya que es posible establecer relaciones entre está y la respuesta en frecuencia.
C
Podemos plantear los requerimientos para la dinámica de lazo cerrado en términos del
ancho de banda (en realidad frecuencia de corte) de la sensibilidad complementaria
RU
T (s), y márgenes de fase y ganancia para lograr picos resonantes de lazo cerrado lo
suficientemente acotados.
Si la dinámica dominante de lazo cerrado puede caracterizarse por un par de polos
complejos conjugados; el ancho de banda de la sensibilidad complementaria se
relaciona directamente con la distancia al origen de los polos dominantes en el plano
ST
s, mientras que su pico resonante (y por lo tanto los márgenes de estabilidad relativa) se
conectan directamente con el factor de amortiguamiento de estos polos.
Si la dinámica dominante es sobre-amortiguada, el polo real que la caracteriza define el
ancho de banda y el margen de fase es del orden de los 900 .
N
En la sección 3.3.2 hemos visto que esta frecuencia se encuentra levemente por encima
del cruce ωc del lazo abierto (en el orden de una octava). Por lo tanto, ajustando la
frecuencia de cruce de lazo abierto podemos establecer el ancho de banda de T (jω).
Para cumplir las especificaciones de diseño restarı́a agregar un compensador para
EN
N
Por conveniencia re-escribimos esta expresión de la siguiente forma:
Ts + 1
K(s) = kc (3.19)
IO
αT s + 1
donde 0 < α < 1, resultando que z = 1/T , p = 1/αT y kc = k · z/p. La respuesta
en frecuencia del compensador tiene la siguiente forma (ejemplo tomado de [Oga10] en
donde α = 0,1):
C
C
RU
ST
Podemos ver que este compensador introduce un “adelanto de fase” cuyo valor máximo
resulta:
N
1−α
φm = sin−1 (3.20)
1+α
Claramente se observa que cuanto menor sea α, mayor será φm ; siendo el valor máximo
O
posible de 900 con α → 0. Este máximo adelanto de fase se produce a una frecuencia
√
ωm = α/T , que es el punto medio entre el polo y el cero del compensador en la escala
logarı́tmica de frecuencias.
C
N
Compensación en Atraso
Si colocamos un polo p y un cero z en baja frecuencia respecto del cruce de ganancia del
lazo abierto, si p < z podemos aumentar la ganancia de lazo abierto a baja frecuencia
IO
sin impactar significativamente en el margen de fase.
Como hemos mencionado para la compensación en el plano s, el caso lı́mite del
compensador en atraso es el controlador PI.
C
Lectura Adicional
De [Oga10]:
C
7.10 - Diseño de sistemas de control por el método de la respuesta en frecuencia
7.11 - Compensación de adelanto
RU
7.12 - Compensación de retardo
los ceros de la transferencia entre entrada y salida son los ceros de G(s) y los polos de
H(s):
NG (s) NH (s)
O
G(s) = , H(s) = →
DG (s) DH (s)
C
NG (s)
Y (s) DG (s) NG (s)DH (s)
T (s) = = =
X(s) NG (s) NH (s) DG (s)DH (s) + NG (s)NH (s)
1+
DG (s) DH (s)
EN
Los ceros cercanos al origen tienden a aumentar el ancho de banda. También provocan
un aumento del sobrepaso en la respuesta al escalón, como se observa en la siguiente
figura. En esta se muestra la respuesta al escalón de una dinámica de segundo con un
cero a diferentes distancias del origen:
C
RU
ST
Es evidente que:
Y (s) Y (s)
N
Podemos incluir polos en el filtro para cancelar los ceros de T (s) cercanos al origen y
O
efecto sobre las sensibilidades para las otras entradas del sistema.
EN
IO
C
Control Moderno de Sistemas SISO
C
RU
ST
N
O
C
EN
79
Especificaciones de Diseño
4.1.1. Respuesta Transitoria
En la subsección 2.3.5 hemos visto que el desempeño en estado estacionario depende
solo de algunos aspectos de la dinámica de lazo abierto, sintetizado en el principio del
modelo interno.
Respecto de la respuesta de lazo cerrado, en la subsección 3.4.1 hemos planteado los
objetivos de la compensación en el plano s a partir de especificaciones de respuesta
N
transitoria al escalón; lo que se traduce en la ubicación deseada para los polos
dominantes de lazo cerrado. Esta es una aproximación razonable para aquellos casos
en los cuales las referencias y perturbaciones cambian solo ocasionalmente.
IO
Tiempos de Respuesta
Hemos considerado en la sección 3.4.1 tres parámetros temporales para la respuesta
transitoria:
C
tiempo de establecimiento
tiempo de crecimiento
C
tiempo de retardo
Oscilación
ST
menor a 0,7.
IO
temente de los modos naturales del lazo cerrado es la variación total, que equivale a
la suma de las amplitudes de todas las oscilaciones de la respuesta transitoria [SP01,
p. 29]:
∞
X
C
TV = vk (4.1)
k=0
C
RU
ST
tener una forma de cuantificar la “eficiencia” del diseño en relación al esfuerzo de control.
Indices de Desempeño
O
En relación al IAE, el ISE penaliza más aquellas soluciones con excursiones mayores
del error (por ejemplo, los sobrepasos).
Dado que el error inicial al escalón es 1 para t = 0 cualquiera sea la respuesta, serı́a
lógico darle más peso en el ı́ndice al error tardı́o (cuando el tiempo crece). Con esta
N
consideración se define el ı́ndice ITAE: integral del tiempo por el valor absoluto del error :
Z T
IT AE = t|e(t)|dt (4.4)
IO
0
Respuestas Optimas
Al momento de decidir especificaciones de diseño se combinan distintos requerimientos
C
de acuerdo al problema particular abordado, pero en muchas ocasiones quedan
aspectos sin definir de forma explı́cita.
Puede plantearse como objetivo la idea de buscar el mejor “resultado posible”, que
C
identificamos como “solución óptima”.
El adjetivo “óptimo” implica algo ası́ como “insuperable”, lo que es muy difı́cil de plantear
RU
en cualquier caso real.
El concepto de “solución óptima” solo tiene sentido en planteos matemáticos muy
concretos, y solo en relación a un ı́ndice de desempeño en particular.
Para afirmar que una solución es óptima debemos demostrar de forma rigurosa que con
esta se obtiene el mı́nimo posible para el ı́ndice de desempeño elegido. Y debe notarse
que si se cambia el ı́ndice de desempeño, la solución óptima podrı́a dejar de serlo para
ST
el nuevo ı́ndice.
esfera
Para una dinámica de segundo orden con tiempo normalizado t̂ = ωn t (lo cual define de
forma implı́cita una restricción), el óptimo ITAE es el caso con factor de amortiguamiento
0,7.
Diferentes trabajos han computado funciones de lazo cerrado sin ceros de diferente
orden que serı́an óptimas para el ı́ndice ITAE (aunque hay cierta controversia sobre
esos resultados). Los polinomios denominadores para las respuestas óptimas ITAE son
los siguientes:
N
s6 + 3,25ωn s5 + 6,60ωn2 s4 + 8,60ωn3 s3 + 7,45ωn4 s2 + 3,95ωn5 s + ωn6
IO
desempeño puede ser algo relevante o no en un determinado caso concreto. EN el caso
ITAE, las respuestas de orden elevado resultan bastante oscilatorias.
C
Para la compensación en frecuencia planteada en la subsección 3.4.2 los objetivos se
establecieron en términos de ancho de banda y pico resonante de lazo cerrado, lo cual
nos conduce a la elección de una frecuencia de cruce de ganancia para el lazo abierto y
C
cotas inferiores para margenes de estabilidad relativa, especialmente el de fase.
RU
El análisis en frecuencia es más razonable para referencias o perturbaciones inciertas,
y permite considerar de forma más directa los compromisos en el diseño. Podemos
plantear los requerimientos estableciendo una cota inferior para el “nivel de rechazo”
(del error a las referencias y las perturbaciones).
matemático, exige elegir una cierta norma para definir a que nos referimos al hablar
de magnitud.
Por ejemplo, para un número complejo podemos usar el módulo como medida de
magnitud. Habitualmente extendemos esto a cualquier vector de dimensión finita n, que
calculamos tomando la raı́z cuadrada del producto escalar de este por si mismo.
N
Normas Vectoriales
Cualquier operador || · || que arroje como resultado una cantidad escalar puede ser
C
el resultado es no negativo: || · || ≥ 0
es un operador positivo: ||x|| = 0 ⇐⇒ x = 0
EN
en donde x es un elemento del espacio vectorial sobre el que opera (ver [SP01, apéndice
A.5, p. 526]).
n
!1/p
X
kxkp , |xk |p (4.5)
k=1
La norma 2 se corresponde con la norma euclı́dea (módulo del vector), mientras que la
norma ∞ se corresponde con la componente de mayor valor absoluto (valor máximo).
N
Z ∞ 1/p
p
kx(t)kp , |x(τ )| dτ (4.6)
IO
−∞
La norma 2 para este caso es la raı́z cuadrada de la energı́a, mientras que la norma ∞
es el pico de su valor absoluto.
Para señales con energı́a no acotada no es posible calcular la norma 2, pero podemos
C
considerar su potencia:
s Z T
1
C
kx(t)kpwr , lı́m |x(τ )|2 dτ (4.7)
T →∞ 2T −T
RU
Estrictamente hablando esta es una semi-norma, por no cumplir todas las propiedades
para de las normas (ver [SP01, apéndice A.5.6, p. 536]).
Z ∞ Z ∞ Z ∞
2 1 2
y 2 (t)dt = |Y (f )| df = |Y (ω)| dω (4.8)
−∞ −∞ 2π −∞
√
el término 1/ 2π para la definición de la norma cuadrática en frecuencia (angular)
podemos decir que:
ky(t)k2 = kY (jω)k2 (4.9)
O
2
ky(t)k2 = |e−at | dt = e−2at dt
0 0
s ∞ r
1 −2at 1
= e = 2a
2a 0
N
lo cual confirma lo expresado por el teorema de Parseval.
IO
Escalado y Normalización
Vamos a considerar en lo sucesivo que en el modelo G(s) tanto la entrada como la salida
han sido normalizadas de la forma:
C
G(s) = e−1
tol Ḡ(s)umax
C
donde etol es la tolerancia para el error de seguimiento, umax es el valor máximo de la
acción de control y Ḡ(s) la transferencia considerando unidades de ingenierı́a.
De esta forma los rangos para la acción de control y la salida estarı́an normalizados al
RU
rango operativo. En otras palabras, en condiciones normales |y| y |u| estarán en el rango
(−1 : 1).
Para el análisis es recomendable realizar esto con todas las entradas y salidas de interés
en el lazo.
ST
Control Perfecto
En la subsección 2.2.1 se introdujo el concepto de control perfecto, que podrı́amos
sintentizar como “rechazo exacto de perturbaciones”: S(s) = 0 (T (s) = 1), lo cual hemos
N
Siendo T (s) un filtro pasa-bajos, podemos caracterizarlo con su frecuencia de corte ωbw
C
(que coincide con su ancho de banda), y como S(s) + T (s) = 1, la sensibilidad S(s) es
pasa-altos caracterizada por una cierta frecuencia de paso ωps .
En el apartado 3.3.2 se mostró que ωps < ωc < ωbw , donde ωc el la frecuencia de cruce
de ganancia del lazo abierto: |K(jωc )G(jωc )| = 1.
EN
N
en frecuencia más plana posible en la banda de paso y la mayor pendiente en la banda
de corte, como se observa a la izquierda en la figura 4.1. Se podrı́a decir que como filtro,
IO
a los efectos de absorber la energı́a de la señal de entrada en la banda de corte es ideal;
e introduce la mı́nima distorsión posible en la distribución espectral de energı́a dentro de
la banda de paso.
C
banda de paso. Esto significa que el atraso traducido a tiempo de retardo es el mismo
para todas las armónicas en la banda de paso, y con ello la distorsión en la forma
temporal de la señal es mı́nima.
C
En el lado derecho de la figura 4.1 se observa que la respuesta transitoria del filtro
de butterworth es algo oscilatoria, mientras que la del filtro de Bessel es mucho más
RU
parecida a la forma de la entrada (un escalón).
Puede observarse que en el caso de Butterworth los polos tienen una distribución circular
(la distancia al origen para todos los polos es la misma), mientras que en el caso de
Bessel la distribución es elı́ptica.
ST
sobre la salida y(t), con lo cual los planteos para seguimiento de referencias y rechazo
de perturbaciones son equivalentes.
Desde el punto de vista del error, la referencia puede considerarse como una
perturbación que debe ser rechazada.
EN
Como las entradas tienen una cierta distribución espectral W̄ (jω), lo razonable serı́a
usar esta distribución como “función de peso” al evaluar la capacidad de rechazo
requerida a lo largo del espectro de frecuencias:
figura 4.2.
rechazo deseado.
Lectura Adicional
De [SP01]:
C
Restricciones en el Diseño
C
En el capı́tulo precedente hemos visto las formas clásicas para la sı́ntesis de un
compensador SISO. En este capı́tulo veremos algunas alternativas, pero en todos los
RU
casos el proceso de sı́ntesis requiere de la definición de especificaciones de diseño, las
cuales de una u otra manera imponen una cierta velocidad de respuesta o ancho de
banda para el lazo cerrado.
Al momento de determinar esta caracterı́stica es necesario analizar las limitaciones en
el diseño que impone la dinámica del proceso a controlar; algunas de las cuales tienen
que ver con la instrumentación (sensores y actuadores) pero otras son estructurales.
ST
Para lograr ω1 > ωg será necesario que en el rango (ω1 : ωc ) el compensador tenga alta
ganancia: |K(jω)| 1.
Esto significa que las acciones de control serán grandes ante perturbaciones equiva-
C
banda alcanzable, aunque debemos aclarar que no se trata de un lı́mite exacto sino más
bien un orden de magnitud.
Ruidos de Medición
La sensibilidad del control al ruido de medición es:
U (s) K(s)
Su (s) = = = K(s)S(s)
N (s) 1 + K(s)G(s)
IO
Lograr una ganancia elevada en el control para frecuencias altas implicarı́a una
amplificación del ruido de medición en ese rango de frecuencia, lo cual normalmente
se traduce en un alto nivel de ruido en la acción de control; llegando en ocasiones a
C
responder al ruido de medición con buena parte del rango de actuación.
Por lo tanto el ruido de medición en alta frecuencia impone también un lı́mite superior
para el ancho de banda alcanzable.
C
4.2.2. Restricciones Estructurales
RU
Estabilidad Interna
Cuando hablamos del lazo cerrado solemos pensar en la función de transferencia entre
referencia y salida T (s). Pero debe tenerse en cuenta que en el lazo cerrado hay varias
entradas, siendo la referencia solo una de ellas.
Debemos considerar perturbaciones y ruido de medición, y analizar también las
ST
exigencias del diseño sobre las acciones de control (pensando también a u(t) como
una salida de interés).
En la subsección 2.3.2 se han definido las sensibilidades del lazo SISO estándar, cuya
estructura repetimos en la figura 4.3.
N
En particular debe tenerse en cuenta que la estabilidad de lazo cerrado no implica solo
la ausencia de polos en el semiplano derecho en T (s) y S(s).
Podrı́an existir modos inestables de lazo cerrado no ser visibles en estas sensibilidades.
O
El diseño debe garantizar que el lazo cerrado sea internamente estable (ver [GGS01,
def.5.1, p. 125]).
C
Diremos que el lazo SISO es internamente estable si las sensibilidades básicas S(s),
Si (s) = S(s)G(s) y Su (s) = S(s)K(s) son todas funciones de transferencia estables.
Este concepto se torna particularmente importante la plantear un control por inversión
para sistemas de fase no mı́nima.
EN
Sistemas de Fase No Mı́nima Los sistemas de fase no-mı́nima son aquellos que
tienen polos y/o ceros en el semiplano-derecho.
La designación surge por el hecho de que en su respuesta en frecuencia la gráfica de
ganancia coincide con la del sistema equivalente con todos sus polos y ceros en el
semiplano izquierdo, pero el atraso de fase es mucho mayor al de este último. En la
figura 4.4 se ilustra esto con un ejemplo.
N
Lo que estamos planteando al hacer esto es que parte del control “invierta” una parte de
la dinámica de la planta.
IO
Si bien este es un recurso viable, debe usarse con precaución al trabajar con plantas de
fase no mı́nima.
Supongamos que p sea un polo de la planta y un cero del control; es decir G(p) = ∞
y K(p) = 0. Entonces podemos escribir las funciones de transferencia de la planta y el
C
compensador de la siguiente forma:
1 B(s) P̄ (s)
C
G(p) = , K(p) = (s − p)
s − p Ā(s) L(s)
s + 0,8 −s + 0,8
Figura 4.4: Polos-ceros y respuesta en frecuencia para G1 (s) = 7,5 (azul) y G2 (s) = 7,5 (rojo)
(s + 2)(s + 3) (s + 2)(s + 3)
P̄ (s) 1 B(s)
(s − p)
L(s) (s − p) Ā(s) P (s)B(s)
T (s) = =
P̄ (s) 1 B(s) L(s)Ā + P̄ (s)B(s)
1 + (s − p)
L(s) (s − p) Ā(s)
N
(s − p)P̄ (s)B(s) + L(s)(s − p)Ā(s) = 0
IO
o bien:
(s − p) P̄ (s)B(s) + L(s)Ā(s) = 0
Aunque en las funciones de sensibilidad S(s) y T (s) este polo no sea visible, el lazo
cerrado tendrá un polo en p.
C
Por lo tanto la estrategia de control con cancelación es válida en tanto p sea un polo
estable para eliminarlo de S(s) y T (s), pero no desaparece del lazo cerrado. Por ejemplo:
C
Y (s) B(s)
Si (s) = = G(s)S(s) =
Di (s) (s − p) L(s)Ā + P̄ (s)B(s)
RU
Si p es un polo inestable (p > 0), la cancelación no es válida porque el lazo cerrado
no serı́a internamente estable. Por lo tanto podemos afirmar que si el lazo cerrado es
estable, no puede haber cancelaciones entre polos y ceros en el semiplano derecho.
1
S(s) =
1 + K(s)G(s)
Y (s) K(s)G(s)
T (s) = =
R(s) 1 + K(s)G(s)
O
S(s) + T (s) = 1
1 1
S(p) = = =0 , T (p) = 1 − S(p) = 1
1 + K(p)G(p) 1 + K(p) ∞ ejθ
N
z > 0 , G(z) = 0 → T (z) = 0 , S(z) = 1 (4.13)
Estas son restricciones de interpolación impuestas para la dinámica de lazo cerrado con
dinámicas de fase no mı́nima en el lazo abierto.
IO
Control de Sistemas Inestables La transformada de Laplace del error es:
Z ∞
E(s) = L {e(t)} = e(t)e−st dt = S(s)R(s)
C
0
Supongamos que el lazo abierto tenga un polo inestable p (p > 0), con lo cual S(p) = 0.
Entonces, independientemente del control se verifica que:
C
Z ∞
E(p) = S(p)R(p) = 0 → e(t)e−pt dt = 0
0
RU
Como e−pt > 0 ∀t > 0, para que la integral sea nula el error e(t) necesariamente tiene
cambiar de signo. Si consideramos una referencia escalón, la respuesta necesariamente
tendrá sobrepaso.
Supongamos que:
C
1
G(s) =
(s − 1)(s + 2)
Analicemos dos casos, el segundo con ancho de banda igual al doble del primero:
EN
Z ∞
Y (s) = L {y(t)} = e(t)e−st dt = T (s)R(s)
0
Supongamos que el lazo abierto tenga un cero de fase no mı́nima z (z > 0), con lo cual
N
T (z) = 0. Entonces:
Z ∞
Y (z) = T (z)R(z) = 0 → y(t)e−zt dt = 0
O
Como e−zt > 0 ∀t > 0, para que la integral sea nula la salida y(t) necesariamente tiene
cambiar de signo, independientemente de lo que sea el control. Si consideramos una
C
dominante de lazo cerrado debe ser más lenta que los ceros de fase no mı́nima del lazo
abierto para evitar subvalores exagerados.
N
K2 (s) = → T2 (s) =
s(s + 1,312) (s + 0,5)2
IO
C
C
RU
ST
N
Si la planta tuviera ceros de fase no mı́nima lentos y polos inestables rápidos, el control
se torna inviable. En esos casos es necesario recurrir a estructuras de control con más
C
de un grado de libertad.
Integrales de la Sensibilidad
EN
donde pk son los polos inestables de lazo abierto. La integral del lado derecho se anula
si el lazo abierto es de grado relativo 2 o superior .
Evidentemente en el caso de plantas estables de grado relativo mayor a 1:
N
Z ∞
ln |S(jω)|dω = 0 (4.15)
0
IO
De esto surge que todo intento de disminuir la sensibilidad en una cierta banda de
frecuencia tendrá siempre su correlato como incremento en otra. Esto se conoce como
“efecto de la cama de agua” (waterbed effect).
C
Como la función de sensibilidad se corresponde con un filtro pasa-altos, en baja
frecuencia el logaritmo natural de su magnitud es negativo. Por lo tanto en alguna región
de la banda de paso su ganancia deberá ser mayor de 1 (amplificación), y esto será más
C
severo si el lazo abierto tiene polos inestables.
Naturalmente el balance de la integral ante una disminución de la sensibilidad en alguna
banda se podrı́a lograr con un incremento pequeño pero sostenido de la sensibilidad en
RU
alta frecuencia, ya que la parte positiva de la integral se extiende hasta el infinito.
dos alternativas para la elección del lazo cerrado T (s): Un filtro de Butterworth y uno de
Bessel, ambos de orden 3 y con el mismo ancho de banda. Por ejemplo, para un ancho
de banda de 2s−1 :
8 21,95
Fbutt (s) = , Fbess (s) =
(s + 2)(s2 + 2s + 4) (s + 2,64)(s2 + 4,18s + 8,33)
N
Podemos fácilmente evaluar como quedarı́a la función de sensibilidad para cada caso
con el siguiente código:
O
clear ; clc
[ B , A ] = b u t t e r ( 3 , 2 , ’ s ’ ) ; F1 = t f ( B , A ) ; S1 = 1 − F1 ;
[ B , A ] = b e s s e l f ( 3 , 2 . 8 ) ; F2 = t f ( B , A ) ; S2 = 1 − F2 ;
C
restricción integral:
Segunda Integral de Bode Para lazos abiertos con un cero de fase no-mı́nima z se
verifica que:
O
Z ∞ np
Y pk + z
ln |S(jω)|w(z, ω)dω = π (4.16)
0 p̄k − z
k=1
C
donde pk son los polos inestables de lazo abierto y p̄k sus complejos conjugados,
mientras que si z es un cero real:
2z
w(z, ω) = (4.17)
z2 + ω2
EN
Robustez
En el diseño de sistemas de control automático trabajamos con modelos de la dinámica
N
de la planta para realizar la sı́ntesis de los parámetros del controlador.
Estos modelos excluyen deliberadamente las caracterı́sticas dinámicas que asumimos
IO
irrelevantes para el diseño. Pero en muchas ocasiones se presentan otros aspecto de la
dinámica real que no podemos modelar, o que solo puede hacerse de forma aproximada.
Debemos asumir que siempre existirá un cierto nivel de incertidumbre en el modelo.
Aun ası́ pretendemos que el sistema de control sea capaz de garantizar mı́nimamente
C
estabilidad de lazo cerrado, y de ser posible también un desempeño mı́nimo para cumplir
los requerimientos del diseño.
La Teorı́a de Control Robusto aborda esta problemática de forma explı́cita, estableciendo
C
pruebas para garantizar la estabilidad robusta y el desempeño robusto; y métodos de
sı́ntesis para intentar alcanzar estos objetivos.
RU
4.3.1. Incertidumbre en el Modelo
En [SP01] se listan algunos orı́genes de esta incertidumbre:
parámetros en el modelo que solo se conocen de forma aproximada
parámetros en los modelos lineales que cambian para diferentes condiciones de
ST
equilibrio
en modelos temporalmente invariantes para dinámicas que no lo son habrá
parámetros que cambian con el tiempo
distorsiones relacionadas con sensores y actuadores
dinámica de alta frecuencia desconocida o difı́cil de modelar
N
Cuando la incertidumbre está asociada a los polos de un proceso SISO puede resultar
O
1
G(s) = G0 (s) , |δ| < 1 (4.20)
1 + δW∆ (s)
C
C
L(s) = L0 (s) [1 + δW∆ (s)] = L0 (s) + |1|ejθδ L0 (s)W∆ (s)
RU
De la gráfica vemos que se tendrá estabilidad para toda la familia de modelos (estabilidad
robusta) si se cumple que:
|L0 (s)|
1> |W∆ (s)|
|1 + L0 (s)|
Por lo tanto podemos decir que la condición de estabilidad robusta para un modelo con
N
de la figura 4.6.
Para otros modelos de robustez debe utilizarse la condición de estabilidad robusta
correspondiente (ver [Peñ92, p. 36]).
de modelos tendrá una magnitud menor o igual a una cierta cota WS (jω), lo cual implica
una restricción mayor a la condición de estabilidad robusta.
(
La inversa de la función de peso WS jω) impone una cota superior para la función de
sensibilidad, y sabemos que la inversa de la sensibilidad es la distancia entre la traza de
N
lo cual equivale a:
Sı́ntesis de Compensadores
N
4.4.1. Asignación de Polos
ssec:polinomial
A continuación proponemos ajustar un compensador bipropio de orden n − 1 para una
IO
planta de orden n, a fin de obtener un polinomio de lazo cerrado de orden 2n − 1 elegido
de forma arbitraria. Este enfoque se desarrolla en [GGS01, sec.7.2, p. 177].
Denotemos las funciones de transferencia para el compensador y la planta de la
siguiente forma:
C
P (s) B(s)
K(s) = , G(s) =
L(s) A(s)
C
donde A(s) es un polinomio de orden n y B(s) es uno de orden menor; mientras que
P (s) y L(s) son polinomios de orden n − 1:
RU
P (s) = pn−1 sn−1 + pn−2 sn−2 + · · · + p1 s + p0
L(s) = ln−1 sn−1 + pn−2 sn−2 + · · · + l1 s + l0
B(s) = nn−1 sn−1 + pn−2 sn−2 + · · · + b1 s + b0
A(s) = an ss + an−1 sn−1 + an−2 sn−2 + · · · + a1 s + a0
ST
1
G(s) =
C
s2 + 3s + 2
El compensador será de orden 1. Entonces:
l1 = 1
3l1 + l0 = 3
2l1 + 3l0 + p1 = 3
2l0 + p0 = 1
N
1 0 0 0 l1 1
3
1 0 0 l
0 = 3
IO
2 3 1 0 p1 3
0 2 0 1 p0 1
De esto obtenemos l1 = 1, l0 = 0, p1 = 1, p0 = 1:
C
s+1
K(s) =
s
C
que equivale a un controlador PI.
RU
El esquema de sı́ntesis, que permite ubicar todos los polos de lazo cerrado, se puede
generalizar de la siguiente forma:
ln−1
..
.
c2n−1
l0
ST
..
M̄e (A, B) = . (4.25)
pn−1
c0
..
.
p0
N
en donde M̄e es una matriz que obtenemos eliminando la fila 1 y las columnas 1 y n + 1
de la matriz eliminante de Silvester Me para los poliniomios A(s) y B(s):
an 0 ··· 0 bn 0 ··· 0
O
an−1
an ··· 0 bn−1 bn ··· 0
.. .. .. .. .. .. .. ..
. . . . . . . .
C
a0
Me (A, B) = a1 ··· an b0 b1 ··· bn (4.26)
0
a0 ··· an−1 0 b0 ··· bn−1
. .. .. .. .. .. .. ..
.. . . . . . . .
0 0 ··· a0 0 0 ··· b0
EN
N
function [ P, L ] = polynomial (B, A, Alc )
n = length (A ) ;
IO
Me = sylm ( A , B ) ;
Me = [Me( 2 : end , 2 : n ) Me( 2 : end , n +2: end ) ] ;
K = Me\ A l c ;
L = K( 1 : n−1) ’;
P = K( n : end ) ’ ;
C
end
C
Si queremos forzar un polo de lazo abierto (por ejemplo un integrador o un filtro)
podemos combinarlo con el denominador de la planta y diseñar el compensador para
ese modelo aumentado.
RU
El compensador resultante será estrictamente propio, ya que al denominador del
compensador bipropio computado con este enfoque deberá ser convolucionardo con
el polo adicional.
Parametrización Afı́n
La alternativa es plantear de forma explı́cita el control por inversión para el lazo cerrado.
Supongamos que tenemos una función objetivo Fq (s) para la sensibilidad complemen-
taria T (s) del lazo cerrado. Debemos sintetizar un compensador K(s) tal que:
N
K(s)G(s)
T (s) = = Fq (s)
1 + K(s)G(s)
O
Despejando:
Finalmente:
Fq (s) 1
EN
K(s) = (4.27)
1 − Fq (s) G(s)
Si:
B(s) N (s) N (s)/D(s) A(s)
G(s) = , Fq (s) = → K(s) =
A(s) D(s) 1 − N (s)/D(s) B(s)
N
De la ecuación (4.28) puede notarse que con este enfoque el compensador tendrá como
ceros los polos de G(s) y los ceros de Fq (s), mientras que sus polos serán los ceros
de G(s) y las raı́ces de D(s) − N (s). Vemos que de forma indirecta esto nos lleva
IO
normalmente a un control por cancelación.
La dimensión de la dinámica cancelada dependerá del orden de la función Fq (s) elegida.
Para que no exista cancelación Fq (s) deberá duplicar el orden de la planta.
C
inestables de la planta. De forma similar habrá cancelaciones entre el control y la planta
cuando esta tenga ceros en el semiplano derecho.
Por lo tanto, para plantas de fase no mı́nima habrá que elegir funciones Fq (s) que
C
aseguren la estabilidad interna del lazo.
Esto implica que los ceros de fase no mı́nima de la planta deberán ser ceros de Fq (s)
(raı́ces del polinomio N (s)), mientras que los polos inestables de la planta deberán ser
RU
raı́ces del polinomio D(s) − N (s).
Esto es algo que ya sabı́amos de la subsección 4.2.2, y que sintetizamos en las
ecuaciones (4.12) y (4.12).
K(s)G(s)
T (s) = = Q(s)G(s)
1 + K(s)G(s)
Por lo tanto, el control para obtener una dinámica inversa Q(s) es:
N
K(s) =
1 − Q(s)G(s)
Podrı́a usarse Q(s) como un control con modelo predictivo, en el cual solo realimentamos
el error de predicción:
C
EN
Entonces a partir de elegir Fq (s) determinamos la dinámica inversa Q(s), y con esta el
control K(s) para implementar una realimentación de la salida.
N
T (s) = Q(s)G(s) = Fq (s)
IO
Si (s) = G(s)S(s) = G(s) [1 − Q(s)G(s)] = G(s) [1 − Fq (s)]
Q(s)
Su (s) = K(s)S(s) = [1 − Q(s)G(s)] = Q(s) = Fq (s)G−1 (s)
1 − Q(s)G(s)
C
Claramente resulta necesario elegir Fq (s) estable, con lo cual T (s) y S(s) resultan
estables.
C
Pero en la tercer ecuación se observa que si la planta tiene un polo inestable p, es
necesario elegir Fq (s) tal que S(p) = 0, o bien Fq (p) = 1.
Y de la cuarta ecuación se observa que para lograr estabilidad interna Su (s) = Q(s)
RU
debe ser estable. Por lo tanto, todo cero de fase no mı́nima de G(s) deberá ser cero de
Fq (s) para que no aparezca como polo de Q(s).
En sı́ntesis, para polos p y ceros z de fase no mı́nima de la planta se debe cumplir que:
Fq (p) = 1 , Fq (z) = 0
ST
B(s) B(s)
G(s) = = k
N
A(s) s Ā(s)
N (s) sk Ā(s)
K(s) =
D(s) − N (s) B(s)
C
Para que el control no tenga ceros en el origen es necesario que el polinomio D(s)−N (s)
tenga k raı́ces en el origen, lo cual implica que los últimos k coeficientes deben ser nulos.
Esto implica que Fq (s) se debe elegir de forma tal que el numerador coincida con los
últimos k términos del denominador.
EN
1
G(s) =
s2
N
Esto implicarı́a una incapacidad para rechazar perturbaciones constantes a la entrada
(o eliminar una condición inicial de error), ya que la función de sensibilidad de entrada
resulta:
IO
1 s (s + a1 ) s + a1 1
S(s) = = 2 → Si (s) = G(s)S(s) =
a0 s 1 s + a1 s + a0 s2 + a1 s + a0 s
1+
s + a1 s2
C
Vemos que el lazo no solamente es incapaz de rechazar perturbaciones de entrada, sino
que además no es internamente estable.
C
Para evitar esto elegimos para el numerador los últimos dos términos del denominador,
y aumentamos el orden de este último para mantener el grado relativo de Fq igual al de
RU
la planta:
a1 s + a0
Fq (s) =
s3 + a2 s2 + a1 s + a0
con lo cual
a1 s + a0 a1 s + a0
K(s) = s2 =
ST
s3 + a2 s2 + a1 s + a0 − a1 s − a0 s + a2
Con esto:
1 s2 (s + a2 )
S(s) = = 3
a1 s + a0 1 s + a2 s2 + a1 s + a0
N
1+ 2
s + a2 s
y entonces
O
s2 (s + a2 ) 1 s + a2
Si (s) = = 3
s3 2
+ a2 s + a1 s + a0 s2 s + a2 s2 + a1 s + a0
C
N
4.4.3. Loop-Shaping
IO
En la subsección 3.4.2 se ha presentado la compensación en frecuencia clásica.
Podemos sintetizar la estrategia considerando que:
C
el ajuste final de ganancia permite establecer la frecuencia de cruce de lazo
abierto, determinando el ancho de banda del lazo cerrado
en la frecuencia de cruce utilizamos un compensador en adelanto para obtener
C
buenos margenes de fase y ganancia
de ser necesario podrı́amos agregar filtro (polos) de alta frecuencia para mitigar
los efectos del ruido de medición (de alta frecuencia). Esto implica además mayor
RU
robustez en relación a la incertidumbre dinámica de alta frecuencia.
1 1 L
E= R(s) + Gd D − N
1+L 1+L 1+L
O
e=0·r+0·d+0·n
C
lo que implica |L| 1 para los primeros dos términos y |L| = 0 para el tercero.
Evidentemente esto genera un conflicto, pero lo salvamos tratando de lograr lo primero
en baja frecuencia y lo segundo en alta.
EN
Además de los requerimientos por desempeño debemos cumplir con los de estabilidad
relativa.
El atraso de fase para una determinada frecuencia ω se encuentra estrechamente
relacionada con la pendiente de la curva de ganancia a esa frecuencia. Podemos
decir que si para una frecuencia ω la pendiente de |L(jω)| es n, el atraso de fase es
aproximadamente −n · 900 [SP01, p. 20].
30(s + 1)
G(s) =
(s + 10)(s + 0,01)2
N
IO
C
C
RU
ST
Una pendiente −1 (−20 db/dec) implica un atraso de fase de 900 , mientras que una
pendiente −2 se corresponde con un atraso de 1800 .
En la frecuencia de cruce el atraso deberı́a ser del orden de los 1200 o menor, lo cual
implica una pendiente mayor que −1,5, pero nula porque de lo contrario no habrı́a cruce.
N
Para lograr alta ganancia en baja frecuencia, la pendiente para frecuencias menores a la
de cruce deberı́a ser más negativa; pero obviamente no podrá ser mas negativa de −2.
O
Esto es deseable también para alta frecuencia, a fin de mejorar la robustez y el rechazo
de ruidos.
IO
Sistemas con Retardo
4.5.1. Dinámicas con Retardo
C
El retardo está presente en la mayorı́a de los sistemas reales. Este puede ser causado
por: transporte de masa, energı́a o información, efecto causado por varios sistemas de
C
bajo orden conectados en serie, tiempo de procesamiento en sensores o controladores,
etc.
Un retardo importante implica una dificultad para el sistema de control. Las dificultades
RU
son provocadas principalmente porque el efecto de las perturbaciones demora para ser
sentido, la acción de control demora para causar efecto en la variable controlada y porque
la acción de control se calcula con base en un error pasado.
4.5.2. Modelado
ST
Y (s)
P (s) = = G(s)e−sL (4.29)
U (s)
N
(donde los retardos en general son relevantes); la respuesta al escalón del sistema con
retardo será de la forma:
C
EN
Es obvio que la ganancia de este operador es 1 para todo valor de frecuencia ω , pero a
diferencia de los otros modelos el atraso de fase no está acotado:
Puede notarse que el atraso es de 1800 para una frecuencia ω = π/L, duplicándose
Una aproximación simple para la transformada de Laplace del retardo es utilizar un polo
o un cero:
1
e−sL ≈ Dp (s) = , e−sL ≈ Dz (s) = 1 − L s (4.32)
Ls + 1
Sin embargo, esto sirve para ω L. Es posible lograr una aproximación exacta para
N
la ganancia, y más ajustada para la fase recurriendo a una expansión de Padè. La
expresión genérica para expandir una función f (x) es:
IO
a0 + b1 x + b2 x2 + · · · + pm xm
f (x) ≈ R(x) = (4.33)
1 + a1 x + a2 x2 + · · · + an xn
ajustando los coeficientes a partir de:
C
R(0) = f (0)
R0 (0) = f 0 (0)
C
R00 (0) = f 00 (0)
..
.
RU
R(m+n) (0) = f (m+n) (0)
D esto se deduce que la aproximación de Padè de primer orden para el retardo es:
N
2 − sL
e−sL ≈ (4.35)
2 + sL
O
Al igual que el retardo, esta función racional tiene ganancia unitaria en todo el espectro
de frecuencias, y da una aproximación razonable para el atraso de fase mientras la
frecuencia no sea demasiado grande, como se puede observar en la figura 4.10.
C
Figura 4.11: Respuesta al escalón para el retardo de transporte (L = 1s) y sus aproximaciones mediante la expansión de Padè
e−(L0 +∆L) s
WL (s) = −1
e−L0 s
= e−∆L s − 1 (4.37)
N
4.5.3. Predictor de Smith
IO
Para una planta descripta por el modelo (4.29) proponemos como esquema de control
ideal el mostrado en la siguiente figura:
C
C
RU
En este la transferencia entre entrada y salida resulta:
la predicción ep (t) = y(t) − ŷ(t) (siendo y(t) la salida real y ŷ(t) la predicción con el
modelo Pn (s)):
C
EN
N
IO
C
Para analizar lo que ocurre en el caso real vamos a computar el control equivalente
C
Ceq (s), que surge del control nominal C(s) combinado con el predictor:
RU
ST
Para llegar a esto reestructuremos el diagrama del control con predictor de la siguiente
forma:
N
O
C
EN
C(s)
C 0 (s) =
1 + C(s)Gn (s)
N
lo que arroja finalmente:
C(s)
Ceq (s) = (4.39)
1 + C(s) [Gn (s) − Pn (s)]
IO
que también puede escribirse como:
C(s)
Ceq (s) = (4.40)
C
1 + C(s)Gn (s) [1 − e−sLn (s)]
C
predictor, o con el modelo de control equivalente; pero este último incluye internamente
un retardo (que de ser pequeño eventualmente podrı́a sustituirse por una aproximación
racional).
RU
4.5.4. Predictor de Smith Filtrado
Es importante remarcar que el predictor de Smith es su forma original no puede usarse
con plantas inestables, y no tiene buenas propiedades de robustez.
La respuesta de lazo cerrado en el caso general es:
ST
Y (s) C(s)G(s)
= e−sL (4.41)
R(s) 1 + C(s)Gn (s) + C(s) [P (s) − Pn (s)]
de donde surge la ecuación caracterı́stica de lazo cerrado:
N
Aunque el control pueda diseñarse para que 1 + C(s)Gn (s) sea un polinomio Hurwitz
(todas sus raı́ces en el semiplano izquierdo), tendiendo en cuenta que Pn (s) 6= P (s) los
O
IO
Y (s) C(s)G(s)
= e−sL (4.44)
R(s) 1 + C(s)Gn (s) + C(s)Fr (s) [P (s) − Pn (s)]
C
Y (s) C(s)G(s) [Gn (s) − Pn (s)Fr (s)]
= e−sL (4.45)
Q(s) 1 + C(s)Gn (s) + C(s)Fr (s) [P (s) − Pn (s)]
C
La ecuación caracterı́stica de lazo cerrado es:
Estructuras Especiales
4.6.1. Anti-Windup
Al implementar un sistema de control que incluya acción integral es necesario considerar
N
el efecto denominado “wind-up del integrador”, e incluir formas de mitigarlo en caso que
esto pudiera ser un inconveniente.
Veamos primero cual es el problema.
O
ganancia infinita de lazo abierto a frecuencia cero, pero esto va acompañado de un efecto
negativo que es el de introducir −900 de atraso de fase en este lazo. Sin embargo, esto
se puede manejar mediante un compensador adecuado, y con ello lograr una respuesta
aceptable de lazo cerrado.
EN
N
IO
C
C
RU
ST
donde:
k∞ = lı́m K(s) , H(s) = K(s)−1 − k∞
−1
(4.47)
s→∞
k∞ k∞ k∞
K̄(s) = = = ≡ K(s)
1
1 + k∞ H(s) 1 1
1 + k∞ − 1 + k ∞ − 1
K(s) k∞ K(s)
N
IO
C
C
RU
Se puede observar que la respuesta con anti-windup no tiene sobrepaso, aun con
saturación.
ST
Filtro de Referencia
Ya hemos mencionado en la subsección 3.4.3 que la sensibilidad complementaria T (s)
se puede ajustar mediante un filtro de referencia Fr (s) como se muestra en la siguiente
C
figura:
EN
Y (s) Y (s)
= Fr (s) = Fr (s)T (s)
R(s) R̄(s)
Podemos incluir polos en el filtro para cancelar los ceros de T (s) cercanos al origen y
evitar sobrepasos excesivos; aunque igualmente implicará una reducción en el ancho de
banda para el seguimiento de la referencia.
Pero debe notarse que el filtro no es parte del lazo cerrado, y por lo tanto no tiene ningún
N
efecto sobre las sensibilidades para las otras entradas del sistema.
IO
C
Control en Cascada
C
RU
ST
N
O
C
EN
IO
C
Realimentación de Estado
C
RU
ST
N
O
C
EN
121
Figura 5.1: regulador por realimentación de estados
Introducción
N
Supongamos que contamos con un modelo de estados para describir la dinámica del
proceso a controlar:
IO
ẋ = Ax + Bu + Bv v (5.1)
donde x ∈ Rn , u ∈ Rm es la acción de control y v ∈ Rp es el vector de perturbación.
Un control por realimentación de estados es aquel en el cual el vector de control u surge
de un mapeo estático del vector de estados x. En el caso lineal:
C
u = −Kx (5.2)
C
donde K ∈ Rm×n es la denominada matriz de realimentación de estados.
Obtenemos la dinámica de lazo cerrado reemplazando (5.2) en (5.1):
RU
ẋ = [A − BK] x + Bv v (5.3)
Ā = [A − BK] (5.4)
ST
Esto puede plantearse también para sistemas que varı́an en el tiempo (caso en el cual
las matrices en (5.1) dependen explı́citamente de t).
Controlabilidad
C
es irrelevante.
Para entender que significa esto vamos a considerar que significa que el sistema no sea
completamente controlable.
N
θ̇ = ω
l
ω̇ = T sin δ
J
IO
Por otra parte, para la posición respecto de una terna geográfica:
ẋ = u
C
ż = w
T
u̇ = fx , fx = sin (θ + δ)
m
C
T
ẇ = fz − g , fz = cos (θ + δ)
m
RU
Linealizando para θ ≈ 0:
ẋ 0 0 0 1 0 0 x 0 0
ż
0 0 0 0 1 0 z 0 0
0
θ̇ 0 0 0 0 1 θ 0 0
=
0 + δ +
u̇ 0 f 0 0 0
u f 0
ST
ẇ
0 0 0 0 0 0 w 0 f − g
ω̇ 0 0 0 0 0 0 ω τ 0
= + u
ẋu 0 Au xu 0
El bloque nulo en la matriz de entrada indica que no hay efecto directo del control u
sobre ẋu , mientras que el bloque nulo en la matriz dinámica de debe al desacoplamiento
C
dinámico de xu respecto de xc (que sı́ es afectado por el control), por lo cual tampoco
hay efecto indirecto.
RU
El sistema serı́a completamente controlable si podemos manipular el empuje del motor
T , con lo cual la parte inferior de la matriz de entrada no serı́a nula.
Matriz de Controlabilidad
Se puede demostrar que un sistema es completamente controlable si y solo si la matriz:
ST
B | AB | A2 B | · · · | An−1 B
(5.5)
rank ( c t r b ( A , B ) )
lo cual arroja como resultado un valor 4, lo cual se corresponde a los cuatro estados
controlables antes mencionados.
EN
N
servosistema), podemos llevar el origen del espacio de estados al estado de referencia
deseado, lo cual equivale a realimentar la diferencia entre el estado original y el de
referencia, en lugar de usar el vector de estados directamente:
IO
u = −K [x − xr ]
Si solo nos interesa un subconjunto de la variables de estado, para el estado de
referencia podemos plantear una relación de la forma:
C
xr = Br r
donde Br será una matriz con valores nulos para los estados no relevantes. Podrı́a
C
inclusive plantearse una ecuación de salida para definir las variables de interés y a partir
de esto definir Br :
RU
y r = Cr x , Br = C+
r
donde C+
r es la “pseudo-inversa” de Cr .
u = −K [x − Br r]
ST
θ̇ = ω
l
ω̇ = T sin δ
J
C
Tomando u = sin δ :
θ̇ 0 1 θ 0
= + u
EN
ω̇ 0 0 ω T l/J
IO
Acción Integral
En la realimentación de estados es posible incluir acción integral expandiendo el vector
de estados.
Si tenemos un vector de referencias r para ciertas salidas y r = Cr x, podemos definir
C
el error de seguimiento como:
er = r − y r = r − Cr x
C
Si agregamos al modelo una nueva variable de estado:
RU Z t
ζ= er dτ
0
ζ̇ −Cr 0 ζ 0 I r
x
u = Kp Ki
ζ
O
posible elegir K tal que la matriz dinámica de lazo cerrado (5.4) tenga cualquier conjunto
de autovalores que se desee.
Esto es muy simple para una planta de segundo orden con una acción de control escalar:
ẋ1 a a12 x1 b
= 11 + 1 u
ẋ2 a21 a22 x2 b2
N
a − b1 k1 a12 − b1 k2
= 11
a21 − b2 k1 a22 − b2 k2
IO
Los polos de lazo cerrado son los autovalores de Ā, es decir, las raı́ces de su ecuación
caracterı́stica:
sI − Ā = s + b1 k1 − a11 b1 k2 − a12
C
b2 k1 − a21 s + b2 k2 − a22
= (s + b1 k1 − a11 ) (s + b2 k2 − a22 ) − (b1 k2 − a12 ) (b2 k1 − a21 )
C
= s2 + (b1 k1 + b2 k2 − a11 − a22 ) s − (b1 k2 − a12 ) (b2 k1 a21 )
(s − p1 ) (s − p2 ) = s2 − (p1 + p2 ) s + p1 p2
Igualando obtenemos un sistema de dos ecuaciones para ajustar las dos ganancias de
la matriz de realimentación de estados:
ST
ż1 0 1 z1 0
= + u
ż2 a1 a2 z2 b
C
A(s) = s2 + a1 s + a2
EN
Para esta forma, el polinomio de lazo cerrado con realimentación de estados [k1 k2 ]
resulta:
Alc (s) = s2 + (a1 + k2 ) s + (a1 + k2 )
Si el polinomio deseado es:
Ar (s) = s2 + α1 s + α2
N
.
k2 = αn−1 − an−1
IO
k1 = αn − an
Como se detalla en [? , cap.10, p. 831], la transformación Tc para llevar cualquier
matriz arbitraria a la forma canónica controlable puede obtenerse mediante la siguiente
composición:
C
Tc = MW (5.8)
donde M se construye de la siguiente forma:
C
M = B | AB | A2 B | · · · | An−1 B
(5.9)
donde B es una matriz columna (en este caso arbitraria pero no nula); y la matriz T se
RU
construye de la forma:
an−1 an−2 ··· a1 1
an−2
an−3 ··· 1 0
W = ... .. .. .. ..
(5.10)
. . . .
a1 1 ··· 0 0
ST
1 0 ··· 0 0
siendo ak los coeficientes del polinomio caracterı́stico de la matriz A:
|sI − A| = s2 + a1 sn−1 + +a2 sn−2 + · · · + an−1 s + an (5.11)
N
(5.12)
Para el caso de acción de control escalar existe una orma alternativa para este cómputo
denominada formula de Ackermann [Oga10, p. 730].
C
Control Vectorial
En el caso de que el control no sea escalar existen infinitas soluciones para el problema
de la asignación de polos.
EN
N
ofrece es una herramienta que se usa de forma iterativa para obtener soluciones con un
balance adecuado entre ”velocidad de respuesta” y ”esfuerzo de control”, lo cual resulta
generalmente en soluciones ”robustas”.
IO
Índice de Desempeño Cuadrático
Como en todo problema de optimización, la cuestión central es la de definir un ı́ndice
de desempeño adecuado. Este debe ser una cantidad definida positiva que resulte
C
fı́sicamente significativa y matemáticamente tratable.
En control automático el objetivo general es el de llevar la planta a una determinada
condición estacionaria con el menor esfuerzo posible. Esto puede cuantificarse mediante
C
un ı́ndice de desempeño cuadrático de la forma:
Z t
xT Qx + uT Ru dt
RU
J(t) = (5.13)
0
ẋ = Ax + Bu (5.14)
u = −Kx
siendo:
O
K = R−1 BT P (5.15)
donde la matriz P es solución de la siguiente ecuación algebraica de Ricatti:
C
h i
AT P + PA − P BR−1 BT P + Q = 0 (5.16)
EN
1 Una matriz H es positiva definida si la forma cuadrática V (x) = xT Hx > 0 ∀x 6= 0. Esto se cumple si es real simétrica
con todos sus menores principales son positivos (y en consecuencia todos sus autovalores son positivos)
N
El término entre paréntesis es una forma cuadrática que podemos reescribir de la
siguiente forma:
IO
d
xT Q + KT RK x = − xT Px (5.17)
dt
Con lo cual:
J(t) = −xT Px (5.18)
C
Desarrollando el lado derecho de la ecuación (5.17), y teniendo en cuenta que a lazo
cerrado ẋ = (A − BK) x:
C
d T
− x Px = −ẋT Px − xT Pẋ
dt
RU
T
= −xT (A − BK) Px − xT P (A − BK) x
h i
T
= −xT (A − BK) P + P (A − BK) x
Como el lado derecho es una matriz negativa definida (el término dentro del paı́s por
definición es positivo definido) y el lazo cerrado es estable, esta ecuación de Liapunov
tiene una solución P positiva definida.
Por otra parte, como R es una matriz real simétrica, se puede escribir como R = TT T,
N
y con esto:
T
(A − BK) P + P (A − BK) + Q + KT TT TK = 0
O
desarrollando y reagrupando:
h i
AT P + PA + Q + KT TT TK − KT BT P − PBK = 0
C
−1 −1
T T T T
TK − T B P TK − T B P
N
En la práctica los coeficientes en las matrices del ı́ndice de desempeño suelen ser
arbitrarios, dado que en general no hay razones sólidas para establecerlos. Pero si
IO
hay criterios para ajustarlos de forma iterativa hasta alcanzar una solución satisfactoria;
entendiendo esto último como lazos cerrados robustos que muestren respuestas rápidas
a los desequilibrios con acciones de control dentro del rango admisible.
C
Selección de las Matrices para el Índice de Desempeño
Si Q y R son matrices diagonales con coeficientes qj , j = 1 : n y rj , j = 1 : m
respectivamente, el ı́ndice será de la forma:
C
Z t
q1 x21 + q2 x22 + · · · + qn x2n + r1 u21 + r2 u22 + · · · + rn u2n dt
J(t) =
RU
0
= q1 I12 + q2 I22 + · · · + qn In2 + r1 J12 + · · · + r1 Jm
2
(5.20)
0 0
El mı́nimo se alcanza cuando todos los sumandos qk Ik2 y rk Jk2 en (5.20) son iguales, lo
que pone en evidencia el balance entre desequilibrio (x 6= 0) y acción de control (u 6= 0)
que se alcanza minimizando este ı́ndice.
N
1 1
C
qj = , rj = (5.22)
|xj |2max |uj |2max
N
Q = diag ( [ ... ]);
R = diag ( [ ... ]);
IO
K = l q r (M, Q, R ) ;
% Lazo c e r r a d o
% Deberı́amos c o n t a r con una m a t r i z Br para mapear l a s r e f e r e n c i a s
% a l o s estados , aunque para e l comando ’ i n i c i a l ’ l a m a t r i z B
C
% es i r r e l e v a n t e
Ac = A − B∗K ;
Bc = K∗ Br ;
C
% Ecuaci ón de s a l i d a , que muestre l o s estados r e l e v a n t e s para
% e l problema y l a s acciones de c o n t r o l
RU
Cc = [ Br ’ ; −K ] ;
Dc = zeros ( s i z e ( Cc , 1 ) , s i z e ( Bc , 2 ) ) ;
LC = ss ( Ac , Bc , Cc , Dc ) ;
xo = [ . . . . ] ; % c o n d i c i ó n i n i c i a l
ST
i n i t i a l ( LC , xo ) ;
Observador de Estados
O
Consideremos nuevamente un modelo de estados lineal para la planta, pero ahora con
su correspondiente ecuación de salidas:
ẋ = Ax + Bu + Bv v (5.23)
EN
y = Cx + Du + η (5.24)
x̂˙ = Ax̂ + Bu
N
En algunos casos lo primero puede realizarse (un ejemplo son los navegadores
inerciales), pero los puntos restantes rara vez se verifican
IO
Podemos notar que existen discrepancias entre el estimador y la realidad es evaluar con
la estimación lo que se deberı́a medir y comparar esto con la medición real:
C
ŷ = Cx̂ + Du
C
proporcional a la diferencia y − ŷ :
Esta es la estructura del observador de estado completo propuesto por David Luenberger
en 1966. Veamos si con esto es posible lograr que la estimación converja al estado real.
e = x − x̂
ė = ẋ − x̂˙
N
Sustituyendo:
O
ė = Ax + Bu + Bv v − Ax̂ − Bu − L (y + η − ŷ)
= A (x − x̂) − Ax̂ + Bu − LC (x − x̂) + Bv v + LCη
C
Se puede elegir la ganancia del observador para ajustar la matriz dinámica del error de
EN
estimación, y con ello asegurar que este error converga a su condición de equilibrio lo
suficientemente rápido.
Ajustar la dinámica del error de estimación es equivalente a diseñar una realimentación
de estados para el denominado sistema dual, definido como:
ż = AT z + CT v (5.26)
T
v = −L z
N
observabilidad.
Observabilidad
IO
Se dice que “un sistema es completamente observable si cualquier estado x(t0 ) puede
ser determinado a partir de la observación de la salida y(t) durante un intervalo de
tiempo finito t0 ≤ t ≤ t1 ”.
Si el sistema es invariante en el tiempo, el instante t0 para el cual se plantea el análisis
C
es irrelevante.
C
Entre los conceptos mencionados se destaca que en algunos casos existen modos
naturales del proceso que no son visibles a través de las salidas disponibles. En estos
RU
casos decimos que el sistema no es completamente observable, porque al menos una
parte del estado no afecta las salidas y por lo tanto no puede reconstruirse.
Esto tiene que ver con la dinámica de la planta (a través de la matriz A) y de la relación
entre los estados y las variables medidas (a través de la matriz C).
Al igual que con la controlabilidad, en el caso de observabilidad de orden reducido es
posible separa el estado en una parte observable y otra que no lo es.
ST
Matriz de Observabilidad
Se puede demostrar que un sistema es completamente observable si y solo si la matriz:
C
N
CA
CA2
(5.27)
..
O
.
n−1
CA
C
es de rango n, siendo esta la dimensión del vector de estados. Se puede verificar que
la matriz de observabilidad es equivalente a la controlabilidad del sistema dual dado por
(5.26).
EN
N
C = zeros ( 3 , 6 ) ;
rank ( obsv ( A ,C ) )
IO
lo cual arroja como resultado un valor 0, lo cual indica que ninguno de los estados
es observable. Es cierto que la velocidad puede obtenerse integrando la aceleración,
y mediante una nueva integración obtener la posición; pero en este proceso nunca se
puede reconstruir la posición y velocidad inicial a partir de las mediciones.
C
Observador de Orden Reducido
C
Cuando algunas de las variables de estado son accesibles, es posible diseñar un
observador para estimar solo aquellos estados no medibles.
Para ello se puede realizar una transformación T para separar los estados medibles de
RU
aquellos que no lo son:
F y
x̂ =
T z
ż = Fz + TBu + Ly
ST
Si la matriz {C T}T resulta singular hay que realizar una nueva elección de L, dado que
para la estimación necesitamos contar con su inversa.
O
por la dinámica del error definida por Ae = A − LC. Esto resulta más eficiente que
un filtro SISO, dado que la medición se combina con la predicción, permitiendo utilizar
mayor información a la hora de filtrar las mediciones.
EN
Esto ofrece un fuerte argumento para utilizar un observador, aun en aquellos casos en
que todo el estado es medible. La contraparte es que los efectos de la perturbación
también serán filtrados con esta misma dinámica, introduciendo cierto atraso para el
rechazo de perturbaciones.
N
Esto hace el cómputo engorroso. Veremos dos opciones:
IO
Observador de Predicción Lo más simple consiste en usar la medición del instante
de muestreo previo para el término de corrección:
x̂k = Fx̂k−1 + Guk−1 + L y k−1 − ŷ k−1
C
El problema en este caso es que existe un retardo de un intervalo de muestreo en la
propagación de la medición.
La dinámica del error estará dada por:
C
ek = xk − x̂k = Fxk−1 + Guk−1 − [Fx̂k−1 + Guk−1 ]
− L (Cxk−1 + Duk−2 − Cx̂k−1 − Duk−2 )
RU
= F (xk−1 − x̂k−1 ) − LC (xk−1 − Cx̂k−1 )
Resultando que:
ek = (F − LC) ek−1
Vemos que matemáticamente esto es análogo al planteo en tiempo continuo, y como en
ST
Observador Actual Para usar la medición actual k podemos usar una estimación “a
priori” del estado actual sin usar el término de corrección para computar la medición
esperada:
N
x̂−
k = Fx̂k−1 + Guk−1
ŷ − −
k = Cx̂k + Duk−1
O
−
x̂k = x−
k − L y k − ŷ k
N
˙ = Ax̂ + Bu + L (y − ŷ)
x̂
u = Kx̂
y = Cx + Du
IO
ŷ = Cx̂ + Du
Sustituyendo:
ẋ = Ax − BKx̂
C
˙ = [A − BK] x̂ + LC (x − x̂)
x̂
C
o bien:
ẋ A −BK x
˙ = LC
x̂ A − BK − LC x̂
RU
Para tener una visión más clara de este resultado realizamos un cambio de coordenadas,
teniendo en cuenta que por la definición del error de estimación:
e = x − x̂ → x̂ = x − e
Entonces podemos replantear la dinámica de lazo cerrado como:
ST
ẋ A − BK BK x
=
ė 0 A − LC e
El polinomio caracterı́stico para esta dinámica es:
Alc (s) = |sI − (A − BK)| |sI − (A − LC)|
N
Vemos entonces que los autovalores o polos de lazo cerrado son los de la realimentación
de estados reales combinados con los de la dinámica del error de estimación. Por lo tanto
O
los autovalores de A − BK, por lo cual el error de estimación deberı́a ser en general
más rápido.
Estimación Óptima
Sean dos estimaciones x1 y x2 de una variable real x con error n1 y n2 de media nula y
varianza v1 y v2 respectivamente:
E n21 = v1
x1 = x + n1 , E {n1 } = 0 ,
E n22 = v2
x2 = x + n2 , E {n2 } = 0 , (5.28)
N
El valor medio de este error es nulo, como ocurre con las estimaciones originales:
E {e} = E {x̂} − E {x}
= αE {x1 } + βE {x2 } − x
IO
= [α + β − 1] x + αE {n1 } + βE {n2 }
=0
La varianza serı́a por definición:
C
n o
2
E e = E (x̂ − x) = E x̂2 + E x2 − 2E {x̂x} = E x̂2 + x2 − 2xE {x̂}
2
C
Expandiendo el cuadrado de la estimación:
x̂2 = α2 x21 + β 2 x22 + 2αβx1 x2
RU
= α2 x2 + n21 + 2xn1 + β 2 x2 + n22 + 2xn2 + 2αβ x2 + (n1 + n2 ) x + n1 n2
2
= (α + β) x2 + α2 n21 + β 2 n22 + 2α (α + β) xn1 + 2β (α + β) xn2 + 2αβn1 n2
= x2 + α2 n21 + β 2 n22 + 2 (αn1 + βn2 ) x + 2αβn1 n2
ST
= x2 + α2 E n21 + β 2 E n22
2
E e2 = α2 v1 + (1 − α) v2 = α2 (v1 + v2 ) − 2αv2 + v2
∂E e2 v2
= 2α (v1 + v2 ) − 2v2 = 0 → α=
∂α v1 + v2
C
con lo cual:
v1 v2
E e2 = v̂ =
v1 + v2
que es la media geométrica de las varianzas originales.
EN
cov(x, y) = E x y T
(5.31)
N
lo cual da como resultado una matriz simétrica. En el caso de un único vector, la varianza
es la matriz de covarianza dada por:
IO
cov(x) = E x xT
(5.32)
C
las diferentes componentes del vector.
Si no hay relación estadı́stica entre las diferentes componentes, los elementos no
diagonales serán nulos. Es fácil por lo tanto intuir el significado de los autovalores y
C
autovectores de dicha matriz.
y = Ax , cov(x) = P
T
cov(y) = E y y T = E Ax [Ax] = E Ax xT AT = APAT
(5.33)
ẋ = Ax + Bu + Bw w (5.34)
EN
y = Cx + Du + v (5.35)
w = N (0, W) , v = N (0, R)
N
minimización de la covarianza en el error de estimación P:
e = x − x̂ = N (0, P)
IO
En general este algoritmo se implementa en tiempo discreto:
C
xk+1 = Fxk + Guk + w̄k
y k = Cxk + Duk + v k
C
donde F y G son las matrices del modelo de tiempo discreto:
n o Z ts
−1 −1
F = Φ(ts) = L [sI − A] , G= Φ(t − τ )B dτ
RU
t=ts 0
x̂−
k+1 = Fx̂k + Guk
ST
Esta predicción será más incierta que la estimación previa x̂k debido a los ruidos de
proceso que no pueden incluirse en esta etapa por ser desconocidos.
La covarianza de dicha estimación a priori x̂−
k+1 será:
P− T
k = FPk−1 F + Q (5.36)
N
ŷ k = Cx̂−
k + Duk
x̂k = x̂−
k + Kk (y k − ŷ k )
C
Para esta fase de corrección primero se debe calcular la matriz de ganancias de Kalman,
que minimiza la covarianza de la estimación ası́ obtenida:
−1
Kk = P− C T
C P − T
C + R (5.37)
EN
k k
Pk = (I − Kk C) P−
k (5.38)
N
Esto implica que podemos obtener la ganancia de estado estacionario computando un
regulador LQR para el sistema dual:
IO
ż = AT z + CT y
con un ı́ndice de desempeño definido con la convarianza del ruido de proceso Q y la del
ruido de medición R.
C
5.2.4. Control Optimo Gausiano
C
Control LQG/LTR
La combinación de un regulador LQR con un filtro de Kalman se conoce como control
RU
LQG (Linear Cuadratic Gausian). Aunque ambos son algoritmos óptimos en cierto
sentido y el regulador LQR tiene buenas propiedades de robustez.
Si bien es cierto que el diseño del regulador y el del observador son problemas
independientes, esta combinación no resulta necesariamente robusta [SP01, Tew11].
ST
N
O
C
EN
IO
C
Apéndices
C
RU
Modelos Dinámicos
ST
ẋ = f (x, u, t) (A.1)
donde x ∈ Rn es el vector de estado, u ∈ Rm es un vector de acciones exógenas
O
143
El modelo completo resulta:
N
El modelo lineal resulta:
IO
y = C∆x + D∆u
donde:
∂f
A= , ∆x = x − x0
C
∂x x0 ,u0
∂f
B= , ∆u = u − u0
C
∂u x0 ,u0
∂h
C=
∂x x0 ,u0
RU
∂h
D=
∂u x0 ,u0
ẋ = Ax + Bu (A.6)
y = Cx + Du (A.7)
N
Podemos aplicar la transformada e Laplace para obtener una solución del modelo lineal:
φ11 (s) φ12 (s) ··· φ1n (s)
−1
φ21 (s) φ22 (s) ··· φ2n (s)
Φ(s) = [sI − A] = . (A.9)
.. .. ..
.. . . .
EN
N
Frecuentemente en control automático se plantean modelos para la dinámica de los
procesos a controlar, identificando las acciones de control u y las variables medidas
y , asumiendo que estas tienen una relación estática (instantánea) con las salidas y
IO
entradas del sistema de control. Sin embargo en general esta interacción entre el
proceso y el controlador se da por medio de sensores y actuadores cuyas dinámicas
no aparecen inicialmente en el modelo del proceso.
C
Esto se da por ejemplo al analizar la dinámica del avión, al asumir que la deflexión de
las susperficies de control aerodinámico o el empuje son acciones de control (pueden
ser manipuladas directamente), cuando el realidad las acciones de control son señales
C
enviadas a un actuador (servomecanismos en el caso de las superficies aerodinámicas)
que se encarga de ejecutar este movimiento.
RU
En tanto la dinámica de estos actuadores resulta rápida respecto de la dinámica de lazo
cerrado que se pretende lograr, no incluirlos en el modelo es admisible. Algo similar
puede decirse de los sensores.
Cuando esto no es ası́ se requiere contar al menos con un modelo de la dinámica
dominante de los actuadores y de los sensores, para fusionarlo con el modelo del
ST
proceso principal.
ẋa = Aa xa + Ba v
y a = Ca xa + Da v ≡ u
O
los actuadores:
ẋ A BCa x BDa
= + v (A.13)
ẋa 0 Aa xa Ba
EN
x
y = C DCa + DDa v
xa
ẋs = As xs + Bs y
y s = Cs xs + Ds y
N
A.1.3. Matriz de Transferencia
A partir de la solución en Laplace (A.8) podemos despejar una relación entre entradas y
IO
salidas:
−1 −1
Y (s) = {C [sI − A] B + D}U (s) + C [sI − A] x(0) (A.15)
C
el efecto de las entradas sobre las salidas partiendo de condiciones iniciales nulas
(equilibrio):
−1
C
G(s) = C [sI − A] B+D (A.16)
En sı́ntesis podemos decir que:
RU
Y (s) = [CΦ(s)] x(0) + G(s)U (s)
De forma expandida:
U1 (s)
Y1 (s) G11 (s) G12 (s) · · · G1m (s)
U2 (s)
.. .. .. .. ..
ST
. = . . . . ..
.
Yl (s) Gl1(s) Gl2(s) · · · Gln (s)
Um (s)
Función de Transferencia
N
Cada elemento Gij (s) es una función racional cuyo denominador es el polinomio
caracterı́stico de la matriz A, de orden n, y el numerador es un polinomio como máximo
de orden n, si D 6= 0, o a lo sumo n − 1 si D = 0.
O
Respuesta en Frecuencia
EN
N
Modelo de Estados
Podemos evaluar la solución de la ecuación de estados (A.10) entre dos instantes de
muestreo consecutivos ta = kts y tb = (k + 1)ts :
IO
Z tb
x(tb ) = Φ(tb − ta )x(ta ) + Φ(t − τ )Bu(τ )dτ
ta
C
Como el sistema es invariante en el tiempo podemos decir que:
Z ts
x(tb ) = Φ(ts )x(ta ) + Φ(t − τ )Bu(τ )dτ
C
0
y k = Cxk + Duk
donde Z ts
C
F = Φ(ts ) , H= Φ(t − τ )B
0
Transformada Z
De la misma forma que ocurre con el modelo de tiempo continuo (A.6), la solución para
una ecuación en diferencias como lo és el modelo de tiempo discreto (A.18) no puede
obtenerse de forma algebraica. Pero al igual que en el caso continuo es posible convertir
el modelo discreto en una expresión algebraica aplicando la transformada Z.
N
X X
y ∗ (t) = y(t)δ(t − nts ) = y(nts)δ(t − nts)
n=0 n=0
IO
Aplicando Laplace:
∞
" #
Z ∞ X
L {y ∗ (t)} = y(nts )δ(t − ns ) e−st dt
0 n=0
C
∞ Z
X ∞
y(nts)δ(t − nts ) e−nts s dt
=
n=0 0
C
Como s(t) = 0∀t 6= nts , podemos sustituir st por nts s en el exponente y reemplazar la
integral por la sucesión y(n · ts):
RU
∞
X
L {y ∗ (t)} = y(nts ) e−nts s
n=0
z = e−ts s (A.19)
(A.20)
n=0
operador lineal:
∞
X
Z {x(t) + y(t)} = [x(nts ) + y(nts )] z −n = Z {x(t)} + Z {y(t)}
n=0
X∞
Z {αy(t)} = αy(nts ) z −n = αZ {y(t)}
n=0
N
Por lo tanto:
Z {y(t + ts )} = z Z {y(t)} − y(0)z (A.21)
Usando un razonamiento similar se demuestra que:
IO
Z {y(t − ts )} = z −1 Z {y(t)} (A.22)
Podemos notar en esto un paralelismo con la transformada de Laplace. Para esta la
variable compleja s representa al operador derivada en el tiempo, y s−1 la integral.
C
Para la transformada Z la variable compleja z representa un operador de desplazamiento
hacia adelante en el tiempo de magnitud ts , y su inversa z −1 un atraso temporal de igual
amplitud.
C
Solución del Modelo de Estados Discreto
De forma similar a la solución del modelo de tiempo continuo con Laplace, podemos
RU
aplicar la transformada z al modelo de tiempo discreto (A.18) recurriendo a la propiedad
(A.21) para convertirlo en una expresión algebraica:
zX(z) − zx0 = FX(z) + HU (z)
por lo tanto
ST
−1
φ(z) = [zI − F]
Esto es matemáticamente igual a la solución de tiempo continuo A.8. Dado que se trata
de un operador lineal, la transformada Z inversa se puede calcular de forma directa a
O
Matriz de Transferencia
Aplicando también la transformada Z a la ecuación de salida y despejando para
EN
C
Estabilidad del Modelo Discreto y Mapeo s-z
La ecuación (A.19) define un “mapeo” entre el pano s y el plano z:
RU
z = e−ts s = e−ts Re{s}−ts jIm{s} = e−ts Re{s} e−jts Im{s} (A.24)
Es evidente que:
|z| = e−ts Re{s} , ∠z = e−jts Im{s} (A.25)
ST
Por lo tanto una recta Re {s} = cte (vertical) en el plano s es una circunsferencia de
radio e−ts Re{s} en el plano z , mientras que una recta Im {s} = cte (horizontal) en el
plano s es una radial con ángulo e−ts Im{s} en el plano z . Debe tenerse presente que la
parte real en s define el tiempo de establecimiento en el caso estable, o el tiempo para
duplicar la amplitud en el inestable. Esto en el plano z queda entonces asociado a la
N
distancia al origen.
A su vez, la parte imaginaria en s define la frecuencia de oscilación en el caso sub-
amortiguado. En el plano z esto se mapea a una lı́nea radial.
O
IO
El caso más simple es el de una dinámica de primer orden:
C
ẋ = −a x + b u
y = cx
C
La matriz de transición de estados para este caso es escalar:
1
RU
φ(s) = → φ(t) = e−at
s+a
Si a > 0 es una dinámica estable sobre-amortiguada.
La matriz de transferencia también es escalar:
Y (s) b
=
ST
U (s) s+a
El modelo en tiempo discreto será:
xk+1 = ā xk + b̄ uk
yk = c xk
N
donde
b
ā = e−ats 1 − e−ats
→ b̄ =
O
a
La matriz de transición de estados discreta es:
1
C
φ(z) =
s − ā
y la función de transferencia discreta resulta:
EN
Y (z) b̄
=
U (z) s − ā
El polo en el modelo continuo está en s = −a (semiplano izquierdo) mientras que para
el modelo discreto es z = e−ats (interior del circulo unitario).
En la figura A.2 se ve la respuesta al escalón calculada con el modelo continuo y con el
discreto.
Estado Estacionario
Los valores de una señal en estado estacionario para el modelo de tiempo contı́nuo se
pueden determinar a partir del teorema del valor final. Para modelos de tiempo continuo
se tiene:
yss = lı́m y(t) = lı́m s Y (s)
t→∞ s→0
N
En tiempo discreto este teorema toma la siguiente forma [Oga96, p.6]:
IO
lo cual es consistente con el hecho de que el modelo discreto del escalón unitario es
−1
1 − z −1 .
Esto implica que para determinar la ganancia a frecuencia cero a partir de una función
C
de transferencia discreta G(z) debemos computar G(1).
Respuesta en Frecuencia
C
La respuesta en frecuencia del proceso operando en tiempo discreto puede obtenerse
reemplazando z = ejωt en la función discreta, en concordancia con el mapeo en el plano
s y el plano z .
RU
Debe observarse que para un determinado modelo continuo, la respuesta en frecuencia
discreta no coincide con la continua; dado que para el modelo discreto hay un dispositivo
de retención a la entrada. Podrı́amos decir que la respuesta en frecuencia discreta se
corresponde con la respuesta en régimen estacionario del proceso continuo con una
entrada senoidal procesada por una retención de orden cero.
ST
en frecuencia.
Para lidiar con este inconveniente se puede aplicar una segunda transformación al
O
modelo continuo, esto es, mapear el plano z a otro plano que denominaremos w
mediante la transformada bilineal, también conocida como método de Tustin; definida
como [Oga96, p.228]:
C
ts
1+ w 2 z−1
z= 2 → w= (A.27)
ts ts z + 1
1− w
EN
2
Esta transformada mapea el interior del cı́rculo unitario del plano z en el semiplano
izquierdo del plano w, llevando el cı́rculo unitario en z al eje imaginario en w.
En el plano w la respuesta en frecuencia vuelve a ser una función racional, pero en
términos de una frecuencia ficticia ν relacionada no-linealmente con la frecuencia real ω :
2 ts
Im {w} = ν = tan ω (A.28)
ts 2
N
Ver [sW04, cap.8, p. 293].
IO
C
C
RU
ST
N
O
C
EN
N
Los bloques son transformaciones aplicadas sobre las señales, y los puntos de suma
son bloques especiales que representan adición sustracción de señales.
IO
Un ejemplo muy simple es el de un modelo masa-resorte-amortiguador:
C
C
mv̇ = f − fr − fb ṗ = v fr = k · p fb = b · v (A.29)
donde f es una fuerza externa, mientras que las expresiones para fr y fb son modelos
RU
para los fenómenos elásticos y disipativos respectivamente.
La ecuación diferencial puede escribirse de forma más significativa dejando en claro las
relaciones causa-efecto de la siguiente forma:
Z t Z t
v= (fr + fb + fp ) dt p= vdt (A.30)
0 0
ST
Como en este caso el modelo es lineal, podemos aplicar la transformada de Laplace para
obtener expresiones algebraicas. De esta forma es posible operar para encontrar alguna
relación entre una variable de entrada y cualquiera de las señales. Con la transformada
de Laplace convertimos el operador derivada en un producto por la variable s:
EN
N
IO
El bloque del recuadro verde incluye dos términos que toman una misma señal de
entrada (P (s)) y la suman (o restan) a una misma señal resultante. Estos bloques en
C
paralelo pueden ser sustituidos por uno que equivalga a la suma de ambos:
C
RU
El resultado tiene una estructura genérica de la forma:
ST
tenemos que:
Z(s) = X(s) − H(s)Y (s)
O
y además:
Y (s) = G(s)Z(s)
Despejando Z(s) y sustituyendo en lo anterior:
C
= (A.31)
X(s) 1 + G(s)H(s)
Para nuestro ejemplo:
1
P (s) ms2 1
= =
F (s) bs + k ms2 + bs + k
1+
ms2
Figura A.3: Reducción del diagrama en bloques para el modelo de 1/4 de auto con 2 grados de libertad
Por ejemplo, para un modelo de 1/4 de auto para la suspensión con dos grados de
libertad:
N
IO
C
Con modelos lineales de elasticidad y amortiguamiento:
C
M ẇ = f1 f1 = k + b˙
RU
mẇr = f2 − f1 f2 = kr δ + br δ̇
ż = w , żr = wr , = z − zr , δ = zr − h
1
M s2 Z(s) = F1 (s) → Z(s) = F1 (s)
M s2
1
ms2 Zr (s) = F2 (s) − F1 (s) → Zr (s) = [F2 (s) − F1 (s)]
ms2
N
Con esto planteamos el diagrama superior de la figura A.3. Luego reducimos el diagrama
hasta obtener un solo bloque que transforme la señal de entrda (en este caso la altura
del terreno) con la de salida (la altura de la carrocerı́a).
C
Hacemos una simplificación del último bloque para obtener una función racional:
Conceptos Principales
Representación gráfica de ecuaciones algebraicas
Reducción de diagramas en bloques
N
IO
C
C
RU
ST
N
O
C
EN
N
El LEM fue construido por la Grumman, por un contrato de u$s 350 M. Estaba compuesto
de dos etapas, una de descenso y otra de ascenso.
IO
Los módulos de descenso contenı́an el tren de aterrizaje, la antena del radio-altı́metro,
el motor de descenso y el combustible para el alunizaje. También tenı́a varios
compartimientos de carga usados para llevar entre otras cosas, los paquetes de los
experimentos de la misión, un carro móvil para el equipo (un carro tirado a mano para
C
los equipo llevado en la misión Apolo 14), el Lunar Rover (un vehı́culo lunar eléctrico
llevado en las misiones Apolo 15, 16 y 17), una cámara de televisión, herramientas y
cajas para la recolección de muestras de la superficie lunar.
C
El módulo de ascenso contenı́a la cabina para la tripulación, los tableros de instrumentos,
el puerto y escotilla de acople (al CSM), la escotilla delantera, el sistema de control
RU
de reacción, las antenas del radar y de comunicaciones, el motor de ascenso y el
combustible para volver a la órbita lunar y encontrarse con el CSM.
ST
N
O
C
C
Dimensiones
Altura 6,37m
RU
Diámetro 4,27m
Envergadura en el tren de aterrizaje 9,07m
Volumen 6,65m3
Masas
Módulo de Ascenso (con combustible) 4670kg
ST
Propulsión
RCS: Reaction Control System (N2O4/UDMH) 16x441N
N
1. Una fase de frenado (Programa 63, o P63) iniciada mediante un teclado unos 10
minutos antes del momento nominal de ignición. P63 primero computa el momento
preciso y la actitud para la ignición. Luego, tı́picamente a 492-km del sitio de alunizaje,
C
P63 enciende el DPS (Descent Propulsion System). Finalmente, P63 transfiere el
LM al estado terminal requerido como condición inicial para la fase de aproximación
C
subsiguiente. La transferencia toma tı́picamente 514 segundos y es casi óptima.
o decrementado en pasos de 0.3 m/s cada vez que el comandante sube o baja un switch
de control (ROD: rate-of-descent) control ubicado cerca de su mano izquierda.
EN
Control de Descenso
Supongamos que nuestra tarea es automatizar al menos la fase de descenso final, dado
que se debe optimizar el uso de combustible y evitar que el vehı́culo quede desnivelado
sobre la superficie, lo cual impedirı́a el posterior despegue del módulo de ascenso. Esto
implicará tomar contacto con la superficie de forma suave, pero sin pérdidas de tiempo
innecesarias durante el descenso.
N
nivel de control de empuje, lo cual no es sencillo debido a las inestabilidades que pueden
experimentarse en la cámara de combustión de un motor cohete por cuestiones termo-
fluidodinámicas.
IO
El DPS permitı́a regular empuje solo en el rango 10 60 %, lo cual define entonces el
rango admisible para nuestra acción de control.
C
Para automatizar el descenso podemos plantear al menos dos estrategias: A - Seguir un
C
B - Ajustar la velocidad de descenso en función de la altura, en base a una curva o
mapeo altura ¿velocidad predefinido
RU
Si vamos a controlar altura podemos plantear el siguiente modelo:
d dh
{m × w} = ṁw + mẇ = F − mg , =w
dt dt
en donde g es la atracción gravitatoria, F es el empuje del motor y m es la masa del
ST
vehı́culo, que varı́a en el tiempo por el consumo del combustible. Asumiendo que el
consumo es proporcional al empuje:
ṁ = cf F → mẇ = (1 − cf w) F − mg
ṁ = cf F → mẇ = (1 − cf w) F − mg
N
Linealizando:
O
mẇ = (1 − cf w) ∆F − cf F0 w − mg , ∆F = F − F0
Tomando w0 = 0 y F0 = mg :
C
1
∆F − cf gw − q
ẇ =
m
Dado que el sistema de propulsión no reacciona de forma instantánea a un comando,
proponemos un modelo de primer orden para la relación entre comando y empuje:
EN
Tdps Ḟ + F = u;
en donde Tdps serı́a la constante de tiempo del motor.
Aplicando Laplace:
1 g
(s + cf g) W (s) = ∆F (s) − , sH(s) = W (s)
m s
N
El diagrama en bloques de la planta serı́a:
IO
C
El problema de esta perspectiva es que para encontrar una relación entre acción
C
de control y salida debemos eliminar la perturbación gravitatoria, pero esta puede
conservarse como una perturbación equivalente a la entrada Di o a la salida Do .
RU
Perturbación Equivalente a la Entrada
1/m Tdps s + 1
H(s) = U (s) − mg
s (s + cf g) (Tdps s + 1) s
ST
N
O
1/m 1
H(s) = U (s) − 2 g
s (s + cf g) (Tdps s + 1) s (s + cf g)
EN
mg 1/cf
Di (s) = , Do (s) = 2
s s
mientras que la función de transferencia de la planta resulta:
H(s) 1/m
G(s) = =
U (s) s (s + cf g) (Tdps s + 1)
La planta es de tipo 1, por lo cual tendrá error nulo a una referencia constante y error
N
finito para una referencia de tipo rampa.
Sin embargo la perturbación de entrada en estado estacionario es de tipo constante y
el lazo de realimentación para esta perturbación incluye solo el controlador, por lo cual
IO
este deberı́a tener acción integral.
C
C
Si lo analizamos como perturbación de salida, el lazo de realimentación en este caso
RU
incluye a la planta, que ya tiene un polo en el origen; pero la perturbación de salida en
estado estacionario serı́a de tipo rampa, por lo cual nuevamente vemos la necesidad de
incluir acción integral en el controlador:
ST
que tendremos un rechazo exacto en estado estacionario. Por otra parte en este caso
no habrá un transitorio como respuesta a la perturbación, dado que la gravedad actúa
permanentemente con la misma intensidad. .
Tomando m = 15000, cf = 3,28,10−4 , g = 1,62, Tdps = 1 y normalizando la
EN
acción de control con la cuarta parte del empuje máximo del DPS (11677N , que serı́a
aproximadamente el rango de nuestra acción de control que va del 10 al 50 % del empuje
máximo) la planta es:
m = 15000;
cf = 3.2787e − 4;
g = 1.62;
Tdps = 1;
N
IO
C
C
RU
H(s) 6,67 × 10−5
G(s) = =
U (s) s (s + 5,3 × 10−1 ) (s + 1)
No podemos esperar que el lazo cerrado sea más rápido que el actuador, que en este
caso es el DPS y tiene una constante de tiempo de 1s. Por lo tanto podemos asumir
ST
con tranquilidad que el polo en está prácticamente en el origen, con lo que el modelo se
reduce a:
H(s) 6,67 × 10−5
G(s) = = 2
U (s) s (s + 1)
Incluyendo el integrador del compensador el diagrama de lugar de raı́ces es:
N
G = t f ( 6 . 6 7 e −5, [ 1 1 0 0 ] ) ;
r l o c u s (G ) ;
O
sgrid ;
Es claro que se requiere de un compensador, dado que con un control integral puro, que
es lo que tenemos hasta ahora; el lazo cerrado será inestable.
C
C
convergencia más rápida que para el caso de amortiguamiento crı́tico o una respuesta
sobre-amortiguada, y podrı́amos adoptarlo.
El otro punto a definir es: ¿cuan rápida queremos que sea la respuesta?
C
La maniobra de descenso final tendrı́a una duración del orden de los 30s. Está claro que
la respuesta transitoria deberı́a extinguirse en un tiempo mucho menor.
Por otra parte tenemos un actuador con una constante de tiempo de un segundo, y
RU
no podemos pretender una respuesta de lazo más rápida que la del actuador. En caso
contrario durante cualquier transitorio habrá frecuentemente saturación de la acción de
control (motor al máximo o a cero empuje) y la respuesta no se corresponderá con lo
que podrı́a suponerse a partir del modelo lineal.
Tentativamente tomemos como objetivo tiempo de establecimiento ts s < 4 y
ST
amortiguamiento η > 0,8. Los polos dominantes de lazo cerrado podrı́an ubicarse en
s = −2 ± j1,2.
controlador serı́a:
2
(s + z)
K(s) = kc
s
con z = 1,19. Restarı́a calcular kc para cumplir con la condición de módulo, lo cual da
N
K(s) = 5,6
s
% objetivo
p l o t ( r e a l ( p ) , imag ( p ) , ’ s ’ ) ;
hold on ;
% l a z o c e r r a d o con e l modelo s i m p l i f i c a d o
To = m i n r e a l (K∗Go/ ( 1 +K∗Go ) ) ;
p = roots ( To . den { 1 } ) ;
% l a z o c e r r a d o con e l modelo s i n s i m p l i f i c a
T = m i n r e a l (K∗G/ ( 1 +K∗G ) ) ;
zpk ( T )
p = roots ( T . den { 1 } ) ;
p l o t ( r e a l ( p ) , imag ( p ) , ’ x r ’ , ’ LineWidth ’ , 2 )
axis ([ − 3.5 0 . 5 −2 2 ] ) ;
legend ( ’ p o l o s deseados a l a z o c e r r a d o ’ . . .
N
, ’ polos con e l modelo s i m p l i f i c a d o ’ . . .
, ’ polos con e l modelo completo ’ ) ;
sgrid ;
IO
C
C
RU
ST
Un aspecto adicional que deberı́amos verificar es que pasa al variar la masa entre el
N
valor al inicio del descenso y el caso lı́mite de consumir la totalidad del combustible.
Modelo Matemático
En primer término proponemos un modelo de dos grados de libertad, considerando el
rotor del generador y la turbina como dos cuerpos rı́gidos vinculados mediante un eje
N
Tt = cα [β − cω ωt ] , Te = ke φ , φ̇ = ωt − ωg
IO
donde β es el ángulo de paso de las palas, cα y cω son coeficientes hidrodinámicos y ke
es la rigidez a torsión del eje.
El rotor del generador tiene 40 pares de polos magnéticos, 650 toneladas de peso y
13,50 metros de diámetro. El eje de la turbina tiene 11,00 metros de largo, 95 toneladas
C
de peso y 1,50 metros de diámetro. La turbina es de 6 palas y tiene un diámetro de 8,5m.
Considerando además la potencia del equipo y algunas suposiciones básicas obtenemos
los siguientes valores aproximados para este ejercicio:
C
Jt 0,9 × 106 kgm2 momento de inercia de la turbina
29,6 × 106 kgm2
RU
Jg momento de inercia del rotor del generador
b (despreciable) amortiguamiento por lubricación de los mecanismos de transmisión
ke 194 × 106 N m rigidez del árbol de transmisión
cω 0,129 variación del torque asociada a la velocidad de giro
cα 87,1 × 106 N m variación del torque asociada al ángulo de ataque
ST
ω(s) 631,8
G(s) = = (A.32)
β(s) (s + 0,376)(s2 + 12,07s + 216,8)
N
O
C
EN
N
banda está definido por el polo real p = −0,376, respecto del cual el par complejo
conjugado asociado a la dinámica elástica con ωn = 14,72 puede considerarse como
rápido.
IO
Proponemos un modelo nominal dado por:
7,749
Go (s) = (A.33)
2,659s + 1
que tiene la misma ganancia a frecuencia cero que (A.32) pero solo conserva el polo
C
real.
En la figura XX vemos que el modelo simplificado da una buena aproximación para
C
frecuencias una década por encima del ancho de banda de lazo abierto.
Entre los modelos (A.32) y (A.33) podemos computar un modelo de incertidumbre
multiplicativa global:
RU
G(s) −s(s + 12,07)
G∆ (s) = −1= 2 (A.34)
Go (s) s + 12,07s + 216,8
Con el modelo simplificado el polinomio de lazo cerrado incluyendo el integrador del
control es de orden 3.
De acuerdo al ancho de banda de lazo abierto partimos de un ancho de banda de lazo
ST
Ab (s) = s3 + 2s2 + 2s + 1
N
Sin considerar los ceros que pudieran aparecer en la función T (s) aportados por el
compensador tendrı́amos con estos polinomio las respuestas en frecuencia y al escalón
mostradas en la siguiente figura.
C
EN
A0 = s (2,659s + 1)
N
donde el polo en el origen se agregó manualmente al compensador obtenido del ajuste
polinomial.
IO
Las dinámicas de lazo cerrado para cada caso se muestran en la figura siguiente,
considerando tanto el modelo nominal (gráficos superiores) y como el modelo completo
(gráficas inferiores). Puede notarse que no se manifiestan diferencias significativas.
C
C
RU
ST
N
N
IO
C
C
RU
Aunque la situación empeoró en todos los casos, el menor impacto se obtuvo para el
polinomio con polos dominantes de segundo orden.
ST
Todo esto era previsible evaluando el margen de robustez resultante con este ancho de
banda:
N
O
C
EN
IO
C
C
1.1. superficies de control aerodinámico en un avión . . . . . . . . . . . . . . . . . . . . . 3
1.2. Sistema realimentado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
RU
1.3. Lazo de control a lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5. Diagrama en bloques de un sistema realimentado con un compensador PID . . . . . . 8
1.6. En esta imágen vemos arriba inverters de diferente potencia (a la izquierda) para control
de motores eléctricos, un interfaz de operador (a la derecha) y varios modelos de PLCs
al centro y debajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.7. Sistema SCADA en una sala de control . . . . . . . . . . . . . . . . . . . . . . . . . . 9
ST
2.7. Esquema del control de régimen de giro (governor ) de un helicóptero con motor de
combustión interna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.9. Replanteo de la figura 2.6 para poner en evidencia las sensibilidades del error a las
distintas entradas del lazo SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
EN
173
3.4. Algunos ejemplos del “teorema del encierro” (tomado de [Oga10]). En los casos (a) y
(b) hay encierro al origen de la curva transformada, mientras que en los (c) y (d) no.
Observar a la izquierda la cantidad de polos y ceros en la región acotada por la curva
original. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.5. Trayectoria de Nyquist modificada para un lazo abierto con polo en el origen y ejemplo
de un posible mapeo (tomado de [Oga10]) . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6. Margenes de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.7. Replanteo del lazo estándar a uno con realimentación unitaria . . . . . . . . . . . . . . 62
3.8. Interpretación gráfica de los términos de la ecuación (??) . . . . . . . . . . . . . . . . 62
N
3.9. Grillas para la determinación de la respuesta en frecuencia de lazo cerrado a partir de
la traza de nyquist del lazo abierto (tomado de [Oga98]) . . . . . . . . . . . . . . . . . 63
3.10.Validez de la hipótesis de control perfecto para una dinámica dominante de segundo
IO
orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.11.Parametrización de la respuesta transitoria . . . . . . . . . . . . . . . . . . . . . . . . 69
3.12.Mapeo de las especificaciones de respuesta transitoria a regiones admisibles para los
polos de lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
C
3.13.Ajuste de un compensador en adelanto mediante el método de la bisectriz (ver [Oga10,
p. 315]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
C
4.1. Respuesta en frecuencia y transitoria al escalón de filtros de los filtros de Butterworth y
Bessel de orden 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.2. Análisis de desempeño en relación a la sensibilidad . . . . . . . . . . . . . . . . . . . 88
RU
4.3. Lazo de control general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
s + 0,8
4.4. Polos-ceros y respuesta en frecuencia para G1 (s) = 7,5 (azul) y G2 (s) =
(s + 2)(s + 3)
−s + 0,8
7,5 (rojo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
(s + 2)(s + 3)
4.5. Análisis de estabilidad robusta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
ST
libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
A.5. Fases de la maniobra de alunizaje de ?as misiones Apollo de la NASA . . . . . . . . . 160
A.6. Esquema del ajuste del vector de empuje para control de trayectoria . . . . . . . . . . 161
IO
C
C
[GGS01] Graham C. Goodwin, Stefan F. Graebe, and Mario E. Salgado. Control System Design.
Prentice Hall, 2001.
[JENR09] Eduardo F. Camacho Julio E. Normey-Rico. Unified approach for robust dead-time
RU
compensator design. Journal of Process Control, (19):38–47, 2009.
[KND] J. Kautsky, N.K. Nichols, and P. Van Dooren. Robust pole assignment in linear state
feedback.
[Oga93] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 2 edition, 1993.
[Oga96] Katsuhiko Ogata. Sistemas de Control en Tiempo Discreto. Prentice Hall, 2 edition, 1996.
[Oga98] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 3 edition, 1998.
N
[Oga10] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 5 edition, 2010.
[Peñ92] Ricardo S. Sánchez Peña. Introducción a los Teorı́a de Control Robusto. AADECA, 1992.
O
[SP01] Sigurd Skogestad and Ian Postlethwaite. Multivariable Feedback Control - Analysis and
Design. John Wiley & Sons, 2 edition, 2001.
C
[sW04] Karl J. Äström and Björn Wittenmark. Computer Controlled Systems - Theory and Design.
Prentice Hall, 3 edition, 2004.
[Tew11] Ashish Tewari. Advanced Control of Aircraft, Spacecraft and Rockets. John Wiley and Sons,
EN
2011.
[ZN42] J.G. Ziegler and N.B. Nichols. Optimum settings for automatic controllers. 1942.
175