′ = RVCG
′ = RVCG
rCG
rCG
F
F
VCG =
− [ ×]VCG VCG =
− [ ×]VCG
mA
mA
R = [R ×]R
R = [R ×]R
−1
−1
= I (M − [ ×]I ) = I (M − [ ×]I )
′ = RVCG
′ = RVCG
rCG
rCG
F
F
− [ ×]VCG
− [ ×]VCG VCG =
VCG =
mA
mA
R = [R ×]R
R = [R ×]R
−1
−1
= I (M − [ ×]I ) = I (M − [ ×]I )
′ = RVCG
′ = RVCG
rCG
rCG
F
F
− [ ×]VCG
VCG =
− [ ×]VCG VCG =
mA
mA
R = [R ×]R
R = [R ×]R
−1
−1
= I (M − [ ×]I ) = I (M − [ ×]I )
Índice
Capítulo 1 Introducción ......................................................4
El Vehículo..................................................................................................................... 4
Comentarios sobre la notación .................................................................................... 6
Capítulo 2 Dinámica de Sistemas ....................................10
Cadenas Dinámicas ..................................................................................................... 10
Principio de Mínima Acción ...................................................................................... 12
Ecuaciones de Euler - Lagrange. ............................................................................... 13
Teoría de Pequeñas Perturbaciones .......................................................................... 16
Solución General del Sistema Dinámico de Control ................................................ 21
Sub Espacios Invariantes ........................................................................................... 23
Modos Normales.......................................................................................................... 30
Estabilidad ................................................................................................................... 34
Teorema de Cayley - Hamilton .................................................................................. 41
Teorema de Controlabilidad...................................................................................... 44
Representación Externa ............................................................................................. 45
Diseño de Controladores ............................................................................................ 47
Ejemplo del Péndulo Invertido .................................................................................. 50
Capítulo 3 Ecuaciones de Movimiento del Vehículo......59
Ejes de Referencia....................................................................................................... 59
Rotaciones en el Espacio............................................................................................. 61
Forma de Gibbs de la Matriz de Rotación................................................................ 63
Transformación de Coordenadas y de Componentes.............................................. 66
Transformaciones por los Ángulos de Euler ............................................................ 68
Sistemas de Referencia en Movimiento..................................................................... 72
Relaciones entre Sistemas de Referencia .................................................................. 77
Dinámica del Cuerpo Elástico.................................................................................... 82
Sistema Dinámico del Vehículo.................................................................................. 91
Fuerzas y Momentos. ................................................................................................ 104
Momentos Másicos para Eslabones......................................................................... 111
Par Dinámico Corredera: Un Eje de Deslizamiento.............................................. 112
Par Dinámico Articulación: Un Eje de Rotación ................................................... 114
Capítulo 4 Compensación ..............................................119
Análisis Dimensional................................................................................................. 119
Adimensionalización de las Ecuaciones de Movimiento........................................ 126
Definición de los Estados de Referencia.................................................................. 129
Análisis Cinemático. ................................................................................................. 131
Análisis Dinámico...................................................................................................... 132
Vuelo Estacionario .................................................................................................... 133
Vuelo Rectilíneo ........................................................................................................ 136
Vuelo Curvilíneo ....................................................................................................... 139
Capítulo 5 Estabilidad .....................................................145
Ecuaciones del Movimiento Perturbado................................................................. 145
Derivadas de Estabilidad.......................................................................................... 150
Vuelo Estacionario .................................................................................................... 158
Vuelo Rectilíneo ........................................................................................................ 158
Vuelo Curvilíneo ....................................................................................................... 174
Capítulo 6 Control .........................................................178
Derivadas de Control ................................................................................................ 178
Unidades de Mediad Inercial ................................................................................... 178
Capítulo 7 Simulación .....................................................198
Simulador del Vehículo. ........................................................................................... 198
Anexos..............................................................................200
Estándar Internacional de la Atmósfera Terrestre ............................................... 200
Métodos de Runge Kutta.......................................................................................... 211
Capítulo 1
Introducción
El Vehículo
El objetivo fundamental de la dinámica de vehículos es el de predecir el movimiento del
artefacto a partir de una condición inicial bien definida. Ahora bien, la dinámica del
vehículo, está determinada por el funcionamiento de todas y cada una de sus partes. Es
decir, si se desea predecir cual será el movimiento de un vehículo, se requiere de todo el
conocimiento necesario para predecir el comportamiento de cada parte o subsistema. Es
evidente que no puede verterse todo este conocimiento en un solo texto, pues resultaría
de proporciones inmanejables. En el presente trabajo, daremos una breve introducción de
algunos de los conceptos que se requieran conforme se haga necesario, sin embargo,
remitiremos al lector a textos más completos sobre temas particulares. Nuestro objetivo
principal es el de poner las bases necesarias y suficientes para que el estudiante pueda
tener una idea integral de los pasos que deben seguirse al diseñar y analizar un vehículo.
En un caso práctico, será necesario recurrir a otras fuentes de información para detalles
particulares tales como la teoría de mecanismos, teoría del control, teoría de máquinas
térmicas, la mecánica de fluidos, la mecánica de sólidos elásticos o teoría de la
elasticidad, etc. Una ventaja de esta perspectiva, es que el estudiante puede darse cuenta
del porqué es necesario estudiar dichos temas en profundidad, antes de lanzarse a la
aventura de diseñar, analizar y construir un vehículo; esto es, si desea hacerlo con el
conocimiento científico con el que cuenta la humanidad hoy en día, a un nivel de
verdadera ingeniería; si desea solamente lograr “algo” que se mueva, puede ahorrarse
“tanta física y tantas matemáticas...”
Existe un sinnúmero de vehículos distintos diseñados para el transporte en diferentes
medios y condiciones. Esta circunstancia implica que, a lo largo del tiempo, se ha
desarrollado una subdivisión de la dinámica de vehículos en diferentes ramas que han
evolucionado, en ocasiones, en forma independiente. Entre ellas podemos mencionar la
mecánica de vuelo, la mecánica orbital, la mecánica de navíos o náutica, etc. Sin
embargo, independientemente de la clase de vehículo de que se trate, la dinámica de
vehículos puede dividirse en tres áreas de acuerdo con la finalidad del estudio, éstas áreas
son: análisis estructural, análisis de estabilidad y control y, finalmente, análisis de
actuaciones. Tradicionalmente, cada una de estas áreas ha estudiado el movimiento del
vehículo según perspectivas y métodos diferentes. A continuación explicitamos
brevemente el enfoque de cada área.
En el análisis estructural se considera al vehículo como un cuerpo deformable
tridimensional. Se está interesado en el estudio de las traslaciones, rotaciones y
deformaciones. El objetivo de este análisis es garantizar la integridad estructural del
vehículo en las diferentes condiciones de movimiento. La integridad estructural implica
el análisis de los esfuerzos a que están sometidos los diferentes elementos y materiales
con que está construido el vehículo. Las distintas solicitaciones a que se ve sometido
durante su movimiento son debidas principalmente a dos factores: el medio fluido que lo
rodea, a través de las fuerzas aerodinámicas, y la curvatura o aceleración de su
trayectoria, a través de las fuerzas inerciales (en el caso de vehículos espaciales los
esfuerzos debidos a gradientes de temperatura son también muy importantes). Los
análisis estructurales generalmente involucran tiempos muy cortos, del orden del inverso
de la frecuencia de oscilación de un elemento característico.
En el área de estabilidad y control se considera al vehículo como un cuerpo rígido
tridimensional y se está interesado en el estudio de las traslaciones y rotaciones. Su
objetivo es garantizar la maniobrabilidad del vehículo en las diferentes condiciones de
movimiento. Se entiende por "maniobrabilidad" la capacidad para controlar la trayectoria,
cuando el vehículo es sometido a diferentes perturbaciones. Si las perturbaciones son
externas a la aeronave, se habla de estabilidad. Si las perturbaciones son debidas a las
acciones del piloto o de un sistema automático, se habla de control. Los cálculos de
estabilidad son válidos en periodos más o menos cortos de tiempo, del orden del tiempo
medio de amortiguamiento de una perturbación.
El análisis de actuaciones considera al vehículo como un punto material sin dimensiones.
Se interesa en el estudio de las traslaciones. Su objetivo es garantizar los rendimientos y
las limitaciones del vehículo en las diferentes condiciones de operación. Los
"rendimientos" y las "limitaciones" son los diferentes parámetros impuestos al diseño en
vista de su utilización así como por reglamentación, respectivamente. Se puede pensar
que el análisis de actuaciones estudia el comportamiento a largo plazo del vehículo.
Ahora bien, debe estar claro que estas divisiones se realizan para la comodidad de
estudio, sin embargo, en la práctica, las hipótesis presentadas en cada rama pueden ser
demasiado limitativas para un problema dado. Por ejemplo, en la determinación del
tiempo de ascenso de un aeroplano, la reducción al punto material conduce a resultados
poco satisfactorios ya que no se consideran los tiempos de ciertos virajes. Igualmente, en
la determinación de la estabilidad de una trayectoria de vuelo, puede ser necesario
considerar las deflexiones provocadas por las diferentes cargas aerodinámicas; es decir,
dejar de lado la hipótesis del cuerpo rígido. Podría pensarse que, en estricto apego a la
física, todos los problemas de la dinámica de vehículos deberían resolverse tomando en
cuenta el carácter elástico de los elementos que forman al vehículo, así como el carácter
de fluido real del medio en que éste evoluciona. Sin embargo, el planteamiento del
problema en estos términos conduce a un sistema de ecuaciones diferenciales parciales,
con geometría variable en el tiempo, el cual resultaría extremadamente complejo a
resolver o analizar. Incluso con los medios computacionales de que disponemos hoy en
día, el cálculo de una solución para dicho sistema de ecuaciones es impensable. En estas
notas presentaremos los métodos más modernos que están siendo utilizados para abordar
el problema.
Originalmente, este material fue preparado para un curso de mecánica de vuelo, por lo
que parece apropiado definir dicha área del conocimiento. La mecánica de vuelo puede
definirse como la ciencia que estudia el movimiento de las aeronaves en la atmósfera
terrestre (o al interior de una masa gaseosa, siendo más generales). Algunos autores
consideran que el "vuelo" orbital de satélites y astronaves, también forma parte de la
mecánica de vuelo, sin embargo, nosotros preferimos hacer la distinción en un nivel
superior, es decir entre aeronáutica y astronáutica, debido a la diferencia fundamental
entre los medios en que se desarrolla el movimiento de estos vehículos. Las aeronaves
evolucionan siempre en el interior de una masa fluida; en cambio, las astronaves están
sometidas a tres regímenes de movimiento: en el exterior de la atmósfera, al interior de la
atmósfera y la etapa de transición o reingreso a la atmósfera.
Comentarios sobre la notación
Las cantidades físicas que se emplean en el análisis pueden ser escalares, vectores,
matrices o, más generalmente, tensores. Comúnmente, existen tres tipos de notación
utilizada para representar dichas cantidades: la vectorial, la matricial y la tensorial.
La notación vectorial, a pesar de ser la más común en la bibliografía, no se utilizará
debido a que en ella se pierde todo rastro del sistema de referencia. Esta característica es
justamente lo que se considera valioso de la notación vectorial, sin embargo, cuando
existen varios sistemas de referencia y se desea conocer las relaciones entre las
componentes en los diversos sistemas, dicha notación resulta confusa. En esta notación
los escalares se representan con letras normales, comúnmente minúsculas, mientras que
los vectores se denotan con una flecha sobre la literal que representa al vector.
Por su parte, la notación matricial representa el conjunto de componentes de un vector,
matriz o tensor con respecto a un sistema de referencia específico, mediante un arreglo
rectangular de números. En una ecuación matricial se representa una identidad entre las
componentes de ciertas matrices con respecto a uno o más sistemas de referencia
explícitamente definidos. Se ha decidido usar la notación matricial en este texto en razón
de ser, quizá, la de más fácil entendimiento para el estudiante de los primeros semestres
del nivel superior. En esta notación los escalares son letras normales, mientras que para
las matrices se utilizan letras negritas (en este texto utilizaremos indistintamente
mayúsculas y minúsculas). Los vectores se consideran matrices con una dimensión
unitaria, es decir, ya sea matrices con un solo renglón o bien matrices con una sola
columna. Es necesario realizar una convención a este respecto ya que, según se defina el
producto matricial, ambos tipos no son equivalentes. Así, hemos optado por representar
todos los vectores como matrices columna (con una sola columna), mientras que el
producto matricial se define como el producto renglón por columna, sumando sobre las
componentes.
En cuanto a la notación tensorial, es la más moderna y desarrollada. Al igual que la
matricial, esta notación se refiere a las componentes de un tensor con respecto a cierto
sistema de referencia, pero generaliza las nociones para incluir tensores de orden superior
a dos así como sistemas de referencia curvilíneos y no ortogonales. Si bien sería la
notación más apropiada para este texto, se ha descartado ya que es de uso poco común en
el nivel superior. Además, el uso de la llamada convención de Einstein hace que se
requiera cierto tiempo para habituarse a su correcta interpretación. En esta notación, un
escalar se considera un tensor de orden cero, un vector es un tensor de orden uno, una
matriz es un tensor de orden dos y se abre la posibilidad a tensores de órdenes superiores.
Todos los tensores se representan mediante letras normales con una lista de subíndices
cuyo número corresponde al orden del tensor (aquí solo consideraremos tensores
cartesianos para los cuales no existe la distinción covariante, contravariante; el lector
interesado en estos temas deberá acudir a la bibliografía especializada para mayor
información). Así, un escalar no tiene subíndices, un vector cuenta con un subíndice, una
matriz con dos y así sucesivamente. Los subíndices pueden adquirir valores según el
número de componentes que tengan los tensores.
De este modo, en todas las ecuaciones de este texto se interpretarán los productos como
matriciales y por lo tanto, no conmutativos. Para escribir todas las operaciones necesarias
en notación matricial se deben hacer algunas consideraciones. En primer lugar, como
hemos dicho, todo vector debe considerarse como una matriz columna. La transpuesta de
un vector es una matriz renglón. Todos los productos matriciales se realizan según la
regla renglón por columna; mientras que el producto por un escalar se realiza
multiplicando por todas las componentes de la matriz. Por otro lado, las operaciones
vectoriales más comunes se transforman a operaciones matriciales de acuerdo con las
siguientes convenciones.
La multiplicación por un escalar se realiza multiplicando por todas las componentes, por
lo tanto, no se requiere ninguna notación especial.
El producto escalar de dos vectores (“producto punto”) puede sustituirse por un producto
matricial transponiendo el primer factor, en efecto, supongamos que se tienen tres
componentes:
a ⋅ b ⇒ a1b1 + a2b2 + a3b3 = [a1 a2
b1
a3 ]b2 = aT b
b3
Por otro lado, el producto vectorial de dos vectores (“producto cruz”, sólo definido en
tres dimensiones) también puede sustituirse por un producto matricial de la siguiente
forma:
i
j
a × b = a1 a 2
b1 b2
k
a3 = (a2 b3 − a3b2 )i + (a3b1 − a1b3 ) j + (a1b2 − a2b1 )k
b3
0b1 − a3b2 + a2 b3 0
⇒ a3b1 + 0b2 − a1b3 = a3
− a2 b1 + a1b2 + 0b3 − a2
− a3
0
a1
a2 b1
− a1 b2 = [a ×]b
0 b3
El producto tensorial de dos vectores se puede escribir como columna por transpuesta
dando como resultado una matriz cuadrada:
a1b1 a1b2
b3 ] = a2b1 a2b2
a3b1 a3b2
a1
a ⊗ b ⇒ a2 [b1 b2
a3
a1b3
a2 b3 = abT
a3b3
Podemos resumir esta información en las tablas siguientes, para referencia:
Notación
Escalar
Cantidades Físicas
Vector Matriz Tensor (O>3)
Vectorial
Matricial
Tensorial
a
a
ai
λ
a
a
aij
a
indefinido
aij
k
Operaciones con vectores
Notación
Multiplicación
Producto Punto
Producto Cruz
Producto Tensorial
c = a × b = −b × a
c = a ⊗b ≠ b ⊗a
b = λa = aλ λ = a ⋅ b = b ⋅ a
T
T
Matricial b = λa = aλ
c = [a ×]b = −[b ×]a
λ =a b=b a
c = abT ≠ baT
cij = ai b j ≠ bi a j
Tensorial bi = λai = ai λ λ = ai bi = bi ai ci = a j bk ε ijk = −b j ak ε ijk
Vectorial
Es necesario señalar que en la tabla anterior, en lo que respecta a la notación tensorial, se
ha hecho uso de la convención de Einstein (la cual implica sumar sobre los índices
ε
repetidos) y el tensor de tercer orden ijk es el tensor antisimétrico (sus componentes son
iguales cero cuando i = j = k ; son iguales a 1 cuando la terna ijk es una permutación par
y son iguales a − 1 cuando la terna ijk es una permutación impar de los índices 1,2,3 ).
En este texto utilizaremos extensivamente la forma [a ×] del producto cruz, por ello es
conveniente en este momento señalar algunas de sus propiedades; las cuales son de
mucha utilidad en el estudio de la mecánica. En primer lugar, llamaremos a esta forma un
pseudo vector para enfatizar el hecho de que proviene de un vector y solo tiene tres
componentes independientes pero, en realidad, se trata de una matriz. En seguida, se
demuestra fácilmente que todo pseudo vector tiene determinante igual a cero:
0
a × = a3
− a2
− a3
0
a1
a2
a
− a1 = a3 3
− a2
0
− a1
a
+ a2 3
0
− a2
0
= a3 (− a2 a1 ) + a2 (a3a1 ) = 0
a1
Otra propiedad de gran importancia es que se trata de una matriz antisimétrica, es decir:
[a ×]T
= −[a ×]
lo cual es fácilmente verificable de su definición. Por último, recordaremos que en
análisis vectorial se demuestra una identidad conocida con el nombre de triple producto
vectorial el cual, en notación matricial se puede establecer en dos versiones diferentes:
[[a ×]b ×]c = (aT c )b − (bT c )a
[a ×][b ×]c = (cT a)b − (bT a)c
Si en la segunda ecuación escogemos a = b y conmutamos los productos, obtenemos:
[a ×][a ×]c = a(aT c ) − (aT a)c
Entonces, podemos factorizar el vector c de la siguiente forma:
[a ×][a ×]c = aaT c − UaT ac
[a ×][a ×]c = (aaT − UaT a)c
En donde U es la matriz identidad del espacio vectorial correspondiente. Por último,
usando la llamada ley del cociente del álgebra tensorial (la cual implica que si dos
cantidades al ser multiplicadas por una tercera generan una identidad, entonces son
iguales entre sí) obtenemos:
[a ×][a ×] = aaT − UaT a
Ahora bien, si el vector n = a es unitario, tendremos la relación:
[n ×][n ×] = nnT − U
Todas estas identidades serán utilizadas ampliamente en el texto.
Capítulo 2
Dinámica de
Sistemas
Cadenas Dinámicas
Un vehículo es una máquina diseñada para el transporte de pasajeros, o carga, de un
punto a otro en el espacio. La región del espacio en la cual se desplaza el vehículo puede
estar ocupada por un medio fluido como el agua o el aire, puede estar limitada por la
superficie terrestre con todas sus irregularidades y detalles o bien, puede estar casi vacía
como en el espacio interestelar.
Por otro lado, una máquina se define como un conjunto de mecanismos capaces de
transformar energía para realizar un trabajo determinado. A su vez, un mecanismo se
define como una cadena dinámica en la que al menos un eslabón permanece fijo con
respecto a un sistema de referencia. Las cadenas dinámicas son conjuntos de eslabones
unidos mediante pares. Los eslabones son cuerpos tridimensionales con propiedades
mecánicas bien definidas. Finalmente, un par es el conjunto de condiciones de restricción
en el movimiento relativo entre dos eslabones.
Los eslabones son cuerpos para los cuales la aplicación de una carga (fuerza o momento,
o ambos), resulta en una deformación bien definida. En ocasiones, para simplificar se
consideran sólidos rígidos para los cuales no existe deformación; sin embargo,
generalmente, se consideran sólidos elásticos homogéneos para los cuales la relación
carga deformación es lineal. En épocas recientes los avances de la tecnología han
provocado que en los diseños de ingeniería se utilicen un sinnúmero de materiales con
propiedades mecánicas mucho más complejas que las dos anteriores, es decir, relaciones
no lineales entre la carga y la deformación resultante.
Cuando se considera un eslabón en el espacio y se introduce un sistema de referencia,
puede fijarse la posición del eslabón estableciendo las coordenadas de un punto particular
del cuerpo. De igual forma, puede fijarse su actitud estableciendo las direcciones de tres
vectores unitarios fijos al cuerpo (o bien mediante tres parámetros de actitud como lo
veremos posteriormente). La elección de este punto y estos vectores es arbitraria y ellos
conforman un nuevo sistema de referencia el cual se denomina “sistema local” o “sistema
de ejes cuerpo”. Generalmente se escoge dicho punto en el llamado centro de gravedad y
los vectores en las direcciones de los llamados ejes principales (estos conceptos se
definirán posteriormente en el texto).
Si se consideran dos eslabones en el mismo espacio pueden existir seis movimientos
relativos entre ellos, a saber: tres traslaciones entre los orígenes de ambos ejes cuerpo y
tres rotaciones de un sistema de ejes con respecto al otro. Si las fuerzas y momentos
externos de un eslabón son independientes del estado dinámico del otro eslabón, se dice
que ambos están libres o tienen movimiento libre. Si las fuerzas y momentos externos de
uno dependen en alguna forma del estado dinámico del otro, se dice que existe una
restricción dinámica en el movimiento entre ambos eslabones. Debido a la tercera ley de
Newton, las fuerzas y momentos externos del segundo eslabón dependerían exactamente
en la misma forma del estado dinámico del primer eslabón. Cuando las fuerzas y
momentos entre los eslabones son tales que impiden completamente un movimiento se
dice que hay restricción total y, dividiendo las fuerzas entre el área de contacto se puede
hablar de esfuerzos internos. Por tanto, los movimientos relativos pueden ser de tres
tipos: completamente libres, restringidos dinámicamente o bien, completamente
restringidos.
Cuando los seis movimientos son libres el par no existe. Cualquier combinación de
movimientos libres y totalmente restringidos se denomina par cinemático. Cualquier
combinación de movimientos libres, restricciones dinámicas y totales se denomina par
dinámico. Cuando fuerzas o momentos son tales que anulan completamente el
movimiento en cierta dirección se denominan reacciones. Cuando están relacionados con
los desplazamientos, y se dirigen en sentido contrario a los mismos, se denominan
fricciones. Los pares cinemáticos son sólo una abstracción que facilita el estudio de los
mecanismos (de hecho, cuando en una cadena todos los pares son cinemáticos, la cadena
se denomina también cinemática), pero no existen en la realidad ya que cualquier tipo de
contacto que permita movimiento entre dos cuerpos genera el fenómeno denominado
fricción.
De las definiciones del párrafo anterior, podemos concluir que un vehículo es un sistema
de ingeniería altamente complejo, cuyo estudio involucra un gran número de ciencias:
cinemática, elasticidad, termodinámica, mecánica de fluidos, etc. De hecho, el avance de
la ingeniería en el último siglo ha sido tal, que es imposible pensar que una sola persona
pueda conocer todos los detalles del funcionamiento de un vehículo, incluso de los más
sencillos; menos aún de un vehículo complejo como un avión o un satélite.
El estudio del comportamiento de una cadena dinámica es la base de la dinámica de
vehículos. Ahora bien, dicho estudio se sustenta en los principios físicos fundamentales.
Es decir, para predecir el comportamiento de una cadena dinámica debemos considerar
que esta está sometida a las leyes de la naturaleza y, a partir de dichas leyes, deberemos
establecer ecuaciones que nos permitan calcular su comportamiento futuro.
Principio de Mínima Acción
Una de las formas más elegantes para la presentación de la mecánica es el llamado
principio de mínima acción. Es cierto que existen otras formas de presentación
(igualmente rigurosas) como: las tres leyes de Newton o las simetrías espacio-temporales
de Noether. Sin embargo, no siendo este un texto sobre la mecánica en general, hemos
escogido el principio de mínima acción por considerarlo muy económico en los
conceptos y en la notación; logrando con ello sentar las bases mínimas para nuestros
propósitos.
En mecánica clásica un sistema se define por un conjunto de variables llamadas
coordenadas generalizadas:
q1 (t )
q (t )
q(t ) = 2
qn (t )
T
Cuando estas coordenadas adquieren valores específicos, por ejemplo q′ = [q1′ , q2′ , qn′ ] ,
se dice que el sistema se encuentra en un estado o fase q′ determinado, por ello se llama
también a las q variables de fase o vector de estado. Introduciendo un espacio euclídeo
R n con un número de dimensiones igual al de coordenadas generalizadas del sistema, es
fácil interpretar cada punto de este espacio como un estado o fase posible del sistema. El
espacio R n se denomina espacio de fases o de estados. Por otro lado, es importante
notar que las coordenadas generalizadas son funciones del tiempo, de modo que, cuando
el sistema pasa de un estado q1 a otro q 2 , requiriendo para ello un intervalo de tiempo
∆t , podemos representar este cambio en el espacio de fases mediante una curva que une
los puntos q1 y q 2 (suponemos dicha curva continua, invocando el principio de
continuidad de los fenómenos naturales). Una curva en el espacio de fases se denomina
una trayectoria. En ocasiones será necesario introducir otro conjunto de variables
T
dependientes del tiempo u(t ) = [u1 (t ), u2 (t ), ur (t )] . Estas variables son independientes
del estado del sistema pero afectan de manera determinante la trayectoria en el espacio de
fases. Debido a que pueden escogerse según convenga, estas variables se denominan
variables de control. El número de variables de control r es normalmente diferente del
número de variables de fase n .
El problema de la mecánica consiste en encontrar la trayectoria que seguirá un sistema
entre dos estados dados, sabiendo que dicho sistema está sometido a ciertas funciones de
control y a las leyes de la naturaleza. Es decir, en el espacio de fases existe un número
infinito de trayectorias posibles entre los puntos q1 y q 2 ; sin embargo, si el sistema está
determinado por alguna ley, con un control dado, solo es posible una de tales trayectorias
y el problema de la física consiste en encontrar esa única trayectoria posible.
Para lograr lo anterior se define una función escalar de las coordenadas generalizadas, de
sus primeras derivadas con respecto al tiempo y de las variables de control:
L(q(t ), q(t ), u(t ))
esta función se conoce como función de Lagrange o lagrangiano del sistema. Para dar
una idea un tanto intuitiva del significado de la función lagrangiana, podemos decir,
siguiendo al matemático John C. Baez (2005), que esta función nos mide el grado de
actividad que existe en cada instante en el sistema. En efecto, la función lagrangiana
crece cuando crece la energía cinética en el sistema; sin embargo, el valor de la
lagrangiana es menor cuando crece la energía potencial del sistema ya que esta energía no
representa actividad sino posibilidad para dicha actividad. De hecho, en los sistemas
mecánicos, la función lagrangiana se establece restando la energía potencial de la
cinética.
Enseguida se define una cantidad que involucra al lagrangiano del sistema a lo largo de la
trayectoria entre dos puntos cualesquiera del espacio de fases. Esta cantidad, conocida
con el nombre de acción, nos representa la suma de la actividad desarrollada por el
cuerpo a lo largo del tiempo:
t2
A = ∫ Ldt
t1
Finalmente, el principio de mínima acción establece que: “Todo sistema seguirá, entre
dos instantes de tiempo t1 y t 2 , una trayectoria en el espacio de fases tal que la acción sea
mínima”. Esta es la famosa presentación lagrangiana de la física clásica.
La acción es una integral de línea y, por lo tanto, la misma integral evaluada sobre dos
líneas curvas que pasen por los puntos q (t1 ) y q (t2 ) , tendrá un valor diferente; es decir,
se trata de una funcional. El principio de mínima acción nos dice que el sistema mecánico
“escogerá”, de entre todas las líneas que pasan por dichos puntos, aquella para la cual la
acción sea mínima. Así, el principio establece el problema del cálculo de la trayectoria de
un sistema mecánico como un problema de extremales.
Ecuaciones de Euler - Lagrange.
El principio de mínima acción nos indica cuál será la trayectoria de un sistema mecánico
sometido a ciertas interacciones; sin embargo, no nos permite calcular directamente dicha
trayectoria. Ahora bien, el mismo principio nos da una indicación sobre cómo realizar el
cálculo: deberemos tomar la primera variación de la funcional de acción con respecto a
las variables de fase e igualarla a cero. El método para realizar esto es un método
elemental del cálculo de variaciones. En primer lugar, consideremos el valor A1 de la
acción a lo largo de una trayectoria cualquiera q (t ) . Enseguida, el valor A2 de la misma
integral a lo largo de una pequeña variación δq(t ) de la trayectoria inicial, suponiendo
que el control es el mismo en ambas trayectorias. Entonces, la variación de la acción
entre ambas trayectorias viene dada por:
δA = A2 − A1 = ∫ dL(q, q, u )dt = ∫ [∇Tq Lδq + ∇Tq Lδq ]dt = 0
t2
t2
t1
t1
La cual debe ser cero por el principio de Hamilton. Ahora bien, la variación de la
trayectoria debe satisfacer las siguientes condiciones:
δq(t1 ) = δq(t2 ) = 0
con el objeto de que la nueva trayectoria pase también por los puntos q (t1 ) y q (t2 ) .
Realizando una integral por partes, obtenemos:
d∇Tq L
δA = ∫ ∇ Lδqdt + ∇ Lδq t − ∫
δqdt = 0
1
dt
t1
t1
t2
T
q
T
q
t2
t2
Tomando en cuenta las condiciones en los extremos y factorizando:
t2
δA = ∫ ∇Tq L −
t1
d T
∇q L δqdt = 0
dt
Finalmente, puesto que la variación que hemos tomado es arbitraria, salvo por las
condiciones en los extremos, es fácil ver que el término entre paréntesis de la ecuación
anterior debe ser igual a cero para que la integral se anule. Por conveniencia escribiremos
la transpuesta negativa de esta relación:
d
∇q L − ∇q L = 0
dt
Las ecuaciones anteriores, solución del problema de extremal, se denominan ecuaciones
de Euler-Lagrange del sistema mecánico.
Debemos agregar, en atención al estudiante interesado en este tema, que con algunas
pequeñas modificaciones, la formulación lagrangiana permite incluir la teoría de la
relatividad general de Einstein y, sustituyendo el concepto de coordenadas generalizadas
por el de función de onda del sistema, puede también representarse la teoría cuántica de
campos de Feynman, la cual es la teoría física considerada como fundamental en nuestros
días. Así, simetrizando el tiempo y el espacio en la integral de acción y considerando una
densidad lagrangiana que depende de la función de onda
del campo en estudio, la
integral de acción puede escribirse como:
t2
A = ∫ L( , ∂ µ , u )d
t1
en donde
es el cuadrivector espacio – tiempo y ∂ µ es la derivada covariante
correspondiente. Por un procedimiento similar al anterior se deducen las ecuaciones de
Euler – Lagrange:
∂ µ ∇∂ µ L − ∇ L = 0
Dependiendo del tipo de sistema y de la lagrangiana que se utilice podemos obtener las
ecuaciones dinámicas para cada campo de la física desde la dinámica de una partícula
newtoniana (como veremos más adelante) hasta las de la electrodinámica quántica o la
cromodinámica de los quarks. De hecho, puede afirmarse que la teoría física más
aceptada hasta nuestros días está contenida en la ecuación anterior junto con el
lagrangiano siguiente:
L = qiDq + liDl − 14 (Fµνa )
2
+ Dµφ − V (φ )
2
(
− λiju u Rφ ⋅ QLj + λijd d Rφ * ⋅ QLj + λijl e Rφ * ⋅ LLj + h.c.
i
i
i
)
El cual es conocido como el Modelo Estándar. Representa la interacción de todas las
partículas fundamentales conocidas hasta la fecha. La primera línea representa la energía
cinética de los quarks y leptones presentes en el sistema, incluyendo su energía
electromagnética; la segunda línea representa el potencial de Higgs y la tercera línea las
interacciones cromodinámicas (la nomenclatura h.c. representa la suma de todos los
hadrones conjugados). Como se ve, en éste lagrangiano están unificadas las fuerzas
fuerte, débil y electromagnética. La aparición de la masa de las partículas se debe al
mecanismo de Higgs. Sin embargo, la interacción gravitacional no ha podido ser
unificada aun y no es tomada en cuenta en este modelo, aún cuando existan muchas
partículas en el sistema.
Como vemos, el problema de la dinámica ha sido resuelto en forma completa. Sin
embargo, resta el problema del modelado del sistema. Es decir, dado un sistema, si
construimos su función de Lagrange en forma apropiada, sabremos cual es la dinámica
resultante para cada condición inicial. Pero no existen técnicas universalmente válidas
para construir la función de Lagrange de un sistema. Puede decirse, en términos muy
generales, que la función de Lagrange es la diferencia entre la energía cinética y la
energía potencial instantáneas del sistema, pero como vemos en el caso del modelo
estándar, la forma en que deben considerarse dichas energías puede no ser muy evidente.
Es incluso irónico pensar que la primera interacción que fue dominada por la mente del
hombre, la interacción gravitacional, no ha podido ser representada, mientras que las
otras formas de interacción, descubiertas mucho después, se encuentran ahora unificadas
en el Lagrangiano del modelo estándar.
En el caso de la mecánica clásica, cuando un cuerpo está sometido a un conjunto de
fuerzas, el trabajo de estas fuerzas debe sumarse a la energía cinética del mismo. Es decir,
el trabajo de las fuerzas externas puede asimilarse al negativo de una energía potencial.
De igual forma, las fuerzas, dado su punto de aplicación, desarrollarán momentos que
deben agregarse en forma de energía de rotación a la lagrangiana. En ejemplos
posteriores veremos algunas de las técnicas que se utilizan para modelar sistemas
clásicos; sin embargo, sugerimos al lector interesado consultar otra bibliografía para
obtener mayores detalles sobre el método que deberá aplicarse en casos específicos de
modelado de un sistema.
Teoría de Pequeñas Perturbaciones
Si bien pueden existir diversas clases de sistemas de acuerdo con las propiedades
matemáticas del lagrangiano correspondiente, para muchos sistemas físicos las
ecuaciones de Euler – Lagrange pueden transformarse de tal modo que quedan
representadas bajo la siguiente forma:
dq
= F(q, u )
dt
Esta ecuación se denomina ecuación de evolución de un sistema de control, ya que nos
representa, directamente, la transformación temporal de la variable de fase, es decir,
representa la evolución temporal del estado del sistema. La dinámica de un sistema está
controlada por su ecuación de evolución.
Dado un valor fijo de las variables de control u c , los puntos q e del espacio de fases para
los cuales se cumple la condición:
F(q e , u c ) = 0
se denominan estados estacionarios del sistema, puesto que una vez que el sistema llega
a ese estado, ya no habrá más cambios de estado. En efecto:
dq
=0
dt qe
El valor escogido para el control se denomina valor de compensación. Cambiando el
valor de compensación es posible mover un estado estacionario a una posición deseada
en el espacio de fases, por ello se habla de un estado estacionario compensado. O bien,
a la inversa, puede pensarse que, escogiendo un punto cualquiera del espacio de fases, se
calculen los valores de las variables de control necesarios para que dicho punto sea un
estado estacionario. Desafortunadamente, puesto que no necesariamente existe el mismo
número de variables de control que de variables de estado y que, además, las ecuaciones
de evolución pueden ser no lineales, no siempre es posible despejar los valores de
compensación. Esto significa que, dependiendo de las características del sistema,
existirán puntos o regiones completas del espacio de fases en las que no podrá
compensarse un estado estacionario. Esto depende completamente de la forma específica
de las ecuaciones y, por lo tanto, no existe una teoría general.
Un ejemplo sencillo de todo lo anterior se presenta en el caso de un avión: un estado
estacionario es el vuelo recto y nivelado a velocidad constante; sin embargo, para fijar el
valor exacto de la velocidad, se debe ajustar un cierto ángulo de ataque de la aeronave, de
tal modo que la tracción de los motores iguale exactamente a la resistencia al avance; esta
compensación se logra mediante unas pequeñas aletas en el borde de salida del elevador.
Los momentos producidos por las fuerzas motrices que no están alineadas con la
trayectoria deben ser anulados por los momentos aerodinámicos producidos con la
deflexión de las mismas superficies de control. Por lo tanto, no podrá ajustarse cualquier
velocidad.
Ejemplo: definición del sistema de Lorentz. Se desarrolla a partir de las ecuaciones de la hidrodinámica y
se refiere al fenómeno de las celdas de convección. R es una variable de control.
dq1
= σ (q2 − q1 )
dt
dq2
= Rq1 − q2 − q1q3
dt
dq3
= −bq3 + q1q2
dt
σ = 10; b = 83
para la determinación de los estados estacionarios escojamos el valor de compensación
σ (qe 2 − qe1 ) = 0
Rc qe1 − qe 2 − qe1qe 3 = 0
− bqe 3 + qe1qe 2 = 0
qe 2 = qe1
(Rc − 1 − qe3 )qe1 = 0
qe21 = bqe 3
Por tanto hay tres posibilidades:
qe(11) = 0
qe(12 ) = b(Rc − 1)
qe(13) = 0
qe( 23) = Rc − 1
qe(13) = − b(Rc − 1)
qe(12) = 0 ; qe( 22) = b(Rc − 1) ; qe( 32) = − b(Rc − 1)
qe( 33) = Rc − 1
Rc :
Podemos ver claramente que para un valor de compensación
Rc ≤ 1 sólo existe un estado estacionario en
Rc > 1 otros dos estados estacionarios aparecen junto al origen
alejándose de él sobre la diagonal q1 = q2 y elevándose a lo largo del eje q3 .
el origen del espacio de fases. Para valores
La teoría de estabilidad y control lineal estudia las posibles trayectorias de un sistema
dinámico en las cercanías de los estados estacionarios compensados. Para realizar este
estudio supongamos que la trayectoria puede escribirse como la suma de un estado
estacionario más una pequeña perturbación:
q (t ) = q e + δq(t )
mientras que el control tiene su valor de compensación más una pequeña variación
arbitraria:
u(t ) = u c + δu(t )
las variaciones se consideran pequeñas de tal modo que:
δq(t ) << 1
δu(t ) << 1
al menos durante un intervalo finito de tiempo. Estamos suponiendo que las ecuaciones
han sido convenientemente transformadas a una forma sin dimensiones de tal modo que
la magnitud de las perturbaciones puede considerarse pequeña comparada con la unidad.
Entonces, el operador de evolución puede desarrollarse en serie de Taylor en las
cercanías del estado estacionario compensado:
F(q e + δq, u c + δu ) = F(q e , u c ) + [∇q F]q
En donde las matrices [∇ q F]q
e ,uc
y [∇u F]q
e ,u c
e ,u c
δq + [∇ u F]q ,u δu + o(δq 2 , δu 2 )
e
c
son notaciones cortas para los jacobianos
del operador de evolución evaluados en el estado estacionario y con los valores de
compensación:
[∇ F]
q
q e ,u c
[
= ∇ q FT
]
T
q e ,u c
∂F1
∂q
1
∂F2
= ∂q1
∂F
n
∂q1
∂F1
∂q2
∂F2
∂q2
∂F1
∂qn
∂Fn
∂qn q =q
e ,u = u c
[∇u F]q ,u
e
c
[
= ∇ u FT
]
T
q e ,u c
∂F1
∂u
1
∂F2
= ∂u1
∂F
n
∂u1
∂F1
∂u2
∂F2
∂u2
∂F1
∂ur
∂Fn
∂ur q =q
e ,u = u c
Las componentes de estos jacobianos se conocen respectivamente con los nombres de
derivadas de estabilidad y derivadas de control. Substituyendo la serie de Taylor en la
ecuación de evolución del sistema y conservando solo los términos de primer orden,
obtendremos la ecuación de evolución de las pequeñas perturbaciones:
dδq
= [∇q F] δq + [∇u F]q ,u δu
q e ,u c
e c
dt
Así, el comportamiento de las trayectorias en las cercanías del estado estacionario
compensado está enteramente gobernado por las derivadas de estabilidad y de control.
Simplificando aún más la notación, hagamos [∇q F]q ,u = ∇q e F y [∇u F]q ,u = ∇u c F ,
e
c
e
c
entonces, el sistema lineal anterior, denominado sistema de control, se puede escribir
como:
dδq
= ∇q e Fδq + ∇ uc Fδu
dt
Ejemplo: Ecuaciones de las perturbaciones para el sistema de Lorenz:
σ
0 δq1 0
δq1 − σ
d
δq2 = (Rc − qe 3 ) − 1 − qe1 δq2 + qe1 δR
dt
qe1 − b δq3 0
δq3 qe 2
Para
Rc ≤ 1 , sólo existe un estado estacionario y las perturbaciones son gobernadas por:
δq1 − σ
d
δq2 = Rc
dt
δq3 0
Para
Rc > 1 , las perturbaciones son gobernadas por:
σ
0 δq1
− 1 0 δq2
0 − b δq3
σ
−σ
δq1
d
1
−1
δq2 =
dt
δq3 ± b(Rc − 1) ± b(Rc − 1)
0
δq1
b(Rc − 1) δq2 ± b(Rc − 1)δR
δq3
0
−b
0
Es conveniente señalar en este momento que la teoría de las pequeñas perturbaciones que
se acaba de presentar es aplicable, casi sin cambios, a una clase un poco más amplia de
sistemas dinámicos. Presentaremos aquí ese tipo de sistemas ya que el caso de la
dinámica de vehículos queda comprendido en esta clase. Específicamente, nos referimos
al caso en que la ecuación de evolución depende de la taza de cambio de las variables de
fase:
q = F(q, q, u )
la forma no es trivial ya que la dependencia no es necesariamente lineal. Entonces,
podemos definir los estados estacionarios como aquellos puntos del espacio de fases en
los que se satisface:
F(q e ,0, u c ) = 0
considerando nuevamente una pequeña perturbación de este estado estacionario, el
desarrollo en serie de Taylor del operador de evolución se puede escribir como:
F(q e + δq, δq, u c + δu ) = F(q e ,0, u c ) + [∇q F]q
+ [∇ u F]q
e , 0,u c
δu + o(δq , δu
2
e , 0,u c
δq + [∇q F]q ,0,u δq
2
e
)
c
de modo que el sistema de control nos queda como:
δq = [∇ q F]q
e , 0,u c
δq + [∇ q F]q
e , 0 ,u c
δq + [∇ u F] q
e , 0 ,u c
δu
pero, por la linealidad de la aproximación, podemos despejar la taza de cambio de las
perturbaciones de modo que:
δq = (U − ∇q F )−1 ∇q Fδq + (U − ∇q F )−1 ∇ u Fδu
e
e
e
c
En conclusión, podemos pensar que el sistema de control es una ecuación del tipo:
δq = Aδq + Bδu
en donde las derivadas de estabilidad A y las derivadas de control B dependen de los
jacobinos del operador de evolución ∇q e F y ∇ uc F en el caso de un sistema simple o bien
(
estos últimos están multiplicados por la forma de Leontief U − ∇q e F
poco más complejo de un sistema dependiente de las velocidades.
)
−1
en el caso un
Solución General del Sistema Dinámico de Control
La mejor manera de conocer el comportamiento de las perturbaciones en las cercanías del
estado estacionario es encontrar la solución de la ecuación de evolución de las
perturbaciones, obtenida en el párrafo anterior. Analicemos primeramente la solución
para un sistema libre de control, es decir, hagamos primero δu = 0 y busquemos la
solución general de la ecuación de evolución homogénea:
dδq
= Aδq
dt
supongamos que dicha solución puede escribirse en forma de serie de potencias del
tiempo:
δq(t ) = b 0 + b1t + b 2t 2 +
+ bkt k +
entonces, substituyendo en la propia ecuación de evolución, obtenemos:
b1 + 2b 2t + 3b 3t 2 +
+ kb k t k −1 +
[
= A b 0 + b1t + b 2t 2 +
+ bk t k +
]
de donde podemos deducir las siguientes ecuaciones vectoriales para los vectores
desconocidos b i :
b1 = Ab 0
1 2
A b0
2
1 3
b3 =
A b0
2⋅3
b2 =
bk =
1
1
A k b0 = A k b 0
k!
1⋅ 2 ⋅ 3 k
por otro lado, substituyendo t = 0 en la solución propuesta obtenemos:
δq(0) = b0
Por lo tanto, substituyendo estos resultados en la solución obtenemos:
1
2
δq (t ) = U + At + A 2t 2 +
+
1 k k
At +
k!
δq(0 )
hasta este momento no hemos mencionado explícitamente en dónde acaba la serie pero,
justamente, la idea es considerar una serie infinita con objeto de aproximar lo mejor
posible la solución. Puede demostrarse matemáticamente que una serie infinita como la
que aparece en el corchete de la expresión anterior converge en forma absoluta y, por lo
tanto, puede tratarse como una cantidad normal, es decir, que le podemos dar un nombre
y tratarla como una matriz igual a cualquier otra. Por analogía con las series de potencias
de un número real definimos la llamada matriz exponencial o, mejor aún, la exponencial
de una matriz:
∞
Ak
k = 0 k!
eA = ∑
En donde hemos convenido en que A 0 = U para cualquier matriz cuadrada. De este
modo, la solución general del sistema libre de control, puede escribirse como:
δq (t ) = e Atδq(0)
Puede pensarse en la matriz exponencial como una matriz que transforma cualquier
estado inicial que se desee en el estado final correspondiente, transcurrido un intervalo de
tiempo t . La matriz exponencial del operador de evolución se llama entonces matriz de
transición entre los estados del sistema dinámico. De hecho, pueden demostrarse las
siguientes propiedades de interés:
de At
= e At A
dt
A (t + s )
= e At e As
e
(e )
At −1
= e A ( −t )
Ahora bien, basándonos en el resultado anterior, la solución general del sistema dinámico
con control (no homogéneo) contendrá un término suplementario que representa el efecto
de la variable de control durante el tiempo transcurrido, en efecto, escribiendo la
ecuación de control en la forma:
dδq
− Aδq = Bδu
dt
y multiplicando por el inverso de la matriz de transición del sistema libre de control:
dδq
e − At
− Aδq = e − At Bδu
dt
obtenemos:
e − At
dδq
− e − At Aδq = e − At Bδu
dt
considerando la derivada del inverso de la matriz de transición obtenemos:
e − At
dδq de − At
−
δq = e − At Bδu
dt
dt
observando que del lado izquierdo tenemos la derivada de un producto:
d − At
(
e δq ) = e − At Bδu
dt
integrando esta última expresión desde cero hasta un tiempo t , obtenemos:
t
d − Aτ
− Aτ
− Aτ
∫0 dt (e δq )dτ =(e δq )0 = ∫0 e Bδu(τ )dτ
t
t
o bien:
t
e − Atδq(t ) − Uδq (0) = ∫ e − Aτ Bδu(τ )dτ
0
Finalmente, despejando las variables de estado obtendremos la solución buscada:
t
δq(t ) = e δq (0) + ∫ e A (t −τ )Bδu(τ )dτ
At
0
Sub Espacios Invariantes
La solución del sistema de control encontrada en la sección anterior contiene toda la
información necesaria para analizar el comportamiento de las perturbaciones en las
cercanías del estado estacionario, sin embargo, como en muchos casos, tal vez ésta no sea
la mejor forma de ver o analizar dicha información. En efecto, podemos pensarlo de la
siguiente manera: la selección de las variables de control introdujo un marco de
referencia arbitrario en el espacio de fases; es posible que, desde marcos de referencia
distintos, la información sobre el comportamiento de las perturbaciones sea más fácil de
analizar o aparezca en ellos más claramente su significado. Cómo veremos en esta
sección, existen en efecto ese tipo de marcos de referencia privilegiados desde cuyo
punto de vista el comportamiento de las trayectorias se vuelve mucho más evidente. La
razón profunda de este hecho radica en la linealidad de las ecuaciones que estamos
tratando, lo cual implica que la suma de dos soluciones también es una solución de la
ecuación. Entonces, el método de análisis consiste en encontrar un conjunto “completo”
de soluciones “sencillas” que al ser sumadas, afectadas convenientemente por un
coeficiente, nos den todo el conjunto de comportamientos posibles. Las nociones de
“completitud” y de “sencillez” del argumento anterior se harán explicitas durante la
explicación subsiguiente.
Consideremos nuevamente el sistema libre de control. Supongamos ahora que existen
ciertas trayectorias en el espacio de fases para las cuales es válido:
dδq
= λδq
dt
En donde λ es cierto número real. Estas trayectorias representan líneas rectas que pasan
por el estado estacionario alejándose o acercándose a él, dependiendo del signo de la
constante λ . Es decir, una perturbación cuya condición inicial esté sobre esta línea recta,
permanecerá siempre sobre ella; en este sentido dichas líneas rectas se denominan sub
espacios invariantes del espacio de fases. Sustituyendo esta expresión de la derivada en la
ecuación de evolución de las perturbaciones del sistema libre de control podemos decir
que, para que exista un sub espacio invariante deberá satisfacerse la ecuación:
λδq = Aδq
o bien:
(A − λU )δq = 0
Es decir, si logramos encontrar un número real λ y un vector δq que satisfagan esta
ecuación, habremos encontrado una recta invariante en el espacio de fases. Por supuesto,
la recta es sólo un caso especial de sub espacio invariante; podemos pensar también en
círculos, elipses, parábolas o cualquier tipo de curva invariante: si la perturbación inicial
está sobre una de dichas curvas, la evolución del sistema se desarrollará siempre sobre
ella. Como puede verse, sería de mucha utilidad conocer los sub espacios invariantes que
rodean al estado estacionario puesto que, entonces, podría predecirse el comportamiento
del sistema en función del comportamiento sobre los sub espacios invariantes.
Primeramente, para poder generalizar el concepto de sub espacio invariante más allá de la
línea recta, definimos:
(A − λU )k δq = 0
Los valores de λ para los cuales esta ecuación tiene soluciones no triviales en δq se
denominan valores propios del operador de evolución A . El exponente k se denomina
multiplicidad del valor propio y solo se admiten números enteros positivos. La solución
particular δq λ ,k correspondiente a un λ y un k se denomina vector propio
generalizado del operador de evolución.
Los vectores propios generalizados forman sub espacios invariantes ya que el operador de
evolución transforma un vector propio generalizado en otro vector propio generalizado.
En efecto, supongamos que el vector δq̂ es un vector propio generalizado:
(A − λU )k δqˆ = 0
multiplicando ambos lados de la ecuación por el operador de evolución A tenemos:
A (A − λU ) δqˆ = 0
k
ahora bien, es fácil probar que (A − λU ) y A conmutan:
k
A (A − λU ) = A (A − λU )(A − λU )
k
k −1
los primeros dos factores conmutan por simple factorización y, como el proceso puede
repetirse k veces, obtenemos:
(A − λU )A(A − λU )k −1 = (A − λU )k A
por lo que:
(A − λU )k Aδqˆ = 0
lo que implica que Aδqˆ es también un vector propio generalizado. Este vector, a su vez,
será transformado en otro vector propio generalizado. Veremos posteriormente que el
conjunto de todos los vectores propios generalizados, asociados a un mismo λ y que
sean linealmente independientes, no es infinito. El espacio formado por estos vectores
será un sub espacio invariante del espacio de fases en el sentido de que una perturbación
cuya condición inicial esté completamente en este espacio, formará una trayectoria
siempre inmersa en el mismo.
En la demostración anterior hemos supuesto que existe un valor propio para el operador
de evolución. Ahora mostraremos que siempre existe al menos un valor propio.
Escojamos una perturbación δq̂ no nula. El conjunto de vectores formado por δq̂ , Aδqˆ ,
A 2δqˆ , ... A nδqˆ , en donde n es la dimensión del espacio de fases, no puede ser
linealmente independiente puesto que se tienen n + 1 vectores de dimensión n . Esto
quiere decir que existen escalares ai , no todos iguales a cero, tales que se tiene:
a0δqˆ + a1Aδqˆ + a2 A 2δqˆ +
+ an A nδqˆ = 0
es decir:
(a U + a A + a A
0
1
2
2
+ an A n )δqˆ = 0
+
Consideremos ahora el polinomio:
f (z ) = a0 z 0 + a1 z1 + a2 z 2 +
an z n
De la teoría algebraica elemental sabemos que estos polinomios tienen un número de
raíces igual al grado del polinomio, contando la multiplicidad, siempre y cuando se
considere su dominio en el plano complejo (es decir, se acepta que la variable z puede
ser un número complejo). En ese caso, el polinomio f (z ) puede factorizarse siempre en
la forma:
m
f ( z ) = b ∏ ( z − λi ) i
k
i =1
en donde b y los λi también son números complejos no nulos y m ≤ n . Además, los
ki ≥ 1 son enteros tales que
m
∑k
i =1
i
= n . Por lo tanto podemos escribir:
m
b∏ (A − λi U ) i δqˆ = 0
k
i =1
Puesto que b y δq̂ son diferentes de cero, se deduce que al menos alguno de los factores
(A − λi U )k
multiplicado por el vector que quede a su derecha, debe anular la expresión;
esto es exactamente igual a decir que al menos existe un valor propio para A . De hecho,
cada uno de los λi es un valor propio. Para ver esto más fácilmente necesitamos, como
resultado auxiliar, demostrar que cualquier producto de la forma (A − λi U )(A − λ j U )
conmuta, en efecto:
i
(A − λi U )(A − λ j U ) = A 2 − λi A − λ j A + λi λ j U
y por lo tanto:
(A − λi U )(A − λ j U ) = (A − λ j U )(A − λi U )
Por lo tanto, si escogemos un valor específico λi y conmutamos los productos, podemos
llevar la factorización a la forma:
(A − λi U )k ∏ (A − λ j U )k δqˆ = 0
i
m
j
j =1, j ≠i
Mostrando que λi es un valor propio. Nótese que hemos eliminado el factor b ya que,
por hipótesis es diferente de cero. Ahora podemos ver que el vector que está en el
paréntesis del lado derecho es un vector propio generalizado asociado al valor λi con la
multiplicidad ki el cual denotaremos mediante dos subíndices:
δq λ ,k =
i
i
∏ (A − λ U )
m
kj
j =1, j ≠ k i
j
δqˆ
De la definición de los vectores propios generalizados se sigue fácilmente que un valor
propio λi con multiplicidad ki > 1 tiene ki vectores propios generalizados asociados a él.
En efecto, cada uno de los vectores δq λi ,ki −1 , δq λi ,ki − 2 , δq λi , 2 , δq λi ,1 , definidos a
continuación, es un vector propio generalizado correspondiente al mismo valor propio:
(A − λi U )k δq λ ,k = 0
(A − λi U )k −1 (A − λi U )δq λ ,k = (A − λi U )k −1δq λ ,k −1 = 0
(A − λi U )k −2 (A − λi U )δq λ ,k −1 = (A − λi U )k −2 δq λ ,k −2 = 0
(A − λi U )k −3 (A − λi U )δq λ ,k −2 = (A − λi U )k −3δq λ ,k −3 = 0
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
(A − λi U )(A − λi U )δq λ ,2 = (A − λi U )δq λ ,1 = 0
i
i
m
Puesto que existen m valores propios con multiplicidades tales que
∑k
i =1
i
= n,
concluimos que siempre existen n vectores propios generalizados.
Sin embargo, hasta ahora, nada nos garantiza que algunos de estos vectores no sean
paralelos entre sí lo cual implicaría que no son sub espacios invariantes independientes.
Para tener n sub espacios invariantes distintos debemos demostrar la independencia
lineal de todos los vectores propios generalizados. Procederemos en dos etapas: primero
demostraremos que los vectores correspondientes a un mismo valor propio son
linealmente independientes; luego demostraremos que cualquier par de vectores,
correspondientes a dos valores propios distintos, son linealmente independientes.
Sean δq λi ,ki , δq λi ,ki −1 , δq λi ,ki − 2 ,
δq λ , 2 , δq λ ,1 los vectores asociados al valor propio λi .
i
i
Entonces debemos demostrar que la única solución posible en los ai para la siguiente
ecuación es la trivial:
a0δq λi ,ki + a1δq λi ,ki −1 + a 2δq λi ,ki − 2 +
+ a ki −2δq λi , 2 + a ki −1δq λi ,1 = 0
De la definición de vectores propios generalizados es fácil ver que todos los vectores
δq λi ,ki − j pueden escribirse en función del primero δq λi ,ki de la siguiente forma:
δq λ ,k −1 = (A − λi U )δq λ ,k
i
i
i
i
δq λ ,k −2 = (A − λi U ) δq λ ,k
2
i
i
i
δq λ ,k −3 = (A − λi U ) δq λ ,k
i
3
i
i
i
δq λ ,1 = (A − λi U )k −1δq λ ,k
i
i
i
i
i
sustituyendo tenemos:
a0δq λi ,ki + a1 (A − λi U )δq λi ,ki + a2 (A − λi U ) δq λi ,ki +
2
multipliquemos ahora por (A − λi U ) i
k −1
+ aki −1 (A − λi U ) i δq λi ,ki = 0
k −1
en ambos lados para obtener:
a0 (A − λi U ) i δq λi ,ki = 0
k −1
De donde vemos que a0 = 0 . De igual forma, multiplicando por (A − λi U ) i
demostraremos que a1 = 0 . Este proceso puede continuarse con todos los términos hasta
a ki −1 = 0 , por lo que los vectores son linealmente independientes.
k −2
Ahora demostraremos la independencia lineal de los vectores propios generalizados
correspondientes a valores propios diferentes. Sean λ1 , λ2 , λm los valores propios con
multiplicidades k1 , k 2 , k m . Denotemos por δq λ1 , j1 , δq λ2 , j2 , δq λm , jm ciertos vectores
propios generalizados con j1 ≤ k1 y j2 ≤ k 2 . Si estos vectores fuesen linealmente
independientes, la única solución de la siguiente ecuación para los ai complejos, sería la
trivial:
a 1δ q λ1 , j1 + a 2 δ q λ 2 , j 2 +
a m δ q λ m , jm = 0
en
efecto,
multiplicando
ambos
lados
de
la
ecuación
por
j1 −1
n
n
(A − λ1U ) (A − λ2U ) (A − λm U ) en donde n es la dimensión del espacio de fases,
obtenemos:
a1 (A − λ1U ) 1
(A − λ2U )n (A − λm U )n δq λ , j +
j −1
n
n
+ a2 (A − λ1U ) (A − λ2 U ) (A − λm U ) δq λ , j
j −1
1
1
+
1
2
+ am (A − λ1U ) 1
j −1
(A − λ2U )n (A − λm U )n δq λ
2
m , jm
=0
puesto que sabemos que j p ≤ k p < n para todo p , realizando las conmutaciones
necesarias en cada caso podemos escribir todos los términos a partir del segundo como:
a1 (A − λ1U ) 1
(A − λ2U )n (A − λm U )n δq λ , j +
j −1
n
n− j
j
+ a2 (A − λ1U ) (A − λm U ) (A − λ2 U ) (A − λ2 U ) δq λ , j
j −1
1
1
2
1
2
2
+ am (A − λ1U ) 1
j −1
2
(A − λ2U )n (A − λm U )n − j (A − λm U ) j δq λ
m
+
m
m , jm
=0
por lo que vemos que cada uno de esos términos se anula en sí mismo, es decir
(A − λ p U ) j δq λ , j = 0 para todo p . Ahora bien, rescribiendo el primer término como:
p
p
p
a1 (A − λ1U ) 1
j −1
a1 (A − λ1U ) 1
j −1
(A + λ1U − λ1U − λ2U )n (A + λ1U − λ1U − λm U )n δq λ , j
1
=0
1
((A − λ1U ) + (λ1 − λ2 )U )n ((A − λ1U ) + (λ1 − λm )U )n δq λ , j
1
1
=0
n
n
n
podemos usar el teorema del binomio (A + C) = ∑ A n −i Ci en cada factor para
i =0 i
obtener:
n
n
j −1
n −i
i
a1 (A − λ1U ) 1 ∑ (A − λ1U ) (λ1 − λ2 )
i =0 i
n n
n −i
i
∑ (A − λ1U ) (λ1 − λm ) δq λ1 , j1 = 0
i =0 i
en cada factor separamos el último término de la serie:
n −1 n
j −1
n −i
i
n
a1 (A − λ1U ) 1 ∑ (A − λ1U ) (λ1 − λ2 ) + U(λ1 − λ2 )
i =0 i
×
n −1 n
n
n −i
i
× ∑ (A − λ1U ) (λ1 − λm ) +U(λ1 − λm ) δq λ1 , j1 = 0
i =0 i
Puesto que i varia desde cero hasta n − 1 , en todos los términos de este complicado
producto, excepto en el último, siempre existe un factor (A − λ1U ) que, combinado con el
factor común (A − λ1U ) j1 −1 siempre puede llevarse hasta la derecha del término para
anularse con el vector δq λ1 , j1 . Por lo tanto, obtenemos:
a1 (A − λ1U ) 1
(λ1 − λ2 )n (λ1 − λm )n δq λ , j
j −1
1
la cual sólo puede anularse si
(A − λ1U ) (A − λ2U )
n
j2 −1
(A − λm U )
1
=0
a1 = 0 . De igual forma, multiplicando por
n
ambos lados de la ecuación inicial obtendremos
a2 = 0 por lo que concluimos que los vectores son linealmente independientes.
Finalmente, podemos concluir que para cualquier operador de evolución existen n
vectores propios generalizados y que dichos vectores son linealmente independientes
entre sí.
Los resultados que se han demostrado hasta aquí significan que el conjunto de vectores
propios generalizados de una matriz cuadrada es un conjunto completo y linealmente
independiente. De la teoría de espacios vectoriales recordamos que esto implica que
dicho conjunto puede ser utilizado para formar una base en el espacio vectorial. La
representación del sistema en la base de los vectores propios generalizados es la manera
más sencilla de estudiar el comportamiento de las perturbaciones. Realizaremos dicha
representación en el apartado siguiente.
Modos Normales
Del apartado anterior se deduce que los vectores propios generalizados pueden formar
una base en el espacio de fases (ya que hay exactamente n vectores linealmente
independientes) y, por lo tanto, podemos transformar la solución general del sistema
dinámico de control a dicha base. En efecto, para cada valor propio distinto λi de la
matriz ∇q e F , formemos la matriz de n renglones por ki columnas:
[
T λ i = δ q λ i ,1 , δ q λ i , 2 ,
, δ q λi ,k i −1 , δ q λ i ,k i
]
Ahora, con las m matrices anteriores correspondientes a los diferentes valores propios
formemos la matriz de n renglones por n columnas:
[
T = Tλ1 , Tλ2 ,
, Tλm
]
por las propiedades que acabamos de demostrar para los vectores propios generalizados
sabemos que esta matriz es invertible (independencia lineal de todas las columnas).
Entonces, consideremos un cambio de coordenadas en el espacio de fases, dado
mediante:
δq = Tδq′
δu = Tδu′
la ecuación de evolución del sistema de control se transforma de la manera siguiente:
dδq′
= (T −1AT )δq′ + T −1BTδu′
dt
Esta ecuación se conoce con el nombre de forma modal de la ecuación de evolución en
el espacio de fases. Ahora encontraremos las componentes del operador de evolución
modal (T −1AT ) . Recordemos que los vectores propios generalizados correspondientes a
un mismo valor propio pueden escribirse como:
0 = (A − λi U )δq λi ,1
δq λ ,1 = (A − λi U )δq λ , 2
i
i
δq λ ,k −3 = (A − λi U )δq λ ,k −2
i
i
i
i
i
i
i
i
i
i
i
i
δq λ ,k −2 = (A − λi U )δq λ ,k −1
δq λ ,k −1 = (A − λi U )δq λ ,k
Evidentemente, estas relaciones pueden escribirse como:
Aδq λi ,1 = λiδq λi ,1
Aδq λi , 2 = δq λi ,1 + λiδq λi , 2
Aδq λi ,ki −2 = δq λi ,ki −3 + λiδq λi ,ki −2
Aδq λi ,ki −1 = δq λi ,ki −2 + λiδq λi ,ki −1
Aδq λi ,ki = δq λi ,ki −1 + λiδq λi ,ki
colocando cada vector como columna de una ecuación matricial tendremos:
λi
0
ATλi = Tλi 0
0
1
0
0
1
λi
0
λi
0
0
0
0
0
0
1
λi
introduciendo la matriz de primera diagonal unitaria de tamaño ki :
0
0
N 1 = 0
0
1
0
0
0
0
0
1
0
0
0
0
0
0
1
0
podemos escribir:
ATλi = Tλi (λi U + N1 )
si ahora introducimos los bloques de Jordan:
J i = λi U + N1
con los tamaños adecuados de acuerdo a la multiplicidad de cada valor propio, podemos
ensamblar la ecuación:
J1
0
AT = T 0
0
0
J2
0
0
0
J3
0
0
0
0
0
J m
Lo que quiere decir que el operador de evolución tiene las siguientes componentes en la
base de los vectores propios generalizados:
J1
0
T −1AT = 0
0
0
J2
0
0
0
J3
0
0
0
0
0
J m
Finalmente, aplicando la solución general a la forma modal de la ecuación de evolución
obtenemos:
δq′(t ) = e (T
−1
t
) δq′(0) + e (T
∫
AT t
−1
)
T −1BTδu′(τ )dτ
AT (t −τ )
0
La ventaja de realizar este cambio de coordenadas es que la matriz de transición puede
calcularse de manera muy simple. En efecto, es muy fácil ver que:
e J1
0
(
T −1AT )
=0
e
0
0
0
eJ2
0
0
eJ3
0
0
0
0
0
e J m
es decir, la exponencial de una matriz diagonal consiste en tomar la exponencial de cada
elemento; por lo tanto, para cada bloque de Jordan tendremos:
e Ji t = e (λi U + N1 )t = e λi Ut e N1t
Para el primer factor, puesto que U k = U se verifica que:
e λi Ut = e λi t U
Para el segundo factor se tiene que N1ki = 0 , razón por la cual estas matrices se
denominan nilpotentes (lo que significa de potencia nula). Las potencias inferiores de N1
también son muy fáciles de calcular ya que se cumple la siguiente relación:
N1j = N j
para j = 1,2, ki − 1 . En donde la matriz N j tiene unos en la diagonal j y ceros en todas
los demás componentes. Por lo tanto, la serie infinita de la exponencial del segundo
factor contiene solo ki − 1 términos diferentes de cero:
e
N1t
∞
=∑
j =0
(N1t ) j
j!
k i −1
tj
= ∑ Nj
j = 0 j!
En donde, por convención se tiene N 0 = U . Finalmente, la matriz de transición del
bloque de Jordan se escribe como:
k i −1
tj
Nj
j = 0 j!
e J i t = e λi t ∑
o, en forma explícita:
e Jit
1
0
= eλi t
0
0
1
t2
2
t
0
1
0
0
t
t ki −1
(ki − 1)!
t2
2
t
1
De esta última expresión podemos concluir lo siguiente: para cualquier valor propio con
multiplicidad superior a uno, existen modos normales en la solución general cuya
amplitud es proporcional al tiempo y a sus potencias superiores (hasta la potencia ki − 1 ).
Estos términos se denominan seculares y, evidentemente, cualquier perturbación de un
modo normal secular terminará en el infinito cuando el tiempo crece sin límite. Esta
condición hace que los sistemas que presentan modos seculares sean catalogados
inmediatamente como inestables y su análisis sea de menor interés (la definición de
estabilidad se dará en el apartado siguiente y veremos que los sistemas con modos
seculares son inestables de acuerdo con dicha definición).
Estabilidad
Una vez que se ha dividido el espacio de fases en sub espacios invariantes se puede
analizar el comportamiento de las trayectorias en cada uno de ellos de manera
independiente. En efecto, por definición, al estar siempre contenidas en el sub espacio
invariante correspondiente, las trayectorias que inician en espacios distintos son
completamente independientes. A los movimientos del sistema sobre los sub espacios
invariantes se les conoce también con el nombre de modos o modos de movimiento.
El comportamiento de las trayectorias en cada sub espacio está determinado por el
tamaño del bloque de Jordan correspondiente o, lo que es lo mismo, por la multiplicidad
del valor propio correspondiente. Como puede verse de la matriz de transición de los
bloques de Jordan, para valores propios con multiplicidades superiores a la unidad,
siempre existen términos que son proporcionales al tiempo. Estos términos se denominan
seculares y, nosotros, aplicaremos este adjetivo también al sub espacio correspondiente.
Entonces, las trayectorias en los sub espacios seculares son tales que se alejan
indefinidamente del estado estacionario. Es decir, una perturbación cuya condición inicial
esté sobre un sub espacio secular siempre se ve amplificada y el sistema se aleja del
estado estacionario. En este caso decimos que el modo de movimiento es inestable.
Cuando el valor propio tiene multiplicidad igual a la unidad, el bloque de Jordan es de
tamaño unitario y, por lo tanto, los términos seculares no existen. El destino final de las
trayectorias sobre el sub espacio invariante dependerá del comportamiento de la función
e λi t . Ahora bien, el comportamiento de esta función depende de si el valor propio es real
o complejo. A continuación analizamos ambos casos.
Para un valor propio real, existen tres posibilidades: la función es creciente si el valor es
positivo, la función es decreciente si el valor es negativo o la función es constante si el
valor es cero. Es fácil observar que el sistema solo tiene tres opciones: si lambda es
positivo, la perturbación crece sin límite; si lambda es negativo, la perturbación tiende a
cero con el tiempo; finalmente, si lambda es cero, la perturbación conserva su valor. En el
primer caso se dice que el modo es inestable, en el segundo estable y en el tercero
neutro.
Comportamiento de las perturbaciones sobre un sub espacio invariante de multiplicidad
unitaria y valor propio real.
En el caso de un valor propio complejo, escribiendo λi = σ i + iω i , la función exponencial
se transforma de acuerdo con la fórmula de Euler:
e λi t = e (σ i +iωi )t = eσ i t [cos(ωi t ) + isen (ωi t )]
Dependiendo del signo de la parte real del valor propio, el modo puede ser nuevamente
estable, inestable o neutro. Sin embargo, ahora, debido a la parte imaginaria del valor
propio, existirán oscilaciones alrededor del estado estacionario. Es necesario reconocer en
este punto que puesto que el operador de evolución tiene todas sus componentes reales,
los coeficientes del polinomio característico deberán ser números reales. Teniendo un
valor propio complejo no es posible satisfacer esta condición, sin embargo, cuando se
tiene simultáneamente dos valores propios complejos λ1 y λ2 y estos son conjugados de
tal modo que λ1 = σ + iω y λ2 = σ − iω , los factores correspondientes del polinomio
característico contribuyen sólo con coeficientes reales, en efecto, el producto de estos
factores se puede escribir como:
(λ − λ1 )(λ − λ2 ) = (λ − (σ + iω ))(λ − (σ − iω )) = λ2 − 2λσ + (σ 2 + ω 2 )
De esta forma, para un modo neutro σ = 0 , las proyecciones de la perturbación sobre el
par de vectores propios representan una elipse con centro en el estado estacionario que es
recorrida con una frecuencia ω . Cuando la parte real es distinta de cero, las oscilaciones
persisten pero su amplitud depende del tiempo siendo trayectorias espirales que se
acercan o se alejan del estado estacionario. La parte real del número complejo representa
entonces un factor de amortiguamiento o amplificación de las oscilaciones.
En suma, cada par de valores propios complejos conjugados, representa un modo de
oscilación del sistema alrededor del estado estacionario, cada modo de oscilación podrá
ser estable, inestable o neutro.
Comportamiento de las perturbaciones sobre un sub espacio invariante de multiplicidad
unitaria y valor propio complejo.
La frecuencia ω se conoce con el nombre de frecuencia amortiguada. Considerando la
representación del número complejo λ = σ + iω en un plano coordenado, como en la
siguiente figura,
Representación en el plano complejo
se pueden introducir dos nuevas variables de la manera siguiente:
n
=
2
+σ 2 ;
ζ =
σ
2
+σ 2
Las cuales se conocen con los nombres de frecuencia no amortiguada y razón de
amortiguamiento. En la literatura de control y en alguna reglamentación es común
encontrar estas variables.
En los párrafos anteriores hemos analizado el movimiento en los sub espacios invariantes
de manera independiente suponiendo que la condición inicial caía exactamente en un sub
espacio invariante. Sin embargo, en la realidad, la condición inicial vendrá dada por una
perturbación no controlada del sistema, es decir, dicha condición inicial caerá en un
punto aleatorio del espacio de fases. El comportamiento de la perturbación en función del
tiempo dependerá de la superposición de los distintos modos de movimiento. Un estado
estacionario se denominará inestable si contiene al menos un modo inestable. Será estable
cuando todos los modos de movimiento sean estables. Los modos neutros pueden ser
eliminados reduciendo la dimensión del espacio de fases y conservando únicamente la
dinámica no trivial.
Puesto que todos los sub espacios seculares son inestables, un estado estacionario que
contenga al menos un sub espacio secular será inestable. De este modo, la dinámica de
interés será la de aquellos estados estacionarios que tengan tantos valores propios
distintos como dimensiones del espacio de fases. En efecto, en este caso cada valor
propio tiene multiplicidad unitaria y no hay espacios seculares. Dada esta condición, el
análisis subsiguiente se desarrollará según el número de dimensiones del espacio de fases
y suponiendo en cada caso que existen tantos valores propios distintos como
dimensiones.
En una dimensión solo hay un sub espacio invariante, el estado estacionario puede ser
estable, inestable o neutro según lo sea el sub espacio invariante.
En dos dimensiones podemos tener, dos valores reales o bien un par de valores complejos
conjugados. Los valores complejos deben ser conjugados ya que todos los elementos del
operador de evolución son reales. En el primer caso se tienen tres combinaciones posibles
de los sub espacios invariantes: con dos sub espacios inestables el estado estacionario se
denomina fuente y es inestable; con dos sub espacios estables el estado estacionario se
denomina sumidero y es estable; con un sub espacio estable y uno inestable el estado
estacionario se denomina punto hiperbólico y es inestable. En el caso de dos complejos
conjugados hay tres opciones: la parte real compartida por ambos valores propios es cero,
el estado estacionario se denomina punto centro y se considera inestable; la parte real es
positiva y el estado estacionario se llama punto espiral positivo o espiral inestable; la
parte real es negativa y el estado estacionario se llama punto espiral negativo o espiral
estable.
En 3 dimensiones pueden existir valores reales y valores complejos al mismo tiempo.
Nuevamente, cada valor propio representa un modo de movimiento que puede ser
oscilatorio o no. Primeramente, para tres valores reales podemos considerar cuatro casos:
tres valores positivos, dos valores positivos y uno negativo, dos negativos y uno positivo
y, finalmente, tres valores negativos. También se habla de fuentes, sumideros y sillas.
En el caso de existir un valor complejo, también debe existir su complejo conjugado, de
este modo solo tenemos la opción en la que hay un valor real y dos complejos
conjugados. Dependiendo del signo de la parte real tenemos diversas opciones: si el valor
real es positivo, se presentan las espirales siguientes.
(figura)
Si el valor real es negativo las espirales son:
(figura)
Cuando el valor real es cero se habla de una degeneración a dos dimensiones, es decir, se
puede encontrar un cambio de coordenadas en el espacio de fases, tal que la dinámica de
las perturbaciones se representa en sólo dos dimensiones.
En dimensión superior a tres, los catálogos no han sido completados. Un hecho de gran
importancia es que pueden existir valores complejos con distintas frecuencias.
Dependiendo de si estas frecuencias son o no, racionales entre sí, se pueden encontrar
ciclos límite con diferentes nudos o bien toros de KAM (Kolmogorov, Arnol’d, Mosser).
Es decir que la trayectoria del sistema se enrolla sobre una superficie toroidal cubriéndola
de manera densa sin llegar a cerrarse jamás. Este fenómeno también se conoce con el
nombre de caos hamiltoniano. Dejaremos aquí el estudio de la estabilidad de los sistemas
lineales. El estudiante interesado podrá encontrar una gran bibliografía a este respecto en
lo que se conoce como la teoría de sistemas dinámicos.
Ejemplo: Análisis de los estados estacionarios del sistema de Lorenz.
−σ − λ
σ
qe 2
−1− λ
qe1
(Rc − qe 3 )
0
− qe1 = 0
−b−λ
[(σ + λ )(1 + λ ) − σ (Rc − qe3 )](b + λ ) + (2σ + λ )qe21 = 0
Considerando las coordenadas del primer estado estacionario
qe1 = 0; qe 2 = 0; qe 3 = 0 , la ecuación
característica se reduce a:
[(σ + λ )(1 + λ ) − σRc ](b + λ ) = 0
por lo tanto hay tres valores propios:
λ1 = −b
2
λ2 , 3
considerando los valores
1+σ
1+ σ
=−
±
+ σ (Rc − 1)
2
2
σ = 10; b =
8
3
, obtenemos:
λ1 = − 83
λ2 = −5.5 − 20.25 + 10 Rc
λ3 = −5.5 + 20.25 + 10 Rc
El primer modo resulta ser siempre estable. El segundo modo también es siempre estable pero en este caso,
para Rc ≥ −2.025 , no hay conducta oscilatoria; para Rc < −2.025 , podrá observarse una conducta
oscilatoria amortiguada alrededor del punto fijo. Por último, para el tercer modo, cuando
Rc < −2.025 ,
podrá observarse una conducta oscilatoria amortiguada alrededor del estado estacionario. El modo es
estable sin oscilaciones para − 2.025 < Rc < 1 . Para Rc = 1 el modo es neutro. Finalmente, para
Rc > 1 el tercer modo es inestable. Es decir, el origen del sistema de coordenadas pierde su estabilidad en
Rc = 1 justo al mismo tiempo en que aparecen los otros dos estados estacionarios.
A continuación debe analizarse la estabilidad de estos estados estacionarios cuyas coordenadas son
qe1 = ± b(Rc − 1); qe 2 = ± b(Rc − 1); qe 3 = Rc − 1 , por lo que la ecuación característica será:
λ [(λ + 1 + σ )(λ + b ) + b(Rc − 1)] + 2σb(Rc − 1) = 0
2
2
1+ b + σ 1+ b + σ
λ λ +
−
+ b(σ + R c ) = −2σb(Rc − 1)
2
2
Considerando nuevamente los valores
σ = 10; b =
8
3
, se observa que ambos puntos fijos tienen las
mismas propiedades de estabilidad regidas por el polinomio característico:
[
]
λ (λ + 416 )2 − ( 416 )2 + 83 (10 + Rc ) = − 160
3 (Rc − 1)
Para
Rc = 1 , cuando estos puntos aparecen en el origen, tenemos:
λ (λ + 11)(λ + 83 ) = 0
es decir que existen tres raíces:
λ1 = −11; λ2 = − 83 y λ3 = 0 . Los dos primeros modos son estables,
mientras que el tercero es neutro.
Por otro lado, considerando la gráfica del polinomio cúbico, es fácil observar que hay un rango de
Rc en el
que siempre existirán tres raíces reales; mientras que fuera de este rango, habrá una raíz real y dos
complejas. Para determinar los límites de estos rangos debemos encontrar los puntos críticos del polinomio
cúbico, es decir:
(
)
f (λ ) = λ (λ + 416 ) − ( 416 ) + 83 (10 + Rc ) + 160
3 ( R c −1)
2
2
la primera derivada es:
f ′(λ ) = 3λ2 + 823 λ + 83 (10 + Rc )
mientras que la segunda derivada es:
f ′′(λ ) = 6λ + 823
igualando a cero la primera derivada encontramos los valores:
λ1, 2 = − 419 ±
λ1, 2 =
( 419 )2 − 89 (10 + Rc )
− 41 ± 961 − 720 Rc
9
Teorema de Cayley - Hamilton
En la definición de la matriz de transferencia aparecen las potencias sucesivas del
operador de evolución del sistema dinámico. Dicho operador es una matriz cuadrada. En
álgebra lineal existe un resultado sumamente interesante que se refiere a las potencias
sucesivas de una matriz de este tipo. El resultado, conocido con el nombre de teorema de
Cayley – Hamilton, puede resumirse diciendo que una matriz cuadrada de dimensión n
tiene solamente n − 1 potencias sucesivas independientes. Es decir que todas las
potencias iguales o superiores a n pueden calcularse a partir de las potencias inferiores.
Expuesto de esta forma, es evidente que el teorema de Cayley – Hamilton es de gran
utilidad para simplificar cálculos que involucren la matriz de transferencia. De hecho, con
este teorema se demuestra que la serie infinita que define la matriz de transferencia puede
transformarse a una serie finita con sólo n − 1 términos. Dada su importancia, a
continuación presentaremos la demostración del teorema.
Consideremos primeramente la ecuación:
f (λ ) = A − λU
En donde λ es una variable escalar. Dicha ecuación se denomina ecuación característica
de la matriz A es claro que las raíces de la ecuación característica son los valores propios
de la matriz. En efecto, si λ = λi es una raíz, el determinante es cero y, del álgebra lineal,
sabemos que el siguiente sistema de ecuaciones tendrá una solución no trivial en el
vector x :
(A − λi U )x = 0
de hecho, el vector x será un vector propio generalizado de la matriz. Ahora, por otro
lado, es fácil ver que la ecuación característica es un polinomio en λ de grado n igual al
tamaño de la matriz:
n
A − λU = ∑ J n −i λi
i =0
Los coeficientes del polinomio dependen únicamente de las componentes de la matriz, en
efecto, evaluando en λ = 0 esta última expresión obtenemos:
A = Jn
de igual modo, todos los demás coeficientes se calculan derivando sucesivamente en λ y
evaluando las derivadas en λ = 0 :
1 d
A − λU λ =0 = J n −1
1! dλ
1 d2
A − λU λ = 0 = J n − 2
2! dλ2
1 dk
A − λU λ = 0 = J n − k
k! dλk
Este procedimiento puede usarse incluso hasta para k = n de donde obtenemos J 0 = 1 .
Como vemos, al evaluar las derivadas en λ = 0 , los coeficientes J i solo dependen de las
componentes de la matriz A .
Veamos otro resultado que será de utilidad para demostrar el teorema de Cayley
Hamilton. Consideremos la siguiente identidad:
A m = A m −1A
multiplicando ambos lados de la identidad por un vector propio del tipo δq λi ,1 para un
valor propio cualquiera λi de la matriz A podemos deducir:
A mδq λi ,1 = A m −1Aδq λi ,1 = A m −1λiδq λi ,1 = λi A m−1δq λi ,1 = λi A m − 2 Aδq λi ,1
en donde los últimos dos factores nos permitirían realizar nuevamente la misma
substitución. Realizando esta operación m veces obtenemos:
A mδq λi ,1 = λimδq λi ,1
En donde se adopta, como siempre, la convención A 0 = U . Esta última ecuación
demuestra que los vectores propios de la potencia m de una matriz son iguales a los
vectores propios de la misma matriz. Mientras que, por otro lado, los valores propios de
la potencia m de la matriz son iguales a la potencia m de los valores propios de la misma
matriz.
Ahora bien, sustituyendo en la ecuación característica algún valor propio específico
λ = λi y multiplicando por el vector propio correspondiente δq λi ,1 tendremos:
J 0λinδq λi ,1 + J 1λin −1δq λi ,1 + J 2λni − 2δq λi ,1 +
J n −1λiδq λi ,1 + J nδq λi ,1 = 0
entonces es posible identificar cada uno de los términos con alguna potencia de la matriz,
de tal modo que:
J 0 A nδq λi ,1 + J 1A n −1δq λi ,1 + J 2 A n − 2δq λi ,1 +
J n −1A nδq λi ,1 + J n A 0δq λi ,1 = 0
despejando el primer término del polinomio y factorizando el vector propio generalizado
del lado derecho:
J 0 A nδq λi ,1 = −(J 1A n −1 + J 2 A n − 2 +
J n −1A n + J n A 0 )δq λi ,1
Entonces, por la ley de cocientes del cálculo tensorial, podemos deducir que las matrices
que aparecen a ambos lados de la igualdad son iguales, recordando además que J 0 = 1
tenemos:
A n = − J 1A n −1 − J 2 A n − 2 −
J n −1A n − J n U
o bien:
n
A n = − ∑ J i A n −i
i =1
la cual también puede representarse como:
n −1
A = − ∑ J n −i A i
n
i =0
Este último resultado es conocido como Teorema de Cayley – Hamilton. A veces se
expresa diciendo que toda matriz cuadrada satisface su propia ecuación característica. Sin
embargo, es importante notar el paso no trivial que se ha realizado al final de la
demostración anterior: la ecuación característica es una sola ecuación cuyos términos son
todos escalares; mientras que la expresión del teorema de Cayley Hamilton implica n × n
ecuaciones, una por cada una de las componentes de las matrices involucradas en sus
términos. Es evidente que, a partir de esta expresión, siempre podrá representarse la
enésima potencia de la matriz en función de las primeras n − 1 potencias (incluyendo al
cero). Así mismo, las potencias superiores podrán expresarse en la misma forma.
La serie infinita que aparece en la definición de la matriz de transferencia puede
transformarse, con ayuda del teorema de Cayley – Hamilton, en una serie con tan solo n
términos, siendo n la dimensión del espacio de fases del sistema. En efecto, dividiendo
la serie en los siguientes tres términos:
n −1
∞
Aktk tn n
Aktk
+ A + ∑
n!
k = n +1 k!
k = 0 k!
e At = ∑
y utilizando el teorema de Cayley – Hamilton en el de en medio:
n −1
∞
tk tn
Aktk
e At = ∑ − J n − k A k + ∑
n!
k = 0 k!
k = n +1 k!
Como vemos, en esta serie ya no aparece la potencia n de la matriz. El siguiente término
de la serie se puede simplificar como:
n −1
∞
tk tn
Aktk
t n +1
e At = ∑ − J n − k A k +
AnA + ∑
(n + 1)!
n!
k = 0 k!
k = n + 2 k!
∞
n −1
n −1
tk tn
Akt k
t n +1
t n +1
e At = ∑ − J n − k +
J 1 J n − k A k − ∑
J n − k +1A k + ∑
(n + 1)!
n!
k = n + 2 k!
k =1 (n + 1)!
k = 0 k!
como puede verse realizando sucesivamente esta operación con los términos siguientes el
resultado será una serie con n − 1 términos compuestos por el factor A k y un polinomio
de la variable tiempo y de los invariantes principales del operador de evolución. En suma,
la matriz de transferencia se puede escribir como:
n −1
e At = ∑ α k (t )A k
k =0
en donde los α k (t ) son polinomios complejos de la variable tiempo. Este resultado será
útil en lo que sigue.
Teorema de Controlabilidad
Se dice que el sistema es controlable en el instante t0 si es posible determinar un vector
de control δu(t ) que transfiera al sistema desde cualquier estado inicial δq(t0 ) a
cualquier otro estado en un intervalo finito de tiempo (t0 , t1 ) . Sin pérdida de generalidad,
se puede suponer que el estado final que se busca es el estado estacionario δq(t1 ) = 0 y el
tiempo inicial es cero. De acuerdo con esto, si se considera la solución general de la
ecuación de evolución:
t1
0 = e At1 δq (0) + ∫ e A (t1 −τ )Bδu(τ )dτ
0
o sea, despejando el estado inicial:
t1
δq(0) = − ∫ e − Aτ Bδu(τ )dτ
0
substituyendo la forma de serie finita para la matriz de transferencia obtenemos:
t1
n −1
δq (0) = − ∑ A B ∫ α k (− τ )δu(τ )dτ
k
k =0
0
definiendo los vectores constantes:
t1
k
= ∫ α k (− τ )δu(τ )dτ
0
podemos escribir:
n −1
δq(0) = − ∑ A k B
k
k =0
reacomodando las componentes de los vectores k en un solo vector podemos rescribir la
ecuación anterior, de la siguiente forma hipermatricial:
δq(0) = −[B, AB, A 2 B, A 3B,
n −1
A B
]
1
n −1
0
Si la dimensión del espacio de fases es n y existen r variables de control, la matriz del
primer paréntesis es de tamaño n × nr y la del segundo es nr × 1 . Para que el sistema sea
completamente controlable, dada cualquier condición inicial se debe satisfacer la
ecuación anterior. Es decir, es necesario que la primera matriz tenga n columnas
independientes, de modo que el determinante de la matriz reducida sea diferente de cero
y pueda encontrarse una solución para cualquier condición inicial.
La matriz:
[
C = B, AB, A 2 B, A 3B,
A n −1B
]
se denomina matriz de controlabilidad del sistema y basta con verificar que su rango es
igual a la dimensión del espacio de fases para saber si un sistema es controlable o no.
Representación Externa
Considerando la solución general del sistema de control obtenida en párrafos anteriores:
t
δq(t ) = e Atδq (0) + ∫ e A (t −τ )Bδu(τ )dτ
0
cuando estamos interesados sólo en el control del sistema, podemos suponer δq (0) = 0 y
escribir:
t
δq(t ) = ∫ G(t − τ )δu(τ )dτ
0
con G(t − τ ) = e A (t −τ )B . Como vemos, la función G enmascara las características del
sistema, pudiendo interpretarse la ecuación anterior como una relación entre la “entrada”
que se le administra al sistema δu(t ) y la “salida” o efecto que se observa en el sistema
debido a esa entrada δq(t ) . La representación anterior se conoce con el nombre de
representación externa del sistema, mientras que la ecuación diferencial de evolución de
los estados se denomina representación interna.
La integral en el lado derecho de la representación externa es lo que se conoce como un
producto de convolución entre las funciones del tiempo G y δu . Por otro lado, La
transformada de Laplace de una función cualquiera del tiempo se define como:
yˆ (s ) =
∞
[y (t )] = ∫ y (t )e − st dt
−∞
y es bien conocido que la transformada de la convolución es igual al producto algebraico
de las transformadas; la representación externa, en el espacio de Laplace tiene la forma:
ˆ (s )δuˆ (s )
δqˆ (s ) = G
La matriz Ĝ(s ) se denomina función de transferencia entre la entrada y la salida, y basta
con conocer dicha función para conocer todas las propiedades de control del sistema.
En una parte muy importante de la literatura sobre teoría de control, desde un principio,
se adopta el punto de vista externo y se desarrollan todos los conceptos y las
demostraciones en el espacio de Laplace. En este curso se ha adoptado el punto de vista
interno puesto que nos interesa desarrollar el modelado del sistema dinámico del vehículo
(lo cual se hace en el capítulo siguiente), además, como se ha visto aquí, las explicaciones
de los conceptos de estabilidad y de controlabilidad aparecen como más directas o
intuitivas en la representación interna y esto ayuda a muchos estudiantes a desarrollar una
base más sólida para la comprensión de los temas. También es paradójico señalar que, en
los libros de control, el teorema de controlabilidad casi siempre aparece en los últimos
capítulos y no al principio como parecería lógico.
Diseño de Controladores
El teorema de controlabilidad, nos permite saber si un estado estacionario es controlable
o no en forma muy sencilla. Sin embargo, en un caso práctico, este teorema no nos ayuda
a calcular efectivamente la función de control necesaria para alcanzar un estado
estacionario. En este párrafo veremos una forma particular de calcular la función de
control apropiada.
El sistema de control, bajo la forma lineal que hemos analizado:
dδq
= Aδq + Bδu
dt
se denomina también sistema de lazo abierto ya que en este sistema la función δu puede
imponerse de cualquier forma, independientemente del resultado que esto pueda tener
sobre la perturbación. En cambio, si relacionamos en cualquier forma la señal de control
con la perturbación del estado δu = K (δq ) , obtenemos lo que se llama un sistema de
control de lazo cerrado:
dδq
= Aδq + BK (δq )
dt
ya que se ha utilizado la “salida”, es decir el valor de la perturbación, para retroalimentar
el sistema buscando controlarlo. Es lógico pensar que la señal de control deba estar
relacionada con las perturbaciones que sufre el sistema, es exactamente lo que hace
cualquier ser humano cuando desea obtener agua tibia a partir de una mezcladora con dos
llaves: si sentimos que el agua está muy caliente abrimos más la llave “fría” o cerramos
un poco la llave “caliente”; y viceversa.
Específicamente, podemos pensar que el control será directamente proporcional a la
perturbación, tendiendo a reducirla siempre; esto se puede representar de la manera
siguiente:
δu = −K Pδq
también podemos pensar que la señal de control sea proporcional al promedio de las
perturbaciones durante un cierto intervalo de tiempo T anterior al instante en que se
aplica el control; esto lo podemos representar como:
δu = −K
t
1
I T
∫ δqdτ
t −T
por último, podemos pensar que la señal de control sea proporcional a la velocidad con
que la perturbación se incrementa o disminuye; esto se puede representar mediante:
δu = − K D
dδq
dt
En la realidad, muchas veces se aplican señales de control que son una combinación de
estas tres posibilidades. En ese caso se habla de control proporcional, integral y
derivativo o bien, simplemente, de control PID. Es evidente que el diseño del control
consiste en el cálculo de las constantes K P , K I , K D de tal forma que el sistema regrese al
estado estacionario para cualquier perturbación inicial. Para un control PID, el sistema de
lazo cerrado se escribe como:
dδq
= Aδq − B K Pδq + K I
dt
t
1
T
∫ δqdτ + K
D
t −T
dδq
dt
Este sistema de lazo cerrado puede verse como un nuevo sistema dinámico autónomo,
reacomodando los términos de la ecuación. Primeramente, introducimos una nueva
variable mediante:
dδr
= δq
dt
Por lo tanto, el control integral puede escribirse como:
t
K
1
I T
∫ δqdτ = −K [δr (t ) + δr (t − T )] = −K [δr + δr ]
1
I T
1
I T
t −T
t −T
substituyendo en el sistema de lazo cerrado obtenemos:
dδq
= Aδq − B K Pδq + K I
dt
dδr
= δq
dt
1
T
[δr + δrt −T ] + K D dδq
dt
el cual, reacomodando los términos puede escribirse como dos ecuaciones diferenciales
de primer orden:
dδq
−1
−1
= (U + BK D ) (A − BK P )δq − (U + BK D ) BK I
dt
dδr
= δq
dt
1
T
[δr − δrt −T ]
Esta ecuación es una ecuación diferencial con retardo. Estas ecuaciones son un poco más
difíciles de resolver que las ecuaciones diferenciales simples, por lo que, aún cuando
existe una teoría perfectamente establecida para estas ecuaciones, en este texto nos
limitaremos a despreciar el término de retardo integrando también la constante T1 en la
constante K I (cabe mencionar que en la mayoría de las aplicaciones se llama control
PID al que consiste precisamente en esta aproximación). Entonces, el sistema dinámico
de PID se puede escribir cómo:
dδq
−1
−1
dt (U + BK D ) (A − BK P ) − (U + BK D ) BK I δq
dδr =
0
U
δr
dt
Ahora bien, el diseño del control consiste en escoger los valores propios de esta nueva
ecuación de evolución, de forma tal que el sistema con control sea estable. Suponiendo
que se desea obtener los valores propios λi la ecuación característica debe ser:
2n
(λ − λ1 )(λ − λ2 ) (λ − λ2n ) = ∑ aˆi λ2n−i
i =0
En donde los coeficientes del polinomio âi se conocen con el nombre de invariantes
principales (es evidente que siempre será aˆ 0 = 1 ). Se debe notar que se requiere
seleccionar 2n valores propios ya que el sistema ha duplicado su tamaño debido a el
control integral. Es fácil demostrar que la siguiente matriz tiene como valores propios los
λi :
0
0
D= 0
− aˆ 2 n
1
0
0
0
1
0
− aˆ 2 n−1
− aˆ 2 n−2
0
0
1
0
0
0
1
− aˆ1
Esta matriz se denomina forma canónica del sistema con valores propios λi . Existen
muchas otras formas de construir matrices que tengan los mismos valores propios. A un
grupo importante de estas se les llama formas acompañantes y se obtienen trabajando los
valores propios en forma similar, por grupos. Sin embargo, se puede demostrar que para
cualquier matriz T no singular, la matriz T −1DT tiene los mismos valores propios que
D ya que tiene el mismo polinomio característico:
D − λU = T −1DT − λU
en efecto, recordando que U = T −1T y factorizando del lado derecho:
T −1DT − λT −1T = T −1 (D − λU )T
por otro lado, el determinante del producto es igual al producto de determinantes:
T −1 D − λ U T = T −1 T D − λ U = D − λ U
De este modo, si se pueden encontrar matrices constantes K P , K I , K D y una matriz T ,
tales que:
(U + BK D )−1 (A − BK P ) − (U + BK D )−1 BK I
−1
= T DT
U
0
el sistema de lazo cerrado con control PID tendrá los valores propios deseados. La
ecuación matricial tiene 4n 2 componentes. Podemos ahora contabilizar las incógnitas
que aparecen en esta ecuación: si se considera que el sistema de lazo abierto tiene n
variables de fase y r variables de control, entonces se tienen 3nr incógnitas por las
componentes de las matrices K P , K I , K D . Sin embargo, las componentes de la matriz T
no son todas independientes ya que por ser de transformación debe ser unitaria.
Como puede verse, este problema es bastante complejo y hasta el momento no se conoce
una solución general del mismo.
Ejemplo del Péndulo Invertido
Se tiene una plataforma deslizante de masa M con una barra vertical unida mediante una
articulación (figura). La barra tiene una masa m . La plataforma es impulsada mediante
una fuerza horizontal u .
En el caso de cuerpos compuestos por diversos eslabones se recomienda establecer los
diagramas de cuerpo libre considerando las reacciones apropiadas en los pares dinámicos
correspondientes. Así, la función de Lagrange para la plataforma del carrito está formada
por la energía cinética de la misma más el trabajo producido por las fuerzas aplicadas:
Lc = 12 MU c2 + ∫ (u − Fix )dx
evidentemente, estamos despreciando cualquier fricción en las ruedas y cancelando entre
sí las fuerzas que no producen desplazamientos en el eje vertical. De la misma forma, la
función de Lagrange de la barra está formada por su energía cinética más el trabajo
producido por las fuerzas aplicadas, la diferencia en este caso es que la barra puede girar
alrededor de la articulación y, por lo tanto, su centro de gravedad se desplaza en ambas
direcciones. De este modo, los movimientos rotacionales contribuyen a la lagrangiana
mediante los términos siguientes:
Lb = 12 m (U b2 + Vb2 ) + ∫ Fix dx + ∫ Fiy dy − mgyCG + 12 IR 2 + ∫ [Fiy ( xCG − x ) − Fix yCG ]dθ
Como puede verse, se ha colocado el cero de la energía potencial en la articulación de
modo que la energía potencial de la barra es cero cuando se encuentra en posición
horizontal. Las variables xCG , yCG están relacionadas geométricamente con las variables
x,θ mediante las siguientes relaciones:
xCG = x + lsen(θ )
yCG = l cos(θ )
U b = xCG = U c + lR cos(θ )
Vb = yCG = −lRsen(θ )
En donde l es la longitud al centro de gravedad de la barra. Ahora bien, las variables de
fase y sus derivadas con respecto al tiempo son:
x = Uc
xCG = U b
yCG = U b
θ =R
Por lo que las ecuaciones de Euler – Lagrange para los dos cuerpos del sistema son:
d
∇U Lc = ∇ x Lc
dt c
d
∇{U b ,Vb , R}Lb = ∇{xCG , y CG ,θ }Lb
dt
es decir:
d
(MU c ) = u − Fix
dt
d
(mU b ) = Fix
dt
d
(mVb ) = Fiy − mg
dt
d
(IR ) = Fiy (xCG − x ) − Fix yCG
dt
utilizando la segunda y tercera ecuaciones para eliminar las fuerzas internas entre los
elementos, considerando las masas constantes y adjuntando la definición de las
velocidades, obtenemos:
x = Uc
MU c = u − m
dU b
dt
θ =R
dV
dU
IR = m b + g ( xCG − x ) − m b yCG
dt
dt
eliminando las variables de fase que no son independientes obtenemos:
x = Uc
(M + m )U c = u − mlR cos(θ ) + mlR 2 sen(θ )
θ =R
(I + ml )R = mglsen(θ ) − mlU c cos(θ )
2
Despejando las primeras derivadas de las variables de fase encontramos el sistema
dinámico correspondiente:
[
]
x = Uc
(I + ml 2 )
ml (I + ml )R − mgl cos(θ ) sen (θ )
u
+
(M + m )(I + ml 2 ) − m 2l 2 cos 2 (θ ) (M + m )(I + ml 2 ) − m 2l 2 cos 2 (θ )
θ =R
2
ml (M + m )g − mR l cos(θ ) sen (θ )
ml cos(θ )
u
R=
−
2
2 2
2
(M + m )(I + ml ) − m l cos (θ ) (M + m )(I + ml 2 ) − m 2l 2 cos2 (θ )
Uc =
[
2
2
]
Encontrar los estados estacionarios de este sistema puede parecer difícil dadas las no
linealidades del mismo. Sin embargo, es fácil verificar que el origen del espacio de fases
q e = 0 es un estado estacionario para un valor de compensación nulo u c = 0 :
xe = 0 ; U ce = 0 ; θ e = 0 ; Re = 0
en efecto, esto se verifica fácilmente debido a la existencia del factor sen(θ ) en las
ecuaciones.
Entonces, las derivadas de estabilidad del sistema dinámico serán:
∂x
=0
∂x qe ,uc
∂U c
∂x
∂θ
∂x
=0
q e ,u c
∂x
∂U c
∂U c
∂U c
q e ,u c
∂θ
∂U c
∂R
=0
∂x qe ,uc
∂R
∂U c
=0
∂x
∂θ
=1
q e ,uc
∂U c
∂θ
=0
q e ,u c
=
q e ,u c
=0
q e ,u c
q e ,u c
− m2l 2 g
(M + m )(I + ml 2 ) − m 2l 2
∂U c
∂R
q e ,u c
mg (M + m )l
∂R
=
∂θ qe ,uc (M + m )(I + ml 2 ) − m 2 l 2
∂R
=0
∂R qe ,uc
=0
Mientras que las derivadas de control son:
∂x
=0
∂u q e ,uc
∂U c
∂u
∂θ
∂u
=
q e ,u c
(I + ml )
(M + m )(I + ml ) − m l
2
2
2 2
=0
q e ,u c
∂R
− ml
=
∂u q e ,u c (M + m )(I + ml 2 ) − m 2l 2
el sistema de control podrá escribirse como:
0
δx
δU 0
c =
δθ 0
δR 0
1
=0
q e ,u c
∂θ
=1
∂R qe ,uc
∂θ
∂θ
=0
q e ,u c
∂x
=0
∂R qe ,uc
=0
0
− m 2l 2 g
0
(M + m )I + Mml 2
0
0
(
M + m )ml g
0
(M + m )I + Mml 2
0
0
(
I + ml 2 )
δx
0 δU
2
c
+ (M + m )I + Mml δu
1 δθ
0
ml
−
0 δR
2
(M + m )I + Mml
Substituyendo valores numéricos podrán calcularse los valores propios del operador de
evolución para conocer la estabilidad del estado estacionario. Igualmente, podrá
encontrarse el rango de la matriz de controlabilidad. Sin embargo, con el objeto de
continuar el cálculo en la forma lo más general posible, rescribiremos este sistema como:
δx 0
δU 0
c =
δθ 0
δR 0
0 δx 0
0 δU c b1
δu
+
1 δθ 0
0 δR − b2
1 0
0 − a1
0 0
0 a2
La estabilidad está dada por el siguiente polinomio característico:
0
0
λU −
0
0
1
0
0 − a1
0
0
0
a2
0
0
=0
1
0
es decir:
λ
0
0
0
λ
λ 0
0
−1
0
λ
a1
0
λ
0
− a2
a1
λ
− a2
0
λ
0
= λ 0
− 1
0
λ
0
λ
− 1 = λ2
− a2
λ
a1
λ
− a2
0
− 1
λ
− 1
= λ2 (λ2 − a 2 )
λ
Por lo que los valores propios del sistema son:
λ1, 2 = 0
λ3, 4 = ± a2
Concluimos que siempre existe un modo inestable. Ahora calcularemos la matriz de
controlabilidad:
0 0
b1 0
,
C=
0 0
− b2 0
1 0
0 − a1
0 0
0 a2
0 0 0
0 b1 0
,
1 0 0
0 − b2 0
1 0
0 − a1
0 0
0 a2
0
0
1
0
2
0 0
b 0
1 ,
0 0
− b2 0
1 0
0 − a1
0 0
0 a2
0
0
1
0
3
0
b
1
0
−
b
2
realizando los cálculos:
0
b
C= 1
0
− b2
b1
0
− b2
0
0
a1b2
0
− a2 b2
a1b2
0
− a2 b2
0
Dividiendo las componentes de la tercera columna entre las componentes respectivas de
la primera, es fácil ver que no habrá controlabilidad cuando se cumpla la condición
a2 b1 − a1b2 = 0 . Sin embargo esto es imposible ya que dicha cantidad es igual a:
a 2 b1 − a1b2 =
ml g
(M + m )I + Mml 2
y todas las cantidades del lado derecho son positivas. En conclusión, este sistema será
siempre controlable.
A continuación diseñaremos un controlador para el sistema propuesto. Debemos calcular
las componentes de la matriz K de tal forma que los valores propios de la nueva matriz
de estabilidad hagan estable el sistema de lazo cerrado. Supongamos que deseamos que el
polinomio característico tenga la siguiente forma:
(λ − λ1 )(λ − λ2 )(λ − λ3 )(λ − λ4 ) = 0
los invariantes principales, en función de los valores propios deseados son:
aˆ 0 = 1
aˆ1 = −(λ1 + λ2 + λ3 + λ4 )
aˆ 2 = λ1λ2 + λ3λ4 + (λ1 + λ2 )(λ3 + λ4 )
aˆ 3 = −(λ1λ2 (λ3 + λ4 ) + (λ1 + λ2 )λ3λ4 )
aˆ 4 = λ1λ2 λ3λ4
Por otro lado, el polinomio característico del sistema de lazo cerrado será:
0
0
λU −
0
0
Es decir:
1
0
0 − a1
0
0
0
a2
0 0
0 b1
[k1
+
1 0
0 − b2
k2
k3
k4 ] = 0
−1
λ
bk
λ + b1k 2
1 1
0
0
− b2 k1 − b2 k 2
0
a1 + b1k3
λ
− a 2 − b2 k3
0
b1k 4
=0
−1
λ − b2 k 4
Realizando los cálculos:
λ4 + (b1k 2 − b2 k 4 )λ3 + (b1k1 − b2 k3 − a2 )λ2 − (a2 b1 − a1b2 )k 2λ − (a2 b1 − a1b2 )k1 = 0
Igualando los coeficientes de potencias iguales entre el polinomio de lazo cerrado y el
polinomio deseado, obtenemos:
b1k 2 − b2 k 4 = aˆ1
b1k1 − b2 k 3 − a2 = aˆ 2
− (a2 b1 − b2 a1 )k 2 = aˆ3
− (a2 b1 − b2 a1 )k1 = aˆ 4
Despejando las ganancias del control tenemos:
k1 = −
aˆ 4
a2b1 − b2 a1
k2 = −
aˆ 3
a2 b1 − b2 a1
k3 = −
b1
aˆ 4
a + aˆ 2
− 2
b2 a2 b1 − b2 a1
b2
k4 = −
b1
aˆ 3
aˆ
− 1
b2 a2b1 − b2 a1 b2
A continuación se efectúa este calculo para los siguientes valores:
[
]
[
M = 3 [Kg ]; m = 0.3 [Kg ]; l = 1 [m]; I = 0.15 Kgm 2 ; g = 9.81 m/s 2
la matriz de derivadas de estabilidad es:
0
0
∇q e F =
0
0
1
0
0 − 0.6329
0
0
0 6.9619
0
0
1
0
]
es decir a1 = 0.6329 y a2 = 6.9619 . Los valores propios de esta matriz son:
λ1 = 0
λ2 = 0
λ3 = 2.6385
λ4 = −2.6385
existen dos modos neutros, uno inestable y uno estable; se concluye que el estado
estacionario es inestable. La matriz de derivadas de control es:
0
0.3226
∇u c F =
0
− 0.2151
es decir b1 = 0.3226 y b2 = 0.2151 . De tal suerte que la matriz de controlabilidad es:
0.3226
0
0.1361
0
0.3226
0
0.1361
0
C=
0
0
− 0.2151
− 1.4972
0
0
− 1.4972
− 0.2151
se puede determinar fácilmente que su rango es 4, por lo que se concluye que el estado
estacionario es controlable. O bien, de otro modo, se verifica que el discriminante
siguiente no es cero:
a2b1 − a1b2 = 2.1097
Ahora bien, deseamos que la varilla regrese a su posición vertical en forma suave, no
brusca, por lo que debemos admitir valores propios complejos conjugados con una parte
real negativa pero no muy grande en valor absoluto. Escojamos los siguientes valores
propios:
λ1 = −15
λ2 = −10
λ3 = −2 + 2 3i
λ4 = −2 − 2 3i
Por lo tanto, la ecuación característica deseada es:
(λ − λ1 )(λ − λ2 )(λ − λ3 )(λ − λ4 ) = (λ + 15)(λ + 10)(λ + 2 − 2
(λ
2
+ 25λ + 150)(λ2 + 4λ + 16) = 0
λ4 + 29λ3 + 266λ2 + 850λ + 2400 = 0
de donde extraemos los invariantes principales:
aˆ0 = 1; aˆ1 = 29; aˆ 2 = 266; aˆ3 = 850; aˆ 4 = 2400
Por último, las ganancias del controlador serán:
k1 = −1137.6147
k 2 = −402.9052
k3 = −2975.6950
k 4 = −739.2078
)(
)
3i λ + 2 + 2 3i = 0
Capítulo 3
Ecuaciones de
Movimiento del
Vehículo
Ejes de Referencia
Durante el análisis del movimiento de un cuerpo se hace necesaria la utilización de
diversos sistemas de referencia. Esto es debido a que la adecuación de un sistema de ejes
depende del fin que se persigue al introducirlo. Así, en nuestro estudio, buscaremos, en
un principio, las ecuaciones que gobiernan la trayectoria del vehículo, posteriormente,
desearemos conocer los movimientos del mismo y, al hacer esto, requeriremos
expresiones para las fuerzas aerodinámicas a que se ve sometido. En cada uno de los tres
análisis mencionados, convendrá tomar un sistema de referencia diferente.
En este libro utilizaremos solamente tres sistemas de referencia, los conocidos con los
nombres de: ejes tierra, ejes cuerpo y ejes viento. Todos los sistemas de referencia
utilizados serán del tipo cartesiano, ortogonal, derecho. En las siguientes tablas
resumimos la definición de cada uno de ellos, agregando alguna información sobre su
utilidad así como la nomenclatura asociada.
Sistema de Ejes Tierra
Definición
a) El origen es cualquier punto de
la superficie terrestre.
(2) El eje Z ′ es paralelo a, y
positivo en el sentido de la
aceleración de la gravedad.
(3) Los ejes X ′ y Y ′ se localizan en
el plano perpendicular al eje Z ′ ,
llamado plano del horizonte, en
Comentarios
Este sistema permite escribir las ecuaciones
de movimiento ya que, como se verá más
adelante, puede considerarse como un
sistema inercial.
cualquier dirección que sea
conveniente, formando un sistema
derecho.
Sistema de Ejes Cuerpo
Definición
Comentarios
b) El origen es el centro de Este sistema permite analizar los
gravedad
del
cuerpo
en movimientos del cuerpo.
Los movimientos traslacionales se conocen
movimiento.
(2) El eje X se toma paralelo a una con los nombres de: avance, derrape y
referencia longitudinal del cuerpo descenso, en las direcciones positivas de los
(por ejemplo, la dirección ejes X − Y − Z respectivamente.
principal de movimiento de un Los movimientos rotacionales se conocen
vehículo).
con los nombres de: alabeo, cabeceo y
(3) El eje Y se toma en el plano guiñada, en el sentido de un tornillo
perpendicular al anterior, paralelo derecho alrededor de los ejes X − Y − Z
a una referencia transversal del respectivamente.
cuerpo
(por
ejemplo,
la
envergadura para un avión).
(4) El eje Z se toma perpendicular a
los anteriores y positivo de tal
suerte que se obtenga un sistema
derecho.
Sistema de Ejes Viento
Definición
Comentarios
c) El origen es el centro de Este sistema nos permite calcular las fuerzas
y momentos aerodinámicos que actúan
gravedad del cuerpo.
(2) El eje X V se toma paralelo a la sobre el cuerpo en movimiento.
proyección del vector velocidad Las fuerzas aerodinámicas se conocen con
sobre el plano X − Z del cuerpo y los nombres de resistencia al avance,
positivo en la dirección opuesta al fuerza de derrape y levantamiento a lo
largo
de
los
ejes
X V − YV − ZV
movimiento.
(3) El eje YV coincide con el eje Y respectivamente.
Los momentos aerodinámicos se conocen
del cuerpo.
(4) El eje ZV es perpendicular a los con los nombres de alabeo, cabeceo y
guiñada alrededor de los ejes X V − YV − ZV
dos anteriores formando un
respectivamente.
sistema derecho.
Puede parecer que hay una ligera inconsistencia al confundir los nombres de los
movimientos en los ejes cuerpo con los de los momentos en los ejes viento (salvo para el
cabeceo, pues los ejes Y coinciden). Sin embargo, puesto que el origen de los ejes viento
coincide con el centro de gravedad del cuerpo, puede considerarse a estos como un caso
particular de ejes cuerpo.
Dependiendo de los autores, a veces se utilizan otros sistemas de referencia en mecánica
de vuelo. Así, podemos mencionar a los llamados “ejes locales”, que son un sistema de
referencia paralelo al de tierra pero con el origen en el centro de gravedad del cuerpo.
También pueden mencionarse los “ejes de estabilidad”, paralelos a los ejes viento pero
girados 180 grados alrededor del eje YV .
Rotaciones en el Espacio.
Durante el análisis del movimiento de un vehículo requeriremos transformar ciertas
cantidades físicas de unos ejes a otros; por ejemplo, las fuerzas aerodinámicas halladas en
el sistema de ejes del viento deberán transformarse a los ejes del vehículo, para conocer
los movimientos que ellas producen. En general, las cantidades físicas que se utilizarán
son vectores que pertenecen a un cierto espacio vectorial. Las transformaciones de
coordenadas pueden interpretarse como rotaciones en el espacio correspondiente (más
adelante estableceremos matemáticamente este hecho). Por otro lado, las rotaciones son
transformaciones lineales de unos vectores en otros y, por lo tanto, comenzaremos
analizando este tipo de transformaciones.
La transformación lineal más general de un vector a en otro x , puede escribirse de la
siguiente forma:
x = Ra
en donde R representa una matriz de orden igual al número de dimensiones del espacio
vectorial (en nuestro caso tratamos únicamente con vectores en tres dimensiones). Ahora
bien, no todas las transformaciones de este tipo pueden interpretarse como rotaciones del
vector a . Para que esto sea posible será necesario satisfacer dos condiciones elementales:
a) La norma del vector a debe permanecer invariable durante la
rotación.
b) Una terna ordenada de vectores debe girar de modo que se
superpongan los vectores en el mismo orden original (se deben evitar
las reflexiones especulares).
Estas condiciones imponen ciertas restricciones sobre las componentes de la matriz R
que serán analizadas a continuación. La condición de invariabilidad de la norma puede
establecerse mediante la siguiente ecuación:
xT x = aT a
2
es decir, el cuadrado de la norma ( x = x T x ) debe ser el mismo antes y después de la
rotación. Sustituyendo la relación de transformación y su transpuesta del lado izquierdo
de esta identidad, puede obtenerse:
aT R T Ra = aT a
en donde hemos utilizado el hecho de que la transpuesta del producto es igual al producto
de transpuestas. Finalmente, a través de la ley del cociente, se obtiene fácilmente:
RT R = U
en donde U es la matriz identidad (con unos en la diagonal principal y ceros fuera de
ella). Esta relación nos indica que, para una matriz de rotación, la transpuesta es igual a la
inversa.
Derivado de lo anterior, también podemos ver que el determinante de la matriz de
rotación es de magnitud unitaria, en efecto, si tomamos el determinante de ambos lados
de la última ecuación obtenemos:
RT R = U
Puesto que el determinante de U = 1 y el determinante del producto es igual al producto
de determinantes tenemos:
2
R =1
Ahora bien, para saber que representa el valor positivo o el valor negativo de este
determinante necesitamos considerar una terna ortonormal de vectores
e1 , e 2 , y e 3 ordenada según la regla de la mano derecha (nótese la permutación cíclica de
los índices):
[e1 ×]e2 = e3 ; [e2 ×]e3 = e1; [e3 ×]e1 = e2
es fácil comprobar que, ordenando las componentes de estos vectores como columnas en
una matriz, el determinante de esta última será igual a la unidad (puesto que los vectores
son unitarios), es decir:
[e1, e2 , e3 ] = 1
Entonces, transformando cada uno de los vectores mediante la matriz R , el determinante
del resultado debe permanecer igual a la unidad, de modo que la terna resultante sea
también ortonormal derecha. En efecto, recordamos que una permutación entre las
columnas de un determinante cambia su signo, por lo tanto, para que los tres vectores se
superpongan simultáneamente, el determinante debe permanecer igual a la unidad. En
suma, tenemos la condición:
[Re1, Re2 , Re3 ] = 1
o bien:
R[e1, e2 , e3 ] = 1
Finalmente, puesto que el determinante del producto es igual al producto de
determinantes llegamos a la conclusión de que:
R =1
En resumen, podemos decir que las condiciones (a) y (b) sobre las rotaciones nos llevan a
las siguientes condiciones sobre las matrices que las representan:
a) La inversa de una matriz de rotación es igual a su transpuesta.
b) El determinante de una matriz de rotación es igual a la unidad.
Puede demostrarse que estas condiciones son necesarias y suficientes, es decir, que toda
matriz que satisfaga las condiciones (a) y (b) representa una rotación de vectores en el
espacio vectorial correspondiente. Sin embargo, estas condiciones no nos permiten
calcular las componentes de la matriz de rotación para un caso específico. Se plantea
entonces el problema de la representación de la matriz de rotación dadas ciertas
condiciones o parámetros de la misma. Dicho problema ha encontrado diversas
soluciones a través de los siglos, mencionemos particularmente: los ángulos de Euler, los
cuaterniones de Gauss, la forma de Gibbs, los parámetros de Euler – Rodrigues, las
matrices de Dirac del grupo SU(2), etc. De entre todas estas representaciones nos
limitaremos a exponer dos de ellas: la forma de Gibbs, debido a su simplicidad y su
utilidad en la simulación de la dinámica de un vehículo, y los ángulos de Euler, debido a
su uso generalizado en el área de la mecánica de vuelo para los análisis de estabilidad.
Las otras formas han sido de utilidad en otras áreas de la ciencia tales como la mecánica
cuántica, la cartografía, etc. El lector interesado podrá encontrar información al respecto
en los libros de texto especializados.
Forma de Gibbs de la Matriz de Rotación.
Supongamos dado un cierto eje alrededor del cual se efectúa una rotación en un espacio
tridimensional. Sea n un vector unitario paralelo a la dirección del eje y φ el ángulo de
rotación en el plano perpendicular al eje. En la siguiente figura puede observarse que se
escoge como positiva la dirección del ángulo φ de acuerdo con la regla de la mano
derecha.
Figura 1. Regla de la mano derecha para las rotaciones.
Sea a un vector fuera del plano perpendicular al eje de giro. Entonces, con el giro
transforma el vector a en el vector x como se muestra en la figura 2. La transformación
puede representarse como x = Ra . Intentamos expresar la transformación de este vector
en función del vector n y del ángulo φ .
Considerando que el vector x , resultado de la transformación, puede expresarse como la
suma de sus componentes paralela al eje de giro y perpendicular al mismo podemos
escribir:
( ) [ ( )]
x = nT x n + x − nT x n
Ahora bien, en la figura 2, es fácil observar que la componente de x paralela al vector n
es igual a la componente de a en la misma dirección:
(n x )n = (n a)n = n(n a ) = nn a
T
T
T
T
Figura 2. Rotación de un vector en el espacio.
Por otro lado, la componente de x en el plano de giro puede expresarse a su vez como la
suma de sus componentes paralela a la proyección de a sobre el mismo plano y
perpendicular a esta última. Estas componentes se expresan fácilmente con ayuda del
ángulo de giro φ , como se deduce de la figura 3:
[x − (n x)n] = [a − (n a)n]cos(φ ) + {[n ×][a − (n a)n]}sen(φ )
T
T
T
es decir:
[x − (n x)n] = [a − (n a)n]cos(φ ) + [n ×]asen(φ )
T
T
en donde se ha hecho uso de la propiedad [n ×]n = 0 , válida para cualquier vector.
Figura 3. Proyección de la rotación en el plano de giro.
Finalmente, sustituyendo estos resultados para las componentes paralela y perpendicular
al eje de giro, el vector x puede escribirse como:
( ) [ ( )]
x = n Ta n + a − n Ta n cos(φ ) + [n ×]asen(φ )
Reacomodando factores para poder factorizar a la derecha el vector a podemos escribir:
[
{
]
}
x = nn T + U − nn T cos(φ ) + [n ×]sen(φ ) a
en donde U es la matriz identidad. Comparando esta expresión con x = Ra
encontramos:
[
]
R = nn T + U − nn T cos(φ ) + [n ×]sen (φ ) = R φn
R φn = nn T + [n ×][Usen (φ ) − [n ×]cos(φ )]
La cual es conocida como la forma de Gibbs de la matriz de rotación. Evidentemente,
esta forma relaciona las componentes de la matriz con el ángulo y con el eje de la
rotación. En lo sucesivo, cuando nos refiramos a una matriz de rotación mediante su
forma de Gibbs, agregaremos como índice el ángulo de rotación y como superíndice el
eje de la rotación.
∂R φn
n
= R φ = [n ×][U cos(φ ) + [n ×]sen (φ )]
∂φ
Transformación de Coordenadas y de Componentes.
Las transformaciones de componentes entre dos sistemas de referencia pueden realizarse
con ayuda de las matrices de rotación. En efecto, supongamos dos sistemas de referencia
con el mismo origen, definidos por dos ternas ortonormales derechas de vectores
unitarios (i′,j′,k ′) e (i,j,k ) y supongamos dada la matriz de rotación R que hace girar
los vectores del primer sistema en los del segundo. Es decir, se tienen las siguientes
igualdades:
i = Ri′, j = Rj′, k = Rk ′
Los vectores del segundo sistema pueden escribirse en componentes del primer sistema
como:
i = c11i′ + c12 j′ + c13k ′
j = c21i′ + c22 j′ + c23k ′
k = c31i′ + c32 j′ + c33k ′
sustituyendo la primera de las ecuaciones anteriores en la primera de éstas e
introduciendo las componentes de las matrices podemos ver que:
Ri′ = c11i′ + c12 j′ + c13k ′
r11
r
21
r31
r12
r22
r32
r13 1 c11
r23 0 = c12
r33 0 c13
Es fácil concluir que estas ecuaciones implican que:
c11 c21 c31
R = c12 c22 c32
c13 c33 c33
Así, vemos que la matriz de rotación que hace girar al primer sistema sobre el segundo,
está constituida en columnas por las componentes, en el primer sistema, de los vectores
unitarios del segundo sistema y, en ocasiones, escribiremos:
R = [c1 , c 2 , c3 ]
en donde los vectores c i son tres vectores unitarios ortogonales. Ahora bien, puesto que
los vectores son unitarios, el producto escalar i′T i es el coseno del ángulo que forman los
vectores i′ e i . Calculando todos los productos escalares posibles entre los seis vectores
unitarios tenemos:
i ′T i = c11i′T i ′ + c12 i ′T j′ + c13i ′T k ′ = c11
i ′T j = c21i ′T i′ + c22 i′T j′ + c23i ′T k ′ = c21
i ′T k = c31i′T i′ + c32 i ′T j′ + c33i′T k ′ = c31
j′T i = c11 j′T i′ + c12 j′T j′ + c13 j′T k ′ = c12
j′T j = c21 j′T i ′ + c22 j′T j′ + c23 j′T k ′ = c22
j′T k = c31 j′T i ′ + c32 j′T j′ + c33 j′T k ′ = c32
k ′T i = c11k ′T i′ + c12 k ′T j′ + c13k ′T k ′ = c13
k ′T j = c21k ′T i′ + c22 k ′T j′ + c23k ′T k ′ = c23
k ′T k = c31k ′T i′ + c32 k ′T j′ + c33k ′T k ′ = c33
Por esta razón, la matriz de rotación entre los dos sistemas se denomina también matriz
de cosenos directores.
Por otro lado, supongamos dado un vector cualquiera a′ en componentes del primer
sistema:
a′ = a1′i′ + a2′ j′ + a3′k ′
las componentes de este vector en el segundo sistema pueden encontrarse mediante sus
proyecciones sobre los vectores unitarios (i,j,k ) :
a1 = a′T i = a1′i′T i + a2′ j′T i + a3′k ′T i
a2 = a′T j = a1′i′T j + a2′ j′T j + a3′ k ′T j
a3 = a′T k = a1′i′T k + a2′ j′T k + a3′k ′T k
utilizando los cosenos directores es fácil comprobar que estas ecuaciones pueden
escribirse como:
a1 = a1′c11 + a2′ c12 + a3′ c13
a2 = a1′c21 + a2′ c22 + a3′ c23
a3 = a1′c31 + a2′ c32 + a3′ c33
o bien, en notación matricial:
a1 c11 c12
a = c
c
2 21 22
a3 c31 c32
c13 a1′
c23 a2′
c33 a3′
es decir:
a = R T a′
La transpuesta de la matriz de rotación, que transforma los vectores unitarios del primer
sistema en vectores unitarios del segundo sistema, transforma las componentes de un
vector en el primer sistema, en componentes del mismo vector en el segundo sistema. La
transformación opuesta es inmediata:
a′ = Ra
Es muy importante interpretar correctamente la diferencia entre estas ecuaciones y la
expresión correspondiente para los vectores unitarios. En esta última, se trata de dos
vectores diferentes relacionados, en un mismo sistema, mediante una transformación
lineal. Mientras que en las ecuaciones finales se trata de la relación entre componentes de
un mismo vector en dos sistemas de referencia.
Finalmente, las componentes de un vector se pueden interpretar como las coordenadas de
un punto en el espacio, con respecto a un sistema de referencia. Por lo tanto, la ecuación
deducida se interpreta como la transformación de coordenadas de un punto entre dos
sistemas de referencia.
Transformaciones por los Ángulos de Euler
La transformación de componentes de un vector en el plano es un problema geométrico
muy simple, como lo muestra la siguiente figura.
a x = a x′ cos(α ) + a y′ sen (α )
a y = −a x′ sen (α ) + a y′ cos(α )
Transformación de componentes de un vector en el plano.
La relación entre los sistemas de referencia x′ − y ′ y x − y es una rotación de un ángulo
α alrededor de un eje z perpendicular al plano de la figura. De acuerdo con los
resultados obtenidos anteriormente, la forma de Gibbs de la matriz de rotación que
transforma el sistema x′ − y ′ en el sistema x − y es:
R αk ′ = k ′k ′T + (U − k ′k ′T )cos(α ) + [k ′ ×]sen (α )
es decir:
cos(
R ✁ = sen (
0
k′
)
)
− sen (
cos(
0
)
)
0
0
1
Así, la transformación de las componentes del vector a del sistema x′ − y ′ al sistema
x − y , puede representarse por la ecuación:
a x− y
cos(α ) sen (α ) 0 a x ′
= R α a x ′− y ′ = − sen (α ) cos(α ) 0 a y ′
0
0
1 0
k ′T
Este caso sencillo puede utilizarse para la transformación de componentes en tres
dimensiones. Para ello, estableceremos primero las matrices de rotación correspondientes
a rotaciones alrededor de los ejes Y y X :
[
]
[
]
R ✄j′ = j′j′T + U − j′j′T cos(✂ ) + [j′ ×]sen (✂ )
R i✄′ = i′i′T + U − i′i′T cos(✂ ) + [i′ ×]sen (✂ )
es decir:
cos(α ) 0 sen (α )
Rα = 0
1
0
− sen (α ) 0 cos(α )
j′
0
0
1
R α = 0 cos(α ) − sen (α )
0 sen (α ) cos(α )
i′
Ahora bien, el lector podrá convencerse fácilmente de que con tres rotaciones sucesivas,
una alrededor de cada uno de los ejes, siempre puede pasarse de un sistema
tridimensional a otro, cualquiera que sea la posición de este último (ver figura).
Transformación mediante tres rotaciones sucesivas.
La posición relativa de un sistema con respecto a otro, denominada actitud, puede
definirse mediante tres rotaciones sucesivas. Es decir, suponiendo inicialmente que los
ejes de ambos sistemas son paralelos, se realizan dichas rotaciones hasta encontrar la
actitud del segundo sistema. Los ángulos de rotación (todos positivos según la regla de la
mano derecha) se conocen con el nombre de ángulos de Euler. Se ha convenido en que
el orden de rotación es el siguiente (ver figura):
1) Partiendo de los ejes tierra, se hace girar el eje Z ′ un ángulo ψ (guiñada).
2) En su nueva posición, se hace girar el eje Y A un ángulo θ (cabeceo).
3) En su nueva posición se hace girar el eje X un ángulo φ (alabeo).
Definición de los Ángulos de Euler.
Debe observarse que la definición de los ángulos de Euler está implícita en el orden de
rotación. En efecto, si primero se efectuara el cabeceo, el ángulo de guiñada necesario
para alcanzar la posición deseada sería diferente al ángulo ψ definido anteriormente.
Con base en estas definiciones, es fácil verificar que un vector, cuyas componentes en el
primer sistema son a′ , tiene las siguientes componentes en el segundo sistema:
a = R φiT R ✁j AT R k ′T a′
Para obtener la relación inversa se debe premultiplicar por las inversas correspondientes
en el orden adecuado:
a′ = R k ′R ✁j A Rφi a
con respecto a la matriz de cosenos directores podemos escribir la siguiente identidad:
R = R k ′R ✁j A R φi
Ejemplo: En un instante dado la actitud de una aeronave con respecto a los ejes tierra es de –3° de guiñada,
3° de cabeceo y 30° de alabeo. La masa de la aeronave es de 7000 kg. Calcule las componentes del peso en
los ejes cuerpo. Si la aeronave acelera a 7 m/s^2, calcule las componentes de la aceleración en ejes tierra.
Solución:
Designemos por
p′ el vector peso del avión. Luego, en los ejes tierra dicho vector tiene componentes:
0 0
p′ = 0 = 0
mg 68670
En donde g es la magnitud de la aceleración de la gravedad. De acuerdo con la fórmula de transformación,
las componentes del peso en los ejes cuerpo son:
− 68670sen (3°) − 3593.9101
p = 68670 cos(3°)sen (30°) = 34287.9451
68670 cos(3°)cos(30°) 59388.4630
El vector aceleración se conoce en ejes cuerpo:
7
a = 0
0
Las componentes en ejes tierra son:
6.9808
a = − 0.3659
− 0.3663
Sistemas de Referencia en Movimiento.
Supongamos que, en un caso dado, tenemos un sistema de referencia fijo y otro que esta
girando con una cierta velocidad angular ′ . Además, tenemos una serie de vectores que
también pueden variar con el tiempo. Primeramente, es obvio que la matriz de rotación
R , entre estos sistemas, varía con el tiempo. Entonces, con el objeto de conocer las
componentes de los vectores con respecto a este sistema de referencia, debemos
establecer una ecuación para conocer la matriz de rotación en cada instante del tiempo.
Esto puede lograrse fácilmente, en cada instante del tiempo, mediante la forma de Gibbs
para una rotación alrededor de un eje paralelo a la velocidad angular ′ y con un ángulo
dado por φ = ′ ∆t . En efecto, supongamos que se conocen las componentes de tres
vectores unitarios paralelos a los ejes del sistema en rotación. Sean estos c1 ,c 2 y c 3
paralelos a X , Y y Z respectivamente. Ahora bien, pasado un tiempo ∆t , la nueva
posición de los vectores c1 ,c 2 y c 3 se encuentra multiplicando cada uno por la forma de
Gibbs para la rotación mencionada. Los vectores c1 ,c 2 y c 3 son, evidentemente, las
columnas de la matriz de rotación en el instante t , es decir, R (t ) . El vector unitario en la
dirección del eje de rotación puede escribirse:
′
′
n′ =
y la forma de Gibbs para la rotación durante un intervalo de tiempo ∆t será:
[
]
R φn′ = n′n′T + U − n′n′T cos(φ ) + [n′ ×]sen (φ )
Ahora bien, la nueva posición de los vectores c1 , c 2 y c 3 después del intervalo ∆t puede
calcularse como:
R (t + ∆t ) = R φn′R (t )
En esta forma puede calcularse la posición del sistema en rotación en cada instante del
tiempo.
[[[[[[El problema inverso, es decir, encontrar la velocidad angular dadas dos posiciones
sucesivas del cuerpo se resuelve con el desviador de la forma de Gibbs:
R φn′ − R φn′T
2
= [n′ ×]sen (φ )
la parte esférica de la forma de Gibbs nos da:
R φn′ + R φn′
= n′n′T + U − n′n′T cos(φ ) ]]]]]]
2
T
[
]
Por otro lado, si los vectores considerados varían con el tiempo, el conocimiento de la
razón de cambio de las componentes en el sistema en rotación no será suficiente para
conocer la razón de cambio de las componentes en el sistema fijo. Será necesario,
además, conocer la derivada de la matriz de rotación con respecto al tiempo. En efecto,
supongamos que el vector A depende del tiempo. En un instante dado, las componentes
de este vector en el sistema fijo vienen dadas por:
A′(t ) = R (t )A (t )
la razón de cambio con respecto al tiempo viene dada por:
dA ′
dA dR
=R
+
A
dt
dt
dt
como vemos, no basta con conocer la cantidad
dA
sino que es necesario conocer
dt
también la derivada de la matriz de rotación.
Para calcular esta derivada, restemos la matriz de rotación R (t ) a ambos lados de la
igualdad que nos permite calcular la matriz después del intervalo ∆t :
R (t + ∆t ) − R (t ) = Rφn′R (t ) − R (t )
dividiendo entre ∆t y tomando el límite cuando esta cantidad tiene a cero, obtenemos:
(
R φn′ − U )
R (t + ∆t ) − R (t ) dR
lim
=
= lim
R (t )
∆t → 0
dt ∆t →0 ∆t
∆t
substituyendo del lado derecho la expresión de la forma de Gibbs y la del ángulo φ :
[cos( ′ ∆t ) − 1] + [n′ ×] lim sen ( ′ ∆t )R
dR
= U − n′n′T lim
∆t → 0
∆t →0
∆t
∆t
dt
[
]
los límites dentro del paréntesis son conocidos y son respectivamente cero y
que sustituyendo el valor de n′ obtenemos:
dR
=
dt
′ por lo
′
′ ×R = [ ′ ×]R
′
Finalmente, considerando las componentes de la velocidad angular en el sistema en
movimiento, la derivada de la matriz de rotación es:
dR
= [R ×]R
dt
En consecuencia, la derivada del vector A en el sistema fijo viene dada por:
dA ′
dA
=R
+ [R ×]RA
dt
dt
en otras palabras, la razón de cambio del vector A en el sistema en rotación está
′
dA
dA
y la variación
compuesta por dos vectores: la taza de cambio intrínseca
=R
dt
dt
aparente [ ′ ×]A′ = [R ×]RA debida únicamente al movimiento de los ejes.
En el caso en que las rotaciones se parametrizan mediante los ángulos de Euler, se deberá
considerar una expresión que nos permita calcular las derivadas de estos parámetros
escalares. La relación existente entre las componentes del vector velocidad angular de los
ejes cuerpo y las derivadas con respecto al tiempo de los ángulos de Euler no es trivial.
En efecto, en términos vectoriales podemos descomponer la velocidad angular en tres
componentes del tipo:
=
d
d
d
+
+
dt dt dt
en donde todos los vectores están en componentes de ejes cuerpo. Los vectores velocidad
d d d
, ,
considerados en esta ecuación tienen direcciones muy particulares
angular
dt dt dt
debidas a la definición de los ángulos de Euler. Observando la figura siguiente
d
tiene las siguientes componentes en los ejes tierra:
concluimos que el vector
dt
′
d d
(0i′ + 0 j′ + k ′)
=
dt
dt
Derivadas con respecto al tiempo de los Ángulos de Euler.
dψ
representa la variación temporal del ángulo de Euler ψ . Transformando a
dt
los ejes cuerpo se obtiene:
En donde
d
dψ
=
(− sen(θ )i + sen(φ ) cos(θ )j + cos(φ ) cos(θ )k )
dt
dt
Por otro lado, el vector
d
tiene las siguientes componentes:
dt
dθ
d
(0i A + j A + 0k A )
=
dt A dt
en unos ejes auxiliares i A , j A , k A que se diferencian de los ejes cuerpo solamente por una
rotación de un ángulo φ alrededor del eje X . En consecuencia, las componentes de este
vector en ejes cuerpo pueden escribirse como:
d
d
= R φi AT
dt
dt A
d
dθ
(0i + cos(φ )j − sen (φ )k )
=
dt dt
Finalmente, el vector
d
tiene las siguientes componentes en ejes cuerpo:
dt
d
dφ
=
(i + 0 j + 0k )
dt dt
Sumando los tres vectgores obtenemos para el vector
los ángulos de Euler:
, en ejes cuerpo y en función de
0
− sen (θ ) dφ / dt
1
= 0 cos(φ ) sen (φ )cos(θ ) dθ / dt
0 − sen (φ ) cos(φ )cos(θ ) dψ / dt
la relación inversa se calcula de manera sencilla como:
dφ / dt 1 sen (φ ) tan (θ ) cos(φ ) tan (θ )
dθ / dt = 0
cos(φ )
− sen (φ )
dψ / dt 0 sen (φ )sec(θ ) cos(φ )sec(θ )
la cual, con el fin de simplificar la notación, puede escribirse como:
e=T
siendo las matrices e y T las correspondientes de la ecuación anterior.
Ejemplo: Considere la misma aeronave del ejemplo 2. Si la aeronave tiene una velocidad angular dada por
T
= {0.2,0.1,0.3} s −1 en ejes cuerpo en ese mismo instante, calcule la actitud de la aeronave 0.3
segundos después.
Solución: Las derivadas de los ángulos de Euler pueden calcularse mediante la fórmula (38):
dφ / dt 1 sen (30) tan (3) cos(30) tan (3) 0.2 0.2162
rad
− sen (30) 0.1 = − 0.0634
cos(30)
dθ / dt = 0
dψ / dt 0 sen (30)sec(3) cos(30)sec(3) 0.3 0.3102 seg
Suponiendo que la velocidad angular se mantiene constante durante el pequeño intervalo de tiempo de 0.3
segundos, la nueva actitud de la aeronave puede aproximarse de la siguiente forma:
(180)(0.2162 )(0.3) = 33.7162°
180∆t dφ
= 30 +
π
π dt
(180)(− 0.0634 )(0.3) = 1.9102°
180∆t dθ
θ 0.3 = θ +
= 3+
π dt
π
(180)(0.3102 )(0.3) = 2.3319°
180∆t dψ
ψ 0.3 = ψ +
= −3 +
π dt
π
φ0.3 = φ +
Relaciones entre Sistemas de Referencia
Ejes Cuerpo – Ejes Tierra.
Como se mencionó anteriormente, las ecuaciones de movimiento que se obtienen del
principio de mínima acción están escritas en un sistema de referencia inercial, ahora bien,
ninguno de los tres sistemas definidos para nuestro análisis es inercial: en efecto, los ejes
viento y cuerpo, al estar ligados a la aeronave giran y sufren aceleraciones con el
desplazamiento de la misma; mientras que los ejes tierra, evidentemente, giran con la
rotación y traslación de la tierra. Sin embargo, el sistema de ejes tierra puede considerarse
como un sistema de referencia inercial mediante dos hipótesis básicas que son
normalmente satisfechas durante el análisis de los vehículos más comunes. En primer
lugar, es evidente que la masa del planeta es, en todos los casos, mucho mayor que la
masa de la aeronave. Ello hace que las fuerzas inerciales debidas a la rotación de la tierra
sean despreciables. Este no sería el caso si se considerara, por ejemplo, el movimiento de
una gran masa de aire; es bien sabido que la existencia y el comportamiento de los
huracanes están íntimamente ligados a dichas fuerzas inerciales. En segundo lugar, el
movimiento de la tierra es mucho más lento que el movimiento de la aeronave. En
consecuencia, en la mayoría de los análisis, puede considerarse a la tierra como
esencialmente fija durante el movimiento de la aeronave.
El sistema de ejes tierra, tal y como quedó definido anteriormente, puede considerarse
como un sistema de referencia inercial y por lo tanto podrán establecerse ecuaciones de
movimiento para el vehículo en este sistema. Sin embargo, como se verá más adelante,
dichas ecuaciones contienen una integral sobre una región del espacio que está en
movimiento y resultan difíciles de manejar desde un punto de vista matemático. Cuando
las ecuaciones de traslación y rotación se escriben en un sistema de coordenadas unido al
propio cuerpo en movimiento, se transforman en ecuaciones diferenciales ordinarias las
cuales son mucho más simples de analizar. De aquí surge la necesidad de establecer la
relación que existe entre ambos sistemas de referencia.
En un instante fijo del tiempo, basta con conocer la posición relativa de los orígenes de
ambos sistemas y la actitud de uno con respecto al otro, para transformar cualquier
cantidad física. Así, la traslación es simplemente una suma vectorial del tipo (ver figura):
′ + rPCG
′
r ′ = rCG
Vectores Posición en Ejes Tierra y Cuerpo.
′ es la posición del centro de gravedad del cuerpo con respecto a los ejes
En donde rCG
tierra. En cuanto a la rotación, si se suponen conocidos los cosenos directores cij de los
ejes cuerpo con respecto a los ejes tierra, la transformación es:
′
rPCG = R T rPCG
Por lo que la relación completa para vectores posición es:
′ + RrPCG
r′ = rCG
Cuando se conocen otros parámetros de la rotación, como los ángulos de Euler o la forma
de Gibbs, se utilizan las expresiones correspondientes.
Finalmente, se debe mencionar que los vectores físicos tales como las velocidades,
aceleraciones y fuerzas, no se ven afectados por la traslación.
Ejes Cuerpo – Ejes Viento.
La línea sobre la cual se mueve el cuerpo en un instante dado está definida por el vector
velocidad del centro de gravedad. Esta línea se denomina viento relativo y puede
definirse, con respecto a los ejes cuerpo, mediante dos ángulos:
El ángulo de ataque α , definido como el ángulo que forma el eje X del cuerpo con la
proyección del viento relativo sobre el plano X − Z del mismo.
El ángulo de derrape β , definido como el ángulo que forma el viento relativo con el eje
X V del viento (ver figura 8).
Figura Definición de los Ángulos de Ataque y de Derrape.
Ambos ángulos son positivos en los sentidos que se marcan en la figura 8. Es necesario
mencionar que el viento relativo definido aquí no considera movimiento relativo entre el
fluido circundante y los ejes tierra. En caso de que este movimiento exista, debe
considerarse un viento efectivo para el cálculo de los efectos aerodinámicos sobre el
vehículo. A partir de estas definiciones y de la definición de los ejes viento y cuerpo, es
fácil obtener la siguiente fórmula de transformación entre ambos sistemas de referencia:
jT
aV = R180
° −α a
El lector observará que en estas fórmulas no interviene el ángulo de derrape. Esto es
debido a la definición misma de los ejes viento, los cuales pueden considerarse como un
caso especial de ejes cuerpo. Sin embargo, durante el cálculo de los efectos
aerodinámicos, este ángulo tendrá una importancia capital. En efecto, como puede verse
en la figura 8, la velocidad del centro de gravedad puede expresarse en ejes viento en
forma muy simple:
VCGV = VCG [− cos(β )i V + sen (β )jV ]
En donde VCG es la magnitud de la velocidad, β es el ángulo de derrape definido en la
figura 8 e i V y jV son los vectores unitarios de los ejes viento. Utilizando la fórmula
obtenemos la expresión de la velocidad en ejes cuerpo:
VCG = VCG [cos(α )cos(β )i + sen (β )j + sen (α )cos(β )k ]
La importancia de las fórmulas anteriores puede apreciarse considerándolas en sentido
inverso. Es decir, si denotamos por U ,V ,W y UV ,VV ,WV las componentes del viento
relativo en ejes cuerpo y ejes viento respectivamente, entonces, el ángulo de ataque y el
ángulo de derrape pueden calcularse mediante:
tan (α ) =
W
U
tan (β ) = −
VV
UV
Ejes Tierra – Ejes Viento.
La dirección instantánea en la que se está moviendo el cuerpo con respecto a los ejes
tierra, es decir, la dirección del vector velocidad del centro de gravedad, puede definirse
con la ayuda de dos ángulos:
El rumbo relativo λ es el ángulo que forma la proyección del vector velocidad en el
plano del horizonte, con el eje X ′ de tierra.
El ángulo de ascenso γ es el ángulo que forma el vector velocidad con su proyección en
el plano del horizonte (ver figura 9).
Figura Definición del Rumbo Relativo y del Ángulo de Ascenso.
Ambos ángulos son positivos en los sentidos que se muestran en la figura 7 Utilizaremos
aquí el término “rumbo relativo” para distinguir el ángulo λ del “rumbo verdadero”
utilizado durante la navegación y el cual hace referencia al norte magnético verdadero del
planeta tierra. De la figura 9 podemos deducir fácilmente la siguiente fórmula para las
componentes del vector velocidad en los ejes tierra:
′ = VCG (cos(γ )cos(λ )i ′ + cos(γ )sen (λ )j′ − sen (γ )k ′)
VCG
Ahora bien, denotando las componentes de la velocidad en ejes tierra como U ′, V ′ y W ′ ,
los ángulos cartográficos estarán dados por las expresiones:
tan(λ ) =
V′
U′
tan(γ ) = −
W′
U ′2 + V ′2
Por otro lado, una transformación directa entre los ejes tierra y los ejes viento no es
posible debido a la definición de estos últimos: el plano X V − ZV coincide con el plano
X − Z del cuerpo, en consecuencia, es necesario conocer la actitud del cuerpo con
respecto a los ejes tierra para realizar dicha transformación. Ahora bien, está actitud
queda definida por los ángulos de Euler, por lo tanto, dadas las componentes de un vector
en los ejes tierra, debemos transformarlas a los ejes cuerpo y, posteriormente,
transformarlas a los ejes viento, es decir:
a = R φi T R θjT Rψk T a′
jT
aV = R180
° −α a
o bien:
jT
iT
jT
kT
′
aV = R180
°−α R φ R θ Rψ a
Ejemplo: Una aeronave se encuentra volando con un rumbo relativo de 27° y un ángulo de ascenso de 7°.
En un instante dado, la actitud de la aeronave con respecto a los ejes tierra es de –3° de guiñada, 3° de
cabeceo y 30° de alabeo. La magnitud del viento relativo es 60 m/s. Suponiendo que el viento está en calma
con respecto a los ejes tierra, calcular:
d)
e)
f)
g)
h)
Las componentes del viento relativo en los ejes tierra.
Las componentes del viento relativo en los ejes cuerpo.
El ángulo de ataque.
Las componentes del viento relativo en los ejes viento.
El ángulo de derrape.
Solución: El viento relativo tiene las siguientes componentes en ejes tierra:
cos(7°) cos(27°) 53.0619
′ = 60cos(7°)sen (27°) = 27.0364
VCG
− sen (7°) − 7.3122
Entonces, sus componentes en los ejes cuerpo son:
VCG
51.8862
= 23.4856
− 18.8745
A partir de estas componentes, el ángulo de ataque viene dado por:
W
−1 18.8745
≈ −20°
= tan
− 51.8862
U
α = tan −1
Utilizando los resultados del inciso (b) y la fórmula (), las componentes del viento relativo en los ejes
viento son:
− 55.2125
= 23.4856
0
VCGV
Finalmente, puede calcularse el ángulo de derrape como:
VV
UV
β = tan −1 −
23.4856
= tan −1
≈ 23°
55.2125
Como veremos más adelante, el cálculo de estos ángulos es la base para determinar las fuerzas y momentos
aerodinámicos que actúan sobre la aeronave y, en consecuencia, para predecir la trayectoria de la misma.
Dinámica del Cuerpo Elástico.
Ecuaciones de movimiento para una partícula clásica.
Sea r′ el vector posición de una partícula con respecto a un sistema de referencia
inercial. Entonces, la velocidad de la partícula se define mediante:
V′ =
dr ′
dt
Considerando r′ como las coordenadas generalizadas del sistema y suponiendo que la
partícula se mueve dentro de un campo de fuerzas con el potencial U (r′) el lagrangiano
del sistema viene dado por:
L = 12 m p V′T V′ − U (r′)
en donde m p es la masa de la partícula. La ecuación de Euler-Lagrange puede escribirse:
[
]
∇ r ′ 12 m p V′T V′ − U (r′) −
[
]
d
∇ V ′ 12 m p V′T V′ − U (r′) = 0
dt
− ∇ r ′U (r′) −
d
(m p V′) = 0
dt
d
(m p V′) = −∇r ′U (r′) = F′
dt
En donde F′ es la resultante de las fuerzas derivadas del potencial que actúan sobre la
partícula. Introduciendo el concepto de cantidad de movimiento:
P′ = m p V ′
obtenemos la famosa ecuación de Newton para el movimiento de una partícula:
dP′
= F′
dt
Es decir, las ecuaciones de Euler-Lagrange son equivalentes al principio de conservación
de la cantidad de movimiento de Newton. Sustituyendo sucesivamente las definiciones de
cantidad de movimiento y velocidad obtenemos:
d dr ′
mp
= F′
dt
dt
Esta ecuación es una ecuación diferencial ordinaria de segundo orden y, por lo tanto,
conocidas la masa, la fuerza resultante, una cierta posición inicial y una velocidad inicial
de la partícula, podemos calcular, en cualquier instante ulterior, la posición de la partícula
r′(t ) ; es decir, la ecuación dinámica nos define la trayectoria de la partícula cuando ésta
se encuentra sometida a la fuerza F′ . Debe notarse que la ecuación abarca el caso general
en el cual tanto la masa como la fuerza resultante son funciones del tiempo.
Teorema de Conservación del Momentum Angular.
La ley de conservación de la cantidad de movimiento implica la conservación de otra
cantidad conocida como momento angular. Este último está definido, con respecto al
origen del sistema de referencia, de la manera siguiente:
G′ = [r′ ×]P′
Es importante notar que esta cantidad no es un vector relativo, es decir que sí depende del
origen del sistema de referencia utilizado. El teorema antes mencionado se obtiene
simplemente derivando esta definición:
dG′ dr ′
dP′
=
×P′ + [r′ ×]
dt
dt
dt
dP′
dr′ dr′
+ [r ′ ×]
=
× m p
dt
dt
dt
dP′
= [r′ ×]
dt
En el último paso se utilizó el hecho de que A × A = 0 para cualquier vector. Finalmente,
sustituyendo la ecuación de la cantidad de movimiento, obtenemos:
dG ′
= [r′ ×]F′
dt
o bien, sustituyendo las definiciones:
d
dr ′
[r′ ×]m p
= [r′ ×]F′
dt
dt
La cantidad [r ′ ×]F′ es conocida con el nombre de momento o torque de la fuerza F′
con respecto al origen del sistema de referencia; puede observarse que se trata de una
cantidad aditiva y evidentemente depende del origen del sistema de coordenadas. Así,
vemos que la variación del momentum angular de una partícula, es igual al torque total
aplicado. Como veremos posteriormente, este teorema nos permitirá conocer los
movimientos rotacionales de un cuerpo. Así mismo, el teorema nos permitirá obtener
ciertas restricciones sobre las deformaciones de los cuerpos elásticos.
Ecuaciones de Movimiento para un Sólido Elástico.
Todo cuerpo puede considerarse como constituido por un gran número de partículas. De
hecho, esta es la teoría física que prevalece en nuestros días. Sin embargo, en nuestro
estudio, no entraremos en los detalles necesarios para tratar un cuerpo compuesto de
partículas cuánticas, este nivel de detalle es innecesario para tratar cuerpos
macroscópicos como los vehículos a los que hacemos referencia (incluso en el caso de
que tratemos un micro vehículo autónomo como los que se están diseñando en la
actualidad). Entonces, en el caso de un cuerpo constituido por partículas clásicas, para
determinar la posición del cuerpo, deberíamos determinar las coordenadas de cada una de
las partículas que lo constituyen. Puesto que para cada partícula debemos determinar tres
coordenadas en los ejes inerciales, un cuerpo con N partículas requeriría la determinación
de 3N coordenadas. Se acostumbra decir que el cuerpo posee 3N grados de libertad. Por
lo tanto, deben establecerse N ecuaciones de movimiento similares a la ecuación
dinámica de la partícula, para la determinación de dichas coordenadas. Puesto que el
número de partículas es normalmente muy grande, este método directo resulta
inaplicable. Con el objeto de obtener ecuaciones suficientes para determinar el
movimiento de un cuerpo en el espacio se utiliza una serie de técnicas y aproximaciones
que serán descritas en esta sección.
Todo movimiento de un cuerpo, referido a un sistema de coordenadas, puede dividirse en
tres componentes. Para simplificar, supongamos primeramente que el cuerpo es rígido; es
decir, que la distancia entre dos puntos cualesquiera del cuerpo permanece constante
durante su movimiento. Entonces, podemos distinguir una traslación como un
movimiento durante el cual la posición angular de la línea que une dos puntos
cualesquiera del cuerpo rígido, con respecto al sistema de coordenadas, permanece
invariable. Enseguida, una rotación es un movimiento durante el cual, las coordenadas de
un punto particular del cuerpo permanecen constantes, mientras que la posición angular
de la línea que une este punto con otro punto cualquiera del cuerpo, varía en el tiempo.
Finalmente, se llama deformación a un movimiento durante el cual las distancias entre los
puntos del cuerpo varían (en este caso se habla de un cuerpo deformable). El lector podrá
convencerse fácilmente de que todo movimiento de un cuerpo cualquiera puede
considerarse como la superposición de una traslación, una rotación y una deformación. El
método utilizado para el análisis del movimiento de un cuerpo con un gran número de
partículas puede resumirse en cuatro fases básicas:
Primera Fase: Se hace la hipótesis del medio continuo. Es decir, se considera que
las partículas son mucho más pequeñas que el cuerpo en sí y que su número es tal que
llenan el espacio en forma continua. Mediante esta hipótesis, en lugar de tratar a las
partículas como masas puntuales, puede introducirse la idea de una distribución continua
de masa en el espacio. Una masa elemental de dicha distribución estará gobernada por las
mismas ecuaciones que la masa puntual, sin embargo, en lugar de tratar con un gran
número de ecuaciones, utilizando la continuidad, se podrán tomar integrales sobre la
distribución para determinar las ecuaciones de movimiento del conjunto.
Segunda Fase: Se calculan los movimientos del centro de gravedad. Es decir, se
integra la ecuación del momento lineal sobre todo el cuerpo, dando como resultado 3
ecuaciones traslacionales que permiten calcular las tres coordenadas de un punto
específico del cuerpo con respecto al sistema de referencia inercial. Se selecciona como
punto específico el denominado centro de gravedad el cual será definido más adelante.
Tercera Fase: Se calculan los movimientos rotacionales del cuerpo. Se integra la
ecuación del momento angular sobre todo el cuerpo, dando como resultado 3 ecuaciones
rotacionales que permiten calcular 3 parámetros de actitud del cuerpo con respecto al
sistema de referencia inercial. Como ya hemos visto, tres parámetros son necesarios y
suficientes para definir completamente la actitud de un cuerpo en tres dimensiones.
Cuarta Fase: Se calculan las deformaciones sufridas por el cuerpo. Para ello, se
integran las ecuaciones de los momentos lineal y angular sobre una región arbitraria del
cuerpo y se demuestra que las deformaciones están relacionadas con los esfuerzos
internos. En realidad, la ecuación del momento angular nos da sólo una serie de
restricciones sobre dichos esfuerzos internos. Esta operación da como resultado un
conjunto de ecuaciones en derivadas parciales las cuales permiten calcular las
deformaciones en cada punto del cuerpo. Las condiciones de frontera correspondientes
vienen dadas por las fuerzas aerodinámicas y motrices aplicadas a la piel y la estructura
del vehículo, así como por la fuerza debida a la aceleración de la gravedad.
En lo sucesivo desarrollaremos matemáticamente cada uno de estos puntos. Así,
aceptando la hipótesis del medio continuo, la masa de un elemento de volumen del
cuerpo viene dada por:
dm = ρdV ′
en donde ρ es la densidad local y dV ′ es el volumen elemental en el sistema de
referencia inercial. Además, si dF′ es la resultante de las fuerzas que actúan sobre el
elemento de volumen, entonces, las ecuaciones dinámicas para dichos elementos serán:
d dr ′
ρ
dV ′ = dF′
dt dt
d
dr ′
[r′ ×]ρ
dV ′ = [r′ ×]dF′
dt
dt
Como vemos, todos los vectores están referidos a un sistema de ejes inerciales y por ello
se representan con un apóstrofe. En este punto debemos distinguir entre dos tipos de
fuerzas y momentos: las cargas externas al cuerpo y las fuerzas y momentos ejercidos por
las otras partículas del cuerpo sobre el elemento en cuestión, éstas se denominan fuerzas
y momentos internos. Ahora bien, las fuerzas aplicadas sobre un elemento de volumen en
cierta región del cuerpo no tienen por que ser idénticas a las aplicadas sobre otra región,
por lo tanto, los miembros derechos de las ecuaciones anteriores deberán ser funciones
del espacio. Por otro lado, las fuerzas aplicadas sobre un elemento de volumen se pueden
dividir según si estas se aplican al elemento como un todo o bien si sólo se aplican en las
caras del volumen elemental; las primeras se denominan fuerzas de volumen y las
segundas, fuerzas superficiales. Para las fuerzas de volumen, tanto externas como
internas, introduciremos una función R ′(r ′) , que represente estas fuerzas por unidad de
volumen, así tendremos:
dFe′VOLUMEN = R′e (r′)dV ′
que nos da la fuerza externa aplicada en el punto r′ por unidad de volumen. Para las
fuerzas superficiales, el problema es un poco más complejo. Consideramos igualmente
una fuerza por unidad de área dA′ del elemento de volumen dV ′ , por ejemplo:
dFe′SUPERFICIE = S′e (r′)dA′
Estas fuerzas por unidad de área se denominan genéricamente esfuerzos. Sin embargo, las
fuerzas que actúan sobre un elemento de área pueden descomponerse en fuerzas que
actúan paralelas y perpendiculares a la superficie (ver figura). Las primeras se denominan
esfuerzos cortantes; las segundas, esfuerzos de tensión o tensiones cuando van dirigidas
según la normal exterior de la superficie (en caso contrario se habla de esfuerzos de
compresión o presiones).
Esfuerzos de Tensión
Esfuerzos Cortantes
Esfuerzos cortantes y de tensión sobre una superficie.
Así, sobre cada superficie actúan 3 esfuerzos mutuamente perpendiculares. La fuerza
total por unidad de área puede escribirse en componentes como:
S′e = s′x i′ + s′y j′ + s′z k ′
si la fuerza S′e se aplica sobre una superficie cuyo vector unitario normal es n′ , entonces
las diferentes componentes pueden expresarse de la manera siguiente:
( ) ( ) ( )
s′ = τ ′ (i′ n′) + σ ′ (j′ n′) + τ ′ (k ′ n′)
s′ = τ ′ (i′ n′) + τ ′ (j′ n′) + σ ′ (k ′ n′)
s′x = σ ′xx i′T n′ + τ ′xy j′T n′ + τ ′xz k ′T n′
T
y
yx
z
zx
T
yy
T
T
yz
T
zy
T
zz
En donde los coeficientes son las componentes de S′e en las diferentes direcciones
indicadas. Es decir que estos coeficientes también representan fuerzas por unidad de área
y se denominan esfuerzos. Estos 9 esfuerzos pueden representarse también actuando
sobre tres caras mutuamente perpendiculares de un elemento de volumen dV ,
constituido por un hexaedro.
Figura 4. Esfuerzos sobre un elemento de volumen.
Las expresiones anteriores pueden escribirse como un producto matricial:
S′e = Φ′n′
En donde se ha introducido la matriz o tensor de esfuerzos:
σ ′xx τ ′xy τ ′xz
Φ′ = τ ′yx σ ′yy τ ′yz
τ zx′ τ ′zy σ ′zz
Con las definiciones anteriores las ecuaciones dinámicas de las partículas pueden
escribirse:
d dr ′
ρ
dV ′ = (R′e + R′i )dV ′ + (Φ′e + Φ′i )n′dA′
dt dt
d
dr ′
[r′ ×]ρ
dV ′ = [r′ ×][(R e + R i )dV ′ + (Φ e + Φ i )ndA′]
dt
dt
Integrando estas ecuaciones sobre toda la región del espacio V ′ ocupada por el cuerpo,
obtenemos las ecuaciones traslacionales y rotacionales:
d dr ′
dV ′ = ∫ R ′e dV ′ + ∫ Φ ′e n′dA′
dt
′
V
V′
∂V ′
∫ dt ρ
d
dr ′
′
[
]
r
ρ
×
dV ′ = ∫ [r ′ ×]R e dV ′ + ∫ [r ′ ×](Φ ′e n′)dA′
∫V ′ dt
dt
∂V ′
V′
La suma de las fuerzas y momentos internos se anula por la tercera ley de Newton,
suponiendo que el cuerpo mantiene su integridad física durante su movimiento. Estas
ecuaciones también pueden escribirse introduciendo la resultante de las fuerzas externas
y los momentos de las mismas con respecto al origen del sistema de referencia inercial:
d dr′
dV ′ = Fe′
dt
V′
d
dr ′
∫V ′ dt [r′ ×]ρ dt dV ′ = [re′ ×]Fe′
∫ dt ρ
En donde el vector re′ es la posición con respecto al sistema de referencia inercial en la
cual la resultante de las fuerzas externas produciría el mismo momento; debe notarse que
esta última cantidad puede ser función del tiempo:
[re′ ×] ∫ R e dV ′ + ∫ Φ ′e ndA′ = ∫ [r′ ×]R′e dV ′ + ∫ [r′ ×](Φ ′e n′)dA′
V ′
∂V ′
∂V ′
V′
Por otro lado, integrando las ecuaciones dinámicas sobre una región del espacio Vi′ que
esté dentro del espacio ocupado por el cuerpo y que no toque sus fronteras, obtenemos:
d dr ′
dV ′ = ∫ R ′i dV ′ + ∫ Φ ′i n′dA′
dt
∂Vi′
Vi′
Vi′
∫ dt ρ
d
∫ dt [r′ ×]ρ
Vi′
dr ′
dV ′ = ∫ [r ′ ×]R ′i dV ′ + ∫ [r ′ ×](Φ ′i n′)dA′
dt
∂Vi′
Vi′
en donde hemos eliminado las fuerzas externas puesto que la región sobre la que se
integra es interna al cuerpo (más adelante se justifica esta simplificación). Por otra parte,
utilizando las conocidas identidades de Green y de Stokes:
∫ ΦndA′ = ∫ (∇ Φ ) dV ′
T
∂V ′
T
V′
∫ [r ×](Φn)dA′ = ∫ (∇ ([r ×]Φ )) dV ′
T
∂V ′
T
V′
para transformar las integrales de superficie en integrales de volumen, es fácil comprobar
que las ecuaciones () se pueden escribir como:
T
d dr ′
T
− R ′i − (∇ Φ ′) dVi′ = 0
dt
Vi′
∫ dt ρ
d
∫ dt [r′ ×]ρ
Vi′
T
dr ′
T
− [r ′ ×]R ′i − (∇ ([r ′ ×]Φ ′)) dVi′ = 0
dt
Ahora bien, puesto que el elemento de volumen de la integral a la izquierda es arbitrario,
el integrando de la misma debe anularse en todo punto. En consecuencia obtenemos:
T
d dr ′
T
ρ
− R′i − ∇ Φ′ = 0
dt dt
(
)
T
d
dr ′
T
[r′ ×]ρ
− [r′ ×]R′i − ∇ ([r′ ×]Φ′) = 0
dt
dt
(
)
Este sistema contiene 6 ecuaciones y 12 incógnitas, a saber: tres componentes del vector
de deformación y nueve componentes del tensor de esfuerzos. Las tres primeras
ecuaciones nos permiten calcular las deformaciones sufridas por el cuerpo en cada uno de
sus puntos; es decir, la función r ′(t ) . Las tres ecuaciones siguientes imponen
restricciones sobre los esfuerzos tangenciales permitiendo calcular tres de ellos. Sin
embargo, faltan seis ecuaciones para cerrar el sistema. Esto se logra relacionando los
esfuerzos con las deformaciones a través de la ley de Hook de la elasticidad.
Como puede verse, se trata de ecuaciones en derivadas parciales y, con objeto de darles
solución, deberán asignarse condiciones de frontera apropiadas; lo que equivale a
reintroducir las fuerzas externas.
En resumen, las ecuaciones dinámicas que gobiernan el movimiento de un cuerpo
elástico deformable son:
d dr′
dV ′ = Fe′
dt
V′
∫ dt ρ
d
∫ dt [r′ ×]ρ
V′
dr′
dV ′ = [re′ ×]Fe′
dt
T
d dr ′
T
ρ
− R′i − ∇ Φ′ = 0
dt dt
(
)
Dichas ecuaciones se denominan dinámicas ya que hacen intervenir las fuerzas que
originan los tres tipos de movimiento: traslación, rotación y deformación.
Sistema Dinámico del Vehículo.
Como hemos mencionado, la mecánica es la ciencia que estudia el movimiento de los
cuerpos en el espacio. Ahora bien, este estudio puede dividirse en dos partes bien
diferenciadas: la cinemática y la dinámica. En el primer caso, los movimientos se
estudian sin hacer referencia a las causas que los producen, es decir las fuerzas. En el
caso de la dinámica, las fuerzas juegan un papel preponderante. En las dos secciones
subsiguientes, realizaremos el estudio tanto cinemático como dinámico del movimiento
de un cuerpo elástico de masa variable en tres dimensiones.
Al comparar las ecuaciones de movimiento del cuerpo elástico con la ecuación de
evolución de un sistema dinámico nos encontramos con dos diferencias principales: la
primera consiste en que las ecuaciones de movimiento son de segundo orden, mientras
que la ecuación de evolución es de primer orden; la segunda diferencia consiste en la
aparición de la derivada con respecto al tiempo bajo el signo de integral, en las
ecuaciones de movimiento. Cada una de estas diferencias nos lleva a un tratamiento
específico de las ecuaciones de movimiento con el objeto de transformarlas en una
ecuación de evolución acorde con la teoría de sistemas dinámicos. A continuación
presentamos en forma breve estos dos métodos y en seguida los aplicamos a las
ecuaciones de movimiento del cuerpo elástico.
Está claro que estas ecuaciones son de segundo orden, razón por la cual es necesario dar
dos tipos de condiciones iniciales para su solución completa: la posición, la actitud y la
forma inicial del cuerpo por un lado, y las velocidades correspondientes por el otro.
Cuando hablamos de la estabilidad de sistemas nos referimos a las ecuaciones de
evolución del sistema, como ecuaciones de primer orden. Es fácil transformar un sistema
de segundo orden en uno de primer orden, duplicando simplemente el número de
incógnitas así como el de ecuaciones; haremos esto en la siguiente sección, introduciendo
explícitamente la velocidad del centro de gravedad así como la velocidad de rotación de
una terna ordenada de vectores unitarios asociados al cuerpo.
La complejidad del sistema de ecuaciones de movimiento no aparece explícitamente bajo
la forma en que las hemos escrito. Este hecho se debe a que, en las ecuaciones
traslacionales y rotacionales, hemos dejado explícita la integral sobre el cuerpo. Esto
significa que dicha integral se efectúa sobre una región del espacio que está en
movimiento e, incluso, cambia sus fronteras constantemente debido a las deformaciones.
Bajo estas condiciones, la solución del sistema de ecuaciones de movimiento resulta
sumamente complicada. El método utilizado para atacar este problema consiste en
reescribir las ecuaciones en un nuevo sistema de coordenadas que se mueva junto con el
cuerpo. De esta forma, podremos introducir funciones que sólo cambian con el tiempo y
que no dependen de la posición de las fronteras del volumen de integración, éstas
funciones podrán ser sacadas de la integral obteniendo así un sistema de ecuaciones
diferenciales ordinarias semejante a la ecuación de evolución de un sistema dinámico.
Evidentemente, las componentes de los vectores que aparecen en estas ecuaciones estarán
relacionadas con las componentes del sistema inercial mediante una matriz de rotación
que varía en el tiempo. Como ya mencionamos, los ejes cuerpo no son inerciales y, en
consecuencia, en las ecuaciones de movimiento escritas en este sistema, además del
cambio de componentes, aparecerán ciertos términos denominados inerciales. El objeto
de esta sección es establecer la forma correcta de las ecuaciones en los ejes cuerpo.
Primeramente debe realizarse una traslación del origen del sistema de ejes tierra al origen
de los ejes cuerpo. Este último es, por definición, el centro de gravedad de la aeronave, el
cual a su vez está definido como un punto en el que podría concentrarse toda la masa del
cuerpo obteniéndose un momento de primer orden idéntico al del cuerpo:
′ ∫ ρdV = ∫ ρr′dV
Q = rCG
V
V
es decir:
∫ ρr′dV
′ =V
rCG
∫ ρdV
=
1
ρr′dV
m A V∫
V
en donde mA es la masa total de la aeronave. Es importante aclarar que esta cantidad, por
definición es una constante con respecto al espacio en el que se integra; sin embargo, en
todas las ecuaciones dejaremos abierta la posibilidad de considerarla como una función
del tiempo. Esta posibilidad tiene aplicaciones prácticas importantes en el caso de
vehículos en los que la masa de algún componente varía en forma significativa durante el
lapso de tiempo en el que se analiza la trayectoria (por ejemplo, para un cohete, la masa
del combustible varía considerablemente durante el periodo considerado en un cálculo de
estabilidad). Ahora bien, para poder calcular efectivamente una trayectoria deberá
conocerse exactamente la forma en que varía esta masa y, por ello, deberá introducirse, al
menos, una ecuación más al sistema que se considera:
dm A
= f (m A )
dt
Por otra parte, la posición del centro de gravedad tampoco puede ser función del espacio
en el que se integra; sin embargo, sí es una función pura del tiempo.
Introduciendo el vector posición de una partícula cualquiera con respecto al origen de los
′ , la traslación se escribe simplemente:
ejes cuerpo como rPCG
′ + rPCG
′
r ′ = rCG
Las componentes de los vectores relativos, tales como las fuerzas y las velocidades, no
sufren cambios cuando se realiza una traslación, por esta razón utilizaremos las mismas
literales. Entonces, las ecuaciones de movimiento pueden escribirse como:
dr ′
d dr ′
d
m A CG + ∫ ρ PCG dV ′ = Fe′
dt V ′ dt
dt
dt
d
∫ dt [(r′
CG
′ ) ×]ρ
+ rPCG
V
′ + rPCG
′ )
d (rCG
dV = [re′ ×]Fe′
dt
simplificando la segunda ecuación obtenemos (ver procedimiento 1):
d
dr ′
d
dr ′
′ ×] m A CG + ∫ ρ PCG dV ′ +
[rCG
dt
′ ×]
+ ∫ [rPCG
V′
dt
d
ρ
dt
dt
dt
′
drPCG
dr ′ dρ ′
′ ×]Fe′ + [rPe
′ ×]Fe′
rPCG dV ′ = [rCG
dV ′ − CG × ∫
dt
dt V ′ dt
V′
′ es una constante para la integral
En estas expresiones se ha utilizado el hecho de que rCG
de volumen (pero es una función del tiempo al igual que la masa). Es importante notar
′ que aparecen en las ecuaciones anteriores, siguen
que las componentes del vector rPCG
siendo componentes paralelas al sistema de referencia inercial. De la misma forma, el
volumen que aparece en el límite de las integrales sigue siendo función del tiempo,
debido a las rotaciones y deformaciones del cuerpo. Los nuevos términos en las
ecuaciones de movimiento se deben únicamente a las aceleraciones lineales. Utilizando la
primera ecuación para simplificar la segunda, obtenemos:
dr ′
d dr ′
d
m A CG + ∫ ρ PCG dV ′ = Fe′
dt V ′ dt
dt
dt
∫ [r′
PCG
V′
×]
′
d drPCG
dr′
ρ
dV ′ − CG
dt
dt
dt
dρ ′
′ ×]Fe′
× ∫
rPCG dV ′ = [rPe
V ′ dt
En lo sucesivo, será más conveniente utilizar, en lugar del vector posición, el vector
velocidad del centro de gravedad con respecto a los ejes tierra:
′ =
VCG
′
drCG
dt
Al hacer esto estamos, de hecho, introduciendo tres incógnitas más y, por lo tanto las
ecuaciones de esta definición deben agregarse al sistema para mantenerlo cerrado. Estas
ecuaciones se denominan cinemáticas debido a que en ellas no aparecen las fuerzas. Las
ecuaciones de movimiento son ahora:
dm A
= f (m A )
dt
′
drCG
′
= VCG
dt
d
dr ′
d
′ ) + ∫ ρ PCG dV ′ = Fe′
(m A VCG
dt
dt
dt
V′
∫ [r′
PCG
V′
×]
′
dρ
d drPCG
′ ×]∫
′ dV ′ = [rPe
′ ×]Fe′
rPCG
ρ
dV ′ − [VCG
dt
dt
dt
V′
Hasta este momento, en estas ecuaciones, las componentes de los vectores involucrados
siguen siendo paralelas al sistema de referencia inercial. Sin embargo, los ejes cuerpo
están rotando junto con la aeronave y, por supuesto, las componentes de todos los
vectores serán distintas. Más aun, como sabemos, la derivada temporal de una cantidad
vectorial se expresa en forma diferente para ejes que están en movimiento. Para un
vector, la transformación necesaria es una transformación de componentes durante una
rotación. Por ejemplo, para las fuerzas externas que aparecen del lado derecho de la
ecuación de traslación, debemos utilizar las componentes en el sistema girado Fe :
Fe′ = RFe
Finalmente, al igual que los cambios en la magnitud de un vector, los cambios en la
magnitud de una cantidad escalar son idénticos en un sistema inercial y en un sistema en
rotación. Con base en estas consideraciones es fácil comprobar que las ecuaciones
dinámicas se escriben como (ver procedimiento 2):
d (m A VCG )
d dr
+ m AR T [R ×]RVCG + ∫ ρ PCG dV
dt
dt
dt V
dr
dρ
+ R T [R ×]R ∫
rPCG dV + 2R T [R ×]R ∫ ρ PCG dV = Fe
dt
dt
V
V
∫ [Rr
PCG
V
×]R
d drPCG
dr
dV − 2 ∫ [R ×]R PCG
ρ
dt
dt
dt
V
× RρrPCG dV
dρ
[[R ×]RrPCG ×]RrPCG dV − ∫ R d ×RrPCG ×RρrPCG dV
dt
dt
V
V
dρ
rPCG dV = [Rre ×]RFe
+ ∫ [[[R ×]RrPCG ×]R ×]RρrPCG dV − [RVCG ×]R ∫
dt
V
V
−∫
En estas expresiones se ha tomado en cuenta que tanto la velocidad angular de los ejes
cuerpo
como la matriz de rotación R son constantes para la integral de volumen, aún
cuando varían con el tiempo. Es importante notar que las componentes del vector rPCG
que aparecen en las ecuaciones anteriores son ya paralelas a los ejes en rotación. De
hecho, las componentes de todos los vectores que aparecen en las ecuaciones son
paralelas a estos ejes. En estas ecuaciones se han introducido nuevas variables de fase: las
componentes de la matriz de rotación y, para poder cerrar el sistema, deberá agregarse al
mismo la siguiente ecuación (derivada de la nueva variable de fase):
dR
= [R ×]R
dt
Esta ecuación representa la cinemática de las rotaciones y, al igual que para la anterior
ecuación cinemática, las componentes de la matriz R permanecerán como componentes
en ejes tierra de los vectores unitarios asociados al cuerpo. Ahora bien, para simplificar la
segunda ecuación podemos utilizar una identidad vectorial conocida con el nombre de
triple producto vectorial que, en notación matricial tiene dos versiones equivalentes:
[[A ×]B ×]C = (A T C)B − (BT C)A
[A ×][B ×]C = (CT A )B − (BT A )C
Así, obtenemos (ver procedimiento 3):
∫ [Rr
PCG
×]R
V
+ R∫
V
dr
d drPCG
T dr
T
ρ
dV + 2R ∫ ρ UrPCG PCG − PCG rPCG dV
dt
dt
dt
dt
V
d
dρ
T
T
T
T
(
)
)
dV + R ∫ ρ (UrPCG
dV
UrPCG
rPCG − rPCG rPCG
rPCG − rPCG rPCG
dt
dt
V
T
T
)dV − [RVCG ×]R ∫
rPCG − rPCG rPCG
+ [R ×]R ∫ ρ (UrPCG
V
V
dρ
rPCG dV = [Rre ×]RFe
dt
Introduciendo la definición del tensor de inercia en ejes cuerpo:
Ix
I = I xy
I xz
I xy
Iy
I yz
I xz
T
T
I yz = ∫ ρ UrPCG
rPCG − rPCG rPCG
dV
V
I z
[
]
podemos escribir la ecuación como:
RI
dρ
d
d dr
+ [R ×]RI + ∫ [RrPCG ×]R ρ PCG dV − [RVCG ×]R ∫
rPCG dV
dt
dt
dt
dt
V
V
dρ
T drPCG drPCG T
T
T
(
)dV = [Rre ×]RFe
+ 2R ∫ ρ UrPCG
−
rPCG dV + R ∫
UrPCG
rPCG − rPCG rPCG
dt
dt
dt
V
V
Finalmente, premultiplicamos toda la expresión por la transpuesta de la matriz de
rotación:
I
dρ
d
d dr
rPCG dV
+ R T [R ×]RI + ∫ R T [RrPCG ×]R ρ PCG dV − R T [RVCG ×]R ∫
dt
dt
dt
dt
V
V
dρ
T drPCG drPCG T
T
T
(UrPCG
)dV = R T [Rre ×]RFe
rPCG dV + ∫
rPCG − rPCG rPCG
+ 2 ∫ ρ UrPCG
−
dt
dt
dt
V
V
Ahora, se puede utilizar la siguiente identidad en las dos ecuaciones:
R T [Ra ×]R = [a ×]
Esta identidad se puede demostrar partiendo de la expresión del producto cruz de dos
vectores cualesquiera en dos sistemas de referencia rotados uno con respecto al otro:
[a ×]b = c
[a′ ×]b′ = c′
ahora, si R es la matriz que hace girar el segundo sistema sobre el primero, tenemos
relaciones del tipo a′ = Ra para cada vector. Sustituyendo en la segunda relación
tenemos:
[Ra ×]Rb = Rc
premultiplicando por la transpuesta de la matriz de rotación:
R T [Ra ×]Rb = c
finalmente, sustituyendo la primera relación y haciendo uso de la ley del cociente
tenemos:
R T [Ra ×]Rb = [a ×]b
R T [Ra ×]R = [a ×]
De hecho, la expresión es más comprensible si pre-multiplicamos nuevamente por la
matriz de rotación y multiplicamos a la derecha por su inversa, obtenemos:
[Ra ×] = R[a ×]R T
que no es más que la transformación de componentes de la matriz [a ×] debida a la
rotación del sistema de coordenadas. Regresando a la ecuaciones dinámicas, utilizamos
ahora la notación de Newton para la derivada con respecto al tiempo y rescribimos los
momentos externos como M e , para reagrupar las ecuaciones dinámicas del siguiente
modo:
VCG =
−
m
Fe
[ ×] ρr dV
− [ ×]VCG − A VCG −
PCG
mA
mA
m A V∫
1
2[ ×]
1
ρrPCG dV −
ρrPCG dV −
ρrPCG dV
∫
∫
mA V
mA V
m A V∫
T
T
)dV
rPCG − rPCG rPCG
= I −1M e − I −1 [ ×]I + I −1 [VCG ×]∫ ρrPCG dV − I −1 ∫ ρ (UrPCG
−I
−1
∫ [r
PCG
×]ρrPCG dV − 2I
∫ ρ (Ur
−1
V
V
V
r
T
PCG PCG
−r
r
T
PCG PCG
)dV
− I −1 ∫ [rPCG ×]ρrPCG dV
V
V
Con el fin de analizar los términos de estas ecuaciones, se pueden reagrupar los mismos
de acuerdo con el tipo de fenómeno físico que representan:
Fe
− [ ×]VCG
mA
[ ×] ρr dV
m
− A VCG −
PCG
mA
m A V∫
1
2[ ×]
−
ρrPCG dV −
ρrPCG dV
∫
mA V
m A V∫
1
−
ρrPCG dV
m A V∫
VCG =
CuerpoRígido
Masa
Deformación
Interacción Masa − Deformación
= I −1M e − I −1 [ ×]I
T
T
)dV
rPCG − rPCG rPCG
+ I −1 [VCG ×]∫ ρrPCG dV − I −1 ∫ ρ (UrPCG
CuerpoRígido
Masa
T
T
)dV
rPCG − rPCG rPCG
− I −1 ∫ [rPCG ×]ρrPCG dV − 2I −1 ∫ ρ (UrPCG
V
V
V
Deformación
V
−I
−1
∫ [rPCG ×]ρrPCG dV
V
Interacción
Masa − Deformación
Con el fin de simplificar el análisis dinámico posterior introduciremos la siguiente
nomenclatura para estos términos:
Fm = − m A VCG − [ ×]∫ ρrPCG dV
Masa
V
Fd = − ∫ ρrPCG dV − 2[ ×]∫ ρrPCG dV
V
Deformación
V
Fi = − ∫ ρrPCG dV
V
Interacción Masa − Deformación
T
T
)dV
M m = [VCG ×]∫ ρrPCG dV − ∫ ρ (UrPCG
rPCG − rPCG rPCG
T
T
)dV
M d = − ∫ [rPCG ×]ρrPCG dV − 2 ∫ ρ (UrPCG
rPCG − rPCG rPCG
V
Masa
V
V
Deformación
V
Interacción
M i = − ∫ [rPCG ×]ρrPCG dV
Masa − Deformación
V
Estos términos son fuerzas y momentos generados por cambios internos del vehículo pero
que afectan su trayectoria, por esta razón, en lo sucesivo les llamaremos fuerzas de
configuración. Por último, definiendo la suma de las fuerzas externas con las fuerzas de
configuración como F = Fe + Fm + Fd + Fi y equivalentemente para los momentos
M = M e + M m + M d + M i , las ecuaciones dinámicas pueden escribirse simplemente
como:
V CG =
F
−
mA
[
× ]V CG
= I −1 (M − [ ×]I
)
A estas ecuaciones deben agregarse las ecuaciones cinemáticas y la de flujo de masa de
modo que el sistema dinámico queda como:
′ = RVCG
rCG
F
− [ ×]VCG
VCG =
mA
R = [R ×]R
= I −1 (M − [ ×]I )
dm A
= f (m A )
dt
Cuando, en lugar de la matriz de cosenos directores se desea utilizar los ángulos de Euler,
recurriendo a las expresiones de las secciones precedentes, y utilizando la notación hiper
matricial el sistema dinámico del vehículo se puede escribir de la siguiente manera:
k′ jA
i
′ R ✁ R R φ VCG
rCG
V F − [ ×]V
CG
CG m
A
e =
T
−1
I (M − [ ×]I )
m A
f (m A )
La ventaja de usar esta forma del sistema dinámico es que se tienen solo trece variables
explícitamente. En cambio, con los cosenos directores, se tienen 19 variables explícitas,
las cuales, considerando que la matriz de cosenos directores es una matriz de rotación se
reducen a 13. La desventaja es que se tiene una singularidad en la matriz T en el caso en
que el vehículo alcance una actitud tal que θ = ± π2 . Esta situación es particularmente
molesta cuando se pretende estudiar el comportamiento de los cohetes pues durante la
mayor parte de la trayectoria se tiene tal actitud. En general, para simular el
comportamiento de una aeronave de cualquier tipo, se recomienda trabajar con la primera
forma del sistema dinámico. Al contrario, cuando se estudia la estabilidad de la mayoría
de las aeronaves se recomienda utilizar la segunda forma del sistema dinámico (en el caso
del despegue vertical de cohetes, se acostumbra modificar un poco la definición de los
ángulos de Euler para que la singularidad quede en otra dirección).
En la sección siguiente retomaremos explícitamente los términos que han sido agrupados
dentro de las fuerzas y momentos de configuración, los cuales representan una gran
variedad de fenómenos que ocupan un lugar prominente en el estudio de la dinámica de
los vehículos.
Anexo Procedimiento 1:
Tenemos la ecuación:
d
∫ dt [(r′
CG
′ ) ×]ρ
+ rPCG
V′
′ + rPCG
′ )
d (rCG
dV ′ = [re′ ×]Fe′
dt
Primeramente se distribuyen los productos:
d
dr′
∫ dt [r′ ×]ρ dt
CG
CG
V′
d
dr′
′
′ ×]ρ PCG dV ′
dV + ∫ [rCG
dt
dt
V′
d
dr′
d
dr′
′ ×]ρ CG dV ′ + ∫ [rPCG
′ ×]ρ PCG dV ′ = [re′ ×]Fe′
[rPCG
dt
dt
dt
dt
V′
V′
+∫
se extraen de la primera integral los términos que no dependen de las coordenadas:
d
dr′
d
dr′
′ ×]m A CG + ∫ [rCG
′ ×]ρ PCG dV ′
[rCG
dt
dt V ′ dt
dt
d
dr′
d
dr′
′ ×]ρ CG dV ′ + ∫ [rPCG
′ ×]ρ PCG dV ′ = [re′ ×]Fe′
[rPCG
dt
dt
dt
dt
V′
V′
+∫
se derivan los dos primeros términos y se conmuta el producto del tercero:
′ drCG
′
′
d
drCG
drCG
′
×
+
×
r
m
m
[
]
A
CG
A
dt
dt
dt
dt
dr ′
d
dr ′
dr ′
′ ×]∫ ρ PCG
+ CG × ∫ ρ PCG dV ′ + [rCG
dt
dt
dt
dt V ′
V′
′
d drCG
dt dt
V′
−∫
′
dV
d
dr ′
′ ′
′ ×]ρ PCG dV ′ = [re′ ×]Fe′
× ρrPCG
dV + ∫ [rPCG
dt
dt
V′
el primer término es cero, el segundo y el cuarto se agrupan y se deriva el quinto:
dr ′
d dr ′
m A CG + ∫ ρ PCG dV ′
dt V ′ dt
dt
dt
d
′ ×]
[rCG
dr ′
+ CG
dt
dr ′
d dr ′
× ∫ ρ PCG dV ′ − CG
dt
dt dt
V ′
d
dr ′
′ ×]ρ PCG
[rPCG
dt
dt
V′
+∫
dr ′
′ dV ′ − CG
× ∫ ρrPCG
dt
V ′
d
′ )dV ′
× ∫ (ρrPCG
V ′ dt
′
dV = [re′ ×]Fe′
el tercer término es cero ya que
∫ ρr ′
PCG
dV ′ = 0 y se deriva el cuarto:
V′
d
dr ′
d
dr ′
′ ×] m A CG + ∫ ρ PCG dV ′
[rCG
dt V ′ dt
dt
dt
dr ′
dr ′
dr ′ dρ ′
dr ′
+ CG × ∫ ρ PCG dV ′ − CG × ∫
rPCG dV ′ − CG
dt
dt V ′
dt V ′ dt
dt
dr ′
× ∫ ρ PCG dV ′
dt
V ′
d
dr ′
′ ×]ρ PCG dV ′ = [re′ ×]Fe′ = [rCG
′ ×]Fe′ + [rPe
′ ×]Fe′
[rPCG
dt
dt
V′
+∫
el segundo y cuarto término se cancelan y en el lado derecho se hace la traslación.
Anexo Procedimiento 2:
Se tienen en cuenta las relaciones:
A ′ = RA ;
dA ′
dA
dR
=R
+ [R ×]RA ;
= [R ×]R
dt
dt
dt
En la primera ecuación se transforma la velocidad con la primera relación:
′
drCG
= RVCG
dt
En la segunda ecuación, se transforma la derivada de la velocidad con la segunda relación
y las fuerzas externas con la primera:
R
d dr ′
d (m A VCG )
+ m A [R ×]RVCG + ∫ ρ PCG dV ′ = RFe
dt
dt
dt
V′
con la segunda relación se transforma la derivada más interna del tercer término:
R
d
dr
d (m A VCG )
+ m A [R ×]RVCG + ∫ Rρ PCG + [R ×]RρrPCG dV ′ = RFe
dt
dt
dt
V′
Ahora, todos los vectores y matrices están en ejes cuerpo y por lo tanto el límite de la
integral debe ser el volumen del cuerpo visto en ejes cuerpo. Se separan las integrales:
R
d
d
dr
d (m A VCG )
+ m A [R ×]RVCG + ∫ Rρ PCG dV + ∫ ([R ×]RρrPCG )dV = RFe
dt
dt
dt
dt
V
V
se deriva en los términos tercero y cuarto, extrayendo de las integrales todos los factores
que no dependen del espacio:
R
+
d (m A VCG )
dR
dr
d dr
ρ PCG dV + R ∫ ρ PCG dV
+ m A [R ×]RVCG +
∫
dt
dt V
dt
dt
dt
V
d
d [R ×]R
ρrPCG dV + [R ×]R ∫ (ρrPCG )dV = RFe
∫
dt
dt
V
V
en el tercer término se usa la tercera relación, el quinto término es cero puesto que
contiene al momento de primer orden con respecto al centro de gravedad, el sexto
término se deriva nuevamente:
d (m A VCG )
d dr
+ m A [R ×]RVCG + R ∫ ρ PCG dV
dt
dt
dt
V
dr
dρ
rPCG dV + 2[R ×]R ∫ ρ PCG dV = RFe
+ [R ×]R ∫
dt
dt
V
V
R
Finalmente, se multiplica toda la ecuación, a la izquierda, por la inversa de la matriz de
cosenos directores:
d (m A VCG )
d dr
+ m AR T [R ×]RVCG + ∫ ρ PCG dV
dt
dt
dt
V
dρ
dr
+ R T [R ×]R ∫
rPCG dV + 2R T [R ×]R ∫ ρ PCG dV = Fe
dt
dt
V
V
En la tercera ecuación, transformamos todos los vectores que no están derivados con la
primera relación:
∫ [Rr
PCG
×]
V′
′
dρ
d drPCG
rPCG dV ′ = [Rre ×]RFe
ρ
dV ′ − [RVCG ×]R ∫
dt
dt
dt
′
V
se tiene en cuenta que la derivada de un escalar es igual en todos los sistemas de
referencia. En el primer término se transforma la derivada más interna mediante la
segunda relación y se separan dos integrales:
∫ [Rr
PCG
×]
V′
d
dr
d
Rρ PCG dV ′ + ∫ [RrPCG ×] ([R ×]RρrPCG )dV ′
dt
dt
dt
V′
dρ
rPCG dV ′ = [Rre ×]RFe
dt
V′
− [RVCG ×]R ∫
en el primer término se deriva teniendo en cuenta la tercera relación, el segundo término
se deriva:
d drPCG
dr
ρ
dV ′ + ∫ [RrPCG ×][R ×]R ρ PCG dV ′
dt
dt
dt
V′
V′
d
d [R ×]R
ρrPCG dV ′ + ∫ [RrPCG ×][R ×]R (ρrPCG )dV ′
+ ∫ [RrPCG ×]
dt
dt
V′
V′
∫ [Rr
PCG
×]R
dρ
rPCG dV ′ = [Rre ×]RFe
dt
′
V
− [RVCG ×]R ∫
el tercer y cuarto términos se derivan nuevamente:
∫ [Rr
PCG
V′
×]R
d drPCG
dr
dV ′ + 2 ∫ [RrPCG ×][R ×]R ρ PCG dV ′
ρ
dt
dt
dt
V′
dR
+ ∫ [RrPCG ×]
× RρrPCG dV ′ + ∫ [RrPCG ×][R ×][R ×]RρrPCG dV ′
dt
V′
V′
dρ
dρ
rPCG dV ′ − [RVCG ×]R ∫
rPCG dV ′ = [Rre ×]RFe
+ ∫ [RrPCG ×][R ×]R
dt
dt
V′
V′
se deriva nuevamente el tercer término:
∫ [Rr
PCG
×]R
V′
d drPCG
dr
ρ
dV ′ + 2 ∫ [RrPCG ×][R ×]R ρ PCG dV ′
dt
dt
dt
V′
[ R ×]R ×]RρrPCG dV ′ + ∫ [RrPCG ×]R d ×RρrPCG dV ′
+ ∫ [RrPCG ×][
dt
V′
V′
+ ∫ [RrPCG ×][R ×][R ×]RρrPCG dV ′
V′
dρ
[RrPCG ×][R ×]RrPCG dV ′ − [RVCG ×]R ∫ dρ rPCG dV ′ = [Rre ×]RFe
dt
dt
V′
V′
+∫
El tercer término es cero puesto que [R ×]R = 0 :
∫ [Rr
PCG
×]R
V′
d drPCG
dr
dV ′ + 2 ∫ [RrPCG ×][R ×]R ρ PCG dV ′
ρ
dt
dt
dt
V′
d
+ ∫ [RrPCG ×]R
dt
V′
dρ
[RrPCG ×][R
+∫
dt
V′
× RρrPCG dV ′ + ∫ [RrPCG ×][R ×][R ×]RρrPCG dV ′
V′
dρ
rPCG dV ′ = [Rre ×]RFe
×]RrPCG dV ′ − [RVCG ×]R ∫
dt
V′
Finalmente, se observa que todos los vectores son en componentes de ejes cuerpo y, por
lo tanto, se modifica el límite de todas las integrales; al mismo tiempo, se conmutan los
productos vectoriales en los términos segundo, tercero, cuarto y quinto, dos veces en el
cuarto:
∫ [Rr
PCG
V
×]R
d drPCG
dr
dV − 2 ∫ [R ×]R PCG
ρ
dt
dt
dt
V
× RρrPCG dV
d
− ∫ R
× RrPCG × RρrPCG dV + ∫ [[[R ×]RrPCG ×]R ×]RρrPCG dV
dt
V
V
dρ
[[R ×]RrPCG ×]RrPCG dV − [RVCG ×]R ∫ dρ rPCG dV = [Rre ×]RFe
−∫
dt
dt
V
V
este último paso se realiza con vistas a la aplicación del triple producto vectorial en el
siguiente procedimiento.
Anexo Procedimiento 3:
Todos los términos pueden convertirse en forma similar. Tomemos como ejemplo el
segundo término. Con la primera forma de la identidad se substituye como:
A=R ;
B=R
d rPCG
;
dt
C = R ρ rPCG
obteniendo:
drPCG
[R ×]R dt
(
×RρrPCG = (R
) RρrPCG )
T
T
drPCG drPCG
R
RρrPCG R
− R
dt
dt
tomando en cuenta que (AB ) = BT AT y que aT b = bT a y reacomodando los escalares
obtenemos:
T
drPCG
[R ×]R dt
(
dr
T
×RρrPCG = Rρ PCG rPCG
dt
) − Rρ r
PCG
T
drPCG
dt
finalmente, factorizando:
drPCG
[R ×]R dt
T drPCG drPCG T
rPCG
−
×RρrPCG = − Rρ UrPCG
dt
dt
Fuerzas y Momentos.
Con el objeto de resolver las ecuaciones de movimiento de la aeronave debe darse una
expresión explícita de las fuerzas y momentos que actúan sobre la misma. Ahora bien,
estas fuerzas y momentos dependen a su vez de las condiciones de vuelo de la aeronave.
Es decir, en las expresiones correspondientes aparecen también las variables de estado
del sistema (la velocidad del centro de gravedad y la velocidad angular de los ejes
cuerpo). A fin de facilitar la escritura de las expresiones, dividiremos las fuerzas externas
de acuerdo con las causas que las producen, es decir: gravitacionales, motrices,
aerostáticas y aerodinámicas, denominándolas por Fg , FT , FAs y FA de tal modo que las
fuerzas externas se escriben como:
Fe = Fg + FT + FAs + FA
Igualmente, en este apartado trataremos algunos casos de fuerzas de configuración que
afectan el movimiento del vehículo. Por lo tanto, las fuerzas (y los momentos) que
aparecen en las ecuaciones de movimiento pueden desglosarse de la siguiente forma:
F = Fg + FT + FAs + FA + Fm + Fd + Fi
A continuación discutiremos la dependencia de las variables de estado para cada uno de
estos siete términos. En el caso de las fuerzas gravitacionales esta dependencia se debe a
la orientación de los ejes cuerpo con respecto a los ejes tierra. Las fuerzas motrices
generalmente son conocidas, a partir del diseño, directamente en los ejes cuerpo. Las
fuerzas aerostáticas actúan siempre en dirección contraria a la gravedad y por ello su
dependencia es similar a la de las fuerzas gravitacionales. En el caso de las fuerzas
aerodinámicas la dependencia se debe a: el viento relativo, la configuración geométrica
de la aeronave y la orientación de los ejes cuerpo. Finalmente, en el caso de las fuerzas
inerciales, se da un fenómeno un poco diferente, las partes móviles del vehículo, al igual
que los cambios de masa, dan lugar a nuevas variables de estado que deben agregarse al
sistema dinámico completo junto con nuevas ecuaciones que gobiernan el
comportamiento de esas variables. En las secciones siguientes analizaremos cada una de
estas siete fuerzas y los momentos que ellas producen con respecto al centro de gravedad
de la aeronave.
Fuerzas Gravitacionales.
Como es bien sabido, las fuerzas gravitacionales dependen de la masa del objeto y se
encuentran dirigidas hacia el centro de la tierra. Por la definición misma de los ejes tierra,
el vector correspondiente a dichas fuerzas puede escribirse de la siguiente forma:
Fg′ = m A gk ′
en donde g es la aceleración de la gravedad en la superficie de la tierra. Las variaciones
de altitud son, generalmente, demasiado pequeñas como para considerar una variación de
esta cantidad. Transformando estas componentes a los ejes cuerpo mediante la matriz de
cosenos directores obtenemos:
Fg = m A gR T k ′
Dichas fuerzas se aplican, por definición, en el centro de gravedad de la aeronave. En
consecuencia, ellas no producen momento alguno con respecto a este punto.
Fuerzas Motrices.
Toda aeronave requiere, ya sea para sustentarse o para trasladarse, de una planta motriz.
La planta motriz se divide en unidades motrices. Cada una de dichas unidades está sujeta
al cuerpo de la aeronave en puntos bien definidos. Por otro lado, las líneas de acción de
las fuerzas generadas por la planta motriz también quedan definidas por el modo de
instalación de cada una de las unidades. En general puede considerarse que estos datos
geométricos son conocidos, a partir del diseño, en los ejes cuerpo. De este modo, la
fuerza total generada por la planta motriz puede representarse del siguiente modo:
n
FT = ∑ Ti e i
i =1
en donde Ti es la magnitud de la fuerza generada por la unidad “i” de la planta motriz y
e i es un vector unitario en la dirección de su línea de acción. Igualmente, si t i es el
vector posición del punto de aplicación de la unidad “i” en ejes cuerpo, los momentos
generados por la fuerza correspondiente con respecto al centro de gravedad son:
n
MT = ∑ Ti [t i ×]ei
i =1
Todas estas cantidades pueden considerarse como constantes o pueden ser variables de
control. En efecto, para las Ti pueden existir palancas de control en la cabina del
vehículo. El caso de e i variable es el caso de los denominados motores vectoriales que se
están diseñando recientemente para aviones de combate. También representa el caso de
los rotores abatibles (“tilt rotors”) que investigó la compañía Bell en los años 80 y 90 del
siglo XX. Finalmente, la posición t i también puede ser variable en estos dos tipos de
unidades de potencia.
Fuerzas Aerostáticas.
De acuerdo con el principio de Arquímedes, la fuerza aerostática que sufre un cuerpo
sumergido es igual al peso del aire desplazado por el volumen del cuerpo y se aplica en el
centro de gravedad de este volumen. Si denotamos por ρ A la densidad del aire (en la
posición instantánea del vehículo), el volumen desplazado corresponde a la integral
V = ∫ dV y su dirección siempre es opuesta a la dirección de la gravedad, por lo tanto, la
V
fuerza aerostática en ejes cuerpo puede representarse como:
FAs = − ρ A gVR T k ′
La fuerza aerostática se aplica en el centroide del volumen desplazado de modo que
puede dar lugar a un momento si este último punto no coincide con el centro de gravedad
del vehículo. Este es exactamente el caso en un globo aerostático cuyo centro de
gravedad está muy por debajo del centroide de la envolvente; es por ello que la canastilla
es estable en la posición inferior. Si la canastilla tiende a balancearse, aparecen
momentos de restauración debidos a la diferencia entre centroide y centro de gravedad.
En otro ejemplo, este es el mecanismo de control de actitud de los dirigibles. En efecto,
inflando balonetas de aire dentro de la envolvente del dirigible puede lograrse desplazar
el centroide del volumen ocupado por el helio; lo cual da lugar a momentos que
modifican la actitud del vehículo.
Fuerzas Aerodinámicas.
De la aerodinámica elemental sabemos que las fuerzas aerodinámicas son funciones
complejas de: la magnitud del viento relativo, el ángulo de ataque, el ángulo de derrape,
la configuración propia de la aeronave, etc. Desde un punto de vista estrictamente
matemático, el problema solo puede plantearse correctamente del siguiente modo: deben
escribirse ecuaciones de movimiento del fluido y acoplarse con las ecuaciones de
movimiento de la aeronave a través de las condiciones de frontera apropiadas. Además,
debe considerarse un fluido real a grandes velocidades (según el caso) y, tal vez, con
variaciones de densidad y temperatura. Evidentemente, dicho problema matemático, si
bien puede plantearse casi completamente, es irresoluble a la hora actual. Mediante el uso
de computadoras pueden resolverse algunos problemas aerodinámicos sencillos en
nuestros días. Pero, incluso con este método, deben introducirse una serie de hipótesis
simplificadoras con el objeto de hacer factible la solución. En la figura siguiente se
muestra cual es la relación que mantienen actualmente los métodos numéricos con
respecto a la aerodinámica.
Posibilidades de tratamiento aerodinámico numérico, a nivel
industrial (adaptado de Monnerie, 1997).
Cabe decir que con el desarrollo de nuevas tecnologías en computación, se podría esperar
que a mediados del próximo siglo puedan realizarse algunas simulaciones de un avión
completo con un fluido real. Sin embargo, de acuerdo con la teoría de la turbulencia,
dichas simulaciones aisladas tendrían poco valor práctico. Además, desde el punto de
vista de la mecánica de vuelo, las simulaciones que podríamos llamar “estacionarias” son
solo útiles para problemas bien específicos. En realidad debería contarse con
simulaciones dinámicas en donde las variables aerodinámicas (como por ejemplo el
ángulo de ataque) dependan efectivamente del tiempo.
La discusión anterior nos lleva a pensar que las expresiones necesarias para cerrar las
ecuaciones de la mecánica de vuelo son inalcanzables. Sin embargo, aceptando la pérdida
de algo de realismo mediante la introducción de hipótesis adecuadas, pueden escribirse
expresiones para las cuales la utilidad dependerá del grado de generalidad de dichas
hipótesis. En esta sección veremos cómo pueden obtenerse expresiones adecuadas al
problema de mecánica de vuelo que se plantee. El primer paso para obtener dichas
expresiones es el de representar las fuerzas y los momentos aerodinámicos en forma de
coeficientes adimensionales de la siguiente manera:
FA = Pd Sc A
M A = Pd lSc mA
En donde S y l son una superficie y una longitud de referencia, respectivamente, y Pd
representa la presión dinámica. Cabe mencionar que, en el caso de aviones, la superficie
de referencia es generalmente la superficie alar en tanto que, para la longitud de
referencia, se utiliza la cuerda media del ala para los momentos alrededor del eje Y y la
envergadura para los momentos alrededor de los ejes X y Z . Finalmente, los coeficientes
así definidos son totales, es decir, se refieren al avión completo incluidos ala, fuselaje,
empenaje, tren, barquillas, antenas, etc. Tradicionalmente, en ejes viento, el coeficiente a
lo largo del eje X se denota por C D y se denomina “resistencia al avance”; el coeficiente
a lo largo del eje Y se denomina “de fuerza lateral o derrape” y se denota por CY ; el
coeficiente a lo largo del eje Z es C L y se denomina “levantamiento”. En cuanto a los
momentos, se utiliza la nomenclatura Cl , C m y C n y se denominan respectivamente
coeficientes de alabeo, cabeceo y guiñada. Es fácil observar que, en ejes viento, las
fuerzas y momentos pueden escribirse en la forma:
FA VIENTO = Pd S (C D iV + CY jV + C L kV )
M A VIENTO = Pd S (bCl iV + cCm jV + bCn kV )
en ejes cuerpo dichos vectores tienen las siguientes componentes:
FA = Pd SR πj −α (C D iV + CY jV + C L k V )
M A = Pd SR πj −α (bCl iV + cC m jV + bCn kV )
Podría pensarse que los coeficientes adimensionales son únicamente funciones de la
geometría del avión y de la geometría del flujo, es decir de los ángulos de ataque y de
derrape; en tanto que la intensidad del flujo VCG y las características del fluido quedarían
representadas solamente a través de la presión dinámica. Sin embargo, existen dos
fenómenos bien conocidos que hacen que dicha hipótesis sea inaplicable, se trata de la
turbulencia y de las ondas de choque.
Como sabemos, para que dos flujos sean semejantes, no basta la semejanza geométrica
sino que también debe cumplirse con la semejanza dinámica, es decir, ambos flujos
deben tener el mismo número de Reynolds:
Re =
VCG l
ν
en donde ν es la viscosidad cinemática del fluido. Ahora bien, a altos números de
Reynolds aparece el fenómeno de turbulencia, el cual consiste en el hecho de que las
variables dinámicas del flujo tales como velocidad, presión, temperatura, etc., comienzan
a fluctuar de manera desordenada, tanto en el tiempo como en el espacio.
Experimentalmente se ha comprobado que los coeficientes aerodinámicos se comportan
en forma muy distinta para un flujo laminar y para un flujo turbulento.
Por otro lado, cuando la velocidad relativa se acerca a la velocidad del sonido en el medio
respectivo, aparecen al frente del cuerpo ondas de compresión, o de choque, que
incrementan exponencialmente la resistencia al avance. Así mismo, cuando la velocidad
relativa alcanza o incluso rebasa a la del sonido, las ondas de choque se posicionan sobre
el cuerpo y su movimiento o desprendimiento modifica enormemente los valores de las
fuerzas aerodinámicas y por tanto los de los coeficientes. La magnitud de estos efectos
puede evaluarse mediante el llamado número de Mach:
M=
VCG
a
en donde a es la velocidad del sonido en el medio.
Ahora bien, considerando los ángulos de ataque y de derrape como constantes, la
variación de los coeficientes aerodinámicos con los números de Reynolds y de Mach,
presenta características muy particulares. En efecto, en ambos casos pueden distinguirse
rangos muy amplios en los que los valores de dichos coeficientes son casi constantes.
Mientras que para valores específicos de estos números se suceden cambios dramáticos
en los coeficientes. Cada uno de estos rangos se denomina régimen de flujo; así, podemos
mencionar los regímenes: laminar, turbulento, subsónico, transónico y supersónico.
Por otro lado, considerando los números de Reynolds y de Mach como constantes, la
variación de los coeficientes aerodinámicos con los ángulos de ataque y de derrape
resulta ser una función suave, es decir más o menos continua; siempre y cuando dichos
ángulos no tomen valores muy altos. Esto último es válido en la mayor parte de las
situaciones comunes. Por esta razón, en la mayoría de los análisis, se acepta
implícitamente que tanto el número de Reynolds como el de Mach, permanecen dentro de
un rango de valores característicos de un régimen de flujo y que las funciones utilizadas
para los coeficientes aerodinámicos corresponden a dicho régimen. En casos especiales,
cuando esta suposición no es válida, deben utilizarse técnicas particulares para tomar en
cuenta las variaciones.
Fuerzas debidas al Cambio de Masa
En el caso del cambio de masa, se debe contrastar contra lo desarrollado para cohetes.
Los términos involucrados son:
Fm = − m A VCG − [ ×]∫ ρrPCG dV
M m = [VCG ×]∫ ρrPCG dV − ∫ ρ (Ur
V
r
T
PCG PCG
V
V
T
)dV
− rPCG rPCG
En ocasiones el flujo de masa se puede considerar constante durante el tiempo que
involucra el análisis. Sin embargo, en otras ocasiones, el flujo de masa es variable y se
debe obtener mediante otra ecuación diferencial. En este caso se aumenta en uno la
dimensión del sistema dinámico del vehículo. Si, además, el flujo de masa puede hacerse
variar mediante algún mecanismo, se tendría una variable de control.
Fuerzas debidas a las Deformaciones
Podemos hablar de dos clases de deformación del cuerpo: las deformaciones elásticas y
las deformaciones por pares dinámicos. Las primeras requieren de un modelo apropiado
de comportamiento del material del que está constituido el cuerpo; esta es el área de la
aeroelasticidad. Las segundas, requieren del modelado tanto de los pares dinámicos como
de los eslabones que constituyen el par. En el caso de las deformaciones, se debe
contrastar contra lo desarrollado para superficies de control (momentos de bisagra) y para
rotores (tanto elementos rotativos en la planta motriz, ver el libro de Roskam, como
rotores de helicóptero). Los términos involucrados son:
Fd = − ∫ ρrPCG dV − 2[ ×]∫ ρrPCG dV
V
V
T
T
)dV
M d = − ∫ [rPCG ×]ρrPCG dV − 2 ∫ ρ (UrPCG
rPCG − rPCG rPCG
V
V
También es muy importante señalar que para dirigibles, las deformaciones de la
envolvente pueden tratarse bajo este esquema.
En el caso de mandos fijos, aun se pueden introducir las variables de control como
deflexiones de las superficies que alteran las fuerzas aerodinámicas del vehículo. Sin
embargo, no se necesita una ecuación diferencial para calcular el movimiento de las
superficies de control.
En el caso de mandos libres, las superficies de control son funciones del tiempo. Por lo
tanto, deberán introducirse ecuaciones de movimiento para cada superficie. Si bien los
términos debidos a las deformaciones elásticas serán despreciables, los términos debidos
al “cambio de forma” por la deflexión de las superficies, no lo son necesariamente. Para
cada superficie deberán calcularse los términos correspondientes a r y r en las
ecuaciones de movimiento. Finalmente, en este caso, los momentos y productos de
inercia del cuerpo no son constantes, se trata de los términos involucrados en la segunda
ecuación (en muchos casos dichas variaciones son despreciables ya que las superficies de
control representan sólo un pequeño porcentaje de la masa y sus movimientos son
pequeños comparados con cualquier longitud característica del aeronave, sin embargo
debe hacerse un estudio de órdenes de magnitud para saber cuando pueden despreciarse
los términos).
Fuerzas de Interacción Cambio de Masa - Deformación
Finalmente, se deberá mencionar algo sobre los términos de acoplamiento masa –
deformación que, a nuestro conocimiento no han sido tratados en la bibliografía. Estos
términos son:
Fi = − ∫ ρrPCG dV
V
M i = − ∫ [rPCG ×]ρrPCG dV
V
Momentos Másicos para Eslabones
Consideremos cómo se relacionan los momentos másicos de primer y segundo orden para
un eslabón de volumen E , independiente del cuerpo, tomados en el sistema de ejes
cuerpo y tomados en ejes locales del eslabón. Se supondrá que los ejes locales del
eslabón están desplazados y girados con respecto a los ejes cuerpo, por lo tanto, una
partícula cualquiera sobre el eslabón tendrá coordenadas en ejes cuerpo dadas por:
rPCG = r0 + R φn00 rP
En donde r0 es la posición, en ejes cuerpo, del origen del sistema local, R φn00 es la forma
de Gibbs del giro correspondiente y rP es la posición de la partícula en los ejes locales.
De este modo, si los momentos de primer orden del eslabón en ejes cuerpo y en ejes
locales son, por definición:
Q ECG = ∫ ρrPCG dV
E
Q E 0 = ∫ ρrP dV
E
estas cantidades se relacionan de la siguiente manera:
(
)
Q ECG = ∫ ρ r0 + R φn0 rP dV = ∫ ρdV r0 + R φn0 ∫ ρrP dV = mE r0 + R φn0 Q E 0
E
E
E
en donde, evidentemente, mE es la masa del eslabón. Para los momentos de segundo
orden tenemos las definiciones siguientes:
(
)
I ECG = ∫ ρ UrPCG rPCG − rPCG rPCG dV
E
(
T
T
)
I E 0 = ∫ ρ UrP rP − rP rP dV
E
T
T
sustituyendo la posición de las partículas en la primera de estas:
(
(
I ECG = ∫ ρ U r0 + R φn0 rP
) (r
T
0
) (
)(
+ R φn 0 rP − r0 + R φn 0 rP r0 + R φn0 rP
) )dV
T
E
desarrollando los productos y reacomodando:
(
)
T
I ECG = mE Ur0 r0 − r0r0 + 2Ur0 R φn 0 Q E 0 − R φn0 Q E 0r0 − r0 Q E 0 R φn 0 + R φn0 I E 0 R φn0
T
T
T
T
T
T
Se puede observar que, cuando el origen de los ejes locales se puede colocar en el centro
de gravedad del eslabón, tendremos Q E 0 = 0 y por lo tanto:
(
Q ECGb = mE r0
)
I ECGb = mE Ur0 r0 − r0r0 + R φn 0 I E 0 R φn 0
T
T
T
en este caso se habla de un eslabón con ejes locales balanceados y por ello hemos
utilizado el subíndice “b” en estas últimas relaciones.
Par Dinámico Corredera: Un Eje de Deslizamiento
Al referirnos a los pares dinámicos hablaremos de un eslabón primario y uno secundario,
significando que tenemos las ecuaciones de movimiento del sistema completo en ejes del
eslabón primario. De este modo, el eslabón primario de un par siempre será el vehículo;
mientras que el secundario será cualquier parte del vehículo que pueda moverse con
respecto a los ejes cuerpo. De acuerdo con la teoría de los sistemas dinámicos de muchos
cuerpos, todos los pares dinámicos pueden reducirse a dos tipos fundamentales: la
corredera y la articulación. Estos pares se distinguen porque permiten un solo grado de
libertad: la corredera es un grado de traslación y la articulación un grado de rotación.
Cualquier otro par dinámico puede reducirse, mediante la adopción de eslabones
virtuales, a una combinación de varios pares pertenecientes a uno de estos dos tipos.
El eslabón secundario de un par tipo corredera puede deslizarse, sin deformarse, a lo
largo de un eje fijo con respecto a los ejes cuerpo. Llamaremos fulcro a un punto
cualquiera a lo largo del eje de deslizamiento y denotaremos sus coordenadas en ejes
cuerpo mediante r f . Puesto que el eje es fijo, el fulcro es fijo. Consideraremos que el eje
de deslizamiento es paralelo al vector unitario n D . Si asociamos al eslabón un sistema de
referencia local tal que su origen esté sobre el eje de deslizamiento podemos representar
la posición instantánea del origen de los ejes locales mediante una distancia λ a partir del
fulcro, de modo que:
r0 = r f + λn D
por otro lado, si los ejes están girados por una rotación R φn00 constante, la posición de
cualquier partícula del eslabón vendrá dada en ejes cuerpo como:
rPCG = r f + λn D + R φn00 rP
en donde rP es la posición de una partícula cualquiera del eslabón en ejes locales. La
ventaja de esta definición es que la única cantidad dependiente del tiempo será la
distancia λ .
De este modo, la velocidad de las partículas del eslabón en ejes cuerpo viene dada por:
rPCG = λn D
De igual forma, la aceleración de las partículas en ejes cuerpo será:
rPCG = λn D
Las fuerzas y momentos de configuración producidos por un eslabón cualquiera son:
Fd = − ∫ ρrPCG dV − 2[ ×]∫ ρrPCG dV
E
M d = − ∫ [rPCG ×]ρrPCG dV − 2 ∫ ρ (Ur
E
r
T
PCG PCG
E
T
)dV
− rPCG rPCG
E
Sustituyendo las aceleraciones y velocidades para las fuerzas de la corredera serán:
Fd = − ∫ ρλn D dV − 2[ ×]∫ ρλn D dV
E
E
Fd = − mE λn D − 2mE λ [ ×]n D
como vemos, se trata de una fuerza paralela al eje de deslizamiento y proporcional a la
aceleración del eslabón y, por otro lado, de una fuerza de Coriolis debida a la rotación de
los ejes cuerpo (obviamente, proporcional a la velocidad de deslizamiento del eslabón).
Por otra parte, los momentos de configuración serán:
T
T
dV n D − n D ∫ ρrPCG
dV
M d = −λ ∫ ρrPCG dV ×n D − 2λ U ∫ ρrPCG
E
E
E
sustituyendo la posición de las partículas y el momento de primer orden en ejes locales:
M d = −mE λ [r f ×]n D − 2mE λ (Ur Tf n D − n Dr Tf ) − 2λλmE (U − n D nTD )
[
]
(
− λ R φn00 Q E 0 × n D − 2λ UQTE 0 R φn00T n D − n D QTE 0R φn00T
)
En el caso en que el eslabón estuviese balanceado las fuerzas no se modifican y los
momentos se simplifican quedando ambos términos como:
Fdb = − mE λn D − 2mE λ [ ×]n D
M db = − mE λ [r f ×]n D − 2mE λ (Ur Tf n D − n Dr Tf ) − 2λλmE (U − n D nTD )
Par Dinámico Articulación: Un Eje de Rotación
El eslabón secundario de este par puede girar, sin deformarse, alrededor de un eje fijo con
respecto a los ejes cuerpo. Si colocamos el origen del sistema de referencia local del
eslabón en el eje de referencia y llamamos fulcro a este punto tendremos r0 = r f . Puesto
que el eje es fijo, el fulcro es fijo. Consideraremos que el eje de giro es paralelo al vector
unitario nG . Si la actitud instantánea del sistema local con respecto a los ejes cuerpo está
dada por un ángulo δ alrededor del eje de giro, entonces, la posición de cualquier
partícula del eslabón vendrá dada en ejes cuerpo como:
rPCG = r f + R δnG rP
en donde rP es la posición de una partícula cualquiera del eslabón en ejes locales. La
ventaja de esta definición es que la única cantidad dependiente del tiempo es el ángulo
δ.
La velocidad de las partículas del eslabón en ejes cuerpo se obtiene derivando la
posición:
rPCG =
dR δnG
rP = δ [nG ×]R δnG rP
dt
en donde se ha utilizado el hecho de que la única función del tiempo es el ángulo δ y es
evidente que R δnG n G = nG . De igual forma, la aceleración de las partículas en ejes cuerpo
será:
rPCG = δ [nG ×]R δnG rP + δ [nG ×]
dR δnG
rP
dt
efectuando nuevamente la derivada de la forma de Gibbs:
rPCG = δ [nG ×]R δnG rP + δ 2 [n G ×][n G ×]R δnG rP
obtenemos finalmente:
rPCG = (δ + δ 2 [nG ×])[nG ×]R δnG rP
Con las velocidades y las aceleraciones evaluadas de esta forma, pueden determinarse las
fuerzas y los momentos de configuración debidos a un eslabón de este tipo sobre el
vehículo. Los términos a calcular son:
Fd = − ∫ ρrPCG dV − 2[ ×]∫ ρrPCG dV
V
M d = − ∫ [rPCG ×]ρrPCG dV − 2 ∫ ρ (Ur
V
r
T
PCG PCG
V
T
)dV
− rPCG rPCG
V
De este modo, las fuerzas de inercia debidas a la rotación de la superficie de control son:
Fd = −(δ + 2δ [ ×] + δ 2 [n G ×])[nG ×]R δnG ∫ ρrP dV
E
o bien:
Fd = − (δ + 2δ [ ×] + δ 2 [nG ×])[nG ×]R δnG Q E 0
En estas expresiones distinguimos claramente entre los efectos de la aceleración angular,
la fuerza de Coriolis y la aceleración centrípeta alrededor del eje de giro.
Por otro lado, los momentos de estas fuerzas vienen dados por:
[
]
M d = − ∫ [r f ×]ρ (δ + δ 2 [nG ×])[nG ×]R δnG rP dV − ∫ R δnG rP × ρ (δ + δ 2 [nG ×])[nG ×]R δnG rP dV
((
E
)
(
E
− 2∫ ρ U r f + rP R δnG δ [nG ×]R δnG rP − δ [nG ×]R δnG rP r f + rP R δnG
T
T
T
T
T
T
))dV
E
En donde simplemente se han sustituido las posiciones, velocidades y aceleraciones. Por
simplicidad trataremos cada uno de los términos por separado. En el primer término se
pueden llevar todos los factores salvo uno fuera de la integral, por lo que tendremos:
M d 1 = −[r f ×]ρ (δ + δ 2 [nG ×])[nG ×]R δnG ∫ rP dV = −[r f ×]ρ (δ + δ 2 [nG ×])[nG ×]R δnG Q E 0
E
En el segundo término desarrollamos:
[
]
[
]
M d 2 = −δ ∫ R δnG rP × ρ [nG ×]R δnG rP dV − δ 2 ∫ R δnG rP × ρ [nG ×][n G ×]R δnG rP dV
E
E
en el primer término conmutamos el segundo producto cruz para obtener:
[
][
]
[
]
M d 2 = −δ ∫ ρ R δnG rP × R δnG rP × nG dV − δ 2 ∫ R δnG rP × ρ [nG ×][nG ×]R δnG rP dV
E
E
[
][
(
]
)
ahora podemos utilizar la identidad R δnG rP × R δnG rP × = R δnG rP rP − UrP rP R δnG
obtener:
(
)
[
T
T
T
para
]
M d 2 = −δ ∫ ρR δnG rP rP − UrP rP R δnG nG dV − δ 2 ∫ R δnG rP × ρ [nG ×][nG ×]R δnG rP dV
T
T
T
E
E
Sacando de la primera integral los términos que no dependen de la posición y utilizando
la definición del momento de inercia del eslabón en ejes locales
T
T
I E 0 = ∫ ρ UrP rP − rP rP dV podemos obtener:
(
)
E
[
]
M d 2 = δR δnG I E 0R δnG n G − δ 2 ∫ R δnG rP × ρ [nG ×][nG ×]R δnG rP dV
T
E
por otro lado, en el segundo término, podemos utilizar la siguiente identidad:
[nG ×][nG ×] = −[nG nG T − U]
de este modo tenemos:
[
]
M d 2 = δR δnG I E 0R δnG n G + δ 2 ∫ ρ R δnG rP × nG nG R δnG rP dV
T
T
E
[
]
en donde hemos utilizado el hecho de que R δnG rP × R δnG rP = 0 . Conmutando los factores
en el producto cruz y en el producto escalar del último término tendremos:
([
] )(
)
M d 2 = δR δnG I E 0R δnG nG + δ 2 ∫ ρ R δnG rP × nG nG R δnG rP dV
T
T
E
M d 2 = δR δnG I E 0R δnG n G − δ 2 ∫ ρ [nG ×]R δnG rPrP R δnG nG dV
T
T
E
finalmente, si agregamos el término igual a cero:
T
(
)
δ 2 ∫ ρ [n G ×]R δn rP TrP R δn n G dV = δ 2 ∫ ρ [nG ×]R δn R δn n G rP TrP dV
G
G
E
=δ
2
T
G
∫ ρ [n ×]n (r
G
G
T
P
G
T
E
)
rP dV = 0
E
tendremos:
(
)
M d 2 = δR δnG I Ef R δnG nG + δ 2 ∫ ρ [nG ×]R δnG UrP rP − rP rP R δnG nG dV
T
T
T
T
E
es decir:
M d 2 = (δ + δ 2 [nG ×])R δnG I Ef nG
T
en donde también se ha hecho uso de la identidad R δnG nG = nG . Pasando al tercer
término de los momentos, podemos reagruparlo del siguiente modo:
(
)
M d 3 = −2δ ∫ ρ Ur f [nG ×]R δnG rP − [nG ×]R δnG rPr f dV
T
(
E
T
)
− 2δ ∫ ρ UrP R δnG [nG ×]R δnG rP − [nG ×]R δnG rP rP R δnG dV
T
T
T
T
E
En la primera integral podemos sacar todos los factores que no dependen del espacio. En
la segunda integral podemos ver que el producto escalar se anula conmutando los
factores:
(
)
− rP R δnG [nG ×]R δnG rP = − [nG ×]R δnG rP R δnG rP = rP R δnG [nG ×]R δnG rP = 0
T
T
T
T
T
obtenemos entonces:
(
M d 3 = −2δ Ur f [nG ×]R δnG Q E 0 − [nG ×]R δnG Q E 0r f
T
+ 2δ [nG ×]R δnG ∫ ρrP rP dV R δnG
T
T
)
T
E
Finalmente, podemos utilizar la definición del momento de inercia del eslabón para
obtener:
(
M d 3 = −2δ Ur f [nG ×]R δnG Q E 0 + [nG ×]R δnG Q E 0r f
T
− 2δ [n G ×]R δnG I E 0 R δnG
T
+ 2δ [nG ×]
∫ ρr
)
P
E
recolectando los resultados para los tres términos:
T
T
rP dV
M d = −[r f ×]ρ (δ + δ 2 [nG ×])[n G ×]R δnG Q Ef + (δ + δ 2 [nG ×])R δnG I Ef nG
T
T
T
T
− 2δ Ur f [nG ×]R δnG Q Ef + [nG ×]R δnG Q Ef r f + [nG ×]R δnG I Ef R δnG − [n G ×]∫ ρrP rP dV
E
En donde se ven claramente las contribuciones del desbalance de masa, de los momentos
de inercia y del acoplamiento entre la velocidad angular del eslabón y la velocidad
angular del vehículo (término de Coriolis).
Si el eje de giro pasara por el centro de gravedad del eslabón no existirían fuerzas ya que,
en ese caso, Q E 0 = 0 ; mientras que los momentos se reducirían a:
M db = (δ + δ 2 [nG ×])R δnG I Ef nG − 2δ [n G ×]R δnG I Ef R δnG
T
+ 2δ [nG ×]
∫ ρr
T
P
rP dV
E
T
T
M db = (δ + δ 2 [nG ×])R δnG I Ef nG − 2δ [nG ×] R δnG I Ef R δnG − ∫ ρrP rP dV
E
Un eslabón que cumple con esta característica se dice que está balanceado en masa.
Capítulo 4
Compensación
Análisis Dimensional.
(Presentar el teorema pi de Bukingham como marco teórico)
Presentaremos la teoría de hélices como un ejemplo sencillo en el cual la aplicación del
análisis dimensional resulta muy sencilla y conduce a una mejor comprensión del
fenómeno de estudio. Posteriormente aplicaremos el análisis dimensional a la dinámica
del vehículo.
Hélices: Modelo de Rankine – Froude.
Una hélice es un mecanismo diseñado para producir una fuerza de tracción o de empuje,
cuando se encuentra sumergida en un medio fluido. Su funcionamiento está basado en la
segunda y la tercera ley de Newton: al incrementar la cantidad de movimiento del fluido
que pasa a través del mecanismo, el fluido reacciona produciendo una fuerza en sentido
contrario a dicho incremento y que actúa sobre la hélice. La explicación más simple de
este fenómeno es el llamado modelo de Rankine – Froude.
pDisco
2 p2 Actuador
b′
V + a′
V
p1
p1
p2
V + a′
r
dr
p2
T
Q
Nomenclatura para el modelo de Rankine - Froude.
Como puede verse en la figura, en este modelo se idealiza la hélice como un disco
infinitamente delgado (disco actuador). Cuando el flujo pasa a través del disco, sufre un
salto de presión p1 − p2 , que tiende a acelerar el fluido en la parte posterior. La fuerza
producida por el cambio en la cantidad de movimiento puede calcularse mediante dos
procedimientos equivalentes: multiplicando el salto de presión por la superficie del disco,
o bien, de acuerdo con la segunda ley de Newton.
Primeramente, el salto de presión puede calcularse mediante la ecuación de Bernoulli
considerando un fluido ideal (no viscoso e incompresible). Para ello, escribiremos la
ecuación de Bernoulli dos veces: la primera para una línea de corriente que inicia delante
del disco y llega hasta sus proximidades sin atravesarlo; la segunda, para una línea de
corriente que inicia justo atrás del disco y llega hasta la estela (cuando la presión del aire
se ha estabilizado con la presión atmosférica). La razón para hacer esto es que la ecuación
de Bernoulli es aplicable a lo largo de una línea de corriente, siempre y cuando las
funciones del fluido sean continuas y, si bien la velocidad es una función continua,
estamos suponiendo que la presión sufre un salto justo al atravesar el disco. En suma,
tenemos:
1
2
1
2
ρV 2 + p1l = 12 ρ (V + a ′)2 + p1c
ρ (V + a ′)2 + p2 c = 12 ρ (V + c′)2 + p2 l
Considerando que la presión lejos del disco (adelante y atrás) debe estar en equilibrio con
la presión atmosférica se tiene p1l = p2l y se deduce fácilmente el valor del salto de
presión:
c′
∆p = p2 c − p1c = ρ V + c′
2
La fuerza generada por una corona de ancho dr y radio medio r queda expresada como
el producto de esta presión por su superficie:
dT = ∆pds
ds = 2πrdr
c′
dT = 2πrρ V + cdr
2
Por otro lado, esta fuerza también es igual al cambio en la cantidad de movimiento del
aire el cual se puede expresar como el flujo másico que pasa a través de la misma corona
multiplicado por el incremento de total de velocidad:
dT = dm∆V
dm = ρ (V + a ′)ds
∆V = (V + c′) − V = c′
dT = 2πrρ (V + a ′)c′dr
Comparando ambas expresiones se deduce que 2a ′ = c′ y, finalmente, la fuerza queda
expresada en función de la velocidad inducida en el disco como:
dT = 4πρr (V + a ′)a ′dr
Por otra parte, de acuerdo con Von Mises (1945), el flujo también sufre un incremento de
velocidad tangencial en el disco actuador. Este incremento es instantáneo y produce un
par sobre el flujo que puede calcularse mediante la ley de conservación del momento
angular:
dQ = 4πρr 2 (V + a ′)b′dr
en donde b es el incremento de velocidad tangencial en el disco (se supone que dicha
velocidad es nula antes de atravesar el disco). Es evidente que estas fórmulas nos
permiten calcular las fuerzas cuando se conocen los incrementos de velocidad a y b . Sin
embargo, este modelo por sí sólo es insuficiente para calcular dichos incrementos.
Hélices: Modelo de Glauert - Theodorsen.
c
L
ζ
D
dT
N
dQ
Nr
φ0
V0
Plano de Rotación
Nomenclatura para el modelo del Elemento de Pala.
En este modelo se considera que la hélice está constituida por un número finito N de
palas. Cada una de las palas está formada por secciones infinitamente delgadas cuya
forma está diseñada con el objeto de producir una cierta fuerza aerodinámica. Estos
elementos son en todo idénticos a los perfiles utilizados en las alas de un avión. La
componente axial de la fuerza aerodinámica, sumada sobre todos los elementos y sobre
todas las palas, formará la tracción generada por la hélice. Por otro lado, las fuerzas
aerodinámicas tendrán también una componente paralela al plano de rotación de la hélice;
esta componente constituirá la resistencia de la hélice a girar en el medio fluido. En la
figura 2 se representa uno de los elementos de pala así como las fuerzas aerodinámicas
que actúan sobre él. La tracción y el par (resistencia al giro), generados por los N
elementos en la posición r y de envergadura dr , se expresan mediante:
dT = 12 ρNcV 02 (C L cos φ 0 − C D sen φ 0 )dr
dQ = 12 ρNcV02 r (C L sen φ 0 + C D cos φ 0 )dr
C L y C D son los coeficientes aerodinámicos de la sección, c es la cuerda y V0 la
magnitud del viento relativo. Es evidente que estas fórmulas son inútiles en tanto no se
conozca el ángulo formado entre el viento relativo y el plano de rotación de la hélice φ0 .
α
ε
V0
θ
φ
φ0
b′
a′
V
2πnr
Diagrama de Velocidades del Elemento de Pala.
Con el objeto de calcular este ángulo, deben considerarse las siguientes velocidades: la
velocidad de avance de la hélice en el medio fluido, la velocidad tangencial del elemento
de pala debida al giro de la hélice y, finalmente, las velocidades inducidas, de acuerdo
con lo previsto por el modelo de Rankine – Froude. En la figura 3 se representan
gráficamente dichas velocidades y se define una serie de ángulos que las relacionan con
el plano de rotación de la hélice (en la misma figura, n representa la velocidad de giro de
la hélice en revoluciones por segundo). El ángulo β es llamado ángulo de paso y está
medido desde el plano de rotación hasta la cuerda aerodinámica del elemento de pala. El
ángulo φ es llamado ángulo de velocidades y representa el ángulo con que el flujo no
perturbado incidiría sobre el perfil. El ángulo ε es llamado ángulo inducido y representa
la diferencia entre el flujo no perturbado y el flujo sobre el elemento. Por lo tanto, es
evidente que: φ 0 = φ + ε . Finalmente, el ángulo α es el ángulo de ataque del perfil:
α = β − φ0 = β − φ − ε .
Hélices: Análisis Dimensional.
Hasta este momento, hemos conducido nuestro análisis considerando las magnitudes
involucradas con sus dimensiones. Sin embargo, es importante realizar un análisis
dimensional con el fin de comparar los órdenes de magnitud de los diferentes términos.
El primer paso del análisis dimensional es introducir valores característicos del fenómeno
para cada una de las magnitudes fundamentales. En nuestro caso estas magnitudes serán:
longitud, masa y tiempo. La única longitud característica del fenómeno es el diámetro de
la hélice: D . Puede construirse un tiempo característico con el inverso de la velocidad de
giro de la hélice: n −1 (nótese que esta definición no es estrictamente correcta ya que n
está dado en revoluciones por segundo; sin embargo, con el objeto de comparar las
expresiones resultantes, hemos seguido la tradición consagrada en este tipo de estudios).
Finalmente, la masa característica vendrá dada por la densidad del fluido circundante y el
diámetro de la hélice: ρD 3 .
Tomando en cuenta estas magnitudes características como unidades de medida, pueden
introducirse una serie de números adimensionales que representan al fenómeno. Así, las
unidades de velocidad son nD y la velocidad de avance de la hélice queda representada
mediante el llamado coeficiente de funcionamiento (o factor de avance):
J=
V
nD
Del mismo modo, las velocidades inducidas quedarán representadas por los números:
a=
a′
b′
y b=
nD
nD
Las unidades de fuerza en este sistema son ρn 2 D 4 y la tracción queda representada por el
coeficiente:
CT =
T
ρn 2 D 4
Las unidades de momento de una fuerza (par) son ρn 2 D 5 y el par queda representado por
el coeficiente:
CQ =
Q
ρn 2 D 5
La posición de un elemento de pala será representada por la coordenada adimensional:
x=
2r
D
Finalmente, se introduce un número adimensional para representar la "densidad" de las
palas con respecto al disco de la hélice:
σ=
Nc
πD
este número se conoce con el nombre de solidez. Es fácil ver que este número puede
hacerse función de la coordenada adimensional x , haciendo variar la cuerda de los
perfiles a lo largo de la pala.
Tomando en cuenta las definiciones anteriores, las fórmulas para la tracción y el par
totales, integrando sobre la longitud de las palas, pueden escribirse como:
1
CT = π ∫ x (J + a )adx
x0
CQ =
π
1
x ( J + a )bdx
2∫
2
x0
en el caso del modelo de Rankine – Froude, y:
CT =
π
1
σ (J + a ) + (πx − b ) [C (πx − b ) − C (J + a )]dx
4∫
2
2
L
D
x0
CQ =
π
1
σx (J + a ) + (πx − b) [C (J + a ) + C (πx − b )]dx
8∫
2
2
L
D
x0
para el modelo de Glauert - Theodorsen. En este último caso se ha eliminado la incógnita
φ0 introduciendo las velocidades inducidas mediante simples relaciones geométricas.
Hélices: Modelo Combinado.
Hemos mencionado que tanto el modelo de Rankine – Froude como el de Glauert
Theodorsen están incompletos ya que no permiten calcular, de manera independiente las
velocidades inducidas o el ángulo inducido. Para completar esta teoría de hélices
presentaremos el método que ha sido utilizado. Este método fue también propuesto por
Theodorsen. Considerando conocidos el ángulo de paso, las características aerodinámicas
del perfil, la distribución de solidez y el factor de avance de la hélice, las incógnitas
necesarias para calcular los coeficientes de tracción y de par son: el ángulo inducido y las
dos velocidades inducidas. Con el fin de dar solución a este problema podemos igualar
las expresiones obtenidas para la tracción y el par de los dos modelos anteriores. El
resultado es el siguiente:
(J + a )a
(J + a )2 + (πx − b )2
(J + a )b
(J + a )2 + (πx − b )2
=
=
σ
8x
σ
8x
[CL (πx − b ) − C D (J + a )]
[C L (J + a ) + CD (πx − b )]
Reconociendo que los coeficientes aerodinámicos dependen del ángulo de ataque y, por
lo tanto, del ángulo inducido, puede verse que el anterior es un sistema de dos ecuaciones
con tres incógnitas. Una tercera ecuación está constituida por la sencilla relación
geométrica:
tan(φ + ε ) =
J +a
πx − b
Ahora bien, este sistema de tres ecuaciones con tres incógnitas es no lineal y
trascendental y, por lo tanto, no puede escribirse una solución analítica. Por el momento,
rescribiremos el sistema considerando las relaciones geométricas:
tan(φ ) =
J
, y sen (φ + ε ) =
πx
J +a
(J + a )2 + (πx − b )2
así como la identidad trigonométrica:
tan( y + z ) =
tan( y ) + tan( z )
1 − tan( y )tan( z )
De este modo, resolviendo las dos primeras ecuaciones para a y b , y después de algunas
transformaciones evidentes, el sistema anterior se puede escribir como:
8x
a= σ
8x
b= σ
(
)
sen (φ + ε )(C Lπx − C D J ) − C L2 + C D2 J
2
8x
2
σ sen (φ + ε ) + C D + C L
(
)
sen (φ + ε )(C L J + C Dπx ) + C L2 + C D2 πx
2
8x
2
σ sen (φ + ε ) + C D + C L
Jb + πxa
tan(ε ) =
J ( J + a ) + πx(πx − b )
Como vemos, sustituyendo las dos primeras expresiones en la tercera, obtendríamos una
sola ecuación para el ángulo inducido. Dicho de otro modo, el problema planteado es el
de encontrar un valor del ángulo ε que anule la expresión:
f (ε ) = tan(ε ) −
Jb + πxa
J ( J + a ) + πx(πx − b )
en donde:
8x
a= σ
8x
b= σ
(
)
sen (φ + ε )(C Lπx − C D J ) − C L2 + C D2 J
2
8x
2
σ sen (φ + ε ) + C D + C L
(
)
sen (φ + ε )(C L J + C Dπx ) + C L2 + C D2 πx
2
8x
2
σ sen (φ + ε ) + C D + C L
Si bien antes de los años cuarenta del siglo veinte no había otras técnicas que la analítica
y la gráfica para dar solución a este problema, hoy en día es casi inmediato pensar en
aplicar cualquier algoritmo numérico con el fin de encontrar las raíces de la función
f (ε ) . Finalmente, será necesario realizar una integración numérica de las expresiones
para los coeficientes de tracción y de par. Evidentemente, si la solución numérica del
ángulo inducido es lo suficientemente aproximada, las integrales de ambos modelos
deberán ser equivalentes.
Adimensionalización de las Ecuaciones de Movimiento.
Regresemos ahora al problema del movimiento del vehículo y apliquemos a este la
técnica del análisis dimensional. Como se mencionó en el capítulo anterior, en el área de
estabilidad y control se estudia el comportamiento del vehículo en intervalos más o
menos cortos de tiempo; unos cuantos segundos después de haber sufrido una
perturbación (externa o interna) a partir de una cierta condición de vuelo. Con el objeto
de poder considerar perturbaciones de las variables de fase que sean pequeñas en
magnitud, comparadas con las propias variables de fase, el primer paso es el de escribir
las ecuaciones en forma adimensional.
Resumamos el método utilizado para adimensionalizar las ecuaciones: primeramente se
determina el número de dimensiones independientes que requiere el sistema, es decir, el
tamaño del sistema de unidades físicas necesarias para describir el comportamiento; en
seguida, se determina un número igual de valores característicos del sistema (estos
valores pueden corresponder directamente a las unidades del sistema o bien a medidas
compuestas); se determina el valor característico correspondiente a cada variable del
sistema; finalmente, se introduce un nuevo conjunto de variables de fase dividiendo cada
variable del sistema por su valor característico.
En el área de dinámica de vuelo se ha utilizado tradicionalmente una adimensionalización
basada en la presión dinámica, la superficie alar (u otra superficie de referencia) y la
aceleración de la gravedad. Sin embargo, en ciertos casos esta opción puede no ser muy
afortunada ya que algunos valores característicos se anulan en ciertas condiciones de
vuelo, lo cual indetermina las variables adimensionales. A continuación presentaremos la
adimensionalización tradicional y luego propondremos una nueva adimensionalización
que podría utilizarse en los casos mencionados.
Tradicionalmente, puesto que en la introducción de los coeficientes aerodinámicos hemos
utilizado la cantidad qS como unidad para las fuerzas aerodinámicas, escogiendo g
como unidad de aceleración y
S como unidad de longitud, las unidades de velocidad
son g S . Así mismo, las unidades para las velocidades angulares son g / S .
Introduciendo estas expresiones, junto con el siguiente conjunto de variables
adimensionales:
r
Ig
~ = VCG ; ~ =
; ~
V
rPCG = PCG ; ~I = 2
CG
qS
S
g S
g S
d
~ A = m A g ; ρ~ = ρg S ; V~ = V3 ; d =
m
~
q
qS
S 2 dt
g S dt
T
t
b
c
T~i = i ; ~ti = i ; b~ =
; c~ =
qS
S
S
S
es fácil comprobar que las ecuaciones de movimiento, en cualquiera de sus versiones, no
cambian de forma:
~
~ = F − [~ ×]V
~
V
CG
CG
~
mA
~ − [~ ×]~I ~ )
~ = ~I −1 (M
~
~
r ′ = RV
CG
CG
R = [R ~ ×]R
con las fuerzas y momentos adimensionales dados por:
~
~
~ F − [~ ×]V
V
CG
CG
m
~
~ A
~ − [~ ×]~I ~ )
= ~I −1 (M
~
′
rCG
k′ jA
i ~
R ✁ R R φ VCG
e
T~
n
~ = (m
~ A − ρ~AV~ )R T k ′ + ∑ T~i e i + R πj −α (C D iV + CY jV + C L kV )
F
i =1
~
~
~ − [~ ×] ρ~~
~
~
~ AV
−m
CG
∫ rPCG dV − ∫ ρ~~rPCG dV − 2[~ ×]∫ ρ~~rPCG dV − ∫ ρ~~rPCG dV
V
V
V
V
~ = T~ [~t ×]e + R j (b~C i + c~C j + b~C k )
M
∑ i i i π −α l V
m V
n V
n
i =1
~ ×] ρ~~
~
~
T
T
+ [V
CG
∫ rPCG dV − ∫ ρ~(U~rPCG ~rPCG − ~rPCG ~rPCG )dV ~
V
V
T ~
T
)dV~~ − ∫ [~rPCG ×]ρ~~rPCG dV~
rPCG ×]ρ~~
rPCG dV~ − 2 ∫ ρ~ (U ~
rPCG
rPCG − ~
rPCG ~
rPCG
− ∫ [~
V
V
V
Sin embargo, esta opción es poco afortunada ya que con ella resulta imposible analizar el
vuelo estacionario de ciertos vehículos (puesto que en ese caso q = 0 y las variables
adimensionales quedarían indeterminadas). En este trabajo hemos decidido proponer una
nueva forma de proceder que sería válida en esos casos.
Así, escogiendo g como valor característico de aceleración y
característico de longitud, el valor característico de la velocidad es
S como valor
g S . Así mismo,
el valor característico para las velocidades angulares es g / S . Finalmente, puesto que
nuestro problema es puramente dinámico, requerimos un valor característico para la
fuerza o bien para la masa. Es difícil determinar un valor característico que abarque todos
los casos, sin embargo, aunque la masa del vehículo también puede ser una variable de
fase en ciertos casos, se ha decidido utilizar la masa inicial del vehículo la cual
denotaremos por m0 , entendiendo que se trata de la masa al inicio del estudio. Esta
opción también puede complicar las cosas cuando, durante el intervalo de estudio, la
masa sufre grandes cambios. En efecto, al final del estudio la magnitud de las fuerzas
efectivamente presentes no corresponderá con el valor característico utilizado para
adimensionalizarlas, en estos casos se deberá tener cuidado al despreciar ciertos términos.
Así, el valor característico para las fuerzas es m0 g .
Introduciendo entonces los valores característicos escogidos, junto con el siguiente
conjunto de variables adimensionales:
~ = VCG ; ~ =
V
CG
g S
g
r
I
; ~
rPCG = PCG ; ~I =
m0 S
S
S
3
2
~ A = m A ; ρ~ = ρS ; q~ = qS ; V~ = V3 ; d =
m
~
m0
m0
m0 g
S 2 dt
T
t
b
c
~
T~i = i ; ~ti = i ; b =
; c~ =
m0 g
S
S
S
d
g
S dt
es fácil comprobar que las ecuaciones de movimiento, en cualquiera de sus versiones, no
cambian de forma:
~
~ = F − [~ ×]V
~
V
CG
CG
~
mA
~ − [~ ×]~I ~ )
~ = ~I −1 (M
~
~
~ F − [~ ×]V
V
CG
CG
m
~
~ A
~ − [~ ×]~I ~ )
= ~I −1 (M
~
′
rCG
k′ jA
i ~
R ✁ R R φ VCG
e
T~
~
~
′ = RV
rCG
CG
~
R = [R ×]R
con las fuerzas y momentos adimensionales dados por:
n
~ = (m
~ A − ρ~AV~ )R T k ′ + ∑ T~i e i + q~R πj −α (C D iV + CY jV + C L kV )
F
i =1
~ − [~ ×] ρ~~
~
~
~
~
~ AV
−m
CG
∫ rPCG dV − ∫ ρ~~rPCG dV − 2[~ ×]∫ ρ~~rPCG dV − ∫ ρ~~rPCG dV
V
V
V
V
~ = T~[~t ×]e + q~R j (b~C i + c~C j + b~C k )
M
∑ i i
l V
m V
n V
π −α
n
i =1
~ ×] ρ~~
~
~
T
T
+ [V
CG
∫ rPCG dV − ∫ ρ~(U~rPCG ~rPCG − ~rPCG ~rPCG )dV ~
V
V
T ~
T
)dV~~ − ∫ [~rPCG ×]ρ~~rPCG dV~
rPCG ×]ρ~~
rPCG dV~ − 2 ∫ ρ~ (U ~
rPCG
rPCG − ~
rPCG ~
rPCG
− ∫ [~
V
V
V
Puesto que las ecuaciones no cambian de forma, en lo sucesivo dejaremos de escribir la
tilde pero debe recordarse siempre que en todas las ecuaciones posteriores se trata de
variables adimensionales.
Definición de los Estados de Referencia
Se define un estado estacionario como aquel punto del espacio de fases a partir del cual el
sistema no puede evolucionar en el tiempo. Es decir, es un punto en el cual las variables
de fase permanecen constantes en el tiempo:
VCGe = 0;
e
′ = 0; φe = 0; θ e = 0; ψ e = 0
= 0; rCGe
En donde utilizamos el subíndice ‘e’ para indicar que se trata de un punto específico del
espacio de fases. Puesto que las variables de fase están relacionadas (se puede hablar de
momentos conjugados entre pares de variables), vemos que el único estado estacionario
posible es el estado de reposo completo con respecto al sistema de ejes tierra. Sin
embargo, una teoría limitada a este estado de referencia tendría muy poca utilidad.
Cabe la posibilidad de estudiar lo que sigue como bifurcaciones del sistema dinámico
completo y seguir la teoría de estabilidad de Floquet, pero esto representa aún un arduo
trabajo de investigación.
Con el fin de ampliar la teoría debe abrirse la posibilidad de estudiar otros estados de
referencia en los cuales algunas de las variables de fase no sean cero sino que tengan un
comportamiento simple en función del tiempo: por ejemplo: los ángulos pueden ser
periódicos y las coordenadas del centro de gravedad incrementarse linealmente con el
tiempo. Esto implica que las otras variables de fase sí serán estacionarias, es decir, las
velocidades angulares y las lineales deberán permanecer constantes. Como veremos a
continuación, partiendo del estado estacionario como primer estado de referencia, pueden
determinarse 19 estados de referencia para los cuales vale la pena realizar el estudio de
estabilidad. Evidentemente, no cualquier vehículo puede compensarse para alcanzar
todos estos estados. Existirán algunos vehículos para los cuales la gama de estados de
referencia deba restringirse por razones físicas.
El estado de referencia inicial, el estado estacionario, se denomina de sustentación pura.
Si se desestabilizan primero los ángulos de Euler, considerando velocidades angulares
constantes, se obtienen cuatro estados de referencia que se denominan: guiñada, cabeceo,
alabeo y rotación general, dependiendo de cuales velocidades angulares son diferentes de
cero. Si se desestabilizan ahora las coordenadas del centro de gravedad, considerando
velocidades constantes, se obtienen otros cuatro estados que son: el avance, la deriva, el
ascenso y el planeo general. Si se desestabilizan ahora pares de coordenadas una
traslacional y una rotacional, considerando una velocidad angular constante alrededor del
mismo eje en el que hay una velocidad de traslación constante, se obtienen otros tres
estados que se llaman: barril, torniquete y barrena plana. Si consideramos ahora pares en
los que la velocidad angular constante es perpendicular a la velocidad de traslación, que
también es constante, obtenemos seis estados que se denominan: recuperación, viraje
coordinado, péndulo, rodeo horizontal, rompimiento y rodeo vertical. Finalmente, si
consideramos que las seis coordenadas se desestabilizan mientras que las seis velocidades
permanecen constantes, obtenemos un estado de referencia llamado hélice general. En
toda esta discusión hemos supuesto que la densidad permanece constante lo cual es solo
aproximado en la atmósfera real.
Con el propósito de dar coherencia a los estudios posteriores, podemos agrupar estos
estados de referencia en tres grandes grupos: a) Vuelo estacionario; definido como
aquella condición de vuelo en la que las coordenadas del centro de gravedad con respecto
a los ejes tierra son constantes; incluye los estados de referencia de sustentación pura,
guiñada, alabeo, cabeceo y rotación general; b) Vuelo rectilíneo; definido como aquella
condición de vuelo en la que el centro de gravedad del vehículo se mueve sobre una línea
recta, visto desde los ejes tierra; incluye los estados de referencia de avance, deriva,
ascenso, planeo general, barril, torniquete y barrena plana; c) Vuelo curvilíneo; definido
como aquella condición de vuelo en la que el centro de gravedad describe una trayectoria
curva visto desde los ejes tierra; incluye los siguientes estados de referencia:
recuperación, viraje coordinado, péndulo, rodeo horizontal, rompimiento, rodeo vertical y
hélice general. En la siguiente tabla se ha condensado toda esta información para
posterior referencia.
1
2
0
0
0
0
0
0
0
0
0
0
3
0
0
0
0
4
0
0
0
Pe
Qe
0
5
0
0
0
6
0
0
7
Ue
0
Pe
0
0
8
0
Ve
0
9
Ue
10 U e
11 0
12 0
0
Re
0
Sustentación Pura
Guiñada
0
Alabeo
Qe
0
Re
0
Rotación General
0
0
0
Deriva
We
0
0
0
Ascenso
Ve
0
We
0
0
0
0
Planeo General
0
0
Barril
Ve
0
0
Pe
0
Qe
0
0
Torniquete
Re
0
Barrena Plana
0
13 U e
14 U e
0
We
0
0
0
0
15 0
Ve
0
0
16 0
0
17 0
Ve
0
Pe
0
We
18 0
0
We
Pe
0
0
Qe
0
Re
0
Cabeceo
Avance
Vuelo
Rectilíneo
Recuperación
Viraje Coordinado
Péndulo
Rodeo Horizontal
0
Re
0
Qe
0
Rodeo Vertical
0
Vuelo
Estacionario
Vuelo
Curvilíneo
Rompimiento
19 U e Ve We Pe Q e Re Hélice General
Estados de Referencia para el Vehículo en Movimiento en Tres Dimensiones
Análisis Cinemático.
De la definición de estado de referencia deducimos que cualquier condición en la cual
tanto la velocidad del centro de gravedad como la velocidad angular de los ejes cuerpo
sean constantes con respecto a los ejes cuerpo, es un estado de referencia. Esto nos lleva a
la conclusión de que para conocer los estados de referencia es necesario analizar las
ecuaciones cinemáticas considerando las velocidades como constantes :
′ = RVCGe
rCG
R = [R e ×]R
Estas ecuaciones constituyen un sistema de seis ecuaciones diferenciales ordinarias, de
primer orden, con coeficientes constantes y seis incógnitas. Para encontrar su solución se
requiere fijar las condiciones iniciales del vehículo es decir, se requiere conocer la
′ (0) y R (0) . Se debe notar que en este caso es más
posición y la actitud iniciales rCG
conveniente trabajar con la matriz de cosenos directores y no con los ángulos de Euler. Es
evidente que las curvas descritas por el vehículo dependerán de los valores de las
constantes VCGe y e . Puesto que estamos trabajando con variables sin dimensiones,
los valores de las componentes pueden estar comprendidos en el intervalo [− 1,1]
cubriendo la gama completa de posibilidades.
En las secciones siguientes se presentan imágenes para cada una de estas trayectorias.
Estas imágenes fueron construidas resolviendo numéricamente el sistema de ecuaciones
cinemáticas con valores al azar para las variables de fase diferentes de cero. Las
condiciones iniciales, puesto que no intervienen en la forma de la trayectoria, se
escogieron en el origen de los ejes tierra y con los vectores unitarios de los ejes cuerpo
paralelos a los de tierra, es decir:
0
1 0 0
′ (0) = 0 ; R (0) = 0 1 0
rCG
0
0 0 1
Para la ecuación de la posición del centro de gravedad se usó un método de Euler muy
simple con un paso relativamente pequeño y para la ecuación de la actitud se utilizó el
método de la forma de Gibbs que se expuso en capítulos anteriores. No se recomienda
utilizar en este tipo de cálculos la parametrización por ángulos de Euler ya que la
ecuación de la actitud contiene una singularidad par θ = ± π 2 , lo cual dificulta en mucho
la solución de las ecuaciones. En las figuras se ha trazado la trayectoria del centro de
gravedad (en negro), así como la actitud de los ejes cuerpo en diferentes instantes de
tiempo (línea roja, eje X, línea verde, eje Y, línea azul, eje Z).
Análisis Dinámico.
El análisis cinemático nos permite conocer las diversas formas geométricas que pueden
tener los estados de referencia, sin embargo, dicho análisis no nos permite calcular en qué
forma el vehículo puede alcanzar y mantener uno de esos estados en particular.
Recordando la teoría general del capítulo uno, sabemos que para lograr esto se debe
recurrir a los valores de compensación de las variables de control. Hasta este momento,
no hemos introducido explícitamente ninguna variable de control en las ecuaciones de
movimiento del vehículo.
Separamos las fuerzas y momentos externos en una componente constante, que se
denomina de configuración limpia, y una componente debida al cambio en las variables
de control. La linealidad de la expresión siguiente puede no ser aplicable en muchos
casos y se debe recurrir a un modelo específico del control que se desea utilizar:
F = F0 + ∇ ∆ e F
e
M = M 0 + ∇ ∆e M
e
Las variables de control e incluyen cualquier tipo de control con el que pueda contar la
aeronave. Es obvio que varios términos en los jacobinos anteriores serán cero por
naturaleza: por ejemplo, la deflexión de una superficie de control no afecta,
generalmente, la línea de acción de las unidades de potencia.
Substituyendo estas expresiones en las ecuaciones de movimiento, es claro que existen
más incógnitas que ecuaciones, por lo que normalmente, existirán diversas formas de
compensar un mismo estado estacionario:
mA [
[
e
e
×]VCGe − ∇ ∆ e F
×]I
e
− ∇ ∆e M
e
e
= F0
= M0
Esta sección debe presentar métodos para calcular las posiciones exactas que deben tener
los controles para mantener los estados estacionarios deseados. Aquí vemos cómo los
parámetros de la hélice deseada no nos llevan a calcular directamente las velocidades del
estado estacionario, sino más bien, se deben calcular simultáneamente esas velocidades y
los ajustes de los controles. También se debe considerar el caso en que las superficies de
control constituyan una nueva variable de fase (mandos libres, ver Cook).
Vuelo Estacionario
Sustentación Pura.
Guiñada.
Cabeceo.
Alabeo.
Rotación General.
Vuelo Rectilíneo
Avance.
Deriva.
Ascenso.
Planeo General.
Barril.
Torniquete.
Barrena Plana.
Vuelo Curvilíneo
Recuperación.
Viraje Coordinado.
Péndulo.
Rodeo Horizontal.
Rompimiento.
Rodeo Vertical.
Hélice General.
Puede apreciarse que la trayectoria es una hélice cuyo eje se encuentra inclinado. Este es
el tipo de trayectoria más general que puede tener un cuerpo, en tres dimensiones, durante
su movimiento en estado estacionario. Es evidente que el radio, el paso y la dirección del
eje de la hélice son funciones de las velocidades que se escojan. Sería interesante, y de
mucha utilidad, el poder calcular dichos parámetros, directamente a partir de las
velocidades o, mejor aún, poder calcular las velocidades necesarias para obtener el
movimiento deseado. Sin embargo, hasta el momento, esto no ha sido posible debido a
las dificultades matemáticas encontradas.
Capítulo 5
Estabilidad
Ecuaciones del Movimiento Perturbado
El estudio de estabilidad y control no es exclusivo del sector aeronáutico. En efecto, en
gran parte de los sistemas desarrollados por el hombre, una de las preocupaciones
esenciales es la de garantizar que el sistema en cuestión se mantenga funcionando
“correctamente” durante los intervalos de tiempo necesarios para cumplir con éxito los
objetivos planteados. Esto a originado el desarrollo de toda una rama de las matemáticas
conocida con el nombre de “sistemas dinámicos”. El objetivo principal de esta ciencia es
el de determinar cuál será el o los comportamientos que es posible observar en un sistema
gobernado por un cierto conjunto de ecuaciones. La característica principal de estas
ecuaciones es que relacionan una variable independiente unidimensional, generalmente
interpretada como el tiempo, con una serie de parámetros y variables que describen al
sistema. Si bien existen diversas clases de ecuaciones que pueden considerarse como
sistemas dinámicos, nosotros nos ocuparemos principalmente de ecuaciones diferenciales
ordinarias de primer orden. En efecto, como se ha podido observar en el tercer capítulo,
esta es la clase de ecuaciones que describen el movimiento de una aeronave en el espacio.
Para este análisis, como ya se ha mencionado, conviene utilizar el sistema dinámico del
vehículo en función de los ángulos de Euler:
F
− [ ×]VCG
VCG
mA
= I −1 (M − [ ×]I )
′ k′ jA i
rCG
R ✁ R Rφ VCG
e
T
como se describió en el capítulo anterior, suponemos que se tiene una solución
′ , e e de este sistema tal que:
VCGe , e , rCGe
VCGe 0
0
e =
′ rCGe
′ (t )
rCGe
e e e e (t )
′ << 1, δe << 1
Deseamos saber ahora si pequeñas perturbaciones δVCG << 1, δ << 1, δrCG
de este estado de referencia tenderán a amortiguarse o, al contrario, se amplificarán. Es
decir, si la solución de las ecuaciones de evolución está dada por:
VCG VCGe + δVCG (t )
e + δ (t )
=
′ (t ) + δrCG
′ (t )
′ rCGe
rCG
e e e (t ) + δe (t )
Deseamos saber cual será el comportamiento de las pequeñas perturbaciones. Como se
demostró en el capítulo uno, el comportamiento de dichas perturbaciones está gobernado
por la matriz de estabilidad; ésta matriz se obtiene derivando el lado derecho del sistema
dinámico con respecto a las variables de fase y evaluando en el estado de referencia, es
decir, la matriz de estabilidad viene dada por:
∇[VCGe ,
m A−1F − [ ×]VCG
−1
I (M − [ ×]I )
′ ,e e ]
e ,rCGe
R ✂k ′R ✁j A R φi VCG
T
Puesto que se trata de derivadas parciales, podemos realizar la derivación con respecto a
cada grupo de variables de manera independiente, separando por columnas los términos
correspondientes, lo cual nos lleva a la siguiente forma hiper matricial:
m A−1∇ VCGe F − ∇ VCGe ([
I −1∇ VCGe M
R ☎k′e R ✄jAe R φi e
0
e
×]VCG ) m A−1∇ ✆e F − ∇ ✆e ([ ×]VCGe ) m −A1∇rCGe
m A−1∇ ee F
′ F
I −1∇ ee M
I −1 ∇ ✆e M − ∇ ✆e ([ ×]I ) I −1∇rCGe
′ M
0
0
∇ ee R ☎k′R ✄jA R φi VCGe
(
)
Te
(
0
∇ ee (T
e
)
)
En esta hiper matriz de cuatro renglones por cuatro columnas cada componente es a su
vez una matriz de tres renglones por tres columnas, esto nos lleva a la conclusión de que
la matriz de estabilidad es una matriz de doce por doce. Para simplificar la notación,
tomamos la convención, muy común en la mecánica de vuelo, de denotar las derivadas de
las fuerzas y momentos mediante subíndices; la única diferencia es que, en nuestro caso,
los subíndices serán vectoriales representando cada componente una columna en la
matriz de estabilidad:
= ∇rCGe
FVCGe = ∇ VCGe F;
F✝e = ∇✝e F;
FrCGe
Fe e = ∇e e F;
′
′ F;
= ∇rCGe
M VCGe = ∇ VCGe M; M ✝e = ∇ ✝e M; M rCGe
M e e = ∇e e M;
′
′ M;
Con lo que la matriz de estabilidad nos queda como:
m A−1FVCGe − ∇ VCGe ([ e ×]VCG ) m A−1F✆e − ∇ ✆e ([ ×]VCGe ) m A−1FrCGe
′
−1
−1
−1
I M VCGe
I M ✆e − ∇ ✆e ([ ×]I ) I M rCGe
′
jA
k′
i
0
0
R ☎e R ✄e R φe
0
0
Te
(
)
m A−1Fe e
I −1M e e
∇e e R ☎k ′ R ✄j A R φi VCGe
(
∇e e T
)
e
Si dejamos de lado, por el momento, las derivadas de fuerzas y momentos para
concentrarnos en las derivadas de los términos que contienen las variables de fase, la
primer derivada en el primer renglón es muy fácil de calcular puesto que ∇ A A = U es la
matriz identidad, es decir:
∇ VCGe ([
×]VCG ) = [
e
e
×]∇ VCGe VCG = [
e
×]
por otro lado, la siguiente derivada en el mismo renglón se puede calcular mediante la
anticonmutatividad del producto vectorial:
∇
e
([
×]VCGe ) = −∇
e
([VCGe ×] ) = −[VCGe ×]
Ahora bien, la derivada en el segundo renglón puede calcularse de la siguiente manera:
∇
e
([
) = (∇ [
×]I
)
×] I
e
(
como ya se mencionó, sabemos que ∇
e
+[
(
×]I ∇
e
e
)
) = U , por lo que el segundo término nos
e
queda como [ e ×]I ; en el primer término el factor I e , una vez que se ha evaluado en el
estado estacionario, puede volver a ponerse dentro de la derivada, ya que es una
constante, por último, se utiliza nuevamente la anticonmutatividad del producto cruz:
(∇ [ ×])I
e
e
=∇
e
([
×]I
e
) = −∇ ([I
e
e
×]
) = −[I
e
×]
Por lo que, finalmente, la derivada que estamos buscando nos queda como:
∇
e
([
×]I
)= [
e
×]I − [I
e
×]
Ahora debemos ocuparnos de las derivadas que aparecen en las ecuaciones cinemáticas.
La derivada que aparece en el tercer renglón puede calcularse como sigue:
(
) [(
∇e e R ✂k ′R ✁j A Rφi VCGe = R ✂k ′e R ✁j Ae R φi VCGe
) (R ✂ R ✁ R
k′
φe
e
jA
i
φe
VCGe
) (R✂ R ✁ R
k′
θe
jA
e
i
φe
)
VCGe ψ
e
]
puesto que las formas de Gibbs de las diferentes rotaciones sólo dependen de un ángulo.
Evaluando entonces las derivadas que se indican obtenemos:
(
)
[
( )
∇ e e R ✁k ′R j A R φi VCGe = R ✁k ′e R j Ae (R φi )φ VCGe , R ✁k ′e R j A
e
θe
(R )
k′
✁
R φi e VCGe ,
ψe
R j Ae R φi e VCGe
]
Tomemos como ejemplo la derivada que aparece en la primera columna:
(R )
i
φ φ
e
0
0
0
0
1
0
∂
i
=
0 cos(φ ) − sen (φ ) = 0 − sen (φe ) − cos(φe ) = R φe
∂φ
0 sen (φ ) cos(φ ) φ 0 cos(φe ) − sen (φe )
e
i
en donde hemos introducido la notación R φe para las derivadas de las formas de Gibbs.
De modo que la matriz buscada puede expresarse como:
(
) [
i
k′
j
∇ e e R ✁k ′R j A R φi VCGe = R ✁k e′ R j Ae R φe VCGe , R ✁k e′ R θAe R φi e VCGe , Rψ e R j Ae R φi e VCGe
]
Por otra parte, la derivada de la matriz T se calcula directamente, resultando:
0 cos(φe ) tan(θ e ) − sen (φe ) tan (θ e )
− sen (φe )
− cos(φe ) e ,
0
0 cos(φe )sec(θ e ) − sen (φe )sec(θ e )
∇e e (T e ) =
cos(φe )sec 2 (θ e )
sen (φe )sec 2 (θ e )
0
0
cos(φe )
− sen (φe )
0 sen (φe )sen (θ e )sec 2 (θ e ) cos(φe )sen (θ e )sec 2 (θ e )
0
e , 0
0
Qe cos(φe ) tan (θ e ) − Re sen (φe ) tan (θ e )
0
Qe sen (φe )sec 2 (θ e ) + Re cos(φe )sec 2 (θ e )
∇ ee (T✂e ) =
− Qe sen (φe ) − Re cos(φe )
0
Qe cos(φe ) − Re sen (φe )
Qe cos(φe )sec(θ e ) − Re sen (φe )sec (θ e ) Qe sen (φe )sec(θ e ) tan(θ e ) + Re cos(φe )sec(θ e ) tan(θ e ) 0
se han escrito explícitamente estas matrices para dejar claro al lector la forma en que
deben calcularse. Sin embargo, dada su complejidad, se dejarán indicadas en los análisis
subsiguientes y sólo se utilizará la forma explícita para estudiar casos particulares; por lo
tanto, la matriz de estabilidad será la siguiente:
m A−1FVCGe − [ e ×]
m A−1F✆e + [VCGe ×]
I −1M VCGe
I −1 M ✆e − [ e ×]I − [I e ×]
R ☎k ′ R ✄j A R φi
0
e
e
e
0
Te
(
)
m A−1FrCGe
′
−1
I M rCGe
′
0
0
m A−1Fe e
I −1M e e
∇e e R ☎k ′ R ✄j A R φi VCGe
(
∇e e T
e
)
Hasta este punto hemos considerado que las fuerzas y los momentos dependen
únicamente de las variables de fase, es decir de las velocidades VCG y . Sin embargo,
el movimiento de la masa fluida que rodea al cuerpo es mucho más complejo que esto.
De hecho, puesto que dicho movimiento es solución de un conjunto de ecuaciones
diferenciales parciales, se debe considerar que las fuerzas y momentos aerodinámicos son
funcionales complejas de estas variables y de todas sus derivadas con respecto al tiempo:
FA = FA (VCGe , VCGe , VCGe ,
, , , ,
)
Evidentemente, no se tienen herramientas matemáticas para contemplar en el análisis
todos los términos involucrados en esta forma funcional. Tradicionalmente se ha optado
por considerar únicamente la dependencia de las aceleraciones lineales. Inicialmente
debemos considerar las derivadas:
∇[VCGe ,
m A−1F − [ ×]VCG
−1
I (M − [ ×]I )
′ ,e e ]
e ,rCGe
R ✁k ′R j A R φi VCG
T
se considerará que las fuerzas y los momentos dependen de las aceleraciones lineales, por
lo tanto, las últimas nueve columnas se agregan para respetar el tamaño de las matrices,
según se estableció en el segundo capítulo, sin embargo, todas esas derivadas se harán
iguales a cero. Finalmente, con estas consideraciones, se debe multiplicar la matriz de
estabilidad por la forma de Leontief:
m A−1FVCGe
−1
I M VCGe
U −
0
0
0
0
0
0
0
0
0
0
−1
U − m A−1FVCGe
0
−1
0
− I M VCGe
=
0
0
0
0
0 0 0
U 0 0
0 U 0
0 0 U
−1
Esta expresión puede simplificarse por el método de submatrices; muy utilizado para
calcular la inversa de hiper matrices como esta. Se propone:
U − m A−1FVCGe
−1
− I M VCGe
0
0
0 L11 L12
U 0 0 L 21 L 22
0 U 0 L 31 L 32
0 0 U L 41 L 42
0
0
L13
L 23
L 33
L 43
L14 U 0 0 0
L 24 0 U 0 0
=
L 34 0 0 U 0
L 44 0 0 0 U
de tal modo que, si se pueden calcular las dieciséis matrices Lij , la segunda hiper matriz
del lado izquierdo será la inversa de la primera, es decir, será la matriz de Leontief del
sistema. Ese cálculo es sencillo ya que, realizando el producto, se tienen dieciséis
ecuaciones matriciales muy simples:
(
)
(U − m
U − m A−1FVCGe L11
−1
− I M VCGe L11 + L 21
L 31
L
41
)
−1
A
(U − m
)
−1
A
FVCGe L12
−1
− I M VCGe A 12 + L 22
L 32
FVCGe L13
−1
− I M VCGe L13 + L 23
L 33
L 42
L 43
(U − m
)
−1
A
FVCGe L14 U 0 0 0
− I M VCGe L14 + L 24 0 U 0 0
=
0 0 U 0
L 34
L 44
0 0 0 U
−1
evidentemente, se tienen de inmediato los siguientes ocho valores:
L 31 = 0, L 32 = 0, L 33 = U,
L 34 = 0
L 41 = 0, L 42 = 0,
L 44 = U
L 43 = 0,
por otro lado, las otras ocho ecuaciones matriciales son:
(U − m
−1
A VCGe
−1
)
(
)
F
L11 = U U − m A−1FVCGe L12 = 0
L 21 = I M VCGe L11
L 22 = U + I −1M VCGe L12
(U − m
−1
A VCGe
−1
)
(U − m
F
L13 = 0
L 23 = I M VCGe L13
−1
A VCGe
−1
)
F
L14 = 0
L 24 = I M VCGe L14
que tienen como solución simple:
(
L11 = U − m A−1FVCGe
(
−1
)
−1
)
−1
−1
A VCGe
L 21 = I M VCGe U − m F
L12 = 0
L13 = 0 L14 = 0
L 22 = U L 23 = 0 L 24 = 0
se comprueba fácilmente que se ha encontrado la inversa, siempre y cuando exista la
inversa del término U − m A−1FVCGe , que es a su vez otra matriz de Leontief:
(
U − m A−1FVCGe
−1
− I M VCGe
0
0
)
(
)
−1
0
U − m A−1FVCGe
0 I −1M V U − m A−1FV
CGe
CGe
U 0
0
0 U
0
0
U
0
0
0
0
(
0 U 0 0 0
U 0 0 0 U 0 0
=
0 U 0 0 0 U 0
0 0 U 0 0 0 U
0
)
−1
0
En conclusión, la ecuación de evolución de las perturbaciones para el vehículo puede
escribirse en la siguiente forma:
(
)
−1
U − m A−1FVCGe
δVCG
δ −1
−1
= I M VCGe U − m A FVCGe
′
δrCG
0
0
δe
(
)
−1
0
0
U 0
0 U
0
0
−1
m A−1F✁ e + [VCGe ×]
0 m A FVCGe − [ e ×]
−1
−1
I M VCGe
I M ✁e − [ e ×]I − [I e ×]
0
k′
jA
i
✂
✄
R
R
R
0
0
φe
e
e
0
T
U
e
(
)
m A−1FrCGe
′
−1
I M rCGe
′
0
0
δVCG
δ
k ′ ✂j A
i
′
∇ e e (R ✄ R R φ VCGe ) δrCG
∇e e T e
δ
e
m A−1Fee
I −1M e e
Derivadas de Estabilidad
Las derivadas de estabilidad para fuerzas y momentos que debemos evaluar son:
FVCGe ;
F☎e ;
FrCGe
′ ;
Fee ;
FVCGe
M VCGe ;
M ☎e ;
M rCGe
′ ;
M ee ;
M VCGe
considerando, grosso modo, que las fuerzas y los momentos consisten de siete
componentes distintas, tenemos que evaluar 70 matrices para completar la forma explícita
de las derivadas de estabilidad. Sin embargo, la gran mayoría de esos términos son nulos
ya que no todas las fuerzas y momentos dependen de todas las variables de fase. Para
aclarar dichas dependencias seguiremos aquí el orden en que aparecen en la matriz de
estabilidad así como la división que se hizo de estas fuerzas en el tercer capítulo.
Fuerzas gravitacionales
Las fuerzas de gravitación no dependen de la velocidad con que se desplace o gire el
cuerpo:
Fg , VCGe = 0
Fg ,☎e = 0
tampoco dependen de las aceleraciones lineales:
Fg ,VCGe = 0
Existen modelos precisos del comportamiento de la gravedad debido a la no esfericidad
de la tierra. Igualmente, existen modelos precisos del comportamiento de la gravedad
terrestre en función de la altitud (de hecho, la ley de la atracción gravitatoria de Newton)
que pueden ser utilizados en algunos casos. Sin embargo, en la mayoría de los casos, los
vehículos que evolucionan dentro de la atmósfera terrestre pueden usar el modelo en el
que la aceleración de la gravedad es una constante, por lo tanto:
Fg ,rCGe
=0
′
Finalmente, puesto que las ecuaciones de movimiento están en ejes cuerpo, las
componentes de la gravedad en dichos ejes dependen de la actitud del vehículo. En el
capítulo tres vimos que esa dependencia se podía expresar de la siguiente forma:
Fg ,e e = m A (R T k ′)e e
O bien, en función de los ángulos de Euler:
(
)
Fg ,e e = m A R φiT R j AT k ′ e
e
en donde se ha realizado la primera multiplicación; por lo tanto, las derivadas de
estabilidad se expresan como:
[(
Fg ,e e = m A R φiT R j AeT
)
φe
k′
(R
iT
φe
R j AT
)
θe
(R
k′
iT
φe
R j AeT
)
ψe
]
k′
puesto que las formas de Gibbs de las diferentes rotaciones sólo dependen de un ángulo:
[
iT
j T
Fg ,ee = m A R φe R j AeT k ′ R φiTe RθAe k ′ 0
]
Fuerzas y Momentos motrices
Las fuerzas motrices son, en última instancia, una clase especial de fuerzas aerodinámicas
ya que el empuje se obtiene interaccionando con el medio que rodea al vehículo. Por lo
tanto, estas fuerzas dependen fuertemente de la velocidad y de las aceleraciones del
vehículo. También dependen de la velocidad angular pero, en general, esta dependencia
es menos notoria. Las fuerzas motrices no dependen de la posición del vehículo. Por
último, puesto que estas fuerzas han sido escritas en ejes cuerpo, no dependen de la
actitud instantánea, por lo tanto:
FTrCGe
= 0 ; FTe e = 0
′
M TrCGe
= 0 ; M Te e = 0
′
Las otras derivadas de estabilidad de estas fuerzas van a depender de las características
específicas de la planta motriz. Tradicionalmente se ha considerado que sólo la magnitud
de la fuerza motriz varía con las velocidades y las aceleraciones. Sin embargo, hoy en
día, con las nuevas tecnologías de los motores vectoriales o bien de los rotores
basculantes es posible que tanto el vector dirección como el vector posición de las plantas
motrices puedan contribuir a las derivadas de estabilidad, por lo tanto escribiremos:
n
n
i =1
i =1
FTVCGe = ∑ e iTiVCGe + ∑ Ti e iVCGe ;
n
n
FT
n
n
i =1
i =1
= ∑ e iTi e + ∑ Ti e i
e
[
]
e
n
M TVCGe = ∑ TiVCGe [t i ×]e i + ∑ Ti t iVCGe × e i + ∑ Ti [t i ×]e iVCGe ;
i =1
MT
i =1
n
n
e
= ∑ Ti
i =1
e
[t i ×]ei + ∑ Ti [t i
i =1
e
]
i =1
n
× e i + ∑ Ti [t i ×]e i
i =1
e
por lo tanto, para una aeronave con una planta motriz específica, se deben definir las seis
matrices siguientes:
TiVCGe ; Ti e ; e iVCGe ; e i e ; t iVCGe ; t i e
evidentemente, las primeras dos son matrices renglón de tres columnas mientras que las
siguientes cuatro son matrices de tres renglones por tres columnas.
Fuerzas y Momentos Aerodinámicos
Las fuerzas aerodinámicas adimensionales se escriben como:
FA = R πj −α (CD iV + CY jV + C L kV )
M A = R πj −α (bCl iV + cCm jV + bCn k V )
Comenzaremos por decir que estas fuerzas y momentos no dependen ni de la posición del
centro de gravedad ni de la actitud de los ejes cuerpo con respecto a los ejes tierra. Es
decir que podemos escribir:
FArCGe
= 0;
′
FAe e = 0
M ArCGe
= 0;
′
M Ae e = 0
Ahora bien, como se discutió en el planteamiento de las ecuaciones de movimiento del
vehículo, estas fuerzas no dependen explícitamente de las variables de fase, sino a través
de los ángulos aerodinámicos, el número de Reynolds y con la hipótesis de flujo casi
estacionario, de las aceleraciones. Recordemos las expresiones de cada uno de estos
argumentos. Primero, para los ángulos tenemos:
tan (α ) =
V
W
; tan (β ) = − V ; VCGV = R πjT−α VCG ;
U
UV
Hemos agregado las componentes del viento relativo en ejes viento ya que nos serán de
utilidad para evaluar las derivadas con respecto al ángulo de derrape. Debemos expresar
también el número de Reynolds en variables adimensionales. Es decir, en variables
dimensionales dicho número se escribe:
Re =
U 2 +W 2c
ν
por lo tanto, introduciendo las variables adimensionales, usando por el momento
nuevamente la tilde para distinguirlas, podemos escribir:
Re =
U~ 2 g S + W~ 2 g S c~ S
ν
=
g S S
ν
U~ 2 + W~ 2 c~ = Re S U~ 2 + W~ 2 c~
en donde hemos definido un Reynolds basado en los valores característicos del sistema:
Re S =
g S S
ν
en lo sucesivo dejaremos de escribir la tilde nuevamente. El número de Reynolds Re S
representa un valor de referencia para manejar las cantidades adimensionales.
Entonces, las derivadas con respecto a las variables de fase de una función cualquiera f
de los ángulos aerodinámicos, del número de Reynolds y de las aceleraciones podrán
calcularse mediante las siguientes fórmulas:
∂f
∂f
∂f
∇ VCGe α +
∇ VCGe β +
∇ V Re
∂α
∂β
∂ Re CGe
∂f
∂f
∂f
∇ e f (α , β , Re, VCG ) =
∇ eα +
∇ eβ +
∇ Re
∂α
∂β
∂ Re e
∇ VCGe f (α , β , Re, VCG ) = ∇ VCGe f
∇ VCGe f (α , β , Re, VCG ) =
Por lo tanto, podemos decir que las derivadas de estabilidad que buscamos se pueden
expresar como:
FAVCGe
M AVCGe
C D
∂
∂ j T
α
C
R
∇
+
=
π
α
Y
V
−
CGe
∂β
∂α
C L
bCl
∂ j
∇T α + ∂
=
R
cC
−
π
α
m
VCGe
∂α
∂β
bCn
FA
e
C D
C D
∂ j T
j T
R π −α CY ∇ VCGe β + ∂ Re R π −α CY ∇ VCGe Re
C L
CL
bCl
bCl
∂ j
j
T
T
R π −α cC m ∇ VCGe β + ∂ Re R π −α cCm ∇ VCGe Re
bCn
bCn
C D
j
= ∇ e R π −α CY ;
C L
FAVCGe = ∇
T
VCGe
C D
j
R π −α CY
CL
bCl
j
M A✁e = ∇✁e R π −α cCm
bCn
M AVCGe = ∇
T
VCGe
bCl
j
R π −α cCm
bCn
las derivadas de los productos se calculan como:
FAVCGe
C Dβ
C De
C Dα
C D Re
T
T
T
j
j
j
= R π −α e CYe ∇ VCGe α + R π −α e CYα ∇ VCGe α + R π −α e CYβ ∇ VCGe β + R π −α e CY Re ∇TVCGe Re
C Lβ
C Le
C Lα
C L Re
j
M AVCGe
bClβ
bCle
bClα
bCl Re
T
j
j
j
T
T
= R π −α e cC me ∇ VCGe α + R π −α e cC mα ∇ VCGe α + R π −α e cC mβ ∇ VCGe β + R π −α e cC m Re ∇ TVCGe Re
bC nβ
bC ne
bC nα
bC n Re
j
CYq
C Lq
C Dr
CYr ;
C Lr
bClp
M A✁e = R πj −αe cCmp
bCnp
bClq
cCmq
bCnq
bClr
cCmr
bCnr
C Dv
CYv
C Lv
CDw
CYw
CLw
bClu
= R πj −α e cCmu
bCnu
bClv
cCmv
bCnv
bClw
cCmw
bCnw
CDp
j
FA✁e = R π −α e CYp
CLp
CDq
CDu
= R πj −α e CYu
C Lu
FAVCGe
M AVCGe
Ahora bien, los gradientes ∇TVCGe α , ∇TVCGe β y ∇TVCGe Re pueden evaluarse de las
definiciones de los ángulos aerodinámicos y del número de Reynolds. Así, para el ángulo
de ataque tenemos:
∇ VCGe tan (α ) = ∇ VCGe
W
U
We
− U 2
e
d tan (α )
∇ VCGe α = 0
dα α e
1
U e
We
− U 2
e
sec 2 (α e )∇ VCGe α = 0
1
U e
Por lo que resulta:
We
2
− U 2 cos (α e )
e
0
∇ VCGe α =
2
cos (α e )
Ue
en el caso del ángulo de derrape debemos calcular primero la matriz:
(
∇ VCGe VCGV = ∇ VCGe R πjT−α VCG
)
resultando:
(
)
∇ VCGe VCGV = R π −α e VCGe ∇TVCGe α + R πjT−α e
jT
es decir:
∇ VCGe VCGV
We
We2
W
2
sen
cos
cos
cos 3 (α e ) 0 − sen (α e ) + e cos 3 (α e ) − sen (α e ) cos 2 (α e )
α
α
α
−
+
−
(
)
(
)
(
)
e
e
e
2
Ue
Ue
Ue
0
1
0
=
2
sen (α ) + We cos 3 (α ) + We sen (α ) cos 2 (α ) 0 − cos(α ) − cos 3 (α ) − We sen (α )cos 2 (α )
e
e
e
e
e
e
e
e
Ue
U e2
Ue
entonces, el gradiente de beta es:
∇ VCGe tan (β ) = −∇ VCGe
VV
UV
(
)
V
sec 2 (β e )∇ VCGe β = − ∇ VCGe VCGV ∇ VCGVe V
UV
de donde obtenemos:
We
We2
We
2
3
3
2
− cos(α e ) + U sen (α e )cos (α e ) − U 2 cos (α e ) 0 − sen (α e ) + U cos (α e ) − sen (α e )cos (α e ) − VVe UVe2
e
e
e
∇ VCGe β = − cos2 (β e )
0
1
0
− 1 UVe
2
W
W
W
sen (α ) + e cos3 (α ) + e sen (α )cos2 (α ) 0 − cos(α ) − cos3 (α ) − e sen (α )cos2 (α )
0
e
e
e
e
e
e
e
e
Ue
Ue
U e2
la velocidad del estado estacionario en ejes viento es:
VCGVe
− U e cos(α e ) − We sen (α e )
=
Ve
U e sen (α e ) − We cos(α e )
por lo que finalmente tenemos:
We
We2
We
2
3
3
2
− cos(α e ) + U sen (α e ) cos (α e ) − U 2 cos (α e ) 0 − sen (α e ) + U cos (α e ) − sen (α e ) cos (α e ) − Ve (U e cos(α e ) + We sen (α e ))2
e
e
e
2
∇ VCGe β = − cos (β e )
0
1
0
1 (U e cos(α e ) + We sen (α e ))
2
W
W
W
3
2
3
2
sen (α ) + e cos (α ) + e sen (α ) cos (α ) 0 − cos(α ) − cos (α ) − e sen (α ) cos (α )
0
e
e
e
e
e
e
e
e
Ue
U e2
Ue
En el caso del número de Reynolds tenemos:
(
∇ VCGe Re = ∇ VCGe Re S
∇ VCGe
U 2 +W 2c
)
Ue
U 2 +W 2
e
e
Re = Re S c
0
We
U 2 +W 2
e
e
Matriz de Leontief para las Aceleraciones
(
)
−1
Recordemos que la matriz de Leontief L = U − m A−1FVCGe
aparece en la ecuación de las
perturbaciones cuando consideramos que el operador de evolución del sistema dinámico
depende en forma no trivial de la razón de cambio de las variables de fase con respecto al
tiempo. En el caso de la dinámica del vehículo esta situación se presenta debido a que el
movimiento del fluido resulta ser una funcional compleja del movimiento del propio
vehículo (condiciones de frontera variables). La hipótesis de quasiestacionaridad en el
movimiento del fluido nos permite considerar que las fuerzas aerodinámicas son función
de las aceleraciones del centro de gravedad, además de la velocidad y la velocidad
angular de los ejes cuerpo.
CDu
−1 j
L = U − m A R π −α e CYu
CLu
− cos α e
L = U − m A−1 0
senα e
− C Du cos α e + C Lu senα e
−1
CYu
L = U − m A
C Du senα e − C Lu cos α e
1 + m A−1C Du cos α e − m A−1C Lu senα e
L=
m A−1CYu
−1
m A C Du senα e − m A−1C Lu cos α e
C Dv
CYv
CLv
CDw
CYw
CLw
0 senα e CDu
1
0 CYu
0 − cos α e CLu
− m A−1C Dv cos α e + m A−1C Lv senα e
1 − m1ACYv
m C Dv senα e − m A−1C Lv cos α e
−1
A
CDv
CYv
CLv
C Dw
CYw
CLw
−1
− C Dw cos α e + C Lw senα e
CYw
C Dw senα e − C Lw cosα e
−1
− m A−1C Dw cos α e + m A−1C Lw senα e
m1ACYw
1 − m A−1C Dw senα e + m A−1C Lw cos α e
−1
− C Dv cos α e + C Lv senα e
CYv
C Dv senα e − C Lv cosα e
−1
Esta matriz deberá ser calculada y multiplicada por la matriz M AVCGe para ensamblar la
hipermatriz de Leontief que deberá, a su vez, ser multiplicada por la matriz de derivadas
de estabilidad.
Inversa del Tensor de Inercia
Puesto que en las ecuaciones que escribiremos en los próximos capítulos deberemos
utilizar componentes, es conveniente expresar desde este momento la inversa del tensor
de inercia en elementos simples que puedan ser substituidos en las ecuaciones escalares.
Entonces, este tensor se puede escribir como:
I xx
−1
I = I xy
I xz
I xy
I yy
I yz
−1
Dxx
I xz
1
I yz = Dxy
D
Dxz
I zz
Dxz
D yz
Dzz
Dxy
D yy
D yz
en donde D es el determinante del tensor de inercia:
D = I xx I yy I zz − I xx I yz2 − I yy I xz2 − I zz I xy2 + 2 I xy I xz I yz
y los Dij son los cofactores del mismo:
Dxx
Dxy
Dxz
Dxy
D yy
D yz
Dxz I yy I zz − I yz2
D yz = I xz I yz − I xy I zz
Dzz I xy I yz − I xz I yy
I xz I yz − I xy I zz
I xy I yz − I xz I yy
I xy I xz − I yz I xx
I xx I yy − I xy2
I xx I zz − I xz2
I xy I xz − I yz I xx
Vuelo Estacionario
Las ecuaciones de evolución de las perturbaciones para VCGe = 0 son:
δVCG = m A−1FV δVCG − [
CGe
e
×]δVCG + m A−1F✁ e δ + m A−1Fe e δe
δ = I −1M V δVCG + I −1 (M✁ − [
CGe
e
e
×]I − [I
e
)
×] δ
′ = R ✄k ′ R ✂j R φi δVCG
δrCG
A
e
e
e
δe = Teδ☎ + ∇ e T☎ eδe
e
Vuelo Rectilíneo
Las ecuaciones de evolución de las perturbaciones para
e
= 0 son:
δVCG = (U − m A−1FV
CGe
) [m
−1
−1
A VCGe
F
′ + m A−1Fe δe ]
δVCG + (m A−1F + [VCGe ×])δ + m A−1Fr′ δrCG
e
CGe
e
′ + I − 1M e δ e
δ = I −1M V δVCG + I −1M ✁ δ + I −1M r′ δrCG
(
CGe
e
+ I −1M VCGe U − m A−1FVCGe
) [m
−1
CGe
−1
A VCGe
F
e
′ + m A−1Fe δe ]
δVCG + (m A−1F✁ + [VCGe ×])δ + m A−1Fr′ δrCG
e
CGe
e
′ = R ✄k ′ R ✂j R φi δVCG + ∇ e (R ✄k ′ R ✂j R φi VCGe )δe
δrCG
A
e
e
A
e
e
δe = Teδ
El caso en que el vehículo tiene el plano X − Z de los ejes cuerpo como un plano de
simetría es lo bastante común como para escribir las expresiones correspondientes a la
inversa del tensor de inercia explícitamente. En efecto, en ese caso tenemos que
I xy = I yz = 0 por lo que el determinante se simplifica como:
DS XZ = I yy (I xx I zz − I xz2 ) = I yy D yy
por lo tanto, la inversa se puede escribir como:
I S−1XZ
I zz
D yy
= 0
− I xz
D yy
0
1
I yy
0
I xz
D yy
0
I xx
D yy
−
además, se hacen las siguientes hipótesis:
Ve = 0;We = 0 ; φe = 0;ψ e = 0 ; α e = 0; β e = 0
C Dβ = C Dp = C Dr = 0
CY Re = CYe = CYα = CYq = 0
C Lβ = C Lp = C Lr = 0
Cl Re = Cle = Clα = Clq = 0
Cmβ = Cmp = Cmr = 0
Cn Re = Cne = Cnα = Cnq = 0
CDu = CDv = CDw = 0
CYu = CYv = CYw = 0
CLu = CLv = 0
Clu = Clv = Clw = 0
Cmu = Cmv = 0
Cnu = Cnv = Cnw = 0
Las derivadas de estabilidad en las ecuaciones cinemáticas son:
(
k′
✁
∇ e e R R R φ VCGe
jA
i
)
0 − U e sen (θ e ) U e sen (
= 0
U e cos(
0
0
0 − U e cos(θ e )
)
e )
e
y:
cos( e ) 0 sen (
R e R e R φe =
0
1
0
− sen ( e ) 0 cos(
k′
✁
jA
i
e
)
1 0 tan (θ e )
Te = 0 1
0
0 0 sec(θ e )
;
)
e
En el caso de las fuerzas gravitacionales tendremos:
Fg ,e e
0
= m A − cos(
0
e
)
− cos(θ e ) 0
0
0
− sen (θ e ) 0
La matriz de rotación entre ejes viento y ejes cuerpo, así como su derivada resultan:
j′
R π −α e
− 1 0 0
= 0 1 0 ;
0 0 − 1
j′
R π −α e
0 0 1
= 0 0 0
− 1 0 0
las derivadas de los ángulos aerodinámicos y del número de Reynolds son:
∇ VCGe
1
Re = Re S c 0 ;
0
0
∇ VCGe α = 0 ;
1
U e
0
1
∇ VCGe β = −
U e
0
por lo tanto, las derivadas de estabilidad de fuerzas y momentos son:
− CD Re
CLe − CDα
0
T
T
0
∇ Re+
0
∇ α + CYβ ∇TVCGe β
FAVCGe =
VCGe
VCGe
− CL Re
− CDe − CLα
0
− bClβ
0
0
T
T
M AVCGe = cCm Re ∇ VCGe Re+ cCmα ∇ VCGe α + 0 ∇TVCGe β
− bCnβ
0
0
− C Dq
0
FA✁e = CYp
0
0
− CLq
FAVCGe
0
CYr ;
0
0
0 0
= 0 0
0
0 0 − CLw
− bClp
M A✁e = 0
− bCnp
M AVCGe
0
cCmq
0
− bClr
0
− bCnr
0
0 0
= 0 0 cCmw
0
0 0
es decir, finalmente:
FAVCGe
− Re S cC D Re
0
=
− Re S cC L Re
0
−
0
FA✁e = CYp
0
FAVCGe
CYβ
Ue
0
− C Dq
0
− CLq
CLe − CDα
Ue
;
0
C + CLα
− De
Ue
0
CYr ;
0
0
0 0
= 0 0
0
0 0 − C Lw
bClβ
0
Ue
M AVCGe = Re S c 2Cm Re
0
bCnβ
0
Ue
− bClp
0
− bClr
cCmq
0
M A✁e = 0
− bCnp
0
− bCnr
M AVCGe
0
cCmα
Ue
0
0
0 0
= 0 0 cCmw
0
0 0
sustituyendo todas estas expresiones y realizando las operaciones es relativamente
sencillo verificar que las doce ecuaciones de las perturbaciones son (se omitió la matriz
de Leontief, realizar, en documento aparte, el cálculo con la matriz de Leontief. Si hay
buenos resultados, sustituir el presente. También falta una revisión integral de todo este
cálculo):
C
Re S cC D Re
C − C Dα
w − Dq q − θ cos(θ e )
u + Le
−
m AU e
mA
mA
u
C
C
−
C
m
U
Y
Yp
β
v =
Yr
A e
−
r − φ cos( e )
v+
p+
mA
m AU e
mA
w
C − m AU e
− Re S cC L Re u − C De + C Lα w − Lq
q − θsen (θ e )
mA
m AU e
mA
b(I zz Clβ − I xz C nβ )
b(I xz C np − I zz Clp )
b(I xz C nr − I zz Clr )
r
p+
v+
D
D
D
U
yy
e
yy
yy
p
cC mq
cC mα
Re S c 2C m Re
q =
q
w+
u+
I yy
I yyU e
I yy
r
b(I xz Clp − I xx Cnp )
b(I xz Clr − I xx C nr )
b(I xx Cnβ − I xz Clβ )
r
p+
v+
D yy
D yy
D yyU e
✁
′ u cos( e ) + (w + ψU e − θU e )sen (θ e )
xCG
✁
y′ =
v + ψU e cos( e )
CG
✁
′ − usen ( e ) + (w − θU e ) cos(θ e )
zCG
φ p + r tan (θ e )
θ =
q
ψ r sec(θ e )
Finalmente, se hacen las siguientes aproximaciones:
α ≈ tan α ≈
w
;
Ue
β ≈ tan β ≈ −
v
Ue
por lo tanto, las ecuaciones de evolución de las perturbaciones quedan como:
u=−
C
Re S cC D Re
C − C Dα
α − Dq q − θ cos(θ e )
u + Le
mA
mA
mA
β =−
CYβ
C
C − m AU e
φ
β − Yp p − Yr
r+
cos(✂e
m AU e
m AU e
m AU e
Ue
α =−
p=−
)
C − m AU e
C + C Lα
Re S cC L Re
θ
u − De
q−
sen (θ e )
α − Lq
m AU e
m AU e
m AU e
Ue
b(I zz Clβ − I xz C nβ )
D yy
β+
b(I xz Cnp − I zz Clp )
D yy
p+
b(I xz C nr − I zz Clr )
r
D yy
q=
r=−
cC
Re S c 2Cm Re
cC
u + mα α + mq q
I yy
I yy
I yy
b(I xx Cnβ − I xz Clβ )
D yy
β+
′ = u cos(
xCG
b(I xz Clp − I xx C np )
D yy
e
p+
b(I xz Clr − I xx Cnr )
r
D yy
) + U e (α +ψ − θ )sen (θ e )
′ = U e (ψ cos(
yCG
′ = −usen (
zCG
e
e
)− β )
) + U e (α − θ ) cos(θ e )
φ = p + r tan(θ e )
θ =q
ψ = r sec(θ e )
La posición del centro de gravedad está desacoplada, es decir, las variables xCG
′ , yCG
′ y
′ no aparecen en ninguna de las nueve ecuaciones restantes. Por lo tanto, podemos
zCG
resolver esas nueve ecuaciones y, posteriormente, calcular la posición del centro de
gravedad. Por esta razón, dejaremos de lado esas tres ecuaciones en los análisis
siguientes.
Por su parte, las nueve ecuaciones restantes se desacoplan en dos subsistemas de cuatro y
cinco ecuaciones respectivamente. El primero se llama sistema longitudinal y el segundo
sistema lateral – direccional. En efecto, observamos que las variables u , α , q y θ del
primer sistema son variables que tienen que ver con el movimiento de la aeronave sobre
su plano X − Z , como si este plano permaneciera fijo; mientras que las variables β , p ,
r , φ y ψ del segundo sistema tienen que ver con movimientos que alteran la posición
del plano X − Z de la aeronave. En los parágrafos siguientes analizaremos estos sistemas
por separado.
Matriz de estabilidad longitudinal:
El primer subsistema desacoplado es:
C
C − C Dα
Re S cC D Re
u + Le
α − Dq q − θ cos(θ e )
mA
mA
mA
C − m AU e
C + C Lα
Re cC
θ
q−
sen (θ e )
α = − S L Re u − De
α − Lq
m AU e
m AU e
m AU e
Ue
u=−
q=
cC
cC
Re S c 2Cm Re
u + mα α + mq q
I yy
I yy
I yy
θ =q
Los valores propios de este sistema pueden determinarse numéricamente. Generalmente,
estos valores son dos números complejos con sus respectivos conjugados, dando un total
de cuatro raíces para el polinomio característico. Los conjugados representan modos de
movimiento desfasados 180° de los dos modos principales. Estos últimos constituyen dos
movimientos oscilatorios caracterizados de la siguiente forma:
a) Modo de Periodo Corto: es un movimiento de alta frecuencia, con un alto factor
de amortiguamiento. Se caracteriza por realizarse a velocidad casi constante, es
decir u ≈ 0 . Está constituido por una oscilación simultánea del ángulo de ataque y
del ángulo de cabeceo.
b) Modo Fugoide o Delfineo: es un movimiento de baja frecuencia con un bajo
factor de amortiguamiento. Se caracteriza por realizarse con un ángulo de ataque
prácticamente constante, es decir α ≈ 0 . Está constituido por una oscilación
simultánea de la velocidad longitudinal y del ángulo de cabeceo.
La frecuencia y el factor de amortiguamiento de estos movimientos pueden aproximarse
mediante ciertas hipótesis con polinomios de segundo grado. En las secciones siguientes
presentamos dichas aproximaciones. La primera hipótesis que se realiza para todas las
aproximaciones por igual es la de la condición de vuelo recto y nivelado, por lo tanto:
θe = 0
Aproximación del periodo corto:
Este modo se desarrolla a velocidad de avance prácticamente constante por lo que se
supone:
u=0
y se deja de lado la ecuación de la perturbación de velocidad longitudinal. La
perturbación de cabeceo queda sujeta a la perturbación de velocidad angular y, por lo
tanto, el sistema se simplifica a sólo dos ecuaciones:
α =−
C − m AU e
C De + C Lα
α − Lq
q
m AU e
m AU e
cC
cC
q = mα α + mq q
I yy
I yy
los valores propios de este sistema pueden calcularse mediante un sencillo determinante:
−
C De + C Lα
−λ
m AU e
cCmα
I yy
−
CLq − m AU e
m AU e
=0
cCmq
−λ
I yy
por lo tanto, la ecuación característica será de segundo grado:
C De + C Lα
λ2pc +
m AU e
−
cCmq
c
λ pc +
[Cmα (CLq − m AU e ) − Cmq (CDe + CLα )] = 0
I yy
I yy m AU e
La solución de esta ecuación nos da fórmulas sencillas para aproximar el factor de
amortiguamiento y la frecuencia de la oscilación de periodo corto.
Aproximación del Fugoide:
El modo fugoide se realiza con ángulo de ataque prácticamente constante:
α =0
sin embargo, en este caso, dejamos de lado la ecuación de la velocidad angular de
cabeceo y trabajamos con la ecuación del ángulo de ataque, convertida en ecuación para
el ángulo de cabeceo mediante θ = q :
u=−
C
Re S cC D Re
u − Dq θ − θ
mA
mA
Re S cC L Re
θ =−
u
C Lq − m AU e
sustituyendo la segunda en la primera:
C m U + C Dq C L Re − C D Re C Lq
u − θ
u = Re S c D Re A e
m A (C Lq − m AU e )
Re S cC L Re
θ =−
u
C Lq − m AU e
los valores propios de este sistema se evalúan mediante un sencillo determinante:
Re S c
(C
D Re
m AU e + C DqC L Re − C D ReC Lq )
−λ
m A (C Lq − m AU e )
Re S cC L Re
−
C Lq − m AU e
−1
−λ
=0
por lo tanto, la ecuación característica es:
λ2f −
Re S c (CD Re m AU e + C DqC L Re − C D ReC Lq )
Re S cC L Re
λf −
=0
m A (C Lq − m AU e )
C Lq − m AU e
la cual nos da una aproximación al factor de amortiguamiento y a la frecuencia de la
oscilación fugoide.
Matriz de Estabilidad Lateral - Direccional:
El segundo sistema desacoplado es:
β =−
p=−
r=−
CYβ
C
C − m AU e
φ
β − Yp p − Yr
r+
cos(✂e
m AU e
m AU e
m AU e
Ue
b(I zz Clβ − I xz C nβ )
D yy
b(I xx Cnβ − I xz Clβ )
D yy
β−
β−
b(I zz Clp − I xz C np )
D yy
b(I xx Cnp − I xz Clp )
D yy
φ = p + r tan(θ e )
ψ = r sec(θ e )
p−
p−
)
b(I zz Clr − I xz Cnr )
r
D yy
b(I xx C nr − I xz Clr )
r
D yy
Puesto que el ángulo de guiñada no interviene en ninguna de las cuatro primeras
ecuaciones, el sistema puede considerarse solamente de tamaño cuatro por cuatro. Los
valores propios de este sistema pueden determinarse numéricamente. Estos, son dos
números reales y un complejo con su conjugado, dando un total de cuatro raíces para el
polinomio característico. Los modos de movimiento correspondientes a cada raíz se
caracterizan de la siguiente forma:
a) Modo de la Espiral: es un movimiento de divergencia lateral de la trayectoria
(ángulo de guiñada) con un alto factor de amortiguamiento. Se caracteriza por
realizarse sin alabeos, es decir φ ≈ 0 .
b) Modo del Barril: es un movimiento de divergencia del ángulo de alabeo con un
alto factor de amortiguamiento. Se caracteriza por realizarse con un ángulo de
derrape prácticamente constante, es decir β ≈ 0 .
c) Modo del Balanceo Holandés: es un movimiento de baja frecuencia, con un bajo
factor de amortiguamiento. Se caracteriza por realizarse con ángulo de alabeo
prácticamente constante, es decir φ ≈ 0 . Está constituido por una oscilación
simultánea del ángulo de derrape y del ángulo de guiñada dando como resultado
una desviación lateral de la trayectoria de vuelo.
La frecuencia y el factor de amortiguamiento de estos movimientos pueden aproximarse
mediante ciertas hipótesis con polinomios de segundo grado. En este caso también, para
lograr las aproximaciones se fija la condición de vuelo recto y nivelado: θ e = 0 .
Aproximación de la Espiral:
El modo espiral se desarrolla con ángulo de alabeo prácticamente constante:
φ =0
la cuarta ecuación implica p = 0 , por lo tanto, el sistema se reduce a tres ecuaciones:
β =−
0=−
r=−
CYβ
C − m AU e
β − Yr
r
m AU e
m AU e
b(I zz Clβ − I xz C nβ )
D yy
b(I xx C nβ − I xz Clβ )
D yy
β−
β−
b(I zz Clr − I xz C nr )
r
D yy
b(I xx Cnr − I xz Clr )
r
D yy
la segunda ecuación es algebraica y podemos despejar de ella el ángulo de derrape,
resultando:
β =−
(I zzClr − I xz Cnr ) r
(I
zz
Clβ − I xz C nβ )
por lo que en esta aproximación nos quedan dos ecuaciones diferenciales:
β=
CYβ (I zz Clr − I xz Cnr ) − (CYr − m AU e )(I zz Clβ − I xz Cnβ )
r
m AU e (I zz Clβ − I xz Cnβ )
r=
b(Cnβ Clr − Clβ Cnr )
(I
zz
Clβ − I xz Cnβ )
r
sin embargo, vemos que la ecuación del derrape depende de la velocidad angular de
guiñada, mientras que ésta puede encontrarse únicamente con la segunda ecuación. De
este modo reducimos el sistema a una sola ecuación cuyo coeficiente de amortiguamiento
será:
λe =
b(Cnβ Clr − Clβ Cnr )
(I zzClβ − I xzCnβ )
Aproximación del Barril:
Este modo, al contrario del anterior, se realiza con ángulos de guiñada y de derrape
prácticamente constantes:
β = 0;ψ = 0
la quinta ecuación implica r = 0 por lo tanto quedan sólo dos ecuaciones diferenciales:
p=−
b(I zz Clp − I xz Cnp )
D yy
p
φ=p
sin embargo, vemos que el alabeo depende de la velocidad de alabeo, pero no a la
inversa. Por lo tanto, el coeficiente de amortiguamiento para este modo de movimiento
será:
λb =
b(I xz Cnp − I zz Clp )
D yy
Aproximación del Balanceo Holandés:
El balanceo holandés se desarrolla con un ángulo de alabeo prácticamente constante:
φ =0
por lo tanto, al igual que en la espiral, el sistema se reduce a tres ecuaciones, sin
embargo, ahora, dejaremos de lado la segunda ecuación y consideramos que la velocidad
de guiñada es independiente del derrape:
β =−
CYβ
C − m AU e
β − Yr
r
m AU e
m AU e
r=−
b(I xx C nβ − I xz Clβ )
D yy
β−
b(I xx Cnr − I xz Clr )
r
D yy
entonces, los valores propios del sistema pueden encontrarse mediante el determinante:
CYβ
C − m AU e
−λ
− Yr
m AU e
m AU e
=0
b(I xx Cnβ − I xz Clβ )
b(I xx Cnr − I xz Clr )
−
−
−λ
D yy
D yy
−
cuya ecuación característica es:
CYβ
b(I xx Cnr − I xz Clr )
λ
+
bh
D yy
m AU e
2
λbh
+
+
b
(m AU e (I xxCnβ − I xzClβ ) + CYβ (I xxCnr − I xzClr ) − CYr (I xxCnβ − I xzClβ )) = 0
D yy m AU e
Ejemplos de Cálculo de Modos de Movimiento:
Los siguientes ejemplos se desarrollaron a partir del libro Flight Dynamics and
Automatic Controls Part I escrito por Jan Roskam. Se presentan para que el estudiante
pueda hacer ejercicios y comparar sus resultados. En cada ejemplo se calculan los valores
propios de las matrices longitudinal y lateral direccional. En donde es apropiado, se
comparan los valores obtenidos mediante las aproximaciones. Finalmente, se calcula la
frecuencia no amortiguada y el coeficiente de amortiguamiento. Para simplificar la
notación en los ejemplos, introducimos la siguiente notación:
f AVCGe
m AVCGe
C D Re C Dβ
= CY Re CYβ
C L Re C Lβ
Cl Re Clβ
= Cm Re Cmβ
Cn Re Cnβ
C Dα
CYα ;
C Lα
Clα
C mα ;
Cnα
Aviación General Monomotor (Cessna 182)
Datos Geométricos y Másicos
C Dp C Dq C Dr
f A✁e = CYp CYq CYr
CLp C Lq C Lr
Clp Clq Clr
m A✁e = Cmp Cmq Cmr
Cnp Cnq Cnr
Nombre
Variable
Superficie Alar
S
Cuerda Media
Envergadura
Peso
c
b
mA g
Tensor de Inercia
Unidades
Valor
174.0
2
ft
ft
ft
lb
4.9
36.0
2650.0
slug ⋅ ft 2
I
0
0
948
0 1346
0
0
1967
0
Estado de Referencia
Nombre
Altitud
Variable
(− )Z CG
Unidades
ft
Velocidad
Ue
ft s
deg
Ángulo
de α e
Ataque
Fuerzas
C De
Aerodinámicas
C
Ye
C Le
Avance
Despegue
0
133.5
5.4
-
0.057
0
0.719
Derivadas de Estabilidad
0
0.38
2.7748e-008
0
0.404 0 ;
f AVCGe =
0
4.41
3.5001e-007
0
0 0.0895
0
- 0.65 ; m A
m AVCGe = 0
0
0 - 0.0907
e
0
0
0
f A e = 0.030533
0
9.2629
0
0.11178
0
0
- 0.039356
0.10255
=
0
- 0.43566
0
0
0.025248
0.013666
En las siguientes tablas se presentan los resultados del análisis de estabilidad:
Nombre
Presión Dinámica
No. de Reynolds Característico
Carga Alar
Envergadura Adimensional
Cuerda Adimensional
Velocidad de Avance Adimensional
Variable
Pd
Re S
~A
m
b~
c~
U~
e
Unidades
N m
-
2
Valor
21.180764
1.706731e+006
0.719043
2.729153
0.371468
6.480245
Tensor de Inercia Adimensional
I~
-
Cofactor Inercial Adimensional
~
D
yy
-
Variable
Unidades
Nombre
λ1,2
λ
3, 4
ωn1, 2
ω
n 3, 4
ζ 1, 2
ζ
3, 4
s −1
λ pc
-
→→ Frecuencia Natural
ωnpc
→→ Razón de Amortiguamiento
ζ pc
s −1
-
→ Aproximación del Fugoide
λf
-
→→ Frecuencia Natural
ωnf
→→ Razón de Amortiguamiento
ζf
s −1
-
Variable
Unidades
Valores propios Longitudinales
→ Frecuencia Natural
→ Razón de Amortiguamiento
→ Aproximación del Periodo Corto
Nombre
-
-
0
0
0.047563
0
0.067532
0
0
0
0.098689
0.004694
Valor
− 1.681423 ± 1.725962i
-0.008333 ± 0.171047i
3.7632
0.1713
0.0487
0.6978
-1.677524 ± 1.724204i
3.757
0.69734
− 0.012233 ± 0.220555i
0.34498
0.055379
Valor
− 5.823960
0.017939
− 0.431562 ± 1.698177i
2.7365
Valores propios Laterales y
Direccionales
λ1
λ2
λ3, 4
→ Frecuencia Natural
ωn 3, 4
→ Razón de Amortiguamiento
ζ 3, 4
→ Aproximación de la Espiral
λe
λb
λbh
-
0.404750
-
-5.884235
-
− 0.392455 ± 1.544174i
ωbh
ζ bh
s −1
-
→ Aproximación del Barril
→ Aproximación
del
Holandés
→→ Frecuencia Natural
Balanceo
→→ Razón de Amortiguamiento
Aviación General Bimotor (Cessna 310)
s −1
-
0.2463
2.4883
0.24632
Entrenamiento Militar Monomotor (SIAI Marchetti S-211)
Entrenamiento Militar bimotor (Cessna T-37A)
Aviación Regional Bimotor (Beach 99)
Aviación Ejecutiva Motor de Cuatro Pistones (Cessna 620)
Datos Geométricos y Másicos
Nombre
Variable
Unidades
Superficie Alar
S
Cuerda Media
Envergadura
Peso
c
b
mA g
ft
ft
ft
lb
I
slug ⋅ ft
Tensor de Inercia
Valor
340.0
2
6.58
55.1
15000
2
0
0
64811
0
17300
0
0
64543
0
Estado de Referencia
Nombre
Altitud
Variable
(− )Z CG
Unidades
ft
Velocidad
Ue
ft s
deg
Ángulo
de α e
Ataque
Fuerzas
C De
Aerodinámicas
C
Ye
C Le
-
Avance
Crucero
18000
366.8
0
0.042
0
0.484
Derivadas de Estabilidad
f AVCGe
0
0.269
2.0988e - 009
=
0
0.883
0 ;
2.4186e - 008
0
5.55
fA
e
0
0
0
= 0.022522
0
3.5919
0
0.088861
0
m AVCGe
0
0 0.1381
= 0
0
- 1.18 ;
0 - 0.1739
0
mA
e
0
- 0.011568
0.056155
=
0
- 0.2654
0
0.0049706
0
0.019843
En las siguientes tablas se presentan los resultados del análisis de estabilidad:
Nombre
Presión Dinámica
No. de Reynolds Característico
Carga Alar
Envergadura Adimensional
Cuerda Adimensional
Velocidad de Avance Adimensional
Variable
Pd
Re S
~A
m
b~
c~
U~
e
Unidades
lb ft
-
Tensor de Inercia Adimensional
-
Cofactor Inercial Adimensional
~
D
yy
-
Variable
Unidades
Valores propios Longitudinales
→ Frecuencia Natural
→ Razón de Amortiguamiento
→ Aproximación del Periodo Corto
λ1,2
λ
3, 4
ωn1, 2
ω
n 3, 4
ζ 1, 2
ζ
3, 4
-
→→ Frecuencia Natural
ωnpc
→→ Razón de Amortiguamiento
ζ pc
s −1
-
→ Aproximación del Fugoide
λf
-
→→ Frecuencia Natural
ωnf
→→ Razón de Amortiguamiento
ζf
s −1
-
Variable
Unidades
Valores propios Laterales y
Direccionales
0.120734
2.988217
0.356851
15.059379
0
0
0.049364
0
0.013177
0
0
0
0.049160
0.002427
Valor
− 5.129302 ± 5.117303i
− 0.025309 ± 0.144500i
9.5708
0.1467
0.70793
0.17252
-
λ1
λ2
λ3, 4
7.447727e+006
s −1
λ pc
Nombre
3.654117e+002
-
I~
Nombre
Valor
2
-
-5.131511 ± 5.115447i
9.5711
0.70821
− 0.023100 ± 0.191406i
0.25467
0.1198
Valor
-3.551019
-0.004444
− 0.767824 ± 3.269806i
→ Frecuencia Natural
ωn 3, 4
→ Razón de Amortiguamiento
ζ 3, 4
→ Aproximación de la Espiral
λe
λb
λbh
-
-0.320678
-
-3.399305
-
− 0.845903 ± 3.190981i
ωbh
ζ bh
s −1
-
→ Aproximación del Barril
→ Aproximación
del
Holandés
→→ Frecuencia Natural
Balanceo
→→ Razón de Amortiguamiento
4.4367
s −1
-
0.2286
4.3607
0.25624
Aviación Ejecutiva Jet Bimotor (Learjet 24)
Avión de Combate Caza Monomotor (Lockheed F-104)
Avión de Combate Caza Bimotor (McDonnell F-4)
Aviación Comercial Cuadrimotor (Boeing 747-200)
Vuelo Curvilíneo
Las ecuaciones de las perturbaciones son:
δVCG = m A−1FV δVCG − [
CGe
e
′ + m A−1Fe e δe
×]δVCG + m A−1F✁ e δ + [VCGe ×]δ + m A−1FrCGe
′ δrCG
δ = I −1M V δVCG + I −1 (M✁ − [
CGe
e
e
×]I − [I
e
)
′ + I −1M e e δe
×] δ + I −1M rCGe
′ δrCG
′ = R ✄k ′ R ✂j R φi δVCG + ∇ e (R ✄k ′ R ✂j R φi VCGe )δe
δrCG
A
e
e
A
e
e
δe = Teδ☎ + ∇ e T☎ eδe
e
Sustituyendo las derivadas de estabilidad encontradas anteriormente tenemos:
δVCG
C De sen (α e ) − C Le cos(α e ) − C Dα cos(α e ) − C Lα sen (α e )
uWe
2
= −m
cos (α e )
CYα
2
Ue
C De cos(α e ) + C Le sen (α e ) + C Dα sen (α e ) − C Lα cos(α e )
−1
A
C De sen (α e ) − C Le cos(α e ) − C Dα cos(α e ) − C Lα sen (α e )
w cos 2 (α e )
+m
CYα
Ue
C De cos(α e ) + C Le sen (α e ) + C Dα sen (α e ) − C Lα cos(α e )
−1
A
− C Dβ cos(α e ) − C Lβ sen (α e )
u wQe − vRe
T
+m
CYβ
∇ VCGe β v − uRe − wPe
C Dβ sen (α e ) − C Lβ cos(α e )
w vPe − uQe
−1
A
− pC Dp cos(α e ) − pC Lp sen (α e ) − qC Dq cos(α e ) − qC Lq sen (α e ) − rC Dr cos(α e ) − rC Lr sen (α e )
+m
pCYp + qCYq + rCYr
pC Dp sen (α e ) − pC Lp cos(α e ) + qC Dq sen (α e ) − qC Lq cos(α e ) + rC Dr sen (α e ) − rC Lr cos(α e )
− θ cos(θ e )
rVe − qWe
+ pWe − rU e + φ cos(φe ) cos( e ) − θsen (φe )sen (θ e )
qU e − pVe − φsen (φe ) cos( e ) − θ cos(φe )sen (θ e )
−1
A
δ = I −1M V δVCG + I −1 (M✁ − [
CGe
✁
e
e
×]I − [I
e
)
′ + I −1M e e δe
×] δ + I −1M rCGe
′ δrCG
✁
✁
✄
✄
) + v[cos(✂e )sen( e )sen(φe ) − sen(✂e ) cos(φe )] + w[cos(✂e )sen( e )cos(φe ) + sen (✂e )sen(φe )]
✁
✁
+ φ {Ve [cos(✂e )sen ( e ) cos(φe ) + sen (✂e )sen (φe )] − We [cos(✂e )sen ( e )sen (φe ) − sen (✂e ) cos(φe )]}
− θ {U e cos(✂e )sen (θ e ) + Ve cos(✂e ) cos(θ e )sen (φe ) + We cos(✂e ) cos(θ e ) cos(φe )}
✁
✁
✁
−ψ {U e sen (ψ e ) cos( e ) − Ve [cos(ψ e ) cos(φe ) + sen (ψ e )sen ( e )sen (φe )] + We [cos(ψ e )sen (φe ) − sen (ψ e )sen ( e ) cos(φe )]}
xCG = u cos(✂e ) cos(
e
✄
yCG = usen (☎e ) cos(
) + v[sen (☎e )sen ( e )sen (φe ) + cos(☎e ) cos(φe )] + w[sen (☎e )sen ( e ) cos(φe ) − cos(☎e )sen (φe )]
✄
✄
☎
+ φ [Ve [sen ( e )sen ( e ) cos(φe ) − cos(☎e )sen (φe )] − We [sen (☎e )sen ( e )sen (φe ) + cos(☎e ) cos(φe )]]
− θ [U e sen (☎e )sen (θ e ) + Ve sen (☎e ) cos(θ e )sen (φe ) + We sen (☎e ) cos(θ e ) cos(φe )]
✄
✄
✄
+ ψ {U e cos(ψ e ) cos( e ) + Ve [cos(ψ e )sen ( e )sen (φe ) − sen (ψ e ) cos(φe )] + We [cos(ψ e )sen ( e ) cos(φe ) + sen (ψ e )sen (φe )]}
e
✆
✆
✆
zCG = −usen ( e ) + v cos( e )sen (φe ) + w cos( e ) cos(φe )
✆
✆
+ φ{Ve cos( e ) cos(φe ) − We cos( e )sen (φe )}
− θ {U e cos(θ e ) − Ve sen (θ e )sen (φe ) − We sen (θ e ) cos(φe )}
φ = p + qsen (φe ) tan (θ e ) + r cos(φe ) tan (θ e ) + φ [Qe cos(φe ) − Re sen (φe )] tan (θ e ) + θ [Qe sen (φe ) + Re cos(φe )]sec 2 (θ e )
θ = q cos(φe ) − rsen (φe ) + θQe cos(φe ) − θRe sen (φe ) − φQe sen (φe ) − φRe cos(φe )
ψ = qsen(φe ) sec(θ e ) + r cos(φe ) sec(θ e ) + φ [Qe cos(φe ) − Re sen(φe )]sec(θ e ) + θ [Qe sen (φe ) + Re cos(φe )]sec(θ e ) tan(θ e )
Punto Neutro.
Margen Estático.
Vuelo con Potencia
Control Longitudinal
Posición.
Empenaje Dinámico.
Estabilizador y Elevador.
Estabilizador-Elevador.
Lateral y Direccional.
Pérdida de un Motor.
Momento de Balanceo con Timón.
Momento de Balanceo con Guiñada.
Momento de Guiñada con Balanceo.
Efecto del Diedro.
Control Lateral y Direccional.
Guiñada Adversa.
Giro con Spoilers.
Inversión de Alerones.
Giro Uniforme.
Viraje Uniforme.
Ascenso Simétrico.
Estabilidad.
Criterios de Estabilidad.
Perturbaciones de Velocidad.
Perturbaciones de Rotación.
Perturbaciones Atmosféricas.
Estabilidad Longitudinal.
Caso General.
Periodo Corto.
Fugoide.
Lateral y Direccional.
Caso General.
Espiral.
Barril.
Giro del Holandés.
Estabilidad No-Lineal.
Simulación.
Método de la Historia Energética.
Método del Espacio de Fases.
Controles Automáticos de Vuelo.
Teoría de Control.
Introducción.
Método de las Raíces.
Método de Bode.
Elementos
Sensores.
Giróscopos.
Acelerómetros.
Sensor del Ángulo de Incidencia.
Anemómetros.
Altímetros.
Computadores.
Actuadores.
Servo Magnético.
Servo Electro-Hidráulico.
Sistemas Amplificadores de la Estabilidad.
Guiñada.
Balanceo.
Cabeceo.
Piloto Automático.
Modos Longitudinales.
Modos Laterales-Direccionales.
Aterrizaje Automático.
Reglamentación.
Capítulo 6
Control
Derivadas de Control
Unidades de Mediad Inercial
Cuando un cuerpo se mueve en el espacio, para poder controlarlo, se debe poder medir,
las variables de fase correspondientes. Si bien pueden desarrollarse modelos de
observadores para algunas variables, la situación ideal sería poder medir la posición, la
actitud y las velocidades tanto del centro de gravedad como la angular de los ejes cuerpo.
En cuanto a la posición y la velocidad del centro de gravedad, hoy en día pueden
utilizarse unidades GPS (Sistema de Posicionamiento Global, por sus siglas en inglés).
En cuanto a la velocidad del viento relativo, la cual también es indispensable para el
control, se pueden utilizar velocímetros bastante precisos. Por último, para la actitud y la
velocidad angular de los ejes cuerpo se utilizan las llamadas IMU (Unidades de Medida
Inercial, por sus siglas en inglés). De estas existen de dos tipos principales: las que
utilizan giróscopos para detectar directamente la velocidad angular y las que utilizan sólo
acelerómetros pudiendo detectar tanto la aceleración del centro de gravedad como la
aceleración angular de los ejes cuerpo.
Señal de un Acelerómetro Ligado a un Cuerpo.
La posición de un punto cualquiera sobre un vehículo, en ejes tierra viene dada por:
′ + Rr
r ′ = rCG
en donde r es la posición del punto en ejes cuerpo y R es la matriz de cosenos
directores de los ejes cuerpo. La velocidad del punto será:
′
dr′ drCG
dR
dr
+
r+R
=
dt
dt
dt
dt
sustituyendo la derivada de la matriz de rotación y derivando nuevamente para obtener la
aceleración tenemos:
′
d 2r ′ d 2rCG
dr
d 2r
2
R
R
R
=
+
[
R
×
]
Rr
+
[
R
×
][
R
×
]
Rr
+
[
×
]
+
dt 2
dt 2
dt
dt 2
en donde la velocidad angular está en componentes de ejes cuerpo. Suponemos ahora que
el punto en cuestión está fijo en el sistema de referencia del cuerpo:
′
d 2r′ d 2rCG
=
+ [R ×]Rr + [R ×][R ×]Rr
2
2
dt
dt
ahora bien, puesto que las aceleraciones de la ecuación anterior están en componentes de
d 2r ′
ejes tierra, introducimos sus componentes en ejes cuerpo haciendo
= a′ = a y
dt 2
′
d 2rCG
= a′CG = aCG , y efectuando la rotación, es decir, podemos escribir:
2
dt
Ra = RaCG + [R ×]Rr + [R ×][R ×]Rr
multiplicando toda la ecuación por la inversa de la matriz de cosenos directores y
utilizando las identidades R T [Ra ×]R = [a ×] y RR T = U , obtenemos:
a = aCG + [ ×]r + [ ×][ ×]r
es la velocidad
en donde aCG es la aceleración del origen del sistema de ejes cuerpo,
angular del sistema y r es la posición del punto con respecto al mismo sistema, ver por
ejemplo Etkin (1996). Todas las componentes de los vectores en la ecuación anterior
están en ejes cuerpo.
Supongamos que en el punto en cuestión se encuentra un acelerómetro lineal de modo
que mide la aceleración en la dirección paralela al vector unitario n (las componentes de
este vector también están en ejes cuerpo). Entonces, la señal medida por el acelerómetro
vendrá dada por la proyección del vector a sobre el vector n :
A = nT a = nT a CG + nT [ ×]r + nT [ ×][ ×]r
conmutando el producto cruz en el segundo término:
A = nT aCG − nT [r ×] + nT [ ×][ ×]r
En el tercer término podemos aplicar la identidad:
[ ×][ ×] =
T
−U
T
por lo que, reacomodando escalares, la señal del acelerómetro se podrá expresar como:
A = nT aCG − nT [r ×] + nT rT
− nT r
T
Factibilidad de la Unidad Libre de Giróscopos
Es evidente que, conociendo la señal de un solo acelerómetro, de la ecuación
correspondiente, no podríamos conocer la aceleración del cuerpo aCG y la aceleración
angular , puesto que se trata de una sola ecuación escalar con seis incógnitas. De
inmediato surge la idea de colocar un conjunto de acelerómetros de modo que se tengan
suficientes ecuaciones como para poder despejar las incógnitas. La pregunta es: ¿Bajo
que configuración de los acelerómetros es posible despejar las aceleraciones del cuerpo?
La pregunta es legítima ya que es evidente que si pusiéramos todos los acelerómetros
paralelos entre si, sería imposible conocer la aceleración angular alrededor del eje de los
acelerómetros aunque hubiera más de seis ecuaciones. Tan, Mostov y Varaiya (2000)
resolvieron esta pregunta de la forma siguiente. Supongamos que tenemos un conjunto de
n acelerómetros, entonces tenemos el sistema de ecuaciones:
A1 = n1T aCG − n1T [r ×] + n1T r1T
A2 = nT2 aCG − nT2 [r ×] + nT2 r2T
An = nTn aCG − nTn [r ×] + nTn rnT
− n1T r1
T
− nT2 r2
T
− nTn rn
T
el cual puede ensamblarse en forma de hipermatriz como:
A1 n1T
A nT
2 = 2
T
An n n
n1T r1T − n1T r1
− n1T [r1 ×]
− nT2 [r2 ×] aCG nT2 r2T − nT2 r2
+
T T
T
− nTn [rn ×]
n n rn − n n rn
T
T
T
La primera matriz del lado derecho es una matriz de n renglones por seis columnas. Por
otro lado, si definimos:
n1T
T
n
J= 2
T
n n
n1T r1T − n1T r1
− n1T [r1 ×]
A1
T T
A
n 2 r2 − nT2 r2
− nT2 [r2 ×]
2
~
; A=
;
=
T T
T
T
− n n [rn ×]
An
n n rn − n n rn
T
T
T
y si la inversa por la izquierda de la matriz J existe, llamémosla J −I 1 , entonces, pueden
despejarse las aceleraciones del sistema de referencia quedando como:
aCG
−1
~
= J I (A − )
En el caso n = 6 , para que la inversa exista el determinante de J debe ser diferente de
cero. Esto significa que los acelerómetros deben ser colocados en posiciones y
orientaciones tales que el determinante no se anule. En el caso más general, la matriz J
será rectangular y deberá tener rango completo para que su inversa por la izquierda
exista; si es el caso, esta última vendrá dada por:
J −I 1 = (J T J ) J T
−1
Para que la inversa por la izquierda exista, el determinante de la matriz en el paréntesis
del lado derecho debe ser diferente de cero (esto es equivalente a tener rango completo).
Nuevamente, esto indica que los acelerómetros deben ser colocados en posiciones y con
orientaciones tales que el determinante de la matriz J T J no se anule.
Como puede verse, las ecuaciones de las aceleraciones dependen exclusivamente del
número, posición y dirección en que se coloquen los acelerómetros. A continuación
analizaremos algunas configuraciones posibles, señalando su factibilidad, sus ventajas y
sus desventajas.
Configuración Debra.
Consideremos la configuración propuesta por Debra (1994) tal y como aparece en la
siguiente figura:
entonces tenemos:
0
0
− L
L
0
0
r1 = 0 ; r2 = − L ; r3 = 0 ; r4 = 0 ; r5 = L ; r6 = 0
0
L
− L
0
0
0
1
n1 = 12 1; n 2 =
0
1
1
0 ; n3 =
2
1
0
1
1 ; n4 =
2
1
0
1
− 1; n5 =
2
1
− 1
1
0 ; n 6 =
2
1
− 1
1
1
2
0
por lo tanto, la matriz J es:
0 L −L 0
1 −L 0
L
1 0
L − L
1 0 − L − L
1 L
0
L
0 −L −L 0
1 1
1
0
0 1
J = 12
0 −1
− 1 0
− 1 1
el determinante es distinto de cero y la matriz inversa es:
1
1
0
J −I 1 = 2 1 2 1
L
− 1L
0
1
0
1
− L1
0
0
1
1
0
1
L
− L1
1
L
0 − 1 − 1
−1 0
1
1
1
0
1
0
− 1L
L
− 1L 0 − 1L
− 1L 1L
0
El término dependiente de la velocidad angular en las ecuaciones de la unidad sería:
n r
r
~ = n
T T
n n rn
T
1
T
2
T
1
T
2
T
1 1
T
2 2
−n r
−n r
T
− n n rn
T
T
T
− (ω x + ω y )ωz
− (ω + ω )ω
x
z
y
= L − (ω y + ωz )ω x
2
(− ω y + ωz )ω x
(− ω x + ωz )ω y
(− ω x + ω y )ωz
el cual, multiplicado por la inversa nos queda como:
ω yωz
ω ω
x z
ω ω
J −I 1 ~ = − L x y
0
0
0
si definimos las matrices:
1 1 0 0 − 1
J 1 = 1 0 1 − 1 0
0 1 1 1 1
1 −1 0 0
J 2 = − 1 0 1 − 1
0 1 − 1 − 1
− 1
1
0
1 − 1
0 − 1
1 0
ω yωz
~ = ω ω
1
x z
ω xω y
las ecuaciones de la unidad de medida inercial se pueden separar de la siguiente forma:
a CG =
=
1
2 2
1
2 2L
J 1A + L ~ 1
J 2A
Esta configuración tiene la ventaja de que la ecuación para la aceleración angular no
depende de la velocidad angular, lo que permite una integración más sencilla. Sin
embargo, la desventaja es la dificultad de fabricación ya que se deben colocar los
acelerómetros en las posiciones especificadas con mucha precisión. En caso contrario, las
componentes nulas de las matrices anteriores serían diferentes de cero quedando anulada
la ventaja anterior.
Por otro lado, es evidente que si la distancia entre los acelerómetros aumenta, será mayor
la precisión obtenida en la velocidad angular, eso imposibilita la miniaturización de la
unidad inercial. De hecho, el dispositivo experimental de Tan, Mostov y Varaiya (2000)
es un cubo de aluminio de 20 cm de lado en el cual se maquinaron cavidades con
dispositivos de control numérico para garantizar el alineamiento. Es evidente que dicho
dispositivo sería muy difícil de llevar a bordo de un UAV de uno o unos cuantos metros
de tamaño.
Configuración con 2 acelerómetros triaxiales
Hoy en día existen acelerómetros triaxiales integrados en un solo micro circuito, con
buena precisión y precio accesible. Por ello vale la pena saber si una o algunas
configuraciones basadas en acelerómetros triaxiales son factibles. Las cosas se
simplifican un poco ya que cada terna tendrá el mismo vector posición. Por otro lado, las
actuales unidades triaxiales garantizan hasta cierto punto la perpendicularidad entre los
tres ejes; sin embargo, el alinear estos ejes entre dos acelerómetros o con otro sistema
arbitrario puede ser una labor ardua y difícil.
Para iniciar, proponemos utilizar dos unidades triaxiales en dos puntos cualquiera del
sistema de ejes cuerpo para tener un total de seis acelerómetros:
r1, 2,3 = p1 ;
r4,5,6 = p 2
si suponemos que las unidades se colocan en actitudes arbitrarias con respecto a los ejes
cuerpo las direcciones de los acelerómetros serán las columnas de las correspondientes
matrices de rotación:
n1, 2, 3 = R1 ;
n 4 , 5, 6 = R 2 ;
Entonces, la matriz J viene dada por:
R1T
J= T
R 2
− R1T [p1 ×]
− R T2 [p 2 ×]
podemos intentar encontrar la inversa de esta matriz por el método de submatrices:
A B R1T
C D R T
2
− R1T [p1 ×] U 0
=
− R T2 [p 2 ×] 0 U
de esta expresión se desprenden cuatro ecuaciones matriciales:
AR1T + BR T2
T
T
CR1 + DR 2
− AR1T [p1 ×] − BR T2 [p 2 ×] U 0
=
− CR1T [p1 ×] − DR T2 [p 2 ×] 0 U
las cuales pueden ponerse en la forma:
B = R 2 − AR 1T R 2
AR 1T [(p 2 − p1 ) ×] = −[p 2 ×]
D = −CR 1T R 2
CR 1T [(p 2 − p1 ) ×] = U
Ahora, es evidente que las ecuaciones segunda y cuarta no pueden resolverse ya que la
matriz dentro del paréntesis es un pseudovector y su determinante es cero, esto implica
que el determinante de la matriz J es igual a cero y por lo tanto, ninguna configuración
con dos acelerómetros triaxiales, cualesquiera que sean las posiciones y las actitudes, es
realizable.
Configuración con 3 acelerómetros triaxiales
Dado tal resultado, se debe utilizar un mínimo de tres unidades triaxiales, en tres puntos
cualesquiera del sistema de ejes cuerpo, para un total de nueve acelerómetros:
r1, 2,3 = p1 ;
r4,5,6 = p 2 ;
r7,8,9 = p 3
suponemos también que las unidades se colocan con una actitud arbitraria con respecto a
los ejes cuerpo dada por sus respectivas matrices de rotación:
n1, 2,3 = R1 ;
n 4 , 5, 6 = R 2 ;
n 7 , 8, 9 = R 3
Entonces, la matriz J viene dada por:
R1T
J = R T2
R T3
− R1T [p1 ×]
− R T2 [p 2 ×]
− R T3 [p3 ×]
La inversa por la izquierda se calcula a continuación:
R1
−1
JI =
[p1 ×]R 1
R2
[p 2 ×]R 2
R1T
R3 T
R
[p3 ×]R 3 T2
R 3
−1
− R 1T [p1 ×]
R1
− R T2 [p 2 ×]
[p ×]R 1
− R T3 [p 3 ×] 1
R2
[p 2 ×]R 2
R3
[p 3 ×]R 3
realizando el producto al interior del paréntesis:
−1
3
U
− 13 ∑ [p1 ×]
i =1
[p1 ×]R1
J −I 1 = 3 3
3
1
R 1
1
[
]
[
][
]
p
p
p
×
−
×
×
i
i
3∑
3∑ 1
i =1
i =1
[p 2 ×]R 2 [p 3 ×]R 3
R2
utilizando la identidad [pi ×][pi ×] = pi pi − Up i pi podemos escribir:
T
T
R3
U
−1
JI = 3
3
13 ∑ pi ×
i =1
−1
3
− 13 ∑ pi ×
i =1
∑ (Up
3
1
3
i =1
T
i
p i − pi pi
T
[p1 ×]R1
R1
)
[p 2 ×]R 2 [p3 ×]R 3
R2
R3
por similitud con la definición de los momentos de primer y segundo orden, definimos la
siguiente nomenclatura para las componentes de la primera matriz:
− [Q ×] [p1 ×]R1
U
J = 3
I R1
[Q ×]
[p 2 ×]R 2 [p3 ×]R 3
−1
−1
I
R2
R3
Llamamos a la primera matriz, matriz de momentos de la configuración y su inversa
puede calcularse por el método de submatrices del siguiente modo:
− [Q ×] U 0
A B U
=
C D [Q ×]
I 0 U
de donde se obtienen cuatro ecuaciones matriciales muy sencillas de resolver:
A + B[Q ×] = U
BI − A[Q ×] = 0
C + D[Q ×] = 0
DI − C[Q ×] = U
la solución es:
A = U − B[Q ×]
B = [Q ×](I + [Q ×][Q ×])
−1
C = − D[Q ×]
D = (I + [Q ×][Q ×])
−1
si definimos la matriz:
E = I + [Q ×][Q ×]
la solución puede representarse en forma simple como:
A = U − [Q ×]E−1 [Q ×]
B = [Q ×]E −1
C = − E−1 [Q ×]
D = E −1
Es fácil comprobar que, si la matriz E−1 existe, entonces efectivamente hemos
encontrado la inversa de la matriz de los momentos de la colocación. Por lo tanto, la
inversa por la izquierda de J se puede escribir como:
U − [Q ×]E −1 [Q ×]
J −I 1 = 3
−1
− E [Q ×]
R2
R3
[Q ×]E−1 R1
[p ×]R [p ×]R [p ×]R
−1
E
1
2
2
3
3
1
realizando el producto tendremos:
R + [Q ×]E −1 [(p1 − Q ) ×]R 1
J −I 1 = 3 1
E −1 [(p1 − Q ) ×]R 1
R 2 + [Q ×]E −1 [(p 2 − Q ) ×]R 2
E −1 [(p 2 − Q ) ×]R 2
R 3 + [Q ×]E −1 [(p 3 − Q ) ×]R 3
E −1 [(p 3 − Q ) ×]R 3
Por lo que, definiendo las siguientes matrices:
Fi = E−1 [(pi − Q ) ×]R i
la inversa por la izquierda de J se puede escribir como:
(R + [Q ×]F1 )
J −I 1 = 3 1
F1
(R 2 + [Q ×]F2 ) (R 3 + [Q ×]F3 )
F2
F3
Como vemos, el problema se ha reducido al cálculo de la inversa de la matriz E el cual,
si bien no es un problema sencillo, parece mucho menos complicado que el de J −I 1 .
Igualmente, la factibilidad de esta unidad inercial corresponde a que el determinante de la
matriz E = I + [Q ×][Q ×] sea diferente de cero.
Partiendo de las definiciones de las matrices Q e I , la matriz clave del problema puede
calcularse de manera formal. Primeramente, se introducen una serie de variables para
simplificar la notación:
Q=Q x2+Q y2+Qz2
I1=I xx I yy − I xy2
I 4=I xx I yz − I xy I xz
I 2=I xx I zz − I xz2
I 5=I yy I xz − I xy I yz
I 3=I yy I zz − I yz2
I 6=I zz I xy − I yz I xz
Se debe notar que todas estas cantidades son escalares. Enseguida, se calcula el
determinante de la matriz:
E =I xx I 3 + I yy I 2 + I zz I1 + 2 I xy I xz I yz − 2 I xx I yy I zz
+ I 3Q x2 + I 2Q y2 + I1Qz2 − 2 I 6Q x Q y − 2 I 5Q xQz − 2 I 4Q y Qz
− (I 1 + I 2 + I 3 − I xxQ x2 − I yy Q y2 − I zzQz2 − 2 I xy Q xQ y − 2 I xzQ x Qz − 2 I yzQ y Qz )Q
Por último, se establece la matriz adjunta:
Adj (E)1,1 = I 3 − 13 Q(I yy+I zz )+ 13 (I zzQ y2 − 2 I yzQ yQz+I yyQz2 )+ 19 QQx2
Adj (E)2, 2 = I 2 − 13 Q(I xx+I zz )+ 13 (I zzQx2 − 2 I xzQxQz+I xxQz2 )+ 19 QQ y2
Adj (E)3, 3 = I1 − 13 Q(I yy+I xx )+ 13 (I yyQx2 − 2 I xy QxQ y+I xxQ y2 )+ 19 QQz2
Adj (E)1, 2 = − I 6+ 13 (I xy Q − I zzQxQ y+(I yzQx+I xzQ y − I xy Qz )Q z )+ 19 QQxQ y
Adj (E)1, 3 = − I 5+ 13 (I xzQ − I yyQxQz+(I yzQx+I xy Qz − I xzQ y )Q y )+ 19 QQxQz
Adj (E)2,3 = − I 4+ 13 (I yzQ − I xxQzQ y+(I xzQ y+I xy Qz − I yzQx )Q x )+ 19 QQ y Qz
Adj (E)2,1 = Adj (E)1, 2
Adj (E)3,1 = Adj (E)1,3
Adj (E)3, 2 = Adj (E)2,3
Como es bien sabido, la matriz inversa es la adjunta dividida entre el determinante. El
número de operaciones no resulta restrictivo para introducir estas fórmulas en un
microprocesador.
Configuración con k acelerómetros triaxiales
Aún cuando el método de solución puede parecer complicado, podría ser que aumentando
el número de acelerómetros pueda lograrse mayor precisión en las medidas. Por esta
razón, proponemos un cálculo para un número cualquiera de ternas ortogonales de
acelerómetros. Las posiciones vendrán dadas para la terna k como:
r3k − 2,3k −1, 3k = p k
suponemos también que las unidades se colocan con una actitud arbitraria con respecto a
los ejes cuerpo, entonces, la actitud de la terna k vendrá dada por:
n 3k − 2,3k −1,3k = R k
Entonces, la matriz J viene dada por:
R1T
T
R
J= 2
T
R k
− R1T [p1 ×]
− R T2 [p 2 ×]
T
− R k [p k ×]
La inversa por la izquierda se calcula a continuación:
R1
−1
JI =
[p ×]R 1
1
R 1T
R k R T2
[p k ×]R k
T
R k
R2
[p 2 ×]R 2
−1
− R 1T [p1 ×]
− R T2 [p 2 ×] R 1
[p1 ×]R 1
− R Tk [p k ×]
R2
[p 2 ×]R 2
Rk
[p k ×]R k
realizando el producto al interior del paréntesis:
−1
k
1
U
−
k ∑ [p1 ×]
i =1
R1
J −I 1 = k k
k
1
[p1 ×]R 1
1
[
]
[
][
]
p
p
p
×
−
×
×
i
i
k ∑
k ∑ 1
i =1
i =1
R2
[p 2 ×]R 2
Rk
[p k ×]R k
utilizando la identidad [pi ×][pi ×] = pi pi − Up i pi podemos escribir:
T
U
−1
JI = k
k
k1 ∑ pi ×
i =1
T
−1
k
− k1 ∑ pi ×
i =1
∑ (Up
k
1
k
i =1
T
i
pi − pi pi
T
R1
[p1 ×]R1
)
R2
[p 2 ×]R 2
Rk
[p k ×]R k
por similitud con la definición de los momentos de primer y segundo orden, definimos la
siguiente nomenclatura para las componentes de la primera matriz:
− [Q ×] R1
U
J = k
I [p1 ×]R1
[Q ×]
−1
−1
I
R2
[p 2 ×]R 2
Rk
[p k ×]R k
Llamamos a la primera matriz, matriz de momentos de la colocación y su inversa puede
calcularse por el método de submatrices del siguiente modo:
− [Q ×] U 0
A B U
=
C D [Q ×]
I 0 U
de donde se obtienen cuatro ecuaciones matriciales muy sencillas de resolver:
A + B[Q ×] = U
BI − A[Q ×] = 0
C + D[Q ×] = 0
DI − C[Q ×] = U
la solución es:
A = U − B[Q ×]
B = [Q ×](I + [Q ×][Q ×])
−1
C = − D[Q ×]
D = (I + [Q ×][Q ×])
−1
si definimos la matriz:
E = I + [Q ×][Q ×]
la solución puede representarse en forma simple como:
A = U − [Q ×]E−1 [Q ×]
B = [Q ×]E −1
C = − E−1 [Q ×]
D = E −1
Es fácil comprobar que, si la matriz E−1 existe, entonces efectivamente hemos
encontrado la inversa de la matriz de los momentos de la colocación. Por lo tanto, la
inversa por la izquierda de J se puede escribir como:
U − [Q ×]E−1 [Q ×]
J −I 1 = k
−1
− E [Q ×]
R2
[Q ×]E−1 R1
[p ×]R [p ×]R
−1
E
1
2
2
1
Rk
[pk ×]R k
realizando el producto tendremos:
R + [Q ×]E−1[(p1 − Q) ×]R1 R 2 + [Q ×]E−1 [(p 2 − Q ) ×]R 2
J −I 1 = k 1
E−1 [(p1 − Q ) ×]R1
E−1[(p 2 − Q ) ×]R 2
Por lo que, definiendo las siguientes matrices:
Fj = E−1 [(p j − Q ) ×]R j
la inversa por la izquierda de J se puede escribir como:
R k + [Q ×]E−1 [(pk − Q) ×]R k
E−1 [(pk − Q) ×]R k
(R + [Q ×]F1 )
J −I 1 = k 1
F1
(R 2 + [Q ×]F2 )
(R k + [Q ×]Fk )
F2
Fk
Como vemos, el problema se ha reducido al cálculo de la inversa de la matriz E el cual,
si bien no es un problema sencillo, parece mucho menos complicado que el de J −I 1 .
Igualmente, la factibilidad de esta unidad inercial corresponde a que el determinante de la
matriz E = I + 1k [Q ×][Q ×] sea diferente de cero.
Configuración Triedro
Esta configuración consiste en colocar un acelerómetro triaxial a lo largo de cada eje
coordenado a la misma distancia del origen:
1
p1 = L 0;
0
0
p 2 = L 1;
0
0
p3 = L 0
1
para simplificar, supondremos que las unidades pueden ser colocadas paralelas a los ejes
cuerpo de modo que:
R1 = R 2 = R 3 = U
entonces tendremos:
1
Q = ∑ pi = L 1 ;
i =1
1
3
3
(
I = ∑ Upi pi − pi pi
i =1
T
T
) = 2L U
la matriz clave del problema será:
−1
4 1 1
3
D = L2 1 4 1 =
1 1 4
las matrices Fi son:
1
6 L2
5 − 1 − 1
− 1 5 − 1
− 1 − 1 5
2
5 − 1 − 1 2
5
1
F1 =
− 1 5 − 1 − 1 × = 18 L − 1
− 1 − 1 5 − 1
− 1
5 − 1 − 1 − 1
5
F2 = 181L − 1 5 − 1 2 × = 181L − 1
− 1 − 1 5 − 1
− 1
− 1 − 1 0 1 − 1
5 − 1 − 1 0 − 2 =
− 1 5 1 2 0
1
6L
1 2
− 1 − 1 0
5 − 1 − 1 0 1 =
− 1 5 − 2 − 1 0
2
3
1
1
0
1
6L − 1
− 3 − 2 − 1
5 − 1 − 1 0 − 2 − 1
5 − 1 − 1 − 1
F3 = 181L − 1 5 − 1 − 1 × = 181L − 1 5 − 1 2 0
1=
− 1 − 1 5 1 − 1 0
− 1 − 1 5 2
− 1 − 3 − 2
1
1
2
6L 3
1 − 1 0
1
18 L
1 − 1
0
− 2 − 1 − 3
3
1
2
La inversa por la izquierda será:
− 1
− 3
1
2
− 1
2
0
1
1
6 L − 2 − 1
2
3
J −I 1 =
5
2
1
9 −1 2
− 1 − 1
2
1
−1 0
− 3 − 2
2 −1
1
5
9 2
− 1 − 1
1
6L
3
1
− 1
− 1
2
2
− 1 − 3 − 2
3
1
2
1 − 1 0
2 − 1 − 1
1
2 − 1
9 − 1
2
5
2
1
6L
lo que puede escribirse como:
0
− 1
3L
31L
−1
JI = 5
9
− 19
1
− 9
− 61L
− 61L
− 2L1
1
2L
1
6L
− 61L
− 21L
2
9
2
9
2
9
0
− 31L
− 19
2
9
− 19
2
9
5
9
2
9
− 19
2
9
− 19
2
9
− 19
− 19
2
9
2
9
2
9
1
6L
1
6L
1
3L
1
2L
− 61L
− 21L
1
6L
1
2L
1
6L
− 61L
− 19
1
6L
2
9
− 61L
− 19
− 31L
1
3L
0
− 19
− 19
5
9
el término dependiente de la velocidad angular será:
1
3 (ω y − ω x )(ω x + ω y − ω z )
− 13 (ωx − ωz )(ω x + ω y + ωz )
1
3 (ω x − ω y )(ω x + ω y + ω z )
~ =
2
2
2
4L
1
1
9 ω xω y + ω x ω z − 2 ω yω z + 2 ω x − ω y − ω z
49L ωxω y − 12 ω xωz + ω yωz − ω x 2 + 12 ω y 2 − ωz 2
4L 1
2
2
2
1
9 − 2 ωxω y + ω xωz + ω yωz − ωx − ω y + 2 ωz
(
(
(
)
)
)
si introducimos las matrices:
1 −1 1
2
3 − 1 − 3 − 2
0
J1 = − 2 − 1 − 3 − 1 0
1
3
1
2
3
1 − 3 − 2 − 1 1 − 1 0
2
2
2
2 − 1 − 1 2 − 1 − 1
5
J2 = −1 2 −1 2
5
2 − 1 2 − 1
2
2
5
− 1 − 1 2 − 1 − 1 2
y las matrices:
(ω y − ω x )(ωx + ω y + ωz )
~ = (ω − ω )(ω + ω + ω )
1
x
x
y
z
z
(ωx − ω y )(ωx + ω y + ωz )
ω xω y + ω xωz − 12 ω yωz + 12 ωx 2 − ω y 2 − ωz 2
~ = ω ω − 1 ω ω +ω ω −ω 2 + 1ω 2 −ω 2
2
y z
x
y
z
2
x y 2 x z
2
2
1
1
− 2 ω x ω y + ω xω z + ω y ω z − ω x − ω y + 2 ω z 2
las ecuaciones de la unidad pueden escribirse como:
=
aCG
J1A − 13 ~ 1
= 19 J 2 A − 49L ~ 2
1
6L
Configuración en L
En la configuración anterior, simplemente colocamos la tercera unidad en el origen:
1
p1 = L 0;
0
0
p 2 = L 1;
0
0
p 3 = 0
0
también colocamos todos los acelerómetros paralelos a un eje:
R1 = R 2 = R 3 = U
en este caso tendremos:
1
Q = ∑ p i = L 1 ;
i =1
0
3
3
(
I = ∑ Upi pi − pi pi
i =1
T
T
)
1 0 0
= L 0 1 0
0 0 2
2
La matriz clave del problema será:
−1
2 1 0
3
D = L2 1 2 0 =
0 0 4
1
4 L2
8 − 4 0
− 4 8 0
0 3
0
las matrices Fi son:
0 0 0
8 − 4 0 0 0 − 1
1
F1 =
− 4 8 0 0 0 − 2 = 12 L 0 0 − 12
3 6 0
0
0 3 1 2 0
0 2
0 12
8 − 4 0 0
0
0 1 = 121L 0
0 0
F2 = 121L − 4 8 0 0
0 3 − 2 − 1 0
0
− 6 − 3 0
0 0 − 12
8 − 4 0 0 0 − 1
1 = 121L 0 0
12
F3 = 121L − 4 8 0 0 0
0 3 1 − 1 0
0
3 − 3 0
1
12 L
La inversa por la izquierda será:
0 0
0
1
12 L 0 0 − 12
3 6
0
J −I 1 =
5 2 0
1
12 − 3 2 0
0
0
0
la cual puede escribirse como:
0
0
− 6
2
1
12 2
0
1
12 L
0
0
12
0
− 3 0
− 1 0
5 0
0 0
0
0
3
5
1
12 − 1
0
1
12 L
0
0
−3
−1
5
0
− 12
12
0
0
0
12
0
0
1
J −I 1 = 45L
12
− 121
0
0
0
1
2L
1
6
1
6
0
0
− L1
0
0
0
0
0
0
0
0
− 21L
1
6
− 41L
− 121
1
6
5
12
0
0
1
L
0
0
0
0
− 41L
− 121
0
0 41L
0 125
0 − 121
0 0
5
12
0
el término dependiente de la velocidad angular será:
ω yω z
− ω xωz
2
2
1
4 ωx − ω y
~ =
2
2
2
L
12 4ω xω y + ωx − 5ω y − 4ωz
12L 4ω xω y − 5ωx 2 + ω y 2 − 4ωz 2
0
(
(
(
)
)
)
si introducimos las matrices:
0 0 0
J 1 = 0 0 − 4
1 2 0
5 2 0
J 2 = − 1 2 0
0 0 0
− 4
0
0 0 0 0
4
− 2 − 1 0 1 − 1 0
2 −1 0 5 −1 0
2 5 0 −1 5 0
0 0 0 0
0 12
0
0
4 0
0
y las matrices:
4ω yωz
~ = − 4ω ω
1
x z
ω x 2 − ω y 2
4ω xω y + ω x 2 − 5ω y 2 − 4ωz 2
~ = 4ω ω − 5ω 2 + ω 2 − 4ω 2
2
x
y
z
x y
0
las ecuaciones de la unidad pueden escribirse como:
− L1
1
L
0
0
0
1
=
1
4L
J1A − 14 ~ 1
aCG = 121 J 2 A − 12L ~ 2
Reconstrucción del Estado del Sistema.
A partir de las aceleraciones obtenidas por el conjunto de acelerómetros puede
reconstruirse el estado instantáneo del sistema. Este proceso puede realizarse en un
microprocesador dedicado especialmente a la tarea o bien en una unidad central de
cálculo a bordo del vehículo.
El proceso de reconstrucción consta de dos etapas: 1) a partir de las aceleraciones se
obtienen las velocidades; 2) a partir de estas velocidades se obtiene la posición y la
actitud con respecto a los ejes tierra.
La primera etapa puede considerarse sencilla ya que las velocidades en ejes cuerpo
vienen dadas simplemente por:
t
t
= ∫ dt;
VCG = ∫ aCG dt
0
0
El problema principal es que la integral se está realizando en un marco de referencia que
depende del tiempo; por lo tanto, en cualquier discretización se debe considerar que el
marco de referencia entre dos instantes distintos se ha desplazado. Así mismo, se debe
considerar que, en realidad, estamos tratando de resolver una ecuación diferencial en
donde el integrando depende de manera no lineal de la incógnita, lo cual puede traer
serias complicaciones en los algoritmos. Cuando el integrando depende en forma simple
de la incógnita, como en el caso de la configuración de Debra para la primera integral,
puede utilizarse un algoritmo sencillo como por ejemplo el de Euler. Cuando el
integrando depende en forma fuertemente no lineal de la incógnita, deberán introducirse
algoritmos más robustos como los de Runge – Kutta de orden superior.
En la segunda etapa pretendemos conocer la posición del centro de gravedad y la actitud
de los ejes cuerpo con respecto a los ejes tierra. En realidad este problema ya fue resuelto
en el capítulo anterior durante la simulación: se trata del subsistema de las ecuaciones
cinemáticas del vehículo. La posición del centro de gravedad vendrá dada por:
t
′ = ∫ RVCG dt
rCG
0
en donde R es la matriz de cosenos directores de los ejes cuerpo con respecto a los ejes
tierra, la cual deberá calcularse a partir del vector velocidad angular
. Como
mencionamos en el capítulo sobre simulación, este último problema puede resolverse de
dos formas equivalentes: mediante los ángulos de Euler o mediante la forma de Gibbs. Es
interesante notar que la mayoría de los algoritmos existentes en las unidades inerciales
comerciales están basados en los ángulos de Euler. Sin embargo, como hemos visto, la
forma de Gibbs es una manera mucho más simple y adaptada al proceso iterativo de la
solución. El algoritmo resumido sería el siguiente:
φ=
n=
∆t
R
R φn = nnT + (U − nnT )cos(φ ) + [n ×]sen (φ )
R (t + ∆t ) = R φn R (t )
Es evidente que se requiere de una condición inicial para cada una de las variables que se
integran. Al encender la unidad pueden utilizarse condiciones triviales.
Errores de deriva y de pérdida de orto normalidad de la matriz de rotación.
Ortonormalización de la Matriz de Cosenos Directores.
Algoritmos de Re-estimación del Estado.
Como se ha visto, la reconstrucción del estado del vehículo a partir de los datos de la
unidad de medida inercial se ve afectada por la acumulación de errores durante el proceso
de integración. Se ha intentado dar respuesta a este problema introduciendo información
suplementaria, adquirida de forma independiente. Es decir, durante el funcionamiento de
la unidad, a diferentes instantes es posible que se obtenga información sobre los valores
instantáneos verdaderos de alguna de las variables y, esa información, puede utilizarse
para reducir el error acumulado en el algoritmo.
Existen dos fuentes principales de información independiente que han sido utilizadas:
a) El GPS: permite conocer la posición, al menos en el plano de tierra y las
componentes de la velocidad del centro de gravedad en el mismo plano.
b) El Magnetómetro:
Capítulo 7
Simulación
Simulador del Vehículo.
Consiste en resolver, mediante un método numérico las ecuaciones de movimiento del
vehículo.
Un primer punto es que se debe estudiar la atmósfera estándar para hacer una rutina que
cambie automáticamente la densidad (presentar la teoría de la atmósfera estándar).
También se debe estudiar un método numérico apropiado para resolver ecuaciones
diferenciales ordinarias de primer orden (presentar la teoría de los métodos Runge Kutta).
Ecuaciones de Movimiento:
Condiciones Iniciales:
′
rCG
φ
θ
ψ
R
R = R ✁k′R j A R φi
VCG
γ
R φn = nnT +
λ
R
VCG
VCG
cos(γ )cos(λ )
T
= R VCG cos(γ )sen(λ )
− sen (γ )
dVCG
d
d
mA
b
I
Fuerzas y Momentos:
c
tan(α ) = VCGZ VCGX
j
FA = R 180
−α (C D i V +
n
VCGV = R πjT−α VCG
tan (β ) = − VCGVY VCGVX
FT = ∑ Ti e i
i =1
Fg = m A R T k ′
F = Fg + FT + FA + FAs + Fm + Fd
M = M T + M A + M As + M m +
Anexos
Estándar Internacional de la Atmósfera Terrestre
El comportamiento de un vehículo al interior de una masa de fluido depende
fundamentalmente de la forma en que varíen las propiedades del fluido con respecto al
espacio y al tiempo; nos referimos a propiedades tales como la presión, temperatura
densidad y viscosidad. Por ello es esencial estudiar el comportamiento de una masa fluida
en reposo sometida a diferentes condiciones.
De hecho, la atmósfera es una capa de fluido que envuelve a ciertos planetas y que,
debido a diversos fenómenos físicos y químicos, puede considerarse como estratificada
en regiones hidrostáticas con condiciones que varían de una región a otra. La mayoría de
los fenómenos aludidos modifican la energía interna de las partículas de fluido de modo
que las condiciones que distinguen a una capa de otra son condiciones sobre el
comportamiento de la temperatura. Precisamente, debido a estas variaciones de
temperatura, la capa de fluido no es en realidad estática, sino que existen corrientes
dominantes y celdas de convección en cada una de las capas. Sin embargo, estos
fenómenos son demasiado complejos como para poder modelarlos de manera precisa. La
solución adoptada internacionalmente en el caso de la atmósfera terrestre es lo que
conocemos como atmósfera estándar internacional. Un estándar de este tipo se utiliza
para la planificación bajo condiciones idénticas y para verificar resultados
experimentales. Permite también la unificación de rangos en pruebas y en la calibración
de instrumentos, principalmente en altímetros y barómetros. Se recomienda su uso en el
tratamiento de resultados de observaciones en geofísica, meteorología y aeronáutica.
La atmósfera estándar comenzó a desarrollarse en la segunda década del siglo veinte de
manera independiente en Estados Unidos y en Europa. La organización “National
Advisory Committee for Aeronautics” (NACA), que posteriormente fue transformada en
la “National Aeronautics and Space Administration” NASA, generó el estándar conocido
como “American Standard Atmosphere” (ASA). Mientras que el estándar europeo fue
desarrollado por la “International Commission for Aerial Navigation” (ICAN). Ambos
estándares eran prácticamente idénticos, salvo por muy pequeñas diferencias. Estas
diferencias fueron resueltas por un comité internacional de modo que la Atmósfera
Estándar Internacional (ISA, “International Standard Atmosphere”) fue adoptada por la
Organización de Aviación Civil Internacional (OACI) en 1952. A partir de esa fecha, el
estándar a sufrido algunas modificaciones de modo que la última publicación de la OACI
es el documento Doc 7488-CD de 1993. El estándar de la “International Standard
Organization” ISO es el documento ISO 2533:1975. El estándar conocido como la “US
Standard Atmosphere” es el documento NASA TM-X-74335 emitido en 1976. Por
razones de disponibilidad, este anexo está basado mayormente en este último documento.
Finalmente, puesto que en la bibliografía aeronáutica, sobre todo la más antigua, se
acostumbra anexar una serie de tablas de atmósfera estándar para “facilitar” los cálculos,
nosotros realizaremos una comparación gráfica entre los valores de temperatura, presión
densidad y viscosidad, dados en la literatura y los obtenidos con las fórmulas. Nosotros
recomendamos fuertemente que el estudiante utilice las fórmulas que definen a los
modelos (que aprenda a programarlas y utilizarlas dentro de sus algoritmos como
funciones de utilidad) en lugar de leer tablas y hacer interpolaciones en las mismas. Este
último método debe ser considerado arcaico y con una precisión deplorable, además,
debe ser considerado como fuente de una infinidad de errores aritméticos que nublan el
entendimiento.
El concepto principal que debe asimilarse es que el estándar de la atmósfera internacional
está basado en un perfil de temperatura con respecto a la altitud. Este perfil es fijo en con
respecto al tiempo y fue determinado mediante un intenso programa de observaciones
empíricas. El perfil de temperatura está formado por dos tipos de regiones: regiones a
temperatura constante (denominadas pausas) y regiones con una variación lineal de la
temperatura (denominadas capas esféricas o simplemente capas). En seguida, las
propiedades de la atmósfera tales como presión y densidad pueden ser expresadas
analíticamente como funciones de la altitud mediante la ecuación de la hidrostática y la
ecuación de estado de los gases. Sin embargo, antes de proceder con el desarrollo de las
fórmulas, debemos establecer claramente lo que se entiende por “altitud”.
Tenemos tres diferentes definiciones de altitud: absoluta, geométrica y geopotencial. La
altitud absoluta es la distancia a partir del centro de la tierra hasta el punto que se está
analizando. Por su parte, la altitud geométrica es la distancia a partir del nivel medio del
mar hasta el punto en cuestión. Estas dos altitudes se relacionan mediante la siguiente
expresión:
ha = hG + R0
en donde ha es la altitud absoluta, hG es la altitud geométrica y R0 = 6.356766 × 106 [m ]
es el radio de la esfera denominada nivel medio del mar. Históricamente, las medidas de
las propiedades atmosféricas se basaban en la suposición de que la aceleración de la
gravedad es constante. Esta suposición condujo a la creación del concepto de altitud
geopotencial. La distancia geopotencial es la distancia, en un campo gravitatorio
constante, que sería necesario recorrer para obtener el mismo incremento de energía
potencial (por unidad de masa) que en un campo gravitatorio real (que varía con la
distancia):
g 0dh = g (hG )dhG
[
]
en donde g 0 = 9.80665 m s 2 es la aceleración de la gravedad al nivel medio del mar
g (0) = g 0 y es también el campo gravitatorio constante que se adopta como referencia.
Por otro lado, se sabe que la aceleración de la gravedad terrestre varía con la altitud
geométrica como:
R0
g (hG ) = g 0
R0 + hG
2
por lo que, substituyendo en la ecuación anterior obtenemos:
2
R0
dhG
dh =
R0 + hG
integrando esta relación desde el nivel medio del mar en el que h = hG = 0 obtenemos la
fórmula para la altitud geopotencial:
h=
R0hG
R0 + hG
Puesto que el estándar está basado en la altitud geopotencial, en realidad debemos
calcular la altitud geométrica correspondiente, es decir:
hG =
R0 h
R0 − h
Es de señalar que, en la práctica, la diferencia entre las altitudes geométrica y potencial es
importante sólo para altitudes geométricas superiores a los quince kilómetros.
Una vez definido el concepto de altitud geopotencial, el paso siguiente consiste en definir
el rango de altitudes geopotenciales o geométricas en el cual es válido el estándar.
Generalmente, las normas internacionales han sido emitidas hasta altitudes de mil
kilómetros. Sin embargo, puesto que nuestro objetivo es el estudio del movimiento de
vehículos dentro de la capa fluida, debemos adoptar un límite mucho menor ya que
cuando la capa fluida se enrarece, los efectos aerodinámicos sobre el movimiento se
vuelven despreciables. Fue el científico húngaro – americano Theodore Von Kármán
quien propuso que el límite superior de la atmósfera, para propósitos prácticos, estuviera
definido como aquella altitud a la cual un vehículo tendría que viajar más rápido que la
velocidad orbital correspondiente como para producir el levantamiento necesario para
sostenerse. Von Kármán determinó que esta altitud es muy cercana a los 100 kilómetros y
propuso esta cifra como definición. En honor a este científico, la altitud de cien
kilómetros se conoce con el nombre de Línea de Von Kármán y, de hecho, hoy en día la
“Fédération Aéronautique Internationale” (FAI) considera esta altitud como la línea de
separación entre la aeronáutica y la astronáutica. Así, nosotros estudiaremos el estándar
internacional de la atmósfera terrestre en el rango de cero a cien kilómetros de altitud, es
decir, entre la línea del nivel medio del mar y la línea de Von Kármán.
Esta región se divide en ocho sub regiones con diferentes propiedades. Las capas y
pausas del estándar internacional de la atmósfera terrestre se definen en la tabla siguiente.
Para referencia se ha agregado una columna con la altitud geométrica correspondiente.
De hecho, la mesopausa tiene su límite antes de la línea de Von Kármán, pero nosotros la
extenderemos hasta los cien kilómetros considerando que, para los propósitos de este
trabajo, la diferencia es despreciable.
La troposfera comienza en la línea del nivel medio del mar y se extiende hasta los 11
kilómetros. Esta capa es calentada principalmente por la transferencia de energía de la
superficie terrestre así que, en promedio, la base es más caliente y la temperatura decrece
con la altitud. Esta situación, claramente inestable para un fluido compresible, favorece
una mezcla vertical de los gases y es por este fenómeno que la capa toma su nombre de la
palabra griega “
” que significa vuelta o giro. La mayoría de los vehículos de
pasajeros se desenvuelven en esta capa. Las masas de aire en la troposfera se encuentran
en constante movimiento de modo que la región se caracteriza por vientos cambiantes,
ráfagas y mucha turbulencia. La influencia de la turbulencia y los fuertes gradientes de
velocidad sobre la integridad estructural de la aeronave y sobre su desempeño siguen
siendo temas importantes de investigación en aeronáutica. Las cargas estructurales
impuestas sobre una aeronave durante un encuentro con aire turbulento pueden reducir la
vida útil del planeador o bien, en caso de turbulencia severa, pueden causar daño
estructural. Los gradientes de velocidad son un fenómeno atmosférico importante que
puede ser de peligro para las aeronaves durante los despegues o los aterrizajes.
La tropopausa se extiende desde los once hasta los veinte kilómetros. Es una región en
donde el movimiento del aire pierde la variabilidad que caracteriza a la troposfera.
La siguiente capa es la estratosfera. Está compuesta de dos sub capas con gradientes de
temperatura diferentes pero ambos negativos. La primera subcapa se extiende desde el
límite de la tropopausa hasta los veinte kilómetros, mientras que la segunda llega hasta
los treinta y dos kilómetros. La variabilidad del movimiento del aire se reduce
significativamente debido a que el gradiente de temperatura se invierte y esto restringe la
turbulencia y la mezcla. A diferencia de la troposfera, la estratosfera es una región
relativamente tranquila, libre de ráfagas y turbulencia, pero caracterizada por vientos
constantes de alta velocidad. Se han medido velocidades de viento de hasta 37 metros por
segundo.
La estratopausa se extiende de los treinta y dos hasta los cincuenta y un kilómetros
manteniendo una temperatura muy cercana a los cero grados centígrados y una presión de
una milésima de la presión al nivel del mar aproximadamente.
Sobre la estratopausa se encuentra la mesosfera que está compuesta también de dos
subcapas que se diferencian por el valor del gradiente de temperatura. La primera
subcapa abarca de los cincuenta y uno hasta los setenta y un kilómetros, mientras que la
segunda comienza aquí y termina a los ochenta y cinco kilómetros aproximadamente. En
esta región es en donde la mayoría de los meteoritos se desintegran. La temperatura
decrece con la altitud por lo que pueden existir vientos variables y turbulencia.
La mesopausa, abarca desde los ochenta y cinco kilómetros hasta la línea de Von Kármán
(cien kilómetros, para los propósitos de este trabajo). Esta región es considerada como el
lugar más frío de la tierra. La temperatura es prácticamente constante con un valor de
unos ciento setenta grados Kelvin, es decir como unos cien grados centígrados por debajo
del cero. Sobre de esta capa se encuentra una capa muy amplia conocida como termosfera
ya que la temperatura comienza a aumentar y puede llegar hasta los 2000 ºK. Sin
embargo, el gas esta tan enrarecido a esas altitudes, que el concepto de temperatura tal y
como lo conocemos pierde su sentido
Considerando una temperatura T0 = 15º C = 288.15º K al nivel medio del mar, en la
gráfica siguiente se muestra el perfil de temperatura que define la atmósfera estándar
internacional entre cero y cien kilómetros de altitud (geométrica).
Las fórmulas para la presión y la densidad del aire se obtienen a partir de la ecuación de
la hidrostática. Trataremos primero el caso de las capas esféricas en las cuales el
gradiente de temperatura es lineal. Suponiendo la aceleración de la gravedad constante
tenemos:
dP
= − ρ (h )g 0
dh
Si tomamos en cuenta la ecuación de estado del gas:
P = ρ (h )RaT (h )
m2
en donde Ra = 287 2 es la constante del gas para el aire y T es la temperatura,
s º K
podemos obtener, dividiendo ambas expresiones:
dP
g dh
=− 0
P
RaT (h )
De modo que si en la capa considerada la temperatura varía como:
T (h ) = Tc + λ (h − hc )
tendremos:
T + λ (h − hc )
P
g
ln = − 0 ln c
Ra λ
Tc
Pc
En donde Pc , Tc , hc son la presión, la temperatura y la altitud geopotencial en la base de la
capa esférica. Esta ecuación puede escribirse en forma más conveniente como:
P T
=
Pc Tc
−
g0
Ra λ
la variación de la densidad puede determinarse a partir de la ecuación de estado, una vez
conocida la presión:
ρT
P
=
Pc ρ cTc
en donde ρ c es la densidad en la base de la capa esférica. Substituyendo el valor de la
presión obtenemos:
ρ T
=
ρ c Tc
g
− 1+ 0
Ra λ
Por otra parte, para las pausas de la atmósfera estándar, sabiendo que se trata de regiones
isotérmicas, partimos de la ecuación de la hidrostática nuevamente y obtenemos:
P
g
ln = − 0 (h − h p )
RT p
Pp
en donde Pp , T p , h p son la presión, la temperatura y la altitud geopotencial en la base de la
pausa. La expresión anterior puede escribirse como:
−
P
=e
Pp
(
g0 h − h p
)
Ra T p
la variación de la densidad en las pausas será:
−
ρ
=e
ρp
(
g0 h −h p
)
Ra T p
Por su parte, la viscosidad del aire depende fuertemente de la temperatura. La variación
de esta propiedad puede calcularse mediante la fórmula de Sutherland que tiene su origen
en una teoría cinética de gases pero que, finalmente, es ajustada empíricamente a datos
experimentales. La fórmula es:
3
T 2 T + S
µ = µ0 0
T0 T + S
en donde µ0 y T0 son ciertos valores de referencia y S es la llamada temperatura de
Sutherland. La fórmula de Sutherland es válida para varios gases puros y no aplica para
mezclas de gases. Sin embargo, el aire, siendo una mezcla, califica para el uso de la
fórmula debido a que sus dos principales componentes, oxígeno y nitrógeno, son
moléculas diatómicas muy similares. Tanto los valores de referencia como la temperatura
de Sutherland difieren para cada sustancia y se determinan experimentalmente. En el caso
del aire se pueden usar los siguientes valores:
Ns
; T0 = 288.15[º K ] ; S = 110.1[º K ]
2
m
µ0 = 1.812 × 10−5
Ahora bien, utilizando los valores en la base de cada región podemos introducir un
conjunto de variables reducidas que ayudan a simplificar los cálculos. Definamos primero
una variable de altitud en unidades del radio terrestre:
ζ =
h
R0
Para la aceleración de la gravedad a cada altitud podemos introducir la variable:
γ=
1
g
=
g 0 (1 + ζ )2
Ahora bien, en cada capa, definimos el gradiente:
λh =
Tc
h − hc
entonces, para la temperatura podemos introducir la variable:
θ=
T
= 1 + λc λh en las capas y θ = 1 en las pausas
Tc
en donde λc es el gradiente estándar de la capa correspondiente. Enseguida, para la
presión tendremos:
g0
g0
−
−
P
δ = = θ Ra λc en las capas y δ = e Ra λh en las pausas
Pc
y para la densidad:
g0
g0
a c
a h
− 1+
−
ρ
R λ
=θ
en las capas y σ = e R λ en las pausas
σ=
ρc
Una propiedad muy interesante de la fórmula de Sutherland es su autosimilaridad, es
decir, si el valor µc se calcula con la misma fórmula para la temperatura Tc , entonces,
estos valores pueden utilizarse en lugar de los valores de referencia µ0 y T0 . Por lo tanto,
suponiendo que se conocen los valores en la base de la región, podemos introducir la
variable:
3
2
1 + θS
µ T Tc + S
en las capas y π = 1 en las pausas
=
=θ
π=
θ + θS
µc Tc T + S
3
2
en donde θ S = S Tc será la constante de Sutherland reducida en la región que se trate.
Resumiendo todo lo anterior, podemos realizar la siguiente tabla de constantes, valores de
referencia y fórmulas para las regiones de la atmósfera estándar consideradas:
m2
Constantes: Ra = 287 2 ; S = 110.1[º K ] ; R0 = 6.356766 × 106 [m ]
s º K
Nivel Medio del Mar:
g 0 = 9.80665 m s 2 ;
[
]
Ns
T0 = 288.15[º K ] ; P0 = 101325[Pa ] ; ρ 0 = 1.225[º K ] ; µ0 = 1.812 × 10 −5 2
m
Troposfera: 0 ≤ h ≤ 11 [Km] ; hc = 0 ; λc = −6.5[º K Km]; θ S = S T0
−
T
λh = 0 ; θ = 1 + λc λh ; δ = θ
h
1000 g 0
Ra λc
; σ =θ
1000 g 0
− 1+
Ra λc
3
; π =θ 2
1 + θS
θ + θS
Altitud 11 kilómetros:
−
θ1 = 1 + 11λc T0 ; δ1 = θ1
1000 g 0
Ra λc
1000 g 0
− 1+
Ra λc
1
; σ1 = θ
3
; π 1 = θ12
1 + θS
θ1 + θ S
T1 = T0θ1 ; P1 = P0δ1 ; ρ1 = ρ 0σ 1 ; µ1 = µ0π 1
Tropopausa: 11 ≤ h ≤ 20 [Km] ; hc = 11 ; λc = 0[º K Km] ; θ S = S T1
g0
g0
−
−
T
λh = 1 ; θ = 1 ; δ = e Ra λh ; σ = e Ra λh ; π = 1
h − 11
Altitud 20 kilómetros:
−
9000 g 0
−
9000 g 0
θ2 = 1 ; δ 2 = e R T ; σ 2 = e R T ; π 2 = 1
T2 = T1θ 2 ; P2 = P1δ 2 ; ρ 2 = ρ1σ 2 ; µ2 = µ1π 2
a 1
a 1
Estratosfera I: 20 ≤ h ≤ 32 [Km] ; hc = 20 ; λc = 1 [º K Km] ; θ S = S T2
−
T
λh = 2 ; θ = 1 + λc λh ; δ = θ
h − 20
Altitud 32 kilómetros:
1000 g 0
Ra λc
; σ =θ
1000 g 0
− 1+
Ra λc
3
; π =θ 2
1 + θS
θ + θS
−
θ 3 = 1 + 12λc T2 ; δ 3 = θ3
1000 g 0
Ra λc
1000 g 0
− 1+
Ra λc
3
; σ3 = θ
1 + θS
θ3 + θ S
3
; π 3 = θ 32
T3 = T2θ 3 ; P3 = P2δ 3 ; ρ 3 = ρ 2σ 3 ; µ3 = µ2π 3
Estratosfera II: 32 ≤ h ≤ 47 [Km] ; hc = 32 ; λc = 2.8 [º K Km]; θ S = S T3
−
T
λh = 2 ; θ = 1 + λc λh ; δ = θ
h − 32
1000 g 0
Ra λc
; σ =θ
1000 g 0
− 1+
Ra λc
3
; π =θ 2
1 + θS
θ + θS
Altitud 47 kilómetros:
−
θ 4 = 1 + 15λc T3 ; δ 4 = θ 4
1000 g 0
Ra λc
; σ4 = θ
1000 g 0
− 1+
Ra λc
4
3
; π 4 = θ 42
1 + θS
θ4 + θ S
T4 = T3θ 4 ; P4 = P3δ 4 ; ρ 4 = ρ 3σ 4 ; µ4 = µ3π 4
Estratopausa: 47 ≤ h ≤ 51 [Km] ; hc = 4 ; λc = 0[º K Km] ; θ S = S T4
g0
g0
−
−
T
λh = 4 ; θ = 1 ; δ = e Ra λh ; σ = e Ra λh ; π = 1
h − 47
Altitud 51 kilómetros: valores de referencia cinco
−
4000 g 0
Ra T4
−
4000 g 0
Ra T4
θ5 = 1 ; δ 5 = e
; σ5 = e
; π5 = 1
T5 = T4θ 5 ; P5 = P4δ 5 ; ρ 5 = ρ 4σ 5 ; µ5 = µ4π 5
Mesosfera I: 51 ≤ h ≤ 71 [Km] ; hc = 51 ; λc = −2.8 [º K Km] ; θ S = S T5
−
T
λh = 2 ; θ = 1 + λc λh ; δ = θ
h − 51
1000 g 0
Ra λc
; σ =θ
1000 g 0
− 1+
Ra λc
3
; π =θ 2
1 + θS
θ + θS
Altitud 71 kilómetros:
−
θ 6 = 1 + 20λc T5 ; δ 6 = θ 6
1000 g 0
Ra λc
; σ6 = θ
1000 g 0
− 1+
Ra λc
6
3
; π 6 = θ 62
1 + θS
θ6 + θ S
T6 = T5θ 6 ; P6 = P5δ 6 ; ρ 6 = ρ 5σ 6 ; µ6 = µ5π 6
Mesosfera II: 71 ≤ h ≤ 84.855 [Km] ; hc = 71 ; λc = −2.0 [º K Km]; θ S = S T6
−
T
λh = 2 ; θ = 1 + λc λh ; δ = θ
h − 71
1000 g 0
Ra λc
; σ =θ
1000 g 0
− 1+
Ra λc
Altitud 84.855 kilómetros: valores de referencia siete
Mesopausa: fórmulas de la pausa con valores siete
Línea de Von Kármán: valores de referencia ocho
3
; π =θ 2
1 + θS
θ + θS
Posición
Nivel Medio del
Mar
Troposfera
Tropopausa
Estratosfera I
Estratosfera II
Estratopausa
Mesosfera I
Mesosfera II
Mesopausa y
Línea de Von
Kármán
Densidad
Viscosidad
288.15 101325
Kg m 3
1.225
m2 s
1.479e-5
216.65
216.65
228.65
270.65
270.65
214.65
186.94
186.94
0.363
0.088
0.013
0.001
8.583e-4
6.387e-5
6.909e-6
4.333e-7
3.939e-5
1.629e-4
1.137e-3
1.212e-2
2.008e-2
2.225e-1
1.822
29.061
Altitud
Geopotencial
Altitud
Geométrica
Temperatura
Presión
Km
Km
ºK
Pa
0
0.000
11
20
32
47
51
71
84.855
98.451
11.019
20.063
32.162
47.349
51.412
71.800
86.000
100.000
22614
5466
865
110
66
4
0.370
0.023
Métodos de Runge Kutta.
Como hemos visto con el método de Euler, el objetivo de cualquier método para resolver
ecuaciones diferenciales ordinarias debe ser evaluar las coordenadas del sistema q en el
instante tn +1 , a partir del conocimiento de las mismas en un instante anterior tn . Fue
Runge el primer investigador en sugerir que era posible evitar las diferenciaciones
sucesivas de la serie de Taylor sin perder la precisión del método. El punto principal de
su sugerencia es utilizar el operador de evolución F(t , q ) = q evaluado en diversos puntos
del intervalo (tn , tn +1 ) para, mediante una combinación lineal con parámetros que deberán
determinarse, igualar la precisión del desarrollo de Taylor.
Definamos, primeramente, la forma general de los métodos de Runge Kutta. Las nuevas
coordenadas serán evaluadas mediante la combinación lineal:
K
q n +1 = q n + ∑ wi ki
i =1
en donde los wi son los coeficientes que deben ser determinados y los ki son
evaluaciones del operador de evolución en los K puntos internos del intervalo (tn , tn +1 ) :
K
ki = hF tn + ci h, q n + ∑ aij k j
j =1
en donde se define siempre c1 = 0 y h = tn +1 − tn es el intervalo de tiempo. Algunos
comentarios son necesarios. Primeramente, si se satisface la condición aij = 0 para los
índices i ≤ j , entonces los ki pueden evaluarse sucesivamente y el método se denomina
explícito. En efecto, los ki son:
k1 = hF(tn , q n )
k 2 = hF(tn + c2 h, q n + a21k1 )
k3 = hF(tn + c3h, q n + a31k1 + a32 k 2 )
k K = hF(tn + cK h, q n + a K 1k1 + a K 2 k2 + a K 3k3 +
a K , K −1k K −1 )
y es evidente que estas cantidades pueden evaluarse sucesivamente sin ninguna
dificultad. En cambio, si la condición aij = 0 para i ≤ j no es satisfecha, los ki son:
k1 = hF(tn + c1h, q n + a11k1 + a12 k 2 +
a1K k K )
k3 = hF(tn + c3h, q n + a31k1 + a32 k 2 +
a3 K k K )
k 2 = hF(tn + c2 h, q n + a21k1 + a22 k2 +
k K = hF(tn + ci h, q n + a K 1k1 + a K 2 k 2 +
a2 K k K )
a KK k K )
lo cual genera un sistema no lineal en los ki muy difícil de resolver. Estos métodos se
denominan implícitos.
Es fácil reconocer lo que representa el primer método de Runge – Kutta, es decir, si
hacemos K = 1 obtenemos:
q n +1 = q n + w1hF(tn , q n )
lo que, comparando con los primeros términos de la serie de Taylor de para q n +1 :
q n +1 = q n + hq + O (h 2 )
junto con el operador de evolución F(t , q ) = q nos da:
w1 = 1
por lo que, finalmente, obtenemos el método de Euler:
q n +1 = q n + hF(tn , q n )
Este sencillo procedimiento puede extenderse para métodos más elaborados con K > 1 .
Cálculo de coeficientes para métodos explícitos.
Método de cuarto orden.
Método de quinto orden.
Método Runge Kutta Felhberg de paso adaptativo.