Academia.eduAcademia.edu

Dinámica de vehiculos autonomos

2010, dinamica de vehiculos autonomos

dinamica de vuelo dr carlos manuel rodriguez roman

′ = RVCG ′ = RVCG rCG rCG F F VCG = − [ ×]VCG VCG = − [ ×]VCG mA mA R = [R ×]R R = [R ×]R −1 −1 = I (M − [ ×]I ) = I (M − [ ×]I ) ′ = RVCG ′ = RVCG rCG rCG F F − [ ×]VCG − [ ×]VCG VCG = VCG = mA mA R = [R ×]R R = [R ×]R −1 −1 = I (M − [ ×]I ) = I (M − [ ×]I ) ′ = RVCG ′ = RVCG rCG rCG F F − [ ×]VCG VCG = − [ ×]VCG VCG = mA mA R = [R ×]R R = [R ×]R −1 −1 = I (M − [ ×]I ) = I (M − [ ×]I ) Índice Capítulo 1 Introducción ......................................................4 El Vehículo..................................................................................................................... 4 Comentarios sobre la notación .................................................................................... 6 Capítulo 2 Dinámica de Sistemas ....................................10 Cadenas Dinámicas ..................................................................................................... 10 Principio de Mínima Acción ...................................................................................... 12 Ecuaciones de Euler - Lagrange. ............................................................................... 13 Teoría de Pequeñas Perturbaciones .......................................................................... 16 Solución General del Sistema Dinámico de Control ................................................ 21 Sub Espacios Invariantes ........................................................................................... 23 Modos Normales.......................................................................................................... 30 Estabilidad ................................................................................................................... 34 Teorema de Cayley - Hamilton .................................................................................. 41 Teorema de Controlabilidad...................................................................................... 44 Representación Externa ............................................................................................. 45 Diseño de Controladores ............................................................................................ 47 Ejemplo del Péndulo Invertido .................................................................................. 50 Capítulo 3 Ecuaciones de Movimiento del Vehículo......59 Ejes de Referencia....................................................................................................... 59 Rotaciones en el Espacio............................................................................................. 61 Forma de Gibbs de la Matriz de Rotación................................................................ 63 Transformación de Coordenadas y de Componentes.............................................. 66 Transformaciones por los Ángulos de Euler ............................................................ 68 Sistemas de Referencia en Movimiento..................................................................... 72 Relaciones entre Sistemas de Referencia .................................................................. 77 Dinámica del Cuerpo Elástico.................................................................................... 82 Sistema Dinámico del Vehículo.................................................................................. 91 Fuerzas y Momentos. ................................................................................................ 104 Momentos Másicos para Eslabones......................................................................... 111 Par Dinámico Corredera: Un Eje de Deslizamiento.............................................. 112 Par Dinámico Articulación: Un Eje de Rotación ................................................... 114 Capítulo 4 Compensación ..............................................119 Análisis Dimensional................................................................................................. 119 Adimensionalización de las Ecuaciones de Movimiento........................................ 126 Definición de los Estados de Referencia.................................................................. 129 Análisis Cinemático. ................................................................................................. 131 Análisis Dinámico...................................................................................................... 132 Vuelo Estacionario .................................................................................................... 133 Vuelo Rectilíneo ........................................................................................................ 136 Vuelo Curvilíneo ....................................................................................................... 139 Capítulo 5 Estabilidad .....................................................145 Ecuaciones del Movimiento Perturbado................................................................. 145 Derivadas de Estabilidad.......................................................................................... 150 Vuelo Estacionario .................................................................................................... 158 Vuelo Rectilíneo ........................................................................................................ 158 Vuelo Curvilíneo ....................................................................................................... 174 Capítulo 6 Control .........................................................178 Derivadas de Control ................................................................................................ 178 Unidades de Mediad Inercial ................................................................................... 178 Capítulo 7 Simulación .....................................................198 Simulador del Vehículo. ........................................................................................... 198 Anexos..............................................................................200 Estándar Internacional de la Atmósfera Terrestre ............................................... 200 Métodos de Runge Kutta.......................................................................................... 211 Capítulo 1 Introducción El Vehículo El objetivo fundamental de la dinámica de vehículos es el de predecir el movimiento del artefacto a partir de una condición inicial bien definida. Ahora bien, la dinámica del vehículo, está determinada por el funcionamiento de todas y cada una de sus partes. Es decir, si se desea predecir cual será el movimiento de un vehículo, se requiere de todo el conocimiento necesario para predecir el comportamiento de cada parte o subsistema. Es evidente que no puede verterse todo este conocimiento en un solo texto, pues resultaría de proporciones inmanejables. En el presente trabajo, daremos una breve introducción de algunos de los conceptos que se requieran conforme se haga necesario, sin embargo, remitiremos al lector a textos más completos sobre temas particulares. Nuestro objetivo principal es el de poner las bases necesarias y suficientes para que el estudiante pueda tener una idea integral de los pasos que deben seguirse al diseñar y analizar un vehículo. En un caso práctico, será necesario recurrir a otras fuentes de información para detalles particulares tales como la teoría de mecanismos, teoría del control, teoría de máquinas térmicas, la mecánica de fluidos, la mecánica de sólidos elásticos o teoría de la elasticidad, etc. Una ventaja de esta perspectiva, es que el estudiante puede darse cuenta del porqué es necesario estudiar dichos temas en profundidad, antes de lanzarse a la aventura de diseñar, analizar y construir un vehículo; esto es, si desea hacerlo con el conocimiento científico con el que cuenta la humanidad hoy en día, a un nivel de verdadera ingeniería; si desea solamente lograr “algo” que se mueva, puede ahorrarse “tanta física y tantas matemáticas...” Existe un sinnúmero de vehículos distintos diseñados para el transporte en diferentes medios y condiciones. Esta circunstancia implica que, a lo largo del tiempo, se ha desarrollado una subdivisión de la dinámica de vehículos en diferentes ramas que han evolucionado, en ocasiones, en forma independiente. Entre ellas podemos mencionar la mecánica de vuelo, la mecánica orbital, la mecánica de navíos o náutica, etc. Sin embargo, independientemente de la clase de vehículo de que se trate, la dinámica de vehículos puede dividirse en tres áreas de acuerdo con la finalidad del estudio, éstas áreas son: análisis estructural, análisis de estabilidad y control y, finalmente, análisis de actuaciones. Tradicionalmente, cada una de estas áreas ha estudiado el movimiento del vehículo según perspectivas y métodos diferentes. A continuación explicitamos brevemente el enfoque de cada área. En el análisis estructural se considera al vehículo como un cuerpo deformable tridimensional. Se está interesado en el estudio de las traslaciones, rotaciones y deformaciones. El objetivo de este análisis es garantizar la integridad estructural del vehículo en las diferentes condiciones de movimiento. La integridad estructural implica el análisis de los esfuerzos a que están sometidos los diferentes elementos y materiales con que está construido el vehículo. Las distintas solicitaciones a que se ve sometido durante su movimiento son debidas principalmente a dos factores: el medio fluido que lo rodea, a través de las fuerzas aerodinámicas, y la curvatura o aceleración de su trayectoria, a través de las fuerzas inerciales (en el caso de vehículos espaciales los esfuerzos debidos a gradientes de temperatura son también muy importantes). Los análisis estructurales generalmente involucran tiempos muy cortos, del orden del inverso de la frecuencia de oscilación de un elemento característico. En el área de estabilidad y control se considera al vehículo como un cuerpo rígido tridimensional y se está interesado en el estudio de las traslaciones y rotaciones. Su objetivo es garantizar la maniobrabilidad del vehículo en las diferentes condiciones de movimiento. Se entiende por "maniobrabilidad" la capacidad para controlar la trayectoria, cuando el vehículo es sometido a diferentes perturbaciones. Si las perturbaciones son externas a la aeronave, se habla de estabilidad. Si las perturbaciones son debidas a las acciones del piloto o de un sistema automático, se habla de control. Los cálculos de estabilidad son válidos en periodos más o menos cortos de tiempo, del orden del tiempo medio de amortiguamiento de una perturbación. El análisis de actuaciones considera al vehículo como un punto material sin dimensiones. Se interesa en el estudio de las traslaciones. Su objetivo es garantizar los rendimientos y las limitaciones del vehículo en las diferentes condiciones de operación. Los "rendimientos" y las "limitaciones" son los diferentes parámetros impuestos al diseño en vista de su utilización así como por reglamentación, respectivamente. Se puede pensar que el análisis de actuaciones estudia el comportamiento a largo plazo del vehículo. Ahora bien, debe estar claro que estas divisiones se realizan para la comodidad de estudio, sin embargo, en la práctica, las hipótesis presentadas en cada rama pueden ser demasiado limitativas para un problema dado. Por ejemplo, en la determinación del tiempo de ascenso de un aeroplano, la reducción al punto material conduce a resultados poco satisfactorios ya que no se consideran los tiempos de ciertos virajes. Igualmente, en la determinación de la estabilidad de una trayectoria de vuelo, puede ser necesario considerar las deflexiones provocadas por las diferentes cargas aerodinámicas; es decir, dejar de lado la hipótesis del cuerpo rígido. Podría pensarse que, en estricto apego a la física, todos los problemas de la dinámica de vehículos deberían resolverse tomando en cuenta el carácter elástico de los elementos que forman al vehículo, así como el carácter de fluido real del medio en que éste evoluciona. Sin embargo, el planteamiento del problema en estos términos conduce a un sistema de ecuaciones diferenciales parciales, con geometría variable en el tiempo, el cual resultaría extremadamente complejo a resolver o analizar. Incluso con los medios computacionales de que disponemos hoy en día, el cálculo de una solución para dicho sistema de ecuaciones es impensable. En estas notas presentaremos los métodos más modernos que están siendo utilizados para abordar el problema. Originalmente, este material fue preparado para un curso de mecánica de vuelo, por lo que parece apropiado definir dicha área del conocimiento. La mecánica de vuelo puede definirse como la ciencia que estudia el movimiento de las aeronaves en la atmósfera terrestre (o al interior de una masa gaseosa, siendo más generales). Algunos autores consideran que el "vuelo" orbital de satélites y astronaves, también forma parte de la mecánica de vuelo, sin embargo, nosotros preferimos hacer la distinción en un nivel superior, es decir entre aeronáutica y astronáutica, debido a la diferencia fundamental entre los medios en que se desarrolla el movimiento de estos vehículos. Las aeronaves evolucionan siempre en el interior de una masa fluida; en cambio, las astronaves están sometidas a tres regímenes de movimiento: en el exterior de la atmósfera, al interior de la atmósfera y la etapa de transición o reingreso a la atmósfera. Comentarios sobre la notación Las cantidades físicas que se emplean en el análisis pueden ser escalares, vectores, matrices o, más generalmente, tensores. Comúnmente, existen tres tipos de notación utilizada para representar dichas cantidades: la vectorial, la matricial y la tensorial. La notación vectorial, a pesar de ser la más común en la bibliografía, no se utilizará debido a que en ella se pierde todo rastro del sistema de referencia. Esta característica es justamente lo que se considera valioso de la notación vectorial, sin embargo, cuando existen varios sistemas de referencia y se desea conocer las relaciones entre las componentes en los diversos sistemas, dicha notación resulta confusa. En esta notación los escalares se representan con letras normales, comúnmente minúsculas, mientras que los vectores se denotan con una flecha sobre la literal que representa al vector. Por su parte, la notación matricial representa el conjunto de componentes de un vector, matriz o tensor con respecto a un sistema de referencia específico, mediante un arreglo rectangular de números. En una ecuación matricial se representa una identidad entre las componentes de ciertas matrices con respecto a uno o más sistemas de referencia explícitamente definidos. Se ha decidido usar la notación matricial en este texto en razón de ser, quizá, la de más fácil entendimiento para el estudiante de los primeros semestres del nivel superior. En esta notación los escalares son letras normales, mientras que para las matrices se utilizan letras negritas (en este texto utilizaremos indistintamente mayúsculas y minúsculas). Los vectores se consideran matrices con una dimensión unitaria, es decir, ya sea matrices con un solo renglón o bien matrices con una sola columna. Es necesario realizar una convención a este respecto ya que, según se defina el producto matricial, ambos tipos no son equivalentes. Así, hemos optado por representar todos los vectores como matrices columna (con una sola columna), mientras que el producto matricial se define como el producto renglón por columna, sumando sobre las componentes. En cuanto a la notación tensorial, es la más moderna y desarrollada. Al igual que la matricial, esta notación se refiere a las componentes de un tensor con respecto a cierto sistema de referencia, pero generaliza las nociones para incluir tensores de orden superior a dos así como sistemas de referencia curvilíneos y no ortogonales. Si bien sería la notación más apropiada para este texto, se ha descartado ya que es de uso poco común en el nivel superior. Además, el uso de la llamada convención de Einstein hace que se requiera cierto tiempo para habituarse a su correcta interpretación. En esta notación, un escalar se considera un tensor de orden cero, un vector es un tensor de orden uno, una matriz es un tensor de orden dos y se abre la posibilidad a tensores de órdenes superiores. Todos los tensores se representan mediante letras normales con una lista de subíndices cuyo número corresponde al orden del tensor (aquí solo consideraremos tensores cartesianos para los cuales no existe la distinción covariante, contravariante; el lector interesado en estos temas deberá acudir a la bibliografía especializada para mayor información). Así, un escalar no tiene subíndices, un vector cuenta con un subíndice, una matriz con dos y así sucesivamente. Los subíndices pueden adquirir valores según el número de componentes que tengan los tensores. De este modo, en todas las ecuaciones de este texto se interpretarán los productos como matriciales y por lo tanto, no conmutativos. Para escribir todas las operaciones necesarias en notación matricial se deben hacer algunas consideraciones. En primer lugar, como hemos dicho, todo vector debe considerarse como una matriz columna. La transpuesta de un vector es una matriz renglón. Todos los productos matriciales se realizan según la regla renglón por columna; mientras que el producto por un escalar se realiza multiplicando por todas las componentes de la matriz. Por otro lado, las operaciones vectoriales más comunes se transforman a operaciones matriciales de acuerdo con las siguientes convenciones. La multiplicación por un escalar se realiza multiplicando por todas las componentes, por lo tanto, no se requiere ninguna notación especial. El producto escalar de dos vectores (“producto punto”) puede sustituirse por un producto matricial transponiendo el primer factor, en efecto, supongamos que se tienen tres componentes: a ⋅ b ⇒ a1b1 + a2b2 + a3b3 = [a1 a2  b1  a3 ]b2  = aT b   b3  Por otro lado, el producto vectorial de dos vectores (“producto cruz”, sólo definido en tres dimensiones) también puede sustituirse por un producto matricial de la siguiente forma: i j a × b = a1 a 2 b1 b2 k a3 = (a2 b3 − a3b2 )i + (a3b1 − a1b3 ) j + (a1b2 − a2b1 )k b3  0b1 − a3b2 + a2 b3   0 ⇒  a3b1 + 0b2 − a1b3  =  a3    − a2 b1 + a1b2 + 0b3  − a2 − a3 0 a1 a2   b1  − a1  b2  = [a ×]b   0  b3  El producto tensorial de dos vectores se puede escribir como columna por transpuesta dando como resultado una matriz cuadrada:  a1b1 a1b2 b3 ] = a2b1 a2b2   a3b1 a3b2  a1  a ⊗ b ⇒ a2 [b1 b2    a3  a1b3  a2 b3  = abT  a3b3  Podemos resumir esta información en las tablas siguientes, para referencia: Notación Escalar Cantidades Físicas Vector Matriz Tensor (O>3) Vectorial Matricial Tensorial a a ai λ a a aij a indefinido aij k Operaciones con vectores Notación Multiplicación Producto Punto Producto Cruz Producto Tensorial c = a × b = −b × a c = a ⊗b ≠ b ⊗a b = λa = aλ λ = a ⋅ b = b ⋅ a T T Matricial b = λa = aλ c = [a ×]b = −[b ×]a λ =a b=b a c = abT ≠ baT cij = ai b j ≠ bi a j Tensorial bi = λai = ai λ λ = ai bi = bi ai ci = a j bk ε ijk = −b j ak ε ijk Vectorial Es necesario señalar que en la tabla anterior, en lo que respecta a la notación tensorial, se ha hecho uso de la convención de Einstein (la cual implica sumar sobre los índices ε repetidos) y el tensor de tercer orden ijk es el tensor antisimétrico (sus componentes son iguales cero cuando i = j = k ; son iguales a 1 cuando la terna ijk es una permutación par y son iguales a − 1 cuando la terna ijk es una permutación impar de los índices 1,2,3 ). En este texto utilizaremos extensivamente la forma [a ×] del producto cruz, por ello es conveniente en este momento señalar algunas de sus propiedades; las cuales son de mucha utilidad en el estudio de la mecánica. En primer lugar, llamaremos a esta forma un pseudo vector para enfatizar el hecho de que proviene de un vector y solo tiene tres componentes independientes pero, en realidad, se trata de una matriz. En seguida, se demuestra fácilmente que todo pseudo vector tiene determinante igual a cero: 0 a × = a3 − a2 − a3 0 a1 a2 a − a1 = a3 3 − a2 0 − a1 a + a2 3 0 − a2 0 = a3 (− a2 a1 ) + a2 (a3a1 ) = 0 a1 Otra propiedad de gran importancia es que se trata de una matriz antisimétrica, es decir: [a ×]T = −[a ×] lo cual es fácilmente verificable de su definición. Por último, recordaremos que en análisis vectorial se demuestra una identidad conocida con el nombre de triple producto vectorial el cual, en notación matricial se puede establecer en dos versiones diferentes: [[a ×]b ×]c = (aT c )b − (bT c )a [a ×][b ×]c = (cT a)b − (bT a)c Si en la segunda ecuación escogemos a = b y conmutamos los productos, obtenemos: [a ×][a ×]c = a(aT c ) − (aT a)c Entonces, podemos factorizar el vector c de la siguiente forma: [a ×][a ×]c = aaT c − UaT ac [a ×][a ×]c = (aaT − UaT a)c En donde U es la matriz identidad del espacio vectorial correspondiente. Por último, usando la llamada ley del cociente del álgebra tensorial (la cual implica que si dos cantidades al ser multiplicadas por una tercera generan una identidad, entonces son iguales entre sí) obtenemos: [a ×][a ×] = aaT − UaT a Ahora bien, si el vector n = a es unitario, tendremos la relación: [n ×][n ×] = nnT − U Todas estas identidades serán utilizadas ampliamente en el texto. Capítulo 2 Dinámica de Sistemas Cadenas Dinámicas Un vehículo es una máquina diseñada para el transporte de pasajeros, o carga, de un punto a otro en el espacio. La región del espacio en la cual se desplaza el vehículo puede estar ocupada por un medio fluido como el agua o el aire, puede estar limitada por la superficie terrestre con todas sus irregularidades y detalles o bien, puede estar casi vacía como en el espacio interestelar. Por otro lado, una máquina se define como un conjunto de mecanismos capaces de transformar energía para realizar un trabajo determinado. A su vez, un mecanismo se define como una cadena dinámica en la que al menos un eslabón permanece fijo con respecto a un sistema de referencia. Las cadenas dinámicas son conjuntos de eslabones unidos mediante pares. Los eslabones son cuerpos tridimensionales con propiedades mecánicas bien definidas. Finalmente, un par es el conjunto de condiciones de restricción en el movimiento relativo entre dos eslabones. Los eslabones son cuerpos para los cuales la aplicación de una carga (fuerza o momento, o ambos), resulta en una deformación bien definida. En ocasiones, para simplificar se consideran sólidos rígidos para los cuales no existe deformación; sin embargo, generalmente, se consideran sólidos elásticos homogéneos para los cuales la relación carga deformación es lineal. En épocas recientes los avances de la tecnología han provocado que en los diseños de ingeniería se utilicen un sinnúmero de materiales con propiedades mecánicas mucho más complejas que las dos anteriores, es decir, relaciones no lineales entre la carga y la deformación resultante. Cuando se considera un eslabón en el espacio y se introduce un sistema de referencia, puede fijarse la posición del eslabón estableciendo las coordenadas de un punto particular del cuerpo. De igual forma, puede fijarse su actitud estableciendo las direcciones de tres vectores unitarios fijos al cuerpo (o bien mediante tres parámetros de actitud como lo veremos posteriormente). La elección de este punto y estos vectores es arbitraria y ellos conforman un nuevo sistema de referencia el cual se denomina “sistema local” o “sistema de ejes cuerpo”. Generalmente se escoge dicho punto en el llamado centro de gravedad y los vectores en las direcciones de los llamados ejes principales (estos conceptos se definirán posteriormente en el texto). Si se consideran dos eslabones en el mismo espacio pueden existir seis movimientos relativos entre ellos, a saber: tres traslaciones entre los orígenes de ambos ejes cuerpo y tres rotaciones de un sistema de ejes con respecto al otro. Si las fuerzas y momentos externos de un eslabón son independientes del estado dinámico del otro eslabón, se dice que ambos están libres o tienen movimiento libre. Si las fuerzas y momentos externos de uno dependen en alguna forma del estado dinámico del otro, se dice que existe una restricción dinámica en el movimiento entre ambos eslabones. Debido a la tercera ley de Newton, las fuerzas y momentos externos del segundo eslabón dependerían exactamente en la misma forma del estado dinámico del primer eslabón. Cuando las fuerzas y momentos entre los eslabones son tales que impiden completamente un movimiento se dice que hay restricción total y, dividiendo las fuerzas entre el área de contacto se puede hablar de esfuerzos internos. Por tanto, los movimientos relativos pueden ser de tres tipos: completamente libres, restringidos dinámicamente o bien, completamente restringidos. Cuando los seis movimientos son libres el par no existe. Cualquier combinación de movimientos libres y totalmente restringidos se denomina par cinemático. Cualquier combinación de movimientos libres, restricciones dinámicas y totales se denomina par dinámico. Cuando fuerzas o momentos son tales que anulan completamente el movimiento en cierta dirección se denominan reacciones. Cuando están relacionados con los desplazamientos, y se dirigen en sentido contrario a los mismos, se denominan fricciones. Los pares cinemáticos son sólo una abstracción que facilita el estudio de los mecanismos (de hecho, cuando en una cadena todos los pares son cinemáticos, la cadena se denomina también cinemática), pero no existen en la realidad ya que cualquier tipo de contacto que permita movimiento entre dos cuerpos genera el fenómeno denominado fricción. De las definiciones del párrafo anterior, podemos concluir que un vehículo es un sistema de ingeniería altamente complejo, cuyo estudio involucra un gran número de ciencias: cinemática, elasticidad, termodinámica, mecánica de fluidos, etc. De hecho, el avance de la ingeniería en el último siglo ha sido tal, que es imposible pensar que una sola persona pueda conocer todos los detalles del funcionamiento de un vehículo, incluso de los más sencillos; menos aún de un vehículo complejo como un avión o un satélite. El estudio del comportamiento de una cadena dinámica es la base de la dinámica de vehículos. Ahora bien, dicho estudio se sustenta en los principios físicos fundamentales. Es decir, para predecir el comportamiento de una cadena dinámica debemos considerar que esta está sometida a las leyes de la naturaleza y, a partir de dichas leyes, deberemos establecer ecuaciones que nos permitan calcular su comportamiento futuro. Principio de Mínima Acción Una de las formas más elegantes para la presentación de la mecánica es el llamado principio de mínima acción. Es cierto que existen otras formas de presentación (igualmente rigurosas) como: las tres leyes de Newton o las simetrías espacio-temporales de Noether. Sin embargo, no siendo este un texto sobre la mecánica en general, hemos escogido el principio de mínima acción por considerarlo muy económico en los conceptos y en la notación; logrando con ello sentar las bases mínimas para nuestros propósitos. En mecánica clásica un sistema se define por un conjunto de variables llamadas coordenadas generalizadas:  q1 (t ) q (t ) q(t ) =  2      qn (t ) T Cuando estas coordenadas adquieren valores específicos, por ejemplo q′ = [q1′ , q2′ , qn′ ] , se dice que el sistema se encuentra en un estado o fase q′ determinado, por ello se llama también a las q variables de fase o vector de estado. Introduciendo un espacio euclídeo R n con un número de dimensiones igual al de coordenadas generalizadas del sistema, es fácil interpretar cada punto de este espacio como un estado o fase posible del sistema. El espacio R n se denomina espacio de fases o de estados. Por otro lado, es importante notar que las coordenadas generalizadas son funciones del tiempo, de modo que, cuando el sistema pasa de un estado q1 a otro q 2 , requiriendo para ello un intervalo de tiempo ∆t , podemos representar este cambio en el espacio de fases mediante una curva que une los puntos q1 y q 2 (suponemos dicha curva continua, invocando el principio de continuidad de los fenómenos naturales). Una curva en el espacio de fases se denomina una trayectoria. En ocasiones será necesario introducir otro conjunto de variables T dependientes del tiempo u(t ) = [u1 (t ), u2 (t ), ur (t )] . Estas variables son independientes del estado del sistema pero afectan de manera determinante la trayectoria en el espacio de fases. Debido a que pueden escogerse según convenga, estas variables se denominan variables de control. El número de variables de control r es normalmente diferente del número de variables de fase n . El problema de la mecánica consiste en encontrar la trayectoria que seguirá un sistema entre dos estados dados, sabiendo que dicho sistema está sometido a ciertas funciones de control y a las leyes de la naturaleza. Es decir, en el espacio de fases existe un número infinito de trayectorias posibles entre los puntos q1 y q 2 ; sin embargo, si el sistema está determinado por alguna ley, con un control dado, solo es posible una de tales trayectorias y el problema de la física consiste en encontrar esa única trayectoria posible. Para lograr lo anterior se define una función escalar de las coordenadas generalizadas, de sus primeras derivadas con respecto al tiempo y de las variables de control: L(q(t ), q(t ), u(t )) esta función se conoce como función de Lagrange o lagrangiano del sistema. Para dar una idea un tanto intuitiva del significado de la función lagrangiana, podemos decir, siguiendo al matemático John C. Baez (2005), que esta función nos mide el grado de actividad que existe en cada instante en el sistema. En efecto, la función lagrangiana crece cuando crece la energía cinética en el sistema; sin embargo, el valor de la lagrangiana es menor cuando crece la energía potencial del sistema ya que esta energía no representa actividad sino posibilidad para dicha actividad. De hecho, en los sistemas mecánicos, la función lagrangiana se establece restando la energía potencial de la cinética. Enseguida se define una cantidad que involucra al lagrangiano del sistema a lo largo de la trayectoria entre dos puntos cualesquiera del espacio de fases. Esta cantidad, conocida con el nombre de acción, nos representa la suma de la actividad desarrollada por el cuerpo a lo largo del tiempo: t2 A = ∫ Ldt t1 Finalmente, el principio de mínima acción establece que: “Todo sistema seguirá, entre dos instantes de tiempo t1 y t 2 , una trayectoria en el espacio de fases tal que la acción sea mínima”. Esta es la famosa presentación lagrangiana de la física clásica. La acción es una integral de línea y, por lo tanto, la misma integral evaluada sobre dos líneas curvas que pasen por los puntos q (t1 ) y q (t2 ) , tendrá un valor diferente; es decir, se trata de una funcional. El principio de mínima acción nos dice que el sistema mecánico “escogerá”, de entre todas las líneas que pasan por dichos puntos, aquella para la cual la acción sea mínima. Así, el principio establece el problema del cálculo de la trayectoria de un sistema mecánico como un problema de extremales. Ecuaciones de Euler - Lagrange. El principio de mínima acción nos indica cuál será la trayectoria de un sistema mecánico sometido a ciertas interacciones; sin embargo, no nos permite calcular directamente dicha trayectoria. Ahora bien, el mismo principio nos da una indicación sobre cómo realizar el cálculo: deberemos tomar la primera variación de la funcional de acción con respecto a las variables de fase e igualarla a cero. El método para realizar esto es un método elemental del cálculo de variaciones. En primer lugar, consideremos el valor A1 de la acción a lo largo de una trayectoria cualquiera q (t ) . Enseguida, el valor A2 de la misma integral a lo largo de una pequeña variación δq(t ) de la trayectoria inicial, suponiendo que el control es el mismo en ambas trayectorias. Entonces, la variación de la acción entre ambas trayectorias viene dada por: δA = A2 − A1 = ∫ dL(q, q, u )dt = ∫ [∇Tq Lδq + ∇Tq Lδq ]dt = 0 t2 t2 t1 t1 La cual debe ser cero por el principio de Hamilton. Ahora bien, la variación de la trayectoria debe satisfacer las siguientes condiciones: δq(t1 ) = δq(t2 ) = 0 con el objeto de que la nueva trayectoria pase también por los puntos q (t1 ) y q (t2 ) . Realizando una integral por partes, obtenemos: d∇Tq L δA = ∫ ∇ Lδqdt + ∇ Lδq t − ∫ δqdt = 0 1 dt t1 t1 t2 T q T q t2 t2 Tomando en cuenta las condiciones en los extremos y factorizando: t2 δA = ∫  ∇Tq L − t1  d T  ∇q L δqdt = 0 dt  Finalmente, puesto que la variación que hemos tomado es arbitraria, salvo por las condiciones en los extremos, es fácil ver que el término entre paréntesis de la ecuación anterior debe ser igual a cero para que la integral se anule. Por conveniencia escribiremos la transpuesta negativa de esta relación: d ∇q L − ∇q L = 0 dt Las ecuaciones anteriores, solución del problema de extremal, se denominan ecuaciones de Euler-Lagrange del sistema mecánico. Debemos agregar, en atención al estudiante interesado en este tema, que con algunas pequeñas modificaciones, la formulación lagrangiana permite incluir la teoría de la relatividad general de Einstein y, sustituyendo el concepto de coordenadas generalizadas por el de función de onda del sistema, puede también representarse la teoría cuántica de campos de Feynman, la cual es la teoría física considerada como fundamental en nuestros días. Así, simetrizando el tiempo y el espacio en la integral de acción y considerando una densidad lagrangiana que depende de la función de onda del campo en estudio, la integral de acción puede escribirse como: t2 A = ∫ L( , ∂ µ , u )d t1 en donde es el cuadrivector espacio – tiempo y ∂ µ es la derivada covariante correspondiente. Por un procedimiento similar al anterior se deducen las ecuaciones de Euler – Lagrange: ∂ µ ∇∂ µ L − ∇ L = 0 Dependiendo del tipo de sistema y de la lagrangiana que se utilice podemos obtener las ecuaciones dinámicas para cada campo de la física desde la dinámica de una partícula newtoniana (como veremos más adelante) hasta las de la electrodinámica quántica o la cromodinámica de los quarks. De hecho, puede afirmarse que la teoría física más aceptada hasta nuestros días está contenida en la ecuación anterior junto con el lagrangiano siguiente: L = qiDq + liDl − 14 (Fµνa ) 2 + Dµφ − V (φ ) 2 ( − λiju u Rφ ⋅ QLj + λijd d Rφ * ⋅ QLj + λijl e Rφ * ⋅ LLj + h.c. i i i ) El cual es conocido como el Modelo Estándar. Representa la interacción de todas las partículas fundamentales conocidas hasta la fecha. La primera línea representa la energía cinética de los quarks y leptones presentes en el sistema, incluyendo su energía electromagnética; la segunda línea representa el potencial de Higgs y la tercera línea las interacciones cromodinámicas (la nomenclatura h.c. representa la suma de todos los hadrones conjugados). Como se ve, en éste lagrangiano están unificadas las fuerzas fuerte, débil y electromagnética. La aparición de la masa de las partículas se debe al mecanismo de Higgs. Sin embargo, la interacción gravitacional no ha podido ser unificada aun y no es tomada en cuenta en este modelo, aún cuando existan muchas partículas en el sistema. Como vemos, el problema de la dinámica ha sido resuelto en forma completa. Sin embargo, resta el problema del modelado del sistema. Es decir, dado un sistema, si construimos su función de Lagrange en forma apropiada, sabremos cual es la dinámica resultante para cada condición inicial. Pero no existen técnicas universalmente válidas para construir la función de Lagrange de un sistema. Puede decirse, en términos muy generales, que la función de Lagrange es la diferencia entre la energía cinética y la energía potencial instantáneas del sistema, pero como vemos en el caso del modelo estándar, la forma en que deben considerarse dichas energías puede no ser muy evidente. Es incluso irónico pensar que la primera interacción que fue dominada por la mente del hombre, la interacción gravitacional, no ha podido ser representada, mientras que las otras formas de interacción, descubiertas mucho después, se encuentran ahora unificadas en el Lagrangiano del modelo estándar. En el caso de la mecánica clásica, cuando un cuerpo está sometido a un conjunto de fuerzas, el trabajo de estas fuerzas debe sumarse a la energía cinética del mismo. Es decir, el trabajo de las fuerzas externas puede asimilarse al negativo de una energía potencial. De igual forma, las fuerzas, dado su punto de aplicación, desarrollarán momentos que deben agregarse en forma de energía de rotación a la lagrangiana. En ejemplos posteriores veremos algunas de las técnicas que se utilizan para modelar sistemas clásicos; sin embargo, sugerimos al lector interesado consultar otra bibliografía para obtener mayores detalles sobre el método que deberá aplicarse en casos específicos de modelado de un sistema. Teoría de Pequeñas Perturbaciones Si bien pueden existir diversas clases de sistemas de acuerdo con las propiedades matemáticas del lagrangiano correspondiente, para muchos sistemas físicos las ecuaciones de Euler – Lagrange pueden transformarse de tal modo que quedan representadas bajo la siguiente forma: dq = F(q, u ) dt Esta ecuación se denomina ecuación de evolución de un sistema de control, ya que nos representa, directamente, la transformación temporal de la variable de fase, es decir, representa la evolución temporal del estado del sistema. La dinámica de un sistema está controlada por su ecuación de evolución. Dado un valor fijo de las variables de control u c , los puntos q e del espacio de fases para los cuales se cumple la condición: F(q e , u c ) = 0 se denominan estados estacionarios del sistema, puesto que una vez que el sistema llega a ese estado, ya no habrá más cambios de estado. En efecto: dq =0 dt qe El valor escogido para el control se denomina valor de compensación. Cambiando el valor de compensación es posible mover un estado estacionario a una posición deseada en el espacio de fases, por ello se habla de un estado estacionario compensado. O bien, a la inversa, puede pensarse que, escogiendo un punto cualquiera del espacio de fases, se calculen los valores de las variables de control necesarios para que dicho punto sea un estado estacionario. Desafortunadamente, puesto que no necesariamente existe el mismo número de variables de control que de variables de estado y que, además, las ecuaciones de evolución pueden ser no lineales, no siempre es posible despejar los valores de compensación. Esto significa que, dependiendo de las características del sistema, existirán puntos o regiones completas del espacio de fases en las que no podrá compensarse un estado estacionario. Esto depende completamente de la forma específica de las ecuaciones y, por lo tanto, no existe una teoría general. Un ejemplo sencillo de todo lo anterior se presenta en el caso de un avión: un estado estacionario es el vuelo recto y nivelado a velocidad constante; sin embargo, para fijar el valor exacto de la velocidad, se debe ajustar un cierto ángulo de ataque de la aeronave, de tal modo que la tracción de los motores iguale exactamente a la resistencia al avance; esta compensación se logra mediante unas pequeñas aletas en el borde de salida del elevador. Los momentos producidos por las fuerzas motrices que no están alineadas con la trayectoria deben ser anulados por los momentos aerodinámicos producidos con la deflexión de las mismas superficies de control. Por lo tanto, no podrá ajustarse cualquier velocidad. Ejemplo: definición del sistema de Lorentz. Se desarrolla a partir de las ecuaciones de la hidrodinámica y se refiere al fenómeno de las celdas de convección. R es una variable de control. dq1 = σ (q2 − q1 ) dt dq2 = Rq1 − q2 − q1q3 dt dq3 = −bq3 + q1q2 dt σ = 10; b = 83 para la determinación de los estados estacionarios escojamos el valor de compensación σ (qe 2 − qe1 ) = 0 Rc qe1 − qe 2 − qe1qe 3 = 0 − bqe 3 + qe1qe 2 = 0 qe 2 = qe1 (Rc − 1 − qe3 )qe1 = 0 qe21 = bqe 3 Por tanto hay tres posibilidades: qe(11) = 0 qe(12 ) = b(Rc − 1) qe(13) = 0 qe( 23) = Rc − 1 qe(13) = − b(Rc − 1) qe(12) = 0 ; qe( 22) = b(Rc − 1) ; qe( 32) = − b(Rc − 1) qe( 33) = Rc − 1 Rc : Podemos ver claramente que para un valor de compensación Rc ≤ 1 sólo existe un estado estacionario en Rc > 1 otros dos estados estacionarios aparecen junto al origen alejándose de él sobre la diagonal q1 = q2 y elevándose a lo largo del eje q3 . el origen del espacio de fases. Para valores La teoría de estabilidad y control lineal estudia las posibles trayectorias de un sistema dinámico en las cercanías de los estados estacionarios compensados. Para realizar este estudio supongamos que la trayectoria puede escribirse como la suma de un estado estacionario más una pequeña perturbación: q (t ) = q e + δq(t ) mientras que el control tiene su valor de compensación más una pequeña variación arbitraria: u(t ) = u c + δu(t ) las variaciones se consideran pequeñas de tal modo que: δq(t ) << 1 δu(t ) << 1 al menos durante un intervalo finito de tiempo. Estamos suponiendo que las ecuaciones han sido convenientemente transformadas a una forma sin dimensiones de tal modo que la magnitud de las perturbaciones puede considerarse pequeña comparada con la unidad. Entonces, el operador de evolución puede desarrollarse en serie de Taylor en las cercanías del estado estacionario compensado: F(q e + δq, u c + δu ) = F(q e , u c ) + [∇q F]q En donde las matrices [∇ q F]q e ,uc y [∇u F]q e ,u c e ,u c δq + [∇ u F]q ,u δu + o(δq 2 , δu 2 ) e c son notaciones cortas para los jacobianos del operador de evolución evaluados en el estado estacionario y con los valores de compensación: [∇ F] q q e ,u c [ = ∇ q FT ] T q e ,u c  ∂F1  ∂q  1  ∂F2 =  ∂q1   ∂F  n  ∂q1 ∂F1 ∂q2 ∂F2 ∂q2 ∂F1  ∂qn      ∂Fn   ∂qn  q =q e ,u = u c [∇u F]q ,u e c [ = ∇ u FT ] T q e ,u c  ∂F1  ∂u  1  ∂F2 =  ∂u1   ∂F  n  ∂u1 ∂F1 ∂u2 ∂F2 ∂u2 ∂F1  ∂ur      ∂Fn   ∂ur  q =q e ,u = u c Las componentes de estos jacobianos se conocen respectivamente con los nombres de derivadas de estabilidad y derivadas de control. Substituyendo la serie de Taylor en la ecuación de evolución del sistema y conservando solo los términos de primer orden, obtendremos la ecuación de evolución de las pequeñas perturbaciones: dδq = [∇q F] δq + [∇u F]q ,u δu q e ,u c e c dt Así, el comportamiento de las trayectorias en las cercanías del estado estacionario compensado está enteramente gobernado por las derivadas de estabilidad y de control. Simplificando aún más la notación, hagamos [∇q F]q ,u = ∇q e F y [∇u F]q ,u = ∇u c F , e c e c entonces, el sistema lineal anterior, denominado sistema de control, se puede escribir como: dδq = ∇q e Fδq + ∇ uc Fδu dt Ejemplo: Ecuaciones de las perturbaciones para el sistema de Lorenz: σ 0  δq1   0  δq1   − σ d        δq2  = (Rc − qe 3 ) − 1 − qe1  δq2  +  qe1 δR dt   qe1 − b  δq3   0  δq3   qe 2 Para Rc ≤ 1 , sólo existe un estado estacionario y las perturbaciones son gobernadas por: δq1   − σ d    δq2  = Rc dt    δq3   0 Para Rc > 1 , las perturbaciones son gobernadas por: σ 0  δq1    − 1 0  δq2   0 − b δq3  σ −σ δq1   d    1 −1 δq2  = dt    δq3   ± b(Rc − 1) ± b(Rc − 1) 0  δq1       b(Rc − 1) δq2  ± b(Rc − 1)δR    δq3   0 −b  0 Es conveniente señalar en este momento que la teoría de las pequeñas perturbaciones que se acaba de presentar es aplicable, casi sin cambios, a una clase un poco más amplia de sistemas dinámicos. Presentaremos aquí ese tipo de sistemas ya que el caso de la dinámica de vehículos queda comprendido en esta clase. Específicamente, nos referimos al caso en que la ecuación de evolución depende de la taza de cambio de las variables de fase: q = F(q, q, u ) la forma no es trivial ya que la dependencia no es necesariamente lineal. Entonces, podemos definir los estados estacionarios como aquellos puntos del espacio de fases en los que se satisface: F(q e ,0, u c ) = 0 considerando nuevamente una pequeña perturbación de este estado estacionario, el desarrollo en serie de Taylor del operador de evolución se puede escribir como: F(q e + δq, δq, u c + δu ) = F(q e ,0, u c ) + [∇q F]q + [∇ u F]q e , 0,u c δu + o(δq , δu 2 e , 0,u c δq + [∇q F]q ,0,u δq 2 e ) c de modo que el sistema de control nos queda como: δq = [∇ q F]q e , 0,u c δq + [∇ q F]q e , 0 ,u c δq + [∇ u F] q e , 0 ,u c δu pero, por la linealidad de la aproximación, podemos despejar la taza de cambio de las perturbaciones de modo que: δq = (U − ∇q F )−1 ∇q Fδq + (U − ∇q F )−1 ∇ u Fδu e e e c En conclusión, podemos pensar que el sistema de control es una ecuación del tipo: δq = Aδq + Bδu en donde las derivadas de estabilidad A y las derivadas de control B dependen de los jacobinos del operador de evolución ∇q e F y ∇ uc F en el caso de un sistema simple o bien ( estos últimos están multiplicados por la forma de Leontief U − ∇q e F poco más complejo de un sistema dependiente de las velocidades. ) −1 en el caso un Solución General del Sistema Dinámico de Control La mejor manera de conocer el comportamiento de las perturbaciones en las cercanías del estado estacionario es encontrar la solución de la ecuación de evolución de las perturbaciones, obtenida en el párrafo anterior. Analicemos primeramente la solución para un sistema libre de control, es decir, hagamos primero δu = 0 y busquemos la solución general de la ecuación de evolución homogénea: dδq = Aδq dt supongamos que dicha solución puede escribirse en forma de serie de potencias del tiempo: δq(t ) = b 0 + b1t + b 2t 2 + + bkt k + entonces, substituyendo en la propia ecuación de evolución, obtenemos: b1 + 2b 2t + 3b 3t 2 + + kb k t k −1 + [ = A b 0 + b1t + b 2t 2 + + bk t k + ] de donde podemos deducir las siguientes ecuaciones vectoriales para los vectores desconocidos b i : b1 = Ab 0 1 2 A b0 2 1 3 b3 = A b0 2⋅3 b2 = bk = 1 1 A k b0 = A k b 0 k! 1⋅ 2 ⋅ 3 k por otro lado, substituyendo t = 0 en la solución propuesta obtenemos: δq(0) = b0 Por lo tanto, substituyendo estos resultados en la solución obtenemos:   1 2 δq (t ) = U + At + A 2t 2 + + 1 k k At + k!  δq(0 ) hasta este momento no hemos mencionado explícitamente en dónde acaba la serie pero, justamente, la idea es considerar una serie infinita con objeto de aproximar lo mejor posible la solución. Puede demostrarse matemáticamente que una serie infinita como la que aparece en el corchete de la expresión anterior converge en forma absoluta y, por lo tanto, puede tratarse como una cantidad normal, es decir, que le podemos dar un nombre y tratarla como una matriz igual a cualquier otra. Por analogía con las series de potencias de un número real definimos la llamada matriz exponencial o, mejor aún, la exponencial de una matriz: ∞ Ak k = 0 k! eA = ∑ En donde hemos convenido en que A 0 = U para cualquier matriz cuadrada. De este modo, la solución general del sistema libre de control, puede escribirse como: δq (t ) = e Atδq(0) Puede pensarse en la matriz exponencial como una matriz que transforma cualquier estado inicial que se desee en el estado final correspondiente, transcurrido un intervalo de tiempo t . La matriz exponencial del operador de evolución se llama entonces matriz de transición entre los estados del sistema dinámico. De hecho, pueden demostrarse las siguientes propiedades de interés: de At = e At A dt A (t + s ) = e At e As e (e ) At −1 = e A ( −t ) Ahora bien, basándonos en el resultado anterior, la solución general del sistema dinámico con control (no homogéneo) contendrá un término suplementario que representa el efecto de la variable de control durante el tiempo transcurrido, en efecto, escribiendo la ecuación de control en la forma: dδq − Aδq = Bδu dt y multiplicando por el inverso de la matriz de transición del sistema libre de control:   dδq e − At  − Aδq  = e − At Bδu   dt obtenemos: e − At dδq − e − At Aδq = e − At Bδu dt considerando la derivada del inverso de la matriz de transición obtenemos: e − At dδq de − At − δq = e − At Bδu dt dt observando que del lado izquierdo tenemos la derivada de un producto: d − At ( e δq ) = e − At Bδu dt integrando esta última expresión desde cero hasta un tiempo t , obtenemos: t d − Aτ − Aτ − Aτ ∫0 dt (e δq )dτ =(e δq )0 = ∫0 e Bδu(τ )dτ t t o bien: t e − Atδq(t ) − Uδq (0) = ∫ e − Aτ Bδu(τ )dτ 0 Finalmente, despejando las variables de estado obtendremos la solución buscada: t δq(t ) = e δq (0) + ∫ e A (t −τ )Bδu(τ )dτ At 0 Sub Espacios Invariantes La solución del sistema de control encontrada en la sección anterior contiene toda la información necesaria para analizar el comportamiento de las perturbaciones en las cercanías del estado estacionario, sin embargo, como en muchos casos, tal vez ésta no sea la mejor forma de ver o analizar dicha información. En efecto, podemos pensarlo de la siguiente manera: la selección de las variables de control introdujo un marco de referencia arbitrario en el espacio de fases; es posible que, desde marcos de referencia distintos, la información sobre el comportamiento de las perturbaciones sea más fácil de analizar o aparezca en ellos más claramente su significado. Cómo veremos en esta sección, existen en efecto ese tipo de marcos de referencia privilegiados desde cuyo punto de vista el comportamiento de las trayectorias se vuelve mucho más evidente. La razón profunda de este hecho radica en la linealidad de las ecuaciones que estamos tratando, lo cual implica que la suma de dos soluciones también es una solución de la ecuación. Entonces, el método de análisis consiste en encontrar un conjunto “completo” de soluciones “sencillas” que al ser sumadas, afectadas convenientemente por un coeficiente, nos den todo el conjunto de comportamientos posibles. Las nociones de “completitud” y de “sencillez” del argumento anterior se harán explicitas durante la explicación subsiguiente. Consideremos nuevamente el sistema libre de control. Supongamos ahora que existen ciertas trayectorias en el espacio de fases para las cuales es válido: dδq = λδq dt En donde λ es cierto número real. Estas trayectorias representan líneas rectas que pasan por el estado estacionario alejándose o acercándose a él, dependiendo del signo de la constante λ . Es decir, una perturbación cuya condición inicial esté sobre esta línea recta, permanecerá siempre sobre ella; en este sentido dichas líneas rectas se denominan sub espacios invariantes del espacio de fases. Sustituyendo esta expresión de la derivada en la ecuación de evolución de las perturbaciones del sistema libre de control podemos decir que, para que exista un sub espacio invariante deberá satisfacerse la ecuación: λδq = Aδq o bien: (A − λU )δq = 0 Es decir, si logramos encontrar un número real λ y un vector δq que satisfagan esta ecuación, habremos encontrado una recta invariante en el espacio de fases. Por supuesto, la recta es sólo un caso especial de sub espacio invariante; podemos pensar también en círculos, elipses, parábolas o cualquier tipo de curva invariante: si la perturbación inicial está sobre una de dichas curvas, la evolución del sistema se desarrollará siempre sobre ella. Como puede verse, sería de mucha utilidad conocer los sub espacios invariantes que rodean al estado estacionario puesto que, entonces, podría predecirse el comportamiento del sistema en función del comportamiento sobre los sub espacios invariantes. Primeramente, para poder generalizar el concepto de sub espacio invariante más allá de la línea recta, definimos: (A − λU )k δq = 0 Los valores de λ para los cuales esta ecuación tiene soluciones no triviales en δq se denominan valores propios del operador de evolución A . El exponente k se denomina multiplicidad del valor propio y solo se admiten números enteros positivos. La solución particular δq λ ,k correspondiente a un λ y un k se denomina vector propio generalizado del operador de evolución. Los vectores propios generalizados forman sub espacios invariantes ya que el operador de evolución transforma un vector propio generalizado en otro vector propio generalizado. En efecto, supongamos que el vector δq̂ es un vector propio generalizado: (A − λU )k δqˆ = 0 multiplicando ambos lados de la ecuación por el operador de evolución A tenemos: A (A − λU ) δqˆ = 0 k ahora bien, es fácil probar que (A − λU ) y A conmutan: k A (A − λU ) = A (A − λU )(A − λU ) k k −1 los primeros dos factores conmutan por simple factorización y, como el proceso puede repetirse k veces, obtenemos: (A − λU )A(A − λU )k −1 = (A − λU )k A por lo que: (A − λU )k Aδqˆ = 0 lo que implica que Aδqˆ es también un vector propio generalizado. Este vector, a su vez, será transformado en otro vector propio generalizado. Veremos posteriormente que el conjunto de todos los vectores propios generalizados, asociados a un mismo λ y que sean linealmente independientes, no es infinito. El espacio formado por estos vectores será un sub espacio invariante del espacio de fases en el sentido de que una perturbación cuya condición inicial esté completamente en este espacio, formará una trayectoria siempre inmersa en el mismo. En la demostración anterior hemos supuesto que existe un valor propio para el operador de evolución. Ahora mostraremos que siempre existe al menos un valor propio. Escojamos una perturbación δq̂ no nula. El conjunto de vectores formado por δq̂ , Aδqˆ , A 2δqˆ , ... A nδqˆ , en donde n es la dimensión del espacio de fases, no puede ser linealmente independiente puesto que se tienen n + 1 vectores de dimensión n . Esto quiere decir que existen escalares ai , no todos iguales a cero, tales que se tiene: a0δqˆ + a1Aδqˆ + a2 A 2δqˆ + + an A nδqˆ = 0 es decir: (a U + a A + a A 0 1 2 2 + an A n )δqˆ = 0 + Consideremos ahora el polinomio: f (z ) = a0 z 0 + a1 z1 + a2 z 2 + an z n De la teoría algebraica elemental sabemos que estos polinomios tienen un número de raíces igual al grado del polinomio, contando la multiplicidad, siempre y cuando se considere su dominio en el plano complejo (es decir, se acepta que la variable z puede ser un número complejo). En ese caso, el polinomio f (z ) puede factorizarse siempre en la forma: m f ( z ) = b ∏ ( z − λi ) i k i =1 en donde b y los λi también son números complejos no nulos y m ≤ n . Además, los ki ≥ 1 son enteros tales que m ∑k i =1 i = n . Por lo tanto podemos escribir: m b∏ (A − λi U ) i δqˆ = 0 k i =1 Puesto que b y δq̂ son diferentes de cero, se deduce que al menos alguno de los factores (A − λi U )k multiplicado por el vector que quede a su derecha, debe anular la expresión; esto es exactamente igual a decir que al menos existe un valor propio para A . De hecho, cada uno de los λi es un valor propio. Para ver esto más fácilmente necesitamos, como resultado auxiliar, demostrar que cualquier producto de la forma (A − λi U )(A − λ j U ) conmuta, en efecto: i (A − λi U )(A − λ j U ) = A 2 − λi A − λ j A + λi λ j U y por lo tanto: (A − λi U )(A − λ j U ) = (A − λ j U )(A − λi U ) Por lo tanto, si escogemos un valor específico λi y conmutamos los productos, podemos llevar la factorización a la forma:   (A − λi U )k  ∏ (A − λ j U )k δqˆ  = 0 i m j  j =1, j ≠i  Mostrando que λi es un valor propio. Nótese que hemos eliminado el factor b ya que, por hipótesis es diferente de cero. Ahora podemos ver que el vector que está en el paréntesis del lado derecho es un vector propio generalizado asociado al valor λi con la multiplicidad ki el cual denotaremos mediante dos subíndices: δq λ ,k = i i ∏ (A − λ U ) m kj j =1, j ≠ k i j δqˆ De la definición de los vectores propios generalizados se sigue fácilmente que un valor propio λi con multiplicidad ki > 1 tiene ki vectores propios generalizados asociados a él. En efecto, cada uno de los vectores δq λi ,ki −1 , δq λi ,ki − 2 , δq λi , 2 , δq λi ,1 , definidos a continuación, es un vector propio generalizado correspondiente al mismo valor propio: (A − λi U )k δq λ ,k = 0 (A − λi U )k −1 (A − λi U )δq λ ,k = (A − λi U )k −1δq λ ,k −1 = 0 (A − λi U )k −2 (A − λi U )δq λ ,k −1 = (A − λi U )k −2 δq λ ,k −2 = 0 (A − λi U )k −3 (A − λi U )δq λ ,k −2 = (A − λi U )k −3δq λ ,k −3 = 0 i i i i i i i i i i i i i i i i i i i i i (A − λi U )(A − λi U )δq λ ,2 = (A − λi U )δq λ ,1 = 0 i i m Puesto que existen m valores propios con multiplicidades tales que ∑k i =1 i = n, concluimos que siempre existen n vectores propios generalizados. Sin embargo, hasta ahora, nada nos garantiza que algunos de estos vectores no sean paralelos entre sí lo cual implicaría que no son sub espacios invariantes independientes. Para tener n sub espacios invariantes distintos debemos demostrar la independencia lineal de todos los vectores propios generalizados. Procederemos en dos etapas: primero demostraremos que los vectores correspondientes a un mismo valor propio son linealmente independientes; luego demostraremos que cualquier par de vectores, correspondientes a dos valores propios distintos, son linealmente independientes. Sean δq λi ,ki , δq λi ,ki −1 , δq λi ,ki − 2 , δq λ , 2 , δq λ ,1 los vectores asociados al valor propio λi . i i Entonces debemos demostrar que la única solución posible en los ai para la siguiente ecuación es la trivial: a0δq λi ,ki + a1δq λi ,ki −1 + a 2δq λi ,ki − 2 + + a ki −2δq λi , 2 + a ki −1δq λi ,1 = 0 De la definición de vectores propios generalizados es fácil ver que todos los vectores δq λi ,ki − j pueden escribirse en función del primero δq λi ,ki de la siguiente forma: δq λ ,k −1 = (A − λi U )δq λ ,k i i i i δq λ ,k −2 = (A − λi U ) δq λ ,k 2 i i i δq λ ,k −3 = (A − λi U ) δq λ ,k i 3 i i i δq λ ,1 = (A − λi U )k −1δq λ ,k i i i i i sustituyendo tenemos: a0δq λi ,ki + a1 (A − λi U )δq λi ,ki + a2 (A − λi U ) δq λi ,ki + 2 multipliquemos ahora por (A − λi U ) i k −1 + aki −1 (A − λi U ) i δq λi ,ki = 0 k −1 en ambos lados para obtener: a0 (A − λi U ) i δq λi ,ki = 0 k −1 De donde vemos que a0 = 0 . De igual forma, multiplicando por (A − λi U ) i demostraremos que a1 = 0 . Este proceso puede continuarse con todos los términos hasta a ki −1 = 0 , por lo que los vectores son linealmente independientes. k −2 Ahora demostraremos la independencia lineal de los vectores propios generalizados correspondientes a valores propios diferentes. Sean λ1 , λ2 , λm los valores propios con multiplicidades k1 , k 2 , k m . Denotemos por δq λ1 , j1 , δq λ2 , j2 , δq λm , jm ciertos vectores propios generalizados con j1 ≤ k1 y j2 ≤ k 2 . Si estos vectores fuesen linealmente independientes, la única solución de la siguiente ecuación para los ai complejos, sería la trivial: a 1δ q λ1 , j1 + a 2 δ q λ 2 , j 2 + a m δ q λ m , jm = 0 en efecto, multiplicando ambos lados de la ecuación por j1 −1 n n (A − λ1U ) (A − λ2U ) (A − λm U ) en donde n es la dimensión del espacio de fases, obtenemos: a1 (A − λ1U ) 1 (A − λ2U )n (A − λm U )n δq λ , j + j −1 n n + a2 (A − λ1U ) (A − λ2 U ) (A − λm U ) δq λ , j j −1 1 1 + 1 2 + am (A − λ1U ) 1 j −1 (A − λ2U )n (A − λm U )n δq λ 2 m , jm =0 puesto que sabemos que j p ≤ k p < n para todo p , realizando las conmutaciones necesarias en cada caso podemos escribir todos los términos a partir del segundo como: a1 (A − λ1U ) 1 (A − λ2U )n (A − λm U )n δq λ , j + j −1 n n− j j + a2 (A − λ1U ) (A − λm U ) (A − λ2 U ) (A − λ2 U ) δq λ , j j −1 1 1 2 1 2 2 + am (A − λ1U ) 1 j −1 2 (A − λ2U )n (A − λm U )n − j (A − λm U ) j δq λ m + m m , jm =0 por lo que vemos que cada uno de esos términos se anula en sí mismo, es decir (A − λ p U ) j δq λ , j = 0 para todo p . Ahora bien, rescribiendo el primer término como: p p p a1 (A − λ1U ) 1 j −1 a1 (A − λ1U ) 1 j −1 (A + λ1U − λ1U − λ2U )n (A + λ1U − λ1U − λm U )n δq λ , j 1 =0 1 ((A − λ1U ) + (λ1 − λ2 )U )n ((A − λ1U ) + (λ1 − λm )U )n δq λ , j 1 1 =0 n n n podemos usar el teorema del binomio (A + C) = ∑   A n −i Ci en cada factor para i =0  i  obtener: n n j −1  n −i i a1 (A − λ1U ) 1  ∑  (A − λ1U ) (λ1 − λ2 )   i =0  i    n n n −i i  ∑  (A − λ1U ) (λ1 − λm ) δq λ1 , j1 = 0  i =0  i   en cada factor separamos el último término de la serie: n −1 n   j −1  n −i i n a1 (A − λ1U ) 1  ∑  (A − λ1U ) (λ1 − λ2 ) + U(λ1 − λ2 )   i =0  i   ×  n −1  n  n n −i i × ∑  (A − λ1U ) (λ1 − λm ) +U(λ1 − λm ) δq λ1 , j1 = 0  i =0  i   Puesto que i varia desde cero hasta n − 1 , en todos los términos de este complicado producto, excepto en el último, siempre existe un factor (A − λ1U ) que, combinado con el factor común (A − λ1U ) j1 −1 siempre puede llevarse hasta la derecha del término para anularse con el vector δq λ1 , j1 . Por lo tanto, obtenemos: a1 (A − λ1U ) 1 (λ1 − λ2 )n (λ1 − λm )n δq λ , j j −1 1 la cual sólo puede anularse si (A − λ1U ) (A − λ2U ) n j2 −1 (A − λm U ) 1 =0 a1 = 0 . De igual forma, multiplicando por n ambos lados de la ecuación inicial obtendremos a2 = 0 por lo que concluimos que los vectores son linealmente independientes. Finalmente, podemos concluir que para cualquier operador de evolución existen n vectores propios generalizados y que dichos vectores son linealmente independientes entre sí. Los resultados que se han demostrado hasta aquí significan que el conjunto de vectores propios generalizados de una matriz cuadrada es un conjunto completo y linealmente independiente. De la teoría de espacios vectoriales recordamos que esto implica que dicho conjunto puede ser utilizado para formar una base en el espacio vectorial. La representación del sistema en la base de los vectores propios generalizados es la manera más sencilla de estudiar el comportamiento de las perturbaciones. Realizaremos dicha representación en el apartado siguiente. Modos Normales Del apartado anterior se deduce que los vectores propios generalizados pueden formar una base en el espacio de fases (ya que hay exactamente n vectores linealmente independientes) y, por lo tanto, podemos transformar la solución general del sistema dinámico de control a dicha base. En efecto, para cada valor propio distinto λi de la matriz ∇q e F , formemos la matriz de n renglones por ki columnas: [ T λ i = δ q λ i ,1 , δ q λ i , 2 , , δ q λi ,k i −1 , δ q λ i ,k i ] Ahora, con las m matrices anteriores correspondientes a los diferentes valores propios formemos la matriz de n renglones por n columnas: [ T = Tλ1 , Tλ2 , , Tλm ] por las propiedades que acabamos de demostrar para los vectores propios generalizados sabemos que esta matriz es invertible (independencia lineal de todas las columnas). Entonces, consideremos un cambio de coordenadas en el espacio de fases, dado mediante: δq = Tδq′ δu = Tδu′ la ecuación de evolución del sistema de control se transforma de la manera siguiente: dδq′ = (T −1AT )δq′ + T −1BTδu′ dt Esta ecuación se conoce con el nombre de forma modal de la ecuación de evolución en el espacio de fases. Ahora encontraremos las componentes del operador de evolución modal (T −1AT ) . Recordemos que los vectores propios generalizados correspondientes a un mismo valor propio pueden escribirse como: 0 = (A − λi U )δq λi ,1 δq λ ,1 = (A − λi U )δq λ , 2 i i δq λ ,k −3 = (A − λi U )δq λ ,k −2 i i i i i i i i i i i i δq λ ,k −2 = (A − λi U )δq λ ,k −1 δq λ ,k −1 = (A − λi U )δq λ ,k Evidentemente, estas relaciones pueden escribirse como: Aδq λi ,1 = λiδq λi ,1 Aδq λi , 2 = δq λi ,1 + λiδq λi , 2 Aδq λi ,ki −2 = δq λi ,ki −3 + λiδq λi ,ki −2 Aδq λi ,ki −1 = δq λi ,ki −2 + λiδq λi ,ki −1 Aδq λi ,ki = δq λi ,ki −1 + λiδq λi ,ki colocando cada vector como columna de una ecuación matricial tendremos: λi 0  ATλi = Tλi  0    0 1 0 0 1 λi 0 λi 0 0 0 0 0  0  1 λi  introduciendo la matriz de primera diagonal unitaria de tamaño ki : 0 0  N 1 = 0   0 1 0 0 0 0 0 1 0 0 0 0 0  0  1 0 podemos escribir: ATλi = Tλi (λi U + N1 ) si ahora introducimos los bloques de Jordan: J i = λi U + N1 con los tamaños adecuados de acuerdo a la multiplicidad de cada valor propio, podemos ensamblar la ecuación:  J1 0  AT = T  0    0 0 J2 0 0 0 J3 0 0 0 0 0       J m  Lo que quiere decir que el operador de evolución tiene las siguientes componentes en la base de los vectores propios generalizados: J1 0  T −1AT =  0    0 0 J2 0 0 0 J3 0 0 0 0 0       J m  Finalmente, aplicando la solución general a la forma modal de la ecuación de evolución obtenemos: δq′(t ) = e (T −1 t ) δq′(0) + e (T ∫ AT t −1 ) T −1BTδu′(τ )dτ AT (t −τ ) 0 La ventaja de realizar este cambio de coordenadas es que la matriz de transición puede calcularse de manera muy simple. En efecto, es muy fácil ver que:  e J1  0 ( T −1AT ) =0 e    0 0 0 eJ2 0 0 eJ3 0 0 0   0  0    e J m  es decir, la exponencial de una matriz diagonal consiste en tomar la exponencial de cada elemento; por lo tanto, para cada bloque de Jordan tendremos: e Ji t = e (λi U + N1 )t = e λi Ut e N1t Para el primer factor, puesto que U k = U se verifica que: e λi Ut = e λi t U Para el segundo factor se tiene que N1ki = 0 , razón por la cual estas matrices se denominan nilpotentes (lo que significa de potencia nula). Las potencias inferiores de N1 también son muy fáciles de calcular ya que se cumple la siguiente relación: N1j = N j para j = 1,2, ki − 1 . En donde la matriz N j tiene unos en la diagonal j y ceros en todas los demás componentes. Por lo tanto, la serie infinita de la exponencial del segundo factor contiene solo ki − 1 términos diferentes de cero: e N1t ∞ =∑ j =0 (N1t ) j j! k i −1 tj = ∑ Nj j = 0 j! En donde, por convención se tiene N 0 = U . Finalmente, la matriz de transición del bloque de Jordan se escribe como: k i −1 tj Nj j = 0 j! e J i t = e λi t ∑ o, en forma explícita: e Jit  1  0 = eλi t  0   0 1 t2 2 t 0 1 0 0 t t ki −1  (ki − 1)!  t2  2  t   1  De esta última expresión podemos concluir lo siguiente: para cualquier valor propio con multiplicidad superior a uno, existen modos normales en la solución general cuya amplitud es proporcional al tiempo y a sus potencias superiores (hasta la potencia ki − 1 ). Estos términos se denominan seculares y, evidentemente, cualquier perturbación de un modo normal secular terminará en el infinito cuando el tiempo crece sin límite. Esta condición hace que los sistemas que presentan modos seculares sean catalogados inmediatamente como inestables y su análisis sea de menor interés (la definición de estabilidad se dará en el apartado siguiente y veremos que los sistemas con modos seculares son inestables de acuerdo con dicha definición). Estabilidad Una vez que se ha dividido el espacio de fases en sub espacios invariantes se puede analizar el comportamiento de las trayectorias en cada uno de ellos de manera independiente. En efecto, por definición, al estar siempre contenidas en el sub espacio invariante correspondiente, las trayectorias que inician en espacios distintos son completamente independientes. A los movimientos del sistema sobre los sub espacios invariantes se les conoce también con el nombre de modos o modos de movimiento. El comportamiento de las trayectorias en cada sub espacio está determinado por el tamaño del bloque de Jordan correspondiente o, lo que es lo mismo, por la multiplicidad del valor propio correspondiente. Como puede verse de la matriz de transición de los bloques de Jordan, para valores propios con multiplicidades superiores a la unidad, siempre existen términos que son proporcionales al tiempo. Estos términos se denominan seculares y, nosotros, aplicaremos este adjetivo también al sub espacio correspondiente. Entonces, las trayectorias en los sub espacios seculares son tales que se alejan indefinidamente del estado estacionario. Es decir, una perturbación cuya condición inicial esté sobre un sub espacio secular siempre se ve amplificada y el sistema se aleja del estado estacionario. En este caso decimos que el modo de movimiento es inestable. Cuando el valor propio tiene multiplicidad igual a la unidad, el bloque de Jordan es de tamaño unitario y, por lo tanto, los términos seculares no existen. El destino final de las trayectorias sobre el sub espacio invariante dependerá del comportamiento de la función e λi t . Ahora bien, el comportamiento de esta función depende de si el valor propio es real o complejo. A continuación analizamos ambos casos. Para un valor propio real, existen tres posibilidades: la función es creciente si el valor es positivo, la función es decreciente si el valor es negativo o la función es constante si el valor es cero. Es fácil observar que el sistema solo tiene tres opciones: si lambda es positivo, la perturbación crece sin límite; si lambda es negativo, la perturbación tiende a cero con el tiempo; finalmente, si lambda es cero, la perturbación conserva su valor. En el primer caso se dice que el modo es inestable, en el segundo estable y en el tercero neutro. Comportamiento de las perturbaciones sobre un sub espacio invariante de multiplicidad unitaria y valor propio real. En el caso de un valor propio complejo, escribiendo λi = σ i + iω i , la función exponencial se transforma de acuerdo con la fórmula de Euler: e λi t = e (σ i +iωi )t = eσ i t [cos(ωi t ) + isen (ωi t )] Dependiendo del signo de la parte real del valor propio, el modo puede ser nuevamente estable, inestable o neutro. Sin embargo, ahora, debido a la parte imaginaria del valor propio, existirán oscilaciones alrededor del estado estacionario. Es necesario reconocer en este punto que puesto que el operador de evolución tiene todas sus componentes reales, los coeficientes del polinomio característico deberán ser números reales. Teniendo un valor propio complejo no es posible satisfacer esta condición, sin embargo, cuando se tiene simultáneamente dos valores propios complejos λ1 y λ2 y estos son conjugados de tal modo que λ1 = σ + iω y λ2 = σ − iω , los factores correspondientes del polinomio característico contribuyen sólo con coeficientes reales, en efecto, el producto de estos factores se puede escribir como: (λ − λ1 )(λ − λ2 ) = (λ − (σ + iω ))(λ − (σ − iω )) = λ2 − 2λσ + (σ 2 + ω 2 ) De esta forma, para un modo neutro σ = 0 , las proyecciones de la perturbación sobre el par de vectores propios representan una elipse con centro en el estado estacionario que es recorrida con una frecuencia ω . Cuando la parte real es distinta de cero, las oscilaciones persisten pero su amplitud depende del tiempo siendo trayectorias espirales que se acercan o se alejan del estado estacionario. La parte real del número complejo representa entonces un factor de amortiguamiento o amplificación de las oscilaciones. En suma, cada par de valores propios complejos conjugados, representa un modo de oscilación del sistema alrededor del estado estacionario, cada modo de oscilación podrá ser estable, inestable o neutro. Comportamiento de las perturbaciones sobre un sub espacio invariante de multiplicidad unitaria y valor propio complejo. La frecuencia ω se conoce con el nombre de frecuencia amortiguada. Considerando la representación del número complejo λ = σ + iω en un plano coordenado, como en la siguiente figura, Representación en el plano complejo se pueden introducir dos nuevas variables de la manera siguiente: n = 2 +σ 2 ; ζ = σ 2 +σ 2 Las cuales se conocen con los nombres de frecuencia no amortiguada y razón de amortiguamiento. En la literatura de control y en alguna reglamentación es común encontrar estas variables. En los párrafos anteriores hemos analizado el movimiento en los sub espacios invariantes de manera independiente suponiendo que la condición inicial caía exactamente en un sub espacio invariante. Sin embargo, en la realidad, la condición inicial vendrá dada por una perturbación no controlada del sistema, es decir, dicha condición inicial caerá en un punto aleatorio del espacio de fases. El comportamiento de la perturbación en función del tiempo dependerá de la superposición de los distintos modos de movimiento. Un estado estacionario se denominará inestable si contiene al menos un modo inestable. Será estable cuando todos los modos de movimiento sean estables. Los modos neutros pueden ser eliminados reduciendo la dimensión del espacio de fases y conservando únicamente la dinámica no trivial. Puesto que todos los sub espacios seculares son inestables, un estado estacionario que contenga al menos un sub espacio secular será inestable. De este modo, la dinámica de interés será la de aquellos estados estacionarios que tengan tantos valores propios distintos como dimensiones del espacio de fases. En efecto, en este caso cada valor propio tiene multiplicidad unitaria y no hay espacios seculares. Dada esta condición, el análisis subsiguiente se desarrollará según el número de dimensiones del espacio de fases y suponiendo en cada caso que existen tantos valores propios distintos como dimensiones. En una dimensión solo hay un sub espacio invariante, el estado estacionario puede ser estable, inestable o neutro según lo sea el sub espacio invariante. En dos dimensiones podemos tener, dos valores reales o bien un par de valores complejos conjugados. Los valores complejos deben ser conjugados ya que todos los elementos del operador de evolución son reales. En el primer caso se tienen tres combinaciones posibles de los sub espacios invariantes: con dos sub espacios inestables el estado estacionario se denomina fuente y es inestable; con dos sub espacios estables el estado estacionario se denomina sumidero y es estable; con un sub espacio estable y uno inestable el estado estacionario se denomina punto hiperbólico y es inestable. En el caso de dos complejos conjugados hay tres opciones: la parte real compartida por ambos valores propios es cero, el estado estacionario se denomina punto centro y se considera inestable; la parte real es positiva y el estado estacionario se llama punto espiral positivo o espiral inestable; la parte real es negativa y el estado estacionario se llama punto espiral negativo o espiral estable. En 3 dimensiones pueden existir valores reales y valores complejos al mismo tiempo. Nuevamente, cada valor propio representa un modo de movimiento que puede ser oscilatorio o no. Primeramente, para tres valores reales podemos considerar cuatro casos: tres valores positivos, dos valores positivos y uno negativo, dos negativos y uno positivo y, finalmente, tres valores negativos. También se habla de fuentes, sumideros y sillas. En el caso de existir un valor complejo, también debe existir su complejo conjugado, de este modo solo tenemos la opción en la que hay un valor real y dos complejos conjugados. Dependiendo del signo de la parte real tenemos diversas opciones: si el valor real es positivo, se presentan las espirales siguientes. (figura) Si el valor real es negativo las espirales son: (figura) Cuando el valor real es cero se habla de una degeneración a dos dimensiones, es decir, se puede encontrar un cambio de coordenadas en el espacio de fases, tal que la dinámica de las perturbaciones se representa en sólo dos dimensiones. En dimensión superior a tres, los catálogos no han sido completados. Un hecho de gran importancia es que pueden existir valores complejos con distintas frecuencias. Dependiendo de si estas frecuencias son o no, racionales entre sí, se pueden encontrar ciclos límite con diferentes nudos o bien toros de KAM (Kolmogorov, Arnol’d, Mosser). Es decir que la trayectoria del sistema se enrolla sobre una superficie toroidal cubriéndola de manera densa sin llegar a cerrarse jamás. Este fenómeno también se conoce con el nombre de caos hamiltoniano. Dejaremos aquí el estudio de la estabilidad de los sistemas lineales. El estudiante interesado podrá encontrar una gran bibliografía a este respecto en lo que se conoce como la teoría de sistemas dinámicos. Ejemplo: Análisis de los estados estacionarios del sistema de Lorenz. −σ − λ σ qe 2 −1− λ qe1 (Rc − qe 3 ) 0 − qe1 = 0 −b−λ [(σ + λ )(1 + λ ) − σ (Rc − qe3 )](b + λ ) + (2σ + λ )qe21 = 0 Considerando las coordenadas del primer estado estacionario qe1 = 0; qe 2 = 0; qe 3 = 0 , la ecuación característica se reduce a: [(σ + λ )(1 + λ ) − σRc ](b + λ ) = 0 por lo tanto hay tres valores propios: λ1 = −b 2 λ2 , 3 considerando los valores 1+σ 1+ σ  =− ±   + σ (Rc − 1) 2  2  σ = 10; b = 8 3 , obtenemos: λ1 = − 83 λ2 = −5.5 − 20.25 + 10 Rc λ3 = −5.5 + 20.25 + 10 Rc El primer modo resulta ser siempre estable. El segundo modo también es siempre estable pero en este caso, para Rc ≥ −2.025 , no hay conducta oscilatoria; para Rc < −2.025 , podrá observarse una conducta oscilatoria amortiguada alrededor del punto fijo. Por último, para el tercer modo, cuando Rc < −2.025 , podrá observarse una conducta oscilatoria amortiguada alrededor del estado estacionario. El modo es estable sin oscilaciones para − 2.025 < Rc < 1 . Para Rc = 1 el modo es neutro. Finalmente, para Rc > 1 el tercer modo es inestable. Es decir, el origen del sistema de coordenadas pierde su estabilidad en Rc = 1 justo al mismo tiempo en que aparecen los otros dos estados estacionarios. A continuación debe analizarse la estabilidad de estos estados estacionarios cuyas coordenadas son qe1 = ± b(Rc − 1); qe 2 = ± b(Rc − 1); qe 3 = Rc − 1 , por lo que la ecuación característica será: λ [(λ + 1 + σ )(λ + b ) + b(Rc − 1)] + 2σb(Rc − 1) = 0 2 2   1+ b + σ  1+ b + σ  λ  λ +  −  + b(σ + R c ) = −2σb(Rc − 1) 2 2      Considerando nuevamente los valores σ = 10; b = 8 3 , se observa que ambos puntos fijos tienen las mismas propiedades de estabilidad regidas por el polinomio característico: [ ] λ (λ + 416 )2 − ( 416 )2 + 83 (10 + Rc ) = − 160 3 (Rc − 1) Para Rc = 1 , cuando estos puntos aparecen en el origen, tenemos: λ (λ + 11)(λ + 83 ) = 0 es decir que existen tres raíces: λ1 = −11; λ2 = − 83 y λ3 = 0 . Los dos primeros modos son estables, mientras que el tercero es neutro. Por otro lado, considerando la gráfica del polinomio cúbico, es fácil observar que hay un rango de Rc en el que siempre existirán tres raíces reales; mientras que fuera de este rango, habrá una raíz real y dos complejas. Para determinar los límites de estos rangos debemos encontrar los puntos críticos del polinomio cúbico, es decir: ( ) f (λ ) = λ (λ + 416 ) − ( 416 ) + 83 (10 + Rc ) + 160 3 ( R c −1) 2 2 la primera derivada es: f ′(λ ) = 3λ2 + 823 λ + 83 (10 + Rc ) mientras que la segunda derivada es: f ′′(λ ) = 6λ + 823 igualando a cero la primera derivada encontramos los valores: λ1, 2 = − 419 ± λ1, 2 = ( 419 )2 − 89 (10 + Rc ) − 41 ± 961 − 720 Rc 9 Teorema de Cayley - Hamilton En la definición de la matriz de transferencia aparecen las potencias sucesivas del operador de evolución del sistema dinámico. Dicho operador es una matriz cuadrada. En álgebra lineal existe un resultado sumamente interesante que se refiere a las potencias sucesivas de una matriz de este tipo. El resultado, conocido con el nombre de teorema de Cayley – Hamilton, puede resumirse diciendo que una matriz cuadrada de dimensión n tiene solamente n − 1 potencias sucesivas independientes. Es decir que todas las potencias iguales o superiores a n pueden calcularse a partir de las potencias inferiores. Expuesto de esta forma, es evidente que el teorema de Cayley – Hamilton es de gran utilidad para simplificar cálculos que involucren la matriz de transferencia. De hecho, con este teorema se demuestra que la serie infinita que define la matriz de transferencia puede transformarse a una serie finita con sólo n − 1 términos. Dada su importancia, a continuación presentaremos la demostración del teorema. Consideremos primeramente la ecuación: f (λ ) = A − λU En donde λ es una variable escalar. Dicha ecuación se denomina ecuación característica de la matriz A es claro que las raíces de la ecuación característica son los valores propios de la matriz. En efecto, si λ = λi es una raíz, el determinante es cero y, del álgebra lineal, sabemos que el siguiente sistema de ecuaciones tendrá una solución no trivial en el vector x : (A − λi U )x = 0 de hecho, el vector x será un vector propio generalizado de la matriz. Ahora, por otro lado, es fácil ver que la ecuación característica es un polinomio en λ de grado n igual al tamaño de la matriz: n A − λU = ∑ J n −i λi i =0 Los coeficientes del polinomio dependen únicamente de las componentes de la matriz, en efecto, evaluando en λ = 0 esta última expresión obtenemos: A = Jn de igual modo, todos los demás coeficientes se calculan derivando sucesivamente en λ y evaluando las derivadas en λ = 0 : 1 d A − λU λ =0 = J n −1 1! dλ 1 d2 A − λU λ = 0 = J n − 2 2! dλ2 1 dk A − λU λ = 0 = J n − k k! dλk Este procedimiento puede usarse incluso hasta para k = n de donde obtenemos J 0 = 1 . Como vemos, al evaluar las derivadas en λ = 0 , los coeficientes J i solo dependen de las componentes de la matriz A . Veamos otro resultado que será de utilidad para demostrar el teorema de Cayley Hamilton. Consideremos la siguiente identidad: A m = A m −1A multiplicando ambos lados de la identidad por un vector propio del tipo δq λi ,1 para un valor propio cualquiera λi de la matriz A podemos deducir: A mδq λi ,1 = A m −1Aδq λi ,1 = A m −1λiδq λi ,1 = λi A m−1δq λi ,1 = λi A m − 2 Aδq λi ,1 en donde los últimos dos factores nos permitirían realizar nuevamente la misma substitución. Realizando esta operación m veces obtenemos: A mδq λi ,1 = λimδq λi ,1 En donde se adopta, como siempre, la convención A 0 = U . Esta última ecuación demuestra que los vectores propios de la potencia m de una matriz son iguales a los vectores propios de la misma matriz. Mientras que, por otro lado, los valores propios de la potencia m de la matriz son iguales a la potencia m de los valores propios de la misma matriz. Ahora bien, sustituyendo en la ecuación característica algún valor propio específico λ = λi y multiplicando por el vector propio correspondiente δq λi ,1 tendremos: J 0λinδq λi ,1 + J 1λin −1δq λi ,1 + J 2λni − 2δq λi ,1 + J n −1λiδq λi ,1 + J nδq λi ,1 = 0 entonces es posible identificar cada uno de los términos con alguna potencia de la matriz, de tal modo que: J 0 A nδq λi ,1 + J 1A n −1δq λi ,1 + J 2 A n − 2δq λi ,1 + J n −1A nδq λi ,1 + J n A 0δq λi ,1 = 0 despejando el primer término del polinomio y factorizando el vector propio generalizado del lado derecho: J 0 A nδq λi ,1 = −(J 1A n −1 + J 2 A n − 2 + J n −1A n + J n A 0 )δq λi ,1 Entonces, por la ley de cocientes del cálculo tensorial, podemos deducir que las matrices que aparecen a ambos lados de la igualdad son iguales, recordando además que J 0 = 1 tenemos: A n = − J 1A n −1 − J 2 A n − 2 − J n −1A n − J n U o bien: n A n = − ∑ J i A n −i i =1 la cual también puede representarse como: n −1 A = − ∑ J n −i A i n i =0 Este último resultado es conocido como Teorema de Cayley – Hamilton. A veces se expresa diciendo que toda matriz cuadrada satisface su propia ecuación característica. Sin embargo, es importante notar el paso no trivial que se ha realizado al final de la demostración anterior: la ecuación característica es una sola ecuación cuyos términos son todos escalares; mientras que la expresión del teorema de Cayley Hamilton implica n × n ecuaciones, una por cada una de las componentes de las matrices involucradas en sus términos. Es evidente que, a partir de esta expresión, siempre podrá representarse la enésima potencia de la matriz en función de las primeras n − 1 potencias (incluyendo al cero). Así mismo, las potencias superiores podrán expresarse en la misma forma. La serie infinita que aparece en la definición de la matriz de transferencia puede transformarse, con ayuda del teorema de Cayley – Hamilton, en una serie con tan solo n términos, siendo n la dimensión del espacio de fases del sistema. En efecto, dividiendo la serie en los siguientes tres términos: n −1 ∞ Aktk tn n Aktk + A + ∑ n! k = n +1 k! k = 0 k! e At = ∑ y utilizando el teorema de Cayley – Hamilton en el de en medio: n −1 ∞  tk tn  Aktk e At = ∑  − J n − k A k + ∑ n! k = 0  k! k = n +1 k!  Como vemos, en esta serie ya no aparece la potencia n de la matriz. El siguiente término de la serie se puede simplificar como: n −1 ∞  tk tn  Aktk t n +1 e At = ∑  − J n − k A k + AnA + ∑ (n + 1)! n! k = 0  k! k = n + 2 k!  ∞ n −1 n −1  tk tn  Akt k t n +1 t n +1 e At = ∑  − J n − k + J 1 J n − k A k − ∑ J n − k +1A k + ∑ (n + 1)! n! k = n + 2 k! k =1 (n + 1)! k = 0  k!  como puede verse realizando sucesivamente esta operación con los términos siguientes el resultado será una serie con n − 1 términos compuestos por el factor A k y un polinomio de la variable tiempo y de los invariantes principales del operador de evolución. En suma, la matriz de transferencia se puede escribir como: n −1 e At = ∑ α k (t )A k k =0 en donde los α k (t ) son polinomios complejos de la variable tiempo. Este resultado será útil en lo que sigue. Teorema de Controlabilidad Se dice que el sistema es controlable en el instante t0 si es posible determinar un vector de control δu(t ) que transfiera al sistema desde cualquier estado inicial δq(t0 ) a cualquier otro estado en un intervalo finito de tiempo (t0 , t1 ) . Sin pérdida de generalidad, se puede suponer que el estado final que se busca es el estado estacionario δq(t1 ) = 0 y el tiempo inicial es cero. De acuerdo con esto, si se considera la solución general de la ecuación de evolución: t1 0 = e At1 δq (0) + ∫ e A (t1 −τ )Bδu(τ )dτ 0 o sea, despejando el estado inicial: t1 δq(0) = − ∫ e − Aτ Bδu(τ )dτ 0 substituyendo la forma de serie finita para la matriz de transferencia obtenemos: t1 n −1 δq (0) = − ∑ A B ∫ α k (− τ )δu(τ )dτ k k =0 0 definiendo los vectores constantes: t1 k = ∫ α k (− τ )δu(τ )dτ 0 podemos escribir: n −1 δq(0) = − ∑ A k B k k =0 reacomodando las componentes de los vectores k en un solo vector podemos rescribir la ecuación anterior, de la siguiente forma hipermatricial: δq(0) = −[B, AB, A 2 B, A 3B,   n −1 A B    ]   1    n −1  0 Si la dimensión del espacio de fases es n y existen r variables de control, la matriz del primer paréntesis es de tamaño n × nr y la del segundo es nr × 1 . Para que el sistema sea completamente controlable, dada cualquier condición inicial se debe satisfacer la ecuación anterior. Es decir, es necesario que la primera matriz tenga n columnas independientes, de modo que el determinante de la matriz reducida sea diferente de cero y pueda encontrarse una solución para cualquier condición inicial. La matriz: [ C = B, AB, A 2 B, A 3B, A n −1B ] se denomina matriz de controlabilidad del sistema y basta con verificar que su rango es igual a la dimensión del espacio de fases para saber si un sistema es controlable o no. Representación Externa Considerando la solución general del sistema de control obtenida en párrafos anteriores: t δq(t ) = e Atδq (0) + ∫ e A (t −τ )Bδu(τ )dτ 0 cuando estamos interesados sólo en el control del sistema, podemos suponer δq (0) = 0 y escribir: t δq(t ) = ∫ G(t − τ )δu(τ )dτ 0 con G(t − τ ) = e A (t −τ )B . Como vemos, la función G enmascara las características del sistema, pudiendo interpretarse la ecuación anterior como una relación entre la “entrada” que se le administra al sistema δu(t ) y la “salida” o efecto que se observa en el sistema debido a esa entrada δq(t ) . La representación anterior se conoce con el nombre de representación externa del sistema, mientras que la ecuación diferencial de evolución de los estados se denomina representación interna. La integral en el lado derecho de la representación externa es lo que se conoce como un producto de convolución entre las funciones del tiempo G y δu . Por otro lado, La transformada de Laplace de una función cualquiera del tiempo se define como: yˆ (s ) = ∞ [y (t )] = ∫ y (t )e − st dt −∞ y es bien conocido que la transformada de la convolución es igual al producto algebraico de las transformadas; la representación externa, en el espacio de Laplace tiene la forma: ˆ (s )δuˆ (s ) δqˆ (s ) = G La matriz Ĝ(s ) se denomina función de transferencia entre la entrada y la salida, y basta con conocer dicha función para conocer todas las propiedades de control del sistema. En una parte muy importante de la literatura sobre teoría de control, desde un principio, se adopta el punto de vista externo y se desarrollan todos los conceptos y las demostraciones en el espacio de Laplace. En este curso se ha adoptado el punto de vista interno puesto que nos interesa desarrollar el modelado del sistema dinámico del vehículo (lo cual se hace en el capítulo siguiente), además, como se ha visto aquí, las explicaciones de los conceptos de estabilidad y de controlabilidad aparecen como más directas o intuitivas en la representación interna y esto ayuda a muchos estudiantes a desarrollar una base más sólida para la comprensión de los temas. También es paradójico señalar que, en los libros de control, el teorema de controlabilidad casi siempre aparece en los últimos capítulos y no al principio como parecería lógico. Diseño de Controladores El teorema de controlabilidad, nos permite saber si un estado estacionario es controlable o no en forma muy sencilla. Sin embargo, en un caso práctico, este teorema no nos ayuda a calcular efectivamente la función de control necesaria para alcanzar un estado estacionario. En este párrafo veremos una forma particular de calcular la función de control apropiada. El sistema de control, bajo la forma lineal que hemos analizado: dδq = Aδq + Bδu dt se denomina también sistema de lazo abierto ya que en este sistema la función δu puede imponerse de cualquier forma, independientemente del resultado que esto pueda tener sobre la perturbación. En cambio, si relacionamos en cualquier forma la señal de control con la perturbación del estado δu = K (δq ) , obtenemos lo que se llama un sistema de control de lazo cerrado: dδq = Aδq + BK (δq ) dt ya que se ha utilizado la “salida”, es decir el valor de la perturbación, para retroalimentar el sistema buscando controlarlo. Es lógico pensar que la señal de control deba estar relacionada con las perturbaciones que sufre el sistema, es exactamente lo que hace cualquier ser humano cuando desea obtener agua tibia a partir de una mezcladora con dos llaves: si sentimos que el agua está muy caliente abrimos más la llave “fría” o cerramos un poco la llave “caliente”; y viceversa. Específicamente, podemos pensar que el control será directamente proporcional a la perturbación, tendiendo a reducirla siempre; esto se puede representar de la manera siguiente: δu = −K Pδq también podemos pensar que la señal de control sea proporcional al promedio de las perturbaciones durante un cierto intervalo de tiempo T anterior al instante en que se aplica el control; esto lo podemos representar como: δu = −K t 1 I T ∫ δqdτ t −T por último, podemos pensar que la señal de control sea proporcional a la velocidad con que la perturbación se incrementa o disminuye; esto se puede representar mediante: δu = − K D dδq dt En la realidad, muchas veces se aplican señales de control que son una combinación de estas tres posibilidades. En ese caso se habla de control proporcional, integral y derivativo o bien, simplemente, de control PID. Es evidente que el diseño del control consiste en el cálculo de las constantes K P , K I , K D de tal forma que el sistema regrese al estado estacionario para cualquier perturbación inicial. Para un control PID, el sistema de lazo cerrado se escribe como:  dδq = Aδq − B K Pδq + K I dt  t 1 T ∫ δqdτ + K D t −T dδq   dt  Este sistema de lazo cerrado puede verse como un nuevo sistema dinámico autónomo, reacomodando los términos de la ecuación. Primeramente, introducimos una nueva variable mediante: dδr = δq dt Por lo tanto, el control integral puede escribirse como: t K 1 I T ∫ δqdτ = −K [δr (t ) + δr (t − T )] = −K [δr + δr ] 1 I T 1 I T t −T t −T substituyendo en el sistema de lazo cerrado obtenemos: dδq  = Aδq − B K Pδq + K I dt  dδr = δq dt 1 T [δr + δrt −T ] + K D dδq  dt  el cual, reacomodando los términos puede escribirse como dos ecuaciones diferenciales de primer orden: dδq −1 −1 = (U + BK D ) (A − BK P )δq − (U + BK D ) BK I dt dδr = δq dt 1 T [δr − δrt −T ] Esta ecuación es una ecuación diferencial con retardo. Estas ecuaciones son un poco más difíciles de resolver que las ecuaciones diferenciales simples, por lo que, aún cuando existe una teoría perfectamente establecida para estas ecuaciones, en este texto nos limitaremos a despreciar el término de retardo integrando también la constante T1 en la constante K I (cabe mencionar que en la mayoría de las aplicaciones se llama control PID al que consiste precisamente en esta aproximación). Entonces, el sistema dinámico de PID se puede escribir cómo:  dδq  −1 −1  dt  (U + BK D ) (A − BK P ) − (U + BK D ) BK I  δq     dδr  =  0 U  δr      dt  Ahora bien, el diseño del control consiste en escoger los valores propios de esta nueva ecuación de evolución, de forma tal que el sistema con control sea estable. Suponiendo que se desea obtener los valores propios λi la ecuación característica debe ser: 2n (λ − λ1 )(λ − λ2 ) (λ − λ2n ) = ∑ aˆi λ2n−i i =0 En donde los coeficientes del polinomio âi se conocen con el nombre de invariantes principales (es evidente que siempre será aˆ 0 = 1 ). Se debe notar que se requiere seleccionar 2n valores propios ya que el sistema ha duplicado su tamaño debido a el control integral. Es fácil demostrar que la siguiente matriz tiene como valores propios los λi :  0  0  D= 0   − aˆ 2 n 1 0 0 0 1 0 − aˆ 2 n−1 − aˆ 2 n−2 0 0 1 0  0   0   1  − aˆ1  Esta matriz se denomina forma canónica del sistema con valores propios λi . Existen muchas otras formas de construir matrices que tengan los mismos valores propios. A un grupo importante de estas se les llama formas acompañantes y se obtienen trabajando los valores propios en forma similar, por grupos. Sin embargo, se puede demostrar que para cualquier matriz T no singular, la matriz T −1DT tiene los mismos valores propios que D ya que tiene el mismo polinomio característico: D − λU = T −1DT − λU en efecto, recordando que U = T −1T y factorizando del lado derecho: T −1DT − λT −1T = T −1 (D − λU )T por otro lado, el determinante del producto es igual al producto de determinantes: T −1 D − λ U T = T −1 T D − λ U = D − λ U De este modo, si se pueden encontrar matrices constantes K P , K I , K D y una matriz T , tales que: (U + BK D )−1 (A − BK P ) − (U + BK D )−1 BK I  −1   = T DT U 0   el sistema de lazo cerrado con control PID tendrá los valores propios deseados. La ecuación matricial tiene 4n 2 componentes. Podemos ahora contabilizar las incógnitas que aparecen en esta ecuación: si se considera que el sistema de lazo abierto tiene n variables de fase y r variables de control, entonces se tienen 3nr incógnitas por las componentes de las matrices K P , K I , K D . Sin embargo, las componentes de la matriz T no son todas independientes ya que por ser de transformación debe ser unitaria. Como puede verse, este problema es bastante complejo y hasta el momento no se conoce una solución general del mismo. Ejemplo del Péndulo Invertido Se tiene una plataforma deslizante de masa M con una barra vertical unida mediante una articulación (figura). La barra tiene una masa m . La plataforma es impulsada mediante una fuerza horizontal u . En el caso de cuerpos compuestos por diversos eslabones se recomienda establecer los diagramas de cuerpo libre considerando las reacciones apropiadas en los pares dinámicos correspondientes. Así, la función de Lagrange para la plataforma del carrito está formada por la energía cinética de la misma más el trabajo producido por las fuerzas aplicadas: Lc = 12 MU c2 + ∫ (u − Fix )dx evidentemente, estamos despreciando cualquier fricción en las ruedas y cancelando entre sí las fuerzas que no producen desplazamientos en el eje vertical. De la misma forma, la función de Lagrange de la barra está formada por su energía cinética más el trabajo producido por las fuerzas aplicadas, la diferencia en este caso es que la barra puede girar alrededor de la articulación y, por lo tanto, su centro de gravedad se desplaza en ambas direcciones. De este modo, los movimientos rotacionales contribuyen a la lagrangiana mediante los términos siguientes: Lb = 12 m (U b2 + Vb2 ) + ∫ Fix dx + ∫ Fiy dy − mgyCG + 12 IR 2 + ∫ [Fiy ( xCG − x ) − Fix yCG ]dθ Como puede verse, se ha colocado el cero de la energía potencial en la articulación de modo que la energía potencial de la barra es cero cuando se encuentra en posición horizontal. Las variables xCG , yCG están relacionadas geométricamente con las variables x,θ mediante las siguientes relaciones: xCG = x + lsen(θ ) yCG = l cos(θ ) U b = xCG = U c + lR cos(θ ) Vb = yCG = −lRsen(θ ) En donde l es la longitud al centro de gravedad de la barra. Ahora bien, las variables de fase y sus derivadas con respecto al tiempo son: x = Uc xCG = U b yCG = U b θ =R Por lo que las ecuaciones de Euler – Lagrange para los dos cuerpos del sistema son: d ∇U Lc = ∇ x Lc dt c d ∇{U b ,Vb , R}Lb = ∇{xCG , y CG ,θ }Lb dt es decir: d (MU c ) = u − Fix dt d (mU b ) = Fix dt d (mVb ) = Fiy − mg dt d (IR ) = Fiy (xCG − x ) − Fix yCG dt utilizando la segunda y tercera ecuaciones para eliminar las fuerzas internas entre los elementos, considerando las masas constantes y adjuntando la definición de las velocidades, obtenemos: x = Uc MU c = u − m dU b dt θ =R dV dU   IR = m b + g ( xCG − x ) − m b yCG dt  dt  eliminando las variables de fase que no son independientes obtenemos: x = Uc (M + m )U c = u − mlR cos(θ ) + mlR 2 sen(θ ) θ =R (I + ml )R = mglsen(θ ) − mlU c cos(θ ) 2 Despejando las primeras derivadas de las variables de fase encontramos el sistema dinámico correspondiente: [ ] x = Uc (I + ml 2 ) ml (I + ml )R − mgl cos(θ ) sen (θ ) u + (M + m )(I + ml 2 ) − m 2l 2 cos 2 (θ ) (M + m )(I + ml 2 ) − m 2l 2 cos 2 (θ ) θ =R 2 ml (M + m )g − mR l cos(θ ) sen (θ ) ml cos(θ ) u R= − 2 2 2 2 (M + m )(I + ml ) − m l cos (θ ) (M + m )(I + ml 2 ) − m 2l 2 cos2 (θ ) Uc = [ 2 2 ] Encontrar los estados estacionarios de este sistema puede parecer difícil dadas las no linealidades del mismo. Sin embargo, es fácil verificar que el origen del espacio de fases q e = 0 es un estado estacionario para un valor de compensación nulo u c = 0 : xe = 0 ; U ce = 0 ; θ e = 0 ; Re = 0 en efecto, esto se verifica fácilmente debido a la existencia del factor sen(θ ) en las ecuaciones. Entonces, las derivadas de estabilidad del sistema dinámico serán: ∂x =0 ∂x qe ,uc ∂U c ∂x ∂θ ∂x =0 q e ,u c ∂x ∂U c ∂U c ∂U c q e ,u c ∂θ ∂U c ∂R =0 ∂x qe ,uc ∂R ∂U c =0 ∂x ∂θ =1 q e ,uc ∂U c ∂θ =0 q e ,u c = q e ,u c =0 q e ,u c q e ,u c − m2l 2 g (M + m )(I + ml 2 ) − m 2l 2 ∂U c ∂R q e ,u c mg (M + m )l ∂R = ∂θ qe ,uc (M + m )(I + ml 2 ) − m 2 l 2 ∂R =0 ∂R qe ,uc =0 Mientras que las derivadas de control son: ∂x =0 ∂u q e ,uc ∂U c ∂u ∂θ ∂u = q e ,u c (I + ml ) (M + m )(I + ml ) − m l 2 2 2 2 =0 q e ,u c ∂R − ml = ∂u q e ,u c (M + m )(I + ml 2 ) − m 2l 2 el sistema de control podrá escribirse como: 0  δx   δU  0  c =   δθ  0    δR  0  1 =0 q e ,u c ∂θ =1 ∂R qe ,uc ∂θ ∂θ =0 q e ,u c ∂x =0 ∂R qe ,uc =0 0 − m 2l 2 g 0 (M + m )I + Mml 2 0 0 ( M + m )ml g 0 (M + m )I + Mml 2 0 0   ( I + ml 2 )    δx   0 δU   2 c +  (M + m )I + Mml δu  1  δθ   0  ml −    0  δR   2  (M + m )I + Mml   Substituyendo valores numéricos podrán calcularse los valores propios del operador de evolución para conocer la estabilidad del estado estacionario. Igualmente, podrá encontrarse el rango de la matriz de controlabilidad. Sin embargo, con el objeto de continuar el cálculo en la forma lo más general posible, rescribiremos este sistema como:  δx  0 δU  0  c =   δθ  0     δR  0 0  δx   0  0 δU c   b1  δu  + 1  δθ   0      0  δR  − b2  1 0 0 − a1 0 0 0 a2 La estabilidad está dada por el siguiente polinomio característico: 0 0 λU −  0  0 1 0 0 − a1 0 0 0 a2 0 0  =0 1  0 es decir: λ 0  0  0 λ λ 0   0 −1 0 λ a1 0 λ 0 − a2 a1 λ − a2 0 λ 0  = λ 0  − 1  0 λ  0  λ − 1 = λ2   − a2 λ  a1 λ − a2 0 − 1  λ  − 1 = λ2 (λ2 − a 2 )  λ Por lo que los valores propios del sistema son: λ1, 2 = 0 λ3, 4 = ± a2 Concluimos que siempre existe un modo inestable. Ahora calcularemos la matriz de controlabilidad:   0  0  b1  0  ,   C=  0  0    − b2  0 1 0 0 − a1 0 0 0 a2 0  0  0 0  b1  0 ,   1   0  0   0 − b2  0 1 0 0 − a1 0 0 0 a2 0 0  1  0 2  0  0  b  0  1 ,   0  0   − b2  0 1 0 0 − a1 0 0 0 a2 0 0  1  0 3  0   b   1   0    − b  2   realizando los cálculos:  0  b C= 1  0  − b2 b1 0 − b2 0 0 a1b2 0 − a2 b2 a1b2  0   − a2 b2   0  Dividiendo las componentes de la tercera columna entre las componentes respectivas de la primera, es fácil ver que no habrá controlabilidad cuando se cumpla la condición a2 b1 − a1b2 = 0 . Sin embargo esto es imposible ya que dicha cantidad es igual a: a 2 b1 − a1b2 = ml g (M + m )I + Mml 2 y todas las cantidades del lado derecho son positivas. En conclusión, este sistema será siempre controlable. A continuación diseñaremos un controlador para el sistema propuesto. Debemos calcular las componentes de la matriz K de tal forma que los valores propios de la nueva matriz de estabilidad hagan estable el sistema de lazo cerrado. Supongamos que deseamos que el polinomio característico tenga la siguiente forma: (λ − λ1 )(λ − λ2 )(λ − λ3 )(λ − λ4 ) = 0 los invariantes principales, en función de los valores propios deseados son: aˆ 0 = 1 aˆ1 = −(λ1 + λ2 + λ3 + λ4 ) aˆ 2 = λ1λ2 + λ3λ4 + (λ1 + λ2 )(λ3 + λ4 ) aˆ 3 = −(λ1λ2 (λ3 + λ4 ) + (λ1 + λ2 )λ3λ4 ) aˆ 4 = λ1λ2 λ3λ4 Por otro lado, el polinomio característico del sistema de lazo cerrado será: 0 0 λU −  0  0 Es decir: 1 0 0 − a1 0 0 0 a2 0  0  0  b1  [k1 + 1  0     0  − b2  k2 k3 k4 ] = 0 −1  λ  bk λ + b1k 2  1 1 0  0  − b2 k1 − b2 k 2 0 a1 + b1k3 λ − a 2 − b2 k3 0  b1k 4   =0 −1   λ − b2 k 4  Realizando los cálculos: λ4 + (b1k 2 − b2 k 4 )λ3 + (b1k1 − b2 k3 − a2 )λ2 − (a2 b1 − a1b2 )k 2λ − (a2 b1 − a1b2 )k1 = 0 Igualando los coeficientes de potencias iguales entre el polinomio de lazo cerrado y el polinomio deseado, obtenemos: b1k 2 − b2 k 4 = aˆ1 b1k1 − b2 k 3 − a2 = aˆ 2 − (a2 b1 − b2 a1 )k 2 = aˆ3 − (a2 b1 − b2 a1 )k1 = aˆ 4 Despejando las ganancias del control tenemos: k1 = − aˆ 4 a2b1 − b2 a1 k2 = − aˆ 3 a2 b1 − b2 a1 k3 = − b1 aˆ 4 a + aˆ 2 − 2 b2 a2 b1 − b2 a1 b2 k4 = − b1 aˆ 3 aˆ − 1 b2 a2b1 − b2 a1 b2 A continuación se efectúa este calculo para los siguientes valores: [ ] [ M = 3 [Kg ]; m = 0.3 [Kg ]; l = 1 [m]; I = 0.15 Kgm 2 ; g = 9.81 m/s 2 la matriz de derivadas de estabilidad es: 0 0 ∇q e F =  0  0 1 0 0 − 0.6329 0 0 0 6.9619 0 0  1  0 ] es decir a1 = 0.6329 y a2 = 6.9619 . Los valores propios de esta matriz son: λ1 = 0 λ2 = 0 λ3 = 2.6385 λ4 = −2.6385 existen dos modos neutros, uno inestable y uno estable; se concluye que el estado estacionario es inestable. La matriz de derivadas de control es:  0   0.3226   ∇u c F =   0    − 0.2151 es decir b1 = 0.3226 y b2 = 0.2151 . De tal suerte que la matriz de controlabilidad es: 0.3226 0 0.1361   0  0.3226 0 0.1361 0   C=  0 0 − 0.2151 − 1.4972   0 0  − 1.4972 − 0.2151 se puede determinar fácilmente que su rango es 4, por lo que se concluye que el estado estacionario es controlable. O bien, de otro modo, se verifica que el discriminante siguiente no es cero: a2b1 − a1b2 = 2.1097 Ahora bien, deseamos que la varilla regrese a su posición vertical en forma suave, no brusca, por lo que debemos admitir valores propios complejos conjugados con una parte real negativa pero no muy grande en valor absoluto. Escojamos los siguientes valores propios: λ1 = −15 λ2 = −10 λ3 = −2 + 2 3i λ4 = −2 − 2 3i Por lo tanto, la ecuación característica deseada es: (λ − λ1 )(λ − λ2 )(λ − λ3 )(λ − λ4 ) = (λ + 15)(λ + 10)(λ + 2 − 2 (λ 2 + 25λ + 150)(λ2 + 4λ + 16) = 0 λ4 + 29λ3 + 266λ2 + 850λ + 2400 = 0 de donde extraemos los invariantes principales: aˆ0 = 1; aˆ1 = 29; aˆ 2 = 266; aˆ3 = 850; aˆ 4 = 2400 Por último, las ganancias del controlador serán: k1 = −1137.6147 k 2 = −402.9052 k3 = −2975.6950 k 4 = −739.2078 )( ) 3i λ + 2 + 2 3i = 0 Capítulo 3 Ecuaciones de Movimiento del Vehículo Ejes de Referencia Durante el análisis del movimiento de un cuerpo se hace necesaria la utilización de diversos sistemas de referencia. Esto es debido a que la adecuación de un sistema de ejes depende del fin que se persigue al introducirlo. Así, en nuestro estudio, buscaremos, en un principio, las ecuaciones que gobiernan la trayectoria del vehículo, posteriormente, desearemos conocer los movimientos del mismo y, al hacer esto, requeriremos expresiones para las fuerzas aerodinámicas a que se ve sometido. En cada uno de los tres análisis mencionados, convendrá tomar un sistema de referencia diferente. En este libro utilizaremos solamente tres sistemas de referencia, los conocidos con los nombres de: ejes tierra, ejes cuerpo y ejes viento. Todos los sistemas de referencia utilizados serán del tipo cartesiano, ortogonal, derecho. En las siguientes tablas resumimos la definición de cada uno de ellos, agregando alguna información sobre su utilidad así como la nomenclatura asociada. Sistema de Ejes Tierra Definición a) El origen es cualquier punto de la superficie terrestre. (2) El eje Z ′ es paralelo a, y positivo en el sentido de la aceleración de la gravedad. (3) Los ejes X ′ y Y ′ se localizan en el plano perpendicular al eje Z ′ , llamado plano del horizonte, en Comentarios Este sistema permite escribir las ecuaciones de movimiento ya que, como se verá más adelante, puede considerarse como un sistema inercial. cualquier dirección que sea conveniente, formando un sistema derecho. Sistema de Ejes Cuerpo Definición Comentarios b) El origen es el centro de Este sistema permite analizar los gravedad del cuerpo en movimientos del cuerpo. Los movimientos traslacionales se conocen movimiento. (2) El eje X se toma paralelo a una con los nombres de: avance, derrape y referencia longitudinal del cuerpo descenso, en las direcciones positivas de los (por ejemplo, la dirección ejes X − Y − Z respectivamente. principal de movimiento de un Los movimientos rotacionales se conocen vehículo). con los nombres de: alabeo, cabeceo y (3) El eje Y se toma en el plano guiñada, en el sentido de un tornillo perpendicular al anterior, paralelo derecho alrededor de los ejes X − Y − Z a una referencia transversal del respectivamente. cuerpo (por ejemplo, la envergadura para un avión). (4) El eje Z se toma perpendicular a los anteriores y positivo de tal suerte que se obtenga un sistema derecho. Sistema de Ejes Viento Definición Comentarios c) El origen es el centro de Este sistema nos permite calcular las fuerzas y momentos aerodinámicos que actúan gravedad del cuerpo. (2) El eje X V se toma paralelo a la sobre el cuerpo en movimiento. proyección del vector velocidad Las fuerzas aerodinámicas se conocen con sobre el plano X − Z del cuerpo y los nombres de resistencia al avance, positivo en la dirección opuesta al fuerza de derrape y levantamiento a lo largo de los ejes X V − YV − ZV movimiento. (3) El eje YV coincide con el eje Y respectivamente. Los momentos aerodinámicos se conocen del cuerpo. (4) El eje ZV es perpendicular a los con los nombres de alabeo, cabeceo y guiñada alrededor de los ejes X V − YV − ZV dos anteriores formando un respectivamente. sistema derecho. Puede parecer que hay una ligera inconsistencia al confundir los nombres de los movimientos en los ejes cuerpo con los de los momentos en los ejes viento (salvo para el cabeceo, pues los ejes Y coinciden). Sin embargo, puesto que el origen de los ejes viento coincide con el centro de gravedad del cuerpo, puede considerarse a estos como un caso particular de ejes cuerpo. Dependiendo de los autores, a veces se utilizan otros sistemas de referencia en mecánica de vuelo. Así, podemos mencionar a los llamados “ejes locales”, que son un sistema de referencia paralelo al de tierra pero con el origen en el centro de gravedad del cuerpo. También pueden mencionarse los “ejes de estabilidad”, paralelos a los ejes viento pero girados 180 grados alrededor del eje YV . Rotaciones en el Espacio. Durante el análisis del movimiento de un vehículo requeriremos transformar ciertas cantidades físicas de unos ejes a otros; por ejemplo, las fuerzas aerodinámicas halladas en el sistema de ejes del viento deberán transformarse a los ejes del vehículo, para conocer los movimientos que ellas producen. En general, las cantidades físicas que se utilizarán son vectores que pertenecen a un cierto espacio vectorial. Las transformaciones de coordenadas pueden interpretarse como rotaciones en el espacio correspondiente (más adelante estableceremos matemáticamente este hecho). Por otro lado, las rotaciones son transformaciones lineales de unos vectores en otros y, por lo tanto, comenzaremos analizando este tipo de transformaciones. La transformación lineal más general de un vector a en otro x , puede escribirse de la siguiente forma: x = Ra en donde R representa una matriz de orden igual al número de dimensiones del espacio vectorial (en nuestro caso tratamos únicamente con vectores en tres dimensiones). Ahora bien, no todas las transformaciones de este tipo pueden interpretarse como rotaciones del vector a . Para que esto sea posible será necesario satisfacer dos condiciones elementales: a) La norma del vector a debe permanecer invariable durante la rotación. b) Una terna ordenada de vectores debe girar de modo que se superpongan los vectores en el mismo orden original (se deben evitar las reflexiones especulares). Estas condiciones imponen ciertas restricciones sobre las componentes de la matriz R que serán analizadas a continuación. La condición de invariabilidad de la norma puede establecerse mediante la siguiente ecuación: xT x = aT a 2 es decir, el cuadrado de la norma ( x = x T x ) debe ser el mismo antes y después de la rotación. Sustituyendo la relación de transformación y su transpuesta del lado izquierdo de esta identidad, puede obtenerse: aT R T Ra = aT a en donde hemos utilizado el hecho de que la transpuesta del producto es igual al producto de transpuestas. Finalmente, a través de la ley del cociente, se obtiene fácilmente: RT R = U en donde U es la matriz identidad (con unos en la diagonal principal y ceros fuera de ella). Esta relación nos indica que, para una matriz de rotación, la transpuesta es igual a la inversa. Derivado de lo anterior, también podemos ver que el determinante de la matriz de rotación es de magnitud unitaria, en efecto, si tomamos el determinante de ambos lados de la última ecuación obtenemos: RT R = U Puesto que el determinante de U = 1 y el determinante del producto es igual al producto de determinantes tenemos: 2 R =1 Ahora bien, para saber que representa el valor positivo o el valor negativo de este determinante necesitamos considerar una terna ortonormal de vectores e1 , e 2 , y e 3 ordenada según la regla de la mano derecha (nótese la permutación cíclica de los índices): [e1 ×]e2 = e3 ; [e2 ×]e3 = e1; [e3 ×]e1 = e2 es fácil comprobar que, ordenando las componentes de estos vectores como columnas en una matriz, el determinante de esta última será igual a la unidad (puesto que los vectores son unitarios), es decir: [e1, e2 , e3 ] = 1 Entonces, transformando cada uno de los vectores mediante la matriz R , el determinante del resultado debe permanecer igual a la unidad, de modo que la terna resultante sea también ortonormal derecha. En efecto, recordamos que una permutación entre las columnas de un determinante cambia su signo, por lo tanto, para que los tres vectores se superpongan simultáneamente, el determinante debe permanecer igual a la unidad. En suma, tenemos la condición: [Re1, Re2 , Re3 ] = 1 o bien: R[e1, e2 , e3 ] = 1 Finalmente, puesto que el determinante del producto es igual al producto de determinantes llegamos a la conclusión de que: R =1 En resumen, podemos decir que las condiciones (a) y (b) sobre las rotaciones nos llevan a las siguientes condiciones sobre las matrices que las representan: a) La inversa de una matriz de rotación es igual a su transpuesta. b) El determinante de una matriz de rotación es igual a la unidad. Puede demostrarse que estas condiciones son necesarias y suficientes, es decir, que toda matriz que satisfaga las condiciones (a) y (b) representa una rotación de vectores en el espacio vectorial correspondiente. Sin embargo, estas condiciones no nos permiten calcular las componentes de la matriz de rotación para un caso específico. Se plantea entonces el problema de la representación de la matriz de rotación dadas ciertas condiciones o parámetros de la misma. Dicho problema ha encontrado diversas soluciones a través de los siglos, mencionemos particularmente: los ángulos de Euler, los cuaterniones de Gauss, la forma de Gibbs, los parámetros de Euler – Rodrigues, las matrices de Dirac del grupo SU(2), etc. De entre todas estas representaciones nos limitaremos a exponer dos de ellas: la forma de Gibbs, debido a su simplicidad y su utilidad en la simulación de la dinámica de un vehículo, y los ángulos de Euler, debido a su uso generalizado en el área de la mecánica de vuelo para los análisis de estabilidad. Las otras formas han sido de utilidad en otras áreas de la ciencia tales como la mecánica cuántica, la cartografía, etc. El lector interesado podrá encontrar información al respecto en los libros de texto especializados. Forma de Gibbs de la Matriz de Rotación. Supongamos dado un cierto eje alrededor del cual se efectúa una rotación en un espacio tridimensional. Sea n un vector unitario paralelo a la dirección del eje y φ el ángulo de rotación en el plano perpendicular al eje. En la siguiente figura puede observarse que se escoge como positiva la dirección del ángulo φ de acuerdo con la regla de la mano derecha. Figura 1. Regla de la mano derecha para las rotaciones. Sea a un vector fuera del plano perpendicular al eje de giro. Entonces, con el giro transforma el vector a en el vector x como se muestra en la figura 2. La transformación puede representarse como x = Ra . Intentamos expresar la transformación de este vector en función del vector n y del ángulo φ . Considerando que el vector x , resultado de la transformación, puede expresarse como la suma de sus componentes paralela al eje de giro y perpendicular al mismo podemos escribir: ( ) [ ( )] x = nT x n + x − nT x n Ahora bien, en la figura 2, es fácil observar que la componente de x paralela al vector n es igual a la componente de a en la misma dirección: (n x )n = (n a)n = n(n a ) = nn a T T T T Figura 2. Rotación de un vector en el espacio. Por otro lado, la componente de x en el plano de giro puede expresarse a su vez como la suma de sus componentes paralela a la proyección de a sobre el mismo plano y perpendicular a esta última. Estas componentes se expresan fácilmente con ayuda del ángulo de giro φ , como se deduce de la figura 3: [x − (n x)n] = [a − (n a)n]cos(φ ) + {[n ×][a − (n a)n]}sen(φ ) T T T es decir: [x − (n x)n] = [a − (n a)n]cos(φ ) + [n ×]asen(φ ) T T en donde se ha hecho uso de la propiedad [n ×]n = 0 , válida para cualquier vector. Figura 3. Proyección de la rotación en el plano de giro. Finalmente, sustituyendo estos resultados para las componentes paralela y perpendicular al eje de giro, el vector x puede escribirse como: ( ) [ ( )] x = n Ta n + a − n Ta n cos(φ ) + [n ×]asen(φ ) Reacomodando factores para poder factorizar a la derecha el vector a podemos escribir: [ { ] } x = nn T + U − nn T cos(φ ) + [n ×]sen(φ ) a en donde U es la matriz identidad. Comparando esta expresión con x = Ra encontramos: [ ] R = nn T + U − nn T cos(φ ) + [n ×]sen (φ ) = R φn R φn = nn T + [n ×][Usen (φ ) − [n ×]cos(φ )] La cual es conocida como la forma de Gibbs de la matriz de rotación. Evidentemente, esta forma relaciona las componentes de la matriz con el ángulo y con el eje de la rotación. En lo sucesivo, cuando nos refiramos a una matriz de rotación mediante su forma de Gibbs, agregaremos como índice el ángulo de rotación y como superíndice el eje de la rotación. ∂R φn n = R φ = [n ×][U cos(φ ) + [n ×]sen (φ )] ∂φ Transformación de Coordenadas y de Componentes. Las transformaciones de componentes entre dos sistemas de referencia pueden realizarse con ayuda de las matrices de rotación. En efecto, supongamos dos sistemas de referencia con el mismo origen, definidos por dos ternas ortonormales derechas de vectores unitarios (i′,j′,k ′) e (i,j,k ) y supongamos dada la matriz de rotación R que hace girar los vectores del primer sistema en los del segundo. Es decir, se tienen las siguientes igualdades: i = Ri′, j = Rj′, k = Rk ′ Los vectores del segundo sistema pueden escribirse en componentes del primer sistema como: i = c11i′ + c12 j′ + c13k ′ j = c21i′ + c22 j′ + c23k ′ k = c31i′ + c32 j′ + c33k ′ sustituyendo la primera de las ecuaciones anteriores en la primera de éstas e introduciendo las componentes de las matrices podemos ver que: Ri′ = c11i′ + c12 j′ + c13k ′  r11 r  21  r31 r12 r22 r32 r13  1  c11  r23  0 = c12      r33  0  c13  Es fácil concluir que estas ecuaciones implican que: c11 c21 c31  R = c12 c22 c32  c13 c33 c33  Así, vemos que la matriz de rotación que hace girar al primer sistema sobre el segundo, está constituida en columnas por las componentes, en el primer sistema, de los vectores unitarios del segundo sistema y, en ocasiones, escribiremos: R = [c1 , c 2 , c3 ] en donde los vectores c i son tres vectores unitarios ortogonales. Ahora bien, puesto que los vectores son unitarios, el producto escalar i′T i es el coseno del ángulo que forman los vectores i′ e i . Calculando todos los productos escalares posibles entre los seis vectores unitarios tenemos: i ′T i = c11i′T i ′ + c12 i ′T j′ + c13i ′T k ′ = c11 i ′T j = c21i ′T i′ + c22 i′T j′ + c23i ′T k ′ = c21 i ′T k = c31i′T i′ + c32 i ′T j′ + c33i′T k ′ = c31 j′T i = c11 j′T i′ + c12 j′T j′ + c13 j′T k ′ = c12 j′T j = c21 j′T i ′ + c22 j′T j′ + c23 j′T k ′ = c22 j′T k = c31 j′T i ′ + c32 j′T j′ + c33 j′T k ′ = c32 k ′T i = c11k ′T i′ + c12 k ′T j′ + c13k ′T k ′ = c13 k ′T j = c21k ′T i′ + c22 k ′T j′ + c23k ′T k ′ = c23 k ′T k = c31k ′T i′ + c32 k ′T j′ + c33k ′T k ′ = c33 Por esta razón, la matriz de rotación entre los dos sistemas se denomina también matriz de cosenos directores. Por otro lado, supongamos dado un vector cualquiera a′ en componentes del primer sistema: a′ = a1′i′ + a2′ j′ + a3′k ′ las componentes de este vector en el segundo sistema pueden encontrarse mediante sus proyecciones sobre los vectores unitarios (i,j,k ) : a1 = a′T i = a1′i′T i + a2′ j′T i + a3′k ′T i a2 = a′T j = a1′i′T j + a2′ j′T j + a3′ k ′T j a3 = a′T k = a1′i′T k + a2′ j′T k + a3′k ′T k utilizando los cosenos directores es fácil comprobar que estas ecuaciones pueden escribirse como: a1 = a1′c11 + a2′ c12 + a3′ c13 a2 = a1′c21 + a2′ c22 + a3′ c23 a3 = a1′c31 + a2′ c32 + a3′ c33 o bien, en notación matricial:  a1   c11 c12 a  = c c  2   21 22  a3  c31 c32 c13   a1′  c23  a2′    c33   a3′  es decir: a = R T a′ La transpuesta de la matriz de rotación, que transforma los vectores unitarios del primer sistema en vectores unitarios del segundo sistema, transforma las componentes de un vector en el primer sistema, en componentes del mismo vector en el segundo sistema. La transformación opuesta es inmediata: a′ = Ra Es muy importante interpretar correctamente la diferencia entre estas ecuaciones y la expresión correspondiente para los vectores unitarios. En esta última, se trata de dos vectores diferentes relacionados, en un mismo sistema, mediante una transformación lineal. Mientras que en las ecuaciones finales se trata de la relación entre componentes de un mismo vector en dos sistemas de referencia. Finalmente, las componentes de un vector se pueden interpretar como las coordenadas de un punto en el espacio, con respecto a un sistema de referencia. Por lo tanto, la ecuación deducida se interpreta como la transformación de coordenadas de un punto entre dos sistemas de referencia. Transformaciones por los Ángulos de Euler La transformación de componentes de un vector en el plano es un problema geométrico muy simple, como lo muestra la siguiente figura. a x = a x′ cos(α ) + a y′ sen (α ) a y = −a x′ sen (α ) + a y′ cos(α ) Transformación de componentes de un vector en el plano. La relación entre los sistemas de referencia x′ − y ′ y x − y es una rotación de un ángulo α alrededor de un eje z perpendicular al plano de la figura. De acuerdo con los resultados obtenidos anteriormente, la forma de Gibbs de la matriz de rotación que transforma el sistema x′ − y ′ en el sistema x − y es: R αk ′ = k ′k ′T + (U − k ′k ′T )cos(α ) + [k ′ ×]sen (α ) es decir:  cos( R ✁ =  sen (   0 k′ ) ) − sen ( cos( 0 ) ) 0 0  1 Así, la transformación de las componentes del vector a del sistema x′ − y ′ al sistema x − y , puede representarse por la ecuación: a x− y  cos(α ) sen (α ) 0  a x ′  = R α a x ′− y ′ =  − sen (α ) cos(α ) 0 a y ′      0 0 1  0  k ′T Este caso sencillo puede utilizarse para la transformación de componentes en tres dimensiones. Para ello, estableceremos primero las matrices de rotación correspondientes a rotaciones alrededor de los ejes Y y X : [ ] [ ] R ✄j′ = j′j′T + U − j′j′T cos(✂ ) + [j′ ×]sen (✂ ) R i✄′ = i′i′T + U − i′i′T cos(✂ ) + [i′ ×]sen (✂ ) es decir:  cos(α ) 0 sen (α ) Rα =  0 1 0    − sen (α ) 0 cos(α ) j′ 0 0  1  R α = 0 cos(α ) − sen (α )   0 sen (α ) cos(α )  i′ Ahora bien, el lector podrá convencerse fácilmente de que con tres rotaciones sucesivas, una alrededor de cada uno de los ejes, siempre puede pasarse de un sistema tridimensional a otro, cualquiera que sea la posición de este último (ver figura). Transformación mediante tres rotaciones sucesivas. La posición relativa de un sistema con respecto a otro, denominada actitud, puede definirse mediante tres rotaciones sucesivas. Es decir, suponiendo inicialmente que los ejes de ambos sistemas son paralelos, se realizan dichas rotaciones hasta encontrar la actitud del segundo sistema. Los ángulos de rotación (todos positivos según la regla de la mano derecha) se conocen con el nombre de ángulos de Euler. Se ha convenido en que el orden de rotación es el siguiente (ver figura): 1) Partiendo de los ejes tierra, se hace girar el eje Z ′ un ángulo ψ (guiñada). 2) En su nueva posición, se hace girar el eje Y A un ángulo θ (cabeceo). 3) En su nueva posición se hace girar el eje X un ángulo φ (alabeo). Definición de los Ángulos de Euler. Debe observarse que la definición de los ángulos de Euler está implícita en el orden de rotación. En efecto, si primero se efectuara el cabeceo, el ángulo de guiñada necesario para alcanzar la posición deseada sería diferente al ángulo ψ definido anteriormente. Con base en estas definiciones, es fácil verificar que un vector, cuyas componentes en el primer sistema son a′ , tiene las siguientes componentes en el segundo sistema: a = R φiT R ✁j AT R k ′T a′ Para obtener la relación inversa se debe premultiplicar por las inversas correspondientes en el orden adecuado: a′ = R k ′R ✁j A Rφi a con respecto a la matriz de cosenos directores podemos escribir la siguiente identidad: R = R k ′R ✁j A R φi Ejemplo: En un instante dado la actitud de una aeronave con respecto a los ejes tierra es de –3° de guiñada, 3° de cabeceo y 30° de alabeo. La masa de la aeronave es de 7000 kg. Calcule las componentes del peso en los ejes cuerpo. Si la aeronave acelera a 7 m/s^2, calcule las componentes de la aceleración en ejes tierra. Solución: Designemos por p′ el vector peso del avión. Luego, en los ejes tierra dicho vector tiene componentes:  0   0  p′ =  0  =  0      mg  68670 En donde g es la magnitud de la aceleración de la gravedad. De acuerdo con la fórmula de transformación, las componentes del peso en los ejes cuerpo son:  − 68670sen (3°)   − 3593.9101 p = 68670 cos(3°)sen (30°) =  34287.9451      68670 cos(3°)cos(30°)  59388.4630  El vector aceleración se conoce en ejes cuerpo: 7  a =  0   0 Las componentes en ejes tierra son:  6.9808  a =  − 0.3659    − 0.3663 Sistemas de Referencia en Movimiento. Supongamos que, en un caso dado, tenemos un sistema de referencia fijo y otro que esta girando con una cierta velocidad angular ′ . Además, tenemos una serie de vectores que también pueden variar con el tiempo. Primeramente, es obvio que la matriz de rotación R , entre estos sistemas, varía con el tiempo. Entonces, con el objeto de conocer las componentes de los vectores con respecto a este sistema de referencia, debemos establecer una ecuación para conocer la matriz de rotación en cada instante del tiempo. Esto puede lograrse fácilmente, en cada instante del tiempo, mediante la forma de Gibbs para una rotación alrededor de un eje paralelo a la velocidad angular ′ y con un ángulo dado por φ = ′ ∆t . En efecto, supongamos que se conocen las componentes de tres vectores unitarios paralelos a los ejes del sistema en rotación. Sean estos c1 ,c 2 y c 3 paralelos a X , Y y Z respectivamente. Ahora bien, pasado un tiempo ∆t , la nueva posición de los vectores c1 ,c 2 y c 3 se encuentra multiplicando cada uno por la forma de Gibbs para la rotación mencionada. Los vectores c1 ,c 2 y c 3 son, evidentemente, las columnas de la matriz de rotación en el instante t , es decir, R (t ) . El vector unitario en la dirección del eje de rotación puede escribirse: ′ ′ n′ = y la forma de Gibbs para la rotación durante un intervalo de tiempo ∆t será: [ ] R φn′ = n′n′T + U − n′n′T cos(φ ) + [n′ ×]sen (φ ) Ahora bien, la nueva posición de los vectores c1 , c 2 y c 3 después del intervalo ∆t puede calcularse como: R (t + ∆t ) = R φn′R (t ) En esta forma puede calcularse la posición del sistema en rotación en cada instante del tiempo. [[[[[[El problema inverso, es decir, encontrar la velocidad angular dadas dos posiciones sucesivas del cuerpo se resuelve con el desviador de la forma de Gibbs: R φn′ − R φn′T 2 = [n′ ×]sen (φ ) la parte esférica de la forma de Gibbs nos da: R φn′ + R φn′ = n′n′T + U − n′n′T cos(φ ) ]]]]]] 2 T [ ] Por otro lado, si los vectores considerados varían con el tiempo, el conocimiento de la razón de cambio de las componentes en el sistema en rotación no será suficiente para conocer la razón de cambio de las componentes en el sistema fijo. Será necesario, además, conocer la derivada de la matriz de rotación con respecto al tiempo. En efecto, supongamos que el vector A depende del tiempo. En un instante dado, las componentes de este vector en el sistema fijo vienen dadas por: A′(t ) = R (t )A (t ) la razón de cambio con respecto al tiempo viene dada por: dA ′ dA dR =R + A dt dt dt como vemos, no basta con conocer la cantidad dA sino que es necesario conocer dt también la derivada de la matriz de rotación. Para calcular esta derivada, restemos la matriz de rotación R (t ) a ambos lados de la igualdad que nos permite calcular la matriz después del intervalo ∆t : R (t + ∆t ) − R (t ) = Rφn′R (t ) − R (t ) dividiendo entre ∆t y tomando el límite cuando esta cantidad tiene a cero, obtenemos: ( R φn′ − U ) R (t + ∆t ) − R (t ) dR lim = = lim R (t ) ∆t → 0 dt ∆t →0 ∆t ∆t substituyendo del lado derecho la expresión de la forma de Gibbs y la del ángulo φ : [cos( ′ ∆t ) − 1] + [n′ ×] lim sen ( ′ ∆t )R dR  =  U − n′n′T lim  ∆t → 0 ∆t →0 ∆t ∆t dt   [ ] los límites dentro del paréntesis son conocidos y son respectivamente cero y que sustituyendo el valor de n′ obtenemos: dR = dt ′ por lo  ′  ′  ×R = [ ′ ×]R  ′  Finalmente, considerando las componentes de la velocidad angular en el sistema en movimiento, la derivada de la matriz de rotación es: dR = [R ×]R dt En consecuencia, la derivada del vector A en el sistema fijo viene dada por: dA ′ dA =R + [R ×]RA dt dt en otras palabras, la razón de cambio del vector A en el sistema en rotación está ′ dA  dA  y la variación compuesta por dos vectores: la taza de cambio intrínseca   =R dt  dt  aparente [ ′ ×]A′ = [R ×]RA debida únicamente al movimiento de los ejes. En el caso en que las rotaciones se parametrizan mediante los ángulos de Euler, se deberá considerar una expresión que nos permita calcular las derivadas de estos parámetros escalares. La relación existente entre las componentes del vector velocidad angular de los ejes cuerpo y las derivadas con respecto al tiempo de los ángulos de Euler no es trivial. En efecto, en términos vectoriales podemos descomponer la velocidad angular en tres componentes del tipo: = d d d + + dt dt dt en donde todos los vectores están en componentes de ejes cuerpo. Los vectores velocidad d d d , , considerados en esta ecuación tienen direcciones muy particulares angular dt dt dt debidas a la definición de los ángulos de Euler. Observando la figura siguiente d tiene las siguientes componentes en los ejes tierra: concluimos que el vector dt ′ d  d (0i′ + 0 j′ + k ′)  =  dt  dt  Derivadas con respecto al tiempo de los Ángulos de Euler. dψ representa la variación temporal del ángulo de Euler ψ . Transformando a dt los ejes cuerpo se obtiene: En donde d dψ = (− sen(θ )i + sen(φ ) cos(θ )j + cos(φ ) cos(θ )k ) dt dt Por otro lado, el vector d tiene las siguientes componentes: dt dθ d  (0i A + j A + 0k A )   =  dt  A dt en unos ejes auxiliares i A , j A , k A que se diferencian de los ejes cuerpo solamente por una rotación de un ángulo φ alrededor del eje X . En consecuencia, las componentes de este vector en ejes cuerpo pueden escribirse como: d d  = R φi AT   dt  dt  A d dθ (0i + cos(φ )j − sen (φ )k ) = dt dt Finalmente, el vector d tiene las siguientes componentes en ejes cuerpo: dt d dφ = (i + 0 j + 0k ) dt dt Sumando los tres vectgores obtenemos para el vector los ángulos de Euler: , en ejes cuerpo y en función de 0 − sen (θ )   dφ / dt  1  = 0 cos(φ ) sen (φ )cos(θ )  dθ / dt     0 − sen (φ ) cos(φ )cos(θ ) dψ / dt  la relación inversa se calcula de manera sencilla como:  dφ / dt  1 sen (φ ) tan (θ ) cos(φ ) tan (θ )  dθ / dt  = 0 cos(φ ) − sen (φ )      dψ / dt  0 sen (φ )sec(θ ) cos(φ )sec(θ ) la cual, con el fin de simplificar la notación, puede escribirse como: e=T siendo las matrices e y T las correspondientes de la ecuación anterior. Ejemplo: Considere la misma aeronave del ejemplo 2. Si la aeronave tiene una velocidad angular dada por T = {0.2,0.1,0.3} s −1 en ejes cuerpo en ese mismo instante, calcule la actitud de la aeronave 0.3 segundos después. Solución: Las derivadas de los ángulos de Euler pueden calcularse mediante la fórmula (38):  dφ / dt  1 sen (30) tan (3) cos(30) tan (3) 0.2   0.2162   rad       − sen (30)   0.1 = − 0.0634  cos(30)  dθ / dt  = 0  dψ / dt  0 sen (30)sec(3) cos(30)sec(3) 0.3  0.3102  seg        Suponiendo que la velocidad angular se mantiene constante durante el pequeño intervalo de tiempo de 0.3 segundos, la nueva actitud de la aeronave puede aproximarse de la siguiente forma: (180)(0.2162 )(0.3) = 33.7162° 180∆t dφ = 30 + π π dt (180)(− 0.0634 )(0.3) = 1.9102° 180∆t dθ θ 0.3 = θ + = 3+ π dt π (180)(0.3102 )(0.3) = 2.3319° 180∆t dψ ψ 0.3 = ψ + = −3 + π dt π φ0.3 = φ + Relaciones entre Sistemas de Referencia Ejes Cuerpo – Ejes Tierra. Como se mencionó anteriormente, las ecuaciones de movimiento que se obtienen del principio de mínima acción están escritas en un sistema de referencia inercial, ahora bien, ninguno de los tres sistemas definidos para nuestro análisis es inercial: en efecto, los ejes viento y cuerpo, al estar ligados a la aeronave giran y sufren aceleraciones con el desplazamiento de la misma; mientras que los ejes tierra, evidentemente, giran con la rotación y traslación de la tierra. Sin embargo, el sistema de ejes tierra puede considerarse como un sistema de referencia inercial mediante dos hipótesis básicas que son normalmente satisfechas durante el análisis de los vehículos más comunes. En primer lugar, es evidente que la masa del planeta es, en todos los casos, mucho mayor que la masa de la aeronave. Ello hace que las fuerzas inerciales debidas a la rotación de la tierra sean despreciables. Este no sería el caso si se considerara, por ejemplo, el movimiento de una gran masa de aire; es bien sabido que la existencia y el comportamiento de los huracanes están íntimamente ligados a dichas fuerzas inerciales. En segundo lugar, el movimiento de la tierra es mucho más lento que el movimiento de la aeronave. En consecuencia, en la mayoría de los análisis, puede considerarse a la tierra como esencialmente fija durante el movimiento de la aeronave. El sistema de ejes tierra, tal y como quedó definido anteriormente, puede considerarse como un sistema de referencia inercial y por lo tanto podrán establecerse ecuaciones de movimiento para el vehículo en este sistema. Sin embargo, como se verá más adelante, dichas ecuaciones contienen una integral sobre una región del espacio que está en movimiento y resultan difíciles de manejar desde un punto de vista matemático. Cuando las ecuaciones de traslación y rotación se escriben en un sistema de coordenadas unido al propio cuerpo en movimiento, se transforman en ecuaciones diferenciales ordinarias las cuales son mucho más simples de analizar. De aquí surge la necesidad de establecer la relación que existe entre ambos sistemas de referencia. En un instante fijo del tiempo, basta con conocer la posición relativa de los orígenes de ambos sistemas y la actitud de uno con respecto al otro, para transformar cualquier cantidad física. Así, la traslación es simplemente una suma vectorial del tipo (ver figura): ′ + rPCG ′ r ′ = rCG Vectores Posición en Ejes Tierra y Cuerpo. ′ es la posición del centro de gravedad del cuerpo con respecto a los ejes En donde rCG tierra. En cuanto a la rotación, si se suponen conocidos los cosenos directores cij de los ejes cuerpo con respecto a los ejes tierra, la transformación es: ′ rPCG = R T rPCG Por lo que la relación completa para vectores posición es: ′ + RrPCG r′ = rCG Cuando se conocen otros parámetros de la rotación, como los ángulos de Euler o la forma de Gibbs, se utilizan las expresiones correspondientes. Finalmente, se debe mencionar que los vectores físicos tales como las velocidades, aceleraciones y fuerzas, no se ven afectados por la traslación. Ejes Cuerpo – Ejes Viento. La línea sobre la cual se mueve el cuerpo en un instante dado está definida por el vector velocidad del centro de gravedad. Esta línea se denomina viento relativo y puede definirse, con respecto a los ejes cuerpo, mediante dos ángulos: El ángulo de ataque α , definido como el ángulo que forma el eje X del cuerpo con la proyección del viento relativo sobre el plano X − Z del mismo. El ángulo de derrape β , definido como el ángulo que forma el viento relativo con el eje X V del viento (ver figura 8). Figura Definición de los Ángulos de Ataque y de Derrape. Ambos ángulos son positivos en los sentidos que se marcan en la figura 8. Es necesario mencionar que el viento relativo definido aquí no considera movimiento relativo entre el fluido circundante y los ejes tierra. En caso de que este movimiento exista, debe considerarse un viento efectivo para el cálculo de los efectos aerodinámicos sobre el vehículo. A partir de estas definiciones y de la definición de los ejes viento y cuerpo, es fácil obtener la siguiente fórmula de transformación entre ambos sistemas de referencia: jT aV = R180 ° −α a El lector observará que en estas fórmulas no interviene el ángulo de derrape. Esto es debido a la definición misma de los ejes viento, los cuales pueden considerarse como un caso especial de ejes cuerpo. Sin embargo, durante el cálculo de los efectos aerodinámicos, este ángulo tendrá una importancia capital. En efecto, como puede verse en la figura 8, la velocidad del centro de gravedad puede expresarse en ejes viento en forma muy simple: VCGV = VCG [− cos(β )i V + sen (β )jV ] En donde VCG es la magnitud de la velocidad, β es el ángulo de derrape definido en la figura 8 e i V y jV son los vectores unitarios de los ejes viento. Utilizando la fórmula obtenemos la expresión de la velocidad en ejes cuerpo: VCG = VCG [cos(α )cos(β )i + sen (β )j + sen (α )cos(β )k ] La importancia de las fórmulas anteriores puede apreciarse considerándolas en sentido inverso. Es decir, si denotamos por U ,V ,W y UV ,VV ,WV las componentes del viento relativo en ejes cuerpo y ejes viento respectivamente, entonces, el ángulo de ataque y el ángulo de derrape pueden calcularse mediante: tan (α ) = W U tan (β ) = − VV UV Ejes Tierra – Ejes Viento. La dirección instantánea en la que se está moviendo el cuerpo con respecto a los ejes tierra, es decir, la dirección del vector velocidad del centro de gravedad, puede definirse con la ayuda de dos ángulos: El rumbo relativo λ es el ángulo que forma la proyección del vector velocidad en el plano del horizonte, con el eje X ′ de tierra. El ángulo de ascenso γ es el ángulo que forma el vector velocidad con su proyección en el plano del horizonte (ver figura 9). Figura Definición del Rumbo Relativo y del Ángulo de Ascenso. Ambos ángulos son positivos en los sentidos que se muestran en la figura 7 Utilizaremos aquí el término “rumbo relativo” para distinguir el ángulo λ del “rumbo verdadero” utilizado durante la navegación y el cual hace referencia al norte magnético verdadero del planeta tierra. De la figura 9 podemos deducir fácilmente la siguiente fórmula para las componentes del vector velocidad en los ejes tierra: ′ = VCG (cos(γ )cos(λ )i ′ + cos(γ )sen (λ )j′ − sen (γ )k ′) VCG Ahora bien, denotando las componentes de la velocidad en ejes tierra como U ′, V ′ y W ′ , los ángulos cartográficos estarán dados por las expresiones: tan(λ ) = V′ U′ tan(γ ) = − W′ U ′2 + V ′2 Por otro lado, una transformación directa entre los ejes tierra y los ejes viento no es posible debido a la definición de estos últimos: el plano X V − ZV coincide con el plano X − Z del cuerpo, en consecuencia, es necesario conocer la actitud del cuerpo con respecto a los ejes tierra para realizar dicha transformación. Ahora bien, está actitud queda definida por los ángulos de Euler, por lo tanto, dadas las componentes de un vector en los ejes tierra, debemos transformarlas a los ejes cuerpo y, posteriormente, transformarlas a los ejes viento, es decir: a = R φi T R θjT Rψk T a′ jT aV = R180 ° −α a o bien: jT iT jT kT ′ aV = R180 °−α R φ R θ Rψ a Ejemplo: Una aeronave se encuentra volando con un rumbo relativo de 27° y un ángulo de ascenso de 7°. En un instante dado, la actitud de la aeronave con respecto a los ejes tierra es de –3° de guiñada, 3° de cabeceo y 30° de alabeo. La magnitud del viento relativo es 60 m/s. Suponiendo que el viento está en calma con respecto a los ejes tierra, calcular: d) e) f) g) h) Las componentes del viento relativo en los ejes tierra. Las componentes del viento relativo en los ejes cuerpo. El ángulo de ataque. Las componentes del viento relativo en los ejes viento. El ángulo de derrape. Solución: El viento relativo tiene las siguientes componentes en ejes tierra: cos(7°) cos(27°)  53.0619  ′ = 60cos(7°)sen (27°) =  27.0364  VCG      − sen (7°)  − 7.3122 Entonces, sus componentes en los ejes cuerpo son: VCG  51.8862    =  23.4856  − 18.8745   A partir de estas componentes, el ángulo de ataque viene dado por: W  −1  18.8745   ≈ −20°  = tan   − 51.8862  U  α = tan −1  Utilizando los resultados del inciso (b) y la fórmula (), las componentes del viento relativo en los ejes viento son: − 55.2125 =  23.4856    0   VCGV Finalmente, puede calcularse el ángulo de derrape como:  VV  UV β = tan −1  −   23.4856   = tan −1   ≈ 23°  55.2125   Como veremos más adelante, el cálculo de estos ángulos es la base para determinar las fuerzas y momentos aerodinámicos que actúan sobre la aeronave y, en consecuencia, para predecir la trayectoria de la misma. Dinámica del Cuerpo Elástico. Ecuaciones de movimiento para una partícula clásica. Sea r′ el vector posición de una partícula con respecto a un sistema de referencia inercial. Entonces, la velocidad de la partícula se define mediante: V′ = dr ′ dt Considerando r′ como las coordenadas generalizadas del sistema y suponiendo que la partícula se mueve dentro de un campo de fuerzas con el potencial U (r′) el lagrangiano del sistema viene dado por: L = 12 m p V′T V′ − U (r′) en donde m p es la masa de la partícula. La ecuación de Euler-Lagrange puede escribirse: [ ] ∇ r ′ 12 m p V′T V′ − U (r′) − [ ] d ∇ V ′ 12 m p V′T V′ − U (r′) = 0 dt − ∇ r ′U (r′) − d (m p V′) = 0 dt d (m p V′) = −∇r ′U (r′) = F′ dt En donde F′ es la resultante de las fuerzas derivadas del potencial que actúan sobre la partícula. Introduciendo el concepto de cantidad de movimiento: P′ = m p V ′ obtenemos la famosa ecuación de Newton para el movimiento de una partícula: dP′ = F′ dt Es decir, las ecuaciones de Euler-Lagrange son equivalentes al principio de conservación de la cantidad de movimiento de Newton. Sustituyendo sucesivamente las definiciones de cantidad de movimiento y velocidad obtenemos: d  dr ′   mp  = F′ dt  dt  Esta ecuación es una ecuación diferencial ordinaria de segundo orden y, por lo tanto, conocidas la masa, la fuerza resultante, una cierta posición inicial y una velocidad inicial de la partícula, podemos calcular, en cualquier instante ulterior, la posición de la partícula r′(t ) ; es decir, la ecuación dinámica nos define la trayectoria de la partícula cuando ésta se encuentra sometida a la fuerza F′ . Debe notarse que la ecuación abarca el caso general en el cual tanto la masa como la fuerza resultante son funciones del tiempo. Teorema de Conservación del Momentum Angular. La ley de conservación de la cantidad de movimiento implica la conservación de otra cantidad conocida como momento angular. Este último está definido, con respecto al origen del sistema de referencia, de la manera siguiente: G′ = [r′ ×]P′ Es importante notar que esta cantidad no es un vector relativo, es decir que sí depende del origen del sistema de referencia utilizado. El teorema antes mencionado se obtiene simplemente derivando esta definición: dG′  dr ′  dP′ = ×P′ + [r′ ×] dt dt  dt  dP′  dr′  dr′ + [r ′ ×] = × m p dt dt  dt  dP′ = [r′ ×] dt En el último paso se utilizó el hecho de que A × A = 0 para cualquier vector. Finalmente, sustituyendo la ecuación de la cantidad de movimiento, obtenemos: dG ′ = [r′ ×]F′ dt o bien, sustituyendo las definiciones: d dr ′   [r′ ×]m p  = [r′ ×]F′ dt  dt  La cantidad [r ′ ×]F′ es conocida con el nombre de momento o torque de la fuerza F′ con respecto al origen del sistema de referencia; puede observarse que se trata de una cantidad aditiva y evidentemente depende del origen del sistema de coordenadas. Así, vemos que la variación del momentum angular de una partícula, es igual al torque total aplicado. Como veremos posteriormente, este teorema nos permitirá conocer los movimientos rotacionales de un cuerpo. Así mismo, el teorema nos permitirá obtener ciertas restricciones sobre las deformaciones de los cuerpos elásticos. Ecuaciones de Movimiento para un Sólido Elástico. Todo cuerpo puede considerarse como constituido por un gran número de partículas. De hecho, esta es la teoría física que prevalece en nuestros días. Sin embargo, en nuestro estudio, no entraremos en los detalles necesarios para tratar un cuerpo compuesto de partículas cuánticas, este nivel de detalle es innecesario para tratar cuerpos macroscópicos como los vehículos a los que hacemos referencia (incluso en el caso de que tratemos un micro vehículo autónomo como los que se están diseñando en la actualidad). Entonces, en el caso de un cuerpo constituido por partículas clásicas, para determinar la posición del cuerpo, deberíamos determinar las coordenadas de cada una de las partículas que lo constituyen. Puesto que para cada partícula debemos determinar tres coordenadas en los ejes inerciales, un cuerpo con N partículas requeriría la determinación de 3N coordenadas. Se acostumbra decir que el cuerpo posee 3N grados de libertad. Por lo tanto, deben establecerse N ecuaciones de movimiento similares a la ecuación dinámica de la partícula, para la determinación de dichas coordenadas. Puesto que el número de partículas es normalmente muy grande, este método directo resulta inaplicable. Con el objeto de obtener ecuaciones suficientes para determinar el movimiento de un cuerpo en el espacio se utiliza una serie de técnicas y aproximaciones que serán descritas en esta sección. Todo movimiento de un cuerpo, referido a un sistema de coordenadas, puede dividirse en tres componentes. Para simplificar, supongamos primeramente que el cuerpo es rígido; es decir, que la distancia entre dos puntos cualesquiera del cuerpo permanece constante durante su movimiento. Entonces, podemos distinguir una traslación como un movimiento durante el cual la posición angular de la línea que une dos puntos cualesquiera del cuerpo rígido, con respecto al sistema de coordenadas, permanece invariable. Enseguida, una rotación es un movimiento durante el cual, las coordenadas de un punto particular del cuerpo permanecen constantes, mientras que la posición angular de la línea que une este punto con otro punto cualquiera del cuerpo, varía en el tiempo. Finalmente, se llama deformación a un movimiento durante el cual las distancias entre los puntos del cuerpo varían (en este caso se habla de un cuerpo deformable). El lector podrá convencerse fácilmente de que todo movimiento de un cuerpo cualquiera puede considerarse como la superposición de una traslación, una rotación y una deformación. El método utilizado para el análisis del movimiento de un cuerpo con un gran número de partículas puede resumirse en cuatro fases básicas: Primera Fase: Se hace la hipótesis del medio continuo. Es decir, se considera que las partículas son mucho más pequeñas que el cuerpo en sí y que su número es tal que llenan el espacio en forma continua. Mediante esta hipótesis, en lugar de tratar a las partículas como masas puntuales, puede introducirse la idea de una distribución continua de masa en el espacio. Una masa elemental de dicha distribución estará gobernada por las mismas ecuaciones que la masa puntual, sin embargo, en lugar de tratar con un gran número de ecuaciones, utilizando la continuidad, se podrán tomar integrales sobre la distribución para determinar las ecuaciones de movimiento del conjunto. Segunda Fase: Se calculan los movimientos del centro de gravedad. Es decir, se integra la ecuación del momento lineal sobre todo el cuerpo, dando como resultado 3 ecuaciones traslacionales que permiten calcular las tres coordenadas de un punto específico del cuerpo con respecto al sistema de referencia inercial. Se selecciona como punto específico el denominado centro de gravedad el cual será definido más adelante. Tercera Fase: Se calculan los movimientos rotacionales del cuerpo. Se integra la ecuación del momento angular sobre todo el cuerpo, dando como resultado 3 ecuaciones rotacionales que permiten calcular 3 parámetros de actitud del cuerpo con respecto al sistema de referencia inercial. Como ya hemos visto, tres parámetros son necesarios y suficientes para definir completamente la actitud de un cuerpo en tres dimensiones. Cuarta Fase: Se calculan las deformaciones sufridas por el cuerpo. Para ello, se integran las ecuaciones de los momentos lineal y angular sobre una región arbitraria del cuerpo y se demuestra que las deformaciones están relacionadas con los esfuerzos internos. En realidad, la ecuación del momento angular nos da sólo una serie de restricciones sobre dichos esfuerzos internos. Esta operación da como resultado un conjunto de ecuaciones en derivadas parciales las cuales permiten calcular las deformaciones en cada punto del cuerpo. Las condiciones de frontera correspondientes vienen dadas por las fuerzas aerodinámicas y motrices aplicadas a la piel y la estructura del vehículo, así como por la fuerza debida a la aceleración de la gravedad. En lo sucesivo desarrollaremos matemáticamente cada uno de estos puntos. Así, aceptando la hipótesis del medio continuo, la masa de un elemento de volumen del cuerpo viene dada por: dm = ρdV ′ en donde ρ es la densidad local y dV ′ es el volumen elemental en el sistema de referencia inercial. Además, si dF′ es la resultante de las fuerzas que actúan sobre el elemento de volumen, entonces, las ecuaciones dinámicas para dichos elementos serán: d  dr ′  ρ dV ′ = dF′ dt  dt  d dr ′   [r′ ×]ρ dV ′ = [r′ ×]dF′ dt  dt  Como vemos, todos los vectores están referidos a un sistema de ejes inerciales y por ello se representan con un apóstrofe. En este punto debemos distinguir entre dos tipos de fuerzas y momentos: las cargas externas al cuerpo y las fuerzas y momentos ejercidos por las otras partículas del cuerpo sobre el elemento en cuestión, éstas se denominan fuerzas y momentos internos. Ahora bien, las fuerzas aplicadas sobre un elemento de volumen en cierta región del cuerpo no tienen por que ser idénticas a las aplicadas sobre otra región, por lo tanto, los miembros derechos de las ecuaciones anteriores deberán ser funciones del espacio. Por otro lado, las fuerzas aplicadas sobre un elemento de volumen se pueden dividir según si estas se aplican al elemento como un todo o bien si sólo se aplican en las caras del volumen elemental; las primeras se denominan fuerzas de volumen y las segundas, fuerzas superficiales. Para las fuerzas de volumen, tanto externas como internas, introduciremos una función R ′(r ′) , que represente estas fuerzas por unidad de volumen, así tendremos: dFe′VOLUMEN = R′e (r′)dV ′ que nos da la fuerza externa aplicada en el punto r′ por unidad de volumen. Para las fuerzas superficiales, el problema es un poco más complejo. Consideramos igualmente una fuerza por unidad de área dA′ del elemento de volumen dV ′ , por ejemplo: dFe′SUPERFICIE = S′e (r′)dA′ Estas fuerzas por unidad de área se denominan genéricamente esfuerzos. Sin embargo, las fuerzas que actúan sobre un elemento de área pueden descomponerse en fuerzas que actúan paralelas y perpendiculares a la superficie (ver figura). Las primeras se denominan esfuerzos cortantes; las segundas, esfuerzos de tensión o tensiones cuando van dirigidas según la normal exterior de la superficie (en caso contrario se habla de esfuerzos de compresión o presiones). Esfuerzos de Tensión Esfuerzos Cortantes Esfuerzos cortantes y de tensión sobre una superficie. Así, sobre cada superficie actúan 3 esfuerzos mutuamente perpendiculares. La fuerza total por unidad de área puede escribirse en componentes como: S′e = s′x i′ + s′y j′ + s′z k ′ si la fuerza S′e se aplica sobre una superficie cuyo vector unitario normal es n′ , entonces las diferentes componentes pueden expresarse de la manera siguiente: ( ) ( ) ( ) s′ = τ ′ (i′ n′) + σ ′ (j′ n′) + τ ′ (k ′ n′) s′ = τ ′ (i′ n′) + τ ′ (j′ n′) + σ ′ (k ′ n′) s′x = σ ′xx i′T n′ + τ ′xy j′T n′ + τ ′xz k ′T n′ T y yx z zx T yy T T yz T zy T zz En donde los coeficientes son las componentes de S′e en las diferentes direcciones indicadas. Es decir que estos coeficientes también representan fuerzas por unidad de área y se denominan esfuerzos. Estos 9 esfuerzos pueden representarse también actuando sobre tres caras mutuamente perpendiculares de un elemento de volumen dV , constituido por un hexaedro. Figura 4. Esfuerzos sobre un elemento de volumen. Las expresiones anteriores pueden escribirse como un producto matricial: S′e = Φ′n′ En donde se ha introducido la matriz o tensor de esfuerzos: σ ′xx τ ′xy τ ′xz    Φ′ = τ ′yx σ ′yy τ ′yz  τ zx′ τ ′zy σ ′zz    Con las definiciones anteriores las ecuaciones dinámicas de las partículas pueden escribirse: d  dr ′  ρ dV ′ = (R′e + R′i )dV ′ + (Φ′e + Φ′i )n′dA′ dt  dt  d dr ′   [r′ ×]ρ dV ′ = [r′ ×][(R e + R i )dV ′ + (Φ e + Φ i )ndA′] dt  dt  Integrando estas ecuaciones sobre toda la región del espacio V ′ ocupada por el cuerpo, obtenemos las ecuaciones traslacionales y rotacionales: d  dr ′  dV ′ = ∫ R ′e dV ′ + ∫ Φ ′e n′dA′ dt  ′ V V′ ∂V ′ ∫ dt  ρ d  dr ′  ′ [ ] r ρ × dV ′ = ∫ [r ′ ×]R e dV ′ + ∫ [r ′ ×](Φ ′e n′)dA′  ∫V ′ dt  dt  ∂V ′ V′ La suma de las fuerzas y momentos internos se anula por la tercera ley de Newton, suponiendo que el cuerpo mantiene su integridad física durante su movimiento. Estas ecuaciones también pueden escribirse introduciendo la resultante de las fuerzas externas y los momentos de las mismas con respecto al origen del sistema de referencia inercial: d  dr′  dV ′ = Fe′ dt  V′ d dr ′  ∫V ′ dt  [r′ ×]ρ dt dV ′ = [re′ ×]Fe′ ∫ dt  ρ En donde el vector re′ es la posición con respecto al sistema de referencia inercial en la cual la resultante de las fuerzas externas produciría el mismo momento; debe notarse que esta última cantidad puede ser función del tiempo:   [re′ ×] ∫ R e dV ′ + ∫ Φ ′e ndA′  = ∫ [r′ ×]R′e dV ′ + ∫ [r′ ×](Φ ′e n′)dA′ V ′  ∂V ′ ∂V ′ V′ Por otro lado, integrando las ecuaciones dinámicas sobre una región del espacio Vi′ que esté dentro del espacio ocupado por el cuerpo y que no toque sus fronteras, obtenemos: d  dr ′  dV ′ = ∫ R ′i dV ′ + ∫ Φ ′i n′dA′ dt  ∂Vi′ Vi′ Vi′ ∫ dt  ρ d  ∫ dt  [r′ ×]ρ Vi′ dr ′  dV ′ = ∫ [r ′ ×]R ′i dV ′ + ∫ [r ′ ×](Φ ′i n′)dA′ dt  ∂Vi′ Vi′ en donde hemos eliminado las fuerzas externas puesto que la región sobre la que se integra es interna al cuerpo (más adelante se justifica esta simplificación). Por otra parte, utilizando las conocidas identidades de Green y de Stokes: ∫ ΦndA′ = ∫ (∇ Φ ) dV ′ T ∂V ′ T V′ ∫ [r ×](Φn)dA′ = ∫ (∇ ([r ×]Φ )) dV ′ T ∂V ′ T V′ para transformar las integrales de superficie en integrales de volumen, es fácil comprobar que las ecuaciones () se pueden escribir como: T  d  dr ′  T  − R ′i − (∇ Φ ′)  dVi′ = 0 dt   Vi′ ∫  dt  ρ d  ∫  dt  [r′ ×]ρ Vi′ T dr ′  T  − [r ′ ×]R ′i − (∇ ([r ′ ×]Φ ′))  dVi′ = 0 dt   Ahora bien, puesto que el elemento de volumen de la integral a la izquierda es arbitrario, el integrando de la misma debe anularse en todo punto. En consecuencia obtenemos: T d  dr ′  T ρ  − R′i − ∇ Φ′ = 0 dt  dt  ( ) T d dr ′  T  [r′ ×]ρ  − [r′ ×]R′i − ∇ ([r′ ×]Φ′) = 0 dt  dt  ( ) Este sistema contiene 6 ecuaciones y 12 incógnitas, a saber: tres componentes del vector de deformación y nueve componentes del tensor de esfuerzos. Las tres primeras ecuaciones nos permiten calcular las deformaciones sufridas por el cuerpo en cada uno de sus puntos; es decir, la función r ′(t ) . Las tres ecuaciones siguientes imponen restricciones sobre los esfuerzos tangenciales permitiendo calcular tres de ellos. Sin embargo, faltan seis ecuaciones para cerrar el sistema. Esto se logra relacionando los esfuerzos con las deformaciones a través de la ley de Hook de la elasticidad. Como puede verse, se trata de ecuaciones en derivadas parciales y, con objeto de darles solución, deberán asignarse condiciones de frontera apropiadas; lo que equivale a reintroducir las fuerzas externas. En resumen, las ecuaciones dinámicas que gobiernan el movimiento de un cuerpo elástico deformable son: d  dr′  dV ′ = Fe′ dt  V′ ∫ dt  ρ d ∫ dt  [r′ ×]ρ V′ dr′  dV ′ = [re′ ×]Fe′ dt  T d  dr ′  T ρ  − R′i − ∇ Φ′ = 0 dt  dt  ( ) Dichas ecuaciones se denominan dinámicas ya que hacen intervenir las fuerzas que originan los tres tipos de movimiento: traslación, rotación y deformación. Sistema Dinámico del Vehículo. Como hemos mencionado, la mecánica es la ciencia que estudia el movimiento de los cuerpos en el espacio. Ahora bien, este estudio puede dividirse en dos partes bien diferenciadas: la cinemática y la dinámica. En el primer caso, los movimientos se estudian sin hacer referencia a las causas que los producen, es decir las fuerzas. En el caso de la dinámica, las fuerzas juegan un papel preponderante. En las dos secciones subsiguientes, realizaremos el estudio tanto cinemático como dinámico del movimiento de un cuerpo elástico de masa variable en tres dimensiones. Al comparar las ecuaciones de movimiento del cuerpo elástico con la ecuación de evolución de un sistema dinámico nos encontramos con dos diferencias principales: la primera consiste en que las ecuaciones de movimiento son de segundo orden, mientras que la ecuación de evolución es de primer orden; la segunda diferencia consiste en la aparición de la derivada con respecto al tiempo bajo el signo de integral, en las ecuaciones de movimiento. Cada una de estas diferencias nos lleva a un tratamiento específico de las ecuaciones de movimiento con el objeto de transformarlas en una ecuación de evolución acorde con la teoría de sistemas dinámicos. A continuación presentamos en forma breve estos dos métodos y en seguida los aplicamos a las ecuaciones de movimiento del cuerpo elástico. Está claro que estas ecuaciones son de segundo orden, razón por la cual es necesario dar dos tipos de condiciones iniciales para su solución completa: la posición, la actitud y la forma inicial del cuerpo por un lado, y las velocidades correspondientes por el otro. Cuando hablamos de la estabilidad de sistemas nos referimos a las ecuaciones de evolución del sistema, como ecuaciones de primer orden. Es fácil transformar un sistema de segundo orden en uno de primer orden, duplicando simplemente el número de incógnitas así como el de ecuaciones; haremos esto en la siguiente sección, introduciendo explícitamente la velocidad del centro de gravedad así como la velocidad de rotación de una terna ordenada de vectores unitarios asociados al cuerpo. La complejidad del sistema de ecuaciones de movimiento no aparece explícitamente bajo la forma en que las hemos escrito. Este hecho se debe a que, en las ecuaciones traslacionales y rotacionales, hemos dejado explícita la integral sobre el cuerpo. Esto significa que dicha integral se efectúa sobre una región del espacio que está en movimiento e, incluso, cambia sus fronteras constantemente debido a las deformaciones. Bajo estas condiciones, la solución del sistema de ecuaciones de movimiento resulta sumamente complicada. El método utilizado para atacar este problema consiste en reescribir las ecuaciones en un nuevo sistema de coordenadas que se mueva junto con el cuerpo. De esta forma, podremos introducir funciones que sólo cambian con el tiempo y que no dependen de la posición de las fronteras del volumen de integración, éstas funciones podrán ser sacadas de la integral obteniendo así un sistema de ecuaciones diferenciales ordinarias semejante a la ecuación de evolución de un sistema dinámico. Evidentemente, las componentes de los vectores que aparecen en estas ecuaciones estarán relacionadas con las componentes del sistema inercial mediante una matriz de rotación que varía en el tiempo. Como ya mencionamos, los ejes cuerpo no son inerciales y, en consecuencia, en las ecuaciones de movimiento escritas en este sistema, además del cambio de componentes, aparecerán ciertos términos denominados inerciales. El objeto de esta sección es establecer la forma correcta de las ecuaciones en los ejes cuerpo. Primeramente debe realizarse una traslación del origen del sistema de ejes tierra al origen de los ejes cuerpo. Este último es, por definición, el centro de gravedad de la aeronave, el cual a su vez está definido como un punto en el que podría concentrarse toda la masa del cuerpo obteniéndose un momento de primer orden idéntico al del cuerpo: ′ ∫ ρdV = ∫ ρr′dV Q = rCG V V es decir: ∫ ρr′dV ′ =V rCG ∫ ρdV = 1 ρr′dV m A V∫ V en donde mA es la masa total de la aeronave. Es importante aclarar que esta cantidad, por definición es una constante con respecto al espacio en el que se integra; sin embargo, en todas las ecuaciones dejaremos abierta la posibilidad de considerarla como una función del tiempo. Esta posibilidad tiene aplicaciones prácticas importantes en el caso de vehículos en los que la masa de algún componente varía en forma significativa durante el lapso de tiempo en el que se analiza la trayectoria (por ejemplo, para un cohete, la masa del combustible varía considerablemente durante el periodo considerado en un cálculo de estabilidad). Ahora bien, para poder calcular efectivamente una trayectoria deberá conocerse exactamente la forma en que varía esta masa y, por ello, deberá introducirse, al menos, una ecuación más al sistema que se considera: dm A = f (m A ) dt Por otra parte, la posición del centro de gravedad tampoco puede ser función del espacio en el que se integra; sin embargo, sí es una función pura del tiempo. Introduciendo el vector posición de una partícula cualquiera con respecto al origen de los ′ , la traslación se escribe simplemente: ejes cuerpo como rPCG ′ + rPCG ′ r ′ = rCG Las componentes de los vectores relativos, tales como las fuerzas y las velocidades, no sufren cambios cuando se realiza una traslación, por esta razón utilizaremos las mismas literales. Entonces, las ecuaciones de movimiento pueden escribirse como: dr ′  d  dr ′  d  m A CG  + ∫  ρ PCG dV ′ = Fe′ dt  V ′ dt  dt  dt  d ∫ dt  [(r′ CG ′ ) ×]ρ + rPCG V ′ + rPCG ′ ) d (rCG dV = [re′ ×]Fe′ dt  simplificando la segunda ecuación obtenemos (ver procedimiento 1):   d dr ′ d dr ′ ′ ×]  m A CG  + ∫  ρ PCG dV ′  + [rCG    dt  ′ ×] + ∫ [rPCG V′ dt  d  ρ dt  dt  dt   ′  drPCG  dr ′  dρ ′ ′ ×]Fe′ + [rPe ′ ×]Fe′ rPCG dV ′ = [rCG dV ′ −  CG × ∫ dt   dt V ′ dt V′ ′ es una constante para la integral En estas expresiones se ha utilizado el hecho de que rCG de volumen (pero es una función del tiempo al igual que la masa). Es importante notar ′ que aparecen en las ecuaciones anteriores, siguen que las componentes del vector rPCG siendo componentes paralelas al sistema de referencia inercial. De la misma forma, el volumen que aparece en el límite de las integrales sigue siendo función del tiempo, debido a las rotaciones y deformaciones del cuerpo. Los nuevos términos en las ecuaciones de movimiento se deben únicamente a las aceleraciones lineales. Utilizando la primera ecuación para simplificar la segunda, obtenemos: dr ′  d  dr ′  d  m A CG  + ∫  ρ PCG dV ′ = Fe′ dt  V ′ dt  dt  dt  ∫ [r′ PCG V′ ×] ′  d  drPCG  dr′ ρ dV ′ −  CG dt  dt   dt  dρ ′ ′ ×]Fe′ × ∫ rPCG dV ′ = [rPe V ′ dt En lo sucesivo, será más conveniente utilizar, en lugar del vector posición, el vector velocidad del centro de gravedad con respecto a los ejes tierra: ′ = VCG ′ drCG dt Al hacer esto estamos, de hecho, introduciendo tres incógnitas más y, por lo tanto las ecuaciones de esta definición deben agregarse al sistema para mantenerlo cerrado. Estas ecuaciones se denominan cinemáticas debido a que en ellas no aparecen las fuerzas. Las ecuaciones de movimiento son ahora: dm A = f (m A ) dt ′ drCG ′ = VCG dt d dr ′ d ′ ) + ∫  ρ PCG dV ′ = Fe′ (m A VCG dt  dt  dt V′ ∫ [r′ PCG V′ ×] ′  dρ d  drPCG ′ ×]∫ ′ dV ′ = [rPe ′ ×]Fe′ rPCG ρ dV ′ − [VCG dt dt  dt  V′ Hasta este momento, en estas ecuaciones, las componentes de los vectores involucrados siguen siendo paralelas al sistema de referencia inercial. Sin embargo, los ejes cuerpo están rotando junto con la aeronave y, por supuesto, las componentes de todos los vectores serán distintas. Más aun, como sabemos, la derivada temporal de una cantidad vectorial se expresa en forma diferente para ejes que están en movimiento. Para un vector, la transformación necesaria es una transformación de componentes durante una rotación. Por ejemplo, para las fuerzas externas que aparecen del lado derecho de la ecuación de traslación, debemos utilizar las componentes en el sistema girado Fe : Fe′ = RFe Finalmente, al igual que los cambios en la magnitud de un vector, los cambios en la magnitud de una cantidad escalar son idénticos en un sistema inercial y en un sistema en rotación. Con base en estas consideraciones es fácil comprobar que las ecuaciones dinámicas se escriben como (ver procedimiento 2): d (m A VCG ) d  dr  + m AR T [R ×]RVCG + ∫  ρ PCG dV dt dt  dt V  dr dρ + R T [R ×]R ∫ rPCG dV + 2R T [R ×]R ∫ ρ PCG dV = Fe dt dt V V ∫ [Rr PCG V ×]R d  drPCG  dr  dV − 2 ∫ [R ×]R PCG ρ dt  dt  dt V   × RρrPCG dV  dρ [[R ×]RrPCG ×]RrPCG dV − ∫  R d ×RrPCG ×RρrPCG dV dt dt   V V  dρ rPCG dV = [Rre ×]RFe + ∫ [[[R ×]RrPCG ×]R ×]RρrPCG dV − [RVCG ×]R ∫ dt V V −∫ En estas expresiones se ha tomado en cuenta que tanto la velocidad angular de los ejes cuerpo como la matriz de rotación R son constantes para la integral de volumen, aún cuando varían con el tiempo. Es importante notar que las componentes del vector rPCG que aparecen en las ecuaciones anteriores son ya paralelas a los ejes en rotación. De hecho, las componentes de todos los vectores que aparecen en las ecuaciones son paralelas a estos ejes. En estas ecuaciones se han introducido nuevas variables de fase: las componentes de la matriz de rotación y, para poder cerrar el sistema, deberá agregarse al mismo la siguiente ecuación (derivada de la nueva variable de fase): dR = [R ×]R dt Esta ecuación representa la cinemática de las rotaciones y, al igual que para la anterior ecuación cinemática, las componentes de la matriz R permanecerán como componentes en ejes tierra de los vectores unitarios asociados al cuerpo. Ahora bien, para simplificar la segunda ecuación podemos utilizar una identidad vectorial conocida con el nombre de triple producto vectorial que, en notación matricial tiene dos versiones equivalentes: [[A ×]B ×]C = (A T C)B − (BT C)A [A ×][B ×]C = (CT A )B − (BT A )C Así, obtenemos (ver procedimiento 3): ∫ [Rr PCG ×]R V + R∫ V dr d  drPCG   T dr  T ρ dV + 2R ∫ ρ  UrPCG PCG − PCG rPCG dV dt  dt  dt dt   V d dρ T T T T ( ) ) dV + R ∫ ρ (UrPCG dV UrPCG rPCG − rPCG rPCG rPCG − rPCG rPCG dt dt V T T )dV − [RVCG ×]R ∫ rPCG − rPCG rPCG + [R ×]R ∫ ρ (UrPCG V V dρ rPCG dV = [Rre ×]RFe dt Introduciendo la definición del tensor de inercia en ejes cuerpo:  Ix  I =  I xy  I xz I xy Iy I yz I xz   T T I yz  = ∫ ρ UrPCG rPCG − rPCG rPCG dV V I z  [ ] podemos escribir la ecuación como: RI dρ d d  dr  + [R ×]RI + ∫ [RrPCG ×]R  ρ PCG dV − [RVCG ×]R ∫ rPCG dV dt dt dt dt   V V dρ  T drPCG drPCG T  T T ( )dV = [Rre ×]RFe + 2R ∫ ρ  UrPCG − rPCG dV + R ∫ UrPCG rPCG − rPCG rPCG dt dt dt   V V Finalmente, premultiplicamos toda la expresión por la transpuesta de la matriz de rotación: I dρ d d  dr  rPCG dV + R T [R ×]RI + ∫ R T [RrPCG ×]R  ρ PCG dV − R T [RVCG ×]R ∫ dt dt dt  dt  V V dρ  T drPCG drPCG T  T T (UrPCG )dV = R T [Rre ×]RFe rPCG dV + ∫ rPCG − rPCG rPCG + 2 ∫ ρ  UrPCG − dt dt dt   V V Ahora, se puede utilizar la siguiente identidad en las dos ecuaciones: R T [Ra ×]R = [a ×] Esta identidad se puede demostrar partiendo de la expresión del producto cruz de dos vectores cualesquiera en dos sistemas de referencia rotados uno con respecto al otro: [a ×]b = c [a′ ×]b′ = c′ ahora, si R es la matriz que hace girar el segundo sistema sobre el primero, tenemos relaciones del tipo a′ = Ra para cada vector. Sustituyendo en la segunda relación tenemos: [Ra ×]Rb = Rc premultiplicando por la transpuesta de la matriz de rotación: R T [Ra ×]Rb = c finalmente, sustituyendo la primera relación y haciendo uso de la ley del cociente tenemos: R T [Ra ×]Rb = [a ×]b R T [Ra ×]R = [a ×] De hecho, la expresión es más comprensible si pre-multiplicamos nuevamente por la matriz de rotación y multiplicamos a la derecha por su inversa, obtenemos: [Ra ×] = R[a ×]R T que no es más que la transformación de componentes de la matriz [a ×] debida a la rotación del sistema de coordenadas. Regresando a la ecuaciones dinámicas, utilizamos ahora la notación de Newton para la derivada con respecto al tiempo y rescribimos los momentos externos como M e , para reagrupar las ecuaciones dinámicas del siguiente modo: VCG = − m Fe [ ×] ρr dV − [ ×]VCG − A VCG − PCG mA mA m A V∫ 1 2[ ×] 1 ρrPCG dV − ρrPCG dV − ρrPCG dV ∫ ∫ mA V mA V m A V∫ T T )dV rPCG − rPCG rPCG = I −1M e − I −1 [ ×]I + I −1 [VCG ×]∫ ρrPCG dV − I −1 ∫ ρ (UrPCG −I −1 ∫ [r PCG ×]ρrPCG dV − 2I ∫ ρ (Ur −1 V V V r T PCG PCG −r r T PCG PCG )dV − I −1 ∫ [rPCG ×]ρrPCG dV V V Con el fin de analizar los términos de estas ecuaciones, se pueden reagrupar los mismos de acuerdo con el tipo de fenómeno físico que representan: Fe − [ ×]VCG mA [ ×] ρr dV m − A VCG − PCG mA m A V∫ 1 2[ ×] − ρrPCG dV − ρrPCG dV ∫ mA V m A V∫ 1 − ρrPCG dV m A V∫ VCG = CuerpoRígido Masa Deformación Interacción Masa − Deformación = I −1M e − I −1 [ ×]I T T )dV rPCG − rPCG rPCG + I −1 [VCG ×]∫ ρrPCG dV − I −1 ∫ ρ (UrPCG CuerpoRígido Masa T T )dV rPCG − rPCG rPCG − I −1 ∫ [rPCG ×]ρrPCG dV − 2I −1 ∫ ρ (UrPCG V V V Deformación V −I −1 ∫ [rPCG ×]ρrPCG dV V Interacción Masa − Deformación Con el fin de simplificar el análisis dinámico posterior introduciremos la siguiente nomenclatura para estos términos: Fm = − m A VCG − [ ×]∫ ρrPCG dV Masa V Fd = − ∫ ρrPCG dV − 2[ ×]∫ ρrPCG dV V Deformación V Fi = − ∫ ρrPCG dV V Interacción Masa − Deformación T T )dV M m = [VCG ×]∫ ρrPCG dV − ∫ ρ (UrPCG rPCG − rPCG rPCG T T )dV M d = − ∫ [rPCG ×]ρrPCG dV − 2 ∫ ρ (UrPCG rPCG − rPCG rPCG V Masa V V Deformación V Interacción M i = − ∫ [rPCG ×]ρrPCG dV Masa − Deformación V Estos términos son fuerzas y momentos generados por cambios internos del vehículo pero que afectan su trayectoria, por esta razón, en lo sucesivo les llamaremos fuerzas de configuración. Por último, definiendo la suma de las fuerzas externas con las fuerzas de configuración como F = Fe + Fm + Fd + Fi y equivalentemente para los momentos M = M e + M m + M d + M i , las ecuaciones dinámicas pueden escribirse simplemente como: V CG = F − mA [ × ]V CG = I −1 (M − [ ×]I ) A estas ecuaciones deben agregarse las ecuaciones cinemáticas y la de flujo de masa de modo que el sistema dinámico queda como: ′ = RVCG rCG F − [ ×]VCG VCG = mA R = [R ×]R = I −1 (M − [ ×]I ) dm A = f (m A ) dt Cuando, en lugar de la matriz de cosenos directores se desea utilizar los ángulos de Euler, recurriendo a las expresiones de las secciones precedentes, y utilizando la notación hiper matricial el sistema dinámico del vehículo se puede escribir de la siguiente manera: k′ jA i ′   R ✁ R R φ VCG   rCG  V   F − [ ×]V  CG  CG   m  A  e = T     −1  I (M − [ ×]I )   m A    f (m A )  La ventaja de usar esta forma del sistema dinámico es que se tienen solo trece variables explícitamente. En cambio, con los cosenos directores, se tienen 19 variables explícitas, las cuales, considerando que la matriz de cosenos directores es una matriz de rotación se reducen a 13. La desventaja es que se tiene una singularidad en la matriz T en el caso en que el vehículo alcance una actitud tal que θ = ± π2 . Esta situación es particularmente molesta cuando se pretende estudiar el comportamiento de los cohetes pues durante la mayor parte de la trayectoria se tiene tal actitud. En general, para simular el comportamiento de una aeronave de cualquier tipo, se recomienda trabajar con la primera forma del sistema dinámico. Al contrario, cuando se estudia la estabilidad de la mayoría de las aeronaves se recomienda utilizar la segunda forma del sistema dinámico (en el caso del despegue vertical de cohetes, se acostumbra modificar un poco la definición de los ángulos de Euler para que la singularidad quede en otra dirección). En la sección siguiente retomaremos explícitamente los términos que han sido agrupados dentro de las fuerzas y momentos de configuración, los cuales representan una gran variedad de fenómenos que ocupan un lugar prominente en el estudio de la dinámica de los vehículos. Anexo Procedimiento 1: Tenemos la ecuación: d ∫ dt  [(r′ CG ′ ) ×]ρ + rPCG V′ ′ + rPCG ′ ) d (rCG dV ′ = [re′ ×]Fe′ dt  Primeramente se distribuyen los productos: d dr′ ∫ dt  [r′ ×]ρ dt CG CG V′ d dr′  ′ ′ ×]ρ PCG dV ′ dV + ∫  [rCG dt  dt   V′ d dr′ d dr′ ′ ×]ρ CG dV ′ + ∫  [rPCG ′ ×]ρ PCG dV ′ = [re′ ×]Fe′  [rPCG dt  dt  dt  dt  V′ V′ +∫ se extraen de la primera integral los términos que no dependen de las coordenadas: d dr′ d dr′ ′ ×]m A CG  + ∫  [rCG ′ ×]ρ PCG dV ′  [rCG dt  dt  V ′ dt  dt  d dr′ d dr′ ′ ×]ρ CG dV ′ + ∫  [rPCG ′ ×]ρ PCG dV ′ = [re′ ×]Fe′  [rPCG dt  dt  dt  dt  V′ V′ +∫ se derivan los dos primeros términos y se conmuta el producto del tercero: ′  drCG ′ ′  d  drCG  drCG ′ × + × r m m [ ]   A CG A  dt  dt dt  dt  dr ′ d dr ′  dr ′  ′ ×]∫  ρ PCG +  CG × ∫ ρ PCG dV ′ + [rCG dt dt  dt  dt V ′ V′ ′ d   drCG  dt   dt V′ −∫  ′ dV  d  dr ′  ′  ′ ′ ×]ρ PCG dV ′ = [re′ ×]Fe′ × ρrPCG dV + ∫  [rPCG dt  dt    V′ el primer término es cero, el segundo y el cuarto se agrupan y se deriva el quinto:  dr ′  d  dr ′    m A CG  + ∫  ρ PCG dV ′ dt  V ′ dt  dt   dt    d ′ ×] [rCG  dr ′ +  CG  dt dr ′ d   dr ′  × ∫ ρ PCG dV ′ −   CG dt dt   dt V ′ d  dr ′ ′ ×]ρ PCG  [rPCG dt  dt V′ +∫ dr ′  ′ dV ′ −  CG ×  ∫ ρrPCG  dt  V ′  d ′ )dV ′ × ∫ (ρrPCG V ′ dt  ′ dV = [re′ ×]Fe′  el tercer término es cero ya que ∫ ρr ′ PCG dV ′ = 0 y se deriva el cuarto: V′ d dr ′ d dr ′ ′ ×]  m A CG  + ∫  ρ PCG dV ′ [rCG   dt  V ′ dt  dt   dt   dr ′  dr ′   dr ′  dρ ′  dr ′ +  CG × ∫ ρ PCG dV ′ −  CG × ∫ rPCG dV ′ −  CG dt  dt V ′  dt V ′ dt  dt dr ′  × ∫ ρ PCG dV ′ dt V ′ d dr ′ ′ ×]ρ PCG dV ′ = [re′ ×]Fe′ = [rCG ′ ×]Fe′ + [rPe ′ ×]Fe′  [rPCG dt  dt  V′ +∫ el segundo y cuarto término se cancelan y en el lado derecho se hace la traslación. Anexo Procedimiento 2: Se tienen en cuenta las relaciones: A ′ = RA ; dA ′ dA dR =R + [R ×]RA ; = [R ×]R dt dt dt En la primera ecuación se transforma la velocidad con la primera relación: ′ drCG = RVCG dt En la segunda ecuación, se transforma la derivada de la velocidad con la segunda relación y las fuerzas externas con la primera: R d  dr ′  d (m A VCG ) + m A [R ×]RVCG + ∫  ρ PCG dV ′ = RFe dt  dt  dt V′ con la segunda relación se transforma la derivada más interna del tercer término: R d dr d (m A VCG )  + m A [R ×]RVCG + ∫  Rρ PCG + [R ×]RρrPCG dV ′ = RFe dt dt dt   V′ Ahora, todos los vectores y matrices están en ejes cuerpo y por lo tanto el límite de la integral debe ser el volumen del cuerpo visto en ejes cuerpo. Se separan las integrales: R d d dr  d (m A VCG ) + m A [R ×]RVCG + ∫  Rρ PCG dV + ∫ ([R ×]RρrPCG )dV = RFe dt dt  dt  dt V V se deriva en los términos tercero y cuarto, extrayendo de las integrales todos los factores que no dependen del espacio: R + d (m A VCG ) dR dr d  dr  ρ PCG dV + R ∫  ρ PCG dV + m A [R ×]RVCG + ∫ dt dt V dt dt  dt  V d d [R ×]R ρrPCG dV + [R ×]R ∫ (ρrPCG )dV = RFe ∫ dt dt V V en el tercer término se usa la tercera relación, el quinto término es cero puesto que contiene al momento de primer orden con respecto al centro de gravedad, el sexto término se deriva nuevamente: d (m A VCG ) d  dr  + m A [R ×]RVCG + R ∫  ρ PCG dV dt dt  dt  V dr dρ rPCG dV + 2[R ×]R ∫ ρ PCG dV = RFe + [R ×]R ∫ dt dt V V R Finalmente, se multiplica toda la ecuación, a la izquierda, por la inversa de la matriz de cosenos directores: d (m A VCG ) d  dr  + m AR T [R ×]RVCG + ∫  ρ PCG dV dt dt  dt  V dρ dr + R T [R ×]R ∫ rPCG dV + 2R T [R ×]R ∫ ρ PCG dV = Fe dt dt V V En la tercera ecuación, transformamos todos los vectores que no están derivados con la primera relación: ∫ [Rr PCG ×] V′ ′  dρ d  drPCG rPCG dV ′ = [Rre ×]RFe ρ dV ′ − [RVCG ×]R ∫ dt dt  dt  ′ V se tiene en cuenta que la derivada de un escalar es igual en todos los sistemas de referencia. En el primer término se transforma la derivada más interna mediante la segunda relación y se separan dos integrales: ∫ [Rr PCG ×] V′ d dr  d  Rρ PCG dV ′ + ∫ [RrPCG ×] ([R ×]RρrPCG )dV ′ dt  dt  dt V′ dρ rPCG dV ′ = [Rre ×]RFe dt V′ − [RVCG ×]R ∫ en el primer término se deriva teniendo en cuenta la tercera relación, el segundo término se deriva: d  drPCG   dr  ρ dV ′ + ∫ [RrPCG ×][R ×]R  ρ PCG dV ′ dt  dt  dt   V′ V′ d d [R ×]R ρrPCG dV ′ + ∫ [RrPCG ×][R ×]R (ρrPCG )dV ′ + ∫ [RrPCG ×] dt dt V′ V′ ∫ [Rr PCG ×]R dρ rPCG dV ′ = [Rre ×]RFe dt ′ V − [RVCG ×]R ∫ el tercer y cuarto términos se derivan nuevamente: ∫ [Rr PCG V′ ×]R d  drPCG   dr  dV ′ + 2 ∫ [RrPCG ×][R ×]R  ρ PCG dV ′ ρ dt  dt  dt   V′  dR  + ∫ [RrPCG ×] × RρrPCG dV ′ + ∫ [RrPCG ×][R ×][R ×]RρrPCG dV ′  dt  V′ V′ dρ dρ rPCG dV ′ − [RVCG ×]R ∫ rPCG dV ′ = [Rre ×]RFe + ∫ [RrPCG ×][R ×]R dt dt V′ V′ se deriva nuevamente el tercer término: ∫ [Rr PCG ×]R V′ d  drPCG   dr  ρ dV ′ + 2 ∫ [RrPCG ×][R ×]R  ρ PCG dV ′ dt  dt  dt   V′ [ R ×]R ×]RρrPCG dV ′ + ∫ [RrPCG ×]R d ×RρrPCG dV ′ + ∫ [RrPCG ×][  dt  V′ V′ + ∫ [RrPCG ×][R ×][R ×]RρrPCG dV ′ V′ dρ [RrPCG ×][R ×]RrPCG dV ′ − [RVCG ×]R ∫ dρ rPCG dV ′ = [Rre ×]RFe dt dt V′ V′ +∫ El tercer término es cero puesto que [R ×]R = 0 : ∫ [Rr PCG ×]R V′ d  drPCG   dr  dV ′ + 2 ∫ [RrPCG ×][R ×]R  ρ PCG dV ′ ρ dt  dt  dt   V′  d + ∫ [RrPCG ×]R  dt V′ dρ [RrPCG ×][R +∫ dt V′  × RρrPCG dV ′ + ∫ [RrPCG ×][R ×][R ×]RρrPCG dV ′  V′ dρ rPCG dV ′ = [Rre ×]RFe ×]RrPCG dV ′ − [RVCG ×]R ∫ dt V′ Finalmente, se observa que todos los vectores son en componentes de ejes cuerpo y, por lo tanto, se modifica el límite de todas las integrales; al mismo tiempo, se conmutan los productos vectoriales en los términos segundo, tercero, cuarto y quinto, dos veces en el cuarto: ∫ [Rr PCG V ×]R d  drPCG  dr  dV − 2 ∫ [R ×]R PCG ρ dt  dt  dt V   × RρrPCG dV   d   − ∫  R × RrPCG × RρrPCG dV + ∫ [[[R ×]RrPCG ×]R ×]RρrPCG dV dt   V  V dρ [[R ×]RrPCG ×]RrPCG dV − [RVCG ×]R ∫ dρ rPCG dV = [Rre ×]RFe −∫ dt dt V V este último paso se realiza con vistas a la aplicación del triple producto vectorial en el siguiente procedimiento. Anexo Procedimiento 3: Todos los términos pueden convertirse en forma similar. Tomemos como ejemplo el segundo término. Con la primera forma de la identidad se substituye como: A=R ; B=R d rPCG ; dt C = R ρ rPCG obteniendo: drPCG  [R ×]R dt (  ×RρrPCG = (R  ) RρrPCG ) T T  drPCG   drPCG  R RρrPCG R − R    dt dt    tomando en cuenta que (AB ) = BT AT y que aT b = bT a y reacomodando los escalares obtenemos: T drPCG  [R ×]R dt ( dr  T ×RρrPCG = Rρ PCG rPCG dt  ) − Rρ  r  PCG T drPCG   dt  finalmente, factorizando: drPCG  [R ×]R dt  T drPCG drPCG T   rPCG  − ×RρrPCG = − Rρ  UrPCG dt dt    Fuerzas y Momentos. Con el objeto de resolver las ecuaciones de movimiento de la aeronave debe darse una expresión explícita de las fuerzas y momentos que actúan sobre la misma. Ahora bien, estas fuerzas y momentos dependen a su vez de las condiciones de vuelo de la aeronave. Es decir, en las expresiones correspondientes aparecen también las variables de estado del sistema (la velocidad del centro de gravedad y la velocidad angular de los ejes cuerpo). A fin de facilitar la escritura de las expresiones, dividiremos las fuerzas externas de acuerdo con las causas que las producen, es decir: gravitacionales, motrices, aerostáticas y aerodinámicas, denominándolas por Fg , FT , FAs y FA de tal modo que las fuerzas externas se escriben como: Fe = Fg + FT + FAs + FA Igualmente, en este apartado trataremos algunos casos de fuerzas de configuración que afectan el movimiento del vehículo. Por lo tanto, las fuerzas (y los momentos) que aparecen en las ecuaciones de movimiento pueden desglosarse de la siguiente forma: F = Fg + FT + FAs + FA + Fm + Fd + Fi A continuación discutiremos la dependencia de las variables de estado para cada uno de estos siete términos. En el caso de las fuerzas gravitacionales esta dependencia se debe a la orientación de los ejes cuerpo con respecto a los ejes tierra. Las fuerzas motrices generalmente son conocidas, a partir del diseño, directamente en los ejes cuerpo. Las fuerzas aerostáticas actúan siempre en dirección contraria a la gravedad y por ello su dependencia es similar a la de las fuerzas gravitacionales. En el caso de las fuerzas aerodinámicas la dependencia se debe a: el viento relativo, la configuración geométrica de la aeronave y la orientación de los ejes cuerpo. Finalmente, en el caso de las fuerzas inerciales, se da un fenómeno un poco diferente, las partes móviles del vehículo, al igual que los cambios de masa, dan lugar a nuevas variables de estado que deben agregarse al sistema dinámico completo junto con nuevas ecuaciones que gobiernan el comportamiento de esas variables. En las secciones siguientes analizaremos cada una de estas siete fuerzas y los momentos que ellas producen con respecto al centro de gravedad de la aeronave. Fuerzas Gravitacionales. Como es bien sabido, las fuerzas gravitacionales dependen de la masa del objeto y se encuentran dirigidas hacia el centro de la tierra. Por la definición misma de los ejes tierra, el vector correspondiente a dichas fuerzas puede escribirse de la siguiente forma: Fg′ = m A gk ′ en donde g es la aceleración de la gravedad en la superficie de la tierra. Las variaciones de altitud son, generalmente, demasiado pequeñas como para considerar una variación de esta cantidad. Transformando estas componentes a los ejes cuerpo mediante la matriz de cosenos directores obtenemos: Fg = m A gR T k ′ Dichas fuerzas se aplican, por definición, en el centro de gravedad de la aeronave. En consecuencia, ellas no producen momento alguno con respecto a este punto. Fuerzas Motrices. Toda aeronave requiere, ya sea para sustentarse o para trasladarse, de una planta motriz. La planta motriz se divide en unidades motrices. Cada una de dichas unidades está sujeta al cuerpo de la aeronave en puntos bien definidos. Por otro lado, las líneas de acción de las fuerzas generadas por la planta motriz también quedan definidas por el modo de instalación de cada una de las unidades. En general puede considerarse que estos datos geométricos son conocidos, a partir del diseño, en los ejes cuerpo. De este modo, la fuerza total generada por la planta motriz puede representarse del siguiente modo: n FT = ∑ Ti e i i =1 en donde Ti es la magnitud de la fuerza generada por la unidad “i” de la planta motriz y e i es un vector unitario en la dirección de su línea de acción. Igualmente, si t i es el vector posición del punto de aplicación de la unidad “i” en ejes cuerpo, los momentos generados por la fuerza correspondiente con respecto al centro de gravedad son: n MT = ∑ Ti [t i ×]ei i =1 Todas estas cantidades pueden considerarse como constantes o pueden ser variables de control. En efecto, para las Ti pueden existir palancas de control en la cabina del vehículo. El caso de e i variable es el caso de los denominados motores vectoriales que se están diseñando recientemente para aviones de combate. También representa el caso de los rotores abatibles (“tilt rotors”) que investigó la compañía Bell en los años 80 y 90 del siglo XX. Finalmente, la posición t i también puede ser variable en estos dos tipos de unidades de potencia. Fuerzas Aerostáticas. De acuerdo con el principio de Arquímedes, la fuerza aerostática que sufre un cuerpo sumergido es igual al peso del aire desplazado por el volumen del cuerpo y se aplica en el centro de gravedad de este volumen. Si denotamos por ρ A la densidad del aire (en la posición instantánea del vehículo), el volumen desplazado corresponde a la integral V = ∫ dV y su dirección siempre es opuesta a la dirección de la gravedad, por lo tanto, la V fuerza aerostática en ejes cuerpo puede representarse como: FAs = − ρ A gVR T k ′ La fuerza aerostática se aplica en el centroide del volumen desplazado de modo que puede dar lugar a un momento si este último punto no coincide con el centro de gravedad del vehículo. Este es exactamente el caso en un globo aerostático cuyo centro de gravedad está muy por debajo del centroide de la envolvente; es por ello que la canastilla es estable en la posición inferior. Si la canastilla tiende a balancearse, aparecen momentos de restauración debidos a la diferencia entre centroide y centro de gravedad. En otro ejemplo, este es el mecanismo de control de actitud de los dirigibles. En efecto, inflando balonetas de aire dentro de la envolvente del dirigible puede lograrse desplazar el centroide del volumen ocupado por el helio; lo cual da lugar a momentos que modifican la actitud del vehículo. Fuerzas Aerodinámicas. De la aerodinámica elemental sabemos que las fuerzas aerodinámicas son funciones complejas de: la magnitud del viento relativo, el ángulo de ataque, el ángulo de derrape, la configuración propia de la aeronave, etc. Desde un punto de vista estrictamente matemático, el problema solo puede plantearse correctamente del siguiente modo: deben escribirse ecuaciones de movimiento del fluido y acoplarse con las ecuaciones de movimiento de la aeronave a través de las condiciones de frontera apropiadas. Además, debe considerarse un fluido real a grandes velocidades (según el caso) y, tal vez, con variaciones de densidad y temperatura. Evidentemente, dicho problema matemático, si bien puede plantearse casi completamente, es irresoluble a la hora actual. Mediante el uso de computadoras pueden resolverse algunos problemas aerodinámicos sencillos en nuestros días. Pero, incluso con este método, deben introducirse una serie de hipótesis simplificadoras con el objeto de hacer factible la solución. En la figura siguiente se muestra cual es la relación que mantienen actualmente los métodos numéricos con respecto a la aerodinámica. Posibilidades de tratamiento aerodinámico numérico, a nivel industrial (adaptado de Monnerie, 1997). Cabe decir que con el desarrollo de nuevas tecnologías en computación, se podría esperar que a mediados del próximo siglo puedan realizarse algunas simulaciones de un avión completo con un fluido real. Sin embargo, de acuerdo con la teoría de la turbulencia, dichas simulaciones aisladas tendrían poco valor práctico. Además, desde el punto de vista de la mecánica de vuelo, las simulaciones que podríamos llamar “estacionarias” son solo útiles para problemas bien específicos. En realidad debería contarse con simulaciones dinámicas en donde las variables aerodinámicas (como por ejemplo el ángulo de ataque) dependan efectivamente del tiempo. La discusión anterior nos lleva a pensar que las expresiones necesarias para cerrar las ecuaciones de la mecánica de vuelo son inalcanzables. Sin embargo, aceptando la pérdida de algo de realismo mediante la introducción de hipótesis adecuadas, pueden escribirse expresiones para las cuales la utilidad dependerá del grado de generalidad de dichas hipótesis. En esta sección veremos cómo pueden obtenerse expresiones adecuadas al problema de mecánica de vuelo que se plantee. El primer paso para obtener dichas expresiones es el de representar las fuerzas y los momentos aerodinámicos en forma de coeficientes adimensionales de la siguiente manera: FA = Pd Sc A M A = Pd lSc mA En donde S y l son una superficie y una longitud de referencia, respectivamente, y Pd representa la presión dinámica. Cabe mencionar que, en el caso de aviones, la superficie de referencia es generalmente la superficie alar en tanto que, para la longitud de referencia, se utiliza la cuerda media del ala para los momentos alrededor del eje Y y la envergadura para los momentos alrededor de los ejes X y Z . Finalmente, los coeficientes así definidos son totales, es decir, se refieren al avión completo incluidos ala, fuselaje, empenaje, tren, barquillas, antenas, etc. Tradicionalmente, en ejes viento, el coeficiente a lo largo del eje X se denota por C D y se denomina “resistencia al avance”; el coeficiente a lo largo del eje Y se denomina “de fuerza lateral o derrape” y se denota por CY ; el coeficiente a lo largo del eje Z es C L y se denomina “levantamiento”. En cuanto a los momentos, se utiliza la nomenclatura Cl , C m y C n y se denominan respectivamente coeficientes de alabeo, cabeceo y guiñada. Es fácil observar que, en ejes viento, las fuerzas y momentos pueden escribirse en la forma: FA VIENTO = Pd S (C D iV + CY jV + C L kV ) M A VIENTO = Pd S (bCl iV + cCm jV + bCn kV ) en ejes cuerpo dichos vectores tienen las siguientes componentes: FA = Pd SR πj −α (C D iV + CY jV + C L k V ) M A = Pd SR πj −α (bCl iV + cC m jV + bCn kV ) Podría pensarse que los coeficientes adimensionales son únicamente funciones de la geometría del avión y de la geometría del flujo, es decir de los ángulos de ataque y de derrape; en tanto que la intensidad del flujo VCG y las características del fluido quedarían representadas solamente a través de la presión dinámica. Sin embargo, existen dos fenómenos bien conocidos que hacen que dicha hipótesis sea inaplicable, se trata de la turbulencia y de las ondas de choque. Como sabemos, para que dos flujos sean semejantes, no basta la semejanza geométrica sino que también debe cumplirse con la semejanza dinámica, es decir, ambos flujos deben tener el mismo número de Reynolds: Re = VCG l ν en donde ν es la viscosidad cinemática del fluido. Ahora bien, a altos números de Reynolds aparece el fenómeno de turbulencia, el cual consiste en el hecho de que las variables dinámicas del flujo tales como velocidad, presión, temperatura, etc., comienzan a fluctuar de manera desordenada, tanto en el tiempo como en el espacio. Experimentalmente se ha comprobado que los coeficientes aerodinámicos se comportan en forma muy distinta para un flujo laminar y para un flujo turbulento. Por otro lado, cuando la velocidad relativa se acerca a la velocidad del sonido en el medio respectivo, aparecen al frente del cuerpo ondas de compresión, o de choque, que incrementan exponencialmente la resistencia al avance. Así mismo, cuando la velocidad relativa alcanza o incluso rebasa a la del sonido, las ondas de choque se posicionan sobre el cuerpo y su movimiento o desprendimiento modifica enormemente los valores de las fuerzas aerodinámicas y por tanto los de los coeficientes. La magnitud de estos efectos puede evaluarse mediante el llamado número de Mach: M= VCG a en donde a es la velocidad del sonido en el medio. Ahora bien, considerando los ángulos de ataque y de derrape como constantes, la variación de los coeficientes aerodinámicos con los números de Reynolds y de Mach, presenta características muy particulares. En efecto, en ambos casos pueden distinguirse rangos muy amplios en los que los valores de dichos coeficientes son casi constantes. Mientras que para valores específicos de estos números se suceden cambios dramáticos en los coeficientes. Cada uno de estos rangos se denomina régimen de flujo; así, podemos mencionar los regímenes: laminar, turbulento, subsónico, transónico y supersónico. Por otro lado, considerando los números de Reynolds y de Mach como constantes, la variación de los coeficientes aerodinámicos con los ángulos de ataque y de derrape resulta ser una función suave, es decir más o menos continua; siempre y cuando dichos ángulos no tomen valores muy altos. Esto último es válido en la mayor parte de las situaciones comunes. Por esta razón, en la mayoría de los análisis, se acepta implícitamente que tanto el número de Reynolds como el de Mach, permanecen dentro de un rango de valores característicos de un régimen de flujo y que las funciones utilizadas para los coeficientes aerodinámicos corresponden a dicho régimen. En casos especiales, cuando esta suposición no es válida, deben utilizarse técnicas particulares para tomar en cuenta las variaciones. Fuerzas debidas al Cambio de Masa En el caso del cambio de masa, se debe contrastar contra lo desarrollado para cohetes. Los términos involucrados son: Fm = − m A VCG − [ ×]∫ ρrPCG dV M m = [VCG ×]∫ ρrPCG dV − ∫ ρ (Ur V r T PCG PCG V V T )dV − rPCG rPCG En ocasiones el flujo de masa se puede considerar constante durante el tiempo que involucra el análisis. Sin embargo, en otras ocasiones, el flujo de masa es variable y se debe obtener mediante otra ecuación diferencial. En este caso se aumenta en uno la dimensión del sistema dinámico del vehículo. Si, además, el flujo de masa puede hacerse variar mediante algún mecanismo, se tendría una variable de control. Fuerzas debidas a las Deformaciones Podemos hablar de dos clases de deformación del cuerpo: las deformaciones elásticas y las deformaciones por pares dinámicos. Las primeras requieren de un modelo apropiado de comportamiento del material del que está constituido el cuerpo; esta es el área de la aeroelasticidad. Las segundas, requieren del modelado tanto de los pares dinámicos como de los eslabones que constituyen el par. En el caso de las deformaciones, se debe contrastar contra lo desarrollado para superficies de control (momentos de bisagra) y para rotores (tanto elementos rotativos en la planta motriz, ver el libro de Roskam, como rotores de helicóptero). Los términos involucrados son: Fd = − ∫ ρrPCG dV − 2[ ×]∫ ρrPCG dV V V T T )dV M d = − ∫ [rPCG ×]ρrPCG dV − 2 ∫ ρ (UrPCG rPCG − rPCG rPCG V V También es muy importante señalar que para dirigibles, las deformaciones de la envolvente pueden tratarse bajo este esquema. En el caso de mandos fijos, aun se pueden introducir las variables de control como deflexiones de las superficies que alteran las fuerzas aerodinámicas del vehículo. Sin embargo, no se necesita una ecuación diferencial para calcular el movimiento de las superficies de control. En el caso de mandos libres, las superficies de control son funciones del tiempo. Por lo tanto, deberán introducirse ecuaciones de movimiento para cada superficie. Si bien los términos debidos a las deformaciones elásticas serán despreciables, los términos debidos al “cambio de forma” por la deflexión de las superficies, no lo son necesariamente. Para cada superficie deberán calcularse los términos correspondientes a r y r en las ecuaciones de movimiento. Finalmente, en este caso, los momentos y productos de inercia del cuerpo no son constantes, se trata de los términos involucrados en la segunda ecuación (en muchos casos dichas variaciones son despreciables ya que las superficies de control representan sólo un pequeño porcentaje de la masa y sus movimientos son pequeños comparados con cualquier longitud característica del aeronave, sin embargo debe hacerse un estudio de órdenes de magnitud para saber cuando pueden despreciarse los términos). Fuerzas de Interacción Cambio de Masa - Deformación Finalmente, se deberá mencionar algo sobre los términos de acoplamiento masa – deformación que, a nuestro conocimiento no han sido tratados en la bibliografía. Estos términos son: Fi = − ∫ ρrPCG dV V M i = − ∫ [rPCG ×]ρrPCG dV V Momentos Másicos para Eslabones Consideremos cómo se relacionan los momentos másicos de primer y segundo orden para un eslabón de volumen E , independiente del cuerpo, tomados en el sistema de ejes cuerpo y tomados en ejes locales del eslabón. Se supondrá que los ejes locales del eslabón están desplazados y girados con respecto a los ejes cuerpo, por lo tanto, una partícula cualquiera sobre el eslabón tendrá coordenadas en ejes cuerpo dadas por: rPCG = r0 + R φn00 rP En donde r0 es la posición, en ejes cuerpo, del origen del sistema local, R φn00 es la forma de Gibbs del giro correspondiente y rP es la posición de la partícula en los ejes locales. De este modo, si los momentos de primer orden del eslabón en ejes cuerpo y en ejes locales son, por definición: Q ECG = ∫ ρrPCG dV E Q E 0 = ∫ ρrP dV E estas cantidades se relacionan de la siguiente manera: ( ) Q ECG = ∫ ρ r0 + R φn0 rP dV = ∫ ρdV r0 + R φn0 ∫ ρrP dV = mE r0 + R φn0 Q E 0 E E E en donde, evidentemente, mE es la masa del eslabón. Para los momentos de segundo orden tenemos las definiciones siguientes: ( ) I ECG = ∫ ρ UrPCG rPCG − rPCG rPCG dV E ( T T ) I E 0 = ∫ ρ UrP rP − rP rP dV E T T sustituyendo la posición de las partículas en la primera de estas: ( ( I ECG = ∫ ρ U r0 + R φn0 rP ) (r T 0 ) ( )( + R φn 0 rP − r0 + R φn 0 rP r0 + R φn0 rP ) )dV T E desarrollando los productos y reacomodando: ( ) T I ECG = mE Ur0 r0 − r0r0 + 2Ur0 R φn 0 Q E 0 − R φn0 Q E 0r0 − r0 Q E 0 R φn 0 + R φn0 I E 0 R φn0 T T T T T T Se puede observar que, cuando el origen de los ejes locales se puede colocar en el centro de gravedad del eslabón, tendremos Q E 0 = 0 y por lo tanto: ( Q ECGb = mE r0 ) I ECGb = mE Ur0 r0 − r0r0 + R φn 0 I E 0 R φn 0 T T T en este caso se habla de un eslabón con ejes locales balanceados y por ello hemos utilizado el subíndice “b” en estas últimas relaciones. Par Dinámico Corredera: Un Eje de Deslizamiento Al referirnos a los pares dinámicos hablaremos de un eslabón primario y uno secundario, significando que tenemos las ecuaciones de movimiento del sistema completo en ejes del eslabón primario. De este modo, el eslabón primario de un par siempre será el vehículo; mientras que el secundario será cualquier parte del vehículo que pueda moverse con respecto a los ejes cuerpo. De acuerdo con la teoría de los sistemas dinámicos de muchos cuerpos, todos los pares dinámicos pueden reducirse a dos tipos fundamentales: la corredera y la articulación. Estos pares se distinguen porque permiten un solo grado de libertad: la corredera es un grado de traslación y la articulación un grado de rotación. Cualquier otro par dinámico puede reducirse, mediante la adopción de eslabones virtuales, a una combinación de varios pares pertenecientes a uno de estos dos tipos. El eslabón secundario de un par tipo corredera puede deslizarse, sin deformarse, a lo largo de un eje fijo con respecto a los ejes cuerpo. Llamaremos fulcro a un punto cualquiera a lo largo del eje de deslizamiento y denotaremos sus coordenadas en ejes cuerpo mediante r f . Puesto que el eje es fijo, el fulcro es fijo. Consideraremos que el eje de deslizamiento es paralelo al vector unitario n D . Si asociamos al eslabón un sistema de referencia local tal que su origen esté sobre el eje de deslizamiento podemos representar la posición instantánea del origen de los ejes locales mediante una distancia λ a partir del fulcro, de modo que: r0 = r f + λn D por otro lado, si los ejes están girados por una rotación R φn00 constante, la posición de cualquier partícula del eslabón vendrá dada en ejes cuerpo como: rPCG = r f + λn D + R φn00 rP en donde rP es la posición de una partícula cualquiera del eslabón en ejes locales. La ventaja de esta definición es que la única cantidad dependiente del tiempo será la distancia λ . De este modo, la velocidad de las partículas del eslabón en ejes cuerpo viene dada por: rPCG = λn D De igual forma, la aceleración de las partículas en ejes cuerpo será: rPCG = λn D Las fuerzas y momentos de configuración producidos por un eslabón cualquiera son: Fd = − ∫ ρrPCG dV − 2[ ×]∫ ρrPCG dV E M d = − ∫ [rPCG ×]ρrPCG dV − 2 ∫ ρ (Ur E r T PCG PCG E T )dV − rPCG rPCG E Sustituyendo las aceleraciones y velocidades para las fuerzas de la corredera serán: Fd = − ∫ ρλn D dV − 2[ ×]∫ ρλn D dV E E Fd = − mE λn D − 2mE λ [ ×]n D como vemos, se trata de una fuerza paralela al eje de deslizamiento y proporcional a la aceleración del eslabón y, por otro lado, de una fuerza de Coriolis debida a la rotación de los ejes cuerpo (obviamente, proporcional a la velocidad de deslizamiento del eslabón). Por otra parte, los momentos de configuración serán:     T T dV n D − n D ∫ ρrPCG dV  M d = −λ  ∫ ρrPCG dV ×n D − 2λ  U ∫ ρrPCG E E    E sustituyendo la posición de las partículas y el momento de primer orden en ejes locales: M d = −mE λ [r f ×]n D − 2mE λ (Ur Tf n D − n Dr Tf ) − 2λλmE (U − n D nTD ) [ ] ( − λ R φn00 Q E 0 × n D − 2λ UQTE 0 R φn00T n D − n D QTE 0R φn00T ) En el caso en que el eslabón estuviese balanceado las fuerzas no se modifican y los momentos se simplifican quedando ambos términos como: Fdb = − mE λn D − 2mE λ [ ×]n D M db = − mE λ [r f ×]n D − 2mE λ (Ur Tf n D − n Dr Tf ) − 2λλmE (U − n D nTD ) Par Dinámico Articulación: Un Eje de Rotación El eslabón secundario de este par puede girar, sin deformarse, alrededor de un eje fijo con respecto a los ejes cuerpo. Si colocamos el origen del sistema de referencia local del eslabón en el eje de referencia y llamamos fulcro a este punto tendremos r0 = r f . Puesto que el eje es fijo, el fulcro es fijo. Consideraremos que el eje de giro es paralelo al vector unitario nG . Si la actitud instantánea del sistema local con respecto a los ejes cuerpo está dada por un ángulo δ alrededor del eje de giro, entonces, la posición de cualquier partícula del eslabón vendrá dada en ejes cuerpo como: rPCG = r f + R δnG rP en donde rP es la posición de una partícula cualquiera del eslabón en ejes locales. La ventaja de esta definición es que la única cantidad dependiente del tiempo es el ángulo δ. La velocidad de las partículas del eslabón en ejes cuerpo se obtiene derivando la posición: rPCG = dR δnG rP = δ [nG ×]R δnG rP dt en donde se ha utilizado el hecho de que la única función del tiempo es el ángulo δ y es evidente que R δnG n G = nG . De igual forma, la aceleración de las partículas en ejes cuerpo será: rPCG = δ [nG ×]R δnG rP + δ [nG ×] dR δnG rP dt efectuando nuevamente la derivada de la forma de Gibbs: rPCG = δ [nG ×]R δnG rP + δ 2 [n G ×][n G ×]R δnG rP obtenemos finalmente: rPCG = (δ + δ 2 [nG ×])[nG ×]R δnG rP Con las velocidades y las aceleraciones evaluadas de esta forma, pueden determinarse las fuerzas y los momentos de configuración debidos a un eslabón de este tipo sobre el vehículo. Los términos a calcular son: Fd = − ∫ ρrPCG dV − 2[ ×]∫ ρrPCG dV V M d = − ∫ [rPCG ×]ρrPCG dV − 2 ∫ ρ (Ur V r T PCG PCG V T )dV − rPCG rPCG V De este modo, las fuerzas de inercia debidas a la rotación de la superficie de control son: Fd = −(δ + 2δ [ ×] + δ 2 [n G ×])[nG ×]R δnG ∫ ρrP dV E o bien: Fd = − (δ + 2δ [ ×] + δ 2 [nG ×])[nG ×]R δnG Q E 0 En estas expresiones distinguimos claramente entre los efectos de la aceleración angular, la fuerza de Coriolis y la aceleración centrípeta alrededor del eje de giro. Por otro lado, los momentos de estas fuerzas vienen dados por: [ ] M d = − ∫ [r f ×]ρ (δ + δ 2 [nG ×])[nG ×]R δnG rP dV − ∫ R δnG rP × ρ (δ + δ 2 [nG ×])[nG ×]R δnG rP dV (( E ) ( E − 2∫ ρ U r f + rP R δnG δ [nG ×]R δnG rP − δ [nG ×]R δnG rP r f + rP R δnG T T T T T T ))dV E En donde simplemente se han sustituido las posiciones, velocidades y aceleraciones. Por simplicidad trataremos cada uno de los términos por separado. En el primer término se pueden llevar todos los factores salvo uno fuera de la integral, por lo que tendremos: M d 1 = −[r f ×]ρ (δ + δ 2 [nG ×])[nG ×]R δnG ∫ rP dV = −[r f ×]ρ (δ + δ 2 [nG ×])[nG ×]R δnG Q E 0 E En el segundo término desarrollamos: [ ] [ ] M d 2 = −δ ∫ R δnG rP × ρ [nG ×]R δnG rP dV − δ 2 ∫ R δnG rP × ρ [nG ×][n G ×]R δnG rP dV E E en el primer término conmutamos el segundo producto cruz para obtener: [ ][ ] [ ] M d 2 = −δ ∫ ρ R δnG rP × R δnG rP × nG dV − δ 2 ∫ R δnG rP × ρ [nG ×][nG ×]R δnG rP dV E E [ ][ ( ] ) ahora podemos utilizar la identidad R δnG rP × R δnG rP × = R δnG rP rP − UrP rP R δnG obtener: ( ) [ T T T para ] M d 2 = −δ ∫ ρR δnG rP rP − UrP rP R δnG nG dV − δ 2 ∫ R δnG rP × ρ [nG ×][nG ×]R δnG rP dV T T T E E Sacando de la primera integral los términos que no dependen de la posición y utilizando la definición del momento de inercia del eslabón en ejes locales T T I E 0 = ∫ ρ UrP rP − rP rP dV podemos obtener: ( ) E [ ] M d 2 = δR δnG I E 0R δnG n G − δ 2 ∫ R δnG rP × ρ [nG ×][nG ×]R δnG rP dV T E por otro lado, en el segundo término, podemos utilizar la siguiente identidad: [nG ×][nG ×] = −[nG nG T − U] de este modo tenemos: [ ] M d 2 = δR δnG I E 0R δnG n G + δ 2 ∫ ρ R δnG rP × nG nG R δnG rP dV T T E [ ] en donde hemos utilizado el hecho de que R δnG rP × R δnG rP = 0 . Conmutando los factores en el producto cruz y en el producto escalar del último término tendremos: ([ ] )( ) M d 2 = δR δnG I E 0R δnG nG + δ 2 ∫ ρ R δnG rP × nG nG R δnG rP dV T T E M d 2 = δR δnG I E 0R δnG n G − δ 2 ∫ ρ [nG ×]R δnG rPrP R δnG nG dV T T E finalmente, si agregamos el término igual a cero: T ( ) δ 2 ∫ ρ [n G ×]R δn rP TrP R δn n G dV = δ 2 ∫ ρ [nG ×]R δn R δn n G rP TrP dV G G E =δ 2 T G ∫ ρ [n ×]n (r G G T P G T E ) rP dV = 0 E tendremos: ( ) M d 2 = δR δnG I Ef R δnG nG + δ 2 ∫ ρ [nG ×]R δnG UrP rP − rP rP R δnG nG dV T T T T E es decir: M d 2 = (δ + δ 2 [nG ×])R δnG I Ef nG T en donde también se ha hecho uso de la identidad R δnG nG = nG . Pasando al tercer término de los momentos, podemos reagruparlo del siguiente modo: ( ) M d 3 = −2δ ∫ ρ Ur f [nG ×]R δnG rP − [nG ×]R δnG rPr f dV T ( E T ) − 2δ ∫ ρ UrP R δnG [nG ×]R δnG rP − [nG ×]R δnG rP rP R δnG dV T T T T E En la primera integral podemos sacar todos los factores que no dependen del espacio. En la segunda integral podemos ver que el producto escalar se anula conmutando los factores: ( ) − rP R δnG [nG ×]R δnG rP = − [nG ×]R δnG rP R δnG rP = rP R δnG [nG ×]R δnG rP = 0 T T T T T obtenemos entonces: ( M d 3 = −2δ Ur f [nG ×]R δnG Q E 0 − [nG ×]R δnG Q E 0r f T + 2δ [nG ×]R δnG ∫ ρrP rP dV R δnG T T ) T E Finalmente, podemos utilizar la definición del momento de inercia del eslabón para obtener: ( M d 3 = −2δ Ur f [nG ×]R δnG Q E 0 + [nG ×]R δnG Q E 0r f T − 2δ [n G ×]R δnG I E 0 R δnG T + 2δ [nG ×] ∫ ρr ) P E recolectando los resultados para los tres términos: T T rP dV M d = −[r f ×]ρ (δ + δ 2 [nG ×])[n G ×]R δnG Q Ef + (δ + δ 2 [nG ×])R δnG I Ef nG   T T T T − 2δ  Ur f [nG ×]R δnG Q Ef + [nG ×]R δnG Q Ef r f + [nG ×]R δnG I Ef R δnG − [n G ×]∫ ρrP rP dV  E   En donde se ven claramente las contribuciones del desbalance de masa, de los momentos de inercia y del acoplamiento entre la velocidad angular del eslabón y la velocidad angular del vehículo (término de Coriolis). Si el eje de giro pasara por el centro de gravedad del eslabón no existirían fuerzas ya que, en ese caso, Q E 0 = 0 ; mientras que los momentos se reducirían a: M db = (δ + δ 2 [nG ×])R δnG I Ef nG − 2δ [n G ×]R δnG I Ef R δnG T + 2δ [nG ×] ∫ ρr T P rP dV E   T T M db = (δ + δ 2 [nG ×])R δnG I Ef nG − 2δ [nG ×] R δnG I Ef R δnG − ∫ ρrP rP dV  E   Un eslabón que cumple con esta característica se dice que está balanceado en masa. Capítulo 4 Compensación Análisis Dimensional. (Presentar el teorema pi de Bukingham como marco teórico) Presentaremos la teoría de hélices como un ejemplo sencillo en el cual la aplicación del análisis dimensional resulta muy sencilla y conduce a una mejor comprensión del fenómeno de estudio. Posteriormente aplicaremos el análisis dimensional a la dinámica del vehículo. Hélices: Modelo de Rankine – Froude. Una hélice es un mecanismo diseñado para producir una fuerza de tracción o de empuje, cuando se encuentra sumergida en un medio fluido. Su funcionamiento está basado en la segunda y la tercera ley de Newton: al incrementar la cantidad de movimiento del fluido que pasa a través del mecanismo, el fluido reacciona produciendo una fuerza en sentido contrario a dicho incremento y que actúa sobre la hélice. La explicación más simple de este fenómeno es el llamado modelo de Rankine – Froude. pDisco 2 p2 Actuador b′ V + a′ V p1 p1 p2 V + a′ r dr p2 T Q Nomenclatura para el modelo de Rankine - Froude. Como puede verse en la figura, en este modelo se idealiza la hélice como un disco infinitamente delgado (disco actuador). Cuando el flujo pasa a través del disco, sufre un salto de presión p1 − p2 , que tiende a acelerar el fluido en la parte posterior. La fuerza producida por el cambio en la cantidad de movimiento puede calcularse mediante dos procedimientos equivalentes: multiplicando el salto de presión por la superficie del disco, o bien, de acuerdo con la segunda ley de Newton. Primeramente, el salto de presión puede calcularse mediante la ecuación de Bernoulli considerando un fluido ideal (no viscoso e incompresible). Para ello, escribiremos la ecuación de Bernoulli dos veces: la primera para una línea de corriente que inicia delante del disco y llega hasta sus proximidades sin atravesarlo; la segunda, para una línea de corriente que inicia justo atrás del disco y llega hasta la estela (cuando la presión del aire se ha estabilizado con la presión atmosférica). La razón para hacer esto es que la ecuación de Bernoulli es aplicable a lo largo de una línea de corriente, siempre y cuando las funciones del fluido sean continuas y, si bien la velocidad es una función continua, estamos suponiendo que la presión sufre un salto justo al atravesar el disco. En suma, tenemos: 1 2 1 2 ρV 2 + p1l = 12 ρ (V + a ′)2 + p1c ρ (V + a ′)2 + p2 c = 12 ρ (V + c′)2 + p2 l Considerando que la presión lejos del disco (adelante y atrás) debe estar en equilibrio con la presión atmosférica se tiene p1l = p2l y se deduce fácilmente el valor del salto de presión: c′   ∆p = p2 c − p1c = ρ V + c′ 2  La fuerza generada por una corona de ancho dr y radio medio r queda expresada como el producto de esta presión por su superficie: dT = ∆pds ds = 2πrdr c′   dT = 2πrρ V + cdr 2  Por otro lado, esta fuerza también es igual al cambio en la cantidad de movimiento del aire el cual se puede expresar como el flujo másico que pasa a través de la misma corona multiplicado por el incremento de total de velocidad: dT = dm∆V dm = ρ (V + a ′)ds ∆V = (V + c′) − V = c′ dT = 2πrρ (V + a ′)c′dr Comparando ambas expresiones se deduce que 2a ′ = c′ y, finalmente, la fuerza queda expresada en función de la velocidad inducida en el disco como: dT = 4πρr (V + a ′)a ′dr Por otra parte, de acuerdo con Von Mises (1945), el flujo también sufre un incremento de velocidad tangencial en el disco actuador. Este incremento es instantáneo y produce un par sobre el flujo que puede calcularse mediante la ley de conservación del momento angular: dQ = 4πρr 2 (V + a ′)b′dr en donde b es el incremento de velocidad tangencial en el disco (se supone que dicha velocidad es nula antes de atravesar el disco). Es evidente que estas fórmulas nos permiten calcular las fuerzas cuando se conocen los incrementos de velocidad a y b . Sin embargo, este modelo por sí sólo es insuficiente para calcular dichos incrementos. Hélices: Modelo de Glauert - Theodorsen. c L ζ D dT N dQ Nr φ0 V0 Plano de Rotación Nomenclatura para el modelo del Elemento de Pala. En este modelo se considera que la hélice está constituida por un número finito N de palas. Cada una de las palas está formada por secciones infinitamente delgadas cuya forma está diseñada con el objeto de producir una cierta fuerza aerodinámica. Estos elementos son en todo idénticos a los perfiles utilizados en las alas de un avión. La componente axial de la fuerza aerodinámica, sumada sobre todos los elementos y sobre todas las palas, formará la tracción generada por la hélice. Por otro lado, las fuerzas aerodinámicas tendrán también una componente paralela al plano de rotación de la hélice; esta componente constituirá la resistencia de la hélice a girar en el medio fluido. En la figura 2 se representa uno de los elementos de pala así como las fuerzas aerodinámicas que actúan sobre él. La tracción y el par (resistencia al giro), generados por los N elementos en la posición r y de envergadura dr , se expresan mediante: dT = 12 ρNcV 02 (C L cos φ 0 − C D sen φ 0 )dr dQ = 12 ρNcV02 r (C L sen φ 0 + C D cos φ 0 )dr C L y C D son los coeficientes aerodinámicos de la sección, c es la cuerda y V0 la magnitud del viento relativo. Es evidente que estas fórmulas son inútiles en tanto no se conozca el ángulo formado entre el viento relativo y el plano de rotación de la hélice φ0 . α ε V0 θ φ φ0 b′ a′ V 2πnr Diagrama de Velocidades del Elemento de Pala. Con el objeto de calcular este ángulo, deben considerarse las siguientes velocidades: la velocidad de avance de la hélice en el medio fluido, la velocidad tangencial del elemento de pala debida al giro de la hélice y, finalmente, las velocidades inducidas, de acuerdo con lo previsto por el modelo de Rankine – Froude. En la figura 3 se representan gráficamente dichas velocidades y se define una serie de ángulos que las relacionan con el plano de rotación de la hélice (en la misma figura, n representa la velocidad de giro de la hélice en revoluciones por segundo). El ángulo β es llamado ángulo de paso y está medido desde el plano de rotación hasta la cuerda aerodinámica del elemento de pala. El ángulo φ es llamado ángulo de velocidades y representa el ángulo con que el flujo no perturbado incidiría sobre el perfil. El ángulo ε es llamado ángulo inducido y representa la diferencia entre el flujo no perturbado y el flujo sobre el elemento. Por lo tanto, es evidente que: φ 0 = φ + ε . Finalmente, el ángulo α es el ángulo de ataque del perfil: α = β − φ0 = β − φ − ε . Hélices: Análisis Dimensional. Hasta este momento, hemos conducido nuestro análisis considerando las magnitudes involucradas con sus dimensiones. Sin embargo, es importante realizar un análisis dimensional con el fin de comparar los órdenes de magnitud de los diferentes términos. El primer paso del análisis dimensional es introducir valores característicos del fenómeno para cada una de las magnitudes fundamentales. En nuestro caso estas magnitudes serán: longitud, masa y tiempo. La única longitud característica del fenómeno es el diámetro de la hélice: D . Puede construirse un tiempo característico con el inverso de la velocidad de giro de la hélice: n −1 (nótese que esta definición no es estrictamente correcta ya que n está dado en revoluciones por segundo; sin embargo, con el objeto de comparar las expresiones resultantes, hemos seguido la tradición consagrada en este tipo de estudios). Finalmente, la masa característica vendrá dada por la densidad del fluido circundante y el diámetro de la hélice: ρD 3 . Tomando en cuenta estas magnitudes características como unidades de medida, pueden introducirse una serie de números adimensionales que representan al fenómeno. Así, las unidades de velocidad son nD y la velocidad de avance de la hélice queda representada mediante el llamado coeficiente de funcionamiento (o factor de avance): J= V nD Del mismo modo, las velocidades inducidas quedarán representadas por los números: a= a′ b′ y b= nD nD Las unidades de fuerza en este sistema son ρn 2 D 4 y la tracción queda representada por el coeficiente: CT = T ρn 2 D 4 Las unidades de momento de una fuerza (par) son ρn 2 D 5 y el par queda representado por el coeficiente: CQ = Q ρn 2 D 5 La posición de un elemento de pala será representada por la coordenada adimensional: x= 2r D Finalmente, se introduce un número adimensional para representar la "densidad" de las palas con respecto al disco de la hélice: σ= Nc πD este número se conoce con el nombre de solidez. Es fácil ver que este número puede hacerse función de la coordenada adimensional x , haciendo variar la cuerda de los perfiles a lo largo de la pala. Tomando en cuenta las definiciones anteriores, las fórmulas para la tracción y el par totales, integrando sobre la longitud de las palas, pueden escribirse como: 1 CT = π ∫ x (J + a )adx x0 CQ = π 1 x ( J + a )bdx 2∫ 2 x0 en el caso del modelo de Rankine – Froude, y: CT = π 1 σ (J + a ) + (πx − b ) [C (πx − b ) − C (J + a )]dx 4∫ 2 2 L D x0 CQ = π 1 σx (J + a ) + (πx − b) [C (J + a ) + C (πx − b )]dx 8∫ 2 2 L D x0 para el modelo de Glauert - Theodorsen. En este último caso se ha eliminado la incógnita φ0 introduciendo las velocidades inducidas mediante simples relaciones geométricas. Hélices: Modelo Combinado. Hemos mencionado que tanto el modelo de Rankine – Froude como el de Glauert Theodorsen están incompletos ya que no permiten calcular, de manera independiente las velocidades inducidas o el ángulo inducido. Para completar esta teoría de hélices presentaremos el método que ha sido utilizado. Este método fue también propuesto por Theodorsen. Considerando conocidos el ángulo de paso, las características aerodinámicas del perfil, la distribución de solidez y el factor de avance de la hélice, las incógnitas necesarias para calcular los coeficientes de tracción y de par son: el ángulo inducido y las dos velocidades inducidas. Con el fin de dar solución a este problema podemos igualar las expresiones obtenidas para la tracción y el par de los dos modelos anteriores. El resultado es el siguiente: (J + a )a (J + a )2 + (πx − b )2 (J + a )b (J + a )2 + (πx − b )2 = = σ 8x σ 8x [CL (πx − b ) − C D (J + a )] [C L (J + a ) + CD (πx − b )] Reconociendo que los coeficientes aerodinámicos dependen del ángulo de ataque y, por lo tanto, del ángulo inducido, puede verse que el anterior es un sistema de dos ecuaciones con tres incógnitas. Una tercera ecuación está constituida por la sencilla relación geométrica: tan(φ + ε ) = J +a πx − b Ahora bien, este sistema de tres ecuaciones con tres incógnitas es no lineal y trascendental y, por lo tanto, no puede escribirse una solución analítica. Por el momento, rescribiremos el sistema considerando las relaciones geométricas: tan(φ ) = J , y sen (φ + ε ) = πx J +a (J + a )2 + (πx − b )2 así como la identidad trigonométrica: tan( y + z ) = tan( y ) + tan( z ) 1 − tan( y )tan( z ) De este modo, resolviendo las dos primeras ecuaciones para a y b , y después de algunas transformaciones evidentes, el sistema anterior se puede escribir como: 8x a= σ 8x b= σ ( ) sen (φ + ε )(C Lπx − C D J ) − C L2 + C D2 J 2  8x  2  σ sen (φ + ε ) + C D  + C L ( ) sen (φ + ε )(C L J + C Dπx ) + C L2 + C D2 πx 2 8x  2  σ sen (φ + ε ) + C D  + C L Jb + πxa tan(ε ) = J ( J + a ) + πx(πx − b ) Como vemos, sustituyendo las dos primeras expresiones en la tercera, obtendríamos una sola ecuación para el ángulo inducido. Dicho de otro modo, el problema planteado es el de encontrar un valor del ángulo ε que anule la expresión: f (ε ) = tan(ε ) − Jb + πxa J ( J + a ) + πx(πx − b ) en donde: 8x a= σ 8x b= σ ( ) sen (φ + ε )(C Lπx − C D J ) − C L2 + C D2 J 2  8x  2  σ sen (φ + ε ) + C D  + C L ( ) sen (φ + ε )(C L J + C Dπx ) + C L2 + C D2 πx 2 8x  2  σ sen (φ + ε ) + C D  + C L Si bien antes de los años cuarenta del siglo veinte no había otras técnicas que la analítica y la gráfica para dar solución a este problema, hoy en día es casi inmediato pensar en aplicar cualquier algoritmo numérico con el fin de encontrar las raíces de la función f (ε ) . Finalmente, será necesario realizar una integración numérica de las expresiones para los coeficientes de tracción y de par. Evidentemente, si la solución numérica del ángulo inducido es lo suficientemente aproximada, las integrales de ambos modelos deberán ser equivalentes. Adimensionalización de las Ecuaciones de Movimiento. Regresemos ahora al problema del movimiento del vehículo y apliquemos a este la técnica del análisis dimensional. Como se mencionó en el capítulo anterior, en el área de estabilidad y control se estudia el comportamiento del vehículo en intervalos más o menos cortos de tiempo; unos cuantos segundos después de haber sufrido una perturbación (externa o interna) a partir de una cierta condición de vuelo. Con el objeto de poder considerar perturbaciones de las variables de fase que sean pequeñas en magnitud, comparadas con las propias variables de fase, el primer paso es el de escribir las ecuaciones en forma adimensional. Resumamos el método utilizado para adimensionalizar las ecuaciones: primeramente se determina el número de dimensiones independientes que requiere el sistema, es decir, el tamaño del sistema de unidades físicas necesarias para describir el comportamiento; en seguida, se determina un número igual de valores característicos del sistema (estos valores pueden corresponder directamente a las unidades del sistema o bien a medidas compuestas); se determina el valor característico correspondiente a cada variable del sistema; finalmente, se introduce un nuevo conjunto de variables de fase dividiendo cada variable del sistema por su valor característico. En el área de dinámica de vuelo se ha utilizado tradicionalmente una adimensionalización basada en la presión dinámica, la superficie alar (u otra superficie de referencia) y la aceleración de la gravedad. Sin embargo, en ciertos casos esta opción puede no ser muy afortunada ya que algunos valores característicos se anulan en ciertas condiciones de vuelo, lo cual indetermina las variables adimensionales. A continuación presentaremos la adimensionalización tradicional y luego propondremos una nueva adimensionalización que podría utilizarse en los casos mencionados. Tradicionalmente, puesto que en la introducción de los coeficientes aerodinámicos hemos utilizado la cantidad qS como unidad para las fuerzas aerodinámicas, escogiendo g como unidad de aceleración y S como unidad de longitud, las unidades de velocidad son g S . Así mismo, las unidades para las velocidades angulares son g / S . Introduciendo estas expresiones, junto con el siguiente conjunto de variables adimensionales: r Ig ~ = VCG ; ~ = ; ~ V rPCG = PCG ; ~I = 2 CG qS S g S g S d ~ A = m A g ; ρ~ = ρg S ; V~ = V3 ; d = m ~ q qS S 2 dt g S dt T t b c T~i = i ; ~ti = i ; b~ = ; c~ = qS S S S es fácil comprobar que las ecuaciones de movimiento, en cualquiera de sus versiones, no cambian de forma: ~ ~ = F − [~ ×]V ~ V CG CG ~ mA ~ − [~ ×]~I ~ ) ~ = ~I −1 (M ~ ~ r ′ = RV CG CG R = [R ~ ×]R con las fuerzas y momentos adimensionales dados por: ~  ~ ~   F − [~ ×]V V CG  CG  m ~  ~   A ~ − [~ ×]~I ~ )  =  ~I −1 (M   ~ ′   rCG k′ jA i ~    R ✁ R R φ VCG   e    T~   n ~ = (m ~ A − ρ~AV~ )R T k ′ + ∑ T~i e i + R πj −α (C D iV + CY jV + C L kV ) F i =1 ~ ~ ~ − [~ ×] ρ~~ ~ ~ ~ AV −m CG ∫ rPCG dV − ∫ ρ~~rPCG dV − 2[~ ×]∫ ρ~~rPCG dV − ∫ ρ~~rPCG dV V V V V ~ = T~ [~t ×]e + R j (b~C i + c~C j + b~C k ) M ∑ i i i π −α l V m V n V n i =1 ~ ×] ρ~~ ~ ~ T T + [V CG ∫ rPCG dV − ∫ ρ~(U~rPCG ~rPCG − ~rPCG ~rPCG )dV ~ V V T ~ T )dV~~ − ∫ [~rPCG ×]ρ~~rPCG dV~ rPCG ×]ρ~~ rPCG dV~ − 2 ∫ ρ~ (U ~ rPCG rPCG − ~ rPCG ~ rPCG − ∫ [~ V V V Sin embargo, esta opción es poco afortunada ya que con ella resulta imposible analizar el vuelo estacionario de ciertos vehículos (puesto que en ese caso q = 0 y las variables adimensionales quedarían indeterminadas). En este trabajo hemos decidido proponer una nueva forma de proceder que sería válida en esos casos. Así, escogiendo g como valor característico de aceleración y característico de longitud, el valor característico de la velocidad es S como valor g S . Así mismo, el valor característico para las velocidades angulares es g / S . Finalmente, puesto que nuestro problema es puramente dinámico, requerimos un valor característico para la fuerza o bien para la masa. Es difícil determinar un valor característico que abarque todos los casos, sin embargo, aunque la masa del vehículo también puede ser una variable de fase en ciertos casos, se ha decidido utilizar la masa inicial del vehículo la cual denotaremos por m0 , entendiendo que se trata de la masa al inicio del estudio. Esta opción también puede complicar las cosas cuando, durante el intervalo de estudio, la masa sufre grandes cambios. En efecto, al final del estudio la magnitud de las fuerzas efectivamente presentes no corresponderá con el valor característico utilizado para adimensionalizarlas, en estos casos se deberá tener cuidado al despreciar ciertos términos. Así, el valor característico para las fuerzas es m0 g . Introduciendo entonces los valores característicos escogidos, junto con el siguiente conjunto de variables adimensionales: ~ = VCG ; ~ = V CG g S g r I ; ~ rPCG = PCG ; ~I = m0 S S S 3 2 ~ A = m A ; ρ~ = ρS ; q~ = qS ; V~ = V3 ; d = m ~ m0 m0 m0 g S 2 dt T t b c ~ T~i = i ; ~ti = i ; b = ; c~ = m0 g S S S d g S dt es fácil comprobar que las ecuaciones de movimiento, en cualquiera de sus versiones, no cambian de forma: ~ ~ = F − [~ ×]V ~ V CG CG ~ mA ~ − [~ ×]~I ~ ) ~ = ~I −1 (M ~  ~ ~   F − [~ ×]V V CG  CG  m ~  ~   A ~ − [~ ×]~I ~ )  =  ~I −1 (M   ~ ′   rCG k′ jA i ~    R ✁ R R φ VCG    e   T~   ~ ~ ′ = RV rCG CG ~ R = [R ×]R con las fuerzas y momentos adimensionales dados por: n ~ = (m ~ A − ρ~AV~ )R T k ′ + ∑ T~i e i + q~R πj −α (C D iV + CY jV + C L kV ) F i =1 ~ − [~ ×] ρ~~ ~ ~ ~ ~ ~ AV −m CG ∫ rPCG dV − ∫ ρ~~rPCG dV − 2[~ ×]∫ ρ~~rPCG dV − ∫ ρ~~rPCG dV V V V V ~ = T~[~t ×]e + q~R j (b~C i + c~C j + b~C k ) M ∑ i i l V m V n V π −α n i =1 ~ ×] ρ~~ ~ ~ T T + [V CG ∫ rPCG dV − ∫ ρ~(U~rPCG ~rPCG − ~rPCG ~rPCG )dV ~ V V T ~ T )dV~~ − ∫ [~rPCG ×]ρ~~rPCG dV~ rPCG ×]ρ~~ rPCG dV~ − 2 ∫ ρ~ (U ~ rPCG rPCG − ~ rPCG ~ rPCG − ∫ [~ V V V Puesto que las ecuaciones no cambian de forma, en lo sucesivo dejaremos de escribir la tilde pero debe recordarse siempre que en todas las ecuaciones posteriores se trata de variables adimensionales. Definición de los Estados de Referencia Se define un estado estacionario como aquel punto del espacio de fases a partir del cual el sistema no puede evolucionar en el tiempo. Es decir, es un punto en el cual las variables de fase permanecen constantes en el tiempo: VCGe = 0; e ′ = 0; φe = 0; θ e = 0; ψ e = 0 = 0; rCGe En donde utilizamos el subíndice ‘e’ para indicar que se trata de un punto específico del espacio de fases. Puesto que las variables de fase están relacionadas (se puede hablar de momentos conjugados entre pares de variables), vemos que el único estado estacionario posible es el estado de reposo completo con respecto al sistema de ejes tierra. Sin embargo, una teoría limitada a este estado de referencia tendría muy poca utilidad. Cabe la posibilidad de estudiar lo que sigue como bifurcaciones del sistema dinámico completo y seguir la teoría de estabilidad de Floquet, pero esto representa aún un arduo trabajo de investigación. Con el fin de ampliar la teoría debe abrirse la posibilidad de estudiar otros estados de referencia en los cuales algunas de las variables de fase no sean cero sino que tengan un comportamiento simple en función del tiempo: por ejemplo: los ángulos pueden ser periódicos y las coordenadas del centro de gravedad incrementarse linealmente con el tiempo. Esto implica que las otras variables de fase sí serán estacionarias, es decir, las velocidades angulares y las lineales deberán permanecer constantes. Como veremos a continuación, partiendo del estado estacionario como primer estado de referencia, pueden determinarse 19 estados de referencia para los cuales vale la pena realizar el estudio de estabilidad. Evidentemente, no cualquier vehículo puede compensarse para alcanzar todos estos estados. Existirán algunos vehículos para los cuales la gama de estados de referencia deba restringirse por razones físicas. El estado de referencia inicial, el estado estacionario, se denomina de sustentación pura. Si se desestabilizan primero los ángulos de Euler, considerando velocidades angulares constantes, se obtienen cuatro estados de referencia que se denominan: guiñada, cabeceo, alabeo y rotación general, dependiendo de cuales velocidades angulares son diferentes de cero. Si se desestabilizan ahora las coordenadas del centro de gravedad, considerando velocidades constantes, se obtienen otros cuatro estados que son: el avance, la deriva, el ascenso y el planeo general. Si se desestabilizan ahora pares de coordenadas una traslacional y una rotacional, considerando una velocidad angular constante alrededor del mismo eje en el que hay una velocidad de traslación constante, se obtienen otros tres estados que se llaman: barril, torniquete y barrena plana. Si consideramos ahora pares en los que la velocidad angular constante es perpendicular a la velocidad de traslación, que también es constante, obtenemos seis estados que se denominan: recuperación, viraje coordinado, péndulo, rodeo horizontal, rompimiento y rodeo vertical. Finalmente, si consideramos que las seis coordenadas se desestabilizan mientras que las seis velocidades permanecen constantes, obtenemos un estado de referencia llamado hélice general. En toda esta discusión hemos supuesto que la densidad permanece constante lo cual es solo aproximado en la atmósfera real. Con el propósito de dar coherencia a los estudios posteriores, podemos agrupar estos estados de referencia en tres grandes grupos: a) Vuelo estacionario; definido como aquella condición de vuelo en la que las coordenadas del centro de gravedad con respecto a los ejes tierra son constantes; incluye los estados de referencia de sustentación pura, guiñada, alabeo, cabeceo y rotación general; b) Vuelo rectilíneo; definido como aquella condición de vuelo en la que el centro de gravedad del vehículo se mueve sobre una línea recta, visto desde los ejes tierra; incluye los estados de referencia de avance, deriva, ascenso, planeo general, barril, torniquete y barrena plana; c) Vuelo curvilíneo; definido como aquella condición de vuelo en la que el centro de gravedad describe una trayectoria curva visto desde los ejes tierra; incluye los siguientes estados de referencia: recuperación, viraje coordinado, péndulo, rodeo horizontal, rompimiento, rodeo vertical y hélice general. En la siguiente tabla se ha condensado toda esta información para posterior referencia. 1 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 4 0 0 0 Pe Qe 0 5 0 0 0 6 0 0 7 Ue 0 Pe 0 0 8 0 Ve 0 9 Ue 10 U e 11 0 12 0 0 Re 0 Sustentación Pura Guiñada 0 Alabeo Qe 0 Re 0 Rotación General 0 0 0 Deriva We 0 0 0 Ascenso Ve 0 We 0 0 0 0 Planeo General 0 0 Barril Ve 0 0 Pe 0 Qe 0 0 Torniquete Re 0 Barrena Plana 0 13 U e 14 U e 0 We 0 0 0 0 15 0 Ve 0 0 16 0 0 17 0 Ve 0 Pe 0 We 18 0 0 We Pe 0 0 Qe 0 Re 0 Cabeceo Avance Vuelo Rectilíneo Recuperación Viraje Coordinado Péndulo Rodeo Horizontal 0 Re 0 Qe 0 Rodeo Vertical 0 Vuelo Estacionario Vuelo Curvilíneo Rompimiento 19 U e Ve We Pe Q e Re Hélice General Estados de Referencia para el Vehículo en Movimiento en Tres Dimensiones Análisis Cinemático. De la definición de estado de referencia deducimos que cualquier condición en la cual tanto la velocidad del centro de gravedad como la velocidad angular de los ejes cuerpo sean constantes con respecto a los ejes cuerpo, es un estado de referencia. Esto nos lleva a la conclusión de que para conocer los estados de referencia es necesario analizar las ecuaciones cinemáticas considerando las velocidades como constantes : ′ = RVCGe rCG R = [R e ×]R Estas ecuaciones constituyen un sistema de seis ecuaciones diferenciales ordinarias, de primer orden, con coeficientes constantes y seis incógnitas. Para encontrar su solución se requiere fijar las condiciones iniciales del vehículo es decir, se requiere conocer la ′ (0) y R (0) . Se debe notar que en este caso es más posición y la actitud iniciales rCG conveniente trabajar con la matriz de cosenos directores y no con los ángulos de Euler. Es evidente que las curvas descritas por el vehículo dependerán de los valores de las constantes VCGe y e . Puesto que estamos trabajando con variables sin dimensiones, los valores de las componentes pueden estar comprendidos en el intervalo [− 1,1] cubriendo la gama completa de posibilidades. En las secciones siguientes se presentan imágenes para cada una de estas trayectorias. Estas imágenes fueron construidas resolviendo numéricamente el sistema de ecuaciones cinemáticas con valores al azar para las variables de fase diferentes de cero. Las condiciones iniciales, puesto que no intervienen en la forma de la trayectoria, se escogieron en el origen de los ejes tierra y con los vectores unitarios de los ejes cuerpo paralelos a los de tierra, es decir: 0 1 0 0   ′ (0) = 0 ; R (0) = 0 1 0 rCG     0 0 0 1 Para la ecuación de la posición del centro de gravedad se usó un método de Euler muy simple con un paso relativamente pequeño y para la ecuación de la actitud se utilizó el método de la forma de Gibbs que se expuso en capítulos anteriores. No se recomienda utilizar en este tipo de cálculos la parametrización por ángulos de Euler ya que la ecuación de la actitud contiene una singularidad par θ = ± π 2 , lo cual dificulta en mucho la solución de las ecuaciones. En las figuras se ha trazado la trayectoria del centro de gravedad (en negro), así como la actitud de los ejes cuerpo en diferentes instantes de tiempo (línea roja, eje X, línea verde, eje Y, línea azul, eje Z). Análisis Dinámico. El análisis cinemático nos permite conocer las diversas formas geométricas que pueden tener los estados de referencia, sin embargo, dicho análisis no nos permite calcular en qué forma el vehículo puede alcanzar y mantener uno de esos estados en particular. Recordando la teoría general del capítulo uno, sabemos que para lograr esto se debe recurrir a los valores de compensación de las variables de control. Hasta este momento, no hemos introducido explícitamente ninguna variable de control en las ecuaciones de movimiento del vehículo. Separamos las fuerzas y momentos externos en una componente constante, que se denomina de configuración limpia, y una componente debida al cambio en las variables de control. La linealidad de la expresión siguiente puede no ser aplicable en muchos casos y se debe recurrir a un modelo específico del control que se desea utilizar: F = F0 + ∇ ∆ e F e M = M 0 + ∇ ∆e M e Las variables de control e incluyen cualquier tipo de control con el que pueda contar la aeronave. Es obvio que varios términos en los jacobinos anteriores serán cero por naturaleza: por ejemplo, la deflexión de una superficie de control no afecta, generalmente, la línea de acción de las unidades de potencia. Substituyendo estas expresiones en las ecuaciones de movimiento, es claro que existen más incógnitas que ecuaciones, por lo que normalmente, existirán diversas formas de compensar un mismo estado estacionario: mA [ [ e e ×]VCGe − ∇ ∆ e F ×]I e − ∇ ∆e M e e = F0 = M0 Esta sección debe presentar métodos para calcular las posiciones exactas que deben tener los controles para mantener los estados estacionarios deseados. Aquí vemos cómo los parámetros de la hélice deseada no nos llevan a calcular directamente las velocidades del estado estacionario, sino más bien, se deben calcular simultáneamente esas velocidades y los ajustes de los controles. También se debe considerar el caso en que las superficies de control constituyan una nueva variable de fase (mandos libres, ver Cook). Vuelo Estacionario Sustentación Pura. Guiñada. Cabeceo. Alabeo. Rotación General. Vuelo Rectilíneo Avance. Deriva. Ascenso. Planeo General. Barril. Torniquete. Barrena Plana. Vuelo Curvilíneo Recuperación. Viraje Coordinado. Péndulo. Rodeo Horizontal. Rompimiento. Rodeo Vertical. Hélice General. Puede apreciarse que la trayectoria es una hélice cuyo eje se encuentra inclinado. Este es el tipo de trayectoria más general que puede tener un cuerpo, en tres dimensiones, durante su movimiento en estado estacionario. Es evidente que el radio, el paso y la dirección del eje de la hélice son funciones de las velocidades que se escojan. Sería interesante, y de mucha utilidad, el poder calcular dichos parámetros, directamente a partir de las velocidades o, mejor aún, poder calcular las velocidades necesarias para obtener el movimiento deseado. Sin embargo, hasta el momento, esto no ha sido posible debido a las dificultades matemáticas encontradas. Capítulo 5 Estabilidad Ecuaciones del Movimiento Perturbado El estudio de estabilidad y control no es exclusivo del sector aeronáutico. En efecto, en gran parte de los sistemas desarrollados por el hombre, una de las preocupaciones esenciales es la de garantizar que el sistema en cuestión se mantenga funcionando “correctamente” durante los intervalos de tiempo necesarios para cumplir con éxito los objetivos planteados. Esto a originado el desarrollo de toda una rama de las matemáticas conocida con el nombre de “sistemas dinámicos”. El objetivo principal de esta ciencia es el de determinar cuál será el o los comportamientos que es posible observar en un sistema gobernado por un cierto conjunto de ecuaciones. La característica principal de estas ecuaciones es que relacionan una variable independiente unidimensional, generalmente interpretada como el tiempo, con una serie de parámetros y variables que describen al sistema. Si bien existen diversas clases de ecuaciones que pueden considerarse como sistemas dinámicos, nosotros nos ocuparemos principalmente de ecuaciones diferenciales ordinarias de primer orden. En efecto, como se ha podido observar en el tercer capítulo, esta es la clase de ecuaciones que describen el movimiento de una aeronave en el espacio. Para este análisis, como ya se ha mencionado, conviene utilizar el sistema dinámico del vehículo en función de los ángulos de Euler:   F − [ ×]VCG   VCG     mA    = I −1 (M − [ ×]I )  ′   k′ jA i  rCG    R ✁ R Rφ VCG   e   T   como se describió en el capítulo anterior, suponemos que se tiene una solución ′ , e e de este sistema tal que: VCGe , e , rCGe  VCGe   0     0   e =  ′  rCGe ′ (t )  rCGe      e e   e e (t )  ′ << 1, δe << 1 Deseamos saber ahora si pequeñas perturbaciones δVCG << 1, δ << 1, δrCG de este estado de referencia tenderán a amortiguarse o, al contrario, se amplificarán. Es decir, si la solución de las ecuaciones de evolución está dada por:  VCG   VCGe + δVCG (t )      e + δ (t )  =  ′ (t ) + δrCG ′ (t ) ′  rCGe  rCG      e   e e (t ) + δe (t )  Deseamos saber cual será el comportamiento de las pequeñas perturbaciones. Como se demostró en el capítulo uno, el comportamiento de dichas perturbaciones está gobernado por la matriz de estabilidad; ésta matriz se obtiene derivando el lado derecho del sistema dinámico con respecto a las variables de fase y evaluando en el estado de referencia, es decir, la matriz de estabilidad viene dada por: ∇[VCGe ,  m A−1F − [ ×]VCG    −1 I (M − [ ×]I )  ′ ,e e ] e ,rCGe  R ✂k ′R ✁j A R φi VCG    T   Puesto que se trata de derivadas parciales, podemos realizar la derivación con respecto a cada grupo de variables de manera independiente, separando por columnas los términos correspondientes, lo cual nos lleva a la siguiente forma hiper matricial: m A−1∇ VCGe F − ∇ VCGe ([  I −1∇ VCGe M   R ☎k′e R ✄jAe R φi e  0  e ×]VCG ) m A−1∇ ✆e F − ∇ ✆e ([ ×]VCGe ) m −A1∇rCGe m A−1∇ ee F ′ F I −1∇ ee M I −1 ∇ ✆e M − ∇ ✆e ([ ×]I ) I −1∇rCGe ′ M 0 0 ∇ ee R ☎k′R ✄jA R φi VCGe ( ) Te ( 0 ∇ ee (T e )       ) En esta hiper matriz de cuatro renglones por cuatro columnas cada componente es a su vez una matriz de tres renglones por tres columnas, esto nos lleva a la conclusión de que la matriz de estabilidad es una matriz de doce por doce. Para simplificar la notación, tomamos la convención, muy común en la mecánica de vuelo, de denotar las derivadas de las fuerzas y momentos mediante subíndices; la única diferencia es que, en nuestro caso, los subíndices serán vectoriales representando cada componente una columna en la matriz de estabilidad: = ∇rCGe FVCGe = ∇ VCGe F; F✝e = ∇✝e F; FrCGe Fe e = ∇e e F; ′ ′ F; = ∇rCGe M VCGe = ∇ VCGe M; M ✝e = ∇ ✝e M; M rCGe M e e = ∇e e M; ′ ′ M; Con lo que la matriz de estabilidad nos queda como: m A−1FVCGe − ∇ VCGe ([ e ×]VCG ) m A−1F✆e − ∇ ✆e ([ ×]VCGe ) m A−1FrCGe ′  −1 −1 −1 I M VCGe I M ✆e − ∇ ✆e ([ ×]I ) I M rCGe ′  jA k′ i  0 0 R ☎e R ✄e R φe  0 0 Te  ( ) m A−1Fe e I −1M e e ∇e e R ☎k ′ R ✄j A R φi VCGe ( ∇e e T       ) e Si dejamos de lado, por el momento, las derivadas de fuerzas y momentos para concentrarnos en las derivadas de los términos que contienen las variables de fase, la primer derivada en el primer renglón es muy fácil de calcular puesto que ∇ A A = U es la matriz identidad, es decir: ∇ VCGe ([ ×]VCG ) = [ e e ×]∇ VCGe VCG = [ e ×] por otro lado, la siguiente derivada en el mismo renglón se puede calcular mediante la anticonmutatividad del producto vectorial: ∇ e ([ ×]VCGe ) = −∇ e ([VCGe ×] ) = −[VCGe ×] Ahora bien, la derivada en el segundo renglón puede calcularse de la siguiente manera: ∇ e ([ ) = (∇ [ ×]I ) ×] I e ( como ya se mencionó, sabemos que ∇ e +[ ( ×]I ∇ e e ) ) = U , por lo que el segundo término nos e queda como [ e ×]I ; en el primer término el factor I e , una vez que se ha evaluado en el estado estacionario, puede volver a ponerse dentro de la derivada, ya que es una constante, por último, se utiliza nuevamente la anticonmutatividad del producto cruz: (∇ [ ×])I e e =∇ e ([ ×]I e ) = −∇ ([I e e ×] ) = −[I e ×] Por lo que, finalmente, la derivada que estamos buscando nos queda como: ∇ e ([ ×]I )= [ e ×]I − [I e ×] Ahora debemos ocuparnos de las derivadas que aparecen en las ecuaciones cinemáticas. La derivada que aparece en el tercer renglón puede calcularse como sigue: ( ) [( ∇e e R ✂k ′R ✁j A Rφi VCGe = R ✂k ′e R ✁j Ae R φi VCGe ) (R ✂ R ✁ R k′ φe e jA i φe VCGe ) (R✂ R ✁ R k′ θe jA e i φe ) VCGe ψ e ] puesto que las formas de Gibbs de las diferentes rotaciones sólo dependen de un ángulo. Evaluando entonces las derivadas que se indican obtenemos: ( ) [ ( ) ∇ e e R ✁k ′R j A R φi VCGe = R ✁k ′e R j Ae (R φi )φ VCGe , R ✁k ′e R j A e θe (R ) k′ ✁ R φi e VCGe , ψe R j Ae R φi e VCGe ] Tomemos como ejemplo la derivada que aparece en la primera columna: (R ) i φ φ e 0 0  0 0 1 0  ∂  i   = 0 cos(φ ) − sen (φ ) = 0 − sen (φe ) − cos(φe ) = R φe    ∂φ  0 sen (φ ) cos(φ ) φ 0 cos(φe ) − sen (φe ) e i en donde hemos introducido la notación R φe para las derivadas de las formas de Gibbs. De modo que la matriz buscada puede expresarse como: ( ) [ i k′ j ∇ e e R ✁k ′R j A R φi VCGe = R ✁k e′ R j Ae R φe VCGe , R ✁k e′ R θAe R φi e VCGe , Rψ e R j Ae R φi e VCGe ] Por otra parte, la derivada de la matriz T se calcula directamente, resultando:  0 cos(φe ) tan(θ e ) − sen (φe ) tan (θ e )  − sen (φe ) − cos(φe )  e ,  0   0 cos(φe )sec(θ e ) − sen (φe )sec(θ e ) ∇e e (T e ) =  cos(φe )sec 2 (θ e )  sen (φe )sec 2 (θ e )  0   0 cos(φe ) − sen (φe )    0 sen (φe )sen (θ e )sec 2 (θ e ) cos(φe )sen (θ e )sec 2 (θ e )       0    e , 0  0  Qe cos(φe ) tan (θ e ) − Re sen (φe ) tan (θ e ) 0 Qe sen (φe )sec 2 (θ e ) + Re cos(φe )sec 2 (θ e )   ∇ ee (T✂e ) =  − Qe sen (φe ) − Re cos(φe ) 0 Qe cos(φe ) − Re sen (φe ) Qe cos(φe )sec(θ e ) − Re sen (φe )sec (θ e ) Qe sen (φe )sec(θ e ) tan(θ e ) + Re cos(φe )sec(θ e ) tan(θ e ) 0   se han escrito explícitamente estas matrices para dejar claro al lector la forma en que deben calcularse. Sin embargo, dada su complejidad, se dejarán indicadas en los análisis subsiguientes y sólo se utilizará la forma explícita para estudiar casos particulares; por lo tanto, la matriz de estabilidad será la siguiente: m A−1FVCGe − [ e ×] m A−1F✆e + [VCGe ×]  I −1M VCGe I −1 M ✆e − [ e ×]I − [I e ×]   R ☎k ′ R ✄j A R φi 0 e e e  0 Te  ( ) m A−1FrCGe ′ −1 I M rCGe ′ 0 0 m A−1Fe e I −1M e e ∇e e R ☎k ′ R ✄j A R φi VCGe ( ∇e e T e       ) Hasta este punto hemos considerado que las fuerzas y los momentos dependen únicamente de las variables de fase, es decir de las velocidades VCG y . Sin embargo, el movimiento de la masa fluida que rodea al cuerpo es mucho más complejo que esto. De hecho, puesto que dicho movimiento es solución de un conjunto de ecuaciones diferenciales parciales, se debe considerar que las fuerzas y momentos aerodinámicos son funcionales complejas de estas variables y de todas sus derivadas con respecto al tiempo: FA = FA (VCGe , VCGe , VCGe , , , , , ) Evidentemente, no se tienen herramientas matemáticas para contemplar en el análisis todos los términos involucrados en esta forma funcional. Tradicionalmente se ha optado por considerar únicamente la dependencia de las aceleraciones lineales. Inicialmente debemos considerar las derivadas: ∇[VCGe ,  m A−1F − [ ×]VCG    −1 I (M − [ ×]I )  ′ ,e e ] e ,rCGe  R ✁k ′R j A R φi VCG    T   se considerará que las fuerzas y los momentos dependen de las aceleraciones lineales, por lo tanto, las últimas nueve columnas se agregan para respetar el tamaño de las matrices, según se estableció en el segundo capítulo, sin embargo, todas esas derivadas se harán iguales a cero. Finalmente, con estas consideraciones, se debe multiplicar la matriz de estabilidad por la forma de Leontief:   m A−1FVCGe   −1  I M VCGe U −  0     0  0 0 0 0 0 0 0 0 −1 U − m A−1FVCGe 0     −1 0   − I M VCGe =   0  0   0  0  0 0 0  U 0 0 0 U 0  0 0 U −1 Esta expresión puede simplificarse por el método de submatrices; muy utilizado para calcular la inversa de hiper matrices como esta. Se propone: U − m A−1FVCGe  −1  − I M VCGe  0  0  0   L11 L12  U 0 0  L 21 L 22 0 U 0  L 31 L 32  0 0 U  L 41 L 42 0 0 L13 L 23 L 33 L 43 L14  U 0 0 0  L 24   0 U 0 0  =  L 34   0 0 U 0     L 44   0 0 0 U de tal modo que, si se pueden calcular las dieciséis matrices Lij , la segunda hiper matriz del lado izquierdo será la inversa de la primera, es decir, será la matriz de Leontief del sistema. Ese cálculo es sencillo ya que, realizando el producto, se tienen dieciséis ecuaciones matriciales muy simples: ( ) (U − m  U − m A−1FVCGe L11  −1 − I M VCGe L11 + L 21  L 31  L 41  ) −1 A (U − m ) −1 A FVCGe L12 −1 − I M VCGe A 12 + L 22 L 32 FVCGe L13 −1 − I M VCGe L13 + L 23 L 33 L 42 L 43 (U − m ) −1 A FVCGe L14  U 0 0 0   − I M VCGe L14 + L 24   0 U 0 0  =  0 0 U 0 L 34    L 44   0 0 0 U −1 evidentemente, se tienen de inmediato los siguientes ocho valores: L 31 = 0, L 32 = 0, L 33 = U, L 34 = 0 L 41 = 0, L 42 = 0, L 44 = U L 43 = 0, por otro lado, las otras ocho ecuaciones matriciales son: (U − m −1 A VCGe −1 ) ( ) F L11 = U U − m A−1FVCGe L12 = 0 L 21 = I M VCGe L11 L 22 = U + I −1M VCGe L12 (U − m −1 A VCGe −1 ) (U − m F L13 = 0 L 23 = I M VCGe L13 −1 A VCGe −1 ) F L14 = 0 L 24 = I M VCGe L14 que tienen como solución simple: ( L11 = U − m A−1FVCGe ( −1 ) −1 ) −1 −1 A VCGe L 21 = I M VCGe U − m F L12 = 0 L13 = 0 L14 = 0 L 22 = U L 23 = 0 L 24 = 0 se comprueba fácilmente que se ha encontrado la inversa, siempre y cuando exista la inversa del término U − m A−1FVCGe , que es a su vez otra matriz de Leontief: ( U − m A−1FVCGe  −1  − I M VCGe  0  0  ) ( ) −1 0  U − m A−1FVCGe  0  I −1M V U − m A−1FV CGe CGe U 0  0  0 U  0 0 U 0 0 0 0 ( 0  U 0 0 0     U 0 0 0 U 0 0 = 0 U 0   0 0 U 0    0 0 U  0 0 0 U 0 ) −1 0 En conclusión, la ecuación de evolución de las perturbaciones para el vehículo puede escribirse en la siguiente forma: ( ) −1 U − m A−1FVCGe δVCG    δ   −1 −1  =  I M VCGe U − m A FVCGe  ′    δrCG 0    0  δe   ( ) −1 0 0 U 0 0 U 0 0 −1 m A−1F✁ e + [VCGe ×] 0  m A FVCGe − [ e ×]  −1 −1 I M VCGe I M ✁e − [ e ×]I − [I e ×] 0  k′ jA i  ✂  ✄ R R R 0 0 φe e e  0 T U   e ( ) m A−1FrCGe ′ −1 I M rCGe ′ 0 0  δVCG     δ  k ′ ✂j A i ′  ∇ e e (R ✄ R R φ VCGe )  δrCG   ∇e e T e δ e    m A−1Fee I −1M e e Derivadas de Estabilidad Las derivadas de estabilidad para fuerzas y momentos que debemos evaluar son: FVCGe ; F☎e ; FrCGe ′ ; Fee ; FVCGe M VCGe ; M ☎e ; M rCGe ′ ; M ee ; M VCGe considerando, grosso modo, que las fuerzas y los momentos consisten de siete componentes distintas, tenemos que evaluar 70 matrices para completar la forma explícita de las derivadas de estabilidad. Sin embargo, la gran mayoría de esos términos son nulos ya que no todas las fuerzas y momentos dependen de todas las variables de fase. Para aclarar dichas dependencias seguiremos aquí el orden en que aparecen en la matriz de estabilidad así como la división que se hizo de estas fuerzas en el tercer capítulo. Fuerzas gravitacionales Las fuerzas de gravitación no dependen de la velocidad con que se desplace o gire el cuerpo: Fg , VCGe = 0 Fg ,☎e = 0 tampoco dependen de las aceleraciones lineales: Fg ,VCGe = 0 Existen modelos precisos del comportamiento de la gravedad debido a la no esfericidad de la tierra. Igualmente, existen modelos precisos del comportamiento de la gravedad terrestre en función de la altitud (de hecho, la ley de la atracción gravitatoria de Newton) que pueden ser utilizados en algunos casos. Sin embargo, en la mayoría de los casos, los vehículos que evolucionan dentro de la atmósfera terrestre pueden usar el modelo en el que la aceleración de la gravedad es una constante, por lo tanto: Fg ,rCGe =0 ′ Finalmente, puesto que las ecuaciones de movimiento están en ejes cuerpo, las componentes de la gravedad en dichos ejes dependen de la actitud del vehículo. En el capítulo tres vimos que esa dependencia se podía expresar de la siguiente forma: Fg ,e e = m A (R T k ′)e e O bien, en función de los ángulos de Euler: ( ) Fg ,e e = m A R φiT R j AT k ′ e e en donde se ha realizado la primera multiplicación; por lo tanto, las derivadas de estabilidad se expresan como: [( Fg ,e e = m A R φiT R j AeT ) φe k′ (R iT φe R j AT ) θe (R k′ iT φe R j AeT ) ψe ] k′ puesto que las formas de Gibbs de las diferentes rotaciones sólo dependen de un ángulo: [ iT j T Fg ,ee = m A R φe R j AeT k ′ R φiTe RθAe k ′ 0 ] Fuerzas y Momentos motrices Las fuerzas motrices son, en última instancia, una clase especial de fuerzas aerodinámicas ya que el empuje se obtiene interaccionando con el medio que rodea al vehículo. Por lo tanto, estas fuerzas dependen fuertemente de la velocidad y de las aceleraciones del vehículo. También dependen de la velocidad angular pero, en general, esta dependencia es menos notoria. Las fuerzas motrices no dependen de la posición del vehículo. Por último, puesto que estas fuerzas han sido escritas en ejes cuerpo, no dependen de la actitud instantánea, por lo tanto: FTrCGe = 0 ; FTe e = 0 ′ M TrCGe = 0 ; M Te e = 0 ′ Las otras derivadas de estabilidad de estas fuerzas van a depender de las características específicas de la planta motriz. Tradicionalmente se ha considerado que sólo la magnitud de la fuerza motriz varía con las velocidades y las aceleraciones. Sin embargo, hoy en día, con las nuevas tecnologías de los motores vectoriales o bien de los rotores basculantes es posible que tanto el vector dirección como el vector posición de las plantas motrices puedan contribuir a las derivadas de estabilidad, por lo tanto escribiremos: n n i =1 i =1 FTVCGe = ∑ e iTiVCGe + ∑ Ti e iVCGe ; n n FT n n i =1 i =1 = ∑ e iTi e + ∑ Ti e i e [ ] e n M TVCGe = ∑ TiVCGe [t i ×]e i + ∑ Ti t iVCGe × e i + ∑ Ti [t i ×]e iVCGe ; i =1 MT i =1 n n e = ∑ Ti i =1 e [t i ×]ei + ∑ Ti [t i i =1 e ] i =1 n × e i + ∑ Ti [t i ×]e i i =1 e por lo tanto, para una aeronave con una planta motriz específica, se deben definir las seis matrices siguientes: TiVCGe ; Ti e ; e iVCGe ; e i e ; t iVCGe ; t i e evidentemente, las primeras dos son matrices renglón de tres columnas mientras que las siguientes cuatro son matrices de tres renglones por tres columnas. Fuerzas y Momentos Aerodinámicos Las fuerzas aerodinámicas adimensionales se escriben como: FA = R πj −α (CD iV + CY jV + C L kV ) M A = R πj −α (bCl iV + cCm jV + bCn k V ) Comenzaremos por decir que estas fuerzas y momentos no dependen ni de la posición del centro de gravedad ni de la actitud de los ejes cuerpo con respecto a los ejes tierra. Es decir que podemos escribir: FArCGe = 0; ′ FAe e = 0 M ArCGe = 0; ′ M Ae e = 0 Ahora bien, como se discutió en el planteamiento de las ecuaciones de movimiento del vehículo, estas fuerzas no dependen explícitamente de las variables de fase, sino a través de los ángulos aerodinámicos, el número de Reynolds y con la hipótesis de flujo casi estacionario, de las aceleraciones. Recordemos las expresiones de cada uno de estos argumentos. Primero, para los ángulos tenemos: tan (α ) = V W ; tan (β ) = − V ; VCGV = R πjT−α VCG ; U UV Hemos agregado las componentes del viento relativo en ejes viento ya que nos serán de utilidad para evaluar las derivadas con respecto al ángulo de derrape. Debemos expresar también el número de Reynolds en variables adimensionales. Es decir, en variables dimensionales dicho número se escribe: Re = U 2 +W 2c ν por lo tanto, introduciendo las variables adimensionales, usando por el momento nuevamente la tilde para distinguirlas, podemos escribir: Re = U~ 2 g S + W~ 2 g S c~ S ν = g S S ν U~ 2 + W~ 2 c~ = Re S U~ 2 + W~ 2 c~ en donde hemos definido un Reynolds basado en los valores característicos del sistema: Re S = g S S ν en lo sucesivo dejaremos de escribir la tilde nuevamente. El número de Reynolds Re S representa un valor de referencia para manejar las cantidades adimensionales. Entonces, las derivadas con respecto a las variables de fase de una función cualquiera f de los ángulos aerodinámicos, del número de Reynolds y de las aceleraciones podrán calcularse mediante las siguientes fórmulas: ∂f ∂f ∂f ∇ VCGe α + ∇ VCGe β + ∇ V Re ∂α ∂β ∂ Re CGe ∂f ∂f ∂f ∇ e f (α , β , Re, VCG ) = ∇ eα + ∇ eβ + ∇ Re ∂α ∂β ∂ Re e ∇ VCGe f (α , β , Re, VCG ) = ∇ VCGe f ∇ VCGe f (α , β , Re, VCG ) = Por lo tanto, podemos decir que las derivadas de estabilidad que buscamos se pueden expresar como: FAVCGe M AVCGe  C D  ∂ ∂  j   T α C R ∇ + = π α Y V −   CGe ∂β ∂α    C L    bCl  ∂  j    ∇T α + ∂ = R cC − π α m   VCGe ∂α  ∂β   bCn  FA e   C D  C D   ∂  j   T  j   T R π −α  CY  ∇ VCGe β + ∂ Re R π −α CY ∇ VCGe Re    C L   CL      bCl   bCl   ∂  j   j   T   T R π −α cC m ∇ VCGe β + ∂ Re R π −α cCm  ∇ VCGe Re    bCn   bCn    C D    j   = ∇ e R π −α CY  ;     C L   FAVCGe = ∇ T VCGe  C D    j   R π −α  CY     CL     bCl   j   M A✁e = ∇✁e R π −α cCm      bCn  M AVCGe = ∇ T VCGe   bCl    j   R π −α cCm     bCn   las derivadas de los productos se calculan como: FAVCGe C Dβ  C De  C Dα  C D Re    T T T j j j     = R π −α e CYe ∇ VCGe α + R π −α e CYα ∇ VCGe α + R π −α e  CYβ ∇ VCGe β + R π −α e  CY Re ∇TVCGe Re        C Lβ   C Le   C Lα   C L Re  j M AVCGe  bClβ   bCle   bClα   bCl Re    T j j j T T     = R π −α e cC me ∇ VCGe α + R π −α e cC mα ∇ VCGe α + R π −α e cC mβ ∇ VCGe β + R π −α e cC m Re ∇ TVCGe Re        bC nβ   bC ne   bC nα   bC n Re  j CYq C Lq C Dr   CYr  ; C Lr   bClp  M A✁e = R πj −αe cCmp  bCnp bClq cCmq bCnq bClr   cCmr  bCnr  C Dv CYv C Lv CDw  CYw   CLw   bClu = R πj −α e cCmu   bCnu bClv cCmv bCnv bClw  cCmw   bCnw  CDp  j FA✁e = R π −α e  CYp  CLp CDq CDu = R πj −α e  CYu   C Lu FAVCGe M AVCGe Ahora bien, los gradientes ∇TVCGe α , ∇TVCGe β y ∇TVCGe Re pueden evaluarse de las definiciones de los ángulos aerodinámicos y del número de Reynolds. Así, para el ángulo de ataque tenemos: ∇ VCGe tan (α ) = ∇ VCGe W U  We  − U 2  e d tan (α )   ∇ VCGe α =  0  dα α e  1   U e   We  − U 2  e   sec 2 (α e )∇ VCGe α =  0  1    U e  Por lo que resulta:   We 2  − U 2 cos (α e ) e   0 ∇ VCGe α =   2  cos (α e )    Ue en el caso del ángulo de derrape debemos calcular primero la matriz: ( ∇ VCGe VCGV = ∇ VCGe R πjT−α VCG ) resultando: ( ) ∇ VCGe VCGV = R π −α e VCGe ∇TVCGe α + R πjT−α e jT es decir: ∇ VCGe VCGV   We We2 W 2 sen cos cos cos 3 (α e ) 0 − sen (α e ) + e cos 3 (α e ) − sen (α e ) cos 2 (α e ) α α α − + − ( ) ( ) ( ) e e e  2 Ue Ue Ue   0 1 0 =  2  sen (α ) + We cos 3 (α ) + We sen (α ) cos 2 (α ) 0 − cos(α ) − cos 3 (α ) − We sen (α )cos 2 (α ) e e e e e e e e   Ue U e2 Ue   entonces, el gradiente de beta es: ∇ VCGe tan (β ) = −∇ VCGe VV UV ( ) V sec 2 (β e )∇ VCGe β = − ∇ VCGe VCGV ∇ VCGVe  V  UV    de donde obtenemos:   We We2 We 2 3 3 2  − cos(α e ) + U sen (α e )cos (α e ) − U 2 cos (α e ) 0 − sen (α e ) + U cos (α e ) − sen (α e )cos (α e )  − VVe UVe2  e e e    ∇ VCGe β = − cos2 (β e ) 0 1 0   − 1 UVe  2 W W W  sen (α ) + e cos3 (α ) + e sen (α )cos2 (α ) 0 − cos(α ) − cos3 (α ) − e sen (α )cos2 (α )   0  e e e e e e e e   Ue Ue U e2   la velocidad del estado estacionario en ejes viento es: VCGVe − U e cos(α e ) − We sen (α e )  = Ve    U e sen (α e ) − We cos(α e )  por lo que finalmente tenemos:   We We2 We 2 3 3 2  − cos(α e ) + U sen (α e ) cos (α e ) − U 2 cos (α e ) 0 − sen (α e ) + U cos (α e ) − sen (α e ) cos (α e )  − Ve (U e cos(α e ) + We sen (α e ))2  e e e    2 ∇ VCGe β = − cos (β e ) 0 1 0   1 (U e cos(α e ) + We sen (α e ))  2 W W W 3 2 3 2  sen (α ) + e cos (α ) + e sen (α ) cos (α ) 0 − cos(α ) − cos (α ) − e sen (α ) cos (α )   0 e e e e e e e e    Ue U e2 Ue   En el caso del número de Reynolds tenemos: ( ∇ VCGe Re = ∇ VCGe Re S ∇ VCGe U 2 +W 2c ) Ue    U 2 +W 2  e e   Re = Re S c  0  We    U 2 +W 2  e e   Matriz de Leontief para las Aceleraciones ( ) −1 Recordemos que la matriz de Leontief L = U − m A−1FVCGe aparece en la ecuación de las perturbaciones cuando consideramos que el operador de evolución del sistema dinámico depende en forma no trivial de la razón de cambio de las variables de fase con respecto al tiempo. En el caso de la dinámica del vehículo esta situación se presenta debido a que el movimiento del fluido resulta ser una funcional compleja del movimiento del propio vehículo (condiciones de frontera variables). La hipótesis de quasiestacionaridad en el movimiento del fluido nos permite considerar que las fuerzas aerodinámicas son función de las aceleraciones del centro de gravedad, además de la velocidad y la velocidad angular de los ejes cuerpo.  CDu  −1 j L = U − m A R π −α e  CYu    CLu  − cos α e  L = U − m A−1  0    senα e   − C Du cos α e + C Lu senα e  −1  CYu L = U − m A    C Du senα e − C Lu cos α e 1 + m A−1C Du cos α e − m A−1C Lu senα e  L= m A−1CYu −1  m A C Du senα e − m A−1C Lu cos α e  C Dv CYv CLv CDw    CYw    CLw   0 senα e  CDu 1 0   CYu  0 − cos α e   CLu − m A−1C Dv cos α e + m A−1C Lv senα e 1 − m1ACYv m C Dv senα e − m A−1C Lv cos α e −1 A CDv CYv CLv C Dw    CYw    CLw   −1 − C Dw cos α e + C Lw senα e    CYw  C Dw senα e − C Lw cosα e   −1 − m A−1C Dw cos α e + m A−1C Lw senα e   m1ACYw  1 − m A−1C Dw senα e + m A−1C Lw cos α e  −1 − C Dv cos α e + C Lv senα e CYv C Dv senα e − C Lv cosα e −1 Esta matriz deberá ser calculada y multiplicada por la matriz M AVCGe para ensamblar la hipermatriz de Leontief que deberá, a su vez, ser multiplicada por la matriz de derivadas de estabilidad. Inversa del Tensor de Inercia Puesto que en las ecuaciones que escribiremos en los próximos capítulos deberemos utilizar componentes, es conveniente expresar desde este momento la inversa del tensor de inercia en elementos simples que puedan ser substituidos en las ecuaciones escalares. Entonces, este tensor se puede escribir como:  I xx  −1 I =  I xy  I xz I xy I yy I yz −1  Dxx I xz  1  I yz  =  Dxy D  Dxz I zz  Dxz   D yz  Dzz  Dxy D yy D yz en donde D es el determinante del tensor de inercia: D = I xx I yy I zz − I xx I yz2 − I yy I xz2 − I zz I xy2 + 2 I xy I xz I yz y los Dij son los cofactores del mismo:  Dxx   Dxy  Dxz Dxy D yy D yz Dxz   I yy I zz − I yz2   D yz  =  I xz I yz − I xy I zz Dzz   I xy I yz − I xz I yy I xz I yz − I xy I zz I xy I yz − I xz I yy   I xy I xz − I yz I xx  I xx I yy − I xy2  I xx I zz − I xz2 I xy I xz − I yz I xx Vuelo Estacionario Las ecuaciones de evolución de las perturbaciones para VCGe = 0 son: δVCG = m A−1FV δVCG − [ CGe e ×]δVCG + m A−1F✁ e δ + m A−1Fe e δe δ = I −1M V δVCG + I −1 (M✁ − [ CGe e e ×]I − [I e ) ×] δ ′ = R ✄k ′ R ✂j R φi δVCG δrCG A e e e δe = Teδ☎ + ∇ e T☎ eδe e Vuelo Rectilíneo Las ecuaciones de evolución de las perturbaciones para e = 0 son: δVCG = (U − m A−1FV CGe ) [m −1 −1 A VCGe F ′ + m A−1Fe δe ] δVCG + (m A−1F + [VCGe ×])δ + m A−1Fr′ δrCG e CGe e ′ + I − 1M e δ e δ = I −1M V δVCG + I −1M ✁ δ + I −1M r′ δrCG ( CGe e + I −1M VCGe U − m A−1FVCGe ) [m −1 CGe −1 A VCGe F e ′ + m A−1Fe δe ] δVCG + (m A−1F✁ + [VCGe ×])δ + m A−1Fr′ δrCG e CGe e ′ = R ✄k ′ R ✂j R φi δVCG + ∇ e (R ✄k ′ R ✂j R φi VCGe )δe δrCG A e e A e e δe = Teδ El caso en que el vehículo tiene el plano X − Z de los ejes cuerpo como un plano de simetría es lo bastante común como para escribir las expresiones correspondientes a la inversa del tensor de inercia explícitamente. En efecto, en ese caso tenemos que I xy = I yz = 0 por lo que el determinante se simplifica como: DS XZ = I yy (I xx I zz − I xz2 ) = I yy D yy por lo tanto, la inversa se puede escribir como: I S−1XZ  I zz   D yy  = 0   − I xz  D yy 0 1 I yy 0 I xz   D yy   0   I xx  D yy  − además, se hacen las siguientes hipótesis: Ve = 0;We = 0 ; φe = 0;ψ e = 0 ; α e = 0; β e = 0 C Dβ = C Dp = C Dr = 0 CY Re = CYe = CYα = CYq = 0 C Lβ = C Lp = C Lr = 0 Cl Re = Cle = Clα = Clq = 0 Cmβ = Cmp = Cmr = 0 Cn Re = Cne = Cnα = Cnq = 0 CDu = CDv = CDw = 0 CYu = CYv = CYw = 0 CLu = CLv = 0 Clu = Clv = Clw = 0 Cmu = Cmv = 0 Cnu = Cnv = Cnw = 0 Las derivadas de estabilidad en las ecuaciones cinemáticas son: ( k′ ✁ ∇ e e R R R φ VCGe jA i ) 0 − U e sen (θ e ) U e sen ( = 0 U e cos( 0  0 0 − U e cos(θ e ) )  e ) e  y:  cos( e ) 0 sen ( R e R e R φe =  0 1 0   − sen ( e ) 0 cos( k′ ✁ jA i e ) 1 0 tan (θ e ) Te = 0 1 0    0 0 sec(θ e ) ;  ) e   En el caso de las fuerzas gravitacionales tendremos: Fg ,e e 0  = m A − cos(   0 e ) − cos(θ e ) 0 0 0  − sen (θ e ) 0 La matriz de rotación entre ejes viento y ejes cuerpo, así como su derivada resultan: j′ R π −α e − 1 0 0  =  0 1 0 ;    0 0 − 1 j′ R π −α e  0 0 1 =  0 0 0    − 1 0 0 las derivadas de los ángulos aerodinámicos y del número de Reynolds son: ∇ VCGe 1  Re = Re S c 0 ;   0   0 ∇ VCGe α =  0  ; 1   U e  0 1 ∇ VCGe β = −   U e   0  por lo tanto, las derivadas de estabilidad de fuerzas y momentos son:  − CD Re   CLe − CDα   0  T T     0 ∇ Re+ 0 ∇ α + CYβ ∇TVCGe β FAVCGe =   VCGe   VCGe    − CL Re  − CDe − CLα   0   − bClβ   0   0    T T     M AVCGe = cCm Re ∇ VCGe Re+ cCmα ∇ VCGe α +  0 ∇TVCGe β     − bCnβ   0   0  − C Dq  0  FA✁e = CYp  0 0 − CLq FAVCGe 0   CYr  ; 0  0  0 0 = 0 0 0    0 0 − CLw   − bClp  M A✁e =  0  − bCnp M AVCGe 0 cCmq 0 − bClr   0  − bCnr  0  0 0 = 0 0 cCmw    0  0 0 es decir, finalmente: FAVCGe   − Re S cC D Re  0 =    − Re S cC L Re  0 −  0  FA✁e = CYp  0 FAVCGe CYβ Ue 0 − C Dq 0 − CLq CLe − CDα   Ue  ; 0  C + CLα  − De  Ue  0   CYr  ; 0  0  0 0 = 0 0 0    0 0 − C Lw   bClβ 0  Ue  M AVCGe =  Re S c 2Cm Re 0   bCnβ  0 Ue   − bClp 0 − bClr    cCmq 0  M A✁e =  0  − bCnp 0 − bCnr  M AVCGe  0   cCmα  Ue   0   0  0 0 = 0 0 cCmw    0  0 0 sustituyendo todas estas expresiones y realizando las operaciones es relativamente sencillo verificar que las doce ecuaciones de las perturbaciones son (se omitió la matriz de Leontief, realizar, en documento aparte, el cálculo con la matriz de Leontief. Si hay buenos resultados, sustituir el presente. También falta una revisión integral de todo este cálculo): C   Re S cC D Re C − C Dα w − Dq q − θ cos(θ e )  u + Le  − m AU e mA mA u   C C − C m U Y Yp β v =   Yr A e − r − φ cos( e ) v+ p+     mA m AU e mA  w   C − m AU e  − Re S cC L Re u − C De + C Lα w − Lq q − θsen (θ e ) mA m AU e mA    b(I zz Clβ − I xz C nβ ) b(I xz C np − I zz Clp ) b(I xz C nr − I zz Clr )  r p+ v+  D D D U yy e yy yy   p  cC mq  cC mα Re S c 2C m Re q =  q w+ u+     I yy I yyU e I yy   r   b(I xz Clp − I xx Cnp ) b(I xz Clr − I xx C nr )   b(I xx Cnβ − I xz Clβ ) r p+ v+  D yy D yy D yyU e   ✁ ′  u cos( e ) + (w + ψU e − θU e )sen (θ e )  xCG ✁  y′  =   v + ψU e cos( e ) CG     ✁ ′   − usen ( e ) + (w − θU e ) cos(θ e )   zCG  φ   p + r tan (θ e ) θ  =   q     ψ   r sec(θ e )  Finalmente, se hacen las siguientes aproximaciones: α ≈ tan α ≈ w ; Ue β ≈ tan β ≈ − v Ue por lo tanto, las ecuaciones de evolución de las perturbaciones quedan como: u=− C Re S cC D Re C − C Dα α − Dq q − θ cos(θ e ) u + Le mA mA mA β =− CYβ C C − m AU e φ β − Yp p − Yr r+ cos(✂e m AU e m AU e m AU e Ue α =− p=− ) C − m AU e C + C Lα Re S cC L Re θ u − De q− sen (θ e ) α − Lq m AU e m AU e m AU e Ue b(I zz Clβ − I xz C nβ ) D yy β+ b(I xz Cnp − I zz Clp ) D yy p+ b(I xz C nr − I zz Clr ) r D yy q= r=− cC Re S c 2Cm Re cC u + mα α + mq q I yy I yy I yy b(I xx Cnβ − I xz Clβ ) D yy β+ ′ = u cos( xCG b(I xz Clp − I xx C np ) D yy e p+ b(I xz Clr − I xx Cnr ) r D yy ) + U e (α +ψ − θ )sen (θ e ) ′ = U e (ψ cos( yCG ′ = −usen ( zCG e e )− β ) ) + U e (α − θ ) cos(θ e ) φ = p + r tan(θ e ) θ =q ψ = r sec(θ e ) La posición del centro de gravedad está desacoplada, es decir, las variables xCG ′ , yCG ′ y ′ no aparecen en ninguna de las nueve ecuaciones restantes. Por lo tanto, podemos zCG resolver esas nueve ecuaciones y, posteriormente, calcular la posición del centro de gravedad. Por esta razón, dejaremos de lado esas tres ecuaciones en los análisis siguientes. Por su parte, las nueve ecuaciones restantes se desacoplan en dos subsistemas de cuatro y cinco ecuaciones respectivamente. El primero se llama sistema longitudinal y el segundo sistema lateral – direccional. En efecto, observamos que las variables u , α , q y θ del primer sistema son variables que tienen que ver con el movimiento de la aeronave sobre su plano X − Z , como si este plano permaneciera fijo; mientras que las variables β , p , r , φ y ψ del segundo sistema tienen que ver con movimientos que alteran la posición del plano X − Z de la aeronave. En los parágrafos siguientes analizaremos estos sistemas por separado. Matriz de estabilidad longitudinal: El primer subsistema desacoplado es: C C − C Dα Re S cC D Re u + Le α − Dq q − θ cos(θ e ) mA mA mA C − m AU e C + C Lα Re cC θ q− sen (θ e ) α = − S L Re u − De α − Lq m AU e m AU e m AU e Ue u=− q= cC cC Re S c 2Cm Re u + mα α + mq q I yy I yy I yy θ =q Los valores propios de este sistema pueden determinarse numéricamente. Generalmente, estos valores son dos números complejos con sus respectivos conjugados, dando un total de cuatro raíces para el polinomio característico. Los conjugados representan modos de movimiento desfasados 180° de los dos modos principales. Estos últimos constituyen dos movimientos oscilatorios caracterizados de la siguiente forma: a) Modo de Periodo Corto: es un movimiento de alta frecuencia, con un alto factor de amortiguamiento. Se caracteriza por realizarse a velocidad casi constante, es decir u ≈ 0 . Está constituido por una oscilación simultánea del ángulo de ataque y del ángulo de cabeceo. b) Modo Fugoide o Delfineo: es un movimiento de baja frecuencia con un bajo factor de amortiguamiento. Se caracteriza por realizarse con un ángulo de ataque prácticamente constante, es decir α ≈ 0 . Está constituido por una oscilación simultánea de la velocidad longitudinal y del ángulo de cabeceo. La frecuencia y el factor de amortiguamiento de estos movimientos pueden aproximarse mediante ciertas hipótesis con polinomios de segundo grado. En las secciones siguientes presentamos dichas aproximaciones. La primera hipótesis que se realiza para todas las aproximaciones por igual es la de la condición de vuelo recto y nivelado, por lo tanto: θe = 0 Aproximación del periodo corto: Este modo se desarrolla a velocidad de avance prácticamente constante por lo que se supone: u=0 y se deja de lado la ecuación de la perturbación de velocidad longitudinal. La perturbación de cabeceo queda sujeta a la perturbación de velocidad angular y, por lo tanto, el sistema se simplifica a sólo dos ecuaciones: α =− C − m AU e C De + C Lα α − Lq q m AU e m AU e cC cC q = mα α + mq q I yy I yy los valores propios de este sistema pueden calcularse mediante un sencillo determinante: − C De + C Lα −λ m AU e cCmα I yy − CLq − m AU e m AU e =0 cCmq −λ I yy por lo tanto, la ecuación característica será de segundo grado:  C De + C Lα λ2pc +   m AU e − cCmq  c λ pc + [Cmα (CLq − m AU e ) − Cmq (CDe + CLα )] = 0 I yy  I yy m AU e La solución de esta ecuación nos da fórmulas sencillas para aproximar el factor de amortiguamiento y la frecuencia de la oscilación de periodo corto. Aproximación del Fugoide: El modo fugoide se realiza con ángulo de ataque prácticamente constante: α =0 sin embargo, en este caso, dejamos de lado la ecuación de la velocidad angular de cabeceo y trabajamos con la ecuación del ángulo de ataque, convertida en ecuación para el ángulo de cabeceo mediante θ = q : u=− C Re S cC D Re u − Dq θ − θ mA mA Re S cC L Re θ =− u C Lq − m AU e sustituyendo la segunda en la primera:  C m U + C Dq C L Re − C D Re C Lq  u − θ u = Re S c D Re A e   m A (C Lq − m AU e )   Re S cC L Re θ =− u C Lq − m AU e los valores propios de este sistema se evalúan mediante un sencillo determinante: Re S c (C D Re m AU e + C DqC L Re − C D ReC Lq ) −λ m A (C Lq − m AU e ) Re S cC L Re − C Lq − m AU e −1 −λ =0 por lo tanto, la ecuación característica es: λ2f − Re S c (CD Re m AU e + C DqC L Re − C D ReC Lq ) Re S cC L Re λf − =0 m A (C Lq − m AU e ) C Lq − m AU e la cual nos da una aproximación al factor de amortiguamiento y a la frecuencia de la oscilación fugoide. Matriz de Estabilidad Lateral - Direccional: El segundo sistema desacoplado es: β =− p=− r=− CYβ C C − m AU e φ β − Yp p − Yr r+ cos(✂e m AU e m AU e m AU e Ue b(I zz Clβ − I xz C nβ ) D yy b(I xx Cnβ − I xz Clβ ) D yy β− β− b(I zz Clp − I xz C np ) D yy b(I xx Cnp − I xz Clp ) D yy φ = p + r tan(θ e ) ψ = r sec(θ e ) p− p− ) b(I zz Clr − I xz Cnr ) r D yy b(I xx C nr − I xz Clr ) r D yy Puesto que el ángulo de guiñada no interviene en ninguna de las cuatro primeras ecuaciones, el sistema puede considerarse solamente de tamaño cuatro por cuatro. Los valores propios de este sistema pueden determinarse numéricamente. Estos, son dos números reales y un complejo con su conjugado, dando un total de cuatro raíces para el polinomio característico. Los modos de movimiento correspondientes a cada raíz se caracterizan de la siguiente forma: a) Modo de la Espiral: es un movimiento de divergencia lateral de la trayectoria (ángulo de guiñada) con un alto factor de amortiguamiento. Se caracteriza por realizarse sin alabeos, es decir φ ≈ 0 . b) Modo del Barril: es un movimiento de divergencia del ángulo de alabeo con un alto factor de amortiguamiento. Se caracteriza por realizarse con un ángulo de derrape prácticamente constante, es decir β ≈ 0 . c) Modo del Balanceo Holandés: es un movimiento de baja frecuencia, con un bajo factor de amortiguamiento. Se caracteriza por realizarse con ángulo de alabeo prácticamente constante, es decir φ ≈ 0 . Está constituido por una oscilación simultánea del ángulo de derrape y del ángulo de guiñada dando como resultado una desviación lateral de la trayectoria de vuelo. La frecuencia y el factor de amortiguamiento de estos movimientos pueden aproximarse mediante ciertas hipótesis con polinomios de segundo grado. En este caso también, para lograr las aproximaciones se fija la condición de vuelo recto y nivelado: θ e = 0 . Aproximación de la Espiral: El modo espiral se desarrolla con ángulo de alabeo prácticamente constante: φ =0 la cuarta ecuación implica p = 0 , por lo tanto, el sistema se reduce a tres ecuaciones: β =− 0=− r=− CYβ C − m AU e β − Yr r m AU e m AU e b(I zz Clβ − I xz C nβ ) D yy b(I xx C nβ − I xz Clβ ) D yy β− β− b(I zz Clr − I xz C nr ) r D yy b(I xx Cnr − I xz Clr ) r D yy la segunda ecuación es algebraica y podemos despejar de ella el ángulo de derrape, resultando: β =− (I zzClr − I xz Cnr ) r (I zz Clβ − I xz C nβ ) por lo que en esta aproximación nos quedan dos ecuaciones diferenciales: β= CYβ (I zz Clr − I xz Cnr ) − (CYr − m AU e )(I zz Clβ − I xz Cnβ ) r m AU e (I zz Clβ − I xz Cnβ ) r= b(Cnβ Clr − Clβ Cnr ) (I zz Clβ − I xz Cnβ ) r sin embargo, vemos que la ecuación del derrape depende de la velocidad angular de guiñada, mientras que ésta puede encontrarse únicamente con la segunda ecuación. De este modo reducimos el sistema a una sola ecuación cuyo coeficiente de amortiguamiento será: λe = b(Cnβ Clr − Clβ Cnr ) (I zzClβ − I xzCnβ ) Aproximación del Barril: Este modo, al contrario del anterior, se realiza con ángulos de guiñada y de derrape prácticamente constantes: β = 0;ψ = 0 la quinta ecuación implica r = 0 por lo tanto quedan sólo dos ecuaciones diferenciales: p=− b(I zz Clp − I xz Cnp ) D yy p φ=p sin embargo, vemos que el alabeo depende de la velocidad de alabeo, pero no a la inversa. Por lo tanto, el coeficiente de amortiguamiento para este modo de movimiento será: λb = b(I xz Cnp − I zz Clp ) D yy Aproximación del Balanceo Holandés: El balanceo holandés se desarrolla con un ángulo de alabeo prácticamente constante: φ =0 por lo tanto, al igual que en la espiral, el sistema se reduce a tres ecuaciones, sin embargo, ahora, dejaremos de lado la segunda ecuación y consideramos que la velocidad de guiñada es independiente del derrape: β =− CYβ C − m AU e β − Yr r m AU e m AU e r=− b(I xx C nβ − I xz Clβ ) D yy β− b(I xx Cnr − I xz Clr ) r D yy entonces, los valores propios del sistema pueden encontrarse mediante el determinante: CYβ C − m AU e −λ − Yr m AU e m AU e =0 b(I xx Cnβ − I xz Clβ ) b(I xx Cnr − I xz Clr ) − − −λ D yy D yy − cuya ecuación característica es:  CYβ b(I xx Cnr − I xz Clr )  λ +  bh D yy   m AU e 2 λbh +  + b (m AU e (I xxCnβ − I xzClβ ) + CYβ (I xxCnr − I xzClr ) − CYr (I xxCnβ − I xzClβ )) = 0 D yy m AU e Ejemplos de Cálculo de Modos de Movimiento: Los siguientes ejemplos se desarrollaron a partir del libro Flight Dynamics and Automatic Controls Part I escrito por Jan Roskam. Se presentan para que el estudiante pueda hacer ejercicios y comparar sus resultados. En cada ejemplo se calculan los valores propios de las matrices longitudinal y lateral direccional. En donde es apropiado, se comparan los valores obtenidos mediante las aproximaciones. Finalmente, se calcula la frecuencia no amortiguada y el coeficiente de amortiguamiento. Para simplificar la notación en los ejemplos, introducimos la siguiente notación: f AVCGe m AVCGe C D Re C Dβ  =  CY Re CYβ  C L Re C Lβ  Cl Re Clβ  = Cm Re Cmβ  Cn Re Cnβ C Dα   CYα  ; C Lα  Clα   C mα  ; Cnα  Aviación General Monomotor (Cessna 182) Datos Geométricos y Másicos C Dp C Dq C Dr    f A✁e =  CYp CYq CYr   CLp C Lq C Lr   Clp Clq Clr    m A✁e = Cmp Cmq Cmr   Cnp Cnq Cnr  Nombre Variable Superficie Alar S Cuerda Media Envergadura Peso c b mA g Tensor de Inercia Unidades Valor 174.0 2 ft ft ft lb 4.9 36.0 2650.0 slug ⋅ ft 2 I 0 0  948  0 1346 0    0 1967  0 Estado de Referencia Nombre Altitud Variable (− )Z CG Unidades ft Velocidad Ue ft s deg Ángulo de α e Ataque Fuerzas C De  Aerodinámicas   C  Ye   C Le  Avance Despegue 0 133.5 5.4 - 0.057  0    0.719 Derivadas de Estabilidad 0 0.38 2.7748e-008  0 0.404 0  ; f AVCGe =   0 4.41  3.5001e-007 0  0 0.0895  0 - 0.65 ; m A m AVCGe = 0   0  0 - 0.0907 e 0 0 0    f A e = 0.030533 0 9.2629   0 0.11178 0   0 - 0.039356  0.10255   = 0 - 0.43566 0   0 0.025248  0.013666 En las siguientes tablas se presentan los resultados del análisis de estabilidad: Nombre Presión Dinámica No. de Reynolds Característico Carga Alar Envergadura Adimensional Cuerda Adimensional Velocidad de Avance Adimensional Variable Pd Re S ~A m b~ c~ U~ e Unidades N m - 2 Valor 21.180764 1.706731e+006 0.719043 2.729153 0.371468 6.480245 Tensor de Inercia Adimensional I~ - Cofactor Inercial Adimensional ~ D yy - Variable Unidades Nombre  λ1,2  λ   3, 4  ωn1, 2  ω   n 3, 4  ζ 1, 2  ζ   3, 4  s −1 λ pc - →→ Frecuencia Natural ωnpc →→ Razón de Amortiguamiento ζ pc s −1 - → Aproximación del Fugoide λf - →→ Frecuencia Natural ωnf →→ Razón de Amortiguamiento ζf s −1 - Variable Unidades Valores propios Longitudinales → Frecuencia Natural → Razón de Amortiguamiento → Aproximación del Periodo Corto Nombre - - 0 0  0.047563   0 0.067532 0    0 0 0.098689 0.004694 Valor − 1.681423 ± 1.725962i   -0.008333 ± 0.171047i     3.7632  0.1713   0.0487  0.6978    -1.677524 ± 1.724204i 3.757 0.69734 − 0.012233 ± 0.220555i 0.34498 0.055379 Valor − 5.823960     0.017939   − 0.431562 ± 1.698177i  2.7365 Valores propios Laterales y Direccionales  λ1     λ2  λ3, 4  → Frecuencia Natural ωn 3, 4 → Razón de Amortiguamiento ζ 3, 4 → Aproximación de la Espiral λe λb λbh - 0.404750 - -5.884235 - − 0.392455 ± 1.544174i ωbh ζ bh s −1 - → Aproximación del Barril → Aproximación del Holandés →→ Frecuencia Natural Balanceo →→ Razón de Amortiguamiento Aviación General Bimotor (Cessna 310) s −1 - 0.2463 2.4883 0.24632 Entrenamiento Militar Monomotor (SIAI Marchetti S-211) Entrenamiento Militar bimotor (Cessna T-37A) Aviación Regional Bimotor (Beach 99) Aviación Ejecutiva Motor de Cuatro Pistones (Cessna 620) Datos Geométricos y Másicos Nombre Variable Unidades Superficie Alar S Cuerda Media Envergadura Peso c b mA g ft ft ft lb I slug ⋅ ft Tensor de Inercia Valor 340.0 2 6.58 55.1 15000 2 0 0  64811  0 17300 0    0 64543  0 Estado de Referencia Nombre Altitud Variable (− )Z CG Unidades ft Velocidad Ue ft s deg Ángulo de α e Ataque Fuerzas C De  Aerodinámicas   C  Ye   C Le  - Avance Crucero 18000 366.8 0 0.042  0    0.484 Derivadas de Estabilidad f AVCGe 0 0.269 2.0988e - 009  = 0 0.883 0 ;   2.4186e - 008 0 5.55  fA e 0 0 0    = 0.022522 0 3.5919    0 0.088861 0  m AVCGe 0  0 0.1381  = 0 0 - 1.18 ;   0 - 0.1739 0  mA e 0 - 0.011568  0.056155   = 0 - 0.2654 0   0.0049706 0 0.019843  En las siguientes tablas se presentan los resultados del análisis de estabilidad: Nombre Presión Dinámica No. de Reynolds Característico Carga Alar Envergadura Adimensional Cuerda Adimensional Velocidad de Avance Adimensional Variable Pd Re S ~A m b~ c~ U~ e Unidades lb ft - Tensor de Inercia Adimensional - Cofactor Inercial Adimensional ~ D yy - Variable Unidades Valores propios Longitudinales → Frecuencia Natural → Razón de Amortiguamiento → Aproximación del Periodo Corto  λ1,2  λ   3, 4  ωn1, 2  ω   n 3, 4  ζ 1, 2  ζ   3, 4  - →→ Frecuencia Natural ωnpc →→ Razón de Amortiguamiento ζ pc s −1 - → Aproximación del Fugoide λf - →→ Frecuencia Natural ωnf →→ Razón de Amortiguamiento ζf s −1 - Variable Unidades Valores propios Laterales y Direccionales 0.120734 2.988217 0.356851 15.059379 0 0 0.049364    0 0.013177 0    0 0 0.049160 0.002427 Valor  − 5.129302 ± 5.117303i  − 0.025309 ± 0.144500i    9.5708 0.1467   0.70793 0.17252   -  λ1     λ2  λ3, 4  7.447727e+006 s −1 λ pc Nombre 3.654117e+002 - I~ Nombre Valor 2 - -5.131511 ± 5.115447i 9.5711 0.70821 − 0.023100 ± 0.191406i 0.25467 0.1198 Valor -3.551019     -0.004444   − 0.767824 ± 3.269806i  → Frecuencia Natural ωn 3, 4 → Razón de Amortiguamiento ζ 3, 4 → Aproximación de la Espiral λe λb λbh - -0.320678 - -3.399305 - − 0.845903 ± 3.190981i ωbh ζ bh s −1 - → Aproximación del Barril → Aproximación del Holandés →→ Frecuencia Natural Balanceo →→ Razón de Amortiguamiento 4.4367 s −1 - 0.2286 4.3607 0.25624 Aviación Ejecutiva Jet Bimotor (Learjet 24) Avión de Combate Caza Monomotor (Lockheed F-104) Avión de Combate Caza Bimotor (McDonnell F-4) Aviación Comercial Cuadrimotor (Boeing 747-200) Vuelo Curvilíneo Las ecuaciones de las perturbaciones son: δVCG = m A−1FV δVCG − [ CGe e ′ + m A−1Fe e δe ×]δVCG + m A−1F✁ e δ + [VCGe ×]δ + m A−1FrCGe ′ δrCG δ = I −1M V δVCG + I −1 (M✁ − [ CGe e e ×]I − [I e ) ′ + I −1M e e δe ×] δ + I −1M rCGe ′ δrCG ′ = R ✄k ′ R ✂j R φi δVCG + ∇ e (R ✄k ′ R ✂j R φi VCGe )δe δrCG A e e A e e δe = Teδ☎ + ∇ e T☎ eδe e Sustituyendo las derivadas de estabilidad encontradas anteriormente tenemos: δVCG C De sen (α e ) − C Le cos(α e ) − C Dα cos(α e ) − C Lα sen (α e ) uWe 2  = −m cos (α e ) CYα 2   Ue C De cos(α e ) + C Le sen (α e ) + C Dα sen (α e ) − C Lα cos(α e ) −1 A C De sen (α e ) − C Le cos(α e ) − C Dα cos(α e ) − C Lα sen (α e ) w cos 2 (α e )   +m CYα   Ue C De cos(α e ) + C Le sen (α e ) + C Dα sen (α e ) − C Lα cos(α e ) −1 A  − C Dβ cos(α e ) − C Lβ sen (α e )  u   wQe − vRe    T     +m  CYβ ∇ VCGe β  v  −  uRe − wPe   C Dβ sen (α e ) − C Lβ cos(α e )   w  vPe − uQe  −1 A  − pC Dp cos(α e ) − pC Lp sen (α e ) − qC Dq cos(α e ) − qC Lq sen (α e ) − rC Dr cos(α e ) − rC Lr sen (α e )   +m  pCYp + qCYq + rCYr   pC Dp sen (α e ) − pC Lp cos(α e ) + qC Dq sen (α e ) − qC Lq cos(α e ) + rC Dr sen (α e ) − rC Lr cos(α e )  − θ cos(θ e )  rVe − qWe       + pWe − rU e + φ cos(φe ) cos( e ) − θsen (φe )sen (θ e )       qU e − pVe   − φsen (φe ) cos( e ) − θ cos(φe )sen (θ e ) −1 A δ = I −1M V δVCG + I −1 (M✁ − [ CGe ✁ e e ×]I − [I e ) ′ + I −1M e e δe ×] δ + I −1M rCGe ′ δrCG ✁ ✁ ✄ ✄ ) + v[cos(✂e )sen( e )sen(φe ) − sen(✂e ) cos(φe )] + w[cos(✂e )sen( e )cos(φe ) + sen (✂e )sen(φe )] ✁ ✁ + φ {Ve [cos(✂e )sen ( e ) cos(φe ) + sen (✂e )sen (φe )] − We [cos(✂e )sen ( e )sen (φe ) − sen (✂e ) cos(φe )]} − θ {U e cos(✂e )sen (θ e ) + Ve cos(✂e ) cos(θ e )sen (φe ) + We cos(✂e ) cos(θ e ) cos(φe )} ✁ ✁ ✁ −ψ {U e sen (ψ e ) cos( e ) − Ve [cos(ψ e ) cos(φe ) + sen (ψ e )sen ( e )sen (φe )] + We [cos(ψ e )sen (φe ) − sen (ψ e )sen ( e ) cos(φe )]} xCG = u cos(✂e ) cos( e ✄ yCG = usen (☎e ) cos( ) + v[sen (☎e )sen ( e )sen (φe ) + cos(☎e ) cos(φe )] + w[sen (☎e )sen ( e ) cos(φe ) − cos(☎e )sen (φe )] ✄ ✄ ☎ + φ [Ve [sen ( e )sen ( e ) cos(φe ) − cos(☎e )sen (φe )] − We [sen (☎e )sen ( e )sen (φe ) + cos(☎e ) cos(φe )]] − θ [U e sen (☎e )sen (θ e ) + Ve sen (☎e ) cos(θ e )sen (φe ) + We sen (☎e ) cos(θ e ) cos(φe )] ✄ ✄ ✄ + ψ {U e cos(ψ e ) cos( e ) + Ve [cos(ψ e )sen ( e )sen (φe ) − sen (ψ e ) cos(φe )] + We [cos(ψ e )sen ( e ) cos(φe ) + sen (ψ e )sen (φe )]} e ✆ ✆ ✆ zCG = −usen ( e ) + v cos( e )sen (φe ) + w cos( e ) cos(φe ) ✆ ✆ + φ{Ve cos( e ) cos(φe ) − We cos( e )sen (φe )} − θ {U e cos(θ e ) − Ve sen (θ e )sen (φe ) − We sen (θ e ) cos(φe )} φ = p + qsen (φe ) tan (θ e ) + r cos(φe ) tan (θ e ) + φ [Qe cos(φe ) − Re sen (φe )] tan (θ e ) + θ [Qe sen (φe ) + Re cos(φe )]sec 2 (θ e ) θ = q cos(φe ) − rsen (φe ) + θQe cos(φe ) − θRe sen (φe ) − φQe sen (φe ) − φRe cos(φe ) ψ = qsen(φe ) sec(θ e ) + r cos(φe ) sec(θ e ) + φ [Qe cos(φe ) − Re sen(φe )]sec(θ e ) + θ [Qe sen (φe ) + Re cos(φe )]sec(θ e ) tan(θ e ) Punto Neutro. Margen Estático. Vuelo con Potencia Control Longitudinal Posición. Empenaje Dinámico. Estabilizador y Elevador. Estabilizador-Elevador. Lateral y Direccional. Pérdida de un Motor. Momento de Balanceo con Timón. Momento de Balanceo con Guiñada. Momento de Guiñada con Balanceo. Efecto del Diedro. Control Lateral y Direccional. Guiñada Adversa. Giro con Spoilers. Inversión de Alerones. Giro Uniforme. Viraje Uniforme. Ascenso Simétrico. Estabilidad. Criterios de Estabilidad. Perturbaciones de Velocidad. Perturbaciones de Rotación. Perturbaciones Atmosféricas. Estabilidad Longitudinal. Caso General. Periodo Corto. Fugoide. Lateral y Direccional. Caso General. Espiral. Barril. Giro del Holandés. Estabilidad No-Lineal. Simulación. Método de la Historia Energética. Método del Espacio de Fases. Controles Automáticos de Vuelo. Teoría de Control. Introducción. Método de las Raíces. Método de Bode. Elementos Sensores. Giróscopos. Acelerómetros. Sensor del Ángulo de Incidencia. Anemómetros. Altímetros. Computadores. Actuadores. Servo Magnético. Servo Electro-Hidráulico. Sistemas Amplificadores de la Estabilidad. Guiñada. Balanceo. Cabeceo. Piloto Automático. Modos Longitudinales. Modos Laterales-Direccionales. Aterrizaje Automático. Reglamentación. Capítulo 6 Control Derivadas de Control Unidades de Mediad Inercial Cuando un cuerpo se mueve en el espacio, para poder controlarlo, se debe poder medir, las variables de fase correspondientes. Si bien pueden desarrollarse modelos de observadores para algunas variables, la situación ideal sería poder medir la posición, la actitud y las velocidades tanto del centro de gravedad como la angular de los ejes cuerpo. En cuanto a la posición y la velocidad del centro de gravedad, hoy en día pueden utilizarse unidades GPS (Sistema de Posicionamiento Global, por sus siglas en inglés). En cuanto a la velocidad del viento relativo, la cual también es indispensable para el control, se pueden utilizar velocímetros bastante precisos. Por último, para la actitud y la velocidad angular de los ejes cuerpo se utilizan las llamadas IMU (Unidades de Medida Inercial, por sus siglas en inglés). De estas existen de dos tipos principales: las que utilizan giróscopos para detectar directamente la velocidad angular y las que utilizan sólo acelerómetros pudiendo detectar tanto la aceleración del centro de gravedad como la aceleración angular de los ejes cuerpo. Señal de un Acelerómetro Ligado a un Cuerpo. La posición de un punto cualquiera sobre un vehículo, en ejes tierra viene dada por: ′ + Rr r ′ = rCG en donde r es la posición del punto en ejes cuerpo y R es la matriz de cosenos directores de los ejes cuerpo. La velocidad del punto será: ′ dr′ drCG dR dr + r+R = dt dt dt dt sustituyendo la derivada de la matriz de rotación y derivando nuevamente para obtener la aceleración tenemos: ′ d 2r ′ d 2rCG dr d 2r 2 R R R = + [ R × ] Rr + [ R × ][ R × ] Rr + [ × ] + dt 2 dt 2 dt dt 2 en donde la velocidad angular está en componentes de ejes cuerpo. Suponemos ahora que el punto en cuestión está fijo en el sistema de referencia del cuerpo: ′ d 2r′ d 2rCG = + [R ×]Rr + [R ×][R ×]Rr 2 2 dt dt ahora bien, puesto que las aceleraciones de la ecuación anterior están en componentes de d 2r ′ ejes tierra, introducimos sus componentes en ejes cuerpo haciendo = a′ = a y dt 2 ′ d 2rCG = a′CG = aCG , y efectuando la rotación, es decir, podemos escribir: 2 dt Ra = RaCG + [R ×]Rr + [R ×][R ×]Rr multiplicando toda la ecuación por la inversa de la matriz de cosenos directores y utilizando las identidades R T [Ra ×]R = [a ×] y RR T = U , obtenemos: a = aCG + [ ×]r + [ ×][ ×]r es la velocidad en donde aCG es la aceleración del origen del sistema de ejes cuerpo, angular del sistema y r es la posición del punto con respecto al mismo sistema, ver por ejemplo Etkin (1996). Todas las componentes de los vectores en la ecuación anterior están en ejes cuerpo. Supongamos que en el punto en cuestión se encuentra un acelerómetro lineal de modo que mide la aceleración en la dirección paralela al vector unitario n (las componentes de este vector también están en ejes cuerpo). Entonces, la señal medida por el acelerómetro vendrá dada por la proyección del vector a sobre el vector n : A = nT a = nT a CG + nT [ ×]r + nT [ ×][ ×]r conmutando el producto cruz en el segundo término: A = nT aCG − nT [r ×] + nT [ ×][ ×]r En el tercer término podemos aplicar la identidad: [ ×][ ×] = T −U T por lo que, reacomodando escalares, la señal del acelerómetro se podrá expresar como: A = nT aCG − nT [r ×] + nT rT − nT r T Factibilidad de la Unidad Libre de Giróscopos Es evidente que, conociendo la señal de un solo acelerómetro, de la ecuación correspondiente, no podríamos conocer la aceleración del cuerpo aCG y la aceleración angular , puesto que se trata de una sola ecuación escalar con seis incógnitas. De inmediato surge la idea de colocar un conjunto de acelerómetros de modo que se tengan suficientes ecuaciones como para poder despejar las incógnitas. La pregunta es: ¿Bajo que configuración de los acelerómetros es posible despejar las aceleraciones del cuerpo? La pregunta es legítima ya que es evidente que si pusiéramos todos los acelerómetros paralelos entre si, sería imposible conocer la aceleración angular alrededor del eje de los acelerómetros aunque hubiera más de seis ecuaciones. Tan, Mostov y Varaiya (2000) resolvieron esta pregunta de la forma siguiente. Supongamos que tenemos un conjunto de n acelerómetros, entonces tenemos el sistema de ecuaciones: A1 = n1T aCG − n1T [r ×] + n1T r1T A2 = nT2 aCG − nT2 [r ×] + nT2 r2T An = nTn aCG − nTn [r ×] + nTn rnT − n1T r1 T − nT2 r2 T − nTn rn T el cual puede ensamblarse en forma de hipermatriz como:  A1  n1T  A  nT  2 =  2       T  An  n n  n1T r1T − n1T r1 − n1T [r1 ×]   − nT2 [r2 ×] aCG  nT2 r2T − nT2 r2 +      T T  T − nTn [rn ×] n n rn − n n rn T T T       La primera matriz del lado derecho es una matriz de n renglones por seis columnas. Por otro lado, si definimos: n1T  T n J= 2   T n n  n1T r1T − n1T r1 − n1T [r1 ×]  A1    T T A  n 2 r2 − nT2 r2 − nT2 [r2 ×] 2  ~  ; A= ; =       T T   T T − n n [rn ×]  An  n n rn − n n rn T T T       y si la inversa por la izquierda de la matriz J existe, llamémosla J −I 1 , entonces, pueden despejarse las aceleraciones del sistema de referencia quedando como: aCG  −1 ~   = J I (A − )   En el caso n = 6 , para que la inversa exista el determinante de J debe ser diferente de cero. Esto significa que los acelerómetros deben ser colocados en posiciones y orientaciones tales que el determinante no se anule. En el caso más general, la matriz J será rectangular y deberá tener rango completo para que su inversa por la izquierda exista; si es el caso, esta última vendrá dada por: J −I 1 = (J T J ) J T −1 Para que la inversa por la izquierda exista, el determinante de la matriz en el paréntesis del lado derecho debe ser diferente de cero (esto es equivalente a tener rango completo). Nuevamente, esto indica que los acelerómetros deben ser colocados en posiciones y con orientaciones tales que el determinante de la matriz J T J no se anule. Como puede verse, las ecuaciones de las aceleraciones dependen exclusivamente del número, posición y dirección en que se coloquen los acelerómetros. A continuación analizaremos algunas configuraciones posibles, señalando su factibilidad, sus ventajas y sus desventajas. Configuración Debra. Consideremos la configuración propuesta por Debra (1994) tal y como aparece en la siguiente figura: entonces tenemos:  0   0  − L  L 0 0           r1 = 0 ; r2 = − L ; r3 = 0 ; r4 = 0 ; r5 = L ; r6 =  0               0   L − L  0   0   0  1 n1 = 12 1; n 2 =   0 1 1   0 ; n3 = 2   1 0  1   1 ; n4 = 2   1 0 1  − 1; n5 = 2    1   − 1 1  0 ; n 6 = 2    1  − 1 1  1 2    0  por lo tanto, la matriz J es: 0 L −L 0  1 −L 0 L  1 0 L − L  1 0 − L − L 1 L 0 L  0 −L −L 0  1 1 1 0  0 1 J = 12   0 −1 − 1 0  − 1 1 el determinante es distinto de cero y la matriz inversa es: 1 1   0 J −I 1 = 2 1 2  1  L  − 1L   0 1 0 1 − L1 0 0 1 1 0 1 L − L1 1 L 0 − 1 − 1 −1 0 1   1 1 0  1 0 − 1L  L − 1L 0 − 1L   − 1L 1L 0 El término dependiente de la velocidad angular en las ecuaciones de la unidad sería: n r  r ~ = n   T T n n rn T 1 T 2 T 1 T 2 T 1 1 T 2 2 −n r −n r T − n n rn T T T  − (ω x + ω y )ωz   − (ω + ω )ω   x z y    = L  − (ω y + ωz )ω x  2   (− ω y + ωz )ω x   (− ω x + ωz )ω y      (− ω x + ω y )ωz  el cual, multiplicado por la inversa nos queda como: ω yωz  ω ω   x z ω ω  J −I 1 ~ = − L  x y   0   0     0  si definimos las matrices: 1 1 0 0 − 1 J 1 = 1 0 1 − 1 0  0 1 1 1 1  1 −1 0 0 J 2 = − 1 0 1 − 1   0 1 − 1 − 1 − 1 1  0  1 − 1 0 − 1  1 0  ω yωz  ~ = ω ω  1  x z ω xω y  las ecuaciones de la unidad de medida inercial se pueden separar de la siguiente forma: a CG = = 1 2 2 1 2 2L J 1A + L ~ 1 J 2A Esta configuración tiene la ventaja de que la ecuación para la aceleración angular no depende de la velocidad angular, lo que permite una integración más sencilla. Sin embargo, la desventaja es la dificultad de fabricación ya que se deben colocar los acelerómetros en las posiciones especificadas con mucha precisión. En caso contrario, las componentes nulas de las matrices anteriores serían diferentes de cero quedando anulada la ventaja anterior. Por otro lado, es evidente que si la distancia entre los acelerómetros aumenta, será mayor la precisión obtenida en la velocidad angular, eso imposibilita la miniaturización de la unidad inercial. De hecho, el dispositivo experimental de Tan, Mostov y Varaiya (2000) es un cubo de aluminio de 20 cm de lado en el cual se maquinaron cavidades con dispositivos de control numérico para garantizar el alineamiento. Es evidente que dicho dispositivo sería muy difícil de llevar a bordo de un UAV de uno o unos cuantos metros de tamaño. Configuración con 2 acelerómetros triaxiales Hoy en día existen acelerómetros triaxiales integrados en un solo micro circuito, con buena precisión y precio accesible. Por ello vale la pena saber si una o algunas configuraciones basadas en acelerómetros triaxiales son factibles. Las cosas se simplifican un poco ya que cada terna tendrá el mismo vector posición. Por otro lado, las actuales unidades triaxiales garantizan hasta cierto punto la perpendicularidad entre los tres ejes; sin embargo, el alinear estos ejes entre dos acelerómetros o con otro sistema arbitrario puede ser una labor ardua y difícil. Para iniciar, proponemos utilizar dos unidades triaxiales en dos puntos cualquiera del sistema de ejes cuerpo para tener un total de seis acelerómetros: r1, 2,3 = p1 ; r4,5,6 = p 2 si suponemos que las unidades se colocan en actitudes arbitrarias con respecto a los ejes cuerpo las direcciones de los acelerómetros serán las columnas de las correspondientes matrices de rotación: n1, 2, 3 = R1 ; n 4 , 5, 6 = R 2 ; Entonces, la matriz J viene dada por: R1T J= T R 2 − R1T [p1 ×]  − R T2 [p 2 ×] podemos intentar encontrar la inversa de esta matriz por el método de submatrices: A B  R1T  C D  R T   2 − R1T [p1 ×] U 0  = − R T2 [p 2 ×]  0 U  de esta expresión se desprenden cuatro ecuaciones matriciales:  AR1T + BR T2  T T CR1 + DR 2 − AR1T [p1 ×] − BR T2 [p 2 ×] U 0  = − CR1T [p1 ×] − DR T2 [p 2 ×]  0 U las cuales pueden ponerse en la forma: B = R 2 − AR 1T R 2 AR 1T [(p 2 − p1 ) ×] = −[p 2 ×] D = −CR 1T R 2 CR 1T [(p 2 − p1 ) ×] = U Ahora, es evidente que las ecuaciones segunda y cuarta no pueden resolverse ya que la matriz dentro del paréntesis es un pseudovector y su determinante es cero, esto implica que el determinante de la matriz J es igual a cero y por lo tanto, ninguna configuración con dos acelerómetros triaxiales, cualesquiera que sean las posiciones y las actitudes, es realizable. Configuración con 3 acelerómetros triaxiales Dado tal resultado, se debe utilizar un mínimo de tres unidades triaxiales, en tres puntos cualesquiera del sistema de ejes cuerpo, para un total de nueve acelerómetros: r1, 2,3 = p1 ; r4,5,6 = p 2 ; r7,8,9 = p 3 suponemos también que las unidades se colocan con una actitud arbitraria con respecto a los ejes cuerpo dada por sus respectivas matrices de rotación: n1, 2,3 = R1 ; n 4 , 5, 6 = R 2 ; n 7 , 8, 9 = R 3 Entonces, la matriz J viene dada por: R1T  J = R T2 R T3  − R1T [p1 ×]  − R T2 [p 2 ×] − R T3 [p3 ×] La inversa por la izquierda se calcula a continuación:    R1 −1 JI =   [p1 ×]R 1  R2 [p 2 ×]R 2 R1T R3  T R [p3 ×]R 3   T2 R 3 −1 − R 1T [p1 ×]     R1 − R T2 [p 2 ×]    [p ×]R 1 − R T3 [p 3 ×]   1 R2 [p 2 ×]R 2 R3  [p 3 ×]R 3  realizando el producto al interior del paréntesis: −1 3   U − 13 ∑ [p1 ×]   i =1  [p1 ×]R1 J −I 1 = 3 3 3 1   R 1 1 [ ] [ ][ ] p p p × − × × i i 3∑ 3∑ 1  i =1  i =1  [p 2 ×]R 2 [p 3 ×]R 3  R2 utilizando la identidad [pi ×][pi ×] = pi pi − Up i pi podemos escribir: T T R3     U −1  JI = 3  3    13 ∑ pi ×    i =1 −1  3  −  13 ∑ pi ×  i =1  ∑ (Up 3 1 3 i =1 T i p i − pi pi T    [p1 ×]R1   R1   ) [p 2 ×]R 2 [p3 ×]R 3  R2 R3   por similitud con la definición de los momentos de primer y segundo orden, definimos la siguiente nomenclatura para las componentes de la primera matriz: − [Q ×] [p1 ×]R1  U J = 3  I   R1  [Q ×] [p 2 ×]R 2 [p3 ×]R 3  −1 −1 I R2 R3   Llamamos a la primera matriz, matriz de momentos de la configuración y su inversa puede calcularse por el método de submatrices del siguiente modo: − [Q ×] U 0   A B  U =  C D [Q ×] I   0 U   de donde se obtienen cuatro ecuaciones matriciales muy sencillas de resolver: A + B[Q ×] = U BI − A[Q ×] = 0 C + D[Q ×] = 0 DI − C[Q ×] = U la solución es: A = U − B[Q ×] B = [Q ×](I + [Q ×][Q ×]) −1 C = − D[Q ×] D = (I + [Q ×][Q ×]) −1 si definimos la matriz: E = I + [Q ×][Q ×] la solución puede representarse en forma simple como: A = U − [Q ×]E−1 [Q ×] B = [Q ×]E −1 C = − E−1 [Q ×] D = E −1 Es fácil comprobar que, si la matriz E−1 existe, entonces efectivamente hemos encontrado la inversa de la matriz de los momentos de la colocación. Por lo tanto, la inversa por la izquierda de J se puede escribir como: U − [Q ×]E −1 [Q ×] J −I 1 = 3 −1  − E [Q ×] R2 R3  [Q ×]E−1   R1  [p ×]R [p ×]R [p ×]R  −1 E 1 2 2 3 3  1 realizando el producto tendremos: R + [Q ×]E −1 [(p1 − Q ) ×]R 1 J −I 1 = 3 1 E −1 [(p1 − Q ) ×]R 1  R 2 + [Q ×]E −1 [(p 2 − Q ) ×]R 2 E −1 [(p 2 − Q ) ×]R 2 R 3 + [Q ×]E −1 [(p 3 − Q ) ×]R 3   E −1 [(p 3 − Q ) ×]R 3  Por lo que, definiendo las siguientes matrices: Fi = E−1 [(pi − Q ) ×]R i la inversa por la izquierda de J se puede escribir como: (R + [Q ×]F1 ) J −I 1 = 3 1 F1  (R 2 + [Q ×]F2 ) (R 3 + [Q ×]F3 ) F2 F3   Como vemos, el problema se ha reducido al cálculo de la inversa de la matriz E el cual, si bien no es un problema sencillo, parece mucho menos complicado que el de J −I 1 . Igualmente, la factibilidad de esta unidad inercial corresponde a que el determinante de la matriz E = I + [Q ×][Q ×] sea diferente de cero. Partiendo de las definiciones de las matrices Q e I , la matriz clave del problema puede calcularse de manera formal. Primeramente, se introducen una serie de variables para simplificar la notación: Q=Q x2+Q y2+Qz2 I1=I xx I yy − I xy2 I 4=I xx I yz − I xy I xz I 2=I xx I zz − I xz2 I 5=I yy I xz − I xy I yz I 3=I yy I zz − I yz2 I 6=I zz I xy − I yz I xz Se debe notar que todas estas cantidades son escalares. Enseguida, se calcula el determinante de la matriz: E =I xx I 3 + I yy I 2 + I zz I1 + 2 I xy I xz I yz − 2 I xx I yy I zz + I 3Q x2 + I 2Q y2 + I1Qz2 − 2 I 6Q x Q y − 2 I 5Q xQz − 2 I 4Q y Qz − (I 1 + I 2 + I 3 − I xxQ x2 − I yy Q y2 − I zzQz2 − 2 I xy Q xQ y − 2 I xzQ x Qz − 2 I yzQ y Qz )Q Por último, se establece la matriz adjunta: Adj (E)1,1 = I 3 − 13 Q(I yy+I zz )+ 13 (I zzQ y2 − 2 I yzQ yQz+I yyQz2 )+ 19 QQx2 Adj (E)2, 2 = I 2 − 13 Q(I xx+I zz )+ 13 (I zzQx2 − 2 I xzQxQz+I xxQz2 )+ 19 QQ y2 Adj (E)3, 3 = I1 − 13 Q(I yy+I xx )+ 13 (I yyQx2 − 2 I xy QxQ y+I xxQ y2 )+ 19 QQz2 Adj (E)1, 2 = − I 6+ 13 (I xy Q − I zzQxQ y+(I yzQx+I xzQ y − I xy Qz )Q z )+ 19 QQxQ y Adj (E)1, 3 = − I 5+ 13 (I xzQ − I yyQxQz+(I yzQx+I xy Qz − I xzQ y )Q y )+ 19 QQxQz Adj (E)2,3 = − I 4+ 13 (I yzQ − I xxQzQ y+(I xzQ y+I xy Qz − I yzQx )Q x )+ 19 QQ y Qz Adj (E)2,1 = Adj (E)1, 2 Adj (E)3,1 = Adj (E)1,3 Adj (E)3, 2 = Adj (E)2,3 Como es bien sabido, la matriz inversa es la adjunta dividida entre el determinante. El número de operaciones no resulta restrictivo para introducir estas fórmulas en un microprocesador. Configuración con k acelerómetros triaxiales Aún cuando el método de solución puede parecer complicado, podría ser que aumentando el número de acelerómetros pueda lograrse mayor precisión en las medidas. Por esta razón, proponemos un cálculo para un número cualquiera de ternas ortogonales de acelerómetros. Las posiciones vendrán dadas para la terna k como: r3k − 2,3k −1, 3k = p k suponemos también que las unidades se colocan con una actitud arbitraria con respecto a los ejes cuerpo, entonces, la actitud de la terna k vendrá dada por: n 3k − 2,3k −1,3k = R k Entonces, la matriz J viene dada por: R1T  T R J= 2   T R k − R1T [p1 ×]  − R T2 [p 2 ×]   T − R k [p k ×] La inversa por la izquierda se calcula a continuación:     R1 −1 JI =  [p ×]R 1  1   R 1T  R k  R T2 [p k ×]R k    T R k R2 [p 2 ×]R 2 −1 − R 1T [p1 ×]   − R T2 [p 2 ×]   R 1   [p1 ×]R 1  − R Tk [p k ×]  R2 [p 2 ×]R 2 Rk  [p k ×]R k  realizando el producto al interior del paréntesis: −1 k   1 U −   k ∑ [p1 ×] i =1   R1 J −I 1 = k  k k 1  [p1 ×]R 1 1 [ ] [ ][ ] p p p × − × × i i k ∑ k ∑ 1  i =1  i =1  R2 [p 2 ×]R 2 Rk  [p k ×]R k  utilizando la identidad [pi ×][pi ×] = pi pi − Up i pi podemos escribir: T   U −1  JI = k  k    k1 ∑ pi ×    i =1 T −1  k  −  k1 ∑ pi ×  i =1  ∑ (Up k 1 k i =1 T i pi − pi pi T     R1  [p1 ×]R1   ) R2 [p 2 ×]R 2 Rk  [p k ×]R k  por similitud con la definición de los momentos de primer y segundo orden, definimos la siguiente nomenclatura para las componentes de la primera matriz: − [Q ×]  R1  U J = k   I  [p1 ×]R1  [Q ×] −1 −1 I R2 [p 2 ×]R 2 Rk  [p k ×]R k  Llamamos a la primera matriz, matriz de momentos de la colocación y su inversa puede calcularse por el método de submatrices del siguiente modo: − [Q ×] U 0   A B  U =  C D [Q ×] I   0 U   de donde se obtienen cuatro ecuaciones matriciales muy sencillas de resolver: A + B[Q ×] = U BI − A[Q ×] = 0 C + D[Q ×] = 0 DI − C[Q ×] = U la solución es: A = U − B[Q ×] B = [Q ×](I + [Q ×][Q ×]) −1 C = − D[Q ×] D = (I + [Q ×][Q ×]) −1 si definimos la matriz: E = I + [Q ×][Q ×] la solución puede representarse en forma simple como: A = U − [Q ×]E−1 [Q ×] B = [Q ×]E −1 C = − E−1 [Q ×] D = E −1 Es fácil comprobar que, si la matriz E−1 existe, entonces efectivamente hemos encontrado la inversa de la matriz de los momentos de la colocación. Por lo tanto, la inversa por la izquierda de J se puede escribir como: U − [Q ×]E−1 [Q ×] J −I 1 = k  −1  − E [Q ×] R2 [Q ×]E−1   R1  [p ×]R [p ×]R −1 E 1 2 2  1 Rk  [pk ×]R k  realizando el producto tendremos: R + [Q ×]E−1[(p1 − Q) ×]R1 R 2 + [Q ×]E−1 [(p 2 − Q ) ×]R 2 J −I 1 = k  1 E−1 [(p1 − Q ) ×]R1 E−1[(p 2 − Q ) ×]R 2  Por lo que, definiendo las siguientes matrices: Fj = E−1 [(p j − Q ) ×]R j la inversa por la izquierda de J se puede escribir como: R k + [Q ×]E−1 [(pk − Q) ×]R k   E−1 [(pk − Q) ×]R k  (R + [Q ×]F1 ) J −I 1 = k  1 F1  (R 2 + [Q ×]F2 ) (R k + [Q ×]Fk ) F2 Fk   Como vemos, el problema se ha reducido al cálculo de la inversa de la matriz E el cual, si bien no es un problema sencillo, parece mucho menos complicado que el de J −I 1 . Igualmente, la factibilidad de esta unidad inercial corresponde a que el determinante de la matriz E = I + 1k [Q ×][Q ×] sea diferente de cero. Configuración Triedro Esta configuración consiste en colocar un acelerómetro triaxial a lo largo de cada eje coordenado a la misma distancia del origen: 1 p1 = L 0;   0 0 p 2 = L 1;   0 0 p3 = L 0   1 para simplificar, supondremos que las unidades pueden ser colocadas paralelas a los ejes cuerpo de modo que: R1 = R 2 = R 3 = U entonces tendremos: 1 Q = ∑ pi = L 1 ;  i =1 1 3 3 ( I = ∑ Upi pi − pi pi i =1 T T ) = 2L U la matriz clave del problema será: −1 4 1 1  3  D = L2 1 4 1 =   1 1 4 las matrices Fi son: 1 6 L2  5 − 1 − 1  − 1 5 − 1    − 1 − 1 5  2  5 − 1 − 1   2   5    1    F1 = − 1 5 − 1  − 1 × = 18 L − 1       − 1 − 1 5   − 1  − 1  5 − 1 − 1  − 1  5   F2 = 181L  − 1 5 − 1   2  × = 181L − 1       − 1 − 1 5   − 1  − 1 − 1 − 1  0 1 − 1 5 − 1 − 1 0 − 2 =   − 1 5   1 2 0  1 6L 1 2 − 1 − 1  0 5 − 1  − 1 0 1 =   − 1 5   − 2 − 1 0 2 3 1 1  0 1 6L  − 1   − 3 − 2 − 1  5 − 1 − 1 0 − 2 − 1  5 − 1 − 1  − 1        F3 = 181L − 1 5 − 1  − 1 × = 181L − 1 5 − 1 2 0 1=        − 1 − 1 5  1 − 1 0   − 1 − 1 5    2    − 1 − 3 − 2 1  1 2 6L  3   1 − 1 0  1 18 L 1 − 1 0 − 2 − 1 − 3   3 1   2 La inversa por la izquierda será: − 1 − 3  1  2 − 1  2   0 1 1   6 L − 2 − 1  2 3 J −I 1 =   5 2   1  9 −1 2     − 1 − 1 2 1 −1 0   − 3 − 2  2 −1 1  5 9  2  − 1 − 1 1 6L 3 1  − 1 − 1 2  2  − 1 − 3 − 2   3 1 2     1 − 1 0     2 − 1 − 1  1  2 − 1  9 − 1  2 5    2 1 6L lo que puede escribirse como:  0 − 1  3L  31L −1 JI =  5  9  − 19  1 − 9 − 61L − 61L − 2L1 1 2L 1 6L − 61L − 21L 2 9 2 9 2 9 0 − 31L − 19 2 9 − 19 2 9 5 9 2 9 − 19 2 9 − 19 2 9 − 19 − 19 2 9 2 9 2 9 1 6L 1 6L 1 3L 1 2L − 61L − 21L 1 6L 1 2L 1 6L − 61L − 19 1 6L 2 9 − 61L − 19 − 31L  1  3L  0   − 19  − 19  5  9  el término dependiente de la velocidad angular será: 1  3 (ω y − ω x )(ω x + ω y − ω z )  − 13 (ωx − ωz )(ω x + ω y + ωz )  1  3 (ω x − ω y )(ω x + ω y + ω z ) ~ = 2 2 2 4L 1 1  9 ω xω y + ω x ω z − 2 ω yω z + 2 ω x − ω y − ω z  49L ωxω y − 12 ω xωz + ω yωz − ω x 2 + 12 ω y 2 − ωz 2  4L 1 2 2 2 1  9 − 2 ωxω y + ω xωz + ω yωz − ωx − ω y + 2 ωz ( ( ( ) )          ) si introducimos las matrices: 1 −1 1 2 3 − 1 − 3 − 2 0  J1 = − 2 − 1 − 3 − 1 0 1 3 1 2   3 1 − 3 − 2 − 1 1 − 1 0   2 2 2 2 − 1 − 1 2 − 1 − 1 5  J2 = −1 2 −1 2 5 2 − 1 2 − 1   2 2 5   − 1 − 1 2 − 1 − 1 2 y las matrices: (ω y − ω x )(ωx + ω y + ωz ) ~ = (ω − ω )(ω + ω + ω ) 1 x x y z   z (ωx − ω y )(ωx + ω y + ωz )  ω xω y + ω xωz − 12 ω yωz + 12 ωx 2 − ω y 2 − ωz 2  ~ =  ω ω − 1 ω ω +ω ω −ω 2 + 1ω 2 −ω 2  2 y z x y z  2  x y 2 x z 2 2 1 1  − 2 ω x ω y + ω xω z + ω y ω z − ω x − ω y + 2 ω z 2    las ecuaciones de la unidad pueden escribirse como: = aCG J1A − 13 ~ 1 = 19 J 2 A − 49L ~ 2 1 6L Configuración en L En la configuración anterior, simplemente colocamos la tercera unidad en el origen: 1 p1 = L 0;   0 0  p 2 = L 1;   0 0 p 3 = 0   0 también colocamos todos los acelerómetros paralelos a un eje: R1 = R 2 = R 3 = U en este caso tendremos: 1  Q = ∑ p i = L 1  ;   i =1 0 3 3 ( I = ∑ Upi pi − pi pi i =1 T T ) 1 0 0 = L 0 1 0    0 0 2 2 La matriz clave del problema será: −1  2 1 0 3  D = L2 1 2 0 =   0 0 4 1 4 L2  8 − 4 0  − 4 8 0   0 3  0 las matrices Fi son: 0 0 0   8 − 4 0 0 0 − 1     1  F1 = − 4 8 0 0 0 − 2 = 12 L 0 0 − 12      3 6 0   0 0 3 1 2 0  0 2 0 12  8 − 4 0  0 0      0 1 = 121L 0 0 0 F2 = 121L − 4 8 0 0      0 3  − 2 − 1 0  0 − 6 − 3 0  0 0 − 12  8 − 4 0 0 0 − 1     1 = 121L 0 0 12  F3 = 121L − 4 8 0 0 0      0 3 1 − 1 0   0 3 − 3 0  1 12 L La inversa por la izquierda será:  0 0 0   1    12 L 0 0 − 12  3 6 0  J −I 1 =   5 2 0   1   12 − 3 2 0    0 0 0     la cual puede escribirse como: 0 0   − 6 2 1  12  2 0 1 12 L 0 0 12 0  − 3 0  − 1 0 5 0  0 0 0 0   3 5 1  12  − 1  0 1 12 L 0 0 −3 −1 5 0 − 12   12   0  0   0   12   0  0   1 J −I 1 =  45L  12  − 121   0 0 0 1 2L 1 6 1 6 0 0 − L1 0 0 0 0 0 0 0 0 − 21L 1 6 − 41L − 121 1 6 5 12 0 0 1 L 0 0 0 0 − 41L − 121 0 0 41L 0 125 0 − 121 0 0 5 12 0 el término dependiente de la velocidad angular será: ω yω z   − ω xωz  2 2 1 4 ωx − ω y ~ =  2 2 2 L  12 4ω xω y + ωx − 5ω y − 4ωz  12L 4ω xω y − 5ωx 2 + ω y 2 − 4ωz 2  0  ( ( ( )          ) ) si introducimos las matrices: 0 0 0 J 1 = 0 0 − 4  1 2 0 5 2 0 J 2 = − 1 2 0   0 0 0 − 4 0 0 0 0 0 4  − 2 − 1 0 1 − 1 0  2 −1 0 5 −1 0  2 5 0 −1 5 0   0 0 0 0 0 12 0 0 4 0 0 y las matrices:  4ω yωz  ~ =  − 4ω ω  1 x z   ω x 2 − ω y 2  4ω xω y + ω x 2 − 5ω y 2 − 4ωz 2  ~ = 4ω ω − 5ω 2 + ω 2 − 4ω 2  2 x y z   x y   0   las ecuaciones de la unidad pueden escribirse como: − L1  1  L  0  0 0  1  = 1 4L J1A − 14 ~ 1 aCG = 121 J 2 A − 12L ~ 2 Reconstrucción del Estado del Sistema. A partir de las aceleraciones obtenidas por el conjunto de acelerómetros puede reconstruirse el estado instantáneo del sistema. Este proceso puede realizarse en un microprocesador dedicado especialmente a la tarea o bien en una unidad central de cálculo a bordo del vehículo. El proceso de reconstrucción consta de dos etapas: 1) a partir de las aceleraciones se obtienen las velocidades; 2) a partir de estas velocidades se obtiene la posición y la actitud con respecto a los ejes tierra. La primera etapa puede considerarse sencilla ya que las velocidades en ejes cuerpo vienen dadas simplemente por: t t = ∫ dt; VCG = ∫ aCG dt 0 0 El problema principal es que la integral se está realizando en un marco de referencia que depende del tiempo; por lo tanto, en cualquier discretización se debe considerar que el marco de referencia entre dos instantes distintos se ha desplazado. Así mismo, se debe considerar que, en realidad, estamos tratando de resolver una ecuación diferencial en donde el integrando depende de manera no lineal de la incógnita, lo cual puede traer serias complicaciones en los algoritmos. Cuando el integrando depende en forma simple de la incógnita, como en el caso de la configuración de Debra para la primera integral, puede utilizarse un algoritmo sencillo como por ejemplo el de Euler. Cuando el integrando depende en forma fuertemente no lineal de la incógnita, deberán introducirse algoritmos más robustos como los de Runge – Kutta de orden superior. En la segunda etapa pretendemos conocer la posición del centro de gravedad y la actitud de los ejes cuerpo con respecto a los ejes tierra. En realidad este problema ya fue resuelto en el capítulo anterior durante la simulación: se trata del subsistema de las ecuaciones cinemáticas del vehículo. La posición del centro de gravedad vendrá dada por: t ′ = ∫ RVCG dt rCG 0 en donde R es la matriz de cosenos directores de los ejes cuerpo con respecto a los ejes tierra, la cual deberá calcularse a partir del vector velocidad angular . Como mencionamos en el capítulo sobre simulación, este último problema puede resolverse de dos formas equivalentes: mediante los ángulos de Euler o mediante la forma de Gibbs. Es interesante notar que la mayoría de los algoritmos existentes en las unidades inerciales comerciales están basados en los ángulos de Euler. Sin embargo, como hemos visto, la forma de Gibbs es una manera mucho más simple y adaptada al proceso iterativo de la solución. El algoritmo resumido sería el siguiente: φ= n= ∆t R R φn = nnT + (U − nnT )cos(φ ) + [n ×]sen (φ ) R (t + ∆t ) = R φn R (t ) Es evidente que se requiere de una condición inicial para cada una de las variables que se integran. Al encender la unidad pueden utilizarse condiciones triviales. Errores de deriva y de pérdida de orto normalidad de la matriz de rotación. Ortonormalización de la Matriz de Cosenos Directores. Algoritmos de Re-estimación del Estado. Como se ha visto, la reconstrucción del estado del vehículo a partir de los datos de la unidad de medida inercial se ve afectada por la acumulación de errores durante el proceso de integración. Se ha intentado dar respuesta a este problema introduciendo información suplementaria, adquirida de forma independiente. Es decir, durante el funcionamiento de la unidad, a diferentes instantes es posible que se obtenga información sobre los valores instantáneos verdaderos de alguna de las variables y, esa información, puede utilizarse para reducir el error acumulado en el algoritmo. Existen dos fuentes principales de información independiente que han sido utilizadas: a) El GPS: permite conocer la posición, al menos en el plano de tierra y las componentes de la velocidad del centro de gravedad en el mismo plano. b) El Magnetómetro: Capítulo 7 Simulación Simulador del Vehículo. Consiste en resolver, mediante un método numérico las ecuaciones de movimiento del vehículo. Un primer punto es que se debe estudiar la atmósfera estándar para hacer una rutina que cambie automáticamente la densidad (presentar la teoría de la atmósfera estándar). También se debe estudiar un método numérico apropiado para resolver ecuaciones diferenciales ordinarias de primer orden (presentar la teoría de los métodos Runge Kutta). Ecuaciones de Movimiento: Condiciones Iniciales: ′ rCG φ θ ψ R R = R ✁k′R j A R φi VCG γ R φn = nnT + λ R VCG VCG cos(γ )cos(λ ) T = R VCG cos(γ )sen(λ )    − sen (γ )  dVCG d d mA b I Fuerzas y Momentos: c tan(α ) = VCGZ VCGX j FA = R 180 −α (C D i V + n VCGV = R πjT−α VCG tan (β ) = − VCGVY VCGVX FT = ∑ Ti e i i =1 Fg = m A R T k ′ F = Fg + FT + FA + FAs + Fm + Fd M = M T + M A + M As + M m + Anexos Estándar Internacional de la Atmósfera Terrestre El comportamiento de un vehículo al interior de una masa de fluido depende fundamentalmente de la forma en que varíen las propiedades del fluido con respecto al espacio y al tiempo; nos referimos a propiedades tales como la presión, temperatura densidad y viscosidad. Por ello es esencial estudiar el comportamiento de una masa fluida en reposo sometida a diferentes condiciones. De hecho, la atmósfera es una capa de fluido que envuelve a ciertos planetas y que, debido a diversos fenómenos físicos y químicos, puede considerarse como estratificada en regiones hidrostáticas con condiciones que varían de una región a otra. La mayoría de los fenómenos aludidos modifican la energía interna de las partículas de fluido de modo que las condiciones que distinguen a una capa de otra son condiciones sobre el comportamiento de la temperatura. Precisamente, debido a estas variaciones de temperatura, la capa de fluido no es en realidad estática, sino que existen corrientes dominantes y celdas de convección en cada una de las capas. Sin embargo, estos fenómenos son demasiado complejos como para poder modelarlos de manera precisa. La solución adoptada internacionalmente en el caso de la atmósfera terrestre es lo que conocemos como atmósfera estándar internacional. Un estándar de este tipo se utiliza para la planificación bajo condiciones idénticas y para verificar resultados experimentales. Permite también la unificación de rangos en pruebas y en la calibración de instrumentos, principalmente en altímetros y barómetros. Se recomienda su uso en el tratamiento de resultados de observaciones en geofísica, meteorología y aeronáutica. La atmósfera estándar comenzó a desarrollarse en la segunda década del siglo veinte de manera independiente en Estados Unidos y en Europa. La organización “National Advisory Committee for Aeronautics” (NACA), que posteriormente fue transformada en la “National Aeronautics and Space Administration” NASA, generó el estándar conocido como “American Standard Atmosphere” (ASA). Mientras que el estándar europeo fue desarrollado por la “International Commission for Aerial Navigation” (ICAN). Ambos estándares eran prácticamente idénticos, salvo por muy pequeñas diferencias. Estas diferencias fueron resueltas por un comité internacional de modo que la Atmósfera Estándar Internacional (ISA, “International Standard Atmosphere”) fue adoptada por la Organización de Aviación Civil Internacional (OACI) en 1952. A partir de esa fecha, el estándar a sufrido algunas modificaciones de modo que la última publicación de la OACI es el documento Doc 7488-CD de 1993. El estándar de la “International Standard Organization” ISO es el documento ISO 2533:1975. El estándar conocido como la “US Standard Atmosphere” es el documento NASA TM-X-74335 emitido en 1976. Por razones de disponibilidad, este anexo está basado mayormente en este último documento. Finalmente, puesto que en la bibliografía aeronáutica, sobre todo la más antigua, se acostumbra anexar una serie de tablas de atmósfera estándar para “facilitar” los cálculos, nosotros realizaremos una comparación gráfica entre los valores de temperatura, presión densidad y viscosidad, dados en la literatura y los obtenidos con las fórmulas. Nosotros recomendamos fuertemente que el estudiante utilice las fórmulas que definen a los modelos (que aprenda a programarlas y utilizarlas dentro de sus algoritmos como funciones de utilidad) en lugar de leer tablas y hacer interpolaciones en las mismas. Este último método debe ser considerado arcaico y con una precisión deplorable, además, debe ser considerado como fuente de una infinidad de errores aritméticos que nublan el entendimiento. El concepto principal que debe asimilarse es que el estándar de la atmósfera internacional está basado en un perfil de temperatura con respecto a la altitud. Este perfil es fijo en con respecto al tiempo y fue determinado mediante un intenso programa de observaciones empíricas. El perfil de temperatura está formado por dos tipos de regiones: regiones a temperatura constante (denominadas pausas) y regiones con una variación lineal de la temperatura (denominadas capas esféricas o simplemente capas). En seguida, las propiedades de la atmósfera tales como presión y densidad pueden ser expresadas analíticamente como funciones de la altitud mediante la ecuación de la hidrostática y la ecuación de estado de los gases. Sin embargo, antes de proceder con el desarrollo de las fórmulas, debemos establecer claramente lo que se entiende por “altitud”. Tenemos tres diferentes definiciones de altitud: absoluta, geométrica y geopotencial. La altitud absoluta es la distancia a partir del centro de la tierra hasta el punto que se está analizando. Por su parte, la altitud geométrica es la distancia a partir del nivel medio del mar hasta el punto en cuestión. Estas dos altitudes se relacionan mediante la siguiente expresión: ha = hG + R0 en donde ha es la altitud absoluta, hG es la altitud geométrica y R0 = 6.356766 × 106 [m ] es el radio de la esfera denominada nivel medio del mar. Históricamente, las medidas de las propiedades atmosféricas se basaban en la suposición de que la aceleración de la gravedad es constante. Esta suposición condujo a la creación del concepto de altitud geopotencial. La distancia geopotencial es la distancia, en un campo gravitatorio constante, que sería necesario recorrer para obtener el mismo incremento de energía potencial (por unidad de masa) que en un campo gravitatorio real (que varía con la distancia): g 0dh = g (hG )dhG [ ] en donde g 0 = 9.80665 m s 2 es la aceleración de la gravedad al nivel medio del mar g (0) = g 0 y es también el campo gravitatorio constante que se adopta como referencia. Por otro lado, se sabe que la aceleración de la gravedad terrestre varía con la altitud geométrica como:  R0   g (hG ) = g 0   R0 + hG  2 por lo que, substituyendo en la ecuación anterior obtenemos: 2  R0   dhG dh =   R0 + hG  integrando esta relación desde el nivel medio del mar en el que h = hG = 0 obtenemos la fórmula para la altitud geopotencial: h= R0hG R0 + hG Puesto que el estándar está basado en la altitud geopotencial, en realidad debemos calcular la altitud geométrica correspondiente, es decir: hG = R0 h R0 − h Es de señalar que, en la práctica, la diferencia entre las altitudes geométrica y potencial es importante sólo para altitudes geométricas superiores a los quince kilómetros. Una vez definido el concepto de altitud geopotencial, el paso siguiente consiste en definir el rango de altitudes geopotenciales o geométricas en el cual es válido el estándar. Generalmente, las normas internacionales han sido emitidas hasta altitudes de mil kilómetros. Sin embargo, puesto que nuestro objetivo es el estudio del movimiento de vehículos dentro de la capa fluida, debemos adoptar un límite mucho menor ya que cuando la capa fluida se enrarece, los efectos aerodinámicos sobre el movimiento se vuelven despreciables. Fue el científico húngaro – americano Theodore Von Kármán quien propuso que el límite superior de la atmósfera, para propósitos prácticos, estuviera definido como aquella altitud a la cual un vehículo tendría que viajar más rápido que la velocidad orbital correspondiente como para producir el levantamiento necesario para sostenerse. Von Kármán determinó que esta altitud es muy cercana a los 100 kilómetros y propuso esta cifra como definición. En honor a este científico, la altitud de cien kilómetros se conoce con el nombre de Línea de Von Kármán y, de hecho, hoy en día la “Fédération Aéronautique Internationale” (FAI) considera esta altitud como la línea de separación entre la aeronáutica y la astronáutica. Así, nosotros estudiaremos el estándar internacional de la atmósfera terrestre en el rango de cero a cien kilómetros de altitud, es decir, entre la línea del nivel medio del mar y la línea de Von Kármán. Esta región se divide en ocho sub regiones con diferentes propiedades. Las capas y pausas del estándar internacional de la atmósfera terrestre se definen en la tabla siguiente. Para referencia se ha agregado una columna con la altitud geométrica correspondiente. De hecho, la mesopausa tiene su límite antes de la línea de Von Kármán, pero nosotros la extenderemos hasta los cien kilómetros considerando que, para los propósitos de este trabajo, la diferencia es despreciable. La troposfera comienza en la línea del nivel medio del mar y se extiende hasta los 11 kilómetros. Esta capa es calentada principalmente por la transferencia de energía de la superficie terrestre así que, en promedio, la base es más caliente y la temperatura decrece con la altitud. Esta situación, claramente inestable para un fluido compresible, favorece una mezcla vertical de los gases y es por este fenómeno que la capa toma su nombre de la palabra griega “ ” que significa vuelta o giro. La mayoría de los vehículos de pasajeros se desenvuelven en esta capa. Las masas de aire en la troposfera se encuentran en constante movimiento de modo que la región se caracteriza por vientos cambiantes, ráfagas y mucha turbulencia. La influencia de la turbulencia y los fuertes gradientes de velocidad sobre la integridad estructural de la aeronave y sobre su desempeño siguen siendo temas importantes de investigación en aeronáutica. Las cargas estructurales impuestas sobre una aeronave durante un encuentro con aire turbulento pueden reducir la vida útil del planeador o bien, en caso de turbulencia severa, pueden causar daño estructural. Los gradientes de velocidad son un fenómeno atmosférico importante que puede ser de peligro para las aeronaves durante los despegues o los aterrizajes. La tropopausa se extiende desde los once hasta los veinte kilómetros. Es una región en donde el movimiento del aire pierde la variabilidad que caracteriza a la troposfera. La siguiente capa es la estratosfera. Está compuesta de dos sub capas con gradientes de temperatura diferentes pero ambos negativos. La primera subcapa se extiende desde el límite de la tropopausa hasta los veinte kilómetros, mientras que la segunda llega hasta los treinta y dos kilómetros. La variabilidad del movimiento del aire se reduce significativamente debido a que el gradiente de temperatura se invierte y esto restringe la turbulencia y la mezcla. A diferencia de la troposfera, la estratosfera es una región relativamente tranquila, libre de ráfagas y turbulencia, pero caracterizada por vientos constantes de alta velocidad. Se han medido velocidades de viento de hasta 37 metros por segundo. La estratopausa se extiende de los treinta y dos hasta los cincuenta y un kilómetros manteniendo una temperatura muy cercana a los cero grados centígrados y una presión de una milésima de la presión al nivel del mar aproximadamente. Sobre la estratopausa se encuentra la mesosfera que está compuesta también de dos subcapas que se diferencian por el valor del gradiente de temperatura. La primera subcapa abarca de los cincuenta y uno hasta los setenta y un kilómetros, mientras que la segunda comienza aquí y termina a los ochenta y cinco kilómetros aproximadamente. En esta región es en donde la mayoría de los meteoritos se desintegran. La temperatura decrece con la altitud por lo que pueden existir vientos variables y turbulencia. La mesopausa, abarca desde los ochenta y cinco kilómetros hasta la línea de Von Kármán (cien kilómetros, para los propósitos de este trabajo). Esta región es considerada como el lugar más frío de la tierra. La temperatura es prácticamente constante con un valor de unos ciento setenta grados Kelvin, es decir como unos cien grados centígrados por debajo del cero. Sobre de esta capa se encuentra una capa muy amplia conocida como termosfera ya que la temperatura comienza a aumentar y puede llegar hasta los 2000 ºK. Sin embargo, el gas esta tan enrarecido a esas altitudes, que el concepto de temperatura tal y como lo conocemos pierde su sentido Considerando una temperatura T0 = 15º C = 288.15º K al nivel medio del mar, en la gráfica siguiente se muestra el perfil de temperatura que define la atmósfera estándar internacional entre cero y cien kilómetros de altitud (geométrica). Las fórmulas para la presión y la densidad del aire se obtienen a partir de la ecuación de la hidrostática. Trataremos primero el caso de las capas esféricas en las cuales el gradiente de temperatura es lineal. Suponiendo la aceleración de la gravedad constante tenemos: dP = − ρ (h )g 0 dh Si tomamos en cuenta la ecuación de estado del gas: P = ρ (h )RaT (h )  m2  en donde Ra = 287  2  es la constante del gas para el aire y T es la temperatura, s º K  podemos obtener, dividiendo ambas expresiones: dP g dh =− 0 P RaT (h ) De modo que si en la capa considerada la temperatura varía como: T (h ) = Tc + λ (h − hc ) tendremos:  T + λ (h − hc )  P g  ln  = − 0 ln c Ra λ  Tc  Pc   En donde Pc , Tc , hc son la presión, la temperatura y la altitud geopotencial en la base de la capa esférica. Esta ecuación puede escribirse en forma más conveniente como: P T  =  Pc  Tc  − g0 Ra λ la variación de la densidad puede determinarse a partir de la ecuación de estado, una vez conocida la presión: ρT P = Pc ρ cTc en donde ρ c es la densidad en la base de la capa esférica. Substituyendo el valor de la presión obtenemos: ρ T  =  ρ c  Tc   g  −  1+ 0   Ra λ  Por otra parte, para las pausas de la atmósfera estándar, sabiendo que se trata de regiones isotérmicas, partimos de la ecuación de la hidrostática nuevamente y obtenemos: P g ln  = − 0 (h − h p ) RT p  Pp  en donde Pp , T p , h p son la presión, la temperatura y la altitud geopotencial en la base de la pausa. La expresión anterior puede escribirse como: − P =e Pp ( g0 h − h p ) Ra T p la variación de la densidad en las pausas será: − ρ =e ρp ( g0 h −h p ) Ra T p Por su parte, la viscosidad del aire depende fuertemente de la temperatura. La variación de esta propiedad puede calcularse mediante la fórmula de Sutherland que tiene su origen en una teoría cinética de gases pero que, finalmente, es ajustada empíricamente a datos experimentales. La fórmula es: 3  T 2 T + S µ = µ0   0  T0  T + S en donde µ0 y T0 son ciertos valores de referencia y S es la llamada temperatura de Sutherland. La fórmula de Sutherland es válida para varios gases puros y no aplica para mezclas de gases. Sin embargo, el aire, siendo una mezcla, califica para el uso de la fórmula debido a que sus dos principales componentes, oxígeno y nitrógeno, son moléculas diatómicas muy similares. Tanto los valores de referencia como la temperatura de Sutherland difieren para cada sustancia y se determinan experimentalmente. En el caso del aire se pueden usar los siguientes valores:  Ns  ; T0 = 288.15[º K ] ; S = 110.1[º K ] 2  m  µ0 = 1.812 × 10−5  Ahora bien, utilizando los valores en la base de cada región podemos introducir un conjunto de variables reducidas que ayudan a simplificar los cálculos. Definamos primero una variable de altitud en unidades del radio terrestre: ζ = h R0 Para la aceleración de la gravedad a cada altitud podemos introducir la variable: γ= 1 g = g 0 (1 + ζ )2 Ahora bien, en cada capa, definimos el gradiente: λh = Tc h − hc entonces, para la temperatura podemos introducir la variable: θ= T = 1 + λc λh en las capas y θ = 1 en las pausas Tc en donde λc es el gradiente estándar de la capa correspondiente. Enseguida, para la presión tendremos: g0 g0 − − P δ = = θ Ra λc en las capas y δ = e Ra λh en las pausas Pc y para la densidad:  g0  g0 a c a h  −  1+ − ρ R λ  =θ  en las capas y σ = e R λ en las pausas σ= ρc Una propiedad muy interesante de la fórmula de Sutherland es su autosimilaridad, es decir, si el valor µc se calcula con la misma fórmula para la temperatura Tc , entonces, estos valores pueden utilizarse en lugar de los valores de referencia µ0 y T0 . Por lo tanto, suponiendo que se conocen los valores en la base de la región, podemos introducir la variable: 3 2 1 + θS µ  T  Tc + S en las capas y π = 1 en las pausas =   =θ π= θ + θS µc  Tc  T + S 3 2 en donde θ S = S Tc será la constante de Sutherland reducida en la región que se trate. Resumiendo todo lo anterior, podemos realizar la siguiente tabla de constantes, valores de referencia y fórmulas para las regiones de la atmósfera estándar consideradas:  m2  Constantes: Ra = 287  2  ; S = 110.1[º K ] ; R0 = 6.356766 × 106 [m ] s º K  Nivel Medio del Mar: g 0 = 9.80665 m s 2 ; [ ]  Ns  T0 = 288.15[º K ] ; P0 = 101325[Pa ] ; ρ 0 = 1.225[º K ] ; µ0 = 1.812 × 10 −5  2  m  Troposfera: 0 ≤ h ≤ 11 [Km] ; hc = 0 ; λc = −6.5[º K Km]; θ S = S T0 − T λh = 0 ; θ = 1 + λc λh ; δ = θ h 1000 g 0 Ra λc ; σ =θ  1000 g 0 −  1+ Ra λc     3 ; π =θ 2 1 + θS θ + θS Altitud 11 kilómetros: − θ1 = 1 + 11λc T0 ; δ1 = θ1 1000 g 0 Ra λc  1000 g 0 −  1+ Ra λc  1 ; σ1 = θ    3 ; π 1 = θ12 1 + θS θ1 + θ S T1 = T0θ1 ; P1 = P0δ1 ; ρ1 = ρ 0σ 1 ; µ1 = µ0π 1 Tropopausa: 11 ≤ h ≤ 20 [Km] ; hc = 11 ; λc = 0[º K Km] ; θ S = S T1 g0 g0 − − T λh = 1 ; θ = 1 ; δ = e Ra λh ; σ = e Ra λh ; π = 1 h − 11 Altitud 20 kilómetros: − 9000 g 0 − 9000 g 0 θ2 = 1 ; δ 2 = e R T ; σ 2 = e R T ; π 2 = 1 T2 = T1θ 2 ; P2 = P1δ 2 ; ρ 2 = ρ1σ 2 ; µ2 = µ1π 2 a 1 a 1 Estratosfera I: 20 ≤ h ≤ 32 [Km] ; hc = 20 ; λc = 1 [º K Km] ; θ S = S T2 − T λh = 2 ; θ = 1 + λc λh ; δ = θ h − 20 Altitud 32 kilómetros: 1000 g 0 Ra λc ; σ =θ  1000 g 0 −  1+ Ra λc     3 ; π =θ 2 1 + θS θ + θS − θ 3 = 1 + 12λc T2 ; δ 3 = θ3 1000 g 0 Ra λc  1000 g 0 −  1+ Ra λc  3 ; σ3 = θ    1 + θS θ3 + θ S 3 ; π 3 = θ 32 T3 = T2θ 3 ; P3 = P2δ 3 ; ρ 3 = ρ 2σ 3 ; µ3 = µ2π 3 Estratosfera II: 32 ≤ h ≤ 47 [Km] ; hc = 32 ; λc = 2.8 [º K Km]; θ S = S T3 − T λh = 2 ; θ = 1 + λc λh ; δ = θ h − 32 1000 g 0 Ra λc ; σ =θ  1000 g 0 −  1+ Ra λc     3 ; π =θ 2 1 + θS θ + θS Altitud 47 kilómetros: − θ 4 = 1 + 15λc T3 ; δ 4 = θ 4 1000 g 0 Ra λc ; σ4 = θ  1000 g 0 −  1+ Ra λc  4    3 ; π 4 = θ 42 1 + θS θ4 + θ S T4 = T3θ 4 ; P4 = P3δ 4 ; ρ 4 = ρ 3σ 4 ; µ4 = µ3π 4 Estratopausa: 47 ≤ h ≤ 51 [Km] ; hc = 4 ; λc = 0[º K Km] ; θ S = S T4 g0 g0 − − T λh = 4 ; θ = 1 ; δ = e Ra λh ; σ = e Ra λh ; π = 1 h − 47 Altitud 51 kilómetros: valores de referencia cinco − 4000 g 0 Ra T4 − 4000 g 0 Ra T4 θ5 = 1 ; δ 5 = e ; σ5 = e ; π5 = 1 T5 = T4θ 5 ; P5 = P4δ 5 ; ρ 5 = ρ 4σ 5 ; µ5 = µ4π 5 Mesosfera I: 51 ≤ h ≤ 71 [Km] ; hc = 51 ; λc = −2.8 [º K Km] ; θ S = S T5 − T λh = 2 ; θ = 1 + λc λh ; δ = θ h − 51 1000 g 0 Ra λc ; σ =θ  1000 g 0 −  1+ Ra λc     3 ; π =θ 2 1 + θS θ + θS Altitud 71 kilómetros: − θ 6 = 1 + 20λc T5 ; δ 6 = θ 6 1000 g 0 Ra λc ; σ6 = θ  1000 g 0 −  1+ Ra λc  6    3 ; π 6 = θ 62 1 + θS θ6 + θ S T6 = T5θ 6 ; P6 = P5δ 6 ; ρ 6 = ρ 5σ 6 ; µ6 = µ5π 6 Mesosfera II: 71 ≤ h ≤ 84.855 [Km] ; hc = 71 ; λc = −2.0 [º K Km]; θ S = S T6 − T λh = 2 ; θ = 1 + λc λh ; δ = θ h − 71 1000 g 0 Ra λc ; σ =θ  1000 g 0 −  1+ Ra λc  Altitud 84.855 kilómetros: valores de referencia siete Mesopausa: fórmulas de la pausa con valores siete Línea de Von Kármán: valores de referencia ocho    3 ; π =θ 2 1 + θS θ + θS Posición Nivel Medio del Mar Troposfera Tropopausa Estratosfera I Estratosfera II Estratopausa Mesosfera I Mesosfera II Mesopausa y Línea de Von Kármán Densidad Viscosidad 288.15 101325 Kg m 3 1.225 m2 s 1.479e-5 216.65 216.65 228.65 270.65 270.65 214.65 186.94 186.94 0.363 0.088 0.013 0.001 8.583e-4 6.387e-5 6.909e-6 4.333e-7 3.939e-5 1.629e-4 1.137e-3 1.212e-2 2.008e-2 2.225e-1 1.822 29.061 Altitud Geopotencial Altitud Geométrica Temperatura Presión Km Km ºK Pa 0 0.000 11 20 32 47 51 71 84.855 98.451 11.019 20.063 32.162 47.349 51.412 71.800 86.000 100.000 22614 5466 865 110 66 4 0.370 0.023 Métodos de Runge Kutta. Como hemos visto con el método de Euler, el objetivo de cualquier método para resolver ecuaciones diferenciales ordinarias debe ser evaluar las coordenadas del sistema q en el instante tn +1 , a partir del conocimiento de las mismas en un instante anterior tn . Fue Runge el primer investigador en sugerir que era posible evitar las diferenciaciones sucesivas de la serie de Taylor sin perder la precisión del método. El punto principal de su sugerencia es utilizar el operador de evolución F(t , q ) = q evaluado en diversos puntos del intervalo (tn , tn +1 ) para, mediante una combinación lineal con parámetros que deberán determinarse, igualar la precisión del desarrollo de Taylor. Definamos, primeramente, la forma general de los métodos de Runge Kutta. Las nuevas coordenadas serán evaluadas mediante la combinación lineal: K q n +1 = q n + ∑ wi ki i =1 en donde los wi son los coeficientes que deben ser determinados y los ki son evaluaciones del operador de evolución en los K puntos internos del intervalo (tn , tn +1 ) : K   ki = hF tn + ci h, q n + ∑ aij k j  j =1   en donde se define siempre c1 = 0 y h = tn +1 − tn es el intervalo de tiempo. Algunos comentarios son necesarios. Primeramente, si se satisface la condición aij = 0 para los índices i ≤ j , entonces los ki pueden evaluarse sucesivamente y el método se denomina explícito. En efecto, los ki son: k1 = hF(tn , q n ) k 2 = hF(tn + c2 h, q n + a21k1 ) k3 = hF(tn + c3h, q n + a31k1 + a32 k 2 ) k K = hF(tn + cK h, q n + a K 1k1 + a K 2 k2 + a K 3k3 + a K , K −1k K −1 ) y es evidente que estas cantidades pueden evaluarse sucesivamente sin ninguna dificultad. En cambio, si la condición aij = 0 para i ≤ j no es satisfecha, los ki son: k1 = hF(tn + c1h, q n + a11k1 + a12 k 2 + a1K k K ) k3 = hF(tn + c3h, q n + a31k1 + a32 k 2 + a3 K k K ) k 2 = hF(tn + c2 h, q n + a21k1 + a22 k2 + k K = hF(tn + ci h, q n + a K 1k1 + a K 2 k 2 + a2 K k K ) a KK k K ) lo cual genera un sistema no lineal en los ki muy difícil de resolver. Estos métodos se denominan implícitos. Es fácil reconocer lo que representa el primer método de Runge – Kutta, es decir, si hacemos K = 1 obtenemos: q n +1 = q n + w1hF(tn , q n ) lo que, comparando con los primeros términos de la serie de Taylor de para q n +1 : q n +1 = q n + hq + O (h 2 ) junto con el operador de evolución F(t , q ) = q nos da: w1 = 1 por lo que, finalmente, obtenemos el método de Euler: q n +1 = q n + hF(tn , q n ) Este sencillo procedimiento puede extenderse para métodos más elaborados con K > 1 . Cálculo de coeficientes para métodos explícitos. Método de cuarto orden. Método de quinto orden. Método Runge Kutta Felhberg de paso adaptativo.