Unidad 5: Diferenciabilidad de campos escalares y vectoriales.
Para esta unidad nos proponemos los siguientes objetivos:
1. Comprender el concepto de diferenciabilidad de funciones escalares y vectoriales y sus relaciones
con la derivabilidad y la continuidad.
2. Comprender la relación entre la diferenciabilidad de un campo escalar en un punto y la existencia
del espacio tangente.
3. Conocer y aplicar el teorema de la derivación de funciones compuestas a problemas que involucren
campos escalares y vectoriales.
4. Comprender la relación entre el vector gradiente de una función escalar diferenciable y sus
conjuntos de nivel.
Introducción
En el curso de Análisis Matemático I, se definió la derivabilidad de una función de variable real en un punto
como aquélla para la cual existe la derivada en dicho punto. Para funciones de varias variables no es posible
generalizar de manera directa, ya que hemos visto que pueden existir las derivadas parciales y, sin embargo, no
admitir derivada direccional en ninguna otra dirección en el punto, o bien ser discontinua en un punto y admitir
derivada en toda dirección en dicho punto. En consecuencia, la derivada direccional no constituye una extensión
satisfactoria del concepto de derivada para funciones de una variable real. Con el objeto de establecer una
generalización eficiente es preciso profundizar algunos conceptos, ya que la idea de función derivable es un
algo más compleja para funciones de varias variables.
Por lo tanto, desarrollaremos una generalización más conveniente que implica la continuidad y que, al mismo
tiempo, posibilite la extensión natural de los resultados de la teoría de derivación en una dimensión a varias
variables. Definiremos la diferenciabilidad de funciones de varias variables reales. Como veremos, la
diferenciabilidad es una propiedad local, que implica la continuidad. Entre las reglas de diferenciación
destacaremos posteriormente la regla de la cadena.
Con el objeto de comprender el significado de esta generalización, es preciso que recordemos los conceptos de
derivada y diferencial para funciones reales de una variable real, como así también sus interpretaciones
geométricas.
1
Recuerdos imborrables
Una función real de una variable real 𝑓: 𝐴 ⊂ 𝑅 → 𝑅, con 𝑥0 ∈ 𝐴° , definida al menos en un entorno del punto
𝑓(𝑥)−𝑓(𝑥0 )
𝑓(𝑥 +ℎ)−𝑓(𝑥0 )
𝑥0 , es derivable en dicho punto, si existe lim
= lim 0
= 𝑓 ′ (𝑥0 ) = 𝑡𝑔𝛽̂.
𝑥→𝑥0
𝑥−𝑥0
ℎ
ℎ→0
El valor de la derivada representa, desde el punto de vista geométrico, la pendiente de la recta tangente a la
curva 𝑦 = 𝑓(𝑥) en el punto (𝑥0 , 𝑦0 ), cuya ecuación es: 𝑦 = 𝑓(𝑥0 ) + 𝑓 ′ (𝑥0 )(𝑥 − 𝑥0 )
Sabemos que:
𝑓 ′ (𝑥0 ) = lim
𝑥→𝑥0
𝑓(𝑥)−𝑓(𝑥0 )
𝑥−𝑥0
⇔
lim
𝑥→𝑥0
𝑓(𝑥)−𝑓(𝑥0 )−𝑓′ (𝑥0 )(𝑥−𝑥0 )
𝑥−𝑥0
= lim
ℎ→0
𝑓(𝑥0 +ℎ)−𝑓(𝑥0 )−ℎ.𝑓′ (𝑥0 )
ℎ
(1)
(por propiedad de los límites que afirma: Si una función tiene límite en un punto, entonces la diferencia entre
función y el límite es un infinitésimo en dicho punto)
En este caso, la diferencia entre las imágenes de la función y las correspondientes a la recta tangente es un
infinitésimo de orden superior a 𝑥 − 𝑥0 .
A la transformación lineal 𝑇: 𝑅 → 𝑅/𝑇(ℎ) = ℎ. 𝑓 ′ (𝑥0 ) = 𝑑𝑓(𝑥0 , ℎ) se la denomina diferencial de la función 𝑓
en el punto 𝑥0 , cuyo valor representa geométricamente la ecuación de la recta tangente referida a unos nuevos
ejes coordenados paralelos a 𝑥 e 𝑦 con origen en el punto 𝑃, en la figura 5.1, el diferencial está representado
por la longitud del segmento ̅̅̅̅
𝑅𝑆, es decir, es el incremento de la ordenada medido sobre la tangente a la curva en
ese punto.
Figura 5.1: Diferencial de una función de una variable real.
La longitud del segmento ̅̅̅̅
𝑄𝑅 coincide con 𝑓(𝑥0 + ℎ) − 𝑓(𝑥0 ) − ℎ. 𝑓 ′ (𝑥0 ) y depende del incremento ℎ, y si a
dicha longitud se la designa 𝜇(ℎ) , entonces: lim
𝑓 es diferenciable en 𝑥0 .
ℎ→0
𝑓(𝑥0 +ℎ)−𝑓(𝑥0 )−ℎ.𝑓′ (𝑥0 )
ℎ
= lim
𝜇(ℎ)
ℎ→0 ℎ
que vale 0 cuando la función
2
Por ello, la aplicación lineal 𝑇(ℎ) es una buena aproximación de la función 𝑓(𝑥) en el entorno del punto 𝑥0
Recordemos que las igualdades (1) son las que permiten comprender intuitivamente el significado analítico de
la derivada: la función 𝑃: 𝑅 → 𝑅 definida por 𝑃(𝑥) = 𝑓(𝑥0 ) + 𝑓 ′ (𝑥0 ). (𝑥 − 𝑥0 ) ∀𝑥 ∈ 𝑅, que es un polinomio de
primer grado, es una buena aproximación de 𝑓 en las cercanías del punto 𝑥0 , puesto que la diferencia 𝑓(𝑥) −
𝑃(𝑥) tiende a cero en el punto 𝑥0 , “mucho más rápidamente” que la diferencia (𝑥 − 𝑥0 ).
Por ello es válida la aproximación 𝑓(𝑥) ≈ 𝑃(𝑥) para valores cercanos al punto 𝑥0 .
Esto fundamenta el establecimiento del siguiente teorema.
Teorema 5.1: Sea 𝑓: 𝐴 ⊂ 𝑅 → 𝑅, con 𝑥0 ∈ 𝐴° . Las siguientes proposiciones son equivalentes:
a. 𝑓 es derivable en 𝑥0 y el valor de la derivada es 𝑓′(𝑥0 ).
b. Existe una única transformación lineal 𝑇: 𝑅 → 𝑅/𝑇(ℎ) = ℎ. 𝑓 ′ (𝑥0 ) tal
lim
ℎ→0
𝑓(𝑥0 +ℎ)−𝑓(𝑥0 )−ℎ.𝑓′ (𝑥0 )
ℎ
que
= 0.
c. Existe un número real 𝑓 ′ (𝑥0 ) y una función de variable real definida en un entorno de 0,
𝜇(ℎ)
𝜇: 𝐸(0, 𝛿) → 𝑅/𝑓(𝑥0 + ℎ) − 𝑓(𝑥0 ) = ℎ. 𝑓 ′ (𝑥0 ) + 𝜇(ℎ) y lim
= 0.
ℎ→0 ℎ
Cabe destacar que si 𝑓 es una función vectorial o escalar de varias variables el límite lim
ℎ→0
𝑓(𝑥0 +ℎ)−𝑓(𝑥0 )−ℎ.𝑓′ (𝑥0 )
ℎ
=
0 carece de sentido ya que el denominador es un vector. En ese caso se reemplaza este vector por su norma
para que sea posible realizar una generalización de este teorema para funciones escalares de varias variables.
Ahora detallaremos la relación local (no global, en todo el dominio de la función) entre continuidad,
derivabilidad y diferenciabilidad de funciones de varias variables en un punto dado 𝑥⃗0
1. No existe relación alguna entre la existencia de las derivadas direccionales y la continuidad de la función en
el punto: existen funciones continuas que no admiten alguna (incluso ninguna) derivada direccional; y,
recíprocamente, existen funciones que tienen todas las derivadas direccionales y no son continuas.
2. Tampoco existe relación entre la existencia de las derivadas parciales (ambas discontinuas, necesariamente)
y la existencia de las restantes derivadas direccionales.
3. Sin embargo, si la función es diferenciable, entonces es continua. El recíproco es falso: hay funciones
continuas que no son diferenciables.
4. Si la función es diferenciable en un punto, entonces admite derivadas direccionales según cualquier dirección
en ese punto (esta proposición será demostrada a posteriori) El recíproco es falso: la existencia de todas las
derivadas direccionales no garantiza la diferenciabilidad de la función.
5. No obstante, si existen las funciones derivadas parciales y son continuas en el punto, entonces es posible
garantizar que la función es diferenciable (y por tanto además admite derivadas direccionales según cualquier
dirección).
6. La diferenciabilidad de la función no asegura que las derivadas parciales sean continuas en el punto.
7. Las funciones 𝑓 que admiten las derivadas parciales continuas se dicen de clase 𝐶 1 , y se expresa 𝑓 ∈ 𝐶 1
En particular, son diferenciables (aunque no todas las funciones diferenciables son de clase 𝐶 1 , como se ha
dicho previamente).
3
Definición 5.1: Función vectorial diferenciable.
Una función 𝑓⃗: 𝐴 ⊂ 𝑅𝑛 → 𝑅𝑚 y 𝑥⃗0 = (𝑎1 , 𝑎2 , … , 𝑎𝑛 ) ∈ 𝐴° se llama diferenciable en el punto 𝑥⃗0 , si
⃗⃗: 𝑅𝑛 → 𝑅𝑚 (que depende de la función 𝑓⃗ como del punto 𝑥⃗0 ) que
existe una transformación lineal 𝑇
verifica:
⃗⃗) − 𝑓⃗(𝑥⃗0 ) − 𝑇
⃗⃗(ℎ⃗⃗)‖
‖𝑓⃗(𝑥⃗0 + ℎ
=0
⃗⃗→0
⃗⃗
ℎ
‖ℎ⃗⃗‖
lim
Usando las propiedades de la norma, es fácil comprobar que esta igualdad es equivalente a:
⃗⃗) − 𝑓⃗(𝑥⃗0 ) − 𝑇
⃗⃗)
⃗⃗(ℎ
𝑓⃗(𝑥⃗0 + ℎ
=0
⃗⃗→0
⃗⃗
ℎ
‖ℎ⃗⃗‖
lim
⃗⃗ es un vector, es el vector de los incrementos ℎ⃗⃗ = (ℎ1 , ℎ2 , … , ℎ𝑛 ) ∈ 𝑅𝑛
Es importante destacar que ℎ
⃗⃗(ℎ⃗⃗)está definida
Dado que 𝑥⃗0 es un punto interior del dominio de 𝑓⃗, la expresión 𝜇⃗(ℎ⃗⃗) = 𝑓⃗(𝑥⃗0 + ℎ⃗⃗) − 𝑓⃗(𝑥⃗0 ) − 𝑇
⃗⃗, 𝑟)).
en alguna bola con centro en ⃗0⃗ (𝐵(0
Esta definición es equivalente a la que sigue:
Definición 5.2: Una función𝑓⃗: 𝐴 ⊂ 𝑅𝑛 → 𝑅𝑚 y 𝑥⃗0 = (𝑎1 , 𝑎2 , … , 𝑎𝑛 ) ∈ 𝐴° se llama diferenciable
⃗⃗, 𝛿) ⊂
⃗⃗: 𝑅𝑛 → 𝑅𝑚 y una función vectorial 𝜇⃗: 𝐸(0
en el punto 𝑥⃗0 , si existe una transformación lineal 𝑇
⃗⃗
⃗⃗(ℎ⃗⃗) + 𝜇⃗(ℎ⃗⃗) siendo lim 𝜇⃗⃗(ℎ) = ⃗0⃗.
𝑅𝑛 → 𝑅𝑚 /𝑓⃗(𝑥⃗0 + ℎ⃗⃗) − 𝑓⃗(𝑥⃗0 ) = 𝑇
⃗⃗
⃗⃗→0
⃗⃗ ‖ℎ‖
ℎ
⃗⃗) difiere de una función afín [𝑓⃗(𝑥⃗0 ) + 𝑇
⃗⃗(ℎ⃗⃗)] en una función vectorial
Esta última condición expresa que 𝑓⃗(𝑥⃗0 + ℎ
⃗⃗) que se aproxima al vector nulo más rápido que el orden lineal cuando ℎ
⃗⃗ → 0
⃗⃗.
infinitésimo 𝜇⃗(ℎ
⃗⃗: 𝑅𝑛 → 𝑅𝑚 existe, entonces es única. De esta forma, la
Es posible demostrar que si esta transformación lineal 𝑇
⃗⃗ recibe el nombre de diferencial de 𝑓⃗ en 𝑥⃗0 y se designa 𝑑𝑓⃗(𝑥⃗0 , ℎ⃗⃗) o bien 𝐷𝑓⃗(𝑥⃗0 ), cuya
transformación lineal 𝑇
matriz asociada respecto de las bases canónicas de 𝑅𝑛 y 𝑅𝑚 se denomina matriz jacobiana de 𝑓⃗ en el punto
𝑥⃗0 y se la expresa 𝐽𝑓⃗(𝑥⃗0 ).
4
Teorema 5.2: Unicidad de la diferencial
Si una función 𝑓⃗: 𝐴 ⊂ 𝑅𝑛 → 𝑅𝑚 y 𝑥⃗0 = (𝑎1 , 𝑎2 , … , 𝑎𝑛 ) ∈ 𝐴° , es diferenciable en el punto 𝑥⃗0 , entonces al
diferencial es única.
⃗⃗1 y 𝑇
⃗⃗2 , por lo tanto:
Demostración. Se supone que existen dos diferenciales de 𝑓⃗ en 𝑥⃗0 , 𝑇
⃗⃗
⃗⃗1 (ℎ⃗⃗) + 𝜇⃗1 (ℎ⃗⃗) siendo lim 𝜇⃗⃗1 (ℎ) = ⃗0⃗ y,
𝑓⃗(𝑥⃗0 + ℎ⃗⃗) − 𝑓⃗(𝑥⃗0 ) = 𝑇
⃗⃗‖
⃗⃗→0
⃗⃗ ‖ℎ
ℎ
⃗⃗) + 𝜇⃗2 (ℎ⃗⃗) siendo lim 𝜇⃗⃗2 (ℎ⃗⃗) = ⃗⃗
⃗⃗2 (ℎ
𝑓⃗(𝑥⃗0 + ℎ⃗⃗) − 𝑓⃗(𝑥⃗0 ) = 𝑇
0, luego restando miembro
⃗⃗‖
⃗⃗→0
⃗⃗ ‖ℎ
ℎ
⃗⃗
⃗⃗
⃗⃗
⃗⃗
⃗⃗) = 𝜇⃗2 (ℎ⃗⃗) − 𝜇⃗1 (ℎ
⃗⃗) y así lim 𝑇⃗⃗1 (ℎ)−𝑇⃗⃗2(ℎ) = lim 𝜇⃗⃗2 (ℎ)−𝜇⃗⃗1(ℎ) = 0
⃗⃗.
⃗⃗1 (ℎ⃗⃗) − 𝑇
⃗⃗2 (ℎ
𝑇
⃗
⃗
⃗
⃗
‖ℎ‖
‖ℎ‖
⃗⃗→0
⃗⃗→0
⃗⃗
⃗⃗
ℎ
ℎ
+
⃗⃗
⃗⃗
Si 𝑥⃗ ≠ 0, entonces 𝑡𝑥⃗ → 0 cuando 𝑡 → 0 y, por tanto,
⃗⃗1 (𝑡𝑥⃗)−𝑇
⃗⃗2 (𝑡𝑥⃗)
𝑇
‖𝑡𝑥
⃗‖
𝑡→0
lim+
⃗⃗1 (𝑥⃗)−𝑇
⃗⃗2 (𝑥⃗)]
𝑡[𝑇
|𝑡|‖𝑥
⃗‖
𝑡→0
= lim+
=
⃗⃗1 (𝑥⃗)−𝑇
⃗⃗2 (𝑥⃗)
𝑡
𝑇
lim+ |𝑡|
‖𝑥⃗‖
𝑡→0
a miembro, resulta:
⃗⃗1 (𝑥⃗) = 𝑇
⃗⃗2 (𝑥⃗) ∀𝑥⃗ ≠ ⃗0⃗
de donde 𝑇
Teorema 5.3: Equivalencia para la diferenciabilidad de funciones vectoriales
Sea una función vectorial 𝑓⃗: 𝐴 ⊂ 𝑅𝑛 → 𝑅𝑚 , 𝑥⃗0 = (𝑎1 , 𝑎2 , … , 𝑎𝑛 ) ∈ 𝐴° y 𝑓⃗ = (𝑓1 , 𝑓2 , … , 𝑓𝑚 ), entonces
son equivalentes:
i) 𝑓⃗es diferenciable en 𝑥⃗0 .
ii) 𝑓𝑖 es diferenciable en 𝑥⃗0 , para cada 𝑖 = 1,2, … , 𝑛 (cada función coordenada de 𝑓⃗ es diferenciable en 𝑥⃗0 )
Definición 5.3: Una función 𝑓⃗: 𝐴 ⊂ 𝑅𝑛 → 𝑅𝑚 se dice diferenciable en un conjunto abierto 𝐵 ⊂
𝐴 si es diferenciable en cada uno de los puntos de 𝐵.
Con anterioridad se ha establecido que si una función vectorial 𝑓⃗: 𝐴 ⊂ 𝑅𝑛 → 𝑅𝑚 es diferenciable en un punto
⃗⃗: 𝑅𝑛 → 𝑅𝑚 cuya matriz asociada respecto de las bases canónicas
𝑥⃗0 ∈ 𝐴° existe una única transformación lineal 𝑇
de 𝑅𝑛 y 𝑅𝑚 es la matriz jacobiana de 𝑓⃗ en el punto 𝑥⃗0 y se la expresa 𝐽𝑓⃗(𝑥⃗0 ). Veremos quién es esta matriz.
⃗⃗: 𝑅𝑛 → 𝑅𝑚 respecto de las bases
Teorema 5.4: La matriz asociada a la transformación lineal 𝑇
𝑖 = 1,2, … , 𝑚
𝜕𝑓
canónicas de 𝑅𝑛 y 𝑅𝑚 es la matriz jacobiana 𝐽𝑓⃗(𝑥⃗0 ) = ( 𝑖 (𝑥⃗0 )) con {
𝜕𝑥𝑗
𝑗 = 1,2, … , 𝑛
Demostración. Sea ℎ⃗⃗ = 𝑥⃗ − 𝑥⃗0 , ℎ⃗⃗ = (ℎ1 , ℎ2 , … , ℎ𝑛 ) y la transformación lineal T ( h ) que tiene asociada
𝑡11
⃗⃗
⃗
⃗
una matriz de dimensión 𝑚 × 𝑛 es: 𝑇(ℎ) = ( ⋮
𝑡𝑚1
…
…
…
𝑡1𝑛
ℎ1
⋮ ).( ⋮ )
𝑡𝑚𝑛
ℎ𝑛
⃗
⃗⃗
⃗
⃗⃗
⃗⃗(ℎ)
𝑓(𝑥⃗ +ℎ)−𝑓(𝑥⃗0 )−𝑇
Como 𝑓⃗(𝑥⃗) es diferenciable en el punto 𝑥⃗0 se verifica: lim 0
=0
⃗⃗
⃗⃗→0
⃗⃗
ℎ
‖ℎ‖
5
y por lo tanto, de acuerdo con el teorema de equivalencia para la diferenciabilidad anteriormente
enunciado, este límite debe verificarse componente a componente, por ejemplo, para componente 𝑗
⃗⃗) − 𝑓𝑗 (𝑥⃗0 ) − ∑𝑛𝑘=1 𝑡𝑗𝑘 ℎ𝑘
𝑓𝑗 (𝑥⃗0 + ℎ
lim
=0
⃗⃗→0
⃗⃗
ℎ
‖ℎ⃗⃗‖
Ahora bien, si ℎ⃗⃗ = 𝜆𝑒̌𝑖 siendo 𝑒̌𝑖 el correspondiente versor de la base canónica de 𝑅𝑛
𝑓𝑗 (𝑥⃗0 + 𝜆𝑒̌𝑖 ) − 𝑓𝑗 (𝑥⃗0 )) 𝜆𝑡𝑗𝑖
𝑓𝑗 (𝑥⃗0 + 𝜆𝑒̌𝑖 ) − (𝑓𝑗 (𝑥⃗0 ) + 𝜆𝑡𝑗𝑖 )
𝜕𝑓𝑖
= lim (
−
)=0⇒
(𝑥⃗ ) − 𝑡𝑗𝑖 = 0
⃗⃗→0
⃗⃗→0
⃗⃗
⃗⃗
𝜕𝑥𝑗 0
𝜆
𝜆
𝜆
ℎ
ℎ
lim
En consecuencia,
𝜕𝑓𝑖
𝜕𝑥𝑗
(𝑥⃗0 ) = 𝑡𝑗𝑖
Nota: Es preciso destacar que el límite del primer cociente es la derivada direccional de la función escalar
𝑓𝑗 en el punto 𝑥⃗0 y en la dirección de los versores de la base canónica, es decir, las derivadas parciales de 𝑓𝑗 en
el punto 𝑥⃗0 . De esta forma, la matriz jacobiana es:
𝜕𝑓1
𝜕𝑓1
𝜕𝑓1
(𝑥⃗0 )
(𝑥⃗0 ) …
(𝑥⃗ )
𝜕𝑥2
𝜕𝑥1
𝜕𝑥𝑛 0
𝜕𝑓2
𝜕𝑓2
𝜕𝑓2
(𝑥
⃗
)
(𝑥
⃗
)
(𝑥⃗ )
…
0
0
⃗
(𝑥
)
𝐽𝑓 ⃗0 = 𝜕𝑥1
𝜕𝑥2
𝜕𝑥𝑛 0
⋮
⋮
⋮
…
𝜕𝑓𝑚
𝜕𝑓𝑚
𝜕𝑓𝑚
(𝑥⃗ )
(𝑥⃗ )
(𝑥⃗ ) …
𝜕𝑥𝑛 0 )
( 𝜕𝑥1 0 𝜕𝑥2 0
Si 𝑛 = 𝑚 la matriz es cuadrada y a su determinante se lo denomina determinante Jacobiano o simplemente
Jacobiano de 𝑓⃗ en 𝑥⃗0 .
Es también importante destacar que una función 𝑓⃗ podría no ser diferenciable en 𝑥⃗0 y no obstante todas sus
componentes admitir derivadas parciales en el punto 𝑥⃗0 . De esta forma, es factible construir la matriz descripta
anteriormente, pero se la denomina matriz derivada. Sólo será la matriz jacobiana si 𝑓⃗ es diferenciable en 𝑥⃗0 .
Comentarios:
Es evidente que tomando otras derivadas direccionales en 𝑥⃗0 que no fueran según los vectores de la
⃗⃗). La matriz
⃗⃗(ℎ
base canónica de 𝑅𝑛 se obtendría otra matriz asociada a la transformación lineal 𝑇
Jacobiana 𝐽𝑓⃗(𝑥⃗0 ) es entonces, la matriz asociada a la diferencial referida a la base canónica.
Obsérvese que los coeficientes de la matriz Jacobiana son números cuyo valor, en general, cambia al
cambiar de punto. Esto pone de manifiesto que la transformación lineal depende del punto considerado.
6
Definición 5.4: Función escalar diferenciable.
Una función 𝑓: 𝐴 ⊂ 𝑅𝑛 → 𝑅 y 𝑥⃗0 = (𝑎1 , 𝑎2 , … , 𝑎𝑛 ) ∈ 𝐴° se llama diferenciable en el punto 𝑥⃗0 , si existe
una transformación lineal 𝑇: 𝑅𝑛 → 𝑅 (que depende de la función 𝑓 como del punto𝑥⃗0 ) que verifica:
𝑓(𝑥⃗0 + ℎ⃗⃗) − 𝑓(𝑥⃗0 ) − 𝑇(ℎ⃗⃗)
lim
=0
⃗⃗→0
⃗⃗
⃗⃗‖
ℎ
‖ℎ
⃗⃗)está
Ya que 𝑥⃗0 es un punto interior del dominio de 𝑓, la expresión 𝜇(ℎ⃗⃗) = 𝑓(𝑥⃗0 + ℎ⃗⃗) − 𝑓(𝑥⃗0 ) − 𝑇(ℎ
⃗⃗, 𝑟))
definida en alguna bola con centro en ⃗0⃗ (𝐵(0
Esta definición es equivalente a la que sigue:
Definición 5.5: Una función 𝑓: 𝐴 ⊂ 𝑅𝑛 → 𝑅 y 𝑥⃗0 = (𝑎1 , 𝑎2 , … , 𝑎𝑛 ) ∈ 𝐴° se llama diferenciable en
el punto X 0 , si existe una transformación lineal T : R n R y una función escalar
( h)
0
: E (0, ) R n R / f ( X 0 h) f ( X 0 ) T (h) (h) siendo lim
h 0
h
Esta última condición expresa que f ( X 0 h) difiere de una función afín f ( X 0 ) T (h) en una función escalar
infinitesimal ( h ) que se aproxima a cero más rápido que el orden lineal cuando h 0 . En este sentido T ( h )
es una buena aproximación local de f ( X 0 h) f ( X 0 )
De la misma forma que se mostró para funciones vectoriales diferenciables, esta transformación lineal
T : R n R existe, es única y recibe el nombre de diferencial de f en X 0 y se designa df ( X 0 , h) o bien
D f ( X 0 ) , cuya matriz asociada respecto de las bases canónicas de Rn y R se llama clásicamente como f ( X 0 )
0
(operador “nabla1”) vector gradiente2 de f en el punto X 0 (a1 , a2 ,..., an ) A y se lo expresa:
1 La Historia informa que el nombre podría deberse al nombre griego de un instrumento musical parecido a un arpa que tiene aproximadamente forma triangular,
aunque algunos historiadores hacen referencia a Maxwell como quien comenzó a emplearlo humorísticamente. Como el símbolo de la letra griega delta mayúscula
, es una delta invertida. El gradiente fue denotado Δ por Hamilton en 1846, hacia 1870 se denoto ∇ la letra delta invertida, que se llamó
es , el de nabla,
“atled”. En 1871 Maxwell escribió “la cantidad ∇P es un vector”. El nombre de “pendiente” como se conocía en un principio pasó de uso y se reemplazó por la de
“gradiente”; se refiere a la palabra grado, el peralte de un camino o una superficie. El nombre de (nabla apareció impreso por vez primera en 1901 en Vector
Analysis, un libro para uso de estudiantes de matemáticas y física.
2
La palabra gradiente es un tecnicismo de la Física y disciplinas afines (meteorología, geodesia, etc.) Es razón entre la variación del valor de una magnitud en dos
puntos próximos y la distancia que los separa. Gradiente de temperatura, de presión. Por eso el gradiente barométrico es la relación de la diferencia de presión
barométrica entre dos puntos. Otro significado de gradiente en el diccionario es también “declive”.
La palabra deriva del latín, del participio de presente “gradiens”, “gradientis”(que da pasos, que desciende o asciende por una grada o escalinata), del verbo latino
“gradi” Este verbo no sólo expresa la idea de andar o avanzar, sino también la idea de un avance reglado según pasos bien medidos o escalones predeterminados
porque se vincula con el vocablo latino “gradus”(paso, escalón)y con el verbo “scandere”(del que proviene escala)puede referirse a una marcha ascendente o
descendente por gradas, lo que es conveniente con el significado técnico del gradiente.
7
f
f
f
( X 0 ),
( X 0 ),...,
(X 0)
f ( X 0 ) ( D1 f ( X 0 ), D2 f ( X 0 ),..., Dn f ( X 0 ))
x2
xn
x1
Cabe observar que si m = 1, la matriz Jacobiana es una matriz fila y es el vector gradiente de f en X 0 .
Si m > 1, las filas de la matriz Jacobiana son los vectores gradiente de las funciones componentes de f en X 0 ,
f 1 ( X 0 )
:
es decir: J f ( X 0 )
f ( X )
m 0
Para tener en cuenta…
Para aquellas funciones escalares que admitan todas las derivadas parciales en un punto X 0 , pero no son
diferenciables en ese punto, puede construirse el vector cuyas componentes son las derivadas parciales en X 0
y, con frecuencia, se lo denomina vector derivada de f en el punto X 0 y se escribe Df ( X 0 ) . Sólo se habla de
vector gradiente cuando la función es diferenciable en X 0 en virtud de los atributos que le asigna la
diferenciabilidad.
Plano tangente a una superficie
Ahora es posible afirmar con mayor precisión lo dicho anteriormente con respecto a que T ( h ) es una buena
aproximación local de f ( X 0 h) f ( X 0 ) , ya que si se desprecia la función ( h ) , que es un infinitésimo, y
n
f
si z f ( X 0 h) (h) , resulta: z f ( X 0 ) f ( X 0 ). h hi . ( X 0 )
xi
i 1
f
( X 0 ). xi ai que consiste la ecuación del
i 1 xi
n
Además, haciendo x X 0 h se obtiene: z f ( X 0 )
“hiperplano tangente” a la gráfica de f incluido en el espacio R n 1 que pasa por el punto
X
0
, f (X 0) .
Concretamente, para funciones de una y dos variables independientes, resulta:
Si n = 1 y f ( x0 ) f ( x0 ).( x x0 ) es la ecuación de la recta tangente a la curva y f ( x) en ( x0 , y0 ) .
f ( x0 )
f
f
( x0 , y0 ).( x x0 ) ( x0 , y0 ).( y y0 ) es la ecuación del plano tangente a la
x
y
“superficie” z f ( x, y ) en el punto ( x0 , y0 , z0 ) , cuyas pendientes en las direcciones de los ejes x e y, son
Si n = 2
z f ( x0 , y0 )
f ( x0 , y0 )
f
f
( x0 , y0 ) y
( x0 , y0 ) respectivamente, o en otras palabras, el plano que pasa por el punto ( x0 , y0 , z0 ) y
x
y
f
f
tiene como vectores directores a ux 1, 0, ( x0 , y0 ) y u y 0,1, ( x0 , y0 ) .
x
y
8
Este plano contiene a las rectas tangentes en el punto ( x0 , y0 , z0 ) a la superficie z f ( x, y ) en las direcciones
de los ejes x e y, por ello parece lógico llamarlo plano tangente en el punto ( x0 , y0 , z0 ) a la superficie z f ( x, y )
. Esta denominación será completamente justificada más adelante cuando se concluya que contiene a la recta
tangente en ( x0 , y0 , z0 ) en cualquier dirección.
Figura 5.2: Plano tangente a una superficie
La expresión lineal obtenida de la ecuación del plano tangente, despejando 𝑧, 𝑇(𝑥, 𝑦) es:
f
f
T ( x, y ) f ( x0 , y0 ) ( x0 , y0 ).( x x0 ) ( x0 , y0 ).( y y0 )
x
y
df ( X 0 )
Y, en consecuencia
𝑓(𝑥, 𝑦) ≈ 𝑇(𝑥, 𝑦) = 𝑓(𝑥0 , 𝑦0 ) +
𝜕𝑓
𝜕𝑓
(𝑥0 , 𝑦0 ). (𝑥 − 𝑥0 ) +
(𝑥 , 𝑦 ). (𝑦 − 𝑦0 )
𝜕𝑥
𝜕𝑦 0 0
⏟
𝑓(𝑥, 𝑦) ≈ 𝑓(𝑥0 , 𝑦0 ) + 𝑑𝑓(𝑥⃗0 )
𝑑𝑓(𝑥⃗0 )
(𝐼)
𝑓(𝑥, 𝑦) − 𝑓(𝑥0 , 𝑦0 ) ≈ 𝑑𝑓(𝑥⃗0 ) ⇒ ∆𝑓 ≈ 𝑑𝑓
y es la única expresión lineal en x e y que aproxima a la función 𝑓(𝑥, 𝑦) en el punto indicado, denominada
aproximación lineal de 𝑓 en ( x0 , y0 , z0 ) , y la fórmula (I) se llama fórmula de aproximación lineal.
9
La diferencial df representa el incremento que experimentaría la función al
pasar de ( x0 , y0 ) a ( x0 h1 , y0 h2 ) si la función se sustituyese por su
x
h
y
aproximación lineal en ( x0 , y0 ) . En otras palabras, es el incremento medido
y
sobre el plano tangente a la superficie en el punto ( x0 , y0 , z0 ) , a diferencia
del incremento real Δf es el incremento real que experimenta la función al
pasar de ( x0 , y0 ) a ( x0 h1 , y0 h2 ) medido sobre la superficie.
x
x
y
Ejemplo 5.1: Determinar aproximadamente el valor de la siguiente raíz cuadrada
4,012 3,98 2 2,02 2
Los tres números elevados al cuadrado dentro de la raíz son muy próximos a los enteros 4, 4 y 2,
respectivamente. Por lo tanto, es posible considerar a la raíz como una función escalar de tres variables
evaluada en las proximidades del punto (4,4,2), y aproximar su valor mediante una función lineal.
f ( x; y; z ) x 2 y 2 z 2 ; ( x0 , y0 , z0 ) (4; 4; 2)
f ( x; y; z ) f ( x0 , y0 , z0 )
f
f
f
( x0 , y0 , z0 )( x x0 ) ( x0 , y0 , z0 )( y y0 ) ( x0 , y0 , z0 )( z z0 )
x
y
z
x
y
f (4.01 , 3.98, 2.02) 4 2 4 2 2 2
(4, 01 4)
(3,98 4)
2
2
2
x 2 y 2 z 2 (4,4,2)
x y z (4,4,2)
z
x 2 y 2 z 2
(2, 02 2)
(4,4,2)
4
4
2
2
2
1
36
·0, 01
·(0, 02)
·0, 02 6 3·0, 01 3·0, 02 3·0, 02 6
36
36
36
Compárese este valor con el de 6,000075 que se obtiene con la calculadora!
Ejemplo 5.2: Para modelizar el proceso de desgaste de las pirámides egipcias, se construye un modelo en
miniatura de las mismas, con un lado de la base de 6 cm y una altura de 4 cm. Luego de someterlo a rigurosas
condiciones ambientales, se comprueba que el lado de la base disminuyó en 0,1 cm, y la altura disminuyó en
0,2 cm. Mediante una aproximación lineal, estimar cuál fue la disminución del área lateral de la pirámide.
Éste es un problema de modelización, en el cual no se conoce explícitamente la función a aproximar, debe
deducirse de la situación física descripta.
10
En este caso, es preciso determinar el área lateral de la pirámide en función de las magnitudes conocidas, el
lado de la base (𝑥) y la altura (𝑦) y ℎ la altura de cada uno de los triángulos que componen el área lateral de la
pirámide. Por el teorema de Pitágoras, ℎ puede ser expresado en términos de 𝑥 y 𝑦, así:
h
x
y
2
2
2
Entonces, el área de cada uno de estos triángulos es:
xh x
AT
2
2
x
y
2
2
2
Y el área lateral total es 4 veces el área de cada uno de los triángulos:
x
A 4 AT 2 x y
2
2
2
Se trata de aproximar linealmente esta función, las coordenadas del punto son las dimensiones dadas del
cuerpo:
(𝑥 0,𝑦0) = (6,4)
La aproximación lineal para el área lateral es:
A A(6, 4)
2
A
A
x
(6, 4)( x 6) (6, 4)( y 4) 2 x y 2
x
y
2
(6,4)
2
x
2
2 y
2
1 2
x
xy
2
2
·( x 6)
·( y 4)
2
2
x
x
y2
y2
2
2
(6;4)
(6,4)
60 685 ( x 6) 485 ( y 4)
Para determinar aproximadamente el valor cuando el lado de la base disminuyó 0,1 cm y la altura disminuyó
0,2 cm, debemos adoptar 𝑥 - 6 = -0,1 y 𝑦 - 4 = -0,2, y en tales condiciones tendremos:
𝐴 = 60 – (68/5) ·0,1 – (48/5) ·0,2 = 60 – 3,28
Dado que el área inicial, con una altura de 4 cm y un lado de la base de 6 cm, era de 60 cm2, la disminución de
área fue de 3,28 cm2.
11
Para tener en cuenta…
f
f
( x0 , y0 ).( x x0 ) ( x0 , y0 ).( y y0 ) tiene sentido (y
x
y
3
define, por tanto, un plano en R ) para una función escalar que simplemente posea derivadas parciales
en el punto ( x0 , y0 ) , pero, si la función no es diferenciable, dicho plano no tiene utilidad alguna como
aproximación local de la superficie.
2. La versión de la definición de diferenciabilidad analizada para una función escalar de dos variables
independientes es:
1. Obsérvese que la ecuación z f ( x0 , y0 )
0
Una función f : A R 2 R / z f ( x, y ) y X 0 ( x0 , y0 ) A es diferenciable en el punto X 0 , si existen sus
f
f
derivadas parciales en ese punto,
( x0 , y0 ) y
( x0 , y0 ) , y se verifica:
x
y
f ( x, y ) f ( x0 , y0 )
lim
( x , y ) (0,0)
f
f
( x0 , y0 ).( x x0 ) ( x0 , y0 ).( y y0 )
x
y
0 siendo
( x, y ) ( x0 , y0 )
( x, y) ( x0 , y0 ) ( x x0 )2 ( y y0 )2
De esta forma, para que una función sea diferenciable en un punto no sólo se requiere la existencia de las
derivadas parciales en ese punto, sino también que la diferencia entre la función y el plano de ecuación
f
f
z f ( x0 , y0 ) ( x0 , y0 ).( x x0 ) ( x0 , y0 ).( y y0 ) sea un infinitésimo de orden superior a uno, o bien, que
x
y
el plano sea una buena aproximación de la función en las cercanías del punto. Si esta condición se verifica,
entonces el plano mencionado es el plano tangente a la superficie z f ( x, y ) , es decir, el plano generado por
las rectas tangentes en las direcciones de los ejes es, en verdad, el plano tangente a la gráfica de f en el punto
( x0 , y0 ) .
Ejemplo 5.3: La función 𝑓(𝑥, 𝑦) = 𝑥 2 + 2𝑦 2 ¿es diferenciable en el punto (𝑥0 , 𝑦0 ) = (1,2)?
Las derivadas parciales existen y valen
𝜕𝑓
𝜕𝑓
= 2,
= 2𝑥 ⇒ ( )
𝜕𝑥 (1,2)
𝜕𝑥
𝜕𝑓
𝜕𝑓
=8
= 4𝑦 ⇒ ( )
𝜕𝑦
𝜕𝑦 (1,2)
Así que el único candidato posible a ser el plano tangente en 𝑒𝑙 𝑝𝑢𝑛𝑡𝑜 (𝑥0 , 𝑦0 ) = (1,2)
es:
𝜕𝑓
𝑧 = 𝑓(1,2) + ( )
𝜕𝑥 (1,2)
𝜕𝑓
. (𝑥 − 1) + ( )
𝜕𝑦 (1,2)
. (𝑦 − 2) = 9 + 2(𝑥 − 1) + 8(𝑦 − 2)
12
Para probar que 𝑓 es diferenciable en el punto se debe mostrar que se verifica:
lim
(𝑥,𝑦)→(1,2)
lim
(𝑥,𝑦)→(1,2)
=
(𝑥 2 + 2𝑦 2 ) − (9 + 2(𝑥 − 1) + 8(𝑦 − 2))
√(𝑥 − 1)2 + (𝑦 − 2)2
(𝑥 2 + 2𝑦 2 ) − (9 + 2𝑥 − 2 + 8𝑦 − 16)
lim
√(𝑥 − 1)2 + (𝑦 − 2)2
(𝑥,𝑦)→(1,2)
=
(𝑥 2 − 2𝑥 + 1) + 2(𝑦 2 − 4𝑦 + 4)
√(𝑥 − 1)2 + (𝑦 − 2)2
lim
(𝑥,𝑦)→(1,2)
=
lim
lim
Luego empleando coordenadas polares es:
lim
𝜌2 𝑐𝑜𝑠 2 𝜃 + 2𝜌2 𝑠𝑒𝑛2 𝜃
𝜌→0 √𝜌2 𝑐𝑜𝑠 2 𝜃
+ 𝜌2 𝑠𝑒𝑛2 𝜃
(𝑥 2 + 2𝑦 2 ) − (2𝑥 + 8𝑦 − 9)
√(𝑥 − 1)2 + (𝑦 − 2)2
(𝑥 − 1)2 + 2(𝑦 − 2)2
(𝑥,𝑦)→(1,2) √(𝑥
Si se efectúa un cambio de variables 𝑢 = 𝑥 − 1 𝑦 𝑣 = 𝑦 − 2, resulta:
=0
− 1)2 + (𝑦 − 2)2
(𝑢)2 + 2(𝑣)2
(𝑢,𝑣)→(0,0) √(𝑢)2
+ (𝑣)2
𝜌2 (𝑐𝑜𝑠 2 𝜃 + 2𝑠𝑒𝑛2 𝜃)
= lim 𝜌(𝑐𝑜𝑠 2 𝜃 + 2𝑠𝑒𝑛2 𝜃) = 0
𝜌→0
𝜌→0
𝜌
= 0 ⇒ lim
Luego 𝜌|𝑐𝑜𝑠 2 𝜃 + 2𝑠𝑒𝑛2 𝜃| ≤ 3𝜌 = 𝐹(𝜌) , 𝑐𝑜𝑚𝑜 lim 3𝜌 = 0, entonces 𝑓 es diferenciable en (1,2)
𝜌→0
La existencia de las derivadas parciales de una función escalar en un punto NO es suficiente para que admita
plano tangente en ese punto, tal como se muestra en el siguiente ejemplo
xy
si ( x, y ) (0, 0)
x y 2
f ( x, y )
. Es posible
Ejemplo 5.4: Sea la función definida por
x y2
0
si ( x, y) (0, 0)
usar, si existen, las derivadas parciales en el punto (0,0) para escribir la ecuación de un plano.
f
f
( x0 , y0 ).( x x0 ) ( x0 , y0 ).( y y0 ) que resulta ser el único “candidato” posible como plano
x
y
tangente a la gráfica de f en (0,0). Pero, ¿es verdaderamente el plano tangente?, es decir, ¿ese plano constituye
una aproximación local de la función f de buena calidad? Investiguemos…
z f ( x0 , y0 )
13
Se calculan las derivadas parciales de f en el punto (0,0) empleando la definición:
f (0 h, 0) f (0, 0)
h
lim 1
h 0
h 0 h
h
f (0, 0 h) f (0, 0)
h
lim 1
D2 f (0, 0) lim
h 0
h 0 h
h
D1 f (0, 0) lim
En consecuencia, el único candidato posible para plano tangente es z x y . ¿Es este plano una buena
aproximación de f en las proximidades del origen?
Si se trata de una buena aproximación, ambos resultados deben proporcionar resultados similares. Veamos la
cuestión con un enfoque más “microscópico” accediendo al origen por subconjuntos. Tal como se procede con
xy
los límites restringidos, evaluaremos la función f ( x, y ) x y
y el plano z x y sobre puntos de
2
x y2
la recta, por ejemplo, y x siempre que ( x, y ) (0, 0) . De esta forma, el problema se reduce a un problema
de aproximación local en una variable real.
Entonces, si y x , resulta:
x
x.x
x2
x2
f ( x, x ) ( x ) x x
2x
2x
2x
x 2
2
x2 x2
2 x2
z x x 2x
¿Es x y
( x) 2 x
x y
xy
x2 y 2
x
2
x y
una buena aproximación para puntos próximos al origen? NO, ya que
no es derivable en x 0 , de modo que esta aproximación no existe, por tanto la aproximación
xy
x2 y 2
x y no es correcta y así el plano z x y no es el plano tangente a la gráfica de f en el
punto (0,0).
Naturalmente que, para este caso, el límite
f
f
f ( x, y ) f ( x0 , y0 ) ( x0 , y0 ).( x x0 ) ( x0 , y0 ).( y y0 )
x
y
lim
0 o bien no existe. Comprobémoslo!
( x , y ) (0,0)
( x, y ) ( x0 , y0 )
x y
lim
xy
x y
2
2
xy
x y
x y2
2
lim
lim
xy
y este límite doble, ya analizado con
x y2
2
x y
x y
anterioridad, no existe (basta restringir la función sobre puntos del haz de rectas que pasan por el origen)
( x , y ) (0,0)
2
2
( x , y ) (0,0)
2
2
( x , y ) (0,0)
14
Recta normal a una superficie
Si se desea hallar la ecuación de la recta normal a la superficie z f ( x, y ) en el punto ( x0 , y0 , z0 ) , puede
calcularse un vector normal al plano tangente calculando el producto vectorial entre los vectores
f
f
ux 1, 0, ( x0 , y0 ) y u y 0,1, ( x0 , y0 ) . Así,
x
y
i
j
k
f
f
f
( x0 , y0 ) ( x0 , y0 ), ( x0 , y0 ),1 y la ecuación vectorial de la recta normal
x
y
x
f
( x0 , y0 )
y
n ux u y 1 0
0 1
f
f
por el punto ( x0 , y0 , z0 ) es X X 0 ( x0 , y0 ), ( x0 , y0 ),1 R , y en forma cartesiana:
y
x
x x0
y y0
z z0
f
f
si
( x0 , y0 ) 0 y
( x0 , y0 ) 0
f
f
x
1
y
( x0 , y0 ) ( x0 , y0 )
x
y
Concepto de gradiente
0
Para una función escalar f : A R 2 R y X 0 ( x0 , y0 ) A , la diferencial en el punto ( x0 , y0 ) es:
f
f
df ( x0 , y0 ) ( x0 , y0 ).( x x0 ) ( x0 , y0 ).( y y0 ) . El 2° miembro es una expresión de primer orden que
x
y
h
h
1
2
puede ser interpretada como el producto escalar del vector incremento h (h1 , h2 ) y el vector
f
f
( x0 , y0 ), ( x0 , y0 ) .
y
x
Tal como ya ha sido presentado, este vector de R2 se denomina gradiente de la función y se escribe
f
f
f ( x0 , y0 ) ( x0 , y0 ), ( x0 , y0 ) o también grad f ( x0 , y0 ) .
y
x
En consecuencia, si f es diferenciable en el punto ( x0 , y0 ) , entonces la diferencial df ( X 0 , h) es el producto
escalar del vector gradiente de f en ( x0 , y0 ) y el vector de incrementos h (h1 , h2 ) :
df ( X 0 , h) f ( x0 , y0 ) (h1, h2 ) .
15
0
En general, para una función escalar f : A R n R , X 0 A y h (h1 , h2 ,..., hn ) diferenciable en X 0 , la
n
diferencial en el punto X 0 es: df ( X 0 , h) f ( X 0 ) h
i 1
f
( X 0 ).hi también denominada diferencial total
xi
de la función f en el punto ( x0 , y0 ) .
Se verá a continuación propiedades muy importantes del vector gradiente y su utilidad en el análisis de
funciones de varias variables…
Condiciones necesarias de diferenciabilidad
0
Teorema 5.5: Sea f : A R n R m , X 0 A . Si f es diferenciable en el punto X 0 , entonces f
es continua en X 0 .
Demostración.
Como f es diferenciable en el punto X 0 , se verifica que existe una función vectorial
: E (0, ) R n R m / f ( X 0 h) f ( X 0 ) J f ( X 0 ) h (h) siendo lim
h 0
( h)
lim f ( X 0 h) f ( X 0 ) lim J f ( X 0 ) h (h) 0 ya que lim (h) lim h
h 0
h 0
h 0
0 y así:
h
( h)
h 0
0
h
Por lo tanto, lim f ( X 0 h) f ( X 0 ) , entonces f es continua en X 0 .
h 0
Para tener en cuenta…
Cabe enfatizar que la continuidad es sólo condición necesaria para la diferenciabilidad, pero no es suficiente.
Por ello, la proposición recíproca es falsa como se muestra con el siguiente ejemplo.
Ejemplo 5.5: La continuidad no permite asegurar la existencia de plano tangente.
1
1
Sea f : R2 R / f ( x, y) x 3 . y 3 . Es continua en (0,0) ya que
lim
( x , y )(0,0)
f ( x, y) f (0,0) 0
16
Es posible calcular las dos derivadas parciales en (0;0) empleando la definición:
1
3
f
F (h;0) F (0;0)
h .0 0
(0, 0) lim
lim
0
h
h
0
0
x
h
h
f’x (0;0) =
1
f
0.h 3 0
F (0; h) F (0;0)
(0, 0) lim
lim
0
h 0
h 0
y
h
h
Es decir, existen las dos derivadas parciales de f en (0;0) y son iguales a 0. De acuerdo con la interpretación
geométrica de la derivada parcial, esto significa que al cortar la superficie representativa de la función con los
planos y = 0 ó x = 0, se obtienen curvas tales que sus rectas tangentes en (0;0;0) son el eje x y el eje y
respectivamente.
Si el plano tangente a la superficie en (0;0;0) existiera, debe contener a estas dos rectas y, por lo tanto, el
plano tangente debería ser el plano xy. Si se observa la gráfica de esta función con z 0.
z
y
x
Es evidente que en (0;0;0) no existe plano tangente, aunque existan las derivadas parciales. Para que f sea
diferenciable en (0,0) debe verificarse que:
f ( x, y ) f (0, 0)
lim
( x 0)2 ( y 0) 2
( x , y ) (0,0)
1
3
lim
( x , y ) (0,0)
f
f
(0, 0).( x 0) (0, 0).( y 0)
x
y
1
3
x y 0 0.x 0. y
x y
2
2
1
3
lim
( x , y ) (0,0)
x y
1
3
x y
2
2
?
0 , ahora bien,
Si se considera el conjunto S ( x, y ) R 2 / y x
17
2
3
lim x lim 1
1 1
2
2
x 0 x 2 x 0 1
3 3
3
3
x y
x
x
x3 2
lim
lim
2
x 2 y 2 x 0 2 x 2 x 0 x 2
x3
1
lim
lim 1
x 0 x 2 x 0
3
x 2
lim
( x , y ) (0,0)
( x , y ) S
Entonces, el límite doble no existe en virtud de la no existencia de un límite direccional, hecho que fundamenta
la no existencia del plano tangente en (0,0,0), y por lo tanto la función no es diferenciable en (0,0).
0
Teorema 5.6: Sea f : A R n R , X 0 A . Si f es diferenciable en el punto X 0 , entonces f
admite derivada en toda dirección u 0 / u 1 en X 0 y f ( X 0 , u ) df ( X 0 , u ) f ( X 0 ) u
Demostración:
Como f es diferenciable en el punto X 0 , se verifica:
: E (0, ) R n R / f ( X 0 h) f ( X 0 ) f ( X 0 ) h (h) siendo lim
h 0
( h)
0
h
Sea h tu con t R , si h 0 , t 0 , entonces
f ( X 0 tu ) f ( X 0 ) f ( X 0 ) (tu ) (tu ) siendo lim
t 0
(tu )
tu
0 y
f ( X 0 tu ) f ( X 0 ) f ( X 0 ) (tu ) (tu )
t
t
lim
t 0
f ( X 0 ) u t (tu )
f ( X 0 tu ) f ( X 0 )
lim
f ( X 0 ) u
t 0
t
t
f ( X 0 ,u )
En consecuencia, f ( X 0 , u ) f ( X 0 ) u lo que prueba el teorema.
Esta fórmula de la derivada direccional implica que la recta tangente a la curva coordenada en la dirección de
u que pasa por el punto X 0 está contenida en el hiperplano tangente.
Este teorema proporciona información muy importante ya que la diferenciabilidad de una función escalar en
un punto asegura, por un lado la existencia de todas las derivadas direccionales en dicho punto, y por el otro
brinda una regla de cálculo para la derivada direccional: el producto interior entre el vector gradiente de la
función calculado en el punto y el versor cuya dirección y sentido se deriva.
18
Ejemplo 5.6:
xy 2
si ( x, y ) (0, 0)
F(x,y)= x 2 y 2
en X o =(0;0)
0
si ( x, y) (0, 0)
xy 2
F es continua en (0,0) ya que lim
lim
( x , y ) (0,0) x 2 y 2
( x , y ) (0,0)
inf initésimo
x
.
y2
x2 y 2
0 F (0, 0)
función a cot ada en
unabola reducida de (0,0)
Empleando la definición de derivada direccional, resulta:
Sea un versor genérico de R2 , u (u1 , u2 ) .
F ( Po t u) F ( Po )
F (tu1 , tu2 ) F (0,0)
F '( X o , u) lím
F '( Po , u ) lím
t 0
t 0
t
t
2
3
2
tu1.(tu2 )
t u1u2
0
(tu1 ) 2 (tu2 ) 2
t 2 (u12 u2 2 )
uu 2
lím
2 1 2 2 u1u2 2 pues u12 u2 2 1 , ya que u (u1 , u2 ) es
F '( X 0 , u ) lím
t 0
t 0
t
t
u1 u2
un versor.
Este resultado nos permite asegurar que la función tiene derivada en cualquier dirección y sentido. Podemos
escribir esta derivada en función de u1 :
F '( X o , u ) u1.(1 u12 ) u1 u13 (u1 )
Como se pide la o las direcciones en la que la derivada direccional es máxima, y la función a maximizar es de
una variable, se buscará el valor de u1 que anula la derivada primera (puntos estacionarios), en los que la
derivada segunda sea negativa
Es decir:
Como (u1 ) u1 u13 , entonces (u1 ) 1 3u12
1
1
(u1 ) 1 3u12 0 u12 u1
3
3
1
Y (u1 ) 6u1
0
3
2
Además, u2 1 u12 entonces, |u2| =
.Entonces las direcciones en la que la derivada direccional es
3
1
2 3 6 3
6
,
,
,
máxima son:
=
y
3
3 3 3 3 3
19
Cabe destacar que no se ha empleado el vector gradiente en virtud de que aún no se ha determinado la
diferenciabilidad de la función F en el punto (0,0). De todas formas, si la función fuera diferenciable en (0,0), la
dirección de máxima derivada en él es única, por lo cual como se han determinado dos direcciones de derivada
máxima, la función no es diferenciable en (0,0). De esta forma, el cálculo de la derivada dirección mediante el
vector gradiente no es aplicable en este caso.
Si hubiésemos calculado el límite para probar que:
F ( x, y ) F (0, 0)
lim
( x 0)2 ( y 0) 2
( x , y ) (0,0)
f ( x, y) f (0, 0)
lim
f
f
(0, 0).( x 0) (0, 0).( y 0)
x
y
( x 0)2 ( y 0) 2
( x , y ) (0,0)
F
F
(0, 0).( x 0)
(0, 0).( y 0)
x
y
?
0
lim
xy 2
0 0.( x 0) 0.( y 0)
x2 y 2
( x , y ) (0,0)
x2 y 2
xy 2
lim
( x , y ) (0,0)
3
2 2
(x y )
2
Este límite no existe ya que si se considera el conjunto S ( x, y ) R 2 / y x resulta:
xy 2
lim
( x , y ) (0,0)
( x , y )S
3
2 2
lim
x 0
x3
x
(x y )
concluido anteriormente.
2
3
y no existe. Por tanto, la función F no es diferenciable en (0,0), tal como se había
Relación entre el vector gradiente y la derivada direccional
El producto interior entre dos vectores se puede calcular como el producto entre las normas de dichos vectores
y el coseno del ángulo que ellos forman, por lo tanto, si 𝑓 es diferenciable en 𝑋 0 y f ( X 0 ) 0
f ( X 0 , u ) f ( X 0 ) u f ( X 0 ) u cos f ( X 0 ) cos
1
Observación importante: La derivada direccional es máxima si cos 1 , cuando 0 , es decir en la
dirección y sentido del vector gradiente, y su valor máximo es f ( X 0 ) (en la dirección y sentido del vector
unitario
f ( X 0 )
f ( X 0 )
). El vector gradiente de f en el punto X 0 , si es no nulo, indica la dirección y sentido de
máximo crecimiento de f a partir de X 0 , en el sentido de que la pendiente en esa dirección es máxima, y la
norma del gradiente representa la máxima derivada direccional o máxima razón de cambio, es decir, el mayor
incremento que puede experimentar la función si las variables independientes sufren un incremento (vectorial)
unitario.
20
Es preciso tener cautela para la interpretación de esta relación: el hecho de que la dirección de máximo
crecimiento de la función f en el punto X 0 se produzca en el sentido del vector f ( X 0 ) , no significa que la
función siempre “crecerá” en ese sentido. En términos generales, una vez que se llega al punto X 0 tu la
dirección de máximo crecimiento puede cambiar. Si se interpreta este hecho desde un ejemplo de la vida real:
cuando un alpinista intenta escalar una pared por su pendiente más abrupta, no siempre sigue la misma
dirección, sino que en cada instante debe redirigir su curso hacia la zona que, en ese instante, apunta hacia la
máxima pendiente.
Cabe enfatizar en este sentido que, la dirección de máximo ascenso en un punto no tiene por qué apuntar, en
general, hacia un máximo local o global de la función. Por ejemplo, para la función escalar dada por
7
9 63
3
f ( x, y) 3x x3 3xy 2 en el punto X 0 , , el vector gradiente es: f ( X 0 ) , cuya dirección
20 25
5 10
y sentido no apunta hacia el máximo local ubicado en el punto (1,0). A continuación en la figura 5.3 se observan
las curvas de nivel de f, el punto X 0 y el gradiente de la función en dicho punto, luego un campo vectorial
generalizado del gradiente, con los vectores gradientes de la función calculados en diversos puntos.
Figura 5.3: Curvas de nivel y campo de gradiente
1. La derivada direccional es mínima (razón de cambio mínima) si cos 1 , cuando , es decir en
la dirección y sentido opuesto del vector gradiente, y su valor mínimo es f ( X 0 )
2. La derivada direccional es nula si cos 0 , cuando
2
, es decir en la dirección normal al vector
gradiente.
21
En la figura 5.4 se puede apreciar los vectores gradiente y versor para una función escalar de dos variables
independientes.
Figura 5.4: Vector gradiente y versor
3. La derivada direccional de f en el punto X 0 según la dirección del versor u viene dada por el producto
interior f ( X 0 , u ) f ( X 0 ) u . En definitiva, los vectores tangentes a las curvas coordenada en la
dirección de u que pasa por el punto X 0 son combinaciones lineales de los vectores tangentes a las
curvas en ese punto según las direcciones de los ejes OX y OY . Esto es evidente desde el punto de vista
geométrico, desde el momento que todos los vectores están situados sobre el hiperplano tangente, y
f
( X 0 ) . De esta forma, en las funciones
éste queda determinado por las derivadas parciales
xi
diferenciables es inmediato calcular las derivadas direccionales, reduciéndolas a un simple producto
interior de vectores.
4. Si f : A Rn R A abierto es diferenciable en X 0 A y f ( X 0 ) c , entonces el vector gradiente
f ( X 0 ) es ortogonal al conjunto de nivel Sc x A / f ( x) c en el punto X 0 . (significa que es
ortogonal a cada vector tangente a Sc en X 0 .
La demostración de esta última proposición se verá posteriormente cuando se estudie la derivación de
funciones compuestas.
Para esta propiedad del gradiente de una función escalar, es posible dar una interpretación física. Por ejemplo,
si se considera un campo escalar T ( x, y, z ) que mide la temperatura del punto ( x, y, z ) R3 , entonces, la
dirección según la cual varia más rápidamente la temperatura es la del gradiente f ( X 0 ) , y esta dirección es
ortogonal a la ’superficie’ isoterma que pasa por X 0 , pensando que sobre las isotermas la temperatura no
experimento cambios, si no que por el contrario permanece constante.
La proposición recíproca del Teorema 5.6 es falsa, es decir, la existencia de todas las derivadas direccionales de
una función en un punto no garantiza la diferenciabilidad en dicho punto, tal como lo muestra el siguiente
ejemplo.
22
xy 3
Ejemplo 5.7: La función definida por f ( x, y ) x 2 y 4
0
si ( x, y) (0,0)
es continua en (0,0), ya que:
si ( x, y) (0,0)
xy 3
y y luego f es continua en (0,0).
x2 y 4
Para cada versor u , la derivada dirección en (0,0) es:
f (tu1 , tu2 ) f (0, 0)
tu1u23
f ( X 0 tu ) f ( X 0 )
lim
lim
lim 2 2 4 0 u
t 0
t 0
t 0 u t u
t
t
1
2
Sin embargo, la función f no es diferenciable en (0,0) ya que
f
f
f ( x, y ) f (0, 0) (0, 0).( x 0) (0, 0).( y 0)
x
y
lim
( x 0) 2 ( y 0) 2
( x , y ) (0,0)
lim
( x , y ) (0,0)
lim
( x , y ) (0,0)
xy 3
0 0.( x 0) 0.( y 0)
x2 y 4
x2 y 2
xy 3
( x2 y 4 ) x2 y 2
Este límite no existe ya que si se considera el conjunto S ( x, y ) R 2 / y 2 x , resulta:
xy 3
lim
y5
lim
y
cuyos límites laterales son diferentes, por lo
( x 2 y 4 ) x 2 y 2 y 0 2 y 4 y 4 y 2 y 0 2 y y 2 1
tanto, esta función proporciona un ejemplo interesante de una función continua tal que los vectores
u , f ((0, 0), u ) : u R 2 forman un plano, “candidato” a ser plano tangente, y sin embargo f no es diferenciable
lim
( x , y ) (0,0)
( x, y ) S
en (0, 0). Para ver gráficamente la razón de la no diferenciabilidad de f en (0,0) se recomienda utilizar un
programa graficador que permita visualizar la gráfica de f en un entorno de (0, 0). Es posible apreciar que por
muy poderoso que sea el zoom en un entorno de (0,0,0) siempre se observará un pliegue a lo largo del eje Oy y
nunca es factible que la gráfica de f se confunda con el plano z = 0. Esto se debe a que en este ejemplo la
aplicación u f ((0, 0), u ) , aunque es lineal no proporciona una aproximación local del incremento
f (u1 , u2 ) f (0,0) que sea uniforme en todas las direcciones.
Ejemplo 5.8: Dada una función f : D R2 R diferenciable, se sabe que la dirección de máximo
crecimiento en un punto (x0, y0) es (3/5, 4/5), se desea calcular:
a) El valor de la derivada direccional en (x0, y0) en dicha dirección.
Como f es diferenciable, la derivada direccional en el punto (x0, y0) en cualquier dirección de R2 existe y es igual
al producto interior entre el vector gradiente de la función en ese punto y el versor dirección. Además, la
dirección de máximo crecimiento en un punto es la misma que la del vector gradiente de la función en ese
mismo punto. La derivada direccional en el punto (x0, y0) en la dirección de máximo crecimiento es:
Df ( x , y ) f ( x0 , y0 ) f ( x0 , y0 ). f ( x0 , y0 )
0
t
0
23
Aún no conociendo el vector gradiente, se sabe que será un vector resultante de multiplicar (3/5,4/5), dirección
de máximo crecimiento, por una constante k positiva, k>0. Si k =1, el vector gradiente coincide con el vector
(3/5,4/5). La derivada direccional en la dirección de máximo crecimiento resulta:
3
9 16
3 4 5
Df ( x , y ) f ( x0 , y0 ) k ,
k
k 0.
0 0
25
5 5 4
5
b) Una dirección de crecimiento nulo en (x0, y0).
Como f es diferenciable, la derivada direccional en el punto (x0, y0) en cualquier dirección de R2 existe y es igual
al vector gradiente de la función en ese punto por el versor dirección. La derivada direccional en un punto en
una dirección de crecimiento nulo es nula. De igualar a cero la derivada direccional se obtiene la ecuación que
cumplirá toda dirección de crecimiento nulo. Bastará con determinar una solución de dicha ecuación para
calcular una dirección de crecimiento nulo. También, cualquier vector ortogonal al vector que indica la dirección
de máximo crecimiento, (3/5, 4/5) es válido.
3 4 u 3u 4u2
D(u1 ,u2 ) f ( x0 , y0 ) , 1 1
0 3u1 4u2 0.
25
5 5 u2
Por ejemplo, el vector (1, -3/4) indica una dirección de crecimiento nulo.
Condiciones suficientes de diferenciabilidad
Teorema 5.7: Sea f : A R n R , A abierto , tal que, en una bola B( X 0 , r ) A , existen las funciones
f
para i 1,..., n y todas ellas continuas en el punto X 0 , entonces la función f es
derivadas parciales
xi
diferenciable en X 0 .
La demostración de este teorema no será desarrollada. 3
La condición del enunciado no es necesaria para la diferenciabilidad; es decir, una función puede ser
diferenciable en un punto, tener derivadas definidas en todo punto de una bola con centro en ese punto y ser
discontinuas en él.
1
2
2
si ( x, y ) (0, 0)
( x y ) sen 2
2
2
es continua
Ejemplo 5.9: La función f : R R / f ( x, y )
x
y
si ( x, y ) (0, 0)
0
en (0,0) (existe el límite de f en (0,0) y vale cero, ya que se trata del producto entre un infinitésimo y una función
acotada), y existen las derivadas parciales en una bola B((0, 0), r ) , pero no son continuas en ese punto. No
obstante f es diferenciable en (0,0) (admite plano tangente en dicho punto cuya ecuación es z = 0) Verifíquelo!!
3
Para quien se sienta interesado en la demostración de este teorema se sugiere consultar la bibliografía propuesta por la Cátedra.
24
Aplicando la definición de derivada parcial se obtiene
f
f
(0, 0) (0, 0) 0
x
y
Además, ( x, y ) (0, 0) es
f
1
2 xsen
2
2
x
x y
1
cos
2
2
x y
1
y
1
cos
x 2 y 2
x 2 y 2 x 2 y 2
1
2 xsen
2
2
x y
f
2 ysen
y
1
( x 2 y 2 ) cos
2
x y 2
3
1 2
. ( x y 2 ) 2 .2 x
2
x
2
x y2
y, en forma análoga se obtiene:
En ambos casos, el límite para ( x, y ) (0, 0) del segundo término no existe ya que no existe
lim
( x , y ) (0,0)
x
x y2
2
pues si la función se restringe al conjunto S ( x, y ) R 2 / y x , resulta:
lim
x 0
x
2x
2
lim
x 0
x
x 2
cuyos límites laterales son diferentes. Por lo tanto, no existe
f
. De la misma
( x , y ) (0,0) x
lim
f
f C1 (0,0)
, por lo cual
y
Este teorema establece una condición suficiente tan utilizada en la práctica por su simplicidad, que sus hipótesis
sirven para caracterizar las llamadas funciones de clase uno
forma, no existe
lim
( x , y ) (0,0)
Definición 5.6: Funciones de clase uno.
Una función f : A Rn R , A abierto es diferenciable con continuidad o continuamente
f
diferenciable en A si existen las funciones derivadas parciales
para i 1,..., n y todas ellas continuas
xi
en A . Se denota C1 ( A) al conjunto de todas las funciones continuamente diferenciables sobre A, por
esta razón se las denomina también funciones de clase uno en A. ( f C1 ( A) )
Definición 5.6: Funciones de clase m.
Una función f : A Rn R , A abierto se dice es de clase m en el abierto A ( f C m ( A) ) si lo es en
cada uno de sus puntos, es decir.
Existen todas las funciones derivadas parciales hasta el orden m en A, y
Las funciones derivadas parciales de orden m son continuas en A.
Naturalmente, al ser continuas las derivadas parciales de orden m existen y son continuas todas las
derivadas parciales de orden menor que m.
25
Para tener en cuenta...
Si la función f admite derivadas parciales de todo orden y son continuas en A, se dice que f es de clase en A.
Se escribe ( f C ( A) )
En resumen, la forma más económica de estudiar el dominio de diferenciabilidad de una función escalar consiste
en hallar los puntos en los que están definidas todas sus funciones derivadas parciales, para determinar
posteriormente en cuáles de ellos son continuas. Así, la función es diferenciable en estos puntos. En aquellos
puntos en los que existen las derivadas parciales y éstas no son funciones continuas, es necesario analizar
directamente la diferenciabilidad según la definición, pues se carece de información (puede ser que la función
sea diferenciable o no).
Por otra parte, en los puntos en los que la función no es continua o no tiene todas las derivadas direccionales,
tampoco es diferenciable.
Observación importante: Es importante recalcar que el gradiente de una función en un punto sólo está
definido si la función es diferenciable en dicho punto, lo cual ya ha sido mencionado más arriba. La mera
f
f
f
existencia del vector
( X 0 ),
( X 0 ),...,
( X 0 ) no es suficiente para que se le otorgue el nombre de
x2
xn
x1
gradiente, dado que ya hemos visto que hay funciones que admiten todas las derivadas direccionales en un
punto y aún así no son diferenciables en dicho punto. El motivo de esta particular exigencia es que el vector
f
f
f
( X 0 ),
( X 0 ),...,
( X 0 ) verifica unas propiedades cuando la función es diferenciable que de otro
x2
xn
x1
modo no verifica. Para poder distinguir una situación de otra se reserva el término gradiente para los vectores
f
f
f
( X 0 ),
( X 0 ),...,
( X 0 ) asociados a funciones diferenciables en el punto X 0 .
x2
xn
x1
Ejemplo 5.10: Se supone que una montaña tiene forma de un paraboloide elíptico z = c - ax2 - by2 , donde
a, b y c son constantes positivas, x e y son las coordenadas este-oeste y norte-sur, y z es la altitud sobre el nivel
del mar (x, y y z están medidas en metros). En el punto (1,1), ¿en qué dirección aumenta más rápido la altitud?
Si se suelta una piedra en (1,1), ¿en qué dirección comenzará a rodar?
La función z f ( x, y) c ax 2 by 2 es polinómica, de modo que admite derivadas parciales continuas en todo
R2 , por lo tanto f es diferenciable en (1,1). Se ha visto con anterioridad que una función aumenta más
rápidamente en la dirección del vector gradiente, y disminuye más rápidamente en la dirección opuesta al
mismo. En este caso:
f (1;1) a
b
;
f ( x; y ) (2ax;2by ) f (1;1) (2a;2b) u
f (1;1) a 2 b 2
a 2 b 2
Ésa es la dirección de máximo crecimiento. La piedra rodará en la dirección en la cual más rápidamente
disminuya la altura, es decir, la opuesta a la recién hallada:
a
b
;
Máximo decrecimiento u
2
2
2
2
a b
a b
26
2
2
;
Ejemplo 5.11: Calcular F ( X 0 ; v) siendo F x, y x2 2 xy ; X 0 =(1;1) y v =
2
2
Como 𝐹 es polinómica, es posible asegurar que tiene derivadas parciales continuas ( F C1 ( R 2 ) ) y, en
consecuencia, es diferenciable en X 0 , y, por lo tanto, es válido calcular la derivada direccional empleando el
vector gradiente.
𝐹’x= 2𝑥-2𝑦 𝐹’x( X 0 )=0
𝐹’y= -2𝑥
F ( X 0 ) (0; 2)
𝐹’y ( X 0 )= -2
2 2
;
Resulta: F ( X 0 ; v) = F ( X 0 ) v (0, 2)
2
2
2
Ejemplo 5.12: Dados los siguientes campos escalares y el punto X o que en cada caso se indica, se desea
hallar la o las direcciones en las que la derivada direccional en X o es máxima .
F x; y
1 x2
en X o =(2,-2)
x y
1 2x
y
x2
x2
𝐹’y = 2
y
𝐹’x =
Son continuas en X o ,la dirección de máxima derivada está dada por el vector gradiente
en X o
5
F ( X o ) ,1
2
5
;1
F ( X o ) 2 5
2
Luego la dirección de máxima derivada es v =
;
29
29 29
F ( X o )
2
27
Ejemplo 5.13: ¿Dónde intersecta al eje z el plano tangente a la gráfica de la superficie z f ( x, y) e x y
en (1; 1; 1)?
La ecuación del plano tangente expresado en términos de las derivadas parciales en un punto (x0; y0; z0) es:
z z0
z
z
( x0 ; y 0 )( x x0 ) ( x0 ; y 0 )( y y 0 )
x
y
En este caso (x0; y0; z0) = (1; 1; 1) y:
z
z
e x y ( x0 ; y 0 ) e 00 1
x
x
z
z
e x y ( x0 ; y 0 ) e 00 1
y
y
Y, reemplazando en la ecuación del plano,
z 1 1·(x 1) 1·( y 1) x y 1
En el eje z resulta, x = y = 0, y por lo tanto el plano tangente intersecta a ese eje en z = 1
f C1
Nótese que, para esta función, las derivadas parciales son continuas en (1,1), en consecuencia,
en el punto (1,1), de modo que f es diferenciable en (1,1) y así tiene sentido la existencia del plano tangente a
su gráfica por ese punto.
Propiedades de las funciones diferenciables
Sean f y g dos funciones vectoriales tales que f , g : A R n R m A abierto y X 0 A ambas diferenciables
en X 0 , entonces se verifica:
1.
f g es diferenciable en X 0 y además D f g
J f g
X0
X0
D f X 0 Dg X 0 y sus matrices jacobianas son
J f X0 J gX0
2. f es diferenciable en X 0 y D( f ) X 0 D f X 0 R y J ( f ) X 0 J f X 0
3. Sean
f y g dos funciones escalares tales que
f , g : A R n R A abierto y X 0 A , ambas
diferenciables en X 0 , entonces se verifica:
a) f .g es diferenciable en X 0 y ( f .g ) X 0 f X 0 .g X 0 f X 0 .g X 0
f
es diferenciable en el punto X 0 y se verifica:
b) Si g X 0 0 entonces la función
g
f X 0 .g X 0 f X 0 .g X 0
f
g2 X0
g X 0
28
En forma análoga a lo que sucede con la continuidad, la diferenciabilidad se preserva cuando se efectúan
operaciones elementales.
Funciones compuestas
Sean las funciones f : A R n R m / A abierto y g : B R m R p / B abierto y f ( A) B . De esta forma
tiene sentido definir la composición de f y g , estando bien definida la función compuesta:
g f : A Rn R p / g f
( x)
g f ( x)
En un diagrama, resulta:
Rm
R
Rp
Df
Recordemos en primer lugar cómo funcionaba la regla de la cadena para las funciones reales de una variable
real para derivar la función compuesta de dos funciones derivables. Es decir, si f(x) es derivable en x0 y g(x) es
derivable en f(x0), entonces ( g f )( x ) también es derivable en x0 y se verifica
( g f )( x0 ) g ( f ( x0 )). f ( x0 )
De manera general, estas expresiones son válidas sustituyendo las derivadas ordinarias por las matrices
jacobianas correspondientes.
Teorema 5.8: Derivación de funciones compuestas. La regla de la cadena.
Sean las funciones f : A R n R m / A abierto y g : B R m R p / B abierto y f ( A) B . Si f
es diferenciable en X 0 A , y g es diferenciable en y 0 f X 0 B ,entonces la función compuesta
g f : A R n R p es diferenciable en X 0 y se verifica d x0 d g f
(X0)
d g f ( X 0 ) d f ( X 0 ) .(la
diferencial de la función compuesta es la composición de las diferenciales). Siendo su expresión matricial
mediante matrices Jacobianas:𝐽𝜑
⃗⃗(𝑥⃗0 ) = 𝐽(𝑔⃗°𝑓⃗)(𝑥⃗0 ) = 𝐽𝑔⃗[𝑓⃗(𝑥⃗0 )]. 𝐽𝑓⃗(𝑥⃗0 ) donde el punto es el producto
matricial.
29
Ejemplo 5.14: Sean las funciones
f : R 3 R 2 / f ( x1 , x2 , x3 ) e x1 x2 , x12 2 x2 x3 , D f R 3 .
g : R 2 R 2 / g ( y1 , y2 ) y1seny2 , y12 y22 ,
Dg R 2 .
Analicemos si existe la matriz derivada de la función compuesta, es decir, la matriz que represente a la
transformación diferencial de la función compuesta g f en el punto (0,0,0):
En primer lugar, se comprueba la existencia de la función compuesta y su diferenciabilidad en el punto (0,0,0),
es decir, el cumplimiento de las hipótesis de la regla de la cadena:
La función f compuesta con g resulta definida así: g f : R 3 R 2
f D f f R3 R 2 Dg , luego f D f Dg
¿Es f una función diferenciable en (0,0,0)?
Sí, ya que sus funciones componentes son diferenciables en todos los puntos de R3, por lo que f lo es en todo
R3. La primera es suma de una función exponencial con dominio R3 y otra polinómica; y la segunda es
polinómica. Ambas funciones son de clase C 1 en (0,0,0)
¿Es g una función diferenciable en f 0, 0, 0 e0 0, 0 0 0 = 1, 0 ?
Sí, ya que sus funciones componentes son diferenciables en todos los puntos de R2 por lo que g lo será en todo
R2. La primera es el producto de una polinómica y una trigonométrica con dominio R2; y la segunda es
polinómica.
Como se cumplen las hipótesis de la regla de la cadena, la función compuesta es diferenciable en el (0,0,0),
teniendo como derivada:
J ( g f )(0,0,0) J g f (0,0,0) J f (0,0,0) J g (1,0) J f (0,0,0)
Cálculo de J f 0, 0, 0 :
f ( x , x , x )
J f ( x1 , x2 , x3 ) 1 1 2 3
f ( x , x , x )
2 1 2 3
f 1 ( x1 , x2 , x3 ) e x1 , 1, 0 ,
f 2 ( x1 , x2 , x3 ) (2 x1 , 2, 1).
Evaluados en el (0,0,0) resulta:
f 1 (0, 0, 0) e0 , 1, 0 (1, 1, 0),
f 2 (0, 0, 0) (2(0), 2, 1) (0, 2, 1).
f (0, 0, 0) 1 -1 0
.
J f (0, 0, 0) 1
f (0, 0, 0) 0 2 1
2
30
Luego, el cálculo de
J g[ f 0, 0, 0 ] J g 1, 0
g ( y , y )
J g ( y1 , y2 ) 1 1 2 .
g ( y , y )
2 1 2
g 1 ( y1 , y2 ) seny2 , y1 cos y2 ,
g 2 ( y1 , y2 ) (2 y1 , 2 y2 ).
Evaluados en el punto (1,0) son:
g 1 (1, 0) sen(0), (1) cos 0 (0, 1),
g 2 (1, 0) (2(1), 2(0)) (2, 0).
g (1, 0) 0 1
J g (1, 0) 1
.
g (1, 0) 2 0
2
La matriz Jacobiana correspondiente a la función compuesta es:
0
𝐽(𝑔⃗°𝑓⃗)(0,0,0) = 𝐽𝑔⃗ (𝑓⃗(0,0,0)) . 𝐽𝑓⃗(0,0,0) = 𝐽𝑔⃗(1,0). 𝐽𝑓⃗(0,0,0) = (
2
1
1
).(
0
0
−1
2
0
0
)=(
1
2
2 1
)
−2 0
Ejemplo 5.15: Si z f ( x, y) sen xy se desea calcular
dz
, sabiendo que x e2t ; y e3t
dt
En primer lugar, se construye una función vectorial con los datos g : R R 2 / g (t ) e 2t , e3t
La función compuesta z (t ) f g (t ) : R R es una función real de una variable real, por eso se trata de una
derivada total y no una derivada parcial (la función compuesta depende de una sola variable)
f es diferenciable en R2 por tratarse de la composición de funciones diferenciables (una función trigonométrica
y una polinómica) las funciones componentes de g son diferenciables en R por tratarse de funciones
exponenciales diferenciables en R, luego, la función compuesta existe tal que
g Dg
(R R ) D f R 2
La función compuesta z (t ) f g (t ) : R R es diferenciable en R, y por tanto:
𝑑𝑧
𝜕𝑓
= 𝑧 ′ (𝑡) = ⃗∇⃗𝑓[𝑔⃗(𝑡)]. 𝐽𝑔⃗(𝑡) = (
𝑑𝑡
𝜕𝑥
= (𝑒 3𝑡 𝑐𝑜𝑠(𝑒 5𝑡 )
𝜕𝑓
𝑓 ′ (𝑡)
. ( 1′ ) = (𝑦𝑐𝑜𝑠(𝑥𝑦)
)|
𝜕𝑦 (𝑒 2𝑡,𝑒 3𝑡) 𝑓2 (𝑡)
2𝑡
2𝑡
𝑥𝑐𝑜𝑠(𝑥𝑦))|(𝑒 2𝑡,𝑒 3𝑡) . (2𝑒 3𝑡 ) =
3𝑒
𝑒 2𝑡 𝑐𝑜𝑠(𝑒 5𝑡 )). (2𝑒 3𝑡 ) = 2𝑒 5𝑡 𝑐𝑜𝑠(𝑒 5𝑡 ) + 3𝑒 5𝑡 𝑐𝑜𝑠(𝑒 5𝑡 ) = 5𝑒 5𝑡 𝑐𝑜𝑠(𝑒 5𝑡 )
3𝑒
En este caso se trata de la composición de una función de dos variables 𝑓(𝑥, 𝑦) donde a su vez cada una de
estas variables dependen de una variable 𝑡. Esto significa que 𝑧 es también una función que depende de 𝑡:
𝑧 = 𝑓(𝑥(𝑡), 𝑦(𝑡))
31
Supongamos que 𝑓 es una función diferenciable. La regla de la cadena que nos da la diferencial de 𝑧 como
función de 𝑡 es:
𝑑𝑧 𝜕𝑧 𝑑𝑥 𝜕𝑧 𝑑𝑦
=
.
+
.
𝑑𝑡 𝜕𝑥 𝑑𝑡 𝜕𝑦 𝑑𝑡
En caso como este, es útil diseñar un árbol de dependencia:
x
t
y
t
Z
Segundo Caso: considerando ahora el caso donde 𝑧 = 𝑓(𝑥, 𝑦) es una función diferenciable y donde a su vez
𝑥 = 𝑔(𝑠, 𝑡) 𝑒 𝑦 = ℎ(𝑠, 𝑡) son funciones diferenciables de 𝑠 𝑦 𝑡. Entonces:
𝜕𝑧 𝜕𝑧 𝜕𝑥 𝜕𝑧 𝜕𝑦
=
.
+
.
𝜕𝑠 𝜕𝑥 𝜕𝑠 𝜕𝑦 𝜕𝑠
𝜕𝑧 𝜕𝑧 𝜕𝑥 𝜕𝑧 𝜕𝑦
=
.
+
.
𝜕𝑡 𝜕𝑥 𝜕𝑡 𝜕𝑦 𝜕𝑡
Se observa que estas dos derivadas parciales son las componentes del vector gradiente de la función
compuesta, que es la matriz jacobiana de su diferencial
Árbol de Dependencia:
s
x
t
Z
s
y
t
32
Ejemplo 5.16:
Si 𝑧 = 𝑓(𝑥, 𝑦) = 𝑥 2 𝑦 − 𝑦 4 𝑥 3 , donde 𝑥 = 𝑡 3 + 2𝑠 𝑒 𝑦 = 𝑠. 𝑙𝑛𝑡, las derivadas parciales de 𝑧 respecto de
𝑠 𝑦 𝑡 son:
𝜕𝑧 𝜕𝑧 𝜕𝑥 𝜕𝑧 𝜕𝑦
=
.
+
.
= (2𝑥𝑦 − 3𝑦 4 𝑥 2 )2 − (𝑥 2 − 4𝑦 3 𝑥 3 ). 𝑙𝑛𝑡
𝜕𝑠 𝜕𝑥 𝜕𝑠 𝜕𝑦 𝜕𝑠
𝑠
𝜕𝑧 𝜕𝑧 𝜕𝑥 𝜕𝑧 𝜕𝑦
=
.
+
.
= (2𝑥𝑦 − 3𝑦 4 𝑥 2 )3𝑡 2 − (𝑥 2 − 4𝑦 3 𝑥 3 ).
𝑡
𝜕𝑡 𝜕𝑥 𝜕𝑡 𝜕𝑦 𝜕𝑡
Sustituyendo los valores de 𝑥 𝑒 𝑦 en función de 𝑡:
𝜕𝑧
= 2[(𝑡 3 + 2𝑠). 𝑠. 𝑙𝑛𝑡 − 3(𝑠. 𝑙𝑛𝑡)4 (𝑡 3 + 2𝑠)2 ] − [(𝑡 3 + 2𝑠)2 − 4(𝑠. 𝑙𝑛𝑡)3 (𝑡 3 + 2𝑠)3 ]. 𝑙𝑛𝑡
𝜕𝑠
𝑠
𝜕𝑧
= [(𝑡 3 + 2𝑠). 𝑠. 𝑙𝑛𝑡 − 3(𝑠. 𝑙𝑛𝑡)4 (𝑡 3 + 2𝑠)2 ]3𝑡 2 − [(𝑡 3 + 2𝑠)2 − 4(𝑠. 𝑙𝑛𝑡)3 (𝑡 3 + 2𝑠)3 ].
𝑡
𝜕𝑠
Calcule la matriz Jacobiana de la función compuesta y compruebe que sus componentes son las derivadas
parciales recientemente obtenidas (Sugerencia, organice las dos funciones que se van a componer
estableciendo dominio y rango de cada una de ellas y obtenga la matriz de la diferencial mediante el producto
matricial de las Jacobianas) y comparta el resultado en el foro.
Ejemplo 5.17: Para la función f ( x, y, z ) ( x 2 yz 2 , sen( x 2 y 2 )) , calculamos la matriz Jacobiana en el
punto (1,1,1).:
f1 ( x, y, z ) x 2 yz 2
Para ello,
, cuyas derivadas parciales son continuas en todo punto de su dominio,
f 2 ( x, y, z ) sen( x 2 y 2 )
entonces, existe la matriz Jacobiana de dimensión 2x3 por ser f diferenciable en (1,1,1) (al ser de clase C1
en ese punto)
f1
x
J f
f 2
x
f1
y
f 2
y
f1
z
z2
2x
2 yz
y evaluada en el punto (1,1,1) es:
2
2
2
2
f 2 2 x cos( x y ) 2 y cos( x y ) 0
z
1
2
2
J f (1,1,1)
2cos(2) 2cos(2) 0
Con anterioridad se han expresado las propiedades del vector gradiente, y, entre ellas, la propiedad de
ortogonalidad a los conjuntos de nivel que se ha enunciado sin demostrar. A continuación se desarrolla la
prueba del siguiente teorema.
33
Teorema 5.9:
Si f : A Rn R A abierto es diferenciable en X 0 A y f ( X 0 ) c , entonces el vector gradiente
f ( X 0 ) es ortogonal al conjunto de nivel Sc x A / f ( x) c en el punto X 0 . (significa que es
ortogonal a cada vector tangente a Sc en X 0 .
Si u Rn es tangente a Sc en X 0 existe un camino r : t0 , t0 Sc con r (t0 ) X 0 y r (t0 ) u
La función (t ) f r (t ) c en el intervalo t0 , t0 . Así, por la regla de la cadena resulta:
⃗⃗𝑓[𝑟⃗(𝑡0 )]. 𝑟⃗ ′ (𝑡0 ) = ⃗∇⃗𝑓[𝑥⃗0 ]. 𝑢
𝜑′ (𝑡0 ) = 𝑑𝑓[𝑟⃗(𝑡0 )]. 𝑟⃗ ′ (𝑡0 ) = ∇
⃗⃗=0
en consecuencia el vector gradiente es ortogonal al vector tangente al conjunto de nivel, y así el gradiente
es ortogonal al conjunto de nivel Sc en X 0 . En la figura 5.5 se muestra la ortogonalidad del vector
gradiente y las líneas de nivel de una función escalar z f ( x, y ) .
Figura 5.5: Ortogonalidad del vector gradiente y las líneas de nivel
De la misma manera, el vector gradiente de una función escalar de tres variables independientes
w F ( x, y, z ) en un punto P ( x0 , y0 , z0 ) es normal a la superficie de nivel S definida por la ecuación
F ( x, y, z ) c que pasa por P.
Si r t = x t , y t , z t es cualquier curva sobre la superficie S que pasa por P en un instante t 0 , entonces
F (r (t )) c y nuevamente F ( x0 , y0 , z0 ) r(t0 ) 0
(I)
34
Figura 5.6: Ortogonalidad del vector gradiente y las superficies de nivel
Como la ecuación (I) se verifica para todas las curvas sobre S que pasan por P, resulta natural definir el plano
tangente a S en el punto P como el plano que pasa por P ( x0 , y0 , z0 ) y que tiene por vector normal el gradiente
F ( x0 , y0 , z0 ) , por lo que su ecuación es: ( x P) F ( P) 0 y su expresión cartesiana, tal como se puede
observar en la figura 5.6.
F
F
F
( x0 , y0 , z0 ).( x x0 )
( x0 , y0 , z0 ).( y y0 )
( x0 , y0 , z0 ).( z z0 ) 0
x
y
z
(II)
Es interesante observar que como la gráfica de una función de dos variables 𝑧 = 𝑓(𝑥, 𝑦) puede ser considerada
como la superficie de nivel 𝐹(𝑥, 𝑦, 𝑧) = 0 donde 𝐹(𝑥, 𝑦, 𝑧) = 𝑓(𝑥, 𝑦) − 𝑧, al aplicar la ecuación (I) a esta 𝐹 en
particular, se obtiene la ecuación (II)
Ejemplo 5.18: En la figura 5.7 se muestran las curvas de nivel de la función f ( x, y) ( x2 y 2 ).e x
campo de gradiente asociado, y se puede observar la ortogonalidad del campo con las líneas de nivel.
2
y2
Figura 5.7: Curvas de nivel y campos de gradientes
35
y el
Probando que 𝑓 no es diferenciable en un punto
¿Cómo se demuestra que una función escalar no es diferenciable?
En primer lugar, a partir de todas las herramientas presentadas para el análisis de la diferenciabilidad, para que
una función sea diferenciable debe cumplir necesariamente algunas propiedades. Si se comprueba que alguna
de estas propiedades falla, entonces queda probado inmediatamente que f no puede ser diferenciable.
Por ejemplo: “Diferenciabilidad implica continuidad”.
Por lo tanto, si f no es continua en X 0 , entonces no es diferenciable en ese punto.
Se conoce el resultado que “Diferenciabilidad implica derivabilidad”.
Luego, si no existen la derivada de f en X 0 en alguna dirección (incluyendo las derivadas parciales), entonces f
no es diferenciable en ese punto.
En el caso de que las condiciones 1 y 2 se cumplan, aún no será posible determinar si la función f es diferenciable
en el punto X 0 . Luego, se puede analizar si f C1 en X 0 , es decir si admite las funciones derivadas parciales
continuas en ese punto. En caso afirmativo, puede establecerse que f es diferenciable en X 0 . Si f C1 en X 0
, esta condición suficiente no sirve para probar que f es o no diferenciable. En este caso deberá probarse la
diferenciabilidad empleando la definición, es decir mediante la comprobación de la existencia y validez de
límite:
lim
h 0
f ( X 0 h) f ( X 0 ) Df ( X 0 ).h
0.
h
Si este límite no existe, o bien no vale cero, entonces la función f no es diferenciable en el punto X 0 . Nótese
que Df ( X 0 ) es un vector cuyas componentes son las derivadas parciales de f en el punto X 0 . Como ya ha sido
expresado con anterioridad, este vector puede existir y, sin embargo no verificar este límite. En caso de
satisfacerlo, se trata del vector gradiente de f en el punto X 0 .
Para tener en cuenta…
Este mismo análisis se realizará para determinar si una función vectorial f es diferenciable en el punto X 0 , ya
que se investiga la diferenciabilidad de cada una de sus funciones componentes que son funcione escalares.
Comentarios adicionales sobre derivabilidad y diferenciabilidad.
Al analizar funciones escalares de varias variables independientes ha sido preciso distinguir entre las nociones
de derivabilidad (existencia de las derivadas direccionales) y diferenciabilidad (existencia del plano tangente
como una buena aproximación de la función en las cercanías de un punto).
La derivabilidad es una noción muy débil, de la que se pueden deducir muy pocas consecuencias. La existencia
de derivadas parciales depende exclusivamente del comportamiento de f en dos direcciones del plano. Y, tal
como se ha visto, esa información puede ser muy poco representativa del comportamiento global de la función.
En particular: f puede tener derivadas parciales en un punto, sin ser ni siquiera continua en ese punto.
36