Maestromate2.0 05.19.15

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 125

UNIVERSIDAD CENTRAL DE VENEZUELA

FACULTAD DE CIENCIAS
ESCUELA DE MATEMÁTICA

Funciones Convexas,
Cuasi-Convexas, Lipschitz y la
Desigualdad de Simpson

Trabajo Especial de Grado presentado ante la


ilustre Universidad Central de Venezuela por
el Br. Jesús E. Materano C. para optar al
tı́tulo de Licenciado en Matemática.
Tutor: Dr. Nelson J. Merentes D.

Caracas, Venezuela
Mayo, 2015
ii

Nosotros, los abajo firmantes, designados por la Universidad Central de Venezuela


como integrantes del Jurado Examinador del Trabajo Especial de Grado titulado
“Desigualdad de Simpson para Funciones Cuasi Convexas y Funciones Lips-
chitzianas”, presentado por el Br. Jesús E. Materano C., titular de la Cédula de Iden-
tidad 17.147.241, certificamos que este trabajo cumple con los requisitos exigidos por
nuestra Magna Casa de Estudios para optar al tı́tulo de Licenciado en Matemática.

Dr.Nelson Merentes
Tutor

Dr. José Luis Sánchez


Jurado

Dr. Hugo Leiva


Jurado
iii

Dedicado primeramente a Dios, y a mi familia, pues con su ayuda es que este trabajo
pasó de ser un sueño, a una meta realizada.
AGRADECIMIENTOS

Quiero agradecer primeramente a Dios, pues sin Él, este trabajo no hubiese sido posi-
ble, como dice su palabra Juan 15:5 “...Separados de mı́ nada podéis hacer” y 1 Tesaloni-
censes 5:18 “Dad gracias en todo, porque ésta es la voluntad de Dios para con vosotros
en Cristo Jesús”.
A mis padres, Yudith Chique y Néstor Materano y hermanos, Massiel y Néstor David,
que han sido apoyo incondicional durante el trayecto de la licenciatura, gracias mami,
papá y hermanos.
A mi apreciada “Casa que vence las sombras” la UCV por abrirme sus puertas, y
llenarme de conocimientos y vivencias inolvidables.
Al Profesor Nelson Merentes, tutor de este trabajo, por su valioso apoyo, colaboración,
guı́a y paciencia durante la elaboración de este trabajo.
A ti Jackdin Hernández, porque fuiste motor principal para empezar, continuar y
finalizar esta tesis, gracias flaquita. TAMDLQP.
A la señorita Mejı́a, Mariita y Ronaldys, quienes me prestaron su valiosa colaboración
con la búsqueda de la bibliografı́a, escritura, y conocimientos básicos de LATEX, sin
olvidar los momentos agradables y cómicos que vivimos.
A todo el personal del Banco Central de Venezuela por su gran ayuda y colaboración.
Al “Topo-Medida team” la señorita Daniella Fuentes, y el Sr. Ivan Zea por esos dı́as,

iv
Agradecimientos v

esas noches, fines de semanas, y conocimientos compartidos que vivimos durante gran
parte de la carrera.
También quiero agradecer a Gari Roa, Leonardo Prato, Alejandro Quintero, Irving
Márquez, Sahid Leal, Yarot Avendaño por los gratos momentos vividos en la facultad y
fuera de ella.
A todos GRACIAS TOTALES!!!
ÍNDICE GENERAL

1 Preliminares 12
1.1 Funciones Convexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.1.1 Continuidad y Diferenciabilidad . . . . . . . . . . . . . . . . . . . 22
1.1.2 Teorema de separación para funciones Convexas (Teorema del
Sandwich) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.1.3 Desigualdad de Jensen . . . . . . . . . . . . . . . . . . . . . . . . 36
1.1.4 Desigualdad de Tipo Hermite-Hadamard . . . . . . . . . . . . . . 39
1.2 Funciones Cuasi-Convexas . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.2.1 Teorema de Separación para Funciones Cuasi-Convexas (Teorema
del Sandwich). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.3 Operaciones con Funciones Convexas . . . . . . . . . . . . . . . . . . . . 53

2 Desigualdad de Simpson 62
2.1 Interpolación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.2 Integración numérica y cuadratura . . . . . . . . . . . . . . . . . . . . . 63
2.3 Fórmulas de integración de tipo interpolatorio . . . . . . . . . . . . . . . 65
2.4 Fórmulas básicas de integración numérica . . . . . . . . . . . . . . . . . . 66
2.5 Desigualdad de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6
Agradecimientos 7

2.5.1 Desigualdad de Simpson para Funciones Cuasi-Convexas . . . . . 84


2.5.2 Desigualdad de Simpson para funciones Lipschitzianas . . . . . . 100
2.6 Aplicaciones para Medias Especiales . . . . . . . . . . . . . . . . . . . . . 111
2.6.1 Media Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
2.6.2 Media Armónica . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
2.6.3 Media Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . 113
2.6.4 Media Logarı́tmica . . . . . . . . . . . . . . . . . . . . . . . . . . 114

Conclusiones y Recomendaciones 118

Bibliografı́a 120
INTRODUCCIÓN

Este Trabajo Especial de Grado, está enmarcado en una de las lı́neas de investigación
que concurren en el seminario permanente que se realiza en la Facultad de Ciencias de
la Universidad Central de Venezuela.
El trabajo es de carácter expositivo e intradisciplinar, ya que en él, participan
diferentes nociones y tópicos matemáticos tales como: convexidad, variación acotada,
interpolación de polinomios, cuadraturas, integración numérica y otros. El objetivo prin-
cipal del Trabajo Especial de Grado es exponer resultados sobre la desigualdad de
Simpson para funciones convexas, cuasi-convexas y Lipschitz.
En análisis numérico, la regla o método de Simpson, nombrada ası́ en honor
a Thomas Simpson (y a veces llamada regla de Kepler), es un método de integración
numérica para obtener el valor aproximado de integrales definidas; especificamente es la
aproximación:

Z b · µ ¶ ¸
b−a a+b
f (x)dx ≈ f (a) + 4f + f (b) .
a 6 2
La fórmula fué utilizada por primera vez por Evangelista Torricelli (1608-1647),
pero debe su nombre al matemático Thomas Simpson (1710-1761), corresponde a la
regla del tonel que el astrónomo y matemático Johannes Kepler (1571-1630), ya habı́a
formulado en 1615.

8
Introducción 9

Uno de los resultados mejor conocido en la integración numérica es la desigualdad


de Simpson

¯Z b · µ ¶ ¸¯
¯ b−a a+b ¯ 1
¯ f (x)dx − f (a) + 4f + f (b) ¯¯ ≤ ||f (4) ||∞ (b − a)5
¯ 6 2 2880
a

donde la función f : [a, b] → R se asume cuatro veces continuamente diferenciable


sobre el intervalo (a, b) y la cuarta derivada acotada en (a, b), es decir

||f (4) ||∞ := sup |f (4) | < ∞.


x∈(a,b)

En este trabajo (capı́tulo 2) la noción de cuadratura juega un importante rol.


Se entiende por cuadratura el cálculo de integrales definidas de funciones de una
variable, esto es, el cálculo del valor

Z b
I(f ) = f (x)dx.
a

La idea básica de la cuadratura numérica es aproximar el valor de I(f ) por la


integral interpolante,

Z b
I(f ) ≈ p(x)dx,
a

bien sea este el polinomio interpolador de f asociado a ciertos nodos, bien un inter-
polante a trozos asociado a una partición ∆ de [a, b]. En el primer caso, la aproximación
da lugar a lo que se conoce como fórmulas de cuadratura; e el segundo caso a las fórmulas
de cuadratura compuesta.
La aproximación numérica de la integral definida se conoce como la integración
o cuadratura numérica. El segundo nombre procede de la antigüedad, en relación con el
cálculo de las áreas de las figuras curvas, cuyo ejemplo más notorio es el problema de la
cuadratura del cı́rculo (encontrar el cuadrado de área coincidente con la de un cı́rculo
dado) [8]. En el capı́tulo 2 nos ocuparemos brevemente del cálculo aproximado del área
bajo la curva f (x), definida sobre un intervalo [a, b], de la recta real, es decir
Introducción 10

Z b
I(f ) = f (x)dx.
a

La integración numérica es una herramienta de gran utilidad para obtener va-


lores aproximados de integrales definidas, que no pueden calcularse analı́ticamente, ya
sea porque el integrando no tiene primitiva expresable analı́ticamente, o bien, porque
dicho integrando no se conoce en forma analı́tica, sino en forma discreta (tabulada).
Cuadratura es un término matemático histórico que significa el determinio de una
área. El estudio de cuadratura ha servido como una de las principales fuentes de
problemas para el análisis matemático.
Los matemáticos de la antigua Grecia, de acuerdo con la doctrina pitagórica, en-
tendı́an la determinación del área de una figura, como el proceso de construcción
geométrica de un cuadrado que tiene la misma área (cuadratura). Ası́ este proceso ob-
tuvo el nombre de cuadratura. Los geómetras griegos no siempre tuvieron éxito, pero
continuaron realizando cuadraturas de algunas figuras cuyos lados no eran otra cosa que
los segmentos de lı́nea; como por ejemplo, el Lune de Hipócrates y la cuadratura del seg-
mento parabólico desarrollada por Arquı́medes. Por tradición griega, estas construcciones
tenian que llevarse a cabo utilizando solamente un compás y una regla.
Para una cuadratura de un rectángulo con los lados a y b es necesario construir un

cuadrado con el lado x = ab (la media geométrica de a y b). Para este propósito, es
posible utilizar el siguiente hecho; si se dibuja el cı́rculo con un diámetro que resulta del
hecho de unir segmentos de lı́nea de longitudes a y b, entonces la altura del segmento de
lı́nea dibujada perpendicularmente al diámetro, a partir de el punto de su conexión con
el punto donde cruza el cı́rculo, es igual a la media geométrica de a y b. Una construcción
geométrica similar resuelve los problemas de cuadratura de un paralelograma y de un
4
triángulo. El área de un segmento de parábola es 3
del área de un cierto triángulo inscrito
en ella.
Los problemas de la cuadratura de figuras curvilı́neas son mucho más difı́ciles que
los anteriores. La cuadratura del cı́rculo con regla y compás se habı́a demostrado en el
Introducción 11

siglo XIX que es imposible. Sin embargo, para algunas cifras (por ejemplo un Lune de
Hipócrates) se puede realizar una cuadratura. Las cuadraturas de la superficie de una
esfera y un segmento de parábola descubierta por Arquı́medes se convirtió en el más alto
logro de análisis en la antiguedad.
El área de la superficie de una esfera es igual a cuadruplicar el área del cı́rculo formado
por un gran cı́rculo de esta esfera.
4
El área de un segmento de una parábola determinada por una lı́nea recta, es 3
del
área de un triángulo inscrito en este segmento.
Para la prueba de estos resultados Arquı́medes de Siracusa utilizó el método de ex-
hausción [9] de Eudoxo.
Este Trabajo Especial de Grado está organizado en dos capı́tulos, el capı́tulo 1
está dedicado a la noción de convexidad, y sus propiedades.
Se estudia la desigualdad de Hermite Hadamard y la desigualdad de Jensen.
En el capı́tulo 2 se introduce brevemente la regla de cuadratura de Simpson y nociones
de interpolación. También se estudia la regla trapezoiodal.
Se exponen de manera detallada algunos resultados de Mahomad Alomari en [3] y
Sever Silvestru Dragomir en [13] sore la desigualdad de Simpson sobre funciones cuasi-
convexas y lipschitzianas respectivamente.
Se dará una generalización, de la Desigualdad de Simpson para funciones cuasi con-
vexas en términos, de la tercera derivada, ası́ como la estimación del error para la fórmula
de cuadratura de Simpson en funciones Lipschitzianas.
CAPÍTULO 1

PRELIMINARES

En este capı́tulo se dará una breve introducción de la noción de convexidad y sus


propiedades como continuidad, diferenciabilidad entre otras. Desigualdad de Hölder y
Hermite-Hadamard ası́ como también se presentarán algunas definiciones, proposiciones,
teoremas y ejemplos, que ayudarán a comprender mejor este trabajo especial de grado.
En la vida diaria la noción de convexidad está presente de varias maneras, el ejemplo
más sencillo; es nuestra posición cuando nos mantenemos de pie, que se fija siempre en la
proyección vertical de nuestro centro de gravedad, y se encuentra dentro del arco de los
pies, el cual tiende a ser convexo. Además, la convexidad tiene un gran impacto en nuestra
vida cotidiana a través de numerosas aplicaciones en distintas áreas del conocimiento
como Finanzas, Economı́a, Ingenierı́a, Computación entre otros.
Los estudios realizados sobre teorı́a de convexidad tienen una larga historia; en el
famoso libro “Los Elementos de Euclı́des”(300 A.C.) aparecen varias contribuciones a
esa materia, relativas, principalmente, a propiedades de los polı́gonos y los poliedros. Sin
embargo, fué Arquı́medes de Siracusa (278-212 A.C.) el primero en dar una definición
precisa de lo que se entendı́a por una curva o una superficie convexa (en su libro “Sobre la
esfera y el cilindro”). Entre las propiedades obtenidas por Arquı́medes, merecen especial
mención los postulados y resultados referentes al centro de gravedad de conjuntos planos

12
Cap. 1 Preliminares 13

y su descripción de los trece poliedros semi regulares, (entiéndase por un poliedro convexo
semi regular si sus caras son polı́gonos regulares de, al menos, dos tipos, y el grupo de
isometrı́as es transitivo sobre los vértices), también conocidos como sólidos arquimedianos
que fueron redescubiertos muy posteriormente por Johannes Kepler (1571-1630) en su
libro“Harmonices Mundi”(1619), quién demostró que efectivamente solo podı́an existir
trece.
Por lo que podemos saber, fué el matemático griego Zenodorus (200 A.C.) el autor del
primer trabajo conocido sobre el famoso problema isoperimétrico, (el cual data del año
810 A.C.). Él demuestra que todos los n-ágonos convexos de perı́metro dado, y el n-ágono
regular encierra la mayor área (suponiendo la existencia de tal n-ágono maximal).
A finales del siglo XIX y principios del siglo XX se trabaja en el tema de convex-
idad por varios matemáticos, entre ellos, el alemán Otto Hölder [30]. El cual, en 1889
demostró la forma discreta de la llamada desigualdad de Jensen, bajo una hipótesis con
un mayor grado de regularidad para la función f 0 , es decir, que la segunda derivada es
no negativa en su dominio, lo que quiere decir que, f 00 (x) > 0 para todo x ∈ Domf.
Además de contribuciones, a finales del siglo XIX, aparecieron diversos resultados
de gran importancia en convexidad gracias a destacados matemáticos como H. Brunn o
H. Minkowski, sin embargo; el interés real sobre la geometrı́a convexa es relativamente
reciente, pues un primer estudio sistemático no lo encontramos hasta 1934, en el libro
de T. Bonnesen y W. Fenchel “Theorie der Konvex Körper”. A lo largo de los años
40 y 50 se descubrieron numerosas aplicaciones importantes de los conjuntos convexos,
principalmente en el campo de la optimización geométrica, lo que acrecentó el interés de
esta teorı́a.
Adicionalmente se obtuvieron varios resultados significativos en el Análisis Funcional
Geométrico, la Economı́a Matemática y Análisis Convexo. El estudio de las funciones
convexas fué tomando auge al punto que apareció el libro de G. H. Hardy, J. E. Littlewood
y G. Polya [28] titulado “Inequalities”.
Uno de los resultados más importantes de las funciones convexas es la llamada de-
Cap. 1 Preliminares 14

sigualdad de Hermite-Hadamard que fué dada por Jaques Hadamard [27] en 1983, para
el caso de las funciones con derivadas creciente en un intervalo cerrado de la recta real.
En esa época la noción de función convexa estaba en proceso de construcción. En 1883
la parte derecha de la desigualdad la demostró Charles Hermite por lo que hoy en dı́a se
llama desigualdad de Hermite-Hadamard, y viene dada de la siguiente manera
µ ¶ Z b
a+b 1 f (a) + f (b)
f ≤ f (x)dx ≤
2 b−a a 2
Una forma más generalizada del concepto de función convexa, la introdujo Edwin
Bekenbach [6] en 1937 en el trabajo ”Generalized Convex Functions”, reemplazando el
segmento por gráficas de funciones continuas pertenecientes a una familia de funciones de
dos parámetros. Las funciones generalizadas son obtenidas de muchas de las propiedades
conocidas para la función convexa clásica, como se puede ver en los trabajos de Edwin
Beckenbach, Mihály Bessenyi y Kazimierz Nikodem [6], [7], [43], respectivamente, o el
libro titulado “Convex Functions”, de A. W. Roberts, D. E. Varberg [51].
Dada funciones f y g definidas sobre un espacio vectorial a valores reales, uno de
los problemas de interés en la matemática es determinar condiciones necesarias y sufi-
cientes sobre f y g para que exista una función h que separe a f y g (f ≤ h ≤ g)
y que cumpla cierta condición; por ejemplo, continuidad, convexidad, cuasi-convexidad,
cuasi-concavidad, monotonı́a, etc. K. Baron, J. Matkowski y K. Nikodem [5] muestran
resultados diferentes a esta clase de problemas. Zs. Páles, en [40], obtiene resultados
similares para funciones cuasi-convexas y cuasi-cóncavas.

1.1 Funciones Convexas


El concepto de función convexa es una noción básica en la geometrı́a, que también se
usa ampliamente en otras áreas de las matemáticas y las ciencias; como en la Teorı́a de
la Optimización y la Teorı́a de las desigualdades, del análisis funcional, la programación
matemática y la Teorı́a de Juegos, la Teorı́a de números, el cálculo variacional y otras
ramas de las matemáticas aplicadas que utilizan este concepto de manera fundamental.
Cap. 1 Preliminares 15

su interrelación con estas ramas que se muestra dı́a a dı́a más profunda y fructı́fera.

En 1893 el francés Jaques Hadamard [31], [32] logró una desigualdad para aquellas
funciones que tienen derivada creciente en [a, b]. Johan Ludwig William Jensen utiliza la
siguiente desigualdad µ ¶
x+y 1
f ≤ (f (x) + f (y)) (1.1)
2 2
para definir funciones convexas y dió el primero de una larga serie de resultados el cual
junto con la desigualdad (1.1) implica la continuidad de f.
A continuación se enunciará la definición de función convexa, la cual constituye la
noción fundamental de este trabajo

Definición 1. Sean I ⊂ R un intervalo y f : I → R una función. Se dice que f es


convexa si y sólo si
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y) (1.2)

para todo x, y ∈ I y t ∈ [0, 1]. Si la desigualdad es estricta cuando x 6= y y t ∈ (0, 1), se


dice que f es estrictamente convexa.

Luego, el matemático Johan Jensen uso la desigualdad que lleva su nombre para
enunciar la siguiente definicion de función convexa [36].

Definición 2. Sean I ⊂ R un conjunto abierto y convexo. Una función f : I → R es


llamada convexa si y sólo si satisface la desigualdad funcional de Jensen
µ ¶
a+b f (x) + f (y)
f ≤
2 2
para todo a, b ∈ I. Si la desigualdad es estricta para x 6= y, entonces la función f es
llamada estrictamente convexa.

Geométricamente, la definición de una función convexa f significa que para cua-


lesquiera dos puntos (x, f (x)), (y, f (y)) ∈ Graf (f ) donde Graf (f ) es el gráfico de
Cap. 1 Preliminares 16

f, la cuerda que los une nunca está por debajo de la gráfica de la función; esta idea
la generaliza el matemático estadounidense E. Beckenbach [6] en 1937, reemplazando
los segmentos por el gráfico de funciones continuas que pertenecen a una familia de
funciones F de dos parámetros, como se muestra a continuación en la Figura 1.1

Figura 1.1: Función convexa, I = [x, y]

Sean x, y ∈ I, x < y y considérese la ecuación de la recta que pasa por los puntos
(x, f (x)), (y, f (y)), es decir

f (y) − f (x)
r(t) = (t − y) + f (y), t ∈ R.
y−x

Si
z = tx + (1 − t), t ∈ (0, 1),
Cap. 1 Preliminares 17

entonces

f (y) − f (x)
r(z) = r(tx + (1 − t)y) = (tx + (1 − x)y − y) + f (y)
y−x
f (y) − f (x)
= (t(x − y)) + f (y)
y−x
= t(f (x) − f (y)) + f (y)

= tf (x) − (1 − t)f (y).

Por lo tanto r(z) = tf (x) + (1 − t)f (y); ası́, el punto (z, r(z)) está sobre el segmento
de recta que une los puntos (x, f (x)), (y, f (y)).

Además, como f es una función convexa, se verifica

f (z) = f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)

= r(z).

En consecuencia f (z) = r(z) para todo z ∈ [x, y], de donde se concluye que el
segmento de recta que une los puntos (x, f (x)), (y, f (y)) nunca está por debajo de la
gráfica de la función.
Para ilustrar esta definición tenemos la siguiente Figura 1.2.

f(x)

tf(x)+(1−t)f(y)
f(y)

f(tx+(1−t)y)

x tx+(1−t)y y

Figura 1.2: Función convexa, I = [x2 , x1 ]


Cap. 1 Preliminares 18

Análogamente, si se invierte la desigualdad (1.2), se dice que f es cóncava. La función


es estrictamente cóncava si la desigualdad es estricta cuando x 6= y y t ∈ (0, 1).
La interpretación geométrica de una función cóncava establece que si f : I → R es
una función cóncava, entonces la cuerda que une los puntos (x, f (x)), (y, f (y)) ∈ Graf (f )
nunca está por arriba de la gráfica de f, como lo ilustra la figura 1.3

f(tx+(1−t)y)

f(y)
tf(x)+(1−t)f(y)

f(x)

x tx+(1−t)y y

Figura 1.3: Función cóncava, I = [x, y]

Ahora consideraremos algunos ejemplos de funciones convexas para ilustrar la


difinición.

Ejemplo 1. f (x) = |x| sobre I = R.


Cap. 1 Preliminares 19

Veamos que f (x) = |x| es convexa.

f (tx + (1 − t)y) = |tx + (1 − t)y|

≤ |tx| + |(1 − t)y|

= t|x| + (1 − t)|y|

= tf (x) + (1 − t)f (y)

ası́ f es convexa.

Ejemplo 2. g(x) = x2 sobre I = R.

Sea t ∈ [0, 1]; para comprobar que la función g(x) = x2 es convexa se tiene que
verificar que
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)

es decir

0 ≤ t(1 − t)(x − y)2

= t(1 − t)(x2 − 2xy + y 2 )

= tx2 (1 − t) + y 2 (1 − t) − 2t(1 − t)xy

= tx2 (1 − t) + y 2 (1 − t)(1 − 1 + t) − 2t(1 − t)xy

= tx2 (1 − t) + y 2 (1 − t)(1 − (1 − t)) − 2t(1 − t)xy

= tx2 + (1 − t)y 2 − t2 x2 − (1 − t)2 y 2 − 2t(1 − t)xy

= tx2 + (1 − t)y 2 − (t2 x2 + (1 − t)2 y 2 + 2t(1 − t)xy)

= tx2 + (1 − t)y 2 − (tx + (1 − t)y)2

en efecto g(x) = x2 es convexa.


Cap. 1 Preliminares 20

1
Ejemplo 3. h(x) = sobre I = (0, ∞).
x
Demostremos que h es una función convexa. En efecto x, y ∈ R y t ∈ [0, 1], entonces:

Demostremos, que h es convexa


1 1 1
≤ t + (1 − t)
tx + (1 − t)y x y
xy ≤ ty(tx + (1 − t)y) + (1 − t)x(tx + (1 − t)y)

xy ≤ ty(tx + y − ty) + (1 − t)x(tx + y − ty)

xy ≤ t2 xy + ty 2 − t2 y 2 + tx2 + xy − txy − t2 x2 − txy + t2 xy

0 ≤ t2 xy + ty 2 − t2 y 2 + tx2 + xy − txy − t2 x2 − txy + t2 xy t>0

0 ≤ 2txy + x2 + y 2 − tx2 − 2xy − ty 2

0 ≤ 2xy(t − 1) + x2 (1 − t) + y 2 (1 − t)

0 ≤ (t − 1)(2xy + x2 + y 2 )

0 ≤ (1 − t)(x + y)2 (1 − t) > 0

0 ≤ (x + y)2

lo cual es cierto; por lo tanto, h es convexa.


El lema que sigue se usará luego para la demostración del Teorema 3.

Lema 1 (Ver [48]). Sean I ⊂ R un intervalo y f : I → R una función. Entonces, f es


convexa si y sólo si
f (z) − f (x) f (y) − f (x) f (y) − f (z)
≤ ≤
z−x y−x y−z
para todo x, y, z ∈ I tal que x < z < y.

Demostración: Para verificar la primera desigualdad, consideremos

z = x + λ(y − x), λ ∈ (0, 1),


µ ¶
z−x
con λ = . Dado que f es convexa, se verifica
y−x
Cap. 1 Preliminares 21

f (z) ≤ f (x) + λ(f (y) − f (x)),

de donde

z−x
f (z) − f (x) ≤ (f (y) − f (x)),
y−x
y en consecuencia

f (z) − f (x) f (y) − f (x)


≤ ,
z−x y−x
en el cual se cumple el lado izquierdo de la desigualdad. Ahora sea z = λ(x−y), entonces,
z−y
= λ ∈ (0, 1) y de la convexidad de la función f se tiene
x−y

f (z) ≤ f (y) + λ(f (x) − f (y)),

de donde se obtiene inmediatamente

f (z) − f (y) f (x) − f (y)


≥ ,
z−y x−y
donde z − y < 0, cumpliéndose ası́ el lado derecho de la desigualdad. Recı́procamente,
supóngase que f verifica las desigualdades del Lema 1 con x < z < y, y sea λ ∈ [0, 1] tal
z−x
que z = x + λ(y − x). Obsérvese que λ = y−x
. Por la primera desigualdad resulta que

f (z) − f (x) f (y) − f (x)


≤ .
z−x y−x
Luego µ ¶
z−x
f (z) ≤ f (x) + (f (y) − f (x)).
y−x
Es decir

f (x + λ(y − x)) ≤ f (x) + λ(f (y) − f (x)),

para todo x, y ∈ I y λ ∈ [0, 1]; ası́ f es una función convexa.


Cap. 1 Preliminares 22

1.1.1 Continuidad y Diferenciabilidad

En esta sección se estudiarán las propiedades de continuidad y diferenciabilidad de


las funciones convexas. Se iniciará con una proposición que expresa que toda función
convexa definida en un intervalo cerrado I = [a, b] es acotada.

Proposición 1 (Ver [51]). Si f : [a, b] → R es una función convexa, entonces es acotada.

Demostración: Sea M = máx{f (a), f (b)} y z ∈ [a, b]. Entonces existe t ∈ [0, 1] tal
que z = ta + (1 − t)b, y como f es una función convexa, se tiene

f (z) = f (ta + (1 − t)b)

≤ tf (a) + (1 − t)f (b)

≤ tM + (1 − t)M

= M.

Es decir, f es acotada superiormente.

Para ver que f es acotada inferiormente se escogerá t ∈ R, de tal forma que los puntos
a+b a+b
x= − t, y= + t,
2 2
están en [a, b]. Entonces
µ ¶ µ µ ¶ µ ¶¶
a+b 1 a+b 1 a+b
f = f +t + −t
2 2 2 2 2
µ ¶ µ ¶
1 a+b 1 a+b
≤ f +t + f −t ,
2 2 2 2
de donde
µ ¶ µ ¶ µ ¶
a+b a+b a+b
f +t ≥ 2f −f −t
2 2 2
µ ¶
a+b
≥ 2f − M = m.
2
a+b
Como cualquier punto en [a, b] se puede escribir en la forma 2
+ t, para algún t
debidamente seleccionado, se deduce que f es acotada inferiormente.
Cap. 1 Preliminares 23

En conclusión, para todo z ∈ [a, b] se verfica que

m ≤ f (z) ≤ M,
µ ¶
a+b
donde M = máx{f (a), f (b)} y m = 2f − M y por lo tanto f es acotada. ¤
2
Observación 1. Es indispensable que el intervalo en el que está definida la función sea
cerrado y acotado ya que en caso contrario puede suceder que la función no sea acotada.
Como ejemplos de estos se tienen las funciones f : (0, 1] → R definida por f (x) = x−1 y
g : [0, ∞) → R dada por g(x) = x2 , que son convexas pero no son acotadas superiormente.

A continuación enunciaremos las definicón de función Lipschitz.

Definición 3. Se dice que una función f : I → R satisface la condición Lipschitz en el


intervalo I si para todo x, y ∈ I existe una constante K > 0 tal que

|f (x) − f (y)| ≤ K|x − y|.

La constante K se denomina constante de Lipschizidad.

En el siguiente teorema demostraremos que toda función f : I ⊂ R → R convexa,


donde I es un intervalo, satisface una condición de Lipschitz en cualquier intervalo cerrado
contenido en I 0 (el interior de I).

Teorema 1 (Ver [51]). Sean I ⊂ R un intervalo, y f : I → R una función convexa.


Entonces f satisface una condición de Lipschitz en cualquier intervalo cerrado [a, b] ⊂ I 0
y, por lo tanto, f es continua en el interior de I.

Demostración: Sea ² > 0 tal que a − ² y b + ² estén en I, y sean M y m las cotas


inferior y superior de f en el intervalo [a − ², b + ²]. Sean x, y ∈ [a, b], con x 6= y.

Como ¯ ¯
¯ 1 ¯
¯ (y − x)¯ = 1,
¯ |y − x| ¯
Cap. 1 Preliminares 24

resulta que
²
z=y+ (y − x) ∈ [a − ², b + ²],
|y − x|
luego,
|y − x| ²x
y= z+ .
² + |y − x| ² + |y − x|
En consecuencia, si consideramos
|y − x|
λ= ∈ (0, 1),
² + |y − x|
se tiene que
y = λz + (1 − λ)x,

y como f es convexa se cumple lo siguiente

f (y) ≤ λf (z) + (1 − λ)f (x)

= λ[f (z) − f (x)] + f (x).

De ahı́ que

f (y) − f (x) ≤ λ(M − m)


|y − x|
< (M − m) = k|y − x|,
²
(M − m)
donde k = . Por lo tanto para x, y ∈ [a, b], x 6= y, se deduce que
²
|f (y) − f (x)| < k|y − x|

y ası́ f es Lipschitz en cualquier intervalo [a, b] ⊂ I 0 . De cualesquiera sea el intervalo


[a, b], se concluye que f es continua en el interior de I. ¤

Observación 2. El teorema que se acaba de demostrar establece que si f : I → R, es


convexa, entonces es continua en el interior del intervalo I. Pero no se aclara la situación
en los puntos extremos del intervalo I. Con el fin de aclarar esto, considérese la función
g : [−1, 1] → R definida por

 x2 si x ∈ [−1, 1)
g(x) =
 2 si x = 1.
Cap. 1 Preliminares 25

Esta función es convexa, continua en x = −1 y discontinua en x = 1.


En lo que sigue de esta sección se tratará la diferenciabilidad de funciones convexas
en términos de derivadas laterales.

Definición 4. Sea f : I → R una función, entonces las derivadas laterales se definen


para x ∈ I en caso de existir tal como sigue
derivada por la izquierda
f (y) − f (x)
f−0 (x) = lı́m
y↑x y−x
y derivada por la derecha
f (y) − f (x)
f+0 (x) = lı́m .
y↓x y−x
Demostraremos a continuación que las derivadas laterales de una función convexa
existen, son monótonas y crecientes en I 0 (Interior de I).

Teorema 2 (Ver [48]). Sea f : I → R una función convexa [estrictamente convexa]


entonces en cada x ∈ I 0 existen las derivadas laterales y las funciones f−0 (x) y f+0 (x) son
crecientes [estrictamente crecientes] en I 0 .

Demostración: Considérese cuatro puntos w, x, y, z ∈ I 0 tales que w < x < y < z y


sean
P = (w, f (w)), Q = (x, f (x)), R = (y, f (y)) y S = (z, f (z)).

(Ver Figura 1.4);


Cap. 1 Preliminares 26

R
Q

w x y z

Figura 1.4: Relación entre las pendientes.

Se considera la siguiente notación para la pendiente de la recta que pasa por los
puntos A y B tal como sigue pendiente(AB) = pend(AB). Con esta notación se obtiene

pend(P Q) ≤ pend(P R) ≤ pend(QR) ≤ pend(QS) ≤ pend(RS) (1.3)

con desigualdades estrictas si f es estrictamente convexa. Esto equivale a las siguientes


desigualdades

f (w) − f (x) f (w) − f (y) f (x) − f (y) f (x) − f (z) f (y) − f (z)
≤ ≤ ≤ ≤ , (1.4)
w−x w−y x−y x−z y−z

de la segunda desigualdad de (1.4) se obtiene que

f (w) − f (y)
es creciente en w (w < y) (1.5)
w−y

de la desigualdad (1.4) y (1.5) se tiene

f (w) − f (y) f (y) − f (z)


≤ ,
w−y y−z
Cap. 1 Preliminares 27

es decir,
f (w) − f (y) f (y) − f (z)
está acotado superiormente por (1.6)
w−y y−z
para cualquier z > y.
De (1.5) y (1.6) resulta que,

f (w) − f (y)
lı́m
w↑y w−y

existe y
f (w) − f (y) f (w) − f (y)
lı́m = sup
w↑y w−y w<y w−y
por lo tanto, si y ∈ I 0 , existe la derivada lateral f−0 (y).
De manera similar, se comprueba que existe derivada lateral f+0 (x), para todo x ∈ I 0
y
f (x) − f (z) f (x) − f (z)
f+0 (x) = lı́m = ı́nf
z↓x x−z z>x x−z
además de las cuatro desigualdades de (1.4) se obtiene que

f−0 (x) ≤ f+0 (x) ≤ f− (y) ≤ f+ (y)

y por lo tanto f−0 (x) ≤ f 0 (x) para todo x ∈ I 0 y f−0 , f+0 son funciones crecientes. ¤

Observación 3. Considérese los tres puntos w, x, y ∈ I 0 , tales que w < x < y. Como la
función derivada lateral f+0 es monótona, existe el lı́mite de f+0 (x) cuando x ↓ w. Además
la desigualdad
f (y) − f (x)
f+0 (x) ≤
y−x
y de la continuidad de f se puede inferir que

f (y) − f (x) f (y) − f (w)


lı́m f+0 (x) ≤ lı́m = .
x↓w x↓w y−x y−w

Si se hace y ↓ w afirmaremos que

f (y) − f (w)
lı́m f+0 (x) ≤ lı́m = f+0 (w).
x↓w y↓w y−w
Cap. 1 Preliminares 28

Esto implica que


lı́m f+ (x) ≤ f+0 (w) (1.7)
x↓w

por otra parte, como w < x, la monotonı́a de f+0 implica que f+0 (w) ≤ f+0 (x) y por lo
tanto
f+0 (w) ≤ lı́m f+0 (x) (1.8)
x↓w

de (1.7) y (1.8) se deduce que

lı́m f+0 (x) = f+0 (w).


x↓w

Supóngase ahora que los tres puntos x, y, w ∈ I 0 son tales que y < x < w. Dado que
la función f+0 es monótona creciente se verifica
f (y) − f (x)
≤ f+0 (x)
y−x
y de la continuidad de f se tiene
f (y) − f (x)
lı́m ≤ lı́m f+0 (x)
x↑w y−x x↑w

si ahora se hace que y ↑ w, se obtiene


f (y) − f (x)
lı́m ≤ lı́m f+0 (x),
y↑w y−x x↑w

es decir,
f−0 (w) ≤ lı́m f+0 (x) (1.9)
x↑w

además, como x < w, la monotonı́a de las derivadas laterales implica que f+0 (x) ≤ f−0 (w)
y en consecuencia
lı́m f+0 (x) ≤ f−0 (w) (1.10)
w↑w

de (1.9) y (1.10) se obtiene que

lı́m f+0 (x) = f−0 (w).


x↑w

El próximo teorema presenta una forma de reconocer las funciones convexas como
integrales de funciones crecientes.
Cap. 1 Preliminares 29

Teorema 3 (Ver [51]). Una función f : (a, b) → R es convexa (estrictamente convexa)


si y sólo si existe una función creciente (estrictamente creciente) g : (a, b) → R y un
punto c ∈ (a, b), tales que para todo x ∈ (a, b)
Z x
f (x) − f (c) = g(t)dt. (1.11)
c

Demostración: Supóngase que la relación (1.11) es cierta con g creciente y sean α, β,


números positivos tales que α + β = 1. Entonces, para todo x, y ∈ (a, b) tales que x < y,
se tiene x < αx + βy < y. Luego

αf (x) + βf (y) − f (αx + βy) = αf (x) + βf (y) − (α + β)f (αx + βy)

= β(f (y) − f (αx + βy)) − α(f (αx + βy) − f (x))


Z y Z αx+βy
= β g(t)dt − α g(t)dt por (1.11)y g creciente
αx+βy x
Z y Z αx+βy
≥ β g(αx + βy)dt − α g(αx + βy)dt (A)
αx+βy x
= βg(αx + βy)(y − (αx + βy)) − αg(αx + βy)(αx + βy − x)

= g(αx + βy)(β(y − (αx + βy)) − α(αx + βy − x))

= g(αx + βy)(βy − β(αx + βy) − α(αx + βy) + αx)

= g(αx + βy)(αx + βy − (α + β)(αx + βy))

= g(αx + βy)(αx + βy − (αx + βy)) = 0

esto implica que


αf (x) + βf (y) − f (αx + βy) ≥ 0 (1.12)

para todo α, β ∈ [0, 1], α + β = 1 y x, y ∈ (a, b). Por lo tanto f es convexa. Además
como g es una función creciente se verifican

x < t < αx + βy ⇒ g(t) ≤ g(αx + βy)

αx + βy < t < y ⇒ g(αx + βy) ≤ g(t)

y si g es estrictamente creciente estas desigualdades son estrictas, y por lo tanto la


desigualdad (A) es estricta, donde la desigualdad (1.12) también es estricta y ası́ la
función f es estrictamente creciente.
Cap. 1 Preliminares 30

Recı́procamente, supóngase que f es una función convexa (estrictamente convexa)


por el Teorema 2 se sabe que la derivada lateral f+0 existe y es creciente (estrictamente
Q
creciente). Consideremos una partición = {c = x0 < x1 < · · · < xn = x} del intervalo
[c, x]. Cómo xk−1 < xk para todo 1 ≤ k ≤ n, se tiene de acuerdo con el Lema 1 y el
Teorema 2 que
f (xk ) − f (xk−1 )
f+0 (xk−1 ) ≤ ≤ f+0 (xk )
xk − xk−1
de donde se obtiene

f+0 (xk−1 )(xk − xk−1 ) ≤ f (xk ) − f (xk−1 ) ≤ f+0 (xk )(xk − xk−1 )

sumando sobre k, se tiene


n
X n
X
f+0 (xk−1 )(xk − xk−1 ) ≤ f (xn ) − f (x0 ) ≤ f+0 (xk )(xk − xk−1 ).
k=1 k=1

Las dos sumas de estas últimas desigualdades son las sumas de Riemann de la función
Q
f+0 asociadas a la partición y verifican las desigualdades independientemente de la
partición del intervalo [c, x] que se considere. Como la función f+0 es creciente, entonces
es Riemann-integrable y al considerar el supremo de la suma izquierda y el ı́nfimo de la
suma de la derecha sobre todas las particiones se obtiene por definición de integral de
Riemann que Z Z
x x
f+0 (t)dt ≤ f (x) − f (c) ≤ f+0 (t)dt
c c

es decir Z x
f (x) − f (c) = f+0 (t)dt
c

y ası́ podemos asegurar que g(t) = f+0 (t). La función f−0 también se puede usar en lugar de
f+ ya que ambas funciones son crecientes (estrictamente crecientes) cuando f es convexa
(estrictamente convexa). ¤
El teorema anterior demuestra que para una función diferenciable, la convexidad
implica que la derivada es creciente. A continuación se presenta otra manera de ver la
convexidad de una función.
Cap. 1 Preliminares 31

Teorema 4 (Ver [51]). Sea f : [a, b] → R una función diferenciable en (a, b). Entonces
f es convexa, (estrictamente convexa), si y sólo si f 0 es una función creciente (estricta-
mente creciente).

Demostración: Supóngase que f 0 es una función creciente (estrictamente creciente),


entonces el teorema fundamental del cálculo asegura que
Z x
f (x) − f (c) = f 0 (t)dt (1.13)
c

para cualquier c ∈ (a, b), en virtud del Teorema 4 se tiene que f es convexa. Recı́proca-
mente, si la derivada f 0 es creciente (estrictamente creciente) y existe en todos los puntos
del dominio de la función f, entonces de acuerdo con la relación (1.13) y de la apli-
cación del Teorema 3 con g(t) = f 0 (t) para todo t ∈ (a, b), se concluye que f es convexa
(estrictamente convexa). ¤
Antes de demostrar el próximo teorema se dará la siguiente definición.

Definición 5. Sean I ⊂ R un intervalo y f : I → R una función. Se dice que f tiene


soporte lineal en x0 ∈ I si existe un número m ∈ R tal que la función afı́n A(x) =
f (x0 ) + m(x − x0 ) verifica que A(x) ≤ f (x) para todo x ∈ I. La función A se conoce
como la función (o recta) de soporte f en x0 .

Como lo ilustra la Figura 1.5, cada punto del interior de su dominio tiene soporte.
Cap. 1 Preliminares 32

Figura 1.5: Recta de soporte de f en x0

El próximo teorema provee una demostración de este hecho.

Teorema 5 (Ver [51]). Una función f : (a, b) → R es convexa, si y sólo si existe al


menos una recta de soporte para cada x0 ∈ (a, b).

Demostración: Supongamos que f es convexa, entonces para cada x0 ∈ (a, b) pode-


mos escoger m ∈ [f−0 (x0 ), f+0 (x0 )]. Si x ∈ (a, b) es tal que x0 < x, entonces

f (x) − f (x0 )
f−0 (x0 ) ≤ m ≤ f+0 (x0 ) ≤
x − x0

de donde
f (x) − f (x0 ) ≥ m(x − x0 ).

Por otra parte, si x < x0 se verifica

f (x) − f (x0 )
≤ f−0 (x0 ) ≤ m ≤ f+0 (x0 )
x − x0
Cap. 1 Preliminares 33

y como x − x0 < 0 resulta


f (x) − f (x0 ) ≥ m(x − x0 )

en cualquier caso se cumple que

f (x) ≥ f (x0 ) + m(x − x0 ) = A(x)

y ası́ A es una recta de soporte de f en x0 . Supongamos ahora que f tiene una recta de
soporte en cada punto de (a, b) y sean x, y ∈ (a, b). Si x0 = tx + (1 − t)y, t ∈ [0, 1], y
A(x) = f (x0 ) + m(x − x0 ) la recta de soporte f en x0 , entonces

f (tx + (1 − t)y) = f (x0 ) = A(x0 ) = A(tx + (1 − t)y)

= tA(x) + (1 − t)A(y)

≤ tf (x) + (1 − t)f (y)

es decir
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)

para todo x, y ∈ (a, b) y t ∈ [0, 1]. Por lo tanto f es convexa. ¤

Definición 6. Sea f una función definida en el intervalo I, f tiene el soporte en x0 ∈ I,


si existe una función afı́n A(x) = f (x0 ) + m(x − x0 ) que pasa por (x0 , f (x0 )), tal que
A(x) ≤ f (x) para todo x ∈ I. La función afı́n A es llamada recta soporte de f en x0 .

1.1.2 Teorema de separación para funciones Convexas (Teore-


ma del Sandwich)

Dadas dos funciones definidas en un intervalo I tal que f ≤ g. Un problema de interés


es determinar si existe una función convexa h : I → R que separe a f y a g, es decir tal
que f ≤ h ≤ g. Existen situaciones donde este problema tiene respuesta negativa como
son los casos que se muestran a continuación [49] y [19]
Cap. 1 Preliminares 34

Figura 1.6:

Figura 1.7:
Cap. 1 Preliminares 35

Una situación como la mostrada en la Figura 1.7 ocurre cuando se considera f, g :


[−1, 1] → R, definidas por f (x) = 1 − |x| y g(x) = 2 − |x|. Si existiese h : [−1, 1] → R
convexa tal que f ≤ h ≤ g, entonces
µ ¶
1 1
0 = f (0) = f (−1) + 1
2 2
µ ¶
1 1
≤ h (−1) + 1
2 2
1 1
≤ h(−1) + h(1)
2 2
1 1
≤ g(−1) + g(1)
2µ 2 ¶ µ ¶
1 1 1 1
≤ −| − 1| + + −|1| +
2 2 2 2
1 1 1
= − − =−
4 4 2

lo cual es una contradicción; por lo tanto, no existe una función convexa que separe a
las funciones f y g. Por supuesto, también existen casos donde la función h existe, por
ejemplo si f y g son convexas o en una situación como en la ilustrada en la Figura 1.8
Cap. 1 Preliminares 36

Figura 1.8:

La respuesta del problema que se plantearon fué dada por Karol Baron, Janusz
Matkowski y Kazimierz Nikodem en el año 1994 [5], quienes dieron una caracterización
de las funciones reales que pueden ser separadas por funciones convexas. Para detalles
de la demostración se refiere al lector a [5].

1.1.3 Desigualdad de Jensen

A continuación se presenta la desigualdad de Jensen, la cual es una generalización de


(1.1).

Teorema 6 (Desigualdad de Jensen, ver [31] y [32]). Sea I ⊂ R un intervalo y f : I → R


una función. Entonces f es convexa si y sólo si
à n ! n
X X
f t i xi ≤ ti f (xi ) (1.14)
i=0 i=0
Cap. 1 Preliminares 37

para todo xi ∈ I, ti ≥ 0, i = 1, ..., n tales que ti + ... + tn = 1.

Demostración:
Para n = 2 la relación (1.14) es la desigualdad que define la convexidad clásica de f
en (1.2).

Supongamos que la desigualdad (1.14) para i = n − 1 por hipótesis inductiva.

Demostraremos que se cumple para i = n, por lo que sin pérdida de generalidad


supondremos que tn < 1, luego 1 − tn > 0 y entonces
à n !
X
f t i xi = f (t1 x1 + ... + tn−1 xn−1 + tn xn )
i=1
µ µ ¶ ¶
t1 x1 + ... + tn−1 xn−1
= f (1 − tn ) + (tn xn )
1 − tn
µ µ ¶ ¶
t1 tn−1
= f (1 − tn ) xi + ... + xn−1 + tn xn
1 − tn 1 − tn
µ ¶
t1 tn−1
≤ (1 − tn )f x1 + ... + xn−1 + tn f (xn )
1 − tn 1 − tn
à n !
X ti xi
= (1 − tn )f .
i=1
1 − tn

Por convexidad
à n ! µ µ ¶ ¶
X t1 tn−1
f t i xi = f (1 − tn ) xi + ... + xn−1 + tn xn
i=1
1 − t n 1 − tn
µ ¶
t1 tn−1
≤ (1 − tn )f x1 + ... + xn−1 + tn f (xn )
1 − tn 1 − tn
à n !
X ti xi
= (1 − tn )f
i=1
1 − tn
Cap. 1 Preliminares 38

por hipótesis inductiva


à n ! à n !
X X ti xi
f t i xi = (1 − tn )f
i=0 i=1
1 − tn
n−1
X ti
≤ (1 − tn ) f (xi ) + tn f (xn )
i=1
1 − tn
n−1
X
= ti f (xi ) + tn f (xn )
i=1
n−1
X
= ti f (xi )
i=1

por lo tanto à n−1 !


X n
X
f t i xi ≤ ti f (xi )
i=1 i=1

llegando a lo que se querı́a demostrar. ¤


A continuación se enuncia y demuestra un teorema análogo al teorema de Jensen
relativo a la forma integral.

Teorema 7 (Ver [39]). Sean (X, Σ, µ) un espacio de medida de probabilidad, I un inter-


valo abierto y ϕ : X → I una función integrable Lebesgue. Si f : I → R es una función
convexa, entonces µZ ¶ Z
f ϕ(x)dµ ≤ f (ϕ(x))dµ.
X X

Demostración: Sea g : I → R una función de la forma g(x) = a(x − m) + f (m)


que soporta a f en m e integrando sobre X en ambos lados de la desigualdad f (ϕ(x)) ≥
g(ϕ(x)) para todo x ∈ X
Z Z
f (ϕ(x))dµ ≥ g(ϕ(x))dµ
X Z X Z
= a(ϕ(x) − m)dµ + f (m)dµ
X
Z X Z
= a (ϕ(x) − m)dµ + f (m) dµ
X X
Cap. 1 Preliminares 39

R
usando el hecho de que X es un espacio de probabilidad, entonces X dµ = 1
Z µZ Z ¶
f (ϕ(x))dµ ≥ a ϕ(x)dµ dµ + f (m)
X X X
= a(m − m) + f (m)

= f (m)
Z
reescribiendo la última desigualdad y sustituyendo m = ϕ(x)dµ
X
µZ ¶ Z
f ϕ(x)dµ ≤ f (ϕ(x))dµ.
X X

1.1.4 Desigualdad de Tipo Hermite-Hadamard

En esta sección se definirá uno de los resultados fundamentales que se deducen de la


noción de funciones convexas, la desigualdad de Hermite-Hadamard.
Sean I ⊂ R y f : I → R una función convexa, entonces la función f satisface la
siguiente desigualdad
µ ¶ Z y
x+y 1 f (x) + f (y)
f ≤ f (s)ds ≤ (1.15)
2 x−y x 2

para todo x, y ∈ I, x < y.


El lado izquierdo de (1.15) fué demostrado por Jacques Hadamard en 1983 antes de
que las funciones convexas fuesen formalmente introducidas. Para funciones con derivadas
crecientes en un intervalo cerrado, es algunas veces llamado Desigualdad de Hadamard y
el lado derecho, la desigualdad de Jensen. En 1985, D. S. Mitrinovic y I. B. Lackovic en
[40] señalan que la desigualdad (1.15) es debido a Charles Hermite quien la obtiene en los
años 1883, diez años antes que Hadamard. Esta desigualdad clásica de Hermite-Hadamard
juega un rol importante en el análisis de la convexidad y tienen una amplia literatura
que trata sus aplicaciones, generalizaciones y refinamientos ver [7][15][41]; También se
conoce que si f es continua, entonces la desigualdad de Hermite-Hadamard caracterizan
la convexidad de f.
Cap. 1 Preliminares 40

Teorema 8. (Ver [27]) Si una función f : I ⊂ R → R es convexa, entonces


µ ¶ Z y
x+y 1 f (x) + f (y)
f ≤ f (s)ds ≤ (1.16)
2 x−y x 2
para todo x, y ∈ I, x < y. Inversamente, si f es continua y satisface el lado derecho o
izquierdo de (1.16) para todo x, y ∈ I, x < y, entonces es convexa.

Demostración: El lado derecho de la desigualdad (1.16) se obtiene de integrar la


desigualdad (1.2) en el intervalo [0, 1] con respecto a t, tal como sigue
Z 1 Z 1 Z 1
f (tx + (1 − t)y)dt ≤ tf (x)dt + (1 − t)f (y)dt
0 0 0
f (x) f (y)
≤ +
2 2
f (x) + f (y)
=
2
haciendo un cambio de variable s = tx + (1 − t)y en la integral
Z 1 Z y
1
f (tx + (1 − t)y)dt = f (s)ds
0 x−y x
se obtiene el lado derecho de la desigualdad (1.16)
Z y ÃZ x+y Z y !
1 1 2
f (s)ds = f (s)ds + f (s)ds
x−y x x−y x x+y
2
ÃZ x+y Z y !
1 2
= f (s1 )ds1 + f (s2 )ds2
x−y x x+y
2

x + y − t(x − y)
haciendo los siguientes cambios de variables s1 = y
2
x + y + t(x − y)
s2 = en la igualdad anterir, se obtiene:
2
Z · µ ¶ µ ¶¸
1 1 x + y − t(x − y) x + y + t(x − y)
f +f dt,
2 0 2 2
ahora usando la convexidad de la función se llega a la desigualdad
Z · µ ¶ µ ¶¸ Z 1 µ ¶
1 1 x + y − t(x − y) x + y + t(x − y) x+y
f +f dt ≥ f dt
2 0 2 2 0 2
µ ¶
x+y
= f ,
2
Cap. 1 Preliminares 41

se obtiene el lado izquierdo de la desigualdad (1.16)


µ ¶ Z y
x+y 1
f ≤ f (s)ds
2 x−y x

llegando a lo que se querı́a demostrar. ¤

A continuación se darán varios ejemplos sobre la desigualdad de Hermite-Hadamard.

Ejemplo 4. Sea f (x) = ex , con x ∈ R. Sustituyendo f (x) en la desigualdad (1.16) se


obtiene

a+b eb − ea eb + ea
e 2 < < para a 6= b ∈ R
b−a 2

eb −ea
Figura 1.9: f (x) = b−a

y si se hace un cambio de variable a = ln(y) y b = ln(x) queda de la siguiente manera,

√ x−y x+y
xy < < para x 6= y ∈ (0, ∞).
ln(x) − ln(y) 2
Cap. 1 Preliminares 42

1.2 Funciones Cuasi-Convexas


Esta sección la dedicamos al estudio de las funciones cuasi-convexas, mediante
definiciones y algunos ejemplos.

Muchos teoremas que involucran funciones convexas han aparecido desde el trabajo
pionero de J. Jensen [31], recientemente se han obtenido algunos resultados para
una clase más amplia de funciones, y estas son las cuasi convexas. Las funciones
cuasiconvexas aparecen en la literatura en 1949, por B. D. Finetti (ver [22]). Para
sentar una formulación más precisa del estudio de B. D. Finetti, seguimos los estudios
de W. Fenchel [20] y algunas de sus observaciones, acerca de los conjuntos de nivel,
para una función (no necesariamente convexa), estas funciones no toman su nombre
actual sino hasta 1953. La cuasiconvexidad es una propiedad más débil que la con-
vexidad, de ahı́ que algunas propiedades de estas últimas no se cumplen para las primeras.

Otros conceptos como el de función cuasi-convexa introducido en 1928 en un trabajo


sobre teorı́a de juegos, por el matemático Jhon Von Neumann, es de mucha utilidad en
los problemas de economı́a y optimización.

Definición 7. Sean D y X conjuntos contenidos en los reales, una función f : D ⊆ X →


R en un subconjunto convexo X es cuasi-convexa si

f (tx + (1 − t)y) ≤ máx{f (x), f (y)} (1.17)

y f es cuasi-cóncava si f (tx + (1 − t)y) ≥ máx{f (x), f (y)} t ∈ (0, 1).

De la Definición 7, se desprende la siguiente proposición.

Proposición 2. Una función f es cuasi-convexa si y sólo si −f es cuasi-cóncava.

Demostración: Sea f una función convexa, si la multiplicamos por −1 ambos lados


se obtiene
−f (tx + (1 − t)y) ≥ −tf (x) − (1 − t)f (y)
Cap. 1 Preliminares 43

es decir
(−f )(tx + (1 − t)y) ≥ t(−f )(x)(−f )(y)

para todo x, y ∈ I y t ∈ [0, 1] esto permite deducir que f es convexa si y sólo si −f es


cóncava. ¤

Ejemplo 5. La siguiente gráfica es una función cuasi-convexa

f(x)

f(tx+ (1-t)y)

f(y)

x tx+ (1-t)y y

Figura 1.10: Función cuasi-convexa

Ejemplo 6. La siguiente gráfica es igualmente una función cuasi-convexa


Cap. 1 Preliminares 44

p
Figura 1.11: f (x) = |x|

A continuación se presenta una proposición que se deriva de la definición de


cuasi-convexidad.

Proposición 3. Toda función f convexa o monótona es cuasiconvexa.

Demostración: Sin pérdida de generalidad, consideremos x, y ∈ I tal que x ≤ y con


I ⊆ R, supongamos que f es monótona creciente para t ∈ [0, 1] entonces

x ≤ tx + (1 − t)y ≤ y

ası́ mismo

mı́n{f (x), f (y)} = f (x) ≤ f (tx + (1 − t)y) ≤ f (y) = máx{f (x), f (y)} (1.18)

luego por (1.18) se cumple que

f (tx + (1 − t)y) ≤ máx{f (x), f (y)}


Cap. 1 Preliminares 45

por lo que en consecuencia f es cuasiconvexa.

Para el caso en que f es cóncava, la demostración es análoga. ¤

1.2.1 Teorema de Separación para Funciones Cuasi-Convexas


(Teorema del Sandwich).

En el año 1996, Wolfang Förg Rob, Kazimierz Nikodem y Zsolt Páles en [50]
generalizan el Teorema del Sandwich para funciones cuasi-convexas, caracterizando las
funciones reales definidas en un intervalo I ⊂ R. A continuación demostraremos un
teorema de separación para funciones cuasi convexas.

Teorema 9. (Ver [50]) Sean I ⊆ R un intervalo arbitrario y f, g : I → R funciones


dadas. Las siguientes propiedades son equivalentes:
(a) Existe una función monótona h : I → R tal que f ≤ h ≤ g.
(b) Existen funciones h1 , h2 : I → R, h1 -cuasi cóncava, h2 -cuasi convexa, tal que
f ≤ h1 ≤ g y f ≤ h2 ≤ g.
(c) Existen funciones h1 , h2 : I → R, h1 -cuasi cóncava, h2 -cuasi convexa, tal que
f ≤ h1 ≤ h2 ≤ g.
(d) Para todo x, y ∈ I y t ∈ [0, 1], las siguientes desigualdades se cumple

f (tx + (1 − t)y) ≤ máx{g(x), g(y)}

g(tx + (1 − t)y) ≥ mı́n{f (x), f (y)} (1.19)

Demostración:

(a) ⇒ (d)
Cap. 1 Preliminares 46

Resulta del hecho de que toda función monótona es cuasi-cóncava y cuasi-


convexa como se demostró en proposición(3).

(d) ⇒ (c)

Consideremos las funciones h1 , h2 : I → R definidas por

h1 (u) := sup{mı́n{f (x), f (y)} : x ≤ u ≤ y, x, y ∈ I} (1.20)

h2 (u) := ı́nf{máx{g(x), g(y)} : x ≤ u ≤ y, x, y ∈ I}. (1.21)

Por la desigualdad (1.19) h1 (u), h2 (u) están bien definidas y

f (u) ≤ h2 (u)

h1 (u) ≤ g(u) (1.22)

para todo u ∈ I.

Por otra parte, f ≤ h1 y h2 ≤ g. Demostraremos que h1 ≤ h2 , h1 es cuasi-


cóncava y h2 es cuasi-convexa. Supongamos lo contrario, que existe w ∈ I tal que
h1 (w) > h2 (w). Entonces existirá x ≤ w ≤ y y u ≤ w ≤ v tal que

mı́n{f (x), f (y)} > máx{g(u), g(v)} (1.23)

Si x ≤ u, entonces de (1.20) y (1.23) se deduce que

h1 (u) ≥ mı́n{f (x), f (y)} > g(u)

lo que contradice a (1.22). Esas contradicciones muestran que h1 ≤ h2 . Ahora


demostraremos que h2 es cuasi-convexa (la demostración de cuasi-concavidad de
h1 es análoga) supongamos que es falso.
Cap. 1 Preliminares 47

Entonces existe x ≤ u ≤ y tal que h2 (u) > máx{h2 (x), h2 (y)}. Por las defini-
ciones de h2 conseguiremos α ≤ x ≤ β y γ ≤ y ≤ δ tal que

h2 (u) > máx{g(α), g(β), g(γ), g(δ)} (1.24)

sin embargo α ≤ u ≤ δ, lo que implica que

h2 (u) ≤ máx{g(α), g(δ)}

esto contradice (1.24) y demuestra que h2 es cuasi-convexa.

(c) ⇒ (b)

Por hipótesis se tiene que f ≤ h1 ≤ h2 ≤ g entonces f ≤ h1 ≤ g y también


satisface para f ≤ h2 ≤ g, es decir, que existen funciones h1 , h2 : I → R,
h1 -cuasi-cóncava y h2 -cuasi-convexa, tal que f ≤ h1 ≤ g y f ≤ h2 ≤ g.

(b) ⇒ (a)

Asumamos primero que sup{f (z) : z ≤ x} < ∞ y ı́nf{g(z) : z ≤ x} > −∞ para


cada x ∈ I. Definamos m1 , m2 : I → R por

m1 := sup{f (z) : z ≤ x}

m2 := ı́nf{g(z) : z ≤ x}.

Es evidente que f ≤ m1 , m2 ≤ g, m1 es no decreciente y m2 es no creciente.


Vamos a demostrar que al menos una de estas funciones separa a las funciones f y
g.
Asumamos lo contrario, entonces existen a, b ∈ I tal que m1 (a) > g(a) y m2 (b) <
f (b). Sin pérdida de generalidad, podemos suponer que a ≤ b. Sea

1
0<²< mı́n{m1 (a) − g(a), f (b) − m2 (b)}. (1.25)
2
Cap. 1 Preliminares 48

Por la definición de m1 , m2 , existen x1 , x2 ∈ I, x1 ≤ a, x2 ≤ b tal que

f (x1 ) > m1 (a) − ²

g(x2 ) < m2 (b) + ². (1.26)

Si x1 ≤ x2 , entonces x2 , a ∈ [x1 , b] por hipótesis (1.25) y (1.26) se tiene

h1 (x2 ) ≤ g(x2 ) < m2 (b) + ²

h2 (a) ≤ g(a) < g(a) + ²

y
h2 (x1 ) ≥ f (x1 ) > m1 (a) − ² > g(a) + ²,

lo que contradice la cuasi-convexidad de h2 sobre [x2 , a].

Ası́ en cualquier caso se llega a la contradicción que demuestra que al menos una
de las funciones m1 , m2 separa a las funciones f y g.
Ahora vamos a tratar con la existencia de las funciones m1 , m2 . Como f está acotada
superiormente por h2 y por lo tanto también está acotado superiormente por el
máx{h2 (α), h2 (β)} en cada intervalo compacto [α.β] ⊂ I (y de manera similar g
por h1 inferiormente), la única posibilidad para la inexistencia de m1 (o m2 ) se
da sı́ f (respectivamente g) es no acotado por el lado izquierdo de I. Debemos
considerar los siguientes tres casos
(i) Supongamos que
sup{f (z) : z ≤ x} = ∞

y
ı́nf{g(z) : z ≤ x} = −∞

para algún x ∈ I. Entonces, por los argumentos antes mencionados, para cualquier
y ≤ x se tiene que
sup{f (z) : z ≤ y} = ∞
Cap. 1 Preliminares 49

y
ı́nf{g(z) : z ≤ y} = −∞.

Por lo tanto hay un punto z1 ≤ x tal que f (z1 ) > 0. Además podemos conseguir
un punto z2 < z1 tal que g(z2 ) < 0 y un punto z3 < z2 tal que f (z3 ) > 0. Como
f < h1 < g, esto es una contradicción para la cuasi convexidad de h1 .
(ii) Supongamos que el sup{f (z) : z ≤ x} = ∞ para algún x ∈ I y m2 existe.
Fijamos x0 ∈ I y elegimos y0 < x0 tal que f (y0 ) > g(x0 ). Para cualquier y ∈ I,
y ≤ y0 es posible restringir m2 al intervalo [y, ∞] ∩ I y definir m1 como lo hicimos
anteriormente en este intervalo, ya que y0 < x0 y f (y0 ) > g(x0 ), la función m1 no
puede separar a las funciones f y g, ası́ solamente la restricción de m2 funciona
como una separación sobre [y, ∞] ∩ I. Luego esto es válido para cualquier y ∈ I,
y ≤ y0 , concluyendo que m2 separa a las funciones f y g sobre I.
(iii) El caso donde m1 existe pero el ı́nf{g(z) : z ≤ x} = −∞ para algún x ∈ I
puede ser tratado como en (ii).

A continuación mostraremos algunos contrajemplos de que una función cuasi-convexa


no necesariamente será convexa.

Ejemplo 7. La función f definida de la siguiente manera

f : [−2, 2] → R
 p
 |x| si −2 ≤ x ≤ 0
f (x) =
 x2 si 0 ≤ x ≤ 2.
es cuasi-convexa y no es convexa ni monótona.
Cap. 1 Preliminares 50

Figura 1.12: f es cuasi-convexa y no es convexa ni monótona

Ejemplo 8. La función f : [0, 2] → R definida como

f : [0, 2] → R

 x2 si 0 ≤ x ≤ 1
f (x) =
 2x si 1 ≤ x ≤ 2.

es monótona, cuasi-convexa y no es convexa porque tiene una discontinuidad en el interior


de su dominio.
Cap. 1 Preliminares 51

Figura 1.13: f es cuasi-convexa, monótona y no es convexa.

En la siguiente proposición se expone una caracterización de las funciones cuasi-


convexas en términos de los conjuntos de nivel.

Proposición 4. Una función f : D ⊆ X → R es cuasi-convexa, si y sólo si para todo


α ∈ R el conjunto

f −1 (−∞, α] = {x : f (x) ≤ α} con α ∈ R

es un conjunto convexo.

Demostración: Supongamos que f es cuasi-convexa, y sean α ∈ R y x, y ∈ Lα(f ) =


{x : f (x) ≤ α}, entonces

f (tx + (1 − t)y) ≤ máx{f (x), f (y)} ≤ α, t ∈ (0, 1),


Cap. 1 Preliminares 52

ası́ resulta que Lα(f ) es convexo.

Recı́procamente, asumamos que Lα(f ) es convexo para todo α ∈ R y consideremos


x, y ∈ X entonces x, y ∈ L = Lmax{f (x),f (y)} (f ), luego tx + (1 − t)y ∈ L, con t ∈ (0, 1).
De donde resulta que f es cuasi-convexa. ¤

Para una función f : D ⊆ X → R, los conjuntos Lα (f ), α ∈ R se denominan conjuntos


de nivel.

Ejemplo 9. Conjunto de nivel de la función f : [−3, 3] → R dada por

f (x) = (x2 − 4)(x2 − 1)

Figura 1.14: La función L2 (f ) no es convexa


Cap. 1 Preliminares 53

1.3 Operaciones con Funciones Convexas


En esta sección se verán las formas de reconocer estas funciones convexas a partir
de operaciones que preservan la convexidad. Por ejemplo, será posible reconocer que la
función f : (0, ∞) → R definida por f (t) = t−1 + t3 es convexa, porque es una suma
de funciones convexas y como se verificará la suma de funciones es una operación que
preserva convexidad.
El siguiente teorema establece que la suma de funciones convexas, y el producto de
una constante no negativa por una función convexa son funciones convexas.

Teorema 10. (Ver[26]) Sea I ⊂ R un intervalo. Si f : I → R y g : I → R son funciones


convexas y α ≥ 0, entonces f + g y αf son funcions convexas sobre I.

Demostración: Sean x, y ∈ I y t ∈ [0, 1]. Entonces

(f + g)(tx + (1 − t)y) = f (tx + (1 − t)y) + g(tx + (1 − t)y)

≤ tf (x) + (1 − t)f (y) + tg(x) + (1 − t)g(y)

= t(f (x) + g(x)) + (1 − t)(f (y) + g(y))

= t(f + g)(x) + (1 − t)f + g(y)

es decir
(f + g)(tx + (1 − t)y) ≤ (f + g)(x) + (1 − t)(f + g)(y)

y por lo tanto f + g es convexa.

También se tiene

(αf )(tx + (1 − t)y) = αf (tx + (1 − t)y)

≤ α(tf (x) + (1 − t)f (y))

= tαf (x) + (1 − t)αf (y)

= t(αf )(x) + (1 − t)(αf )(y)

y por consiguiente αf es convexa.


Cap. 1 Preliminares 54

Ejemplo 10. Si f : R → R y g : R → R son las funciones definidas por f (x) = |x| y


g(x) = x2 entonces (f + g)(x) = |x| + x2 , para todo x ∈ R, es convexa, porque f y g son
convexas.

Ejemplo 11. Como la función h : (0, ∞) → R definida por h(x) = x−1 es convexa
tenemos que la función (3h)(x) = 3x−1 definida sobre (0, ∞) también es convexa.

Corolario 1. Sean I ⊂ R un intervalo y {fn }n∈N una sucesión de funciones fn : I → R



X
convexas. Si la serie fn (x) converge a f (x) para cada x ∈ I, entonces f es una función
n=1
convexa sobre I.

Demostración: Sea {gn }n∈N la sucesión de funciones gn : I → R definidas como


sigue:


 f (x) n=1, para todo x ∈ I

 1
gn (x) = f1 (x) + f2 (x) n=2, para todo x ∈ I



 f (x) + f (x) + ... + f (x)
1 2 m n=m
Entonces

X
f (x) = fn (x) = lı́m gn (x), para todo x ∈ I.
n→∞
n=1

Luego, para todo t ∈ [0, 1] y x, y ∈ I se verifica

f (tx + (1 − t)y) = lı́m gn (tx + (1 − t)y)


n→∞

≤ lı́m (tgn (x) + (1 − t)gn (y))


n→∞

= t lı́m gn (x) + (1 − t) lı́m gn (y)


n→∞ n→∞

= tf (x) + (1 − t)f (y)



X
lo cual implica que f = fn es convexa. ¤
n=1
En el siguiente teorema se presentan las condiciones para que su composición sea una
función convexa o cóncava.
Cap. 1 Preliminares 55

Teorema 11. Sean I ⊂ R un intervalo y f : I → R y g : f (I) → R funciones. Entonces:


1) Si f es convexa y g es convexa y creciente, entonces g ◦ f es convexa.
2) Si f es cóncava y g es convexa y decreciente, entonces g ◦ f es convexa.
3) Si f es cóncava y g es cóncava y creciente, entonces g ◦ f es cóncava.
4) Si f es convexa y g es cóncava y decreciente, entonces g ◦ f es cóncava.

Demostración: Sean x, y ∈ I y t ∈ [0, 1]. Entonces

1)(g ◦ f )(tx + (1 − t)y) = g(f (tx + (1 − t)y))

≤ g(tf (x) + (1 − t)f (y)) f es convexa y g creciente

≤ tg(f (x)) + (1 − t)g(f (y)) ya que g es convexa

= t(g ◦ f )(x) + (1 − t)(g ◦ f )(y).

2)(g ◦ f )(tx + (1 − t)y) = g(f (tx + (1 − t)y))

≤ g(tf (x) + (1 − t)f (y)) f es cóncava y g decreciente

≤ tg(f (x) + (1 − t)f (y)) ya que g es convexa

= t(g ◦ f )(x) + (1 − t)(g ◦ f )(y).

3)(g ◦ f )(tx + (1 − t)y) = g(f (tx + (1 − t)y))

≥ g(tf (x) + (1 − t)f (y)) f es cóncava y g es creciente

≥ tg(f (x)) + (1 − t)g(f (y)) ya que g es cóncava

= t(g ◦ f )(x) + (1 − t)(g ◦ f )(y).

4)(g ◦ f )(tx + (1 − t)y) = g(f (tx + (1 − t)y))

≥ g(tf (x) + (1 − t)f (y)) f convexa y g decreciente

≥ tg(f (x)) + (1 − t)g(f (y)) porque g es cóncava

= t(g ◦ f )(x) + (1 − t)(g ◦ f )(y). ¤


Cap. 1 Preliminares 56

Ejemplo 12. Si f : (0, ∞) → R y g : (0, ∞) → R son las funciones definidas por


f (x) = x−1 y g(x) = x3 entonces (g ◦ f )(x) = x−3 es convexa sobre (0, ∞) porque f es
convexa y g es convexa y creciente.

Ejemplo 13. Como las funciones f : (0, ∞) → R y g : (0, ∞) → R definidas por



f (x) = x y g(x) = x−1 son tales que f es cóncava y g es convexa y decreciente se
1
concluye que la función (g ◦ f )(x) = x− 2 es convexa sobre (0, ∞).

Ejemplo 14. Si f : (0, ∞) → R y g : (o, ∞) → R son las funciones definidas por


√ √
f (x) = x y g(x) = ln(x) entonces (g ◦ f )(x) = ln( x) es cóncava sobre (0, ∞) pues f
es cóncava y g es cóncava y creciente.

En el próximo teorema se exhiben las condiciones bajo las cuales el producto de


funciones convexas, es una función convexa.

Teorema 12. Sean I ⊂ R un intervalo y sean f : I → R y g : I → R funciones no


negativas, crecientes y convexas, entonces la función h = f · g es no negativa, creciente
y convexa.

Demostración Si f y g son crecientes y no negativas, se tiene que para cualesquiera


x, y ∈ I tales que x < y se verifica

0 ≤ f (x) ≤ g(x)

y
0 ≤ g(x) ≤ g(y)

entonces
0 ≤ h(x) = f (x)g(x) ≤ f (y)g(y) = h(y)

y por lo tanto h es creciente y no negativa.

Para demostrar la convexidad se usa el echo de que si x < y se verifica

(f (x) − f (y))(g(y) − g(x)) ≤ 0


Cap. 1 Preliminares 57

es decir
f (x)g(y) + f (y)g(x) ≤ f (x)g(x) + f (y)g(y).

Usando esta desigualdad se tiene que para todo t ∈ [0, 1] y x, y ∈ I se cumple

h(tx + (1 − t)y) = f (tx + (1 − t)y)g(tx + (1 − t)y)

≤ (tf (x) + (1 − t)f (y))(tg(x) + (1 − t)g(y))

= t2 f (x)g(x) + t(1 − t)(f (x)g(y) + f (y)g(x)) + (1 − t)2 f (y)g(y)

≤ t2 f (x)g(x) + t(1 − t)(f (x)g(x) + f (y)g(y)) + f (y)g(y)

−2tf (y)g(y) + t2 f (y)g(y)

= t2 f (x)g(x)tf (x)g(x) + tf (y)g(y) − t2 f (x)g(x) − t2 f (y)g(y)

+f (y)g(y) − 2f (y)g(y) + t2 f (y)g(y)

= tf (x)g(x) + f (y)g(y) − tf (y)g(y)

= tf (x)g(x) + (1 − t)f (y)g(y)

= th(x) + (1 − t)h(y)

Esto implica que

h(tx + (1 − t)y) ≤ th(x) + (1 − t)h(y)

por lo que h = f ◦g es convexa. ¤


El teorema que anunciaremos a continuación establece bajo que condiciones el supre-
mo de una familia arbitraria de funciones convexas, es una función convexa.

Teorema 13. Sea {fα } una familia arbitraria de funciones convexas definidas sobre el
intervalo I, y sea f (x) = sup fα (x). Si J = {x ∈ I : f (x) < ∞} es un conjunto no vacı́o,
entonces J es un intervalo y f es una función convexa sobre J.
Cap. 1 Preliminares 58

Demostración: Si t ∈ [0, 1] y x, y ∈ J es decir f (x) < ∞ y f (y) < ∞, entonces

f (tx + (1 − y)y) = sup fα (tx + (1 − t)y)

≤ sup(tfα (x) + (1 − t)fα (y))

≤ t sup fα (x) + (1 − t) sup fα (y)

= tf (x) + (1 − t)f (y) < ∞.

Esto demuestra que f es convexa sobre J y además que si x, y ∈ J, entonces f (tx +


(1 − t)y) < ∞, lo cual significa que tx + (1 − t)y ∈ J y por lo tanto J es un intervalo.¤
En el teorema que sigue, se dan condiciones para que la inversa de una función sea
cóncava o convexa.

Teorema 14. Sean I ⊂ R un intervalo abierto y f : I → R una función estrictamente


monótona. Sea f −1 : f (I) → I la función inversa de f. Entonces
1) Si f es convexa y creciente, entonces f −1 es cóncava.
2) Si f es convexa y decreciente, entonces f −1 es convexa.
3) Si f es cóncava y creciente, entonces f −1 es convexa.
4) Si f es cóncava y decreciente, entonces f −1 es cóncava.

Demostración: Sean x, y ∈ f (I) y t ∈ [0, 1]. Si u = f −1 (x) y f −1 (y), entonces:

1) Como f es convexa se verifica

f (tu + (1 − t)v) ≤ tf (u) + (1 − t)f (v)

= tx + (1 − t)y,

y por ser f −1 creciente, asi se tiene que

f −1 (f (tu + (1 − t)v)) ≤ f −1 (tu + (1 − t)v)

luego
tu + (1 − t)v ≤ f −1 (tx + (1 − t)y)
Cap. 1 Preliminares 59

es decir
tf −1 (x) + (1 − t)f −1 (y) ≤ f −1 (tx + (1 − t)y)

y en consecuencia f −1 es cóncava.
2) De la convexidad de f

f (tu + (1 − t)v) ≤ tx + (1 − t)y,

y como f −1 es decreciente, se verifica

f −1 (f (tu + (1 − t)v)) ≥ f −1 (tx + (1 − t)y)

luego
tu + (1 − t)v ≥ f −1 (tx + (1 − t)y)

es decir
tf −1 (x) + (1 − t)f −1 (y) ≥ f −1 (tx + (1 − t)y)

por lo tanto f −1 es convexa.


3) De la concavidad de f

tf (u) + (1 − t)f (v) ≤ f (tu + (1 − t)v)

y por ser f −1 creciente, se tiene que

f −1 (tf (u) + (1 − t)f (v)) ≤ f −1 (f (tu + (1 − t)v))

luego
f −1 (tf (u) + (1 − t)f (v)) ≤ tu + (1 − t)v

es decir
f −1 (tx + (1 − t)y) ≤ tf −1 (x) + (1 − t)f −1 (y)

por lo tanto f −1 es convexa.


4) Como f es cóncava se cumple lo siguiente

tf (u) + (1 − t)f (v) ≤ f (tu + (1 − t)v)


Cap. 1 Preliminares 60

y como f −1 es decreciente

f −1 (tf (u) + (1 − t)f (v)) ≥ f −1 (f (tu + (1 − t)v))

ası́
f −1 (tx + (1 − t)y) ≥ tu + (1 − t)v

es decir
f −1 (tx + (1 − t)y) ≥ tf −1 (x) + (1 − t)f −1 (y)

por lo tanto f −1 es cóncava. ¤

Ejemplo 15. Sea f : R → R la función definida por f (x) = ex es convexa y creciente,


su inversa f −1 : (0, ∞) → R definida por f −1 (x) = ln(x) es cóncava.

Además, por ser la función g : R → R definida por g(x) = e−x convexa y decreciente,
su inversa g −1 : (0, ∞) → R definida por g −1 (x) = − ln(x) es convexa
Cap. 1 Preliminares 61

Figura 1.15: La función L2 (f ) no es convexa

Otros resultados de interés de caracterizaciones de funciones cuasi-convexas diferen-


ciables, demostrado por el premio Nobel de economı́a del año 1972, K. J. Arrow y A. C.
Enthoven se pueden verificar en [4].
CAPÍTULO 2

DESIGUALDAD DE SIMPSON

Un problema que se presenta con frecuencia en las ciencias experimentales y de


ingenierı́a es tratar de construir una función (denominada “función interpolante”) de la
que se conoce una serie de datos (denominados “datos de interpolación”). Estos datos
pueden ser fruto de las observaciones realizadas en un determinado experimento en el que
se relacionan dos o más variables e involucran valores de una función o de sus derivadas.
Por su sencillez y operatividad los polinomios se usan frecuentemente como funciones
interpolantes.

2.1 Interpolación
Supongamos que hay dos magnitudes x, y de los que se conocen n + 1 valores
relacionados {(x0 , y0 ), (x1 , y1 ), · · · , (xn , yn )}, por ejemplo, datos obtenidos en una expe-
rimentación. Con la condición xi 6= xj , si i 6= j.
Nos planteamos si existe una función p tal que

p(xk ) = yk k = 0, · · · , n (2.1)

es decir, queremos una función cuya gráfica “pase”por los puntos del plano dados. Si p

62
Cap. 2 Desigualdades 63

verifica (2.1) diremos que p interpola los datos dados, p es una función de interpolación
para los datos (xk , yk ), k = 0, · · · , n.
Este tipo de problemas suele darse cuando tenemos datos obtenidos por experi-
mentación y sabemos que hay una función f que rige el proceso pero que desconocemos
y queremos trabajar con una función alternativa p que represente bien a esos datos de la
muestra. Si f rige el proceso entonces f (xk ) = yk luego exigiremos a la función p ese mis-
mo requisito, esto nos proporciona condiciones que imponer a p con las que trataremos
de obtenerla y una vez conseguido nos permitirı́a conocer o predecir que habrá pasado
en otros x en los que no se ha experimentado.
Supongamos que existe la función f tal que f (xk ) = yk , k = 0, · · · , m. Caben
varias preguntas:

1 La función p que interpola los datos dados ¿de qué tipo ha de ser? ¿polinómica,
trigonométrica, racional? La respuesta vendrá dada por los datos yk .

1.1 Si se observa que los datos presentan periodicidad entonces buscaremos a p


dentro de las funciones trigonométricas.

1.2 Si los datos presentan ası́ntotas entonces p deberı́a ser una función racional.

1.3 Si los yk presentan un comportamiento polinomial, entonces p se escogerı́a de


tipo polinómico.

2 Una vez escogido el tipo de función habrá que responder dos cuestiones, ¿Existe p
del tipo escogido que interpole los datos dados? Y si existe, ¿es única?

3 ¿Es la función polinómica escogida una buena aproximación de la función original


f en los puntos x que no son de la muestra?

2.2 Integración numérica y cuadratura


Uno de los problemas más antiguos es el del cálculo del área que encierra una curva.
Cap. 2 Desigualdades 64

La integral resuelve el problema de calcular el área bajo la gráfica de una función posi-
tiva definida sobre un intervalo cerrado. Como sabemos, la regla de Barrow resuelve el
problema de calcular la integral de una función en un intervalo [a, b], mediante la fórmula

Z b
f (x)dx = F (b) − F (a),
a

siendo F una primitiva de la función f en el intervalo [a, b], es decir, F 0 (x) = f (x),
para todo x ∈ [a, b]. Sin embargo, en muchos casos, esto no es posible, dado que

• Para ciertas funciones no es posible calcular dichas primitiva, a pesar de saber que
existe. Por ejemplo, para las funciones

2 sin x √
f (x) = ex , f (x) = , f (x) = x5 + 1
x

no es posible encontrar una primitiva expresable en término de funciones elemen-


tales.

• En muchos problemas que se plantean, a la hora de integrar funciones, están rela-


cionados con funciones definidas en forma de tabla de valores o gráficas y no se
conoce una expresión analı́tica de f (x).

En ambos casos se precisa de fórmulas de integración numérica (también llamadas


fórmulas de cuadratura), que nos van a permitir calcular un valor aproximado de
la integral de la forma

Z b n
X
f (x)dx ≈ ai f (xi ),
a i=0

donde los xi , con i = 0, 1, · · · , n son puntos del intervalo [a, b] y los coeficientes ai ,
con i = 0, · · · , n, son números reales elegidos convenientemente.
Cap. 2 Desigualdades 65

2.3 Fórmulas de integración de tipo interpolatorio


Para obtener fórmulas de integración numérica seguiremos, ´basicamente, el procedimien-
to basado en calcular el polinomio de interpolación de la función f en algunos puntos del
intervalo [a, b] y aproximar el valor de la integral de la función por el valor de la integral
del polinomio de interpolación. En concreto,

Z b Z b
f (x)dx ≈ Pn (x)dx,
a a

donde

n
X
Pn (x) = f (xi )Li (x), x ∈ [a, b]
i=0

es el polinomio de interpolación de f en los n+1 puntos distintos, xi con i = 0, · · · , n,


del intervalo [a, b]. Integrando esta expresión en [a,b] obtenemos

Z b n
X
Pn (x)dx = ci f (xi ),
a i=0

siendo

Z b
ci = Li (x)dx,
a

para i = 0, 1, · · · , n. Nótese que los coeficientes ci , con i = 0, 1, · · · , n, son independi-


entes de f y, por tanto, una vez calculados, proporcionan una fórmula que se puede que
se puede aplicar a cualquier función f : [a, b] → R.
Además será necesario estudiar el error que se comete en este tipo de fórmulas,
es decir, el valor de

Z b Z b Z b
Rn (f ) = f (x)dx − Pn (x)dx = En (x)dx,
a a a

con En (x) = f (x) − Pn (x), en [10], el estudio del error de interpolación se prueba que
si f ∈ Cn+1 ([a, b]), se tiene que
Cap. 2 Desigualdades 66

f (n+1) (ξx )
En (x) = P in (x),
(n + 1!)
con Πn (x) = (x − x0 )(x − x1 ) · · · (x − xn ) y donde ξx es un punto intermedio entre
x0 , x1 · · · , xn , x. Entonces, en este caso el error de integración que se comete es

Z b Z b
f (n+1)(ξx )
Rn (f ) = En (x)dx = Πn (x)dx.
a a (n + 1)!
Para determinar una expresión explı́cita del error de integración Rn (f ), resulta de
utilidad el siguiente resultado conocido como teorema del valor medio generalizado:

Teorema 15. (Ver[10]) Sean h, g : [a, b] → R funciones continuas en [a, b] y supongamos


que g no cambia de signo en [a, b], entonces

Z b Z b
h(x)g(x)dx = h(ξ) g(x)dx,
a a

donde ξ es un punto del intervalo (a, b).

Por otro lado, es obvio que si f es un polinomio de grado menor o igual que n,
entonces f coincidirá con su polinomio de interpolación. En consecuencia, las fórmulas
de tipo interpolatorio sobre n + 1 puntos distintos son exactas para todos los polinomios
de grado menor o igual que n, en el sentido de que

Rn (f ) = 0.

La próxima sección (2.4) está basada básicamente en las siguientes referencias [23],
[34], [52].

2.4 Fórmulas básicas de integración numérica


Fórmula del rectángulo
La fórmula de integración más sencilla es aquella que utiliza el valor de la función f en
Cap. 2 Desigualdades 67

un solo punto x0 ∈ [a, b]. En este caso el polinomio de interpolación de la función f es de


grado, es decir, P0 (x) = f (x0 ), por lo que

Z b Z b Z b
f (x)dx ≈ P0 (x)dx = f( x0 )dx = f (x0 )(b − a).
a a a

Si x0 = a se obtiene la fórmula del rectángulo izquierdo dado por


Z b
f (x)dx ≈ f (a)(b − a). (2.2)
a

Si la función f ∈ C1 ([a, b]), el error cometido al usar la fórmula (2.2) es

Z b Z b
0 0 f 0 (ξ)
R0 (f ) = f (ξx )(x − a)dx = f (ξ) (x − a)dx = (b − a)2 ,
a a 2
con ξ ∈ (a, b). Para deducir esta fórmula del error hemos utilizado el Teorema 15
puesto que la función Π0 (x) = (x − a) no cambia de signo en [a, b].

Observación 4. • Un resultado similar se obtiene si x0 = b, en este caso la fórmula


de integración se denomina fórmula del rectángulo derecho,

Z b
f (x)dx ' f (b)(b − a),
a

f 0 (ξ)
(b − a)2 . R0 (f ) = −
2
Rb
• Geométricamente, si f (x) ≥ 0 en [a, b], el valor de a f (x)dx se aproxima por el
área del rectángulo de base (b − a) y altura f (a) o f (b).

a+b
En el caso de que x0 = 2
, se obtiene la fórmula del punto medio dada por

Z b µ ¶
a+b
f (x)dx ' f (b − a). (2.3)
a 2
Para obtener una expresión explı́cita del error de integración que se comete usan-
do esta fórmula, suponemos que la función f ∈ C2 ([a, b]) y hacemos uso del siguiente
a+b
desarrollo de Taylor de la función f en el punto 2
,
Cap. 2 Desigualdades 68

µ ¶ µ ¶µ ¶ µ ¶2
a+b 0 a+b a+b f 00 (ξ) a+b
f (x) = f +f x− + x− .
2 2 2 2 2
Integrando ambos miembros y usando la fórmula (2.3), se obtiene que

Z b µ ¶
a+b f 00 (ξ)
R0 (f ) = f (x)dx − f (b − a) = (b − a)3 ,
a 2 24
con ξ ∈ (a, b). De nuevo para deducir esta fórmula del error hemos utilizado el Teo-
¡ ¢2
rema 15 usando en esta ocasión que la función x − a+b2
no cambia de signo en [a, b].
la fórmula (2.3) es especialmente interesante, puesto que si observamos el término que
nos da el error, podemos comprobar que se trata de una fórmula de integración de orden
uno, debido a que f 00 (x) = 0, para todo x ∈ (a, b), si f es un polinomio de grado menor
o igual que uno.
Fórmula del trapecio
Se trata de una fórmula de integración con dos puntos. en este caso el polinomio de
interpolación de la función f es de grado uno. En concreto, si consideramos los puntos
x0 , x1 ∈ [a, b], el polinomio de interpolación de la función f será

f (x1 ) − fx0
P1 (x) = f (x0 )f [x0 , x1 ](x − x0 ) = f (x0 ) + (x − x0 ).
x1 x0
Podemos entonces obtener la siguiente fórmula de integración numérica

Z b Z bµ ¶
f (x1 ) − f (x0 )
f (x)dx ' f (x0 ) + (x − x0 ) dx.
a a x1 − x0
Para el caso particular x0 = a, x1 = b se obtiene la fórmula del trapecio que viene
dada por

Z b
b−a
f (x)dx ' (f (a) + f (b)). (2.4)
a 2
Además, si suponemos que f ∈ C2 ([a, b]) y dado que la función Π1 (x)(x − a)(x −
b) no cambia de signo en el intervalo [a, b], entonces la aplicación del Teorema 15 nos
proporciona
Cap. 2 Desigualdades 69

Z b Z b
f 00 (ξx ) f 00 (ξ) f 00 (ξ)
R1 (f ) = (x − a)(x − b)dx = (x − a)(x − b)dx = − (b − a)3 .
a 2! 2 a 12
donde ξ es un punto del intervalo (a, b).

Observación 5. • La expresión del error asegura que la fórmula (2.4) es exacta para,
polinomios de grado no mayor que uno.

• Geométricamente, si f (x) ≥ 0 en [a, b], la fórmula del trapecio aproxima el valor de


Rb
a
f (x)dx por el área del trapecio resultante de unir los puntos (a, 0), (b, 0), (b, f (b))
y (a, f (a)).

Fórmula de Simpson Se trata de una fórmula para tres puntos, pero consigue
exactitud para los polinomios de grado menor o igual que tres, considerando los puntos
a+b
x0 = a, x1 = 2
y x2 = b. Por integración del polinomio de interpolación, se deduce
facilmente que

Z b µ µ ¶ ¶
b−a a+b
f (x)dx ≈ f (a) + 4f + f (b) . (2.5)
a 6 2
La deducción del error en la fórmula (2.5) es un poco más laboriosa. Para ello, hay
que suponer que f ∈ C4 ([a, b]), integrar el desarrollo de Taylor de orden tres de la función
f en el punto x1 y aplicar el Teorema 15, obteniéndose que

f 4 (ξ)
R2 (f ) = − (b − a)5 ,
2880
con ξ ∈ (a, b).

Observación 6. • La fórmula de Simpson es una de las fórmulas de integración


numérica más usadas en la práctica.

• En cuanto a la precisión, la expresión del error R2 (f ), en términos de la derivada


cuarta de f, confirma que la fórmula es exacta para los polinomios de grado menor
o igual que tres. Sin embargo, se obtiene a partir de la integración de un polinomio
de grado dos. La fórmula (2.5) tiene pues un grado más de exactitud.
Cap. 2 Desigualdades 70

Definición 8. (Fórmula de cuadratura) Sean {x0 < · · · < xn } ⊂ [a, b], n + 1 puntos
distintos y f ∈ C0 ([a, b]) una función dada. Una fórmula de cuadratura In con n + 1
nodos (puntos de cuadratura) es de la forma

n
X
In (f ) = αk f (xk ) (2.6)
k=0

donde αk ∈ R, son los pesos de cuadratura, y xk ∈ [a, b], k = 0, · · · , n son los nodos
de cuadratura.

Definición 9. (Error) Llamaremos E(f ) = I(f ) − In (f ) el error en una fórmula de


cuadratura.

Definición 10. (Orden) Diremos que una fórmula de cuadratura es de orden m ∈ N si



 E(p) = 0 para cada p ∈ Pm ][x]
p(t) =
 E(q) 6= 0 para algun q ∈ P
m+1 [x].

Observación 7. Debido a la linealidad de la integral (??) y la linealidad de la suma


(2.6), se tiene que el error E[.] es un funcional lineal. Luego, podemos definir el orden de
una fórmula de cuadraturade forma equivalente como sigue: Una fórmula de cuadratura
es de orden m ∈ N si

 E(xk ) = 0 para k = 0, · · · , m
 E(xm+1 ) 6= 0.

Ejemplo 16. Fórmula de cuadratura de punto medio

µ ¶
a+b
I0 (f ) = (b − a)f
2
es exactamente de orden 1. En efecto, aplicando la fórmula anterior se tiene

Z b
E(1) = 0 ⇔ I(1) − I0 (1) = 0 ⇔ dx − (b − a) = 0;
a
Cap. 2 Desigualdades 71

Z b µ ¶
a+b
E(x) = 0 ⇔ I(x) − I0 (x) = 0 ⇔ xdx − (b − a) = 0;
a 2

Z b µ ¶2
2 2 2 2 a+b
E(x ) = 0 ⇔ I(x ) − I0 (x ) = 0 ⇔ x dx − (b − a) 6= 0.
a 2
Ejemplo 17. Fórmula de cuadratura de Simpson

µ µ ¶ ¶
b−a a+b
I2 (f ) = f (a) + 4f + f (b)
6 2
es exactamente de orden 3.

Algoritmo de Lagrange Fijados un soporte de n + 1 puntos distintos S =


{x0 , · · · , xn } y unos valores reales (yi )ni=0 cualesquiera, el algoritmo de Lagrange de
construcción del polinomio de interpolación consiste en buscar el polinomio de interpo-
lación pn ∈ Pn[x] de la forma

pn (x) = y0 L0 (x) + y1 L1 (x) + · · · + yn Ln (x), (2.7)

donde Li ∈ Pn [x], Li (xi ) = 1 y Li xj = 0 para cada j 6= i, (es decir, Li es un polinomio


de interpolación asociado a los valores canónicos {0, · · · , 1, · · · , 0}). Usando la unicidad
del polinomio de interpolación, se puede comprobar que Li es de la forma

(x − x0 ) · · · (x − xi−1 )(x − xi+1 ) · · · (x − xn )


Li (x) = , (2.8)
(xi − x0 ) · · · (xi − xi−1 )(xi − xi+1 ) · · · (xi − xn )

con con i = 0, · · · , n y que (2.7) es el polinomio de interpolación buscado.


El conjunto de polinomios {L0 , L1 · · · , Ln } se llama la base de Lagrange aso-
ciado a los puntos (xi )ni=0 . Se trata de una base del espacio vectorial de polinomios de
interpolación asociados a dicho soporte. Identificando el polinomio de interpolación con
los valores (yi )ni=0 , la base de Lagrange son los polinomios de interpolación correspondi-
entes a la base canónica de Rn+1 .

Observación 8. Una ventaja del algoritmo de Lagrange, es que para el mismo soporte
S = (xi )ni=0 y distintos valores (yi )ni=0 , basta calcular la base de Lagrange una sola vez
Cap. 2 Desigualdades 72

(los Li solo dependen de S). Esto permitirı́a calcular varios polinomios de interpolación
asociados al mismo soporte S y a distintos valores (yi )ni=0 .
Además, si el soporte S es equidistante, haciendo el cambio de variable afı́n x ∈
[a, b] ↔ t ∈ [0, n], los polinomios Li de la base de Lagrange se transforman en polinomio
li que solo dependen del número de puntos de soporte (y no de la posición de los puntos).
En efecto,
Yn µ ¶ Y n
t−j (−1)n−i n
Li (x) ≡ li (t) = = (t − j), i = 0, ..., n (2.9)
j=0,j6=1
i − j n! i j=0,j6=0

En caso de añadir un punto más al soporte hay que volver a calcular toda la base de
Lagrange asociada.

Definición 11. (Fórmula de cuadratura de tipo interpolatorio (f.c.t.i.)) Sean f ∈


C0 ([a, b]), S = {x0 < x1 < · · · < xn } ⊂ [a, b] un soporte de puntos distintos y pn (x)
el polinomio de interpolación asociado a f y a S. Diremos que una fórmula de cuadratu-
ra In con n + 1 nodos es de tipo interpolatorio si
Z b
In (f ) ≡ I(pn ) = pn (x)dx (2.10)
a

Los puntos de interpolación xk , k = 0, · · · , n son los nodos de la f.c.t.i. Veamos cómo


se pueden calcular los pesos. Debido a (2.7), sabemos que el polinomio de interpolación
pn se expresa respecto de la base de Lagrange como sigue:
n
X
pn (x) = f (xk )Lk , (2.11)
k=0

donde los Lk vienen dados por (2.8). Luego, teniendo en cuenta a (2.11) en (2.10), de-
ducimos que

Z b n
X Z b
pn = f (xk ) Lk (x),
a k=0 a

en consecuencia, una f.c.t.i. es un caso particular de fórmula de cuadratura asociada a


los nodos de interpolación y a los pesos
Cap. 2 Desigualdades 73

Z b
αk = Lk (x)dx, k = 0, · · · , n. (2.12)
a

Ejemplo 18. Sea n = 1, x0 = a y x1 = b. Busquemos los pesos α0 y α1 para que la


fórmula de cuadratura I1 (f ) = α0 f (a) + α1 f (b) sea del tipo interpolatorio. Usando (2.12)
y que

x − x1 x−b x − xo x−a
L0 (x) = = , L1 (x) = = ,
x0 − x1 x−a x1 − x0 b−a
tenemos

Z b
x−b b−a
α0 = dx = ,
a a−b 2

Z b
x−a b−a
α1 = dx = ,
a b−a 2
de donde obtenemos la fórmula del trapecio

b−a
I1 (f ) = (f (a) + f (b)).
2
a+b
Para n = 2, x0 = a, x1 = 2
, x2 = b haciendo cálculos similares se obtiene la fórmula
de Simpson

µ µ ¶ ¶
b−a a+b
I2 (f ) = f (a) + 4f + f (b) .
6 2
Dado que una integral es el lı́mite de una suma infinita, es natural que su aproxi-
mación consista en una suma finita de muestras, ponderadas con pesos wi , del integrando
f (xi ). Dicha suma se denomina fórmula de cuadratura.
Nota Histórica En el año 1615 Johanes Kepler establece la llamada regla
del tonel y sobre la historia de su surgimiento, Kepler la describe en la dedicatoria de
su publicación (Nova Stereometria doliorum vinariorum). Después de que la primera
esposa de Kepler habı́a muerto en Praga en 1611, Kepler se casó nuevamente y para la
Cap. 2 Desigualdades 74

boda compró algunos toneles de vino; con el vino en la bodega, el vendedor, con una
vara de medir, determinó el contenido de los barriles sin calcular, utilizando un método,
que consiste en introducir una vara de metal, y medir a través del barril, en diagonal
hacia los bordes del fondo de los barriles de vino, la marca en la vara arrojaba la
medida del volúmen del contenido. Kepler se sorprendió de que una diagonal a través del
medio del barril pudiera dar una medida sobre el volúmen y puso en duda la exactitud
de este método debido a que, por ejemplo, un barril muy bajo que tuviera una base
algo más ancha y por eso un volúmen mucho menor, podrı́a tener el mismo radio a la vista.

A raı́z de esto, Kepler formuló el escrito de un nuevo cálculo del contenido de barriles
en el que buscaba métodos verificables para la medición de los toneles de vino. Para ello
la metodologı́a que empleó fué la siguiente.
Consideró en primer lugar el caso de los barriles cilı́ndricos, considera λ a la distancia
ND que hay entre el hoyo de llenado y el talón de los fondos, 2x a la altura AB del barril
y 2y al diámetro AD del barril.

Figura 2.1: Medidas del barril

Por el teorema de Pitágoras, se tiene que x2 + 4y 2 = λ2 . Por tanto, el volúmen del


barril podrı́a ser calculado, de la siguiente manera

1
V = πr2 h = πy 2 2x = πx(λ2 − x2 ).
2
Cap. 2 Desigualdades 75

La obsevación crucial hecha por Kepler fué entonces que todos los barriles austriacos
se fabricaban con la misma razón entre la altura y el diámetro.
x
En efecto, considerando la razón t = y
y empleando las dos expresiones anteriores, se
tiene

−2
V = 2πλ3 t(4 + t2 ) 3 .

De esta fórmula se observa, que el volúmen V de un barril cilı́ndrico depende de


x
λ y la razón t = y
no se determina solamente conociendo el valor de λ. Para que se
pueda utilizar el método de medición de los toneles austriacos, los barriles tendrı́an que
fabricarse con una relación t fija.
Debido a los estudios publicados por Kepler, Thomas Simpson (1710-1761) realiza
investigaciones posteriores y con el conocimiento de cálculo diferencial realizado por el
matemático alemán Gottfried Leibniz (1646-1716) sobre la función, e integral y en 1743
encuentra una aproximación para el cálculo de área la cual se denominará Regla de
Simpson en el intervalo [a, b] y se denota de la siguiente forma

Z · ¸
b−a a+b
f (x)dx ≈ f (a) + 4f + f (b) .
6 2
Para efectos de la demostración del método de Simpson, se asume cada sub área como
un pequeño arco de la parábola de la forma f (x) ≈ ax2 + bx + c con lı́mite inferior a y
a+b
lı́mite superior b por ende la mitad del de la pequeña sub área es 2
(Ver Figura 2.2)
Cap. 2 Desigualdades 76

f(x)

f(b)

f((a+ b)/2)
g(x)
f(a)

a (a+ b)/2 b

Figura 2.2: Representación geométrica de la Desigualdad de Simpson

La aproximación de una función f (x) a ser integrada usanto la regla de Simpson


(cálculo de valor cuadrático), g(x).
Esta última aproximación se puede generalizar evaluando la función en un intervalo
de tal forma que la función f (x) se evalua en los extremos a, b y un punto central a+b 2
.
¡ a+b ¡ a+b ¢¢
La ecuación de la parábola que pasa por los puntos (a, f (a)), 2 , f 2 , (b, f (b))
y viene dada por
¡ ¢ µ ¶
x − a+b
2 (x − a)(x − b) a+b (x − a)(x − a+b
2
)
g(x) ≈ ¡ b−a ¢ f (a) + b−a a−b
f + b−a
f (b)
(b − a) 2 ( 2 )( 2 ) 2 (b − a)( 2 )

resultando de la siguiente forma:


Z b · µ ¶ ¸
(b − a) a+b
g(x)dx ≈ f (a) + 4f + f (b)
a 6 2

La simple inspección visual de esta figura y la que describe el procedimiento de los


trapecios o los rectángulos, confirma que el método de Simpson deberá ser mucho más
exacto que los procedimientos mencionados.
Cap. 2 Desigualdades 77

Ahora, se sabe que el área que se desea encontrar serı́a la sumatoria de todas las
sub áreas que se calculen. Al igual que los métodos de la regla trapezoidal y de la regla
rectángular, entre más sub áreas tenga la integral a calcular, más exacto será el valor
encontrado.

En la siguiente sección se estudiarán dos desigualdades de tipo Simpson para la función


cuasi-convexa, en términos de la tercera derivada, como también aplicaciones de la regla
de cuadratura numérica de Simpson.
Además se estudiará la desigualdad de Simpson para funciones Lipschitzianas y
se aplicará a medias especiales tales como media aritmética, media geométrica, media
armónica y media logarı́tmica.

2.5 Desigualdad de Simpson


En los últimos años varios autores han considerado desigualdades, que dan de manera
explı́cita, cotas de errores para fórmulas de cuadraturas ya conocidas y nuevas. Por
esjemplo la desigualdad de Simpson de una cota del error para la bien conocida, regla de
cuadratura de Simpson.
Como se estableció en la introducción del trabajo, el siguiente teorema es bien cono-
cido [17].

Teorema 16. Supóngase que f es una función cuatro veces continuamente diferenciable
sobre (a, b) y
kf (4) k∞ := sup |f (4) (x)| < ∞.
x∈(a,b)

Entonces la siguiente desgualdad


¯Z b · µ ¶ ¸¯
¯ (b − a) a+b ¯ (b − a)5 (4)
¯ f (x)dx − f (a) + 4f + f (b) ¯≤ kf k∞ (2.13)
¯ 6 2 ¯ 2880
a

se satisface, y en la literatura es conocido como la desigualdad de Simpson.


Cap. 2 Desigualdades 78

En caso de que f no sea cuatro veces diferenciable ni su cuarta derivada es acota-


da en (a, b), entonces no podemos aplicar la fórmula clasica de la desigualdad de Simpson.

La desigualdad (2.13) se define como la desigualdad de Simpson, donde f : [a, b] → R


se supone es cuatro veces continuamente diferenciable en el intervalo (a, b) y la cuarta
derivada es acotada sobre (a, b), es decir,

||f (4) ||∞ := sup |f (4) (x)|.


x∈(a,b)

Durante los últimos años, muchos autores han establecido varias generalizaciones de
la desigualdad de Simpson, (2.13) para las funciones de variación acotada y funciones
Lipschitzianas, monótonas y funciones absolutamente continuas. Para contrapartes, refi-
namientos y generalizaciones de la desigualda de Simpson verificar [1], [2], [13], [14], [16],
[17], [18], [21], [24] y [45], el cual es el resultado principal de este capı́tulo.
En el año 2000 J. Pecãric y S. Varos̃anec en [45] desarrolló la desigualdad de Simpson
para funciones cuya enésima derivada con n ∈ {0, 1, 2, 3} es de variación acotada. A
continuación se dará el enunciado de la definición de variación acotada y dicho resultado.

Definición 12. Sea u : [a, b] → R una función. Para cada partición π : a = t0 < t1 <
· · · < tn = b del intervalo [a, b], definimos

b
_ n
X
(f ) := sup |u(ti ) − u(ti−1 )|,
π
a i=1

donde el supremo se considera sobre el conjunto de todas las particiones π del intervalo
b
_ _
[a, b]. Si < ∞, decimos que f tiene variación acotada. Se denota por B [a, b] a la
a
familia de todas las funciones de variación acotada sobre [a, b].

Teorema 17. Sea n ∈ {0, 1, 2, 3} y f una función real sobre [a, b] tal que f (n) es de
variación acotada. Entonces
¯Z b · µ ¶ ¸¯ b
_
¯ b − a a + b ¯ ¡ (n) ¢
¯ f (x)dx − f (a) + 4f + f (b) ¯ ≤ Cn(b − a)n+1 f (2.14)
¯ 6 2 ¯
a a
Cap. 2 Desigualdades 79

donde,
1 1 1 1
C0 = ; C1 = ; C2 = ; C3 =
3 24 324 1152
b
_
y (f (n) ) es la variación total de f (n) sobre el intervalo [a, b].
a

Se puede notar que en la desigualdad (2.14) cuando n = 0, el resultado fué probado


en el año 1999 por Dragomir en [14]. Ghizzeti en el año 1970 en [24] probó que si f 000 es
W
una función absolutamente continua con variación total ba (f ), entonces (2.14) se cumple
también para n = 3.
Uno de los resultados que demostró S. S. Dragomir en el año 2002 en [18] es que si
existe una división del intervalo [a, b] y αi (i = 0, ..., k + 1) sea k + 2 puntos de modo que
α0 = a, αi ∈ [xi−1 , xi ], (i = 1, ..., k) y αk+1 = b. I que si además f es de variación acotada
entonces se cumple la siguiente desigualdad
¯Z ¯
¯ b Xk ¯
¯ ¯
¯ f (x)dx − (αi+1 − αi )f (xi )¯
¯ a ¯
i=0
· ½ ¾¸ _
b
1 xi + xi+1
< ν(h) + máx |αi+1 − |, i = 0, ..., k − 1 (f )
2 2 a
b
_
< ν(h) (f )
a

Wb
donde ν(h) := máx{hi |i = 0, ...k − 1}, hi := xi+1 − xi , (i = 0, ..., k − 1) y a (f ) es la
variación total de f sobre el intervalo [a, b].
Otro resultado que podemos verificar en [53] que demostró E. Set en el año 2012 es
el siguiente, el cual afirma que si tenemos una función diferenciable f sobre el interior de
I y además |f 0 | cuasi-convexa se obtiene el siguiente resultado
¯ · µ ¶ ¸ Z b ¯
¯1 a + b 1 ¯ 5(b − a)
¯ f (a) + 4f + f (b) − f (x)dx¯¯ ≤ máx{|f 0 (a)|, |f 0 (b)|}.
¯6 2 b−a a 36

Asi mismo se puede verificar en [1] que si f 0 es una función absolutamente continua
sobre el interior de I y |f 00 |q es cuasi-convexa sobre [a, b] entonces la siguiente desigualdad
Cap. 2 Desigualdades 80

se cumple
¯ Z b · µ ¶ ¸¯
¯ 1 1 a+b ¯
¯ f (x)dx − f (a) + 4f + f (b) ¯
¯b − a 6 2 ¯
a
"µ ½¯ µ ¶¯ ¾¶ 1q µ ½¯ µ ¶¯q ¾¶ 1q #
(b − a)2 ¯ 00 a + b ¯q ¯ a + b ¯
≤ máx ¯¯f ¯ , |f 00 (b)|q
¯ + máx ¯¯f 00 ¯ , |f 00 (a)|q
¯ .
162 2 2

Otro resultado interesante sobre la desiguadad de Simpson, para funciones acotadas,


que se demostró en [17] y [45] el cual asegura que si f es una función de variación acotada
se va a cumplir la siguiente desigualdad
¯Z b · µ ¶¸¯ b
¯ b − a f (a) + f (b) a + b ¯ 1 _
¯ f (x)dx − + 2f ¯ ≤ (b − a) (f )
¯ 3 2 2 ¯ 3
a a

Wb 1
donde a denota la variación total de f sobre el intervalo [a, b]. La constante 3
es la
mejor posible.
Por otra parte I. Fedotov, y S. S. Dragomir en el año 1999 argumentó en [21] que si f
es una función diferenciable en el interior de I y a, b ∈ int(I) con a < b, y si f 0 ∈ L1 [a, b]
y además γ < f 0 < Γ para todo x ∈ [a, b] la siguiente desigualdad se cumple
Z b µ ¶
1 f (b) − f (a) a+b
|f (x) − f (t)dt − x− |
b−a a b−a 2
1
< (b − a)(Γ − γ)
4

para todo x ∈ [a, b].


Ahora si asumimos que In : a = x0 < x1 < · · · < xn−1 < xn = b es una partición del
intervalo [a, b] y f está por encima, entonces tenemos la fórmula clásica de la cuadratura
de Simpson la cual se define de la siguiente manera
Z b
f (x)dx = As (f, In ) + Rs (f, In ) (2.15)
a

donde As (f, In ) es la regla de Simpson


n−1 n−1 µ ¶
1X 2X xi + xi+1
As (f, In ) =: [f (xi ) + f (xi+1 )]hi + f hi (2.16)
6 i=0 3 i=0 2
Cap. 2 Desigualdades 81

y el término residuo Rs (f, In ) que se define de la siguiente forma

b − a (4)
|Rs,n (f, In )| = − ||f || (2.17)
4!5!

satisface el estimado
X n−1
1
|Rs (f, In )| ≤ ||f (4) ||∞ h5i (2.18)
2880 i=0

donde hi = xi+1 − xi para i = 0, ..., n − 1.

Ahora cuando tenemos una partición equidistante de [a, b] dada por

b−a
In : xi := a + i, i = 0, ..., n; (2.19)
n

entonces tenemos la fórmula


Z b
f (x)dx = As,n (f ) + Rs,n (f ) (2.20)
a

donde
n−1 · µ ¶ µ ¶¸
b−aX b−a b−a
As,n (f ) = f a+ i +f a+ (i + 1) (2.21)
6 i=0 n n
n−1 µ ¶
2(b − a) X b − a 2i + 1
+ f a+
3n i=0
n 2

y el resto satisface la estimación

1 (b − a)5 (4)
|Rs,n (f )| ≤ ||f ||∞ (2.22)
2880 n4
(b−a)
Teorema 18. (Ver [56]) Sea f ∈ C4 ([a, b], R), con h = 2
y X0 = a, x1 = x0 + h, x2 =
b. Entonces existe x ∈ (a, b) tal que

Z b
h h5 (4)
E(f ) := f (x)dx − (f (x0 ) + 4f (x1 ) + f (x2 )) = − f (x)
a 3 90
Notemos que en algunos sitios de la literatura, la acotación es escrita en térmionos
de (b − a) como
Cap. 2 Desigualdades 82

(b − a)5 (4)
E(f ) = − f (x)
2880
Demostración
Definamos F (t) = f (x(t)). Entonces dx = hdt, y

Z x2 Z 1
f (x)dx = h F (τ )dτ
x0 −1

En términos de esta función el error de integración se escribe como

Z b µ ¶ µZ 1 ¶
h a+b 1
f (x)dx− (f (a)+4f +f (b)) = h F (τ )dτ − (F (−1) + 4F (0) + F (1)) .
a 3 2 −1 3

Definimos

Z t
1
G(t) = F (τ )dτ − (F (−t) + 4F (0) + F (t))
−t 3
para t ∈ [−1, 1]. En particular, h(G(1)) es el error de integración que estamos tratando
de estimar. Consideremos la función

H(t) = G(t) − t5 G(1).

Como H(0) = H(1) = 0 por el teorema de Rolle existe ξ1 ∈ (0, 1) tal que H 0 (ξ) = 0,
Como H 0 (0) = 0, entonces existe ξ2 ∈ (0, 1) tal que H (2) (ξ2 ) = 0. Como H (2) (0) = H (3) =
0, se puede aplicar el Teorema de Rolle repetidamente para encontrar que existe µ ∈ (0, 1)
tal que

H (3) (µ) = 0.

Notemos que la tercera derivada de G es dada por G(3) (t) = − 3t (F (3) (t) − F (3) (−t)),
por lo que
µ
H (3) (µ) = − (F (3) (µ) − F (3) (−µ)) − 60µ2 G(1) = 0.
3
Reescribiendo esta escuación como
Cap. 2 Desigualdades 83

2 F (3) (µ) − F (3) (−µ) 2


− µ2 = µ2 90G(1).
3 (µ − (−µ)) 3
2µ2
Usando que µ 6= 0, se puede dividir por ambos lados por 3
. Y por el Teorema del
valor medio, existe x ∈ (−µ, µ) tal que

90G(1) = −F (4) (ξ),

de donde se otiene el error, despues de multiplicar por h,

h (4)
hG(1) = − F (ξ).
90
Ahora nótese que haciendo un cambio de variables x = x1 + th

(4) d4 d4
F (t) = 4 f (x) = 4 (x1 + ht) = h4 f (4) (x).
dt dt
¤
De aqui se desprende que la cota del error

¯Z b ¯
¯ ¯ 1
¯
E2 (f ) = ¯ f (x)dx − I2 (f )¯¯ ≤ h5 M4 ,
a 90
donde M4 es la cota superior sobre el valor absoluta de la cuarta derivada sobre el
intervalo [a, b].
A continuación enunciaremos la siguiente definición que nos ayudará a demostrar el
la desigualdad de Simpson para funciones cuasi-convexas, el cual es uno de los resultados
principales, y se encuentra en [3] de este Trabajo Especial de Grado.

Definición 13. Una función F : [a, b] → R se llama absolutamente continua si para todo
ε > 0 existe un δ > 0 tal que para toda familia {(ai , bi )} de intervalos disjuntos en [a, b]
n
X n
X
tal que (bi − ai ) < δ se cumple la desigualdad |F (bi − F (ai ))| < ε
k=i i=1
Cap. 2 Desigualdades 84

2.5.1 Desigualdad de Simpson para Funciones Cuasi-Convexas

Lema 2. Sea f : I ⊆ R → R una función absolutamente continua en I 0 tal que f 000 ∈


L[a, b], donde a, b ∈ I con a < b. Si |f 000 | es cuasi-convexa en [a, b] entonces

Z b · µ ¶ ¸ Z 1
(b − a) a+b 4
f (x)dx − f (a) + 4f + f (b) = (b − a) p(t)f 000 (ta + (1 − t)b)dt
a 6 2 0

donde
 ¢ £ ¤ ¡

t − 12 1 2
si t ∈ 0, 21 ;
t
6
p(t) =
 1 (t − 1)2 ¡t − 1 ¢ si t ∈ ( 1 , 1].
6 2 2
·
Demostración: Sean I,I1 e I2 definidas de la siguiente manera:
Z 1
I = p(t)f 000 (ta + (1 − t)b)dt
0
Z 1 µ ¶
1 2
2 1
= tf 000 (ta + (1 − t)b)dt
t−
6 0 2
Z µ ¶
1 1 2 1
+ (t − 1) t − f 000 (ta + (1 − t)b)dt
6 12 2

Z 1 µ ¶
1 2
2 1
I1 = t t− f 00 (ta − (1 − t)b)dt
6 0 2

e
Z 1 µ ¶
1 2 1
I2 = (t − 1) t− f 000 (ta + (1 − t)b)dt. (2.23)
6 1
2
2

para resolver I1 por partes, consideremos el siguiente cambio de variables


µ ¶
2 1
u=t t−
2

entonces
du = (3t2 − t)dt
Cap. 2 Desigualdades 85

y
dv = f 000 (ta + (1 − t)b)dt

luego
f 00 (ta + (1 − t)b)
v=
a−b
realicemos otro cambio de variables dado por

u1 = ta + (1 − t)b

ası́
du1 = (a − b)dt

reescribiendo
du1
= dt
a−b
además
dv1 = f 00 (ta + (1 − t)b)

y
1
f 00 (ta + (1 − t)b)
v1 =
a−b
à µ ¶ 00 ¯1 " Z 1 #!
1 2 1 f (ta + (1 − t)b) ¯¯ 2 1 2
luego I1 = t t− ¯ − f 00 (ta + (1 − t)b)(3t2 − t)dt .
6 2 a−b 0 a−b 0

Definamos Iˆ1 de la siguiente manera


Z 1
2 f 00 (ta + (1 − t)b)(3t2 − t)
Iˆ1 = dt
0 a−b

calculemos I10 por partes haciendo un cambio de variable con

u2 = 3t2 − t

du2 = (6t − 1)dt


Cap. 2 Desigualdades 86

y
dv2 = f 00 (ta + (1 − t)b)
f 0 (ta + (1 − t)b)
v2 =
a−b
¯ 1 "Z 1 #
(3t2
− t)f 0
(ta + (1 − t)b) ¯2 2 (6t − 1)f 0 (ta + (1 − t)b)
Iˆ1 = ¯ −
¯ dt
(a − b)2 0 0 a−b
a continuación consideremos la siguiente notación de Iˆ2
Z 1
2 (6t − 1)f 0 (ta + (1 − t)b)
Iˆ2 = dt
0 a−b
calculamos Iˆ2 por partes haciendo el cambio de variable

u3 = 6t − 1

du3 = 6dt

y
dv3 = f 0 (ta + (1 − t)b)dt
f (ta + (1 − t)b)
v3 =
a−b
se obtiene que
Z 1
(6t − 1)f (ta + (1 − t)b) 6 2
Iˆ2 = − f (ta + (1 − t)b)dt.
a−b a−b 0

Luego
" µ ¶ ¯1 " "Z 1 ###
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 2 1 2
I1 = t t− ¯ − a−b f 00 (ta + (1 − t)b)(3t2 − t)dt
6 2 a−b 0 0
" µ ¶ 00 ¯1 " " ¯ 1 ###
1 2 1 f (ta + (1 − t)b) ¯¯ 2 1 (3t2 − t)f 0 (ta + (1 − t)b) ¯¯ 2
= t t− ¯ − a−b ¯
6 2 a−b 0 a−b 0
"Z 1 #
1 2 (6t − 1)f 0 (ta + (1 − t)b)
+ dt
6 0 (a − b)2
" µ ¶ ¯1 ¯1 #
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 2 1 2 0
¯2
¯
= t t− ¯ − (3t − t)f (ta + (1 − t)b) ¯
6 2 a−b 0 (a − b)2 0
" " Z 1 ##
1 (6t − 1)f (ta + (1 − t)b) 6 2
+ − f (ta + (1 − t)b)dt
6 (a − b)3 (a − b)3 0
Cap. 2 Desigualdades 87

1
multiplicando distributivamente por
6
µ ¶ ¯1 ¯1
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 2 1 2 f 0 (ta + (1 − t)b) ¯¯ 2
I1 = t t− ¯ − 6 (3t − t) ¯
6 2 a−b 0 (a − b)2 0
µ ¶ ¯1 Z 1
1 f (ta + (1 − t)b) ¯¯ 2 2 f (ta + (1 − t)b)
+ t− ¯ − dt.
6 (a − b)3 0 0 (a − b)3

Ahora bien, calculando I2 de igual manera y resolviendo por partes se obtiene que
Z µ ¶
1 1 2 1
I2 = (t − 1) t − f 000 (ta + (1 − t)b)dt
6 12 2

considerando el cambio de variable


µ ¶
2 1
r = (t − 1) t−
2

dr = (3t2 − 5t + 2)dt
f 00 (ta + (1 − t)b)
s=
a−b
y
ds = f 000 (ta + (1 − t)b)dt

se obtiene que
" µ ¶ 00 ¯1 Z 1 00 #
1 1 f (ta + (1 − t)b) ¯ f (ta + (1 − t)b)(3t2
− 5t + 2)
I2 = (t − 1)2 t − ¯ − dt
6 2 a−b ¯1 1 a−b
2 2

denotemos por Z 1
f 00 (ta + (1 − t)b)(3t2 − 5t + 2)
Iˆ3 = dt.
1
2
a−b
calculando I20 por partes, se considera el siguiente cambio de variables, sea

r1 = 3t2 − 5t + 2

dr1 = (6t − 5)dt

y
f 0 (ta + (1 − t)b)
s1 =
a−b
Cap. 2 Desigualdades 88

ds1 = f 00 (ta + (1 − t)b).

Consideremos la siguiente notación Iˆ3 de la siguiente forma


Z 1 00
ˆ f (ta + (1 − t)b)(3t2 − 5t + 2)
I3 = dt
1
2
a−b
¯1 Z 1 0
(3t2 − 5t + 2)f 0 (ta + (1 − t)b) ¯¯ f (ta + (1 − t)b)(6t − 5)
= ¯ − dt.
(a − b)2 1 1
2
(a − b)2
2

Sea Z 1
f 0 (ta + (1 − t)b)(6t − 5)
Iˆ4 = dt
1
2
(a − b)2

Integrando I20 por partes, consideremos el siguiente cambio de variable

r2 = 6t − 5

dr2 = 6dt

y
f (ta + (1 − t)b)
s2 =
a−b
ds2 = f 0 (ta + (1 − t)b)

ahora definiremos Iˆ4 como sigue


Z 1 0
ˆ f (ta + (1 − t)b)(6t − 5)
I4 = dt
1
2
(a − b)2
¯1 Z 1
f (ta + (1 − t)b) ¯¯ f (ta + (1 − t)b)
= (6t − 5) 3 ¯ − 6 3
dt
(a − b) 1 1
2
(a − b)
2
Cap. 2 Desigualdades 89

luego
µ ¶ ¯1 ¯1
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 1 f 0 (ta + (1 − t)b) ¯¯
I2 = (t − 1) t − ¯ 1 − 6 (3t − 2)(t − 1) ¯1
6 2 (a − b) (a − b)2
2 2
Z 1
(6t − 5) f (ta + (1 − t)b) 4 f (ta + 1 − t)b
+ 3
+ dt
6 (a − b) 6 12 (a − b)3
µ ¶ ¯1 ¯1
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 1 f 0 (ta + (1 − t)b) ¯¯
= (t − 1) t − ¯ 1 − 6 (3t − 2)(t − 1) ¯1
6 2 (a − b) (a − b)2
2 2
µ ¶ ¯1 Z 1
5 f (ta + (1 − t)b) ¯ ¯ 2 f (ta + (1 − t)b)
+ t− 3 ¯ + dt
6 (a − b) 1 3 2 1 (a − b)3
2
Z 1
1 f 0 ( a+b
2
) 2 f ( a+b
2
) 1 f (b) 2 f (ta + (1 − t)b)
= − + + − dt
24 (a − b)2 6 (a − b)3 6 (a − b)3 0 (a − b)3
Z 1
1 f 0 ( a+b
2
) 1 f (a) 2 f ( a+b
2
) f (ta + (1 − t)b)
+ 2
+ 3
+ 3
− dt.
24 (a − b) 6 (a − b) 6 (a − b) 1
2
(a − b)3

Haciendo el cambio de variables x = ta + (1 − t)b y dx = (a − b)dt, se tiene el siguiente


resultado
Z b · µ ¶ ¸ Z 1
(b − a) a+b 4
f (x)dx − f (a) + 4f + f (b) = (b − a) p(t)f 000 (ta + (1 − t)b)dt
a 6 2 0

el cual da la representación deseada. ¤

Del resultado anterior podemos asegurar el siguiente teorema.

Teorema 19. Sea f : I ⊆ R → R una función absolutamente contı́nua en I 0 tal que


f 000 ∈ L[a, b], donde a, b ∈ I con a < b. Si |f 000 | es cuasi-convexa en [a, b], entonces

¯Z b · µ ¶ ¸¯ · ½ ¯ µ ¶¯¾¸
¯ (b − a) a + b ¯ 4 ¯ 000 a + b ¯
¯ f (x)dx − f (a) + 4f + f (b) ¯ ≤ (b − a) máx |f (a)|, ¯¯f
000 ¯
¯ 6 2 ¯ 1152 2 ¯
a
· ½¯ µ ¶¯ ¾¸
(b − a)4 ¯ 000 a + b ¯ 000
+ máx ¯¯f ¯ , |f (b)|
¯
1152 2
Demostración: Por la definición de cuasi-convexidad y el Lema 2 se obtiene que
¯Z b · µ ¶ ¸¯ Z 1
¯ (b − a) a + b ¯
¯ f (x)dx − f (a) + 4f + f (b) ¯¯ ≤ (b − a)4
|p(t)f 000 (ta + (1 − t)b)|dt
¯ 6 2
a 0
Cap. 2 Desigualdades 90

si p(t) está definido por


 ¡ ¢ £ ¤
 t − 12
1 2
t si t ∈ 0, 21 ;
6
p(t) =
 1 (t − 1)2 ¡t − 1 ¢ si t ∈ ( 1 , 1].
6 2 2

Se obtiene la siguiente
¯Z b · µ ¶ ¸¯ Z 1
¯ (b − a) a+b ¯
¯ f (x)dx − f (a) + 4f ¯
+ f (b) ¯ ≤ (b − a)4
|p(t)f 000 (ta + (1 − t)b)|dt
¯ 6 2
a 0
¯ µ
4 Z 12 ¯
¶¯
(b − a) ¯
= ¯t2 t − 1 ¯ |f 000 (ta + (1 − t)b)|dt
6 ¯ 2 ¯
0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2

por propiedad del valor absoluto


Z 1¯ µ ¶¯
(b − a)4 2 ¯¯ 2 1 ¯¯ 000
6 ¯t t − 2 ¯ |f (ta + (1 − t)b)|dt
0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2
4 Z 12
µ ¶ ½ ¯ µ ¶¯¾
(b − a) 1 ¯ 000 a + b ¯
≤ t 2 000
− t máx |f (b)|, ¯f ¯ ¯ dt
6 2 2 ¯
0
Z µ ¶ ½¯ µ ¶¯ ¾
(b − a)4 1 1 ¯ 000 a + b ¯ 000
+ 2
(1 − t) t − máx ¯f¯ ¯
6 1 2 2 ¯ , |f (a)| dt.
2

Resolviendo la integral
Z 1 µ ¶
2
2 1
I1 = t − t dt
0 2
Cap. 2 Desigualdades 91

se obtiene el resultado
Z 1 Z 1µ ¶ Z 1 Z 1
2 1 2 1 2 2 1 2 2
2 3 3 3
(t − t )dt = −t + t dt = − t dt + t dt
0 2 0 2 0 2 0
¯1 ¯1 ¯1 ¯1
t4 ¯¯ 2 1 t3 ¯¯ 2 t4 ¯¯ 2 1 3 ¯¯ 2
= − ¯ + =− ¯ + t ¯
4 0 2 3 ¯0 4 0 6 0
µ ¶4 µ ¶3
1 1 1 1 1
= − +
2 4 2 2 3
µ ¶ µ ¶
1 1 1 1 1 1 1
= − + =− +
16 4 2 8 3 64 48
1
= .
192

Ahora se resuelve la integral


Z 1 µ ¶
2 1
I2 = (1 − t) t− dt
1
2
2
se obtiene
Z 1 µ ¶ Z 1µ ¶
2 1 3 5 2 1
(1 − 2t + t ) t − dt = t − t + 2t − dt
1
2
2 1
2
2 2
Z 1 Z Z 1 Z
3 5 1 2 1 1
= t dt − t dt + 2 dt − dt
1
2
2 1
2
1
2
2 1
2
¯1 ¯1 ¯1 ¯1 ¯1 ¯1
t4 ¯¯ 5 t3 ¯¯ 1 1 t2 ¯¯ t4 ¯¯ 5 3 ¯¯ 2 1 1 ¯¯
= − + 2 ¯ = ¯ − t ¯ + t | 1 − t¯
4 ¯1 2 3 ¯1 2 2 1 4 1 6 1 2 2 1
2
µ ¶4
2
" Ã 2
µ ¶2
2
!# 2
µ ¶2 · µ
2
¶¸
1 1 1 5 1 1 1 1 1 1
= − − − +1− − 1−
4 2 4 2 3 2 3 2 2 2
µ ¶ · µ µ ¶ ¶¸ µ ¶ · µ ¶¸
1 1 1 5 1 1 1 1 1 1
= − − − +1− −
4 16 4 2 3 8 3 4 2 2
· µ ¶¸
1 1 5 1 1 3 1
= − − − + + −
4 64 2 24 3 4 4
15 35 1
= − +
64 48 2
45 − 140 + 96
=
192
1
= .
192
Cap. 2 Desigualdades 92

Entonces
Z 1 µ ¶ ½ ¯ µ ¶¯¾
(b − a)4 2 2 1 ¯ 000 a + b ¯
t 000
− t máx |f (b)|, ¯f ¯ ¯ dt
6 2 2 ¯
0
Z µ ¶ ½¯ µ ¶¯ ¾
(b − a)4 1 1 ¯ 000 a + b ¯ 000
+ 2
(1 − t) t − máx ¯¯f ¯ , |f (a)| dt
¯
6 1 2 2
2
½ ¯ µ ¶¯¾ ½¯ µ ¶¯ ¾
(b − a)4 1 ¯ 000 a + b ¯ (b − a)4 1 ¯ 000 a + b ¯ 000
= 000
máx |f (b)|, ¯f ¯ ¯ ¯ ¯
6 192 2 ¯ + 6 192
máx ¯f
2 ¯ , |f (a)|
½ ¯ µ ¶¯¾ ½ ¯ µ ¶¯¾
(b − a)4 ¯ 000 a + b ¯ (b − a) 4 ¯ 000 a + b ¯
= máx |f (b)|, ¯¯f
000 ¯ +
¯ máx |f (a)|, ¯¯f
000 ¯
¯
1152 2 1152 2
· ½ ¯ µ ¶¯ ¾ ½¯ µ ¶¯ ¾¸
(b − a)4 ¯ a + b ¯¯ ¯ 000 a + b ¯ 000
= máx |f 000 (a)|, ¯¯f 000 ¯ + máx ¯f
¯
¯ , |f f (b)|
¯
1152 2 2

llegando al resultado que se querı́a demostrar, completando la demostración.


¤
A continuación demostraremos las desigualdades de Young y Hölder que nos
ayudará a comprender mejor la demostración del siguiente teorema, además de enunciar
un teorema de la desigualdad de Hadamard para aplicaciones cuasi-convexas.

Teorema 20. (ver[42]) Sean φ una función continua y estrictamente creciente en el


intervalo [0, c], con c > 0, tal que φ(0) = 0. Si ψ es la función inversa de φ, entonces
Z x Z y
xy ≤ φ(s)ds + ψ(t)dt.
0 0

para todo x ∈ [0, c] y y ∈ [0, φ(c)] la igualdad se cumple si y sólo si y = φ(x).

Demostración Comencemos por demostrar que para todo x ∈ [0, c]


Z x Z φ(s)
xφ(x) = φ(s)ds + ψ(t)dt. (2.24)
0 0

Si x = 0 el caso es el trivial. Supongamos x > 0. A cada entero n ≥ 1 se le puede


asociar la partición Pn = {0, nx , 2 nx , ..., i nx , (i + 1) nx ..., x} del intervalo [0, x] lo cual nos
Cap. 2 Desigualdades 93

£ ¤
da n sub-intervalos i nx , (i + 1) nx , (i = 0, ..., n − 1) cada uno de longitud x
n
. A Pn le
corresponde la suma inferior de Riemann de φ
n−1 ³
x´ x x X ³ x´
X n−1
I(Pn , φ) = φ i = φ i .
i=0
n n n i=0 n

Además, al mismo entero n se le puede corresponder la partición


³x´ ³ x´ ³ x´ ³ x´
Pn0 = {0 = φ(0), φ ,φ 2 , ..., φ i , φ (i + 1) , ..., φ(x)} del intervalo
n n n n
[0, φ(x)], a la cual corresponde la suma superior de Riemann de la función ψ
n−1
X ³ ³ x ´´ ³ ³ x´ ³ x ´´
S(Pn0 , ψ) = ψ φ (i + 1) φ (i + 1) −φ i
i=0
n n n

x
n−1
X ³ x ³ x ´´
= (i + 1) φ(i + 1) − φ i .
n i=0
n n

Por otra parte se tiene que para todo n

I(Pn , φ) + S(Pn0 , ψ) = xφ(x) (2.25)

ya que
n−1 ³
x´ X ³ x´ ³ x´ ³ x´ X ³ x´
X n−1 n−1
X n−1
φ i + (i + 1) φ(i + 1) −φ i = (i + 1)φ (i + 1) − iφ i
i=1
n i=0
n n i=0
n i=1
n
n−1 ³
x´ ³ x´
X n−1
X
= φ j + nφ(x) − iφ i nφ(x).
j=1
n i=1
n

Por ser φ continua en [0, x] también lo es ψ en [0, ψ(x)]. Por consiguiente exis-
Z x Z φ(x)
ten las integrales φ(s)ds, ψ(t)dt. Además debido a la continuidad uniforme
0 0
de φ en [0, x], cuando n tiende a infinito, la longitud de cada subintervalo de la for-
h ³ x´ xi
ma φ i , φ(i + 1) , (i = 0, ..., n − 1) tiende a cero, de modo que en virtud de la
n n
definición de la integral de Riemann se tiene
Z x Z φ(x)
0
lı́m I(Pn , φ) = φ(s)ds, lı́m S(Pn , ψ) = ψ(t)dt
n→∞ 0 n→∞ 0

de lo cual se deduce, utilizando (2.25), la fórmula (2.24).


Cap. 2 Desigualdades 94

De (2.24) resulta que para demostrar el teorema basta establecer que si y 6= φ(x),
entonces Z y
xy < ψ(t)dt > x(y − φ(x)),
φ(x)

de lo cual resulta que

xy = xφ(x) + x(y − φ(x))


Z x Z φ(x) Z y
< φ(s)ds + ψ(t)dt + ψ(t)dt
0 0 φ(x)
Z x Z y
= φ(s)ds + ψ(t)dt
0 0

por lo que se concluye que


Z x Z y
xy < φ(s)ds + ψ(t)dt.
0 0

Si y < φ(x), entonces


Z φ(x)
ψ(t)dt < x(φ(x) − y)
y

y por lo tanto

xy = xφ(x) − x(φ(x) − y)
Z x Z φ(x) Z φ(x)
< φ(s)ds + ψ(t)dt − ψ(t)dt
0 0 y
Z x Z y
= φ(s)ds + ψ(t)dt
0 0

en consecuencia Z Z
x y
xy < φ(s)ds + ψ(t)dt.
0 0

llegando ası́ a lo que se querı́a demostrar ¤

Teorema 21. (Desigualdad de Hölder) Sea (X, F, µ) un espacio de medida,


1 1
f, g ∈ M(X, F, C) y p, q > 1 tales que p
+ q
= 1. Entonces
Z µZ ¶1/p µZ ¶1/q
p q
|f ||g|dµ ≤ |f | dµ |g| dµ . (2.26)
X X X
Cap. 2 Desigualdades 95

Demostración Denotemos por α y β a los factores que están al lado derecho de


(2.26)
µZ ¶1/p µZ ¶1/q
p q
α := |f | dµ , β := |g| dµ .
X X

Si α = 0, entonces f = 0 en casi todas partes, y la desigualdad (2.26) se convierte


en la igualdad trivial 0 = 0. De manera similar se considera el caso cuando g = 0. Si
α > 0, β > 0 y α = ∞ o β = ∞, entonces el lado derecho de (2.26) es ∞, y (2.26) se
cumple de manera trivial.

Consideremos el caso principal cuando α, β ∈ (0, ∞). Denotemos por u y v a las


funciones f y g normalizadas de la siguiente manera
f g
u := , v := .
α β
Entonces
Z Z Z Z
p 1 p q 1
|u| dµ = p |f | dµ = 1, |v| dµ = q |g|q dµ = 1.
X α X X β X

Para todo x ∈ X aplicamos la desigualdad de Young a los números |u(x)| y |v(x)|


|u(x)|p |v(x)|q
|u(x)v(x)| ≤ + ,
p q
luego integramos ambos lados sobre X respecto a la medida µ
Z
1 1
|uv|dµ ≤ + = 1,
X p q
esto es,
Z
|f g|dµ ≤ αβ
X
Z
= |f g|dµ
X
µZ ¶1/p µZ ¶1/q
p q
≤ |f | dµ |g| dµ
X X

llegando al resultado deseado. ¤


Cap. 2 Desigualdades 96

Teorema 22. Sea f 00 : I ⊆ R → R una función absolutamente contı́nua en I 0 tal que


p
f 000 ∈ L[a, b], donde a < b. Si |f 000 |q , q = , es cuasi-convexa en [a, b], para algún
(p − 1)
p > 1, entonces la siguiente desigualdad se cumple:
¯Z b · µ ¶ ¸¯
¯ (b − a) a+b ¯
¯ f (x)dx − f (a) + 4f + f (b) ¯
¯ 6 2 ¯
a
µ "
¶1/p µ ½¯ µ ¶¯ ¾¶1/q #
2−1/p (b − a)4 Γ(p + 1)Γ(2p + 1) ¯ 000 a + b ¯q
≤ máx ¯¯f ¯ , |f 000 (b)|q
¯
48 Γ(3p + 2) 2
µ ¶1/p "µ ½¯ µ ¶¯ ¾¶1/q #
2−1/p (b − a)4 Γ(p + 1)Γ(2p + 1) ¯ 000 a + b ¯q
+ máx ¯¯f ¯ , |f 000 (a)|q
¯
48 Γ(3p + 2) 2

Sacando factor común se tiene que


µ ¶1/p "µ ½ µ ¶ ¾¶1/q
2−1/P (b − a)4 Γ(p + 1)Γ(2p + 1) 000 a + b q 000 q
máx |f | , |f (b)|
48 Γ(3p + 2) 2
µ ½¯ µ ¶¯ ¾¶¸
¯ 000 a + b ¯q
+ máx ¯¯f ¯ , |f (a)|
¯
000 q
2
"µ ½¯ µ ¶¯ ¾¶1/q
2−1/P (b − a)4 ¯ 000 a + b ¯q
= (B(p + 1, 2p + 1)) 1/p
máx ¯¯f ¯ , |f (b)|
¯
000 q
48 2
µ ½¯ µ ¶¯ ¾¶1/q #
¯ 000 a + b ¯q
+ máx ¯¯f ¯ , |f (a)|
¯
000 q
.
2

Demostración: Por el Lema 2 y la desigualdad de Hölder, se tiene que


¯Z b · µ ¶ ¸¯ Z 1
¯ (b − a) a + b ¯
¯ f (x)dx − f (a) + 4f ¯
+ f (b) ¯ ≤ (b − a)4
|p(t)f 000 (ta + (1 − t)b)|dt
¯ 6 2
a 0

por propiedad de valor absoluto


Z Z 1¯ µ ¶¯
4
1
000 (b − a)4 2 ¯¯ 2 1 ¯¯ 000
(b − a) |p(t)f (ta + (1 − t)b)dt| ≤ ¯t t − 2 ¯ |f (ta + (1 − t)b)|dt
0 6 0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2
Cap. 2 Desigualdades 97

usando la desigualdad de Hölder se tiene lo siguiente


Z 1¯ µ ¶¯
(b − a)4 2 ¯¯ 2 1 ¯¯ 000
6 ¯t t − 2 ¯ |f (ta + (1 − t)b)|dt +
0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2
ÃZ 1 · µ ¶¸p !1/p ÃZ 1 !1/q
(b − a)4 2 1 2
≤ t2 −t dt |f 000 (ta + (1 − t)b)|q dt
6 0 2 0
ÃZ · µ ¶¸ !1/p ÃZ !1/q
4 1 p 1
(b − a) 1
+ (t − 1)2 t − dt |f 000 (ta + (1 − t)b)|q dt
6 1
2
2 1
2

como f es cuasi-convexa, y usando la desigualdad de Hermite-Hadamard, se tiene que


Z 1 ½¯ µ ¶¯ ¾
2 ¯ 000 a + b ¯q
000 q ¯
|f (ta + (1 − t)b)| dt ≤ máx ¯f ¯ 000 q
2 ¯ , |f (b)| ,
0

y Z ½¯ µ ¶¯ ¾
1 ¯ 000 a + b ¯q
000 q ¯
|f (ta + (1 − t)b)| ≤ máx ¯f ¯ 000 q
1 2 ¯ , |f (a)|
2

Calculando la integral
Z 1· µ ¶¸p Z 1 µ ¶p
2
2 1 2
2 p 1
t −t dt = (t ) − t dt
0 2 0 2
Z 1 µ ¶p
2
2p 1
= t − t dt
0 2
1
como 0 ≤ t ≤ entonces 0 ≤ 2t ≤ 1 consideremos el siguiente cambio de variable,
2
du
u = 2t entonces 2dt = du y dt =
2
Z 1 ³ ´2p µ ¶p Z 1 2p
u 1 u du u (1 − u)p du
− = 2p
0 2 2 2 2 0 2 2p 2
Z 1
1
= 2p p u2p (1 − u)p du
2 22 0

sumando y restando 1 a los exponentes


Z 1
1 1
3p+1
u(2p+1)−1 (1 − u)(p+1)−1 du = 3p+1 B(2p + 1, p + 1)
2 0 2
1 Γ(2p + 1)Γ(p + 1)
= 3p+1 .
2 Γ(3p + 2)
Cap. 2 Desigualdades 98

Calculando de nuevo la integral


Z 1· µ ¶¸p Z 1 µ ¶p
2 1 2p 1
(t − 1) t − dt = (t − 1) t− dt
1
2
2 1
2
2
1
como 2
≤ t ≤ 1 entonces 0 ≤ 2t − 1 ≤ 1, realizando el cambio de variable
du
2t − 1 = u entonces 2dt = du luego dt =
2
Z 1 µ ¶ 2p µ ¶ p Z 1µ ¶2p ³ ´
u+1 u+1 1 du u−1 u p du
−1 − =
0 2 2 2 2 0 2 2 2
Z 1
1
= 2p p (u − 1)2p up du
2 22 0
Z 1
1
= 3p+1 (u − 1)2p up du
2 0

sumando y restando 1 a los exponentes, como en el caso anterior, se obtiene


Z 1
1 1
(3p+1)
(u − 1)(2p+1)−1 u(p+1)−1 du = (3p+1) B(2p + 1, p + 1)
2 0 2
1 Γ(2p + 1)Γ(p + 1)
= (3p+1)
2 Γ(3p + 2)

luego por definición de p(t), f 000 ∈ L[a, b] y la desigualdad de Hölder


Z 1¯ µ ¶¯
(b − a)4 2 ¯¯ 2 1 ¯¯ 000
6 ¯t t − 2 ¯ |f (ta + (1 − t)b)|dt
0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2
ÃZ 1 · µ ¶¸p !1/p ÃZ 1 !1/q
(b − a)4 2 1 2
≤ t2 −t dt |f 000 (ta + (1 − t)b)|q dt
6 0 2 0
ÃZ · µ ¶¸p ! 1/p ÃZ !1/q
1 1
(b − a)4 1
+ (t − 1)2 t − dt |f 000 (ta + (1 − t)b)|q dt
6 1
2
2 1
2
Cap. 2 Desigualdades 99

resolviendo la integral se tiene lo siguiente


· µÃZ 1 ¶¸p !1/p ÃZ 1 !1/q
(b − a)4 1 2 2
t2 −t dt |f 000 (ta + (1 − t)b)|q dt
6 0 2 0
ÃZ · µ ¶¸p ! 1/p ÃZ !1/q
1 1
(b − a)4 1
+ (t − 1)2 t − dt |f 000 (ta + (1 − t)b)|q dt
6 1
2
2 1
2
µ ¶ µ ¶ ÃZ 1 !1/q
1/p 1/p
(b − a)4 1 Γ(2p + 1)Γ(p + 1) 2
000 q
= |f (ta + (1 − t)b)| dt
6 23p+1 Γ(3p + 2) 0
µ ¶1/p µ ¶1/p ÃZ 1 !1/q
(b − a)4 1 Γ(2p + 1)Γ(p + 1)
+ |f 000 (ta + (1 − t)b)|q dt
6 23p+1 Γ(3p + 2) 1
2
µ ¶ µ ¶ ÃZ 1 !1/q
1/p 1/p
(b − a)4 1 Γ(2p + 1)Γ(p + 1) 2
= |f 000 (ta + (1 − t)b)|q dt
6 23p 2 Γ(3p + 2) 0
µ ¶ µ ¶ ÃZ !1/q
1/p 1/p 1
(b − a)4 1 Γ(2p + 1)Γ(p + 1) 000 q
+ |f (ta + (1 − t)b)| dt
6 23p 2 Γ(3p + 2) 1
2

µ ¶1/p ÃZ 1 !1/q
(b − a)4 2−1/p Γ(2p + 1)Γ(p + 1) 2
= |f 000 (ta + (1 − t)b)|q dt
48 Γ(3p + 2) 0
µ ¶1/p ÃZ 1 !1/q
(b − a)4 2−1/p Γ(2p + 1)Γ(p + 1) 000 q
+ |f (ta + (1 − t)b)| dt
48 Γ(3p + 2) 1
2

como f es cuasi-convexa y por la desigualdad de Hermite-Hadamard se tiene


Z 1 ½¯ µ ¶¯ ¾
2 ¯ 000 a + b ¯q
|f (ta + (1 − t)b)| dt ≤ máx ¯¯f
000 q ¯ , |f (b)|
¯
000 q
0 2

y Z ½¯ µ ¶¯ ¾
1 ¯ 000 a + b ¯q
|f (ta + (1 − t)b)| dt ≤ máx ¯¯f
000 q ¯ , |f (a)|
¯
000 q
1
2
2
Cap. 2 Desigualdades 100

entonces sacando factor común


µ ¶1/p ÃZ 1 !1/q
2−1/p (b − a)4 Γ(2p + 1)Γ(p + 1) 2
000 q
|f (ta + (1 − t)b)| dt
48 Γ(3p + 2) 0
µ ¶1/p ÃZ 1 !1/q
2−1/p (b − a)4 Γ(2p + 1)Γ(p + 1)
+ |f 000 (ta + (1 − t)b)|q dt
48 Γ(3p + 2) 1
2

−1/p 4
µ ¶1/p "Z 1 #
2 (b − a) Γ(2p + 1)Γ(p + 1) 2
= |f 000 (ta + (1 − t)b)|q dt
48 Γ(3p + 2) 0
µ ¶ "µ ½¯ µ ¶¯ ¾¶1/q
1/p
2−1/p (b − a)4 Γ(2p + 1)Γ(p + 1) ¯ 000 a + b ¯q
≤ máx ¯¯f ¯ , |f (b)|
¯
000 q
48 Γ(3p + 2) 2
µ ½¯ µ ¶¯ ¾¶1/q #
¯ 000 a + b ¯q
+ máx ¯¯f ¯ , |f 000 (a)|q
¯
2

llegando a lo que se querı́a demostrar. ¤

2.5.2 Desigualdad de Simpson para funciones Lipschitzianas

En esta sección se presentará la definición y propiedades de las funciones Lipchizianas,


para luego realizar un estudio de la cuadratura de Simpson para este tipo de funciones.

Las funciones Lipschitzianas se le conoce por ese nombre gracias al matemático


Rudolph Lipschitz, quien fué un matemático alemán, y profesor en las universidades de
Breslau y Bonn. Estudió las invariantes diferenciales, las propiedades de los subespacios
de Riemann, las series de Fourier, y la teorı́a de números.

Lipschitz también estaba muy interesado en las cuestiones fundamentales de la in-


vestigación matemática y de la instrucción matemática en las universidades. Reunió sus
estudios sobre estos temas en los dos volúmenes de Análisis de Grundtagen. Hasta en-
tonces un trabajo de este tipo nunca habı́a aparecido en alemán, aunque existı́an tales
libros en francés. El trabajo comienza con la teorı́a de los números enteros racionales y
pasa a las ecuaciones diferenciales y la teorı́a de funciones. La fundación de matemáticas
Cap. 2 Desigualdades 101

también se considera en términos de sus aplicaciones. En el análisis básico, Lipschitz


descubrió una condición que lleva su nombre, que es hoy dı́a tan importantes para prue-
bas de existencia y singularidad como la teorı́a de la aproximación. Si f es una función
definida en el intervalo [a, b], entonces se dice que f satisface la condición de Lipschitz
con el exponente α y el coeficiente M, si para cualquier par de valores x, y en [a, b], la
condición |f (x) − f (y)| ≤ L|x − y|α , con α > 0 se cumple, la cual es una generalización
de la siguiente definición

Definición 14. Se dice que una función f : I → R satisface la condición de Lipschitz


en el intervalo I si para todo x, y ∈ I existe una constante L > 0 tal que

|f (x) − f (y)| < L|x − y|.

La condición se consideró por primera vez por Lipschitz en [38] en su estudio de la


convergencia de la serie de Fourier de una función periódica f.

Observación 9. Cualquier función Lipschitz con L < 1 es, por definición, L-contractiva.
es decir, es aquella que contrae las distancias con una razón de contracción estrictamente
menor que la unidad.

A continuación se darán varios ejemplos de funciones que son Lipschitzianas y otras


que no lo son.

Ejemplo 19. La función f : R → R, f (x) = |x|, es Lipschitz en toda la recta real. Para
demostrarlo basta observar que |f (x) − f (y)| = ||x| − |y|| < 1|x − y| para todo x, y ∈ R.

Ejemplo 20. La funcion f : R → R, f (x) = x2 , no es Lipschitz en toda la recta real.


Lo demostraremos por reducción al absurdo. Supongamos que es Lipschitz en R para
alguna constante L > 0. Entonces, |f (x) − f (y)| < L|x − y|, para todo x, y ∈ R, como
|f (x) − f (y)|
la función es derivable en R, sabemos que lı́m = |f 0 (x)| para todo x, y ∈ R
y→x |x − y|
combinando la desigualdad de la condición Lipschitz con la identidad anterior, obtenemos
Cap. 2 Desigualdades 102

que L > |f 0 (x)| para todo x ∈ R lo cual es imposible, pues la derivada no está acotada:
lı́m |f 0 (x)| = 2 lı́m |x| = ∞.
|x|→∞ |x|→∞

Proposición 5. Sea un I un intervalo y sea f : I → R una función continua en I,


derivable en el int(I) y tal que su derivada es acotada. Entonces f es Lipschitz continua
en I.

Proposición 6. Sea f ∈ C 1 ([a, b]), esto es, f es derivable en [a, b] y f 0 es continua en


[a, b]. Entonces f es Lipschitz continua en [a, b].

Definición 15. (Integral de Riemann-Stieltjes) Dadas g, F : [a, b] → R, si existe


lı́m S(P, g, F ) = I, diremos que la integral Riemann-Stieltjes de g respecto a F en
||p||→0
el intervaloZ existe y vale
Z b I.
b
Notación: gdF = g(x)dF (x).
a a

Observación 10. En el caso particular en que F (x) = x, la definición coincide con la


definición de integral de Riemann en [a, b]

Teorema 23. Sea f : [a, b] → R una función L-Lipchiziana sobre [a, b]. Entonces
¯Z b · µ ¶¸¯
¯ b − a f (a) + f (b) a + b ¯¯ 5
¯ f (x)dx − + 2f ≤ L(b − a)2 .
¯ 3 2 2 ¯ 36
a

Demostración Usando la fórmula de integración por partes de Riemann-Stieltjes se


tiene Z · µ ¶¸ Z b
b
b − a f (a) + f (b) a+b
s(x)df (x) = + 2f − f (x)dx
a 3 2 2 a

donde
 ¢
 x− 5a+b
, x ∈ [ a, a+b ;
6 2
s(x) := £ ¤
 x− a+5b
, x ∈ a+b ,b .
6 2
Cap. 2 Desigualdades 103

En efecto
Z b Z a+b µ ¶ Z b µ ¶
2 5a + b a + 5b
s(x)df (x) = x− df (x) + x− df (x)
a a 6 a+b
2
6
·µ ¶ ¸ a+b ·µ ¶ ¸b Z b
5a + b 2 a + 5b
= x− f (x) + x− f (x) − f (x)dx
6 a 6 a+b a
·µ ¶ µ ¶ µ ¶ 2 ¸
a + b 5a + b a+b 5a + b
= − f − a− f (a)
2 6 2 6
·µ ¶ µ ¶ µ ¶¸ Z b
a + 5b a + b a + 5b a+b
+ b− f (b) − − f − f (x)dx
6 2 6 2 a
· µ ¶ µ ¶¸
3(a + b) − (5a + b) a+b 6a − (5a + b)
= f − f (a)
6 2 6
· µ ¶ µ ¶¸ Z b
6b − (a + 5b) 3(a + b) − (a + 5b) a+b
+ f (b) − f − f (x)dx
6 6 2 a
· µ ¶ µ ¶ ¸
3a + 3b − 5a − b a+b 6a − 5a − b
= f − f (a)
6 2 6
·µ ¶ µ µ ¶¶¸ Z b
6b − a − 5b 3a + 3b − a − 5b a+b
+ f (b) − f − f (x)dx
6 6 2 a
·µ µ ¶¶ µ ¶¸
2b − 2a a+b a−b
= f − f (a)
6 2 6
·µ ¶ µ µ ¶¶¸ Z b
b−a 2a − 2b a+b
+ f (b) − f − f (x)dx
6 6 2 a
µ ¶ µ ¶ Z b
b−a a+b b−a b−a b−a a+b
= f + f (a) + f (b) + f − f (x)dx
3 2 6 6 3 2 a
· µ ¶¸ Z b
b − a f (a) f (b) a+b
= + + 2f − f (x)dx
3 2 2 2 a
· µ ¶¸ Z b
b − a f (a) + f (b) a+b
= + 2f − f (x)dx.
3 2 2 a

Ahora supongamos que ∆n : a = xn0 < xn1 < · · · < xnn−1 < xnn = b es una secuencia
de divisiones con V (∆n ) 7→ 0 cuando n 7→ ∞ donde V (∆n ) := máx (xni+1 − xni ) y
{i∈0,...,n−1}
ξ n ∈ [xni − xni+1 ]. Si p : [a, b] → R es integrable Riemann sobre [a, b] y v : [a, b] → R es
Lipchiziana sobre [a, b], entonces
¯Z b ¯ ¯¯ n−1
X
¯
¯
¯ ¯ ¯ n ¯
¯ ¯
p(x)dv(x)¯ = ¯ lı́m n n
p(ξi )[v(xi+1 ) − v(xi )]¯
¯ ¯v(∆n )7→0 ¯
a i=0
Cap. 2 Desigualdades 104

por definición de valor absoluto


¯Z b ¯ ¯ ¯
¯ ¯ ¯ n−1
X ¯
¯ ¯ ¯ n n n ¯
¯ p(x)dv(x)¯ = ¯ lı́m p(ξi )[v(xi+1 ) − v(xi )]¯
a ¯v(∆n )7→0 ¯
i=0
n−1
X ¯ ¯
¯ v(x n
) − v(x n ¯
)
≤ lı́m |p(ξin )|(xni+1 − xni ) ¯¯ i+1
n n
i ¯
¯
v(∆n )7→0
i=0
x i+1 − x i

como v es Lipschitziana entonces


n−1 ¯ ¯ n−1
X ¯ v(xni+1 ) − v(xni ) ¯¯ X
lı́m |p(ξin )|(xni+1 − xni ) ¯¯ ¯ ≤ lı́m |p(ξin )|(xni+1 − xni )
v(∆n )7→0
i=0
xni+1 − xni v(∆n )7→0
i=0
Z b
= L |p(x)|dx (2.27)
a

realizando el cambio de variable p(x) = s(x), v(x) = f (x) se obtiene


¯Z b ¯ Z b
¯ ¯
¯ ¯
s(x)df (x)¯ ≤ L |s(x)|dx
¯
a a

calculando
Z ¯
Z a+b ¯ Z b ¯ ¯
b ¯ 5a + b ¯¯
2 ¯ a + 5b ¯¯
|s(x)|dx = ¯ ¯
¯x − 6 ¯ dx + a+b ¯x − 6 ¯ dx
a a 2
Z 5a+b µ ¶ Z a+b µ ¶
6 5a + b 2 5a + b
= − x dx + x− dx
a 6 5a+b
6
6
Z a+5b µ ¶ Z b µ ¶
6 a + 5b a + 5b
+ − x dx + x− dx
a+b
2
6 a+5b
6
6

definamos I1 I2 I3 e I4 de la siguiente forma


Z 5a+b µ ¶
6 5a + b
I1 = − x dx
a 6
Z a+b µ ¶
2 5a + b
I2 = x− dx
5a+b
6
6
Z a+5b µ ¶
6 a + 5b
I3 = − x dx
a+b
2
6
Cap. 2 Desigualdades 105

Z b µ ¶
a + 5b
I4 = x− dx
a+5b
6
6
procedemos a resolver I1
Z 5a+b µ ¶ Z 5a+b Z 5a+b
6 5a + b 6 5a + b 6
− x dx = dx − xdx
a 6 a 6 a
¯ 5a+b ¯ 5a+b
5a + b ¯¯ 6 x2 ¯¯ 6
= x¯ − ¯
6 a 2 a
·µ ¶µ ¶ µ ¶ ¸ " µ ¶2 #
5a + b 5a + b 5a + b 1 5a + b a2
= − a − −
6 6 6 2 6 2
µ ¶2 µ ¶ 2
5a + b (5a2 + ab) 1 5a + b a2
= − − +
6 6 2 6 2
2 2
µ ¶
25a + 10ab + b 5a + ab 1 25a + 10ab + b2
2 2
a2
= − − +
36 6 2 36 2
µ 2 2
¶ 2 2
1 25a + 10ab + b 5a + ab a
= − +
2 36 6 2
25a + 10ab + b − 60a − 12ab + 36a2
2 2 2
=
72
2 2
a − 2ab + b
=
72
(a − b)2
=
72

ahora de igual forma


Z a+b µ ¶
2 5a + b
I2 = x− dx
5a+b
6
6
Cap. 2 Desigualdades 106

por lo tanto
Z a+b µ ¶ Z a+b Z a+b
2 5a + b 2 5a + b
2
x− dx = xdx − dx
5a+b
6
6 5a+b
6
5a+b
6
6
¯ a+b ¯ a+b
x ¯¯2 2
5a + b ¯¯ 2
= − x¯
2 ¯ 5a+b 6 5a+b
" µ6 ¶2 µ
6
¶2 #
1 a+b 1 5a + b
= −
2 2 2 6
·µ ¶µ ¶ µ ¶µ ¶¸
5a + b a+b 5a + b 5a + b
− −
6 2 6 6
· 2 2
¸ · ¸
1 (a + b) 1 (5a + b) 1 2 2 1 2
= − − (5a + 5ab + ab + b ) − (5a + b)
2 4 2 36 12 36
· ¸ · ¸
1 2 1 2 1 2 2 1 2
= (a + b) − (5a + b) − (5a + 6ab + b ) − (5a + b)
8 72 12 36
1 1 1 1
= (a + b)2 − (5a + b)2 − (5a2 + 6ab + b2 ) + (5a + b)2
8 72 12 µ 36 ¶
2
1 2 1 2 2 2(5a + b) − (5a + b)2
= (a + b) − (5a + 6ab + b ) +
8 12 72
2
1 1 (5a + b)
= (a + b)2 − (5a2 + 6ab + b2 ) +
8 12 72
9(a + b) − 6(5a + 6ab + b ) + (5a + b)2
2 2 2
=
72
9(a2 + 2ab + b2 ) − 6(5a2 + 6ab + b2 ) + (25a2 + 10ab + b2 )
=
72
9a + 18ab + 9b − 30a − 36ab − 6b2 + 25a2 + 10ab + b2
2 2 2
=
72
4a2 − 8ab + 4b2
=
72
4(a − 2ab + b2 )
2
=
72
(a − b)2
= .
18
Cap. 2 Desigualdades 107

continuando con I3
Z a+5b µ ¶ Z a+5b Z a+5b
6 a + 5b 6 a + 5b 6
− x dx = dx − xdx
a+b
2
6 a+b
2
6 a+b
2
¯ a+5b ¯ a+5b
a + 5b ¯¯ 6 x ¯ 6
2
= x¯ − ¯¯
6 a+b 2 a+b
· µ2 ¶ 2 µ ¶¸
a + 5b a + 5b a + 5b a + b
= −
6 6 6 2
" µ ¶2 µ ¶2 #
1 a + 5b 1 a+b
− −
2 6 2 2
· ¸
1 2 1 2 2
= (a + 5b) − (a + ab + 5ab + 5b )
36 12
· ¸
1 2 1 2
− (a + 5b) − (a + b)
72 8
1 1 1 1
= (a + 5b)2 − (a2 + 6ab + 5b2 ) − (a + 5b)2 + (a + b)2
36 12 72 8
2
1 1 2(a + 5b) − (a + 5b)2
= (a + b)2 − (a2 + 6ab + 5b2 ) +
8 12 72
9(a + b)2 − 6(a2 + 6ab + 5b2 ) + (a + 5b)2
=
72
9(a + 2ab + b ) − 6(a2 + 6ab + 5b2 ) + (a2 + 10ab + 25b2 )
2 2
=
72
9a2 + 18ab + 9b2 − 6a2 − 36ab − 30b2 + a2 + 10ab + 25b2
=
72
2 2
4a − 8ab + 4b
=
72
4(a2 − 2ab + b2 )
=
72
2
(a − b)
= .
18
Cap. 2 Desigualdades 108

Procediendo igualmente con I4


Z b · µ ¶¸ Z b Z b
a + 5b a + 5b
x− dx = xdx − dx
a+5b
6
6 a+5b
6
a+5b
6
6
¯b ¯b
x2 ¯¯ a + 5b ¯¯
= − x¯
2 ¯ a+5b 6 a+5b
" 6
µ ¶2 # ·µ
6
¶ µ ¶µ ¶¸
1 2 1 a + 5b a + 5b a + 5b a + 5b
= b − − b−
2 2 6 6 6 6
· 2 ¸ · ¸
b 1 1 1
= − (a + 5b)2 − (ab + 5b2 ) − (a + 5b)2
2 72 6 36
2
b 1 1 1
= − (a + 5b)2 − (ab + 5b2 ) + (a + 5b)2
2 72 6 36
b2 1 (a + 5b)2
= − (ab + 5b2 ) +
2 6 72
36b − 12ab − 60b + a + 10ab + 25b2
2 2 2
=
72
a2 − 2ab + b2
=
72
(a − b)2
=
72

luego se tiene que


Z b
|s(x)|dx = I1 + I2 + I3 + I4
a
(a − b)2 (a − b)2 (a − b)2 (a − b)2
= + + +
72 18 18 72
2 2
2(a − b) 2(a − b)
= +
72 18
(a − b)2 (a − b)2
= +
36 9
(a − b) + 4(a − b)2
2
=
36
5(a − b)2
=
36

ahora usando la desigualdad (2.27)


¯Z b ¯ Z b
¯ ¯
¯ ¯
s(x)df (x)¯ ≤ L |s(x)|dx
¯
a a
Cap. 2 Desigualdades 109

y la identidad
Z b · µ ¶¸ Z b
b − a f (a) + f (b) a+b
s(x)df (x) = + 2f − f (x)dx
a 3 2 2 a

se deduce el resultado deseado


¯Z b · ¸¯
¯ b − a f (a) + f (b) a + b ¯¯ 5
¯ f (x)dx − + 2f ( ) ¯ ≤ L(b − a)2 . ¤
¯ 3 2 2 36
a

Corolario 2. Supongamos que f : [a, b] → R es una función diferenciable cuya derivada


está acotada en (a, b), es decir

kf 0 k∞ := sup |f 0 (x)| ≤ ∞
x∈(a,b)

entonces se tiene

¯Z b · µ ¶¸¯
¯ b − a f (a) + f (b) a + b ¯
¯ f (x)dx − + 2f ¯ ≤ 5 kf 0 k∞ (b − a)2 . (2.28)
¯ 3 2 2 ¯ 36
a

f (a) − f (b)
Demostración: Por definición f 0 = lı́m , por hipótesis, como la derivada
a→b a−b
f (a) − f (b)
es acotada en (a, b) existe L ∈ R finito tal que ≤ L ası́ mismo
a−b
f (a) − f (b) ≤ L|a − b| es decir, f es una función Lipschitz, como f 0 es acotada, la misma
tiene supremo, por lo que f (a) − f (b) ≤ L|a − b| ≤ sup |f 0 ||a − b| por lo tanto

L|a − b| ≤ ||f 0 ||∞ |a − b| (2.29)

ası́ por (2.29) y el teorema anterior, se tiene que


¯Z b · µ ¶¸¯
¯ b − a f (a) + f (b) a + b ¯
¯ f (x)dx − + 2f ¯ ≤ 5 ||f 0 ||∞ (b − a)2 . ¤
¯ 3 2 2 ¯ 36
a

Corolario 3. Sea f : [a, b] → R una función Lipchiziana sobre [a, b] e Ih una partición de
[a, b]. Entonces se tiene por la desigualdad de Simpson y la fórmula (2.15) que el término
resto Rs (f, Ih ) satisface la estimación:
n−1
5 X 2
|Rs (f, Ih )| ≤ L h. (2.30)
36 i=0 i
Cap. 2 Desigualdades 110

Comentario 1. Si la función f : [a, b] → R no es cuatro veces diferenciable ni la cuarta


derivada es acotada en (a, b), entonces no podemos aplicar la estimación clásica en la
fórmula de Simpson usando la cuarta derivada.

Se dan una clase de funciones que son Lipschitz y tienen cuarta derivada en el
intervalo dado. Sea fp : [a, b] → R, fp := (x − a)p donde p ∈ (3, 4). Entonces como f es
diferenciable podemos asegurar que

fp0 := p(x − a)p−1 , x ∈ (a, b)

es la constante de lipchizidad, procederemos a comprobarlo por definición de función


Lipschitz se tiene que

|fp (b) − fp (a)| = | − (b − a)p |

= (b − a)p

= (b − a)(b − a)p−1

≤ (b − a)(b − a)p−1 p

= (b − a)L

y
p(p − 1)(p − 2)(p − 3)
fp4 (x) = , x ∈ (a, b).
(x − a)4−p
Se puede notar que fp es Lipchiziana con la constante

L = p(b − a)p−1 < ∞

pero
lı́m fp(4) = +∞.
x7→a+

por lo tanto se demuestra que no se puede usar la desigualdad de Simpson, ya que la


función no está acotada.
Cap. 2 Desigualdades 111

2.6 Aplicaciones para Medias Especiales


En esta sección se presentarán algunas aplicaciones para medias especiales; que po-
drı́an considerarse extensiones de la media aritmética, media geométrica, media armónica,
media logarı́tmicas y media logarı́tmica generalizadas para los números reales positivos.

Definición 16. Consideremos R+ el conjunto de los números reales positivos. Una fun-
ción continua de dos variables, M : R2 → R es una medida sobre R+ si

mı́n{x, y} ≤ M (x, y) ≤ máx{x, y} x, y ∈ R+ .

2.6.1 Media Aritmética

La media aritmética denotada por A (también llamada promedio o simplemente


media) de un conjunto finito de números, es el valor caracterı́stico de una serie de datos
cuantitativos, objetos de estudio que parte del principio de la esperanza matemática, y
se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos.
Expresada de forma más intuitiva, podemos decir que la media aritmética es la can-
tidad total de la variable distribuida en partes iguales entre cada observación.
Una de las limitaciones de la media aritmética es que es una medida muy sensible
a los valores extremos; valores muy grandes tienden a aumentarla, mientras que valores
muy pequeños tienden a reducirla, lo que implica que puede dejar de ser representativa
de la población.
La media aritmética se calcula sumando todos los componentes y dividiendo el resul-
tado entre el número de componentes. El resultado es la media aritmética.
Dados los números a, b > 0 la media aritmética viene dada por

a+b
A = A(a, b) = .
2

Algunas de las propiedades de la media aritmética son las siguientes


Propiedades
Cap. 2 Desigualdades 112

1. La suma de las desviaciones con respecto a la media aritmética es cero.

2. La media aritmética de los cuadrados de las desviaciones de los valores de la vari-


ables con respecto a una constante cualquiera se hace mı́nima cuando dicha con-
stante coincide con la media aritmética.

3. Si a todos los valores de la variable se le suma una misma cantidad, la media


aritmética queda aumentada en dicha cantidad.

4. Si todos los valores de la variable se multiplican por una misma constante, la media
aritmética queda multiplicada por dicha constante.

5. La media aritmética de un conjunto de números positivos siempre es igual o superior


a la media geométrica es decir
√ a+b
ab ≤ .
2

6. La media aritmética está comprendida entre el valor máximo y el valor mı́nimo del
conjunto de datos
a+b
mı́n{a, b} ≤ ≤ máx{a, b}.
2

2.6.2 Media Armónica

La media armónica, denotada por H, de una cantidad finita de números es igual al


recı́proco, o inverso, de la media aritmética de los recı́procos de dichos valores.
Ası́, dados números a, b positivos la media armónica será igual a

2
H= 1 .
a
+ 1b

La media armónica es una de las tres medias de Pitágoras. Para todos los conjuntos
de datos positivos que contienen al menos un par de valores distintos, la media armónica
es siempre la menor de las tres medias, mientras que la media aritmética es siempre la
mayor de las tres y la media geométrica siempre está en el medio de ellas dos.
Cap. 2 Desigualdades 113

Algunas de las propiedades de la media armónica son las siguientes


Propiedades

1. La inversa de la media armónica es la media aritmética de los inversos de los valores


de la variable.

2. Siempre se puede pasar de una media armónica a una media aritmética transfor-
mando adecuadamente los datos.

3. La media armónica siempre es menor o igual que la media aritmética, ya que para
cualesquiera numeros reales positivos a, b > 0

2 a+b
1 1 ≤ .
a
+ b
2

2.6.3 Media Geométrica

La media geométrica denotada por G, de ciertos números positivos a, b, es la raı́s


cuadrada del producto de dichos números, es recomendado para datos de progresión
geométrica, para promediar razones, interés compuesto y números ı́ndices, el cual viene
dado de la siguiente manera


G= ab.

Relación con la media aritmética de logaritmos

Se puede obtener el mismo resultado de la media geométrica, usando el método


que involucra logaritmos. Mediante el uso de identidades logarı́tmicas para transformar
la fórmula, las multiplicaciones se pueden expresar como una suma, y las potencias como
una multiplicación.

à n !1/n " n #
Y 1X
ai = exp ln ai .
i=1
n i=1
Cap. 2 Desigualdades 114

Una de las aplicaciones de la media geométrica es el crecimiento proporcional, donde se


verifica que la media geométrica es más apropiada que la media aritmética para describir
el crecimiento proporcional y el crecimiento exponencial. En temas de negocios, la media
geométrica de crecimiento, es conocida como tasa de creciemiento anual compuesta.
Algunas propiedades de esta media son las siguientes:

Propiedades

1. El logaritmo de la media geométrica es igual a la media aritmética de los logaritmos


de los valores de la variable.

2. La media geométrica de un conjunto de números positivos es siempre menor o igual


que la media aritmética
√ a+b
ab ≤ .
2

2.6.4 Media Logarı́tmica

La media logarı́tmica denotada por L, de número positivos a, b, está definido por

xa − b
L(a, b) = , a 6= b.
ln a − ln b

L(a, a) = a.

De esta manera L es simétrica en a y b y continua en a = b.


Recientemente ha sido motivo de intensas investigaciones ya que la media log-
arı́tmica tiene aplicaciones importantes en la fı́sica, economı́a e incluso la metereologı́a.
(Ver [33], [46], [47]). Kählig y Matkowski estudia-ron una variante de la ecuación fun-
cional de Jensen que implica la media logarı́tmica, el cual aparece en un problema de
conducción del calor.
Propiedades
Cap. 2 Desigualdades 115

1. La media logarı́tmica separa a la media geométrica y a la media aritmética.

G(x, y) ≤ L(x, y) ≤ A(x, y). (V er[11]).

2. Si x y y son números positivos, entonces


Y
L(x, y) = αm (x, y)
m=1

x2−m + y 2−m
donde αm (x, y) = . (Ver [11])
2
3. La media logarı́tmica también puede ser representada mediante la integral de la
siguiente forma (Ver [44])
Z 1
L(x, y) = xt y 1−t dt.
0

De igual manera la diferencia de temperatura de media logarı́tmica es usada


para determinar la fuerza que impulsa la transferencia de calor en el sistema de flujo,
particularmente en intercambio de calor.
Sabemos que Lp es monótona no decreciente con p ∈ R definiendo a L−1 := L y
L0 := I. En particular, se tiene las siguientes desigualdades

H ≤ G ≤ L ≤ I ≤ A.

En lo que sigue, haciendo uso del Teorema 23 mostraremos nuevas desigualdades que
fueron mencionadas anteriormente:
1. Sea f : [a, b] → R (0 < a < b), f (x) = xp , p ∈ R\{−1, 0}; entonces

Z b
1
f (x)dx = Lp (a, b)
b−a a

µ ¶
a+b
f = Ap (a, b),
2
Cap. 2 Desigualdades 116

f (a) + f (b)
= A(ap , bp ),
2
donde

 pbp−1 , si p ≥ 1;
||f 0 ||∞ = δp (a, b) :=
 |p|ap−1 , si p ∈ (−∞, 1)\{−1, 0}.

Usando la desigualdad (2.28) se tiene

¯ ¯
¯ p ¯
¯Lp (a, b) − A(a , b ) − A (a, b)¯ ≤ 5 δp (a, b)(b − a).
1 p p 2 p
¯ 3 3 ¯ 35

2. Sea f : [a, b] → R (0 < a < b), f (x) = x1 ; entonces

Z b
1
f (x)dx = L−1 (a, b),
b−a a

µ ¶
a+b
f = A−1 (a, b).
2

f (a) + f (b) 1
= H −1 (a, b), ||f 0 ||∞ = .
2 a2
Usando la desigualdad (2.28) se obtiene

5 b−a
|3HA − LA − 2LH| ≤ . LAH.
12 a2
3. Sea f : [a, b] → R (0 < a < b), f (x) = ln x, entonces

Z b
1
f (x)dx = ln I(a, b),
b−a a

µ ¶
a+b
f = ln A(a, b),
2

f (a) + f (b) 1
= ln A(a, b), ||f 0 ||∞ = .
2 a
Cap. 2 Desigualdades 117

Usando la desigualdad (2.28) se tiene que

¯ · ¸¯ µ ¶
¯ I ¯ 5 b − a
¯ln ¯≤ .
¯ G1/3 A2/3 ¯ 36 a
Observación 11. Otras medias de gran importancia y utilidad son la media de Stolarsky
y la media de Ginni, la cual mencionaremos a continuación (Ver [54],[55]):
a) Media Stolarsky

Consideremos r, s ∈ R y sean a, b > 0. La media Stolarsky denotada por Er,s (a, b) de


orden (r, s) de a, b con a 6= b se define como
 µ s s


 r b − a

 . r , rs(r − s) 6= 0;

 sµ b − ar ¶

 r r
 exp − 1 + a ln a − b ln b ,

r = s 6= 0;
r r r
Er,s = µ ¶a − b

 1 b −ar r

 . , r 6= 0, s = 0;

 r ln b − ln a


 √ab,

r = s = 0.

con Er,s (a, a) = a.


b) Media Ginni
Consideremos r, s ∈ R y sean a, b > 0. La media Ginni denotada por Gr,s (a, b) de orden
(r, s) de a, b con a 6= b se define como
 µ ¶1/(s−r)

 as + bs

 , r 6= s;

 arµ+ br ¶
Gr,s (a, b) = ar ln a + br ln b
 exp , r = s 6= 0;

 ar + br

 √
 ab, r = s = 0.
CONCLUSIONES Y RECOMENDACIONES

En este trabajo especial de grado se realizó un estudio sobre la noción de funciones con-
vexas; basado en algunas de sus propiedades de regularidad y diferenciabilidad; además
de sus resultados tales como la desigualdad de Jensen (para el caso discreto y el caso
continuo), la desigualdad de Hermite-Hadamard y el Teorema del Sandwich.

Se estudiaron las funciones cuasi-convexas como un caso particular de las funciones


convexas, destacando algunas caracterizaciones y genera-lizaciones tales como que toda
función convexa es cuasi-convexa, pero el recı́proco no siempre es cierto, también pudimos
verificar las distintas operaciones con funciones convexas, cuasi-convexas y Teorema del
Sandwich.

Luego como punto neurálgico de este trabajo, se estudió la desigualdad de Simpson


y los distintos resultados, conocidos en la literatura para algunos espacios de funciones,
como lo es para funciones de variación acotada con primera y segunda derivada el cual
lo demostró S. S. Dragomir en el año 1999.

Se desarrolló la Desigualdad de Simpson para funciones cuasi-convexas, con tercera

118
Conclusiones y Recomendaciones 119

derivada.

Finalmete se realizó un estudio de la estimación del término residuo para la fórmu-


la de cuadratura de Simpson sobre funciones Lipschitzianas. Además utilizando dichos
resultados se presentaron algunas aplicaciones para medias especiales.

En el desarrollo de las investigaciones de este Trabajo Especial de Grado han surgido


diversos problemas, posiblemente problemas abiertos; a conti-nuación expondremos una
selección de aquellos que resultan más relevantes en el contexto de la tesis esperando que
determine futuras investigaciones:

1 Estudiar las posibilidad de conseguir estimaciones del error de la aproximación de


la desigualdad de Simpson, donde la tercera derivada es una:

1.1 Función de variación acotada generalizada en el sentido de Wiener, Riesz,


Young, Waterman, Koremblum, Schramm, etc.

1.2 Funciones fuertemente convexas o cóncavas con módulo c, fuertemente cuasi-


convexas o cuasi-cóncavas con módulo c, y fuertemente cóncava o convexa
conjunto valuada con módulo c.

2 Estudiar el comportamiento de las posibles estimaciones dadas en el punto anterior


para obtener aplicaciones en las distintas medias especiales vistas en el capı́tulo 2.
BIBLIOGRAFÍA

[1] M. Alomari, M. Darus, On some inequalities Simpson-type via quasi-convex function


with applications, Tran. J. Math. Mech., 2 (2010), 15-24.

[2] M. Alomari, M. Darus, U. S. Kirmaci, Refinements of Hadamard-type inequalities


for cuasi-convex functions with applications to trapezoidal formula and to special
means, Computers an Mathematics with applications, 59 (2010), 225-232.

[3] M. Alomari, S. Hussain, Two inequalities of Simpson type for quasi-convex functions
and applications, Applied Mathematics E-Notes, 11 (2011), 110-117.

[4] K. J. Arrow, K. J. Enthoven, Quasi-concave programming, Econometrica, 29 (1961)


779-800.

[5] K. Baron, J. Matkowski, K. Nikodem, A sandwich with convexity, Math. Pannonica


5/1 (1994), 139-144.

[6] E. F. Beckenbach, R. H. Bing, On generalized convex functions, Trans. Amer. Math.


Soc. 58 (1945), 220-230.

[7] M. Besenyei, Zs Páles, Hadamard-type inequalities for generalized convex functions,


Math Inequal. Appl 6/3 (2003), 379-392.

120
Bibliografı́a 121

[8] F. Bombal, La cuadratura del cı́rculo: Historia de una obsesión, Rev. Real Acad.
Exact. Fis. Nat. (Esp). Vol. 105, N◦ 2, 241-258. (2012).

[9] C. B. Boyer, A History of Mathematics, 2nd ed. rev. by Uta C. Merzbach, New York,
Wiley 1989.

[10] R. L. Burden, J. Douglas Faires, Análisis numérico, Thomson Learning, 2014.

[11] B. C. Carlson, The logarithmic mean. Am Math monthly 79, 615-618 (1972).

[12] D. Cruz-Uribe, C. J. Neugebauer, Sharp error bounds for the trapezoidal rule and
Simpson’s rule, Journal of inequalities in pure and applied mathematics, Vol. 3, Issue
4, Article 49, 2002.

[13] S. S. Dragomir, On Simpson’s quadrature formula for lipchitzian mappings and ap-
plications, Soochow Journal of Mathematics, Vol. 25, No.2 (1999) 175-180.

[14] S. S. Dragomir, On Simpson´s quadrature formula for mappings of bounded variation


and applications, Tamkang J. Math., 30(1)(1999), 53-58.

[15] S. S. Dragomir, C. E. M. Pearce, Selected Topics on Hermite-Hadamard In-


equalities and applications, RGMIA Monographs, Victoria University, 2002.(ON-
LINE:HTTP://rgmia.uv.edu..au/monographs/).

[16] S. S. Dragomir, J. E. Pecãric, S. Wang, The unified treatment of trapezoid, Simp-


son and Ostrowski type inequalities for monotonic mappings and applications, J. of
Inequal. Appl., 31(2000), 61-70.

[17] S. S. Dragomir, R. P. Agarwal, P. Cerone, On Simpson’s inequality and applications,


J. of Inequal. Appl., 5 (2000), 533-579.

[18] S. S. Dragomir, Th. M. Rassias, (Eds) Ostrowski type inequalities and applications
in numerical integration, Kluwer Academic Publishers, Dordrecht, Boston, London,
2002.
Bibliografı́a 122

[19] B. C. Escobar, Algunos Teoremas de Separación de Funciones, Tesis de Grado, Uni-


versidad Nacional Abierta, Vicerectorado Académico, Caracas, 2001.

[20] W. Fenchel, convex cones, sets and functions,(mimeographed lecture notes) Princeton
University Press, Princeton, New Jersey, 1953.

[21] I. Fedotov, S. S. Dragomir, An inequality of Ostrowski type and its applicationn


for Simpson´s rule and special means, Preprint, RGMIA Res. Rep. Coll., 2 (1999),
13-20. http://matilda, vu.edu.au/rgmia.

[22] B. De Finetti, Sulle stratificazioni convesse, Annali di Matematica Pura ed Applicata,


[4]30 (1949), 173-183.

[23] F. Garcı́a, A. Nevot, Métodos numéricos, Universidad Pontificia de Comillas,


Madrid, 1997.

[24] A. Ghizzetti, A. Ossicini, Quadrature formulae, International series of numerical


mathematics, Vol. 13, Birkhãuser Verlag Basel-Stutgart, 1970.

[25] H. J. Greenberg, W. P. Pierskalla, A Review of quasi-convex functions, Reprinted


from operations research, Vol. 19, No. 7, 1971.

[26] J. González, J. Ortega, Cálculo V (Análisis Numérico), Universidad Nacional Abier-


ta, Caracas, 1984.

[27] J. Hadamard, Étude sur les propriétés des fonctions entiéres et en particulier d’une
fonction considérée par Riemann, J. Math. Pures Appl. 58 (1893), 171-215.

[28] G. H. Hardy, J. E. Littlewood, G. Polya, Inequalities, Cambridge, Mathematical


Library, 2nd Edition, 1952, Reprinted 1988.

[29] P. J. H. Herrera, La historia del problema isoperimétrico clásico con geometrı́a ele-
mental, La Gaceta de la RSME, Vol. 15, (2012) 335-354.

[30] O. Hölder, Über einen Mittelwertsatz, Nachr. Ges. Wiss. Göettingen,(1889), 38-47.
Bibliografı́a 123

[31] J. L. Jensen, Om konvese Funktioner og Uligheder imellem Middlevaerdier, Nyt


Tidsskr. Math. 16B (1905), 49-69.

[32] J. L. Jensen, Sur les fonctions convexes et les inégalités entre les valeurs moyennes.
Acta Math. 30 (1906), 175-193.

[33] P. Kahlig, J. Matkowski, Functional Equations involving the logarithmic mean. Z.


Angew Math Mech 76(7), 385-390.

[34] D. Kincaid, W, Cheney,Análisis Numérico, Addison-Wesley Iberoamericana, Willm-


ington, 1994.

[35] P. K. Kythe, M. R. Schäferkotter, Handbook of computational methods for integra-


tion, Chapman and Hall/CRC. 2005.

[36] M. Kuczma, An Introduction to the Theory of Functional Equations and Inequalities.


Cauchy’s Equation and Jensen’s Inequality PWN-Uniwersytet Slaski, Warszawa-
Kraków-Katowice, 1985.

[37] G. F. Kuncir, Algorithm 103: Simpson’s Rule Integrator, Communications of the


ACM, Vol. 5, (1962) 347.

[38] R. Lipschitz, De explicatione per series trigonometricas isttuenda functionum unius


variablis arbitrarium, et praecipue earum, quae per variablis spatium finitum valorum
maximorum et minimorum habent infinitum disquisitio, J. Reine Angew. Math, 63
(1864) 296-308.

[39] N. Merentes, N. Nikodem, Remarks on strongly convex functions, Aequations Math-


ematicae, no.1-2, 80 (2010), 193-199.

[40] D. S. Mitrivic, I. B. Lackovic, Hermite and convexity, Aequationes Math. 28 (1985),


229-232.
Bibliografı́a 124

[41] C. P. Nicculescu, L. E. Person, Convex Functions and their Applications, A Contem-


porary Approach CMS Books in Mathematics vol. 23, Springer-Verlag, New York,
2006.

[42] J. Nieto, Una demostración sencilla y elemental de la desigualdad de Young, Revista


Colombiana de Matemáticas, (1974) 177-182.

[43] K. Nikodem, Zs. Páles, Generalized convexity and separation theorems, J. Conv.
Anal. 14/2 (2007), 239-247.

[44] C. E. M. Pearce, J. Pecaric, V. Simic On Weighted generalized logarithmic means


University of Houston, vol. 24, No. 3 (1998).

[45] J. Pecaric, S. Varosanec, A note of Simpsons inequality for functions of bounded


variation, Tamkang J. Math (2000), 239-242.

[46] A. O. Pittenger, The logarithmic mean i n variables. Am math Monthly. 92(2),


99-104 (1985).

[47] G. Pólya, G. Szego, Isoperometric inequalities in mathematical physics. Princeton


University, Press. Princeton (1951).

[48] H. R. Romero, Funciones Convexas, Trabajo Especial de Grado, Universidad Na-


cional Abierta (1999).

[49] G. Roa, Funciones Fuertemente Convexas y Fuertemente Midconvexas, Trabajo Es-


pecial de Grado Universidad Central De Venezuela (2011).

[50] W. F. Rob, K. Nikodem, Z. Páles, Separation by monotonic functions Mathematica


Pannonica 7/2 (1996), 191-196.

[51] A. W. Roberts, D. E. Varberg, Convex Functions, Academic Press, New York-


London, 1973.
Bibliografı́a 125

[52] J. M. Quesada, C. Sánchez, J. Jódar, J. Martı́nez, Análisis y métodos numéricos,


Publicaciones de la Universidad de Jaén, Jaén, 2004.

[53] E. Set, M. E. Özdemir, M. Z. Sarikaya, On New Inequalities of Simpson’s type for


cuasi-convex functions with applications, Tamkang Journal Of Mathematics, Vol. 43,
No. 3, (2012), 357-364.

[54] K. B. Stolarsky, Generalizations of the logarithmic mean, Math. Mag. 48 (1975),


87-92.

[55] K. B. Stolarsky, The power and generalized logarithmic means, Amer. Math. Month-
ly, 87 (1980), 545-548.

[56] E. Sülly, D. Mayers, An Introduction to Numerical Analysis, University of Oxford,


2003.

[57] W. H. Young, On classes of Summable Functions and their Fourier Series Preceed-
ings, Series B, No. 581, 1912.

También podría gustarte