Maestromate2.0 05.19.15

UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS
ESCUELA DE MATEMÁTICA
Funciones Convexas,
Cuasi-Convexas, Lipschitz y la
Desigualdad de Simpson
Trabajo Especial de Grado presentado ante la

ilustre Universidad Central de Venezuela por
el Br. Jesús E. Materano C. para optar al
tı́tulo de Licenciado en Matemática.
Tutor: Dr. Nelson J. Merentes D.
Caracas, Venezuela
Mayo, 2015
ii
Nosotros, los abajo firmantes, designados por la Universidad Central de Venezuela

como integrantes del Jurado Examinador del Trabajo Especial de Grado titulado
“Desigualdad de Simpson para Funciones Cuasi Convexas y Funciones Lips-
chitzianas”, presentado por el Br. Jesús E. Materano C., titular de la Cédula de Iden-
tidad 17.147.241, certificamos que este trabajo cumple con los requisitos exigidos por
nuestra Magna Casa de Estudios para optar al tı́tulo de Licenciado en Matemática.
Dr.Nelson Merentes
Tutor
Dr. José Luis Sánchez

Jurado
Dr. Hugo Leiva

Jurado
iii
Dedicado primeramente a Dios, y a mi familia, pues con su ayuda es que este trabajo
pasó de ser un sueño, a una meta realizada.
AGRADECIMIENTOS
Quiero agradecer primeramente a Dios, pues sin Él, este trabajo no hubiese sido posi-
ble, como dice su palabra Juan 15:5 “...Separados de mı́ nada podéis hacer” y 1 Tesaloni-
censes 5:18 “Dad gracias en todo, porque ésta es la voluntad de Dios para con vosotros
en Cristo Jesús”.
A mis padres, Yudith Chique y Néstor Materano y hermanos, Massiel y Néstor David,
que han sido apoyo incondicional durante el trayecto de la licenciatura, gracias mami,
papá y hermanos.
A mi apreciada “Casa que vence las sombras” la UCV por abrirme sus puertas, y
llenarme de conocimientos y vivencias inolvidables.
Al Profesor Nelson Merentes, tutor de este trabajo, por su valioso apoyo, colaboración,
guı́a y paciencia durante la elaboración de este trabajo.
A ti Jackdin Hernández, porque fuiste motor principal para empezar, continuar y
finalizar esta tesis, gracias flaquita. TAMDLQP.
A la señorita Mejı́a, Mariita y Ronaldys, quienes me prestaron su valiosa colaboración
con la búsqueda de la bibliografı́a, escritura, y conocimientos básicos de LATEX, sin
olvidar los momentos agradables y cómicos que vivimos.
A todo el personal del Banco Central de Venezuela por su gran ayuda y colaboración.
Al “Topo-Medida team” la señorita Daniella Fuentes, y el Sr. Ivan Zea por esos dı́as,
iv
Agradecimientos v
esas noches, fines de semanas, y conocimientos compartidos que vivimos durante gran
parte de la carrera.
También quiero agradecer a Gari Roa, Leonardo Prato, Alejandro Quintero, Irving
Márquez, Sahid Leal, Yarot Avendaño por los gratos momentos vividos en la facultad y
fuera de ella.
A todos GRACIAS TOTALES!!!
ÍNDICE GENERAL
1 Preliminares 12
1.1 Funciones Convexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.1.1 Continuidad y Diferenciabilidad . . . . . . . . . . . . . . . . . . . 22
1.1.2 Teorema de separación para funciones Convexas (Teorema del
Sandwich) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.1.3 Desigualdad de Jensen . . . . . . . . . . . . . . . . . . . . . . . . 36
1.1.4 Desigualdad de Tipo Hermite-Hadamard . . . . . . . . . . . . . . 39
1.2 Funciones Cuasi-Convexas . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.2.1 Teorema de Separación para Funciones Cuasi-Convexas (Teorema
del Sandwich). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.3 Operaciones con Funciones Convexas . . . . . . . . . . . . . . . . . . . . 53
2 Desigualdad de Simpson 62
2.1 Interpolación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.2 Integración numérica y cuadratura . . . . . . . . . . . . . . . . . . . . . 63
2.3 Fórmulas de integración de tipo interpolatorio . . . . . . . . . . . . . . . 65
2.4 Fórmulas básicas de integración numérica . . . . . . . . . . . . . . . . . . 66
2.5 Desigualdad de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6
Agradecimientos 7
2.5.1 Desigualdad de Simpson para Funciones Cuasi-Convexas . . . . . 84

2.5.2 Desigualdad de Simpson para funciones Lipschitzianas . . . . . . 100
2.6 Aplicaciones para Medias Especiales . . . . . . . . . . . . . . . . . . . . . 111
2.6.1 Media Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
2.6.2 Media Armónica . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
2.6.3 Media Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . 113
2.6.4 Media Logarı́tmica . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Conclusiones y Recomendaciones 118
Bibliografı́a 120
INTRODUCCIÓN
Este Trabajo Especial de Grado, está enmarcado en una de las lı́neas de investigación
que concurren en el seminario permanente que se realiza en la Facultad de Ciencias de
la Universidad Central de Venezuela.
El trabajo es de carácter expositivo e intradisciplinar, ya que en él, participan
diferentes nociones y tópicos matemáticos tales como: convexidad, variación acotada,
interpolación de polinomios, cuadraturas, integración numérica y otros. El objetivo prin-
cipal del Trabajo Especial de Grado es exponer resultados sobre la desigualdad de
Simpson para funciones convexas, cuasi-convexas y Lipschitz.
En análisis numérico, la regla o método de Simpson, nombrada ası́ en honor
a Thomas Simpson (y a veces llamada regla de Kepler), es un método de integración
numérica para obtener el valor aproximado de integrales definidas; especificamente es la
aproximación:
Z b · µ ¶ ¸
b−a a+b
f (x)dx ≈ f (a) + 4f + f (b) .
a 6 2
La fórmula fué utilizada por primera vez por Evangelista Torricelli (1608-1647),
pero debe su nombre al matemático Thomas Simpson (1710-1761), corresponde a la
regla del tonel que el astrónomo y matemático Johannes Kepler (1571-1630), ya habı́a
formulado en 1615.
8
Introducción 9
Uno de los resultados mejor conocido en la integración numérica es la desigualdad

de Simpson
¯Z b · µ ¶ ¸¯
¯ b−a a+b ¯ 1
¯ f (x)dx − f (a) + 4f + f (b) ¯¯ ≤ ||f (4) ||∞ (b − a)5
¯ 6 2 2880
a
donde la función f : [a, b] → R se asume cuatro veces continuamente diferenciable

sobre el intervalo (a, b) y la cuarta derivada acotada en (a, b), es decir
||f (4) ||∞ := sup |f (4) | < ∞.

x∈(a,b)
En este trabajo (capı́tulo 2) la noción de cuadratura juega un importante rol.

Se entiende por cuadratura el cálculo de integrales definidas de funciones de una
variable, esto es, el cálculo del valor
Z b
I(f ) = f (x)dx.
a
La idea básica de la cuadratura numérica es aproximar el valor de I(f ) por la

integral interpolante,
Z b
I(f ) ≈ p(x)dx,
a
bien sea este el polinomio interpolador de f asociado a ciertos nodos, bien un inter-
polante a trozos asociado a una partición ∆ de [a, b]. En el primer caso, la aproximación
da lugar a lo que se conoce como fórmulas de cuadratura; e el segundo caso a las fórmulas
de cuadratura compuesta.
La aproximación numérica de la integral definida se conoce como la integración
o cuadratura numérica. El segundo nombre procede de la antigüedad, en relación con el
cálculo de las áreas de las figuras curvas, cuyo ejemplo más notorio es el problema de la
cuadratura del cı́rculo (encontrar el cuadrado de área coincidente con la de un cı́rculo
dado) [8]. En el capı́tulo 2 nos ocuparemos brevemente del cálculo aproximado del área
bajo la curva f (x), definida sobre un intervalo [a, b], de la recta real, es decir
Introducción 10
Z b
I(f ) = f (x)dx.
a
La integración numérica es una herramienta de gran utilidad para obtener va-

lores aproximados de integrales definidas, que no pueden calcularse analı́ticamente, ya
sea porque el integrando no tiene primitiva expresable analı́ticamente, o bien, porque
dicho integrando no se conoce en forma analı́tica, sino en forma discreta (tabulada).
Cuadratura es un término matemático histórico que significa el determinio de una
área. El estudio de cuadratura ha servido como una de las principales fuentes de
problemas para el análisis matemático.
Los matemáticos de la antigua Grecia, de acuerdo con la doctrina pitagórica, en-
tendı́an la determinación del área de una figura, como el proceso de construcción
geométrica de un cuadrado que tiene la misma área (cuadratura). Ası́ este proceso ob-
tuvo el nombre de cuadratura. Los geómetras griegos no siempre tuvieron éxito, pero
continuaron realizando cuadraturas de algunas figuras cuyos lados no eran otra cosa que
los segmentos de lı́nea; como por ejemplo, el Lune de Hipócrates y la cuadratura del seg-
mento parabólico desarrollada por Arquı́medes. Por tradición griega, estas construcciones
tenian que llevarse a cabo utilizando solamente un compás y una regla.
Para una cuadratura de un rectángulo con los lados a y b es necesario construir un
√
cuadrado con el lado x = ab (la media geométrica de a y b). Para este propósito, es
posible utilizar el siguiente hecho; si se dibuja el cı́rculo con un diámetro que resulta del
hecho de unir segmentos de lı́nea de longitudes a y b, entonces la altura del segmento de
lı́nea dibujada perpendicularmente al diámetro, a partir de el punto de su conexión con
el punto donde cruza el cı́rculo, es igual a la media geométrica de a y b. Una construcción
geométrica similar resuelve los problemas de cuadratura de un paralelograma y de un
4
triángulo. El área de un segmento de parábola es 3
del área de un cierto triángulo inscrito
en ella.
Los problemas de la cuadratura de figuras curvilı́neas son mucho más difı́ciles que
los anteriores. La cuadratura del cı́rculo con regla y compás se habı́a demostrado en el
Introducción 11
siglo XIX que es imposible. Sin embargo, para algunas cifras (por ejemplo un Lune de
Hipócrates) se puede realizar una cuadratura. Las cuadraturas de la superficie de una
esfera y un segmento de parábola descubierta por Arquı́medes se convirtió en el más alto
logro de análisis en la antiguedad.
El área de la superficie de una esfera es igual a cuadruplicar el área del cı́rculo formado
por un gran cı́rculo de esta esfera.
4
El área de un segmento de una parábola determinada por una lı́nea recta, es 3
del
área de un triángulo inscrito en este segmento.
Para la prueba de estos resultados Arquı́medes de Siracusa utilizó el método de ex-
hausción [9] de Eudoxo.
Este Trabajo Especial de Grado está organizado en dos capı́tulos, el capı́tulo 1
está dedicado a la noción de convexidad, y sus propiedades.
Se estudia la desigualdad de Hermite Hadamard y la desigualdad de Jensen.
En el capı́tulo 2 se introduce brevemente la regla de cuadratura de Simpson y nociones
de interpolación. También se estudia la regla trapezoiodal.
Se exponen de manera detallada algunos resultados de Mahomad Alomari en [3] y
Sever Silvestru Dragomir en [13] sore la desigualdad de Simpson sobre funciones cuasi-
convexas y lipschitzianas respectivamente.
Se dará una generalización, de la Desigualdad de Simpson para funciones cuasi con-
vexas en términos, de la tercera derivada, ası́ como la estimación del error para la fórmula
de cuadratura de Simpson en funciones Lipschitzianas.
CAPÍTULO 1
PRELIMINARES
En este capı́tulo se dará una breve introducción de la noción de convexidad y sus

propiedades como continuidad, diferenciabilidad entre otras. Desigualdad de Hölder y
Hermite-Hadamard ası́ como también se presentarán algunas definiciones, proposiciones,
teoremas y ejemplos, que ayudarán a comprender mejor este trabajo especial de grado.
En la vida diaria la noción de convexidad está presente de varias maneras, el ejemplo
más sencillo; es nuestra posición cuando nos mantenemos de pie, que se fija siempre en la
proyección vertical de nuestro centro de gravedad, y se encuentra dentro del arco de los
pies, el cual tiende a ser convexo. Además, la convexidad tiene un gran impacto en nuestra
vida cotidiana a través de numerosas aplicaciones en distintas áreas del conocimiento
como Finanzas, Economı́a, Ingenierı́a, Computación entre otros.
Los estudios realizados sobre teorı́a de convexidad tienen una larga historia; en el
famoso libro “Los Elementos de Euclı́des”(300 A.C.) aparecen varias contribuciones a
esa materia, relativas, principalmente, a propiedades de los polı́gonos y los poliedros. Sin
embargo, fué Arquı́medes de Siracusa (278-212 A.C.) el primero en dar una definición
precisa de lo que se entendı́a por una curva o una superficie convexa (en su libro “Sobre la
esfera y el cilindro”). Entre las propiedades obtenidas por Arquı́medes, merecen especial
mención los postulados y resultados referentes al centro de gravedad de conjuntos planos
12
Cap. 1 Preliminares 13
y su descripción de los trece poliedros semi regulares, (entiéndase por un poliedro convexo
semi regular si sus caras son polı́gonos regulares de, al menos, dos tipos, y el grupo de
isometrı́as es transitivo sobre los vértices), también conocidos como sólidos arquimedianos
que fueron redescubiertos muy posteriormente por Johannes Kepler (1571-1630) en su
libro“Harmonices Mundi”(1619), quién demostró que efectivamente solo podı́an existir
trece.
Por lo que podemos saber, fué el matemático griego Zenodorus (200 A.C.) el autor del
primer trabajo conocido sobre el famoso problema isoperimétrico, (el cual data del año
810 A.C.). Él demuestra que todos los n-ágonos convexos de perı́metro dado, y el n-ágono
regular encierra la mayor área (suponiendo la existencia de tal n-ágono maximal).
A finales del siglo XIX y principios del siglo XX se trabaja en el tema de convex-
idad por varios matemáticos, entre ellos, el alemán Otto Hölder [30]. El cual, en 1889
demostró la forma discreta de la llamada desigualdad de Jensen, bajo una hipótesis con
un mayor grado de regularidad para la función f 0 , es decir, que la segunda derivada es
no negativa en su dominio, lo que quiere decir que, f 00 (x) > 0 para todo x ∈ Domf.
Además de contribuciones, a finales del siglo XIX, aparecieron diversos resultados
de gran importancia en convexidad gracias a destacados matemáticos como H. Brunn o
H. Minkowski, sin embargo; el interés real sobre la geometrı́a convexa es relativamente
reciente, pues un primer estudio sistemático no lo encontramos hasta 1934, en el libro
de T. Bonnesen y W. Fenchel “Theorie der Konvex Körper”. A lo largo de los años
40 y 50 se descubrieron numerosas aplicaciones importantes de los conjuntos convexos,
principalmente en el campo de la optimización geométrica, lo que acrecentó el interés de
esta teorı́a.
Adicionalmente se obtuvieron varios resultados significativos en el Análisis Funcional
Geométrico, la Economı́a Matemática y Análisis Convexo. El estudio de las funciones
convexas fué tomando auge al punto que apareció el libro de G. H. Hardy, J. E. Littlewood
y G. Polya [28] titulado “Inequalities”.
Uno de los resultados más importantes de las funciones convexas es la llamada de-
sigualdad de Hermite-Hadamard que fué dada por Jaques Hadamard [27] en 1983, para
el caso de las funciones con derivadas creciente en un intervalo cerrado de la recta real.
En esa época la noción de función convexa estaba en proceso de construcción. En 1883
la parte derecha de la desigualdad la demostró Charles Hermite por lo que hoy en dı́a se
llama desigualdad de Hermite-Hadamard, y viene dada de la siguiente manera
µ ¶ Z b
a+b 1 f (a) + f (b)
f ≤ f (x)dx ≤
2 b−a a 2
Una forma más generalizada del concepto de función convexa, la introdujo Edwin
Bekenbach [6] en 1937 en el trabajo ”Generalized Convex Functions”, reemplazando el
segmento por gráficas de funciones continuas pertenecientes a una familia de funciones de
dos parámetros. Las funciones generalizadas son obtenidas de muchas de las propiedades
conocidas para la función convexa clásica, como se puede ver en los trabajos de Edwin
Beckenbach, Mihály Bessenyi y Kazimierz Nikodem [6], [7], [43], respectivamente, o el
libro titulado “Convex Functions”, de A. W. Roberts, D. E. Varberg [51].
Dada funciones f y g definidas sobre un espacio vectorial a valores reales, uno de
los problemas de interés en la matemática es determinar condiciones necesarias y sufi-
cientes sobre f y g para que exista una función h que separe a f y g (f ≤ h ≤ g)
y que cumpla cierta condición; por ejemplo, continuidad, convexidad, cuasi-convexidad,
cuasi-concavidad, monotonı́a, etc. K. Baron, J. Matkowski y K. Nikodem [5] muestran
resultados diferentes a esta clase de problemas. Zs. Páles, en [40], obtiene resultados
similares para funciones cuasi-convexas y cuasi-cóncavas.
1.1 Funciones Convexas

El concepto de función convexa es una noción básica en la geometrı́a, que también se
usa ampliamente en otras áreas de las matemáticas y las ciencias; como en la Teorı́a de
la Optimización y la Teorı́a de las desigualdades, del análisis funcional, la programación
matemática y la Teorı́a de Juegos, la Teorı́a de números, el cálculo variacional y otras
ramas de las matemáticas aplicadas que utilizan este concepto de manera fundamental.
su interrelación con estas ramas que se muestra dı́a a dı́a más profunda y fructı́fera.
En 1893 el francés Jaques Hadamard [31], [32] logró una desigualdad para aquellas
funciones que tienen derivada creciente en [a, b]. Johan Ludwig William Jensen utiliza la
siguiente desigualdad µ ¶
x+y 1
f ≤ (f (x) + f (y)) (1.1)
2 2
para definir funciones convexas y dió el primero de una larga serie de resultados el cual
junto con la desigualdad (1.1) implica la continuidad de f.
A continuación se enunciará la definición de función convexa, la cual constituye la
noción fundamental de este trabajo
Definición 1. Sean I ⊂ R un intervalo y f : I → R una función. Se dice que f es

convexa si y sólo si
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y) (1.2)
para todo x, y ∈ I y t ∈ [0, 1]. Si la desigualdad es estricta cuando x 6= y y t ∈ (0, 1), se

dice que f es estrictamente convexa.
Luego, el matemático Johan Jensen uso la desigualdad que lleva su nombre para
enunciar la siguiente definicion de función convexa [36].
Definición 2. Sean I ⊂ R un conjunto abierto y convexo. Una función f : I → R es

llamada convexa si y sólo si satisface la desigualdad funcional de Jensen
µ ¶
a+b f (x) + f (y)
f ≤
2 2
para todo a, b ∈ I. Si la desigualdad es estricta para x 6= y, entonces la función f es
llamada estrictamente convexa.
Geométricamente, la definición de una función convexa f significa que para cua-

lesquiera dos puntos (x, f (x)), (y, f (y)) ∈ Graf (f ) donde Graf (f ) es el gráfico de
f, la cuerda que los une nunca está por debajo de la gráfica de la función; esta idea
la generaliza el matemático estadounidense E. Beckenbach [6] en 1937, reemplazando
los segmentos por el gráfico de funciones continuas que pertenecen a una familia de
funciones F de dos parámetros, como se muestra a continuación en la Figura 1.1
Figura 1.1: Función convexa, I = [x, y]
Sean x, y ∈ I, x < y y considérese la ecuación de la recta que pasa por los puntos
(x, f (x)), (y, f (y)), es decir
f (y) − f (x)
r(t) = (t − y) + f (y), t ∈ R.
y−x
Si
z = tx + (1 − t), t ∈ (0, 1),
entonces
f (y) − f (x)
r(z) = r(tx + (1 − t)y) = (tx + (1 − x)y − y) + f (y)
y−x
f (y) − f (x)
= (t(x − y)) + f (y)
y−x
= t(f (x) − f (y)) + f (y)
= tf (x) − (1 − t)f (y).
Por lo tanto r(z) = tf (x) + (1 − t)f (y); ası́, el punto (z, r(z)) está sobre el segmento
de recta que une los puntos (x, f (x)), (y, f (y)).
Además, como f es una función convexa, se verifica
f (z) = f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)
= r(z).
En consecuencia f (z) = r(z) para todo z ∈ [x, y], de donde se concluye que el
segmento de recta que une los puntos (x, f (x)), (y, f (y)) nunca está por debajo de la
gráfica de la función.
Para ilustrar esta definición tenemos la siguiente Figura 1.2.
f(x)
tf(x)+(1−t)f(y)
f(y)
f(tx+(1−t)y)
x tx+(1−t)y y
Figura 1.2: Función convexa, I = [x2 , x1 ]

Análogamente, si se invierte la desigualdad (1.2), se dice que f es cóncava. La función

es estrictamente cóncava si la desigualdad es estricta cuando x 6= y y t ∈ (0, 1).
La interpretación geométrica de una función cóncava establece que si f : I → R es
una función cóncava, entonces la cuerda que une los puntos (x, f (x)), (y, f (y)) ∈ Graf (f )
nunca está por arriba de la gráfica de f, como lo ilustra la figura 1.3
f(tx+(1−t)y)
f(y)
tf(x)+(1−t)f(y)
f(x)
x tx+(1−t)y y
Figura 1.3: Función cóncava, I = [x, y]
Ahora consideraremos algunos ejemplos de funciones convexas para ilustrar la

difinición.
Ejemplo 1. f (x) = |x| sobre I = R.

Veamos que f (x) = |x| es convexa.
f (tx + (1 − t)y) = |tx + (1 − t)y|
≤ |tx| + |(1 − t)y|
= t|x| + (1 − t)|y|
= tf (x) + (1 − t)f (y)
ası́ f es convexa.
Ejemplo 2. g(x) = x2 sobre I = R.
Sea t ∈ [0, 1]; para comprobar que la función g(x) = x2 es convexa se tiene que
verificar que
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)
es decir
0 ≤ t(1 − t)(x − y)2
= t(1 − t)(x2 − 2xy + y 2 )
= tx2 (1 − t) + y 2 (1 − t) − 2t(1 − t)xy
= tx2 (1 − t) + y 2 (1 − t)(1 − 1 + t) − 2t(1 − t)xy
= tx2 (1 − t) + y 2 (1 − t)(1 − (1 − t)) − 2t(1 − t)xy
= tx2 + (1 − t)y 2 − t2 x2 − (1 − t)2 y 2 − 2t(1 − t)xy
= tx2 + (1 − t)y 2 − (t2 x2 + (1 − t)2 y 2 + 2t(1 − t)xy)
= tx2 + (1 − t)y 2 − (tx + (1 − t)y)2
en efecto g(x) = x2 es convexa.

1
Ejemplo 3. h(x) = sobre I = (0, ∞).
x
Demostremos que h es una función convexa. En efecto x, y ∈ R y t ∈ [0, 1], entonces:
Demostremos, que h es convexa

1 1 1
≤ t + (1 − t)
tx + (1 − t)y x y
xy ≤ ty(tx + (1 − t)y) + (1 − t)x(tx + (1 − t)y)
xy ≤ ty(tx + y − ty) + (1 − t)x(tx + y − ty)
xy ≤ t2 xy + ty 2 − t2 y 2 + tx2 + xy − txy − t2 x2 − txy + t2 xy
0 ≤ t2 xy + ty 2 − t2 y 2 + tx2 + xy − txy − t2 x2 − txy + t2 xy t>0
0 ≤ 2txy + x2 + y 2 − tx2 − 2xy − ty 2
0 ≤ 2xy(t − 1) + x2 (1 − t) + y 2 (1 − t)
0 ≤ (t − 1)(2xy + x2 + y 2 )
0 ≤ (1 − t)(x + y)2 (1 − t) > 0
0 ≤ (x + y)2
lo cual es cierto; por lo tanto, h es convexa.

El lema que sigue se usará luego para la demostración del Teorema 3.
Lema 1 (Ver [48]). Sean I ⊂ R un intervalo y f : I → R una función. Entonces, f es

convexa si y sólo si
f (z) − f (x) f (y) − f (x) f (y) − f (z)
≤ ≤
z−x y−x y−z
para todo x, y, z ∈ I tal que x < z < y.
Demostración: Para verificar la primera desigualdad, consideremos
z = x + λ(y − x), λ ∈ (0, 1),

µ ¶
z−x
con λ = . Dado que f es convexa, se verifica
y−x
f (z) ≤ f (x) + λ(f (y) − f (x)),
de donde
z−x
f (z) − f (x) ≤ (f (y) − f (x)),
y−x
y en consecuencia
f (z) − f (x) f (y) − f (x)

≤ ,
z−x y−x
en el cual se cumple el lado izquierdo de la desigualdad. Ahora sea z = λ(x−y), entonces,
z−y
= λ ∈ (0, 1) y de la convexidad de la función f se tiene
x−y
f (z) ≤ f (y) + λ(f (x) − f (y)),
de donde se obtiene inmediatamente
f (z) − f (y) f (x) − f (y)

≥ ,
z−y x−y
donde z − y < 0, cumpliéndose ası́ el lado derecho de la desigualdad. Recı́procamente,
supóngase que f verifica las desigualdades del Lema 1 con x < z < y, y sea λ ∈ [0, 1] tal
z−x
que z = x + λ(y − x). Obsérvese que λ = y−x
. Por la primera desigualdad resulta que
f (z) − f (x) f (y) − f (x)

≤ .
z−x y−x
Luego µ ¶
z−x
f (z) ≤ f (x) + (f (y) − f (x)).
y−x
Es decir
f (x + λ(y − x)) ≤ f (x) + λ(f (y) − f (x)),
para todo x, y ∈ I y λ ∈ [0, 1]; ası́ f es una función convexa.

1.1.1 Continuidad y Diferenciabilidad
En esta sección se estudiarán las propiedades de continuidad y diferenciabilidad de

las funciones convexas. Se iniciará con una proposición que expresa que toda función
convexa definida en un intervalo cerrado I = [a, b] es acotada.
Proposición 1 (Ver [51]). Si f : [a, b] → R es una función convexa, entonces es acotada.
Demostración: Sea M = máx{f (a), f (b)} y z ∈ [a, b]. Entonces existe t ∈ [0, 1] tal
que z = ta + (1 − t)b, y como f es una función convexa, se tiene
f (z) = f (ta + (1 − t)b)
≤ tf (a) + (1 − t)f (b)
≤ tM + (1 − t)M
= M.
Es decir, f es acotada superiormente.
Para ver que f es acotada inferiormente se escogerá t ∈ R, de tal forma que los puntos
a+b a+b
x= − t, y= + t,
2 2
están en [a, b]. Entonces
µ ¶ µ µ ¶ µ ¶¶
a+b 1 a+b 1 a+b
f = f +t + −t
2 2 2 2 2
µ ¶ µ ¶
1 a+b 1 a+b
≤ f +t + f −t ,
2 2 2 2
de donde
µ ¶ µ ¶ µ ¶
a+b a+b a+b
f +t ≥ 2f −f −t
2 2 2
µ ¶
a+b
≥ 2f − M = m.
2
a+b
Como cualquier punto en [a, b] se puede escribir en la forma 2
+ t, para algún t
debidamente seleccionado, se deduce que f es acotada inferiormente.
En conclusión, para todo z ∈ [a, b] se verfica que
m ≤ f (z) ≤ M,
µ ¶
a+b
donde M = máx{f (a), f (b)} y m = 2f − M y por lo tanto f es acotada. ¤
2
Observación 1. Es indispensable que el intervalo en el que está definida la función sea
cerrado y acotado ya que en caso contrario puede suceder que la función no sea acotada.
Como ejemplos de estos se tienen las funciones f : (0, 1] → R definida por f (x) = x−1 y
g : [0, ∞) → R dada por g(x) = x2 , que son convexas pero no son acotadas superiormente.
A continuación enunciaremos las definicón de función Lipschitz.
Definición 3. Se dice que una función f : I → R satisface la condición Lipschitz en el

intervalo I si para todo x, y ∈ I existe una constante K > 0 tal que
|f (x) − f (y)| ≤ K|x − y|.
La constante K se denomina constante de Lipschizidad.
En el siguiente teorema demostraremos que toda función f : I ⊂ R → R convexa,

donde I es un intervalo, satisface una condición de Lipschitz en cualquier intervalo cerrado
contenido en I 0 (el interior de I).
Teorema 1 (Ver [51]). Sean I ⊂ R un intervalo, y f : I → R una función convexa.

Entonces f satisface una condición de Lipschitz en cualquier intervalo cerrado [a, b] ⊂ I 0
y, por lo tanto, f es continua en el interior de I.
Demostración: Sea ² > 0 tal que a − ² y b + ² estén en I, y sean M y m las cotas

inferior y superior de f en el intervalo [a − ², b + ²]. Sean x, y ∈ [a, b], con x 6= y.
Como ¯ ¯
¯ 1 ¯
¯ (y − x)¯ = 1,
¯ |y − x| ¯
resulta que
²
z=y+ (y − x) ∈ [a − ², b + ²],
|y − x|
luego,
|y − x| ²x
y= z+ .
² + |y − x| ² + |y − x|
En consecuencia, si consideramos
|y − x|
λ= ∈ (0, 1),
² + |y − x|
se tiene que
y = λz + (1 − λ)x,
y como f es convexa se cumple lo siguiente
f (y) ≤ λf (z) + (1 − λ)f (x)
= λ[f (z) − f (x)] + f (x).
De ahı́ que
f (y) − f (x) ≤ λ(M − m)

|y − x|
< (M − m) = k|y − x|,
²
(M − m)
donde k = . Por lo tanto para x, y ∈ [a, b], x 6= y, se deduce que
²
|f (y) − f (x)| < k|y − x|
y ası́ f es Lipschitz en cualquier intervalo [a, b] ⊂ I 0 . De cualesquiera sea el intervalo

[a, b], se concluye que f es continua en el interior de I. ¤
Observación 2. El teorema que se acaba de demostrar establece que si f : I → R, es

convexa, entonces es continua en el interior del intervalo I. Pero no se aclara la situación
en los puntos extremos del intervalo I. Con el fin de aclarar esto, considérese la función
g : [−1, 1] → R definida por

 x2 si x ∈ [−1, 1)
g(x) =
 2 si x = 1.
Esta función es convexa, continua en x = −1 y discontinua en x = 1.

En lo que sigue de esta sección se tratará la diferenciabilidad de funciones convexas
en términos de derivadas laterales.
Definición 4. Sea f : I → R una función, entonces las derivadas laterales se definen

para x ∈ I en caso de existir tal como sigue
derivada por la izquierda
f (y) − f (x)
f−0 (x) = lı́m
y↑x y−x
y derivada por la derecha
f (y) − f (x)
f+0 (x) = lı́m .
y↓x y−x
Demostraremos a continuación que las derivadas laterales de una función convexa
existen, son monótonas y crecientes en I 0 (Interior de I).
Teorema 2 (Ver [48]). Sea f : I → R una función convexa [estrictamente convexa]

entonces en cada x ∈ I 0 existen las derivadas laterales y las funciones f−0 (x) y f+0 (x) son
crecientes [estrictamente crecientes] en I 0 .
Demostración: Considérese cuatro puntos w, x, y, z ∈ I 0 tales que w < x < y < z y

sean
P = (w, f (w)), Q = (x, f (x)), R = (y, f (y)) y S = (z, f (z)).
(Ver Figura 1.4);

R
Q
w x y z
Figura 1.4: Relación entre las pendientes.
Se considera la siguiente notación para la pendiente de la recta que pasa por los
puntos A y B tal como sigue pendiente(AB) = pend(AB). Con esta notación se obtiene
pend(P Q) ≤ pend(P R) ≤ pend(QR) ≤ pend(QS) ≤ pend(RS) (1.3)
con desigualdades estrictas si f es estrictamente convexa. Esto equivale a las siguientes

desigualdades
f (w) − f (x) f (w) − f (y) f (x) − f (y) f (x) − f (z) f (y) − f (z)
≤ ≤ ≤ ≤ , (1.4)
w−x w−y x−y x−z y−z
de la segunda desigualdad de (1.4) se obtiene que
f (w) − f (y)
es creciente en w (w < y) (1.5)
w−y
de la desigualdad (1.4) y (1.5) se tiene
f (w) − f (y) f (y) − f (z)

≤ ,
w−y y−z
es decir,
f (w) − f (y) f (y) − f (z)
está acotado superiormente por (1.6)
w−y y−z
para cualquier z > y.
De (1.5) y (1.6) resulta que,
f (w) − f (y)
lı́m
w↑y w−y
existe y
f (w) − f (y) f (w) − f (y)
lı́m = sup
w↑y w−y w<y w−y
por lo tanto, si y ∈ I 0 , existe la derivada lateral f−0 (y).
De manera similar, se comprueba que existe derivada lateral f+0 (x), para todo x ∈ I 0
y
f (x) − f (z) f (x) − f (z)
f+0 (x) = lı́m = ı́nf
z↓x x−z z>x x−z
además de las cuatro desigualdades de (1.4) se obtiene que
f−0 (x) ≤ f+0 (x) ≤ f− (y) ≤ f+ (y)
y por lo tanto f−0 (x) ≤ f 0 (x) para todo x ∈ I 0 y f−0 , f+0 son funciones crecientes. ¤
Observación 3. Considérese los tres puntos w, x, y ∈ I 0 , tales que w < x < y. Como la
función derivada lateral f+0 es monótona, existe el lı́mite de f+0 (x) cuando x ↓ w. Además
la desigualdad
f (y) − f (x)
f+0 (x) ≤
y−x
y de la continuidad de f se puede inferir que
f (y) − f (x) f (y) − f (w)

lı́m f+0 (x) ≤ lı́m = .
x↓w x↓w y−x y−w
Si se hace y ↓ w afirmaremos que
f (y) − f (w)
lı́m f+0 (x) ≤ lı́m = f+0 (w).
x↓w y↓w y−w
Esto implica que

lı́m f+ (x) ≤ f+0 (w) (1.7)
x↓w
por otra parte, como w < x, la monotonı́a de f+0 implica que f+0 (w) ≤ f+0 (x) y por lo
tanto
f+0 (w) ≤ lı́m f+0 (x) (1.8)
x↓w
de (1.7) y (1.8) se deduce que
lı́m f+0 (x) = f+0 (w).

x↓w
Supóngase ahora que los tres puntos x, y, w ∈ I 0 son tales que y < x < w. Dado que
la función f+0 es monótona creciente se verifica
f (y) − f (x)
≤ f+0 (x)
y−x
y de la continuidad de f se tiene
f (y) − f (x)
lı́m ≤ lı́m f+0 (x)
x↑w y−x x↑w
si ahora se hace que y ↑ w, se obtiene

f (y) − f (x)
lı́m ≤ lı́m f+0 (x),
y↑w y−x x↑w
es decir,
f−0 (w) ≤ lı́m f+0 (x) (1.9)
x↑w
además, como x < w, la monotonı́a de las derivadas laterales implica que f+0 (x) ≤ f−0 (w)
y en consecuencia
lı́m f+0 (x) ≤ f−0 (w) (1.10)
w↑w
de (1.9) y (1.10) se obtiene que
lı́m f+0 (x) = f−0 (w).

x↑w
El próximo teorema presenta una forma de reconocer las funciones convexas como
integrales de funciones crecientes.
Teorema 3 (Ver [51]). Una función f : (a, b) → R es convexa (estrictamente convexa)

si y sólo si existe una función creciente (estrictamente creciente) g : (a, b) → R y un
punto c ∈ (a, b), tales que para todo x ∈ (a, b)
Z x
f (x) − f (c) = g(t)dt. (1.11)
c
Demostración: Supóngase que la relación (1.11) es cierta con g creciente y sean α, β,

números positivos tales que α + β = 1. Entonces, para todo x, y ∈ (a, b) tales que x < y,
se tiene x < αx + βy < y. Luego
αf (x) + βf (y) − f (αx + βy) = αf (x) + βf (y) − (α + β)f (αx + βy)
= β(f (y) − f (αx + βy)) − α(f (αx + βy) − f (x))

Z y Z αx+βy
= β g(t)dt − α g(t)dt por (1.11)y g creciente
αx+βy x
Z y Z αx+βy
≥ β g(αx + βy)dt − α g(αx + βy)dt (A)
αx+βy x
= βg(αx + βy)(y − (αx + βy)) − αg(αx + βy)(αx + βy − x)
= g(αx + βy)(β(y − (αx + βy)) − α(αx + βy − x))
= g(αx + βy)(βy − β(αx + βy) − α(αx + βy) + αx)
= g(αx + βy)(αx + βy − (α + β)(αx + βy))
= g(αx + βy)(αx + βy − (αx + βy)) = 0
esto implica que

αf (x) + βf (y) − f (αx + βy) ≥ 0 (1.12)
para todo α, β ∈ [0, 1], α + β = 1 y x, y ∈ (a, b). Por lo tanto f es convexa. Además
como g es una función creciente se verifican
x < t < αx + βy ⇒ g(t) ≤ g(αx + βy)
αx + βy < t < y ⇒ g(αx + βy) ≤ g(t)
y si g es estrictamente creciente estas desigualdades son estrictas, y por lo tanto la

desigualdad (A) es estricta, donde la desigualdad (1.12) también es estricta y ası́ la
función f es estrictamente creciente.
Recı́procamente, supóngase que f es una función convexa (estrictamente convexa)

por el Teorema 2 se sabe que la derivada lateral f+0 existe y es creciente (estrictamente
Q
creciente). Consideremos una partición = {c = x0 < x1 < · · · < xn = x} del intervalo
[c, x]. Cómo xk−1 < xk para todo 1 ≤ k ≤ n, se tiene de acuerdo con el Lema 1 y el
Teorema 2 que
f (xk ) − f (xk−1 )
f+0 (xk−1 ) ≤ ≤ f+0 (xk )
xk − xk−1
de donde se obtiene
f+0 (xk−1 )(xk − xk−1 ) ≤ f (xk ) − f (xk−1 ) ≤ f+0 (xk )(xk − xk−1 )
sumando sobre k, se tiene

n
X n
X
f+0 (xk−1 )(xk − xk−1 ) ≤ f (xn ) − f (x0 ) ≤ f+0 (xk )(xk − xk−1 ).
k=1 k=1
Las dos sumas de estas últimas desigualdades son las sumas de Riemann de la función
Q
f+0 asociadas a la partición y verifican las desigualdades independientemente de la
partición del intervalo [c, x] que se considere. Como la función f+0 es creciente, entonces
es Riemann-integrable y al considerar el supremo de la suma izquierda y el ı́nfimo de la
suma de la derecha sobre todas las particiones se obtiene por definición de integral de
Riemann que Z Z
x x
f+0 (t)dt ≤ f (x) − f (c) ≤ f+0 (t)dt
c c
es decir Z x
f (x) − f (c) = f+0 (t)dt
c
y ası́ podemos asegurar que g(t) = f+0 (t). La función f−0 también se puede usar en lugar de
f+ ya que ambas funciones son crecientes (estrictamente crecientes) cuando f es convexa
(estrictamente convexa). ¤
El teorema anterior demuestra que para una función diferenciable, la convexidad
implica que la derivada es creciente. A continuación se presenta otra manera de ver la
convexidad de una función.
Teorema 4 (Ver [51]). Sea f : [a, b] → R una función diferenciable en (a, b). Entonces
f es convexa, (estrictamente convexa), si y sólo si f 0 es una función creciente (estricta-
mente creciente).
Demostración: Supóngase que f 0 es una función creciente (estrictamente creciente),

entonces el teorema fundamental del cálculo asegura que
Z x
f (x) − f (c) = f 0 (t)dt (1.13)
c
para cualquier c ∈ (a, b), en virtud del Teorema 4 se tiene que f es convexa. Recı́proca-
mente, si la derivada f 0 es creciente (estrictamente creciente) y existe en todos los puntos
del dominio de la función f, entonces de acuerdo con la relación (1.13) y de la apli-
cación del Teorema 3 con g(t) = f 0 (t) para todo t ∈ (a, b), se concluye que f es convexa
(estrictamente convexa). ¤
Antes de demostrar el próximo teorema se dará la siguiente definición.
Definición 5. Sean I ⊂ R un intervalo y f : I → R una función. Se dice que f tiene

soporte lineal en x0 ∈ I si existe un número m ∈ R tal que la función afı́n A(x) =
f (x0 ) + m(x − x0 ) verifica que A(x) ≤ f (x) para todo x ∈ I. La función A se conoce
como la función (o recta) de soporte f en x0 .
Como lo ilustra la Figura 1.5, cada punto del interior de su dominio tiene soporte.
Figura 1.5: Recta de soporte de f en x0
El próximo teorema provee una demostración de este hecho.
Teorema 5 (Ver [51]). Una función f : (a, b) → R es convexa, si y sólo si existe al

menos una recta de soporte para cada x0 ∈ (a, b).
Demostración: Supongamos que f es convexa, entonces para cada x0 ∈ (a, b) pode-

mos escoger m ∈ [f−0 (x0 ), f+0 (x0 )]. Si x ∈ (a, b) es tal que x0 < x, entonces
f (x) − f (x0 )
f−0 (x0 ) ≤ m ≤ f+0 (x0 ) ≤
x − x0
de donde
f (x) − f (x0 ) ≥ m(x − x0 ).
Por otra parte, si x < x0 se verifica
f (x) − f (x0 )
≤ f−0 (x0 ) ≤ m ≤ f+0 (x0 )
x − x0
y como x − x0 < 0 resulta

f (x) − f (x0 ) ≥ m(x − x0 )
en cualquier caso se cumple que
f (x) ≥ f (x0 ) + m(x − x0 ) = A(x)
y ası́ A es una recta de soporte de f en x0 . Supongamos ahora que f tiene una recta de
soporte en cada punto de (a, b) y sean x, y ∈ (a, b). Si x0 = tx + (1 − t)y, t ∈ [0, 1], y
A(x) = f (x0 ) + m(x − x0 ) la recta de soporte f en x0 , entonces
f (tx + (1 − t)y) = f (x0 ) = A(x0 ) = A(tx + (1 − t)y)
= tA(x) + (1 − t)A(y)
≤ tf (x) + (1 − t)f (y)
es decir
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)
para todo x, y ∈ (a, b) y t ∈ [0, 1]. Por lo tanto f es convexa. ¤
Definición 6. Sea f una función definida en el intervalo I, f tiene el soporte en x0 ∈ I,

si existe una función afı́n A(x) = f (x0 ) + m(x − x0 ) que pasa por (x0 , f (x0 )), tal que
A(x) ≤ f (x) para todo x ∈ I. La función afı́n A es llamada recta soporte de f en x0 .
1.1.2 Teorema de separación para funciones Convexas (Teore-

ma del Sandwich)
Dadas dos funciones definidas en un intervalo I tal que f ≤ g. Un problema de interés

es determinar si existe una función convexa h : I → R que separe a f y a g, es decir tal
que f ≤ h ≤ g. Existen situaciones donde este problema tiene respuesta negativa como
son los casos que se muestran a continuación [49] y [19]
Figura 1.6:
Figura 1.7:
Una situación como la mostrada en la Figura 1.7 ocurre cuando se considera f, g :

[−1, 1] → R, definidas por f (x) = 1 − |x| y g(x) = 2 − |x|. Si existiese h : [−1, 1] → R
convexa tal que f ≤ h ≤ g, entonces
µ ¶
1 1
0 = f (0) = f (−1) + 1
2 2
µ ¶
1 1
≤ h (−1) + 1
2 2
1 1
≤ h(−1) + h(1)
2 2
1 1
≤ g(−1) + g(1)
2µ 2 ¶ µ ¶
1 1 1 1
≤ −| − 1| + + −|1| +
2 2 2 2
1 1 1
= − − =−
4 4 2
lo cual es una contradicción; por lo tanto, no existe una función convexa que separe a
las funciones f y g. Por supuesto, también existen casos donde la función h existe, por
ejemplo si f y g son convexas o en una situación como en la ilustrada en la Figura 1.8
Figura 1.8:
La respuesta del problema que se plantearon fué dada por Karol Baron, Janusz
Matkowski y Kazimierz Nikodem en el año 1994 [5], quienes dieron una caracterización
de las funciones reales que pueden ser separadas por funciones convexas. Para detalles
de la demostración se refiere al lector a [5].
1.1.3 Desigualdad de Jensen
A continuación se presenta la desigualdad de Jensen, la cual es una generalización de

(1.1).
Teorema 6 (Desigualdad de Jensen, ver [31] y [32]). Sea I ⊂ R un intervalo y f : I → R

una función. Entonces f es convexa si y sólo si
Ã n ! n
X X
f t i xi ≤ ti f (xi ) (1.14)
i=0 i=0
para todo xi ∈ I, ti ≥ 0, i = 1, ..., n tales que ti + ... + tn = 1.
Demostración:
Para n = 2 la relación (1.14) es la desigualdad que define la convexidad clásica de f
en (1.2).
Supongamos que la desigualdad (1.14) para i = n − 1 por hipótesis inductiva.
Demostraremos que se cumple para i = n, por lo que sin pérdida de generalidad

supondremos que tn < 1, luego 1 − tn > 0 y entonces
Ã n !
X
f t i xi = f (t1 x1 + ... + tn−1 xn−1 + tn xn )
i=1
µ µ ¶ ¶
t1 x1 + ... + tn−1 xn−1
= f (1 − tn ) + (tn xn )
1 − tn
µ µ ¶ ¶
t1 tn−1
= f (1 − tn ) xi + ... + xn−1 + tn xn
1 − tn 1 − tn
µ ¶
t1 tn−1
≤ (1 − tn )f x1 + ... + xn−1 + tn f (xn )
1 − tn 1 − tn
Ã n !
X ti xi
= (1 − tn )f .
i=1
1 − tn
Por convexidad
Ã n ! µ µ ¶ ¶
X t1 tn−1
f t i xi = f (1 − tn ) xi + ... + xn−1 + tn xn
i=1
1 − t n 1 − tn
µ ¶
t1 tn−1
≤ (1 − tn )f x1 + ... + xn−1 + tn f (xn )
1 − tn 1 − tn
Ã n !
X ti xi
= (1 − tn )f
i=1
1 − tn
por hipótesis inductiva

Ã n ! Ã n !
X X ti xi
f t i xi = (1 − tn )f
i=0 i=1
1 − tn
n−1
X ti
≤ (1 − tn ) f (xi ) + tn f (xn )
i=1
1 − tn
n−1
X
= ti f (xi ) + tn f (xn )
i=1
n−1
X
= ti f (xi )
i=1
por lo tanto Ã n−1 !

X n
X
f t i xi ≤ ti f (xi )
i=1 i=1
llegando a lo que se querı́a demostrar. ¤

A continuación se enuncia y demuestra un teorema análogo al teorema de Jensen
relativo a la forma integral.
Teorema 7 (Ver [39]). Sean (X, Σ, µ) un espacio de medida de probabilidad, I un inter-

valo abierto y ϕ : X → I una función integrable Lebesgue. Si f : I → R es una función
convexa, entonces µZ ¶ Z
f ϕ(x)dµ ≤ f (ϕ(x))dµ.
X X
Demostración: Sea g : I → R una función de la forma g(x) = a(x − m) + f (m)

que soporta a f en m e integrando sobre X en ambos lados de la desigualdad f (ϕ(x)) ≥
g(ϕ(x)) para todo x ∈ X
Z Z
f (ϕ(x))dµ ≥ g(ϕ(x))dµ
X Z X Z
= a(ϕ(x) − m)dµ + f (m)dµ
X
Z X Z
= a (ϕ(x) − m)dµ + f (m) dµ
X X
R
usando el hecho de que X es un espacio de probabilidad, entonces X dµ = 1
Z µZ Z ¶
f (ϕ(x))dµ ≥ a ϕ(x)dµ dµ + f (m)
X X X
= a(m − m) + f (m)
= f (m)
Z
reescribiendo la última desigualdad y sustituyendo m = ϕ(x)dµ
X
µZ ¶ Z
f ϕ(x)dµ ≤ f (ϕ(x))dµ.
X X
1.1.4 Desigualdad de Tipo Hermite-Hadamard
En esta sección se definirá uno de los resultados fundamentales que se deducen de la

noción de funciones convexas, la desigualdad de Hermite-Hadamard.
Sean I ⊂ R y f : I → R una función convexa, entonces la función f satisface la
siguiente desigualdad
µ ¶ Z y
x+y 1 f (x) + f (y)
f ≤ f (s)ds ≤ (1.15)
2 x−y x 2
para todo x, y ∈ I, x < y.

El lado izquierdo de (1.15) fué demostrado por Jacques Hadamard en 1983 antes de
que las funciones convexas fuesen formalmente introducidas. Para funciones con derivadas
crecientes en un intervalo cerrado, es algunas veces llamado Desigualdad de Hadamard y
el lado derecho, la desigualdad de Jensen. En 1985, D. S. Mitrinovic y I. B. Lackovic en
[40] señalan que la desigualdad (1.15) es debido a Charles Hermite quien la obtiene en los
años 1883, diez años antes que Hadamard. Esta desigualdad clásica de Hermite-Hadamard
juega un rol importante en el análisis de la convexidad y tienen una amplia literatura
que trata sus aplicaciones, generalizaciones y refinamientos ver [7][15][41]; También se
conoce que si f es continua, entonces la desigualdad de Hermite-Hadamard caracterizan
la convexidad de f.
Teorema 8. (Ver [27]) Si una función f : I ⊂ R → R es convexa, entonces

µ ¶ Z y
x+y 1 f (x) + f (y)
f ≤ f (s)ds ≤ (1.16)
2 x−y x 2
para todo x, y ∈ I, x < y. Inversamente, si f es continua y satisface el lado derecho o
izquierdo de (1.16) para todo x, y ∈ I, x < y, entonces es convexa.
Demostración: El lado derecho de la desigualdad (1.16) se obtiene de integrar la

desigualdad (1.2) en el intervalo [0, 1] con respecto a t, tal como sigue
Z 1 Z 1 Z 1
f (tx + (1 − t)y)dt ≤ tf (x)dt + (1 − t)f (y)dt
0 0 0
f (x) f (y)
≤ +
2 2
f (x) + f (y)
=
2
haciendo un cambio de variable s = tx + (1 − t)y en la integral
Z 1 Z y
1
f (tx + (1 − t)y)dt = f (s)ds
0 x−y x
se obtiene el lado derecho de la desigualdad (1.16)
Z y ÃZ x+y Z y !
1 1 2
f (s)ds = f (s)ds + f (s)ds
x−y x x−y x x+y
2
ÃZ x+y Z y !
1 2
= f (s1 )ds1 + f (s2 )ds2
x−y x x+y
2
x + y − t(x − y)
haciendo los siguientes cambios de variables s1 = y
2
x + y + t(x − y)
s2 = en la igualdad anterir, se obtiene:
2
Z · µ ¶ µ ¶¸
1 1 x + y − t(x − y) x + y + t(x − y)
f +f dt,
2 0 2 2
ahora usando la convexidad de la función se llega a la desigualdad
Z · µ ¶ µ ¶¸ Z 1 µ ¶
1 1 x + y − t(x − y) x + y + t(x − y) x+y
f +f dt ≥ f dt
2 0 2 2 0 2
µ ¶
x+y
= f ,
2
se obtiene el lado izquierdo de la desigualdad (1.16)

µ ¶ Z y
x+y 1
f ≤ f (s)ds
2 x−y x
A continuación se darán varios ejemplos sobre la desigualdad de Hermite-Hadamard.
Ejemplo 4. Sea f (x) = ex , con x ∈ R. Sustituyendo f (x) en la desigualdad (1.16) se

obtiene
a+b eb − ea eb + ea
e 2 < < para a 6= b ∈ R
b−a 2
eb −ea
Figura 1.9: f (x) = b−a
y si se hace un cambio de variable a = ln(y) y b = ln(x) queda de la siguiente manera,
√ x−y x+y
xy < < para x 6= y ∈ (0, ∞).
ln(x) − ln(y) 2
1.2 Funciones Cuasi-Convexas

Esta sección la dedicamos al estudio de las funciones cuasi-convexas, mediante
definiciones y algunos ejemplos.
Muchos teoremas que involucran funciones convexas han aparecido desde el trabajo
pionero de J. Jensen [31], recientemente se han obtenido algunos resultados para
una clase más amplia de funciones, y estas son las cuasi convexas. Las funciones
cuasiconvexas aparecen en la literatura en 1949, por B. D. Finetti (ver [22]). Para
sentar una formulación más precisa del estudio de B. D. Finetti, seguimos los estudios
de W. Fenchel [20] y algunas de sus observaciones, acerca de los conjuntos de nivel,
para una función (no necesariamente convexa), estas funciones no toman su nombre
actual sino hasta 1953. La cuasiconvexidad es una propiedad más débil que la con-
vexidad, de ahı́ que algunas propiedades de estas últimas no se cumplen para las primeras.
Otros conceptos como el de función cuasi-convexa introducido en 1928 en un trabajo

sobre teorı́a de juegos, por el matemático Jhon Von Neumann, es de mucha utilidad en
los problemas de economı́a y optimización.
Definición 7. Sean D y X conjuntos contenidos en los reales, una función f : D ⊆ X →

R en un subconjunto convexo X es cuasi-convexa si
f (tx + (1 − t)y) ≤ máx{f (x), f (y)} (1.17)
y f es cuasi-cóncava si f (tx + (1 − t)y) ≥ máx{f (x), f (y)} t ∈ (0, 1).
De la Definición 7, se desprende la siguiente proposición.
Proposición 2. Una función f es cuasi-convexa si y sólo si −f es cuasi-cóncava.
Demostración: Sea f una función convexa, si la multiplicamos por −1 ambos lados

se obtiene
−f (tx + (1 − t)y) ≥ −tf (x) − (1 − t)f (y)
es decir
(−f )(tx + (1 − t)y) ≥ t(−f )(x)(−f )(y)
para todo x, y ∈ I y t ∈ [0, 1] esto permite deducir que f es convexa si y sólo si −f es

cóncava. ¤
Ejemplo 5. La siguiente gráfica es una función cuasi-convexa
f(x)
f(tx+ (1-t)y)
f(y)
x tx+ (1-t)y y
Figura 1.10: Función cuasi-convexa
Ejemplo 6. La siguiente gráfica es igualmente una función cuasi-convexa

p
Figura 1.11: f (x) = |x|
A continuación se presenta una proposición que se deriva de la definición de

cuasi-convexidad.
Proposición 3. Toda función f convexa o monótona es cuasiconvexa.
Demostración: Sin pérdida de generalidad, consideremos x, y ∈ I tal que x ≤ y con

I ⊆ R, supongamos que f es monótona creciente para t ∈ [0, 1] entonces
x ≤ tx + (1 − t)y ≤ y
ası́ mismo
mı́n{f (x), f (y)} = f (x) ≤ f (tx + (1 − t)y) ≤ f (y) = máx{f (x), f (y)} (1.18)
luego por (1.18) se cumple que
f (tx + (1 − t)y) ≤ máx{f (x), f (y)}

por lo que en consecuencia f es cuasiconvexa.
Para el caso en que f es cóncava, la demostración es análoga. ¤
1.2.1 Teorema de Separación para Funciones Cuasi-Convexas

(Teorema del Sandwich).
En el año 1996, Wolfang Förg Rob, Kazimierz Nikodem y Zsolt Páles en [50]
generalizan el Teorema del Sandwich para funciones cuasi-convexas, caracterizando las
funciones reales definidas en un intervalo I ⊂ R. A continuación demostraremos un
teorema de separación para funciones cuasi convexas.
Teorema 9. (Ver [50]) Sean I ⊆ R un intervalo arbitrario y f, g : I → R funciones

dadas. Las siguientes propiedades son equivalentes:
(a) Existe una función monótona h : I → R tal que f ≤ h ≤ g.
(b) Existen funciones h1 , h2 : I → R, h1 -cuasi cóncava, h2 -cuasi convexa, tal que
f ≤ h1 ≤ g y f ≤ h2 ≤ g.
(c) Existen funciones h1 , h2 : I → R, h1 -cuasi cóncava, h2 -cuasi convexa, tal que
f ≤ h1 ≤ h2 ≤ g.
(d) Para todo x, y ∈ I y t ∈ [0, 1], las siguientes desigualdades se cumple
f (tx + (1 − t)y) ≤ máx{g(x), g(y)}
g(tx + (1 − t)y) ≥ mı́n{f (x), f (y)} (1.19)
Demostración:
(a) ⇒ (d)
Resulta del hecho de que toda función monótona es cuasi-cóncava y cuasi-

convexa como se demostró en proposición(3).
(d) ⇒ (c)
Consideremos las funciones h1 , h2 : I → R definidas por
h1 (u) := sup{mı́n{f (x), f (y)} : x ≤ u ≤ y, x, y ∈ I} (1.20)
h2 (u) := ı́nf{máx{g(x), g(y)} : x ≤ u ≤ y, x, y ∈ I}. (1.21)
Por la desigualdad (1.19) h1 (u), h2 (u) están bien definidas y
f (u) ≤ h2 (u)
h1 (u) ≤ g(u) (1.22)
para todo u ∈ I.
Por otra parte, f ≤ h1 y h2 ≤ g. Demostraremos que h1 ≤ h2 , h1 es cuasi-

cóncava y h2 es cuasi-convexa. Supongamos lo contrario, que existe w ∈ I tal que
h1 (w) > h2 (w). Entonces existirá x ≤ w ≤ y y u ≤ w ≤ v tal que
mı́n{f (x), f (y)} > máx{g(u), g(v)} (1.23)
Si x ≤ u, entonces de (1.20) y (1.23) se deduce que
h1 (u) ≥ mı́n{f (x), f (y)} > g(u)
lo que contradice a (1.22). Esas contradicciones muestran que h1 ≤ h2 . Ahora

demostraremos que h2 es cuasi-convexa (la demostración de cuasi-concavidad de
h1 es análoga) supongamos que es falso.
Entonces existe x ≤ u ≤ y tal que h2 (u) > máx{h2 (x), h2 (y)}. Por las defini-
ciones de h2 conseguiremos α ≤ x ≤ β y γ ≤ y ≤ δ tal que
h2 (u) > máx{g(α), g(β), g(γ), g(δ)} (1.24)
sin embargo α ≤ u ≤ δ, lo que implica que
h2 (u) ≤ máx{g(α), g(δ)}
esto contradice (1.24) y demuestra que h2 es cuasi-convexa.
(c) ⇒ (b)
Por hipótesis se tiene que f ≤ h1 ≤ h2 ≤ g entonces f ≤ h1 ≤ g y también

satisface para f ≤ h2 ≤ g, es decir, que existen funciones h1 , h2 : I → R,
h1 -cuasi-cóncava y h2 -cuasi-convexa, tal que f ≤ h1 ≤ g y f ≤ h2 ≤ g.
(b) ⇒ (a)
Asumamos primero que sup{f (z) : z ≤ x} < ∞ y ı́nf{g(z) : z ≤ x} > −∞ para

cada x ∈ I. Definamos m1 , m2 : I → R por
m1 := sup{f (z) : z ≤ x}
m2 := ı́nf{g(z) : z ≤ x}.
Es evidente que f ≤ m1 , m2 ≤ g, m1 es no decreciente y m2 es no creciente.

Vamos a demostrar que al menos una de estas funciones separa a las funciones f y
g.
Asumamos lo contrario, entonces existen a, b ∈ I tal que m1 (a) > g(a) y m2 (b) <
f (b). Sin pérdida de generalidad, podemos suponer que a ≤ b. Sea
1
0<²< mı́n{m1 (a) − g(a), f (b) − m2 (b)}. (1.25)
2
Por la definición de m1 , m2 , existen x1 , x2 ∈ I, x1 ≤ a, x2 ≤ b tal que
f (x1 ) > m1 (a) − ²
g(x2 ) < m2 (b) + ². (1.26)
Si x1 ≤ x2 , entonces x2 , a ∈ [x1 , b] por hipótesis (1.25) y (1.26) se tiene
h1 (x2 ) ≤ g(x2 ) < m2 (b) + ²
h2 (a) ≤ g(a) < g(a) + ²
y
h2 (x1 ) ≥ f (x1 ) > m1 (a) − ² > g(a) + ²,
lo que contradice la cuasi-convexidad de h2 sobre [x2 , a].
Ası́ en cualquier caso se llega a la contradicción que demuestra que al menos una
de las funciones m1 , m2 separa a las funciones f y g.
Ahora vamos a tratar con la existencia de las funciones m1 , m2 . Como f está acotada
superiormente por h2 y por lo tanto también está acotado superiormente por el
máx{h2 (α), h2 (β)} en cada intervalo compacto [α.β] ⊂ I (y de manera similar g
por h1 inferiormente), la única posibilidad para la inexistencia de m1 (o m2 ) se
da sı́ f (respectivamente g) es no acotado por el lado izquierdo de I. Debemos
considerar los siguientes tres casos
(i) Supongamos que
sup{f (z) : z ≤ x} = ∞
y
ı́nf{g(z) : z ≤ x} = −∞
para algún x ∈ I. Entonces, por los argumentos antes mencionados, para cualquier
y ≤ x se tiene que
sup{f (z) : z ≤ y} = ∞
y
ı́nf{g(z) : z ≤ y} = −∞.
Por lo tanto hay un punto z1 ≤ x tal que f (z1 ) > 0. Además podemos conseguir
un punto z2 < z1 tal que g(z2 ) < 0 y un punto z3 < z2 tal que f (z3 ) > 0. Como
f < h1 < g, esto es una contradicción para la cuasi convexidad de h1 .
(ii) Supongamos que el sup{f (z) : z ≤ x} = ∞ para algún x ∈ I y m2 existe.
Fijamos x0 ∈ I y elegimos y0 < x0 tal que f (y0 ) > g(x0 ). Para cualquier y ∈ I,
y ≤ y0 es posible restringir m2 al intervalo [y, ∞] ∩ I y definir m1 como lo hicimos
anteriormente en este intervalo, ya que y0 < x0 y f (y0 ) > g(x0 ), la función m1 no
puede separar a las funciones f y g, ası́ solamente la restricción de m2 funciona
como una separación sobre [y, ∞] ∩ I. Luego esto es válido para cualquier y ∈ I,
y ≤ y0 , concluyendo que m2 separa a las funciones f y g sobre I.
(iii) El caso donde m1 existe pero el ı́nf{g(z) : z ≤ x} = −∞ para algún x ∈ I
puede ser tratado como en (ii).
A continuación mostraremos algunos contrajemplos de que una función cuasi-convexa

no necesariamente será convexa.
Ejemplo 7. La función f definida de la siguiente manera
f : [−2, 2] → R
 p
 |x| si −2 ≤ x ≤ 0
f (x) =
 x2 si 0 ≤ x ≤ 2.
es cuasi-convexa y no es convexa ni monótona.
Figura 1.12: f es cuasi-convexa y no es convexa ni monótona
Ejemplo 8. La función f : [0, 2] → R definida como
f : [0, 2] → R

 x2 si 0 ≤ x ≤ 1
f (x) =
 2x si 1 ≤ x ≤ 2.
es monótona, cuasi-convexa y no es convexa porque tiene una discontinuidad en el interior

de su dominio.
Figura 1.13: f es cuasi-convexa, monótona y no es convexa.
En la siguiente proposición se expone una caracterización de las funciones cuasi-

convexas en términos de los conjuntos de nivel.
Proposición 4. Una función f : D ⊆ X → R es cuasi-convexa, si y sólo si para todo

α ∈ R el conjunto
f −1 (−∞, α] = {x : f (x) ≤ α} con α ∈ R
es un conjunto convexo.
Demostración: Supongamos que f es cuasi-convexa, y sean α ∈ R y x, y ∈ Lα(f ) =

{x : f (x) ≤ α}, entonces
f (tx + (1 − t)y) ≤ máx{f (x), f (y)} ≤ α, t ∈ (0, 1),

ası́ resulta que Lα(f ) es convexo.
Recı́procamente, asumamos que Lα(f ) es convexo para todo α ∈ R y consideremos

x, y ∈ X entonces x, y ∈ L = Lmax{f (x),f (y)} (f ), luego tx + (1 − t)y ∈ L, con t ∈ (0, 1).
De donde resulta que f es cuasi-convexa. ¤
Para una función f : D ⊆ X → R, los conjuntos Lα (f ), α ∈ R se denominan conjuntos

de nivel.
Ejemplo 9. Conjunto de nivel de la función f : [−3, 3] → R dada por
f (x) = (x2 − 4)(x2 − 1)
Figura 1.14: La función L2 (f ) no es convexa

1.3 Operaciones con Funciones Convexas

En esta sección se verán las formas de reconocer estas funciones convexas a partir
de operaciones que preservan la convexidad. Por ejemplo, será posible reconocer que la
función f : (0, ∞) → R definida por f (t) = t−1 + t3 es convexa, porque es una suma
de funciones convexas y como se verificará la suma de funciones es una operación que
preserva convexidad.
El siguiente teorema establece que la suma de funciones convexas, y el producto de
una constante no negativa por una función convexa son funciones convexas.
Teorema 10. (Ver[26]) Sea I ⊂ R un intervalo. Si f : I → R y g : I → R son funciones

convexas y α ≥ 0, entonces f + g y αf son funcions convexas sobre I.
Demostración: Sean x, y ∈ I y t ∈ [0, 1]. Entonces
(f + g)(tx + (1 − t)y) = f (tx + (1 − t)y) + g(tx + (1 − t)y)
≤ tf (x) + (1 − t)f (y) + tg(x) + (1 − t)g(y)
= t(f (x) + g(x)) + (1 − t)(f (y) + g(y))
= t(f + g)(x) + (1 − t)f + g(y)
es decir
(f + g)(tx + (1 − t)y) ≤ (f + g)(x) + (1 − t)(f + g)(y)
y por lo tanto f + g es convexa.
También se tiene
(αf )(tx + (1 − t)y) = αf (tx + (1 − t)y)
≤ α(tf (x) + (1 − t)f (y))
= tαf (x) + (1 − t)αf (y)
= t(αf )(x) + (1 − t)(αf )(y)
y por consiguiente αf es convexa.

Ejemplo 10. Si f : R → R y g : R → R son las funciones definidas por f (x) = |x| y

g(x) = x2 entonces (f + g)(x) = |x| + x2 , para todo x ∈ R, es convexa, porque f y g son
convexas.
Ejemplo 11. Como la función h : (0, ∞) → R definida por h(x) = x−1 es convexa
tenemos que la función (3h)(x) = 3x−1 definida sobre (0, ∞) también es convexa.
Corolario 1. Sean I ⊂ R un intervalo y {fn }n∈N una sucesión de funciones fn : I → R

∞
X
convexas. Si la serie fn (x) converge a f (x) para cada x ∈ I, entonces f es una función
n=1
convexa sobre I.
Demostración: Sea {gn }n∈N la sucesión de funciones gn : I → R definidas como

sigue:


 f (x) n=1, para todo x ∈ I

 1
gn (x) = f1 (x) + f2 (x) n=2, para todo x ∈ I



 f (x) + f (x) + ... + f (x)
1 2 m n=m
Entonces
∞
X
f (x) = fn (x) = lı́m gn (x), para todo x ∈ I.
n→∞
n=1
Luego, para todo t ∈ [0, 1] y x, y ∈ I se verifica
f (tx + (1 − t)y) = lı́m gn (tx + (1 − t)y)

n→∞
≤ lı́m (tgn (x) + (1 − t)gn (y))

n→∞
= t lı́m gn (x) + (1 − t) lı́m gn (y)

n→∞ n→∞
= tf (x) + (1 − t)f (y)

∞
X
lo cual implica que f = fn es convexa. ¤
n=1
En el siguiente teorema se presentan las condiciones para que su composición sea una
función convexa o cóncava.
Teorema 11. Sean I ⊂ R un intervalo y f : I → R y g : f (I) → R funciones. Entonces:

1) Si f es convexa y g es convexa y creciente, entonces g ◦ f es convexa.
2) Si f es cóncava y g es convexa y decreciente, entonces g ◦ f es convexa.
3) Si f es cóncava y g es cóncava y creciente, entonces g ◦ f es cóncava.
4) Si f es convexa y g es cóncava y decreciente, entonces g ◦ f es cóncava.
Demostración: Sean x, y ∈ I y t ∈ [0, 1]. Entonces
1)(g ◦ f )(tx + (1 − t)y) = g(f (tx + (1 − t)y))
≤ g(tf (x) + (1 − t)f (y)) f es convexa y g creciente
≤ tg(f (x)) + (1 − t)g(f (y)) ya que g es convexa
= t(g ◦ f )(x) + (1 − t)(g ◦ f )(y).
2)(g ◦ f )(tx + (1 − t)y) = g(f (tx + (1 − t)y))
≤ g(tf (x) + (1 − t)f (y)) f es cóncava y g decreciente
≤ tg(f (x) + (1 − t)f (y)) ya que g es convexa
= t(g ◦ f )(x) + (1 − t)(g ◦ f )(y).
3)(g ◦ f )(tx + (1 − t)y) = g(f (tx + (1 − t)y))
≥ g(tf (x) + (1 − t)f (y)) f es cóncava y g es creciente
≥ tg(f (x)) + (1 − t)g(f (y)) ya que g es cóncava
= t(g ◦ f )(x) + (1 − t)(g ◦ f )(y).
4)(g ◦ f )(tx + (1 − t)y) = g(f (tx + (1 − t)y))
≥ g(tf (x) + (1 − t)f (y)) f convexa y g decreciente
≥ tg(f (x)) + (1 − t)g(f (y)) porque g es cóncava
= t(g ◦ f )(x) + (1 − t)(g ◦ f )(y). ¤

Ejemplo 12. Si f : (0, ∞) → R y g : (0, ∞) → R son las funciones definidas por

f (x) = x−1 y g(x) = x3 entonces (g ◦ f )(x) = x−3 es convexa sobre (0, ∞) porque f es
convexa y g es convexa y creciente.
Ejemplo 13. Como las funciones f : (0, ∞) → R y g : (0, ∞) → R definidas por

√
f (x) = x y g(x) = x−1 son tales que f es cóncava y g es convexa y decreciente se
1
concluye que la función (g ◦ f )(x) = x− 2 es convexa sobre (0, ∞).
Ejemplo 14. Si f : (0, ∞) → R y g : (o, ∞) → R son las funciones definidas por

√ √
f (x) = x y g(x) = ln(x) entonces (g ◦ f )(x) = ln( x) es cóncava sobre (0, ∞) pues f
es cóncava y g es cóncava y creciente.
En el próximo teorema se exhiben las condiciones bajo las cuales el producto de

funciones convexas, es una función convexa.
Teorema 12. Sean I ⊂ R un intervalo y sean f : I → R y g : I → R funciones no

negativas, crecientes y convexas, entonces la función h = f · g es no negativa, creciente
y convexa.
Demostración Si f y g son crecientes y no negativas, se tiene que para cualesquiera

x, y ∈ I tales que x < y se verifica
0 ≤ f (x) ≤ g(x)
y
0 ≤ g(x) ≤ g(y)
entonces
0 ≤ h(x) = f (x)g(x) ≤ f (y)g(y) = h(y)
y por lo tanto h es creciente y no negativa.
Para demostrar la convexidad se usa el echo de que si x < y se verifica
(f (x) − f (y))(g(y) − g(x)) ≤ 0

es decir
f (x)g(y) + f (y)g(x) ≤ f (x)g(x) + f (y)g(y).
Usando esta desigualdad se tiene que para todo t ∈ [0, 1] y x, y ∈ I se cumple
h(tx + (1 − t)y) = f (tx + (1 − t)y)g(tx + (1 − t)y)
≤ (tf (x) + (1 − t)f (y))(tg(x) + (1 − t)g(y))
= t2 f (x)g(x) + t(1 − t)(f (x)g(y) + f (y)g(x)) + (1 − t)2 f (y)g(y)
≤ t2 f (x)g(x) + t(1 − t)(f (x)g(x) + f (y)g(y)) + f (y)g(y)
−2tf (y)g(y) + t2 f (y)g(y)
= t2 f (x)g(x)tf (x)g(x) + tf (y)g(y) − t2 f (x)g(x) − t2 f (y)g(y)
+f (y)g(y) − 2f (y)g(y) + t2 f (y)g(y)
= tf (x)g(x) + f (y)g(y) − tf (y)g(y)
= tf (x)g(x) + (1 − t)f (y)g(y)
= th(x) + (1 − t)h(y)
Esto implica que
h(tx + (1 − t)y) ≤ th(x) + (1 − t)h(y)
por lo que h = f ◦g es convexa. ¤

El teorema que anunciaremos a continuación establece bajo que condiciones el supre-
mo de una familia arbitraria de funciones convexas, es una función convexa.
Teorema 13. Sea {fα } una familia arbitraria de funciones convexas definidas sobre el
intervalo I, y sea f (x) = sup fα (x). Si J = {x ∈ I : f (x) < ∞} es un conjunto no vacı́o,
entonces J es un intervalo y f es una función convexa sobre J.
Demostración: Si t ∈ [0, 1] y x, y ∈ J es decir f (x) < ∞ y f (y) < ∞, entonces
f (tx + (1 − y)y) = sup fα (tx + (1 − t)y)
≤ sup(tfα (x) + (1 − t)fα (y))
≤ t sup fα (x) + (1 − t) sup fα (y)
= tf (x) + (1 − t)f (y) < ∞.
Esto demuestra que f es convexa sobre J y además que si x, y ∈ J, entonces f (tx +

(1 − t)y) < ∞, lo cual significa que tx + (1 − t)y ∈ J y por lo tanto J es un intervalo.¤
En el teorema que sigue, se dan condiciones para que la inversa de una función sea
cóncava o convexa.
Teorema 14. Sean I ⊂ R un intervalo abierto y f : I → R una función estrictamente

monótona. Sea f −1 : f (I) → I la función inversa de f. Entonces
1) Si f es convexa y creciente, entonces f −1 es cóncava.
2) Si f es convexa y decreciente, entonces f −1 es convexa.
3) Si f es cóncava y creciente, entonces f −1 es convexa.
4) Si f es cóncava y decreciente, entonces f −1 es cóncava.
Demostración: Sean x, y ∈ f (I) y t ∈ [0, 1]. Si u = f −1 (x) y f −1 (y), entonces:
1) Como f es convexa se verifica
f (tu + (1 − t)v) ≤ tf (u) + (1 − t)f (v)
= tx + (1 − t)y,
y por ser f −1 creciente, asi se tiene que
f −1 (f (tu + (1 − t)v)) ≤ f −1 (tu + (1 − t)v)
luego
tu + (1 − t)v ≤ f −1 (tx + (1 − t)y)
es decir
tf −1 (x) + (1 − t)f −1 (y) ≤ f −1 (tx + (1 − t)y)
y en consecuencia f −1 es cóncava.
2) De la convexidad de f
f (tu + (1 − t)v) ≤ tx + (1 − t)y,
y como f −1 es decreciente, se verifica
f −1 (f (tu + (1 − t)v)) ≥ f −1 (tx + (1 − t)y)
luego
tu + (1 − t)v ≥ f −1 (tx + (1 − t)y)
es decir
tf −1 (x) + (1 − t)f −1 (y) ≥ f −1 (tx + (1 − t)y)
por lo tanto f −1 es convexa.

3) De la concavidad de f
tf (u) + (1 − t)f (v) ≤ f (tu + (1 − t)v)
y por ser f −1 creciente, se tiene que
f −1 (tf (u) + (1 − t)f (v)) ≤ f −1 (f (tu + (1 − t)v))
luego
f −1 (tf (u) + (1 − t)f (v)) ≤ tu + (1 − t)v
es decir
f −1 (tx + (1 − t)y) ≤ tf −1 (x) + (1 − t)f −1 (y)
por lo tanto f −1 es convexa.

4) Como f es cóncava se cumple lo siguiente
tf (u) + (1 − t)f (v) ≤ f (tu + (1 − t)v)

y como f −1 es decreciente
f −1 (tf (u) + (1 − t)f (v)) ≥ f −1 (f (tu + (1 − t)v))
ası́
f −1 (tx + (1 − t)y) ≥ tu + (1 − t)v
es decir
f −1 (tx + (1 − t)y) ≥ tf −1 (x) + (1 − t)f −1 (y)
por lo tanto f −1 es cóncava. ¤
Ejemplo 15. Sea f : R → R la función definida por f (x) = ex es convexa y creciente,

su inversa f −1 : (0, ∞) → R definida por f −1 (x) = ln(x) es cóncava.
Además, por ser la función g : R → R definida por g(x) = e−x convexa y decreciente,
su inversa g −1 : (0, ∞) → R definida por g −1 (x) = − ln(x) es convexa
Figura 1.15: La función L2 (f ) no es convexa
Otros resultados de interés de caracterizaciones de funciones cuasi-convexas diferen-

ciables, demostrado por el premio Nobel de economı́a del año 1972, K. J. Arrow y A. C.
Enthoven se pueden verificar en [4].
CAPÍTULO 2
DESIGUALDAD DE SIMPSON
Un problema que se presenta con frecuencia en las ciencias experimentales y de

ingenierı́a es tratar de construir una función (denominada “función interpolante”) de la
que se conoce una serie de datos (denominados “datos de interpolación”). Estos datos
pueden ser fruto de las observaciones realizadas en un determinado experimento en el que
se relacionan dos o más variables e involucran valores de una función o de sus derivadas.
Por su sencillez y operatividad los polinomios se usan frecuentemente como funciones
interpolantes.
2.1 Interpolación
Supongamos que hay dos magnitudes x, y de los que se conocen n + 1 valores
relacionados {(x0 , y0 ), (x1 , y1 ), · · · , (xn , yn )}, por ejemplo, datos obtenidos en una expe-
rimentación. Con la condición xi 6= xj , si i 6= j.
Nos planteamos si existe una función p tal que
p(xk ) = yk k = 0, · · · , n (2.1)
es decir, queremos una función cuya gráfica “pase”por los puntos del plano dados. Si p
62
Cap. 2 Desigualdades 63
verifica (2.1) diremos que p interpola los datos dados, p es una función de interpolación
para los datos (xk , yk ), k = 0, · · · , n.
Este tipo de problemas suele darse cuando tenemos datos obtenidos por experi-
mentación y sabemos que hay una función f que rige el proceso pero que desconocemos
y queremos trabajar con una función alternativa p que represente bien a esos datos de la
muestra. Si f rige el proceso entonces f (xk ) = yk luego exigiremos a la función p ese mis-
mo requisito, esto nos proporciona condiciones que imponer a p con las que trataremos
de obtenerla y una vez conseguido nos permitirı́a conocer o predecir que habrá pasado
en otros x en los que no se ha experimentado.
Supongamos que existe la función f tal que f (xk ) = yk , k = 0, · · · , m. Caben
varias preguntas:
1 La función p que interpola los datos dados ¿de qué tipo ha de ser? ¿polinómica,
trigonométrica, racional? La respuesta vendrá dada por los datos yk .
1.1 Si se observa que los datos presentan periodicidad entonces buscaremos a p

dentro de las funciones trigonométricas.
1.2 Si los datos presentan ası́ntotas entonces p deberı́a ser una función racional.
1.3 Si los yk presentan un comportamiento polinomial, entonces p se escogerı́a de

tipo polinómico.
2 Una vez escogido el tipo de función habrá que responder dos cuestiones, ¿Existe p
del tipo escogido que interpole los datos dados? Y si existe, ¿es única?
3 ¿Es la función polinómica escogida una buena aproximación de la función original

f en los puntos x que no son de la muestra?
2.2 Integración numérica y cuadratura

Uno de los problemas más antiguos es el del cálculo del área que encierra una curva.
La integral resuelve el problema de calcular el área bajo la gráfica de una función posi-
tiva definida sobre un intervalo cerrado. Como sabemos, la regla de Barrow resuelve el
problema de calcular la integral de una función en un intervalo [a, b], mediante la fórmula
Z b
f (x)dx = F (b) − F (a),
a
siendo F una primitiva de la función f en el intervalo [a, b], es decir, F 0 (x) = f (x),
para todo x ∈ [a, b]. Sin embargo, en muchos casos, esto no es posible, dado que
• Para ciertas funciones no es posible calcular dichas primitiva, a pesar de saber que
existe. Por ejemplo, para las funciones
2 sin x √
f (x) = ex , f (x) = , f (x) = x5 + 1
x
no es posible encontrar una primitiva expresable en término de funciones elemen-

tales.
• En muchos problemas que se plantean, a la hora de integrar funciones, están rela-

cionados con funciones definidas en forma de tabla de valores o gráficas y no se
conoce una expresión analı́tica de f (x).
En ambos casos se precisa de fórmulas de integración numérica (también llamadas

fórmulas de cuadratura), que nos van a permitir calcular un valor aproximado de
la integral de la forma
Z b n
X
f (x)dx ≈ ai f (xi ),
a i=0
donde los xi , con i = 0, 1, · · · , n son puntos del intervalo [a, b] y los coeficientes ai ,
con i = 0, · · · , n, son números reales elegidos convenientemente.
2.3 Fórmulas de integración de tipo interpolatorio

Para obtener fórmulas de integración numérica seguiremos, ´basicamente, el procedimien-
to basado en calcular el polinomio de interpolación de la función f en algunos puntos del
intervalo [a, b] y aproximar el valor de la integral de la función por el valor de la integral
del polinomio de interpolación. En concreto,
Z b Z b
f (x)dx ≈ Pn (x)dx,
a a
donde
n
X
Pn (x) = f (xi )Li (x), x ∈ [a, b]
i=0
es el polinomio de interpolación de f en los n+1 puntos distintos, xi con i = 0, · · · , n,

del intervalo [a, b]. Integrando esta expresión en [a,b] obtenemos
Z b n
X
Pn (x)dx = ci f (xi ),
a i=0
siendo
Z b
ci = Li (x)dx,
a
para i = 0, 1, · · · , n. Nótese que los coeficientes ci , con i = 0, 1, · · · , n, son independi-

entes de f y, por tanto, una vez calculados, proporcionan una fórmula que se puede que
se puede aplicar a cualquier función f : [a, b] → R.
Además será necesario estudiar el error que se comete en este tipo de fórmulas,
es decir, el valor de
Z b Z b Z b
Rn (f ) = f (x)dx − Pn (x)dx = En (x)dx,
a a a
con En (x) = f (x) − Pn (x), en [10], el estudio del error de interpolación se prueba que
si f ∈ Cn+1 ([a, b]), se tiene que
f (n+1) (ξx )
En (x) = P in (x),
(n + 1!)
con Πn (x) = (x − x0 )(x − x1 ) · · · (x − xn ) y donde ξx es un punto intermedio entre
x0 , x1 · · · , xn , x. Entonces, en este caso el error de integración que se comete es
Z b Z b
f (n+1)(ξx )
Rn (f ) = En (x)dx = Πn (x)dx.
a a (n + 1)!
Para determinar una expresión explı́cita del error de integración Rn (f ), resulta de
utilidad el siguiente resultado conocido como teorema del valor medio generalizado:
Teorema 15. (Ver[10]) Sean h, g : [a, b] → R funciones continuas en [a, b] y supongamos

que g no cambia de signo en [a, b], entonces
Z b Z b
h(x)g(x)dx = h(ξ) g(x)dx,
a a
donde ξ es un punto del intervalo (a, b).
Por otro lado, es obvio que si f es un polinomio de grado menor o igual que n,
entonces f coincidirá con su polinomio de interpolación. En consecuencia, las fórmulas
de tipo interpolatorio sobre n + 1 puntos distintos son exactas para todos los polinomios
de grado menor o igual que n, en el sentido de que
Rn (f ) = 0.
La próxima sección (2.4) está basada básicamente en las siguientes referencias [23],
[34], [52].
2.4 Fórmulas básicas de integración numérica

Fórmula del rectángulo
La fórmula de integración más sencilla es aquella que utiliza el valor de la función f en
un solo punto x0 ∈ [a, b]. En este caso el polinomio de interpolación de la función f es de

grado, es decir, P0 (x) = f (x0 ), por lo que
Z b Z b Z b
f (x)dx ≈ P0 (x)dx = f( x0 )dx = f (x0 )(b − a).
a a a
Si x0 = a se obtiene la fórmula del rectángulo izquierdo dado por

Z b
f (x)dx ≈ f (a)(b − a). (2.2)
a
Si la función f ∈ C1 ([a, b]), el error cometido al usar la fórmula (2.2) es
Z b Z b
0 0 f 0 (ξ)
R0 (f ) = f (ξx )(x − a)dx = f (ξ) (x − a)dx = (b − a)2 ,
a a 2
con ξ ∈ (a, b). Para deducir esta fórmula del error hemos utilizado el Teorema 15
puesto que la función Π0 (x) = (x − a) no cambia de signo en [a, b].
Observación 4. • Un resultado similar se obtiene si x0 = b, en este caso la fórmula

de integración se denomina fórmula del rectángulo derecho,
Z b
f (x)dx ' f (b)(b − a),
a
f 0 (ξ)
(b − a)2 . R0 (f ) = −
2
Rb
• Geométricamente, si f (x) ≥ 0 en [a, b], el valor de a f (x)dx se aproxima por el
área del rectángulo de base (b − a) y altura f (a) o f (b).
a+b
En el caso de que x0 = 2
, se obtiene la fórmula del punto medio dada por
Z b µ ¶
a+b
f (x)dx ' f (b − a). (2.3)
a 2
Para obtener una expresión explı́cita del error de integración que se comete usan-
do esta fórmula, suponemos que la función f ∈ C2 ([a, b]) y hacemos uso del siguiente
a+b
desarrollo de Taylor de la función f en el punto 2
,
µ ¶ µ ¶µ ¶ µ ¶2
a+b 0 a+b a+b f 00 (ξ) a+b
f (x) = f +f x− + x− .
2 2 2 2 2
Integrando ambos miembros y usando la fórmula (2.3), se obtiene que
Z b µ ¶
a+b f 00 (ξ)
R0 (f ) = f (x)dx − f (b − a) = (b − a)3 ,
a 2 24
con ξ ∈ (a, b). De nuevo para deducir esta fórmula del error hemos utilizado el Teo-
¡ ¢2
rema 15 usando en esta ocasión que la función x − a+b2
no cambia de signo en [a, b].
la fórmula (2.3) es especialmente interesante, puesto que si observamos el término que
nos da el error, podemos comprobar que se trata de una fórmula de integración de orden
uno, debido a que f 00 (x) = 0, para todo x ∈ (a, b), si f es un polinomio de grado menor
o igual que uno.
Fórmula del trapecio
Se trata de una fórmula de integración con dos puntos. en este caso el polinomio de
interpolación de la función f es de grado uno. En concreto, si consideramos los puntos
x0 , x1 ∈ [a, b], el polinomio de interpolación de la función f será
f (x1 ) − fx0
P1 (x) = f (x0 )f [x0 , x1 ](x − x0 ) = f (x0 ) + (x − x0 ).
x1 x0
Podemos entonces obtener la siguiente fórmula de integración numérica
Z b Z bµ ¶
f (x1 ) − f (x0 )
f (x)dx ' f (x0 ) + (x − x0 ) dx.
a a x1 − x0
Para el caso particular x0 = a, x1 = b se obtiene la fórmula del trapecio que viene
dada por
Z b
b−a
f (x)dx ' (f (a) + f (b)). (2.4)
a 2
Además, si suponemos que f ∈ C2 ([a, b]) y dado que la función Π1 (x)(x − a)(x −
b) no cambia de signo en el intervalo [a, b], entonces la aplicación del Teorema 15 nos
proporciona
Z b Z b
f 00 (ξx ) f 00 (ξ) f 00 (ξ)
R1 (f ) = (x − a)(x − b)dx = (x − a)(x − b)dx = − (b − a)3 .
a 2! 2 a 12
donde ξ es un punto del intervalo (a, b).
Observación 5. • La expresión del error asegura que la fórmula (2.4) es exacta para,
polinomios de grado no mayor que uno.
• Geométricamente, si f (x) ≥ 0 en [a, b], la fórmula del trapecio aproxima el valor de

Rb
a
f (x)dx por el área del trapecio resultante de unir los puntos (a, 0), (b, 0), (b, f (b))
y (a, f (a)).
Fórmula de Simpson Se trata de una fórmula para tres puntos, pero consigue
exactitud para los polinomios de grado menor o igual que tres, considerando los puntos
a+b
x0 = a, x1 = 2
y x2 = b. Por integración del polinomio de interpolación, se deduce
facilmente que
Z b µ µ ¶ ¶
b−a a+b
f (x)dx ≈ f (a) + 4f + f (b) . (2.5)
a 6 2
La deducción del error en la fórmula (2.5) es un poco más laboriosa. Para ello, hay
que suponer que f ∈ C4 ([a, b]), integrar el desarrollo de Taylor de orden tres de la función
f en el punto x1 y aplicar el Teorema 15, obteniéndose que
f 4 (ξ)
R2 (f ) = − (b − a)5 ,
2880
con ξ ∈ (a, b).
Observación 6. • La fórmula de Simpson es una de las fórmulas de integración

numérica más usadas en la práctica.
• En cuanto a la precisión, la expresión del error R2 (f ), en términos de la derivada

cuarta de f, confirma que la fórmula es exacta para los polinomios de grado menor
o igual que tres. Sin embargo, se obtiene a partir de la integración de un polinomio
de grado dos. La fórmula (2.5) tiene pues un grado más de exactitud.
Definición 8. (Fórmula de cuadratura) Sean {x0 < · · · < xn } ⊂ [a, b], n + 1 puntos
distintos y f ∈ C0 ([a, b]) una función dada. Una fórmula de cuadratura In con n + 1
nodos (puntos de cuadratura) es de la forma
n
X
In (f ) = αk f (xk ) (2.6)
k=0
donde αk ∈ R, son los pesos de cuadratura, y xk ∈ [a, b], k = 0, · · · , n son los nodos
de cuadratura.
Definición 9. (Error) Llamaremos E(f ) = I(f ) − In (f ) el error en una fórmula de

cuadratura.
Definición 10. (Orden) Diremos que una fórmula de cuadratura es de orden m ∈ N si


 E(p) = 0 para cada p ∈ Pm ][x]
p(t) =
 E(q) 6= 0 para algun q ∈ P
m+1 [x].
Observación 7. Debido a la linealidad de la integral (??) y la linealidad de la suma

(2.6), se tiene que el error E[.] es un funcional lineal. Luego, podemos definir el orden de
una fórmula de cuadraturade forma equivalente como sigue: Una fórmula de cuadratura
es de orden m ∈ N si

 E(xk ) = 0 para k = 0, · · · , m
 E(xm+1 ) 6= 0.
Ejemplo 16. Fórmula de cuadratura de punto medio
µ ¶
a+b
I0 (f ) = (b − a)f
2
es exactamente de orden 1. En efecto, aplicando la fórmula anterior se tiene
Z b
E(1) = 0 ⇔ I(1) − I0 (1) = 0 ⇔ dx − (b − a) = 0;
a
Z b µ ¶
a+b
E(x) = 0 ⇔ I(x) − I0 (x) = 0 ⇔ xdx − (b − a) = 0;
a 2
Z b µ ¶2
2 2 2 2 a+b
E(x ) = 0 ⇔ I(x ) − I0 (x ) = 0 ⇔ x dx − (b − a) 6= 0.
a 2
Ejemplo 17. Fórmula de cuadratura de Simpson
µ µ ¶ ¶
b−a a+b
I2 (f ) = f (a) + 4f + f (b)
6 2
es exactamente de orden 3.
Algoritmo de Lagrange Fijados un soporte de n + 1 puntos distintos S =

{x0 , · · · , xn } y unos valores reales (yi )ni=0 cualesquiera, el algoritmo de Lagrange de
construcción del polinomio de interpolación consiste en buscar el polinomio de interpo-
lación pn ∈ Pn[x] de la forma
pn (x) = y0 L0 (x) + y1 L1 (x) + · · · + yn Ln (x), (2.7)
donde Li ∈ Pn [x], Li (xi ) = 1 y Li xj = 0 para cada j 6= i, (es decir, Li es un polinomio

de interpolación asociado a los valores canónicos {0, · · · , 1, · · · , 0}). Usando la unicidad
del polinomio de interpolación, se puede comprobar que Li es de la forma
(x − x0 ) · · · (x − xi−1 )(x − xi+1 ) · · · (x − xn )

Li (x) = , (2.8)
(xi − x0 ) · · · (xi − xi−1 )(xi − xi+1 ) · · · (xi − xn )
con con i = 0, · · · , n y que (2.7) es el polinomio de interpolación buscado.

El conjunto de polinomios {L0 , L1 · · · , Ln } se llama la base de Lagrange aso-
ciado a los puntos (xi )ni=0 . Se trata de una base del espacio vectorial de polinomios de
interpolación asociados a dicho soporte. Identificando el polinomio de interpolación con
los valores (yi )ni=0 , la base de Lagrange son los polinomios de interpolación correspondi-
entes a la base canónica de Rn+1 .
Observación 8. Una ventaja del algoritmo de Lagrange, es que para el mismo soporte
S = (xi )ni=0 y distintos valores (yi )ni=0 , basta calcular la base de Lagrange una sola vez
(los Li solo dependen de S). Esto permitirı́a calcular varios polinomios de interpolación
asociados al mismo soporte S y a distintos valores (yi )ni=0 .
Además, si el soporte S es equidistante, haciendo el cambio de variable afı́n x ∈
[a, b] ↔ t ∈ [0, n], los polinomios Li de la base de Lagrange se transforman en polinomio
li que solo dependen del número de puntos de soporte (y no de la posición de los puntos).
En efecto,
Yn µ ¶ Y n
t−j (−1)n−i n
Li (x) ≡ li (t) = = (t − j), i = 0, ..., n (2.9)
j=0,j6=1
i − j n! i j=0,j6=0
En caso de añadir un punto más al soporte hay que volver a calcular toda la base de
Lagrange asociada.
Definición 11. (Fórmula de cuadratura de tipo interpolatorio (f.c.t.i.)) Sean f ∈

C0 ([a, b]), S = {x0 < x1 < · · · < xn } ⊂ [a, b] un soporte de puntos distintos y pn (x)
el polinomio de interpolación asociado a f y a S. Diremos que una fórmula de cuadratu-
ra In con n + 1 nodos es de tipo interpolatorio si
Z b
In (f ) ≡ I(pn ) = pn (x)dx (2.10)
a
Los puntos de interpolación xk , k = 0, · · · , n son los nodos de la f.c.t.i. Veamos cómo

se pueden calcular los pesos. Debido a (2.7), sabemos que el polinomio de interpolación
pn se expresa respecto de la base de Lagrange como sigue:
n
X
pn (x) = f (xk )Lk , (2.11)
k=0
donde los Lk vienen dados por (2.8). Luego, teniendo en cuenta a (2.11) en (2.10), de-
ducimos que
Z b n
X Z b
pn = f (xk ) Lk (x),
a k=0 a
en consecuencia, una f.c.t.i. es un caso particular de fórmula de cuadratura asociada a

los nodos de interpolación y a los pesos
Z b
αk = Lk (x)dx, k = 0, · · · , n. (2.12)
a
Ejemplo 18. Sea n = 1, x0 = a y x1 = b. Busquemos los pesos α0 y α1 para que la

fórmula de cuadratura I1 (f ) = α0 f (a) + α1 f (b) sea del tipo interpolatorio. Usando (2.12)
y que
x − x1 x−b x − xo x−a
L0 (x) = = , L1 (x) = = ,
x0 − x1 x−a x1 − x0 b−a
tenemos
Z b
x−b b−a
α0 = dx = ,
a a−b 2
Z b
x−a b−a
α1 = dx = ,
a b−a 2
de donde obtenemos la fórmula del trapecio
b−a
I1 (f ) = (f (a) + f (b)).
2
a+b
Para n = 2, x0 = a, x1 = 2
, x2 = b haciendo cálculos similares se obtiene la fórmula
de Simpson
µ µ ¶ ¶
b−a a+b
I2 (f ) = f (a) + 4f + f (b) .
6 2
Dado que una integral es el lı́mite de una suma infinita, es natural que su aproxi-
mación consista en una suma finita de muestras, ponderadas con pesos wi , del integrando
f (xi ). Dicha suma se denomina fórmula de cuadratura.
Nota Histórica En el año 1615 Johanes Kepler establece la llamada regla
del tonel y sobre la historia de su surgimiento, Kepler la describe en la dedicatoria de
su publicación (Nova Stereometria doliorum vinariorum). Después de que la primera
esposa de Kepler habı́a muerto en Praga en 1611, Kepler se casó nuevamente y para la
boda compró algunos toneles de vino; con el vino en la bodega, el vendedor, con una
vara de medir, determinó el contenido de los barriles sin calcular, utilizando un método,
que consiste en introducir una vara de metal, y medir a través del barril, en diagonal
hacia los bordes del fondo de los barriles de vino, la marca en la vara arrojaba la
medida del volúmen del contenido. Kepler se sorprendió de que una diagonal a través del
medio del barril pudiera dar una medida sobre el volúmen y puso en duda la exactitud
de este método debido a que, por ejemplo, un barril muy bajo que tuviera una base
algo más ancha y por eso un volúmen mucho menor, podrı́a tener el mismo radio a la vista.
A raı́z de esto, Kepler formuló el escrito de un nuevo cálculo del contenido de barriles
en el que buscaba métodos verificables para la medición de los toneles de vino. Para ello
la metodologı́a que empleó fué la siguiente.
Consideró en primer lugar el caso de los barriles cilı́ndricos, considera λ a la distancia
ND que hay entre el hoyo de llenado y el talón de los fondos, 2x a la altura AB del barril
y 2y al diámetro AD del barril.
Figura 2.1: Medidas del barril
Por el teorema de Pitágoras, se tiene que x2 + 4y 2 = λ2 . Por tanto, el volúmen del

barril podrı́a ser calculado, de la siguiente manera
1
V = πr2 h = πy 2 2x = πx(λ2 − x2 ).
2
La obsevación crucial hecha por Kepler fué entonces que todos los barriles austriacos
se fabricaban con la misma razón entre la altura y el diámetro.
x
En efecto, considerando la razón t = y
y empleando las dos expresiones anteriores, se
tiene
−2
V = 2πλ3 t(4 + t2 ) 3 .
De esta fórmula se observa, que el volúmen V de un barril cilı́ndrico depende de

x
λ y la razón t = y
no se determina solamente conociendo el valor de λ. Para que se
pueda utilizar el método de medición de los toneles austriacos, los barriles tendrı́an que
fabricarse con una relación t fija.
Debido a los estudios publicados por Kepler, Thomas Simpson (1710-1761) realiza
investigaciones posteriores y con el conocimiento de cálculo diferencial realizado por el
matemático alemán Gottfried Leibniz (1646-1716) sobre la función, e integral y en 1743
encuentra una aproximación para el cálculo de área la cual se denominará Regla de
Simpson en el intervalo [a, b] y se denota de la siguiente forma
Z · ¸
b−a a+b
f (x)dx ≈ f (a) + 4f + f (b) .
6 2
Para efectos de la demostración del método de Simpson, se asume cada sub área como
un pequeño arco de la parábola de la forma f (x) ≈ ax2 + bx + c con lı́mite inferior a y
a+b
lı́mite superior b por ende la mitad del de la pequeña sub área es 2
(Ver Figura 2.2)
f(x)
f(b)
f((a+ b)/2)
g(x)
f(a)
a (a+ b)/2 b
Figura 2.2: Representación geométrica de la Desigualdad de Simpson
La aproximación de una función f (x) a ser integrada usanto la regla de Simpson

(cálculo de valor cuadrático), g(x).
Esta última aproximación se puede generalizar evaluando la función en un intervalo
de tal forma que la función f (x) se evalua en los extremos a, b y un punto central a+b 2
.
¡ a+b ¡ a+b ¢¢
La ecuación de la parábola que pasa por los puntos (a, f (a)), 2 , f 2 , (b, f (b))
y viene dada por
¡ ¢ µ ¶
x − a+b
2 (x − a)(x − b) a+b (x − a)(x − a+b
2
)
g(x) ≈ ¡ b−a ¢ f (a) + b−a a−b
f + b−a
f (b)
(b − a) 2 ( 2 )( 2 ) 2 (b − a)( 2 )
resultando de la siguiente forma:

Z b · µ ¶ ¸
(b − a) a+b
g(x)dx ≈ f (a) + 4f + f (b)
a 6 2
La simple inspección visual de esta figura y la que describe el procedimiento de los

trapecios o los rectángulos, confirma que el método de Simpson deberá ser mucho más
exacto que los procedimientos mencionados.
Ahora, se sabe que el área que se desea encontrar serı́a la sumatoria de todas las
sub áreas que se calculen. Al igual que los métodos de la regla trapezoidal y de la regla
rectángular, entre más sub áreas tenga la integral a calcular, más exacto será el valor
encontrado.
En la siguiente sección se estudiarán dos desigualdades de tipo Simpson para la función

cuasi-convexa, en términos de la tercera derivada, como también aplicaciones de la regla
de cuadratura numérica de Simpson.
Además se estudiará la desigualdad de Simpson para funciones Lipschitzianas y
se aplicará a medias especiales tales como media aritmética, media geométrica, media
armónica y media logarı́tmica.
2.5 Desigualdad de Simpson

En los últimos años varios autores han considerado desigualdades, que dan de manera
explı́cita, cotas de errores para fórmulas de cuadraturas ya conocidas y nuevas. Por
esjemplo la desigualdad de Simpson de una cota del error para la bien conocida, regla de
cuadratura de Simpson.
Como se estableció en la introducción del trabajo, el siguiente teorema es bien cono-
cido [17].
Teorema 16. Supóngase que f es una función cuatro veces continuamente diferenciable
sobre (a, b) y
kf (4) k∞ := sup |f (4) (x)| < ∞.
x∈(a,b)
Entonces la siguiente desgualdad

¯Z b · µ ¶ ¸¯
¯ (b − a) a+b ¯ (b − a)5 (4)
¯ f (x)dx − f (a) + 4f + f (b) ¯≤ kf k∞ (2.13)
¯ 6 2 ¯ 2880
a
se satisface, y en la literatura es conocido como la desigualdad de Simpson.

En caso de que f no sea cuatro veces diferenciable ni su cuarta derivada es acota-

da en (a, b), entonces no podemos aplicar la fórmula clasica de la desigualdad de Simpson.
La desigualdad (2.13) se define como la desigualdad de Simpson, donde f : [a, b] → R

se supone es cuatro veces continuamente diferenciable en el intervalo (a, b) y la cuarta
derivada es acotada sobre (a, b), es decir,
||f (4) ||∞ := sup |f (4) (x)|.

x∈(a,b)
Durante los últimos años, muchos autores han establecido varias generalizaciones de
la desigualdad de Simpson, (2.13) para las funciones de variación acotada y funciones
Lipschitzianas, monótonas y funciones absolutamente continuas. Para contrapartes, refi-
namientos y generalizaciones de la desigualda de Simpson verificar [1], [2], [13], [14], [16],
[17], [18], [21], [24] y [45], el cual es el resultado principal de este capı́tulo.
En el año 2000 J. Pecãric y S. Varos̃anec en [45] desarrolló la desigualdad de Simpson
para funciones cuya enésima derivada con n ∈ {0, 1, 2, 3} es de variación acotada. A
continuación se dará el enunciado de la definición de variación acotada y dicho resultado.
Definición 12. Sea u : [a, b] → R una función. Para cada partición π : a = t0 < t1 <
· · · < tn = b del intervalo [a, b], definimos
b
_ n
X
(f ) := sup |u(ti ) − u(ti−1 )|,
π
a i=1
donde el supremo se considera sobre el conjunto de todas las particiones π del intervalo
b
_ _
[a, b]. Si < ∞, decimos que f tiene variación acotada. Se denota por B [a, b] a la
a
familia de todas las funciones de variación acotada sobre [a, b].
Teorema 17. Sea n ∈ {0, 1, 2, 3} y f una función real sobre [a, b] tal que f (n) es de
variación acotada. Entonces
¯Z b · µ ¶ ¸¯ b
_
¯ b − a a + b ¯ ¡ (n) ¢
¯ f (x)dx − f (a) + 4f + f (b) ¯ ≤ Cn(b − a)n+1 f (2.14)
¯ 6 2 ¯
a a
donde,
1 1 1 1
C0 = ; C1 = ; C2 = ; C3 =
3 24 324 1152
b
_
y (f (n) ) es la variación total de f (n) sobre el intervalo [a, b].
a
Se puede notar que en la desigualdad (2.14) cuando n = 0, el resultado fué probado

en el año 1999 por Dragomir en [14]. Ghizzeti en el año 1970 en [24] probó que si f 000 es
W
una función absolutamente continua con variación total ba (f ), entonces (2.14) se cumple
también para n = 3.
Uno de los resultados que demostró S. S. Dragomir en el año 2002 en [18] es que si
existe una división del intervalo [a, b] y αi (i = 0, ..., k + 1) sea k + 2 puntos de modo que
α0 = a, αi ∈ [xi−1 , xi ], (i = 1, ..., k) y αk+1 = b. I que si además f es de variación acotada
entonces se cumple la siguiente desigualdad
¯Z ¯
¯ b Xk ¯
¯ ¯
¯ f (x)dx − (αi+1 − αi )f (xi )¯
¯ a ¯
i=0
· ½ ¾¸ _
b
1 xi + xi+1
< ν(h) + máx |αi+1 − |, i = 0, ..., k − 1 (f )
2 2 a
b
_
< ν(h) (f )
a
Wb
donde ν(h) := máx{hi |i = 0, ...k − 1}, hi := xi+1 − xi , (i = 0, ..., k − 1) y a (f ) es la
variación total de f sobre el intervalo [a, b].
Otro resultado que podemos verificar en [53] que demostró E. Set en el año 2012 es
el siguiente, el cual afirma que si tenemos una función diferenciable f sobre el interior de
I y además |f 0 | cuasi-convexa se obtiene el siguiente resultado
¯ · µ ¶ ¸ Z b ¯
¯1 a + b 1 ¯ 5(b − a)
¯ f (a) + 4f + f (b) − f (x)dx¯¯ ≤ máx{|f 0 (a)|, |f 0 (b)|}.
¯6 2 b−a a 36
Asi mismo se puede verificar en [1] que si f 0 es una función absolutamente continua
sobre el interior de I y |f 00 |q es cuasi-convexa sobre [a, b] entonces la siguiente desigualdad
se cumple
¯ Z b · µ ¶ ¸¯
¯ 1 1 a+b ¯
¯ f (x)dx − f (a) + 4f + f (b) ¯
¯b − a 6 2 ¯
a
"µ ½¯ µ ¶¯ ¾¶ 1q µ ½¯ µ ¶¯q ¾¶ 1q #
(b − a)2 ¯ 00 a + b ¯q ¯ a + b ¯
≤ máx ¯¯f ¯ , |f 00 (b)|q
¯ + máx ¯¯f 00 ¯ , |f 00 (a)|q
¯ .
162 2 2
Otro resultado interesante sobre la desiguadad de Simpson, para funciones acotadas,

que se demostró en [17] y [45] el cual asegura que si f es una función de variación acotada
se va a cumplir la siguiente desigualdad
¯Z b · µ ¶¸¯ b
¯ b − a f (a) + f (b) a + b ¯ 1 _
¯ f (x)dx − + 2f ¯ ≤ (b − a) (f )
¯ 3 2 2 ¯ 3
a a
Wb 1
donde a denota la variación total de f sobre el intervalo [a, b]. La constante 3
es la
mejor posible.
Por otra parte I. Fedotov, y S. S. Dragomir en el año 1999 argumentó en [21] que si f
es una función diferenciable en el interior de I y a, b ∈ int(I) con a < b, y si f 0 ∈ L1 [a, b]
y además γ < f 0 < Γ para todo x ∈ [a, b] la siguiente desigualdad se cumple
Z b µ ¶
1 f (b) − f (a) a+b
|f (x) − f (t)dt − x− |
b−a a b−a 2
1
< (b − a)(Γ − γ)
4
para todo x ∈ [a, b].

Ahora si asumimos que In : a = x0 < x1 < · · · < xn−1 < xn = b es una partición del
intervalo [a, b] y f está por encima, entonces tenemos la fórmula clásica de la cuadratura
de Simpson la cual se define de la siguiente manera
Z b
f (x)dx = As (f, In ) + Rs (f, In ) (2.15)
a
donde As (f, In ) es la regla de Simpson

n−1 n−1 µ ¶
1X 2X xi + xi+1
As (f, In ) =: [f (xi ) + f (xi+1 )]hi + f hi (2.16)
6 i=0 3 i=0 2
y el término residuo Rs (f, In ) que se define de la siguiente forma
b − a (4)
|Rs,n (f, In )| = − ||f || (2.17)
4!5!
satisface el estimado
X n−1
1
|Rs (f, In )| ≤ ||f (4) ||∞ h5i (2.18)
2880 i=0
donde hi = xi+1 − xi para i = 0, ..., n − 1.
Ahora cuando tenemos una partición equidistante de [a, b] dada por
b−a
In : xi := a + i, i = 0, ..., n; (2.19)
n
entonces tenemos la fórmula

Z b
f (x)dx = As,n (f ) + Rs,n (f ) (2.20)
a
donde
n−1 · µ ¶ µ ¶¸
b−aX b−a b−a
As,n (f ) = f a+ i +f a+ (i + 1) (2.21)
6 i=0 n n
n−1 µ ¶
2(b − a) X b − a 2i + 1
+ f a+
3n i=0
n 2
y el resto satisface la estimación
1 (b − a)5 (4)
|Rs,n (f )| ≤ ||f ||∞ (2.22)
2880 n4
(b−a)
Teorema 18. (Ver [56]) Sea f ∈ C4 ([a, b], R), con h = 2
y X0 = a, x1 = x0 + h, x2 =
b. Entonces existe x ∈ (a, b) tal que
Z b
h h5 (4)
E(f ) := f (x)dx − (f (x0 ) + 4f (x1 ) + f (x2 )) = − f (x)
a 3 90
Notemos que en algunos sitios de la literatura, la acotación es escrita en térmionos
de (b − a) como
(b − a)5 (4)
E(f ) = − f (x)
2880
Demostración
Definamos F (t) = f (x(t)). Entonces dx = hdt, y
Z x2 Z 1
f (x)dx = h F (τ )dτ
x0 −1
En términos de esta función el error de integración se escribe como
Z b µ ¶ µZ 1 ¶
h a+b 1
f (x)dx− (f (a)+4f +f (b)) = h F (τ )dτ − (F (−1) + 4F (0) + F (1)) .
a 3 2 −1 3
Definimos
Z t
1
G(t) = F (τ )dτ − (F (−t) + 4F (0) + F (t))
−t 3
para t ∈ [−1, 1]. En particular, h(G(1)) es el error de integración que estamos tratando
de estimar. Consideremos la función
H(t) = G(t) − t5 G(1).
Como H(0) = H(1) = 0 por el teorema de Rolle existe ξ1 ∈ (0, 1) tal que H 0 (ξ) = 0,
Como H 0 (0) = 0, entonces existe ξ2 ∈ (0, 1) tal que H (2) (ξ2 ) = 0. Como H (2) (0) = H (3) =
0, se puede aplicar el Teorema de Rolle repetidamente para encontrar que existe µ ∈ (0, 1)
tal que
H (3) (µ) = 0.
Notemos que la tercera derivada de G es dada por G(3) (t) = − 3t (F (3) (t) − F (3) (−t)),
por lo que
µ
H (3) (µ) = − (F (3) (µ) − F (3) (−µ)) − 60µ2 G(1) = 0.
3
Reescribiendo esta escuación como
2 F (3) (µ) − F (3) (−µ) 2

− µ2 = µ2 90G(1).
3 (µ − (−µ)) 3
2µ2
Usando que µ 6= 0, se puede dividir por ambos lados por 3
. Y por el Teorema del
valor medio, existe x ∈ (−µ, µ) tal que
90G(1) = −F (4) (ξ),
de donde se otiene el error, despues de multiplicar por h,
h (4)
hG(1) = − F (ξ).
90
Ahora nótese que haciendo un cambio de variables x = x1 + th
(4) d4 d4
F (t) = 4 f (x) = 4 (x1 + ht) = h4 f (4) (x).
dt dt
¤
De aqui se desprende que la cota del error
¯Z b ¯
¯ ¯ 1
¯
E2 (f ) = ¯ f (x)dx − I2 (f )¯¯ ≤ h5 M4 ,
a 90
donde M4 es la cota superior sobre el valor absoluta de la cuarta derivada sobre el
intervalo [a, b].
A continuación enunciaremos la siguiente definición que nos ayudará a demostrar el
la desigualdad de Simpson para funciones cuasi-convexas, el cual es uno de los resultados
principales, y se encuentra en [3] de este Trabajo Especial de Grado.
Definición 13. Una función F : [a, b] → R se llama absolutamente continua si para todo
ε > 0 existe un δ > 0 tal que para toda familia {(ai , bi )} de intervalos disjuntos en [a, b]
n
X n
X
tal que (bi − ai ) < δ se cumple la desigualdad |F (bi − F (ai ))| < ε
k=i i=1
2.5.1 Desigualdad de Simpson para Funciones Cuasi-Convexas
Lema 2. Sea f : I ⊆ R → R una función absolutamente continua en I 0 tal que f 000 ∈

L[a, b], donde a, b ∈ I con a < b. Si |f 000 | es cuasi-convexa en [a, b] entonces
Z b · µ ¶ ¸ Z 1
(b − a) a+b 4
f (x)dx − f (a) + 4f + f (b) = (b − a) p(t)f 000 (ta + (1 − t)b)dt
a 6 2 0
donde
 ¢ £ ¤ ¡

t − 12 1 2
si t ∈ 0, 21 ;
t
6
p(t) =
 1 (t − 1)2 ¡t − 1 ¢ si t ∈ ( 1 , 1].
6 2 2
·
Demostración: Sean I,I1 e I2 definidas de la siguiente manera:
Z 1
I = p(t)f 000 (ta + (1 − t)b)dt
0
Z 1 µ ¶
1 2
2 1
= tf 000 (ta + (1 − t)b)dt
t−
6 0 2
Z µ ¶
1 1 2 1
+ (t − 1) t − f 000 (ta + (1 − t)b)dt
6 12 2
Z 1 µ ¶
1 2
2 1
I1 = t t− f 00 (ta − (1 − t)b)dt
6 0 2
e
Z 1 µ ¶
1 2 1
I2 = (t − 1) t− f 000 (ta + (1 − t)b)dt. (2.23)
6 1
2
2
para resolver I1 por partes, consideremos el siguiente cambio de variables

µ ¶
2 1
u=t t−
2
entonces
du = (3t2 − t)dt
y
dv = f 000 (ta + (1 − t)b)dt
luego
f 00 (ta + (1 − t)b)
v=
a−b
realicemos otro cambio de variables dado por
u1 = ta + (1 − t)b
ası́
du1 = (a − b)dt
reescribiendo
du1
= dt
a−b
además
dv1 = f 00 (ta + (1 − t)b)
y
1
f 00 (ta + (1 − t)b)
v1 =
a−b
Ã µ ¶ 00 ¯1 " Z 1 #!
1 2 1 f (ta + (1 − t)b) ¯¯ 2 1 2
luego I1 = t t− ¯ − f 00 (ta + (1 − t)b)(3t2 − t)dt .
6 2 a−b 0 a−b 0
Definamos Iˆ1 de la siguiente manera

Z 1
2 f 00 (ta + (1 − t)b)(3t2 − t)
Iˆ1 = dt
0 a−b
calculemos I10 por partes haciendo un cambio de variable con
u2 = 3t2 − t
du2 = (6t − 1)dt

y
dv2 = f 00 (ta + (1 − t)b)
f 0 (ta + (1 − t)b)
v2 =
a−b
¯ 1 "Z 1 #
(3t2
− t)f 0
(ta + (1 − t)b) ¯2 2 (6t − 1)f 0 (ta + (1 − t)b)
Iˆ1 = ¯ −
¯ dt
(a − b)2 0 0 a−b
a continuación consideremos la siguiente notación de Iˆ2
Z 1
2 (6t − 1)f 0 (ta + (1 − t)b)
Iˆ2 = dt
0 a−b
calculamos Iˆ2 por partes haciendo el cambio de variable
u3 = 6t − 1
du3 = 6dt
y
dv3 = f 0 (ta + (1 − t)b)dt
f (ta + (1 − t)b)
v3 =
a−b
se obtiene que
Z 1
(6t − 1)f (ta + (1 − t)b) 6 2
Iˆ2 = − f (ta + (1 − t)b)dt.
a−b a−b 0
Luego
" µ ¶ ¯1 " "Z 1 ###
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 2 1 2
I1 = t t− ¯ − a−b f 00 (ta + (1 − t)b)(3t2 − t)dt
6 2 a−b 0 0
" µ ¶ 00 ¯1 " " ¯ 1 ###
1 2 1 f (ta + (1 − t)b) ¯¯ 2 1 (3t2 − t)f 0 (ta + (1 − t)b) ¯¯ 2
= t t− ¯ − a−b ¯
6 2 a−b 0 a−b 0
"Z 1 #
1 2 (6t − 1)f 0 (ta + (1 − t)b)
+ dt
6 0 (a − b)2
" µ ¶ ¯1 ¯1 #
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 2 1 2 0
¯2
¯
= t t− ¯ − (3t − t)f (ta + (1 − t)b) ¯
6 2 a−b 0 (a − b)2 0
" " Z 1 ##
1 (6t − 1)f (ta + (1 − t)b) 6 2
+ − f (ta + (1 − t)b)dt
6 (a − b)3 (a − b)3 0
1
multiplicando distributivamente por
6
µ ¶ ¯1 ¯1
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 2 1 2 f 0 (ta + (1 − t)b) ¯¯ 2
I1 = t t− ¯ − 6 (3t − t) ¯
6 2 a−b 0 (a − b)2 0
µ ¶ ¯1 Z 1
1 f (ta + (1 − t)b) ¯¯ 2 2 f (ta + (1 − t)b)
+ t− ¯ − dt.
6 (a − b)3 0 0 (a − b)3
Ahora bien, calculando I2 de igual manera y resolviendo por partes se obtiene que
Z µ ¶
1 1 2 1
I2 = (t − 1) t − f 000 (ta + (1 − t)b)dt
6 12 2
considerando el cambio de variable

µ ¶
2 1
r = (t − 1) t−
2
dr = (3t2 − 5t + 2)dt
f 00 (ta + (1 − t)b)
s=
a−b
y
ds = f 000 (ta + (1 − t)b)dt
se obtiene que
" µ ¶ 00 ¯1 Z 1 00 #
1 1 f (ta + (1 − t)b) ¯ f (ta + (1 − t)b)(3t2
− 5t + 2)
I2 = (t − 1)2 t − ¯ − dt
6 2 a−b ¯1 1 a−b
2 2
denotemos por Z 1
f 00 (ta + (1 − t)b)(3t2 − 5t + 2)
Iˆ3 = dt.
1
2
a−b
calculando I20 por partes, se considera el siguiente cambio de variables, sea
r1 = 3t2 − 5t + 2
dr1 = (6t − 5)dt
y
f 0 (ta + (1 − t)b)
s1 =
a−b
ds1 = f 00 (ta + (1 − t)b).
Consideremos la siguiente notación Iˆ3 de la siguiente forma

Z 1 00
ˆ f (ta + (1 − t)b)(3t2 − 5t + 2)
I3 = dt
1
2
a−b
¯1 Z 1 0
(3t2 − 5t + 2)f 0 (ta + (1 − t)b) ¯¯ f (ta + (1 − t)b)(6t − 5)
= ¯ − dt.
(a − b)2 1 1
2
(a − b)2
2
Sea Z 1
f 0 (ta + (1 − t)b)(6t − 5)
Iˆ4 = dt
1
2
(a − b)2
Integrando I20 por partes, consideremos el siguiente cambio de variable
r2 = 6t − 5
dr2 = 6dt
y
f (ta + (1 − t)b)
s2 =
a−b
ds2 = f 0 (ta + (1 − t)b)
ahora definiremos Iˆ4 como sigue

Z 1 0
ˆ f (ta + (1 − t)b)(6t − 5)
I4 = dt
1
2
(a − b)2
¯1 Z 1
f (ta + (1 − t)b) ¯¯ f (ta + (1 − t)b)
= (6t − 5) 3 ¯ − 6 3
dt
(a − b) 1 1
2
(a − b)
2
luego
µ ¶ ¯1 ¯1
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 1 f 0 (ta + (1 − t)b) ¯¯
I2 = (t − 1) t − ¯ 1 − 6 (3t − 2)(t − 1) ¯1
6 2 (a − b) (a − b)2
2 2
Z 1
(6t − 5) f (ta + (1 − t)b) 4 f (ta + 1 − t)b
+ 3
+ dt
6 (a − b) 6 12 (a − b)3
µ ¶ ¯1 ¯1
1 2 1 f 00 (ta + (1 − t)b) ¯¯ 1 f 0 (ta + (1 − t)b) ¯¯
= (t − 1) t − ¯ 1 − 6 (3t − 2)(t − 1) ¯1
6 2 (a − b) (a − b)2
2 2
µ ¶ ¯1 Z 1
5 f (ta + (1 − t)b) ¯ ¯ 2 f (ta + (1 − t)b)
+ t− 3 ¯ + dt
6 (a − b) 1 3 2 1 (a − b)3
2
Z 1
1 f 0 ( a+b
2
) 2 f ( a+b
2
) 1 f (b) 2 f (ta + (1 − t)b)
= − + + − dt
24 (a − b)2 6 (a − b)3 6 (a − b)3 0 (a − b)3
Z 1
1 f 0 ( a+b
2
) 1 f (a) 2 f ( a+b
2
) f (ta + (1 − t)b)
+ 2
+ 3
+ 3
− dt.
24 (a − b) 6 (a − b) 6 (a − b) 1
2
(a − b)3
Haciendo el cambio de variables x = ta + (1 − t)b y dx = (a − b)dt, se tiene el siguiente

resultado
Z b · µ ¶ ¸ Z 1
(b − a) a+b 4
f (x)dx − f (a) + 4f + f (b) = (b − a) p(t)f 000 (ta + (1 − t)b)dt
a 6 2 0
el cual da la representación deseada. ¤
Del resultado anterior podemos asegurar el siguiente teorema.
Teorema 19. Sea f : I ⊆ R → R una función absolutamente contı́nua en I 0 tal que

f 000 ∈ L[a, b], donde a, b ∈ I con a < b. Si |f 000 | es cuasi-convexa en [a, b], entonces
¯Z b · µ ¶ ¸¯ · ½ ¯ µ ¶¯¾¸
¯ (b − a) a + b ¯ 4 ¯ 000 a + b ¯
¯ f (x)dx − f (a) + 4f + f (b) ¯ ≤ (b − a) máx |f (a)|, ¯¯f
000 ¯
¯ 6 2 ¯ 1152 2 ¯
a
· ½¯ µ ¶¯ ¾¸
(b − a)4 ¯ 000 a + b ¯ 000
+ máx ¯¯f ¯ , |f (b)|
¯
1152 2
Demostración: Por la definición de cuasi-convexidad y el Lema 2 se obtiene que
¯Z b · µ ¶ ¸¯ Z 1
¯ (b − a) a + b ¯
¯ f (x)dx − f (a) + 4f + f (b) ¯¯ ≤ (b − a)4
|p(t)f 000 (ta + (1 − t)b)|dt
¯ 6 2
a 0
si p(t) está definido por

 ¡ ¢ £ ¤
 t − 12
1 2
t si t ∈ 0, 21 ;
6
p(t) =
 1 (t − 1)2 ¡t − 1 ¢ si t ∈ ( 1 , 1].
6 2 2
Se obtiene la siguiente
¯Z b · µ ¶ ¸¯ Z 1
¯ (b − a) a+b ¯
¯ f (x)dx − f (a) + 4f ¯
+ f (b) ¯ ≤ (b − a)4
|p(t)f 000 (ta + (1 − t)b)|dt
¯ 6 2
a 0
¯ µ
4 Z 12 ¯
¶¯
(b − a) ¯
= ¯t2 t − 1 ¯ |f 000 (ta + (1 − t)b)|dt
6 ¯ 2 ¯
0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2
por propiedad del valor absoluto

Z 1¯ µ ¶¯
(b − a)4 2 ¯¯ 2 1 ¯¯ 000
6 ¯t t − 2 ¯ |f (ta + (1 − t)b)|dt
0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2
4 Z 12
µ ¶ ½ ¯ µ ¶¯¾
(b − a) 1 ¯ 000 a + b ¯
≤ t 2 000
− t máx |f (b)|, ¯f ¯ ¯ dt
6 2 2 ¯
0
Z µ ¶ ½¯ µ ¶¯ ¾
(b − a)4 1 1 ¯ 000 a + b ¯ 000
+ 2
(1 − t) t − máx ¯f¯ ¯
6 1 2 2 ¯ , |f (a)| dt.
2
Resolviendo la integral
Z 1 µ ¶
2
2 1
I1 = t − t dt
0 2
se obtiene el resultado
Z 1 Z 1µ ¶ Z 1 Z 1
2 1 2 1 2 2 1 2 2
2 3 3 3
(t − t )dt = −t + t dt = − t dt + t dt
0 2 0 2 0 2 0
¯1 ¯1 ¯1 ¯1
t4 ¯¯ 2 1 t3 ¯¯ 2 t4 ¯¯ 2 1 3 ¯¯ 2
= − ¯ + =− ¯ + t ¯
4 0 2 3 ¯0 4 0 6 0
µ ¶4 µ ¶3
1 1 1 1 1
= − +
2 4 2 2 3
µ ¶ µ ¶
1 1 1 1 1 1 1
= − + =− +
16 4 2 8 3 64 48
1
= .
192
Ahora se resuelve la integral

Z 1 µ ¶
2 1
I2 = (1 − t) t− dt
1
2
2
se obtiene
Z 1 µ ¶ Z 1µ ¶
2 1 3 5 2 1
(1 − 2t + t ) t − dt = t − t + 2t − dt
1
2
2 1
2
2 2
Z 1 Z Z 1 Z
3 5 1 2 1 1
= t dt − t dt + 2 dt − dt
1
2
2 1
2
1
2
2 1
2
¯1 ¯1 ¯1 ¯1 ¯1 ¯1
t4 ¯¯ 5 t3 ¯¯ 1 1 t2 ¯¯ t4 ¯¯ 5 3 ¯¯ 2 1 1 ¯¯
= − + 2 ¯ = ¯ − t ¯ + t | 1 − t¯
4 ¯1 2 3 ¯1 2 2 1 4 1 6 1 2 2 1
2
µ ¶4
2
" Ã 2
µ ¶2
2
!# 2
µ ¶2 · µ
2
¶¸
1 1 1 5 1 1 1 1 1 1
= − − − +1− − 1−
4 2 4 2 3 2 3 2 2 2
µ ¶ · µ µ ¶ ¶¸ µ ¶ · µ ¶¸
1 1 1 5 1 1 1 1 1 1
= − − − +1− −
4 16 4 2 3 8 3 4 2 2
· µ ¶¸
1 1 5 1 1 3 1
= − − − + + −
4 64 2 24 3 4 4
15 35 1
= − +
64 48 2
45 − 140 + 96
=
192
1
= .
192
Entonces
Z 1 µ ¶ ½ ¯ µ ¶¯¾
(b − a)4 2 2 1 ¯ 000 a + b ¯
t 000
− t máx |f (b)|, ¯f ¯ ¯ dt
6 2 2 ¯
0
Z µ ¶ ½¯ µ ¶¯ ¾
(b − a)4 1 1 ¯ 000 a + b ¯ 000
+ 2
(1 − t) t − máx ¯¯f ¯ , |f (a)| dt
¯
6 1 2 2
2
½ ¯ µ ¶¯¾ ½¯ µ ¶¯ ¾
(b − a)4 1 ¯ 000 a + b ¯ (b − a)4 1 ¯ 000 a + b ¯ 000
= 000
máx |f (b)|, ¯f ¯ ¯ ¯ ¯
6 192 2 ¯ + 6 192
máx ¯f
2 ¯ , |f (a)|
½ ¯ µ ¶¯¾ ½ ¯ µ ¶¯¾
(b − a)4 ¯ 000 a + b ¯ (b − a) 4 ¯ 000 a + b ¯
= máx |f (b)|, ¯¯f
000 ¯ +
¯ máx |f (a)|, ¯¯f
000 ¯
¯
1152 2 1152 2
· ½ ¯ µ ¶¯ ¾ ½¯ µ ¶¯ ¾¸
(b − a)4 ¯ a + b ¯¯ ¯ 000 a + b ¯ 000
= máx |f 000 (a)|, ¯¯f 000 ¯ + máx ¯f
¯
¯ , |f f (b)|
¯
1152 2 2
llegando al resultado que se querı́a demostrar, completando la demostración.

¤
A continuación demostraremos las desigualdades de Young y Hölder que nos
ayudará a comprender mejor la demostración del siguiente teorema, además de enunciar
un teorema de la desigualdad de Hadamard para aplicaciones cuasi-convexas.
Teorema 20. (ver[42]) Sean φ una función continua y estrictamente creciente en el

intervalo [0, c], con c > 0, tal que φ(0) = 0. Si ψ es la función inversa de φ, entonces
Z x Z y
xy ≤ φ(s)ds + ψ(t)dt.
0 0
para todo x ∈ [0, c] y y ∈ [0, φ(c)] la igualdad se cumple si y sólo si y = φ(x).
Demostración Comencemos por demostrar que para todo x ∈ [0, c]

Z x Z φ(s)
xφ(x) = φ(s)ds + ψ(t)dt. (2.24)
0 0
Si x = 0 el caso es el trivial. Supongamos x > 0. A cada entero n ≥ 1 se le puede

asociar la partición Pn = {0, nx , 2 nx , ..., i nx , (i + 1) nx ..., x} del intervalo [0, x] lo cual nos
£ ¤
da n sub-intervalos i nx , (i + 1) nx , (i = 0, ..., n − 1) cada uno de longitud x
n
. A Pn le
corresponde la suma inferior de Riemann de φ
n−1 ³
x´ x x X ³ x´
X n−1
I(Pn , φ) = φ i = φ i .
i=0
n n n i=0 n
Además, al mismo entero n se le puede corresponder la partición

³x´ ³ x´ ³ x´ ³ x´
Pn0 = {0 = φ(0), φ ,φ 2 , ..., φ i , φ (i + 1) , ..., φ(x)} del intervalo
n n n n
[0, φ(x)], a la cual corresponde la suma superior de Riemann de la función ψ
n−1
X ³ ³ x ´´ ³ ³ x´ ³ x ´´
S(Pn0 , ψ) = ψ φ (i + 1) φ (i + 1) −φ i
i=0
n n n
x
n−1
X ³ x ³ x ´´
= (i + 1) φ(i + 1) − φ i .
n i=0
n n
Por otra parte se tiene que para todo n
I(Pn , φ) + S(Pn0 , ψ) = xφ(x) (2.25)
ya que
n−1 ³
x´ X ³ x´ ³ x´ ³ x´ X ³ x´
X n−1 n−1
X n−1
φ i + (i + 1) φ(i + 1) −φ i = (i + 1)φ (i + 1) − iφ i
i=1
n i=0
n n i=0
n i=1
n
n−1 ³
x´ ³ x´
X n−1
X
= φ j + nφ(x) − iφ i nφ(x).
j=1
n i=1
n
Por ser φ continua en [0, x] también lo es ψ en [0, ψ(x)]. Por consiguiente exis-
Z x Z φ(x)
ten las integrales φ(s)ds, ψ(t)dt. Además debido a la continuidad uniforme
0 0
de φ en [0, x], cuando n tiende a infinito, la longitud de cada subintervalo de la for-
h ³ x´ xi
ma φ i , φ(i + 1) , (i = 0, ..., n − 1) tiende a cero, de modo que en virtud de la
n n
definición de la integral de Riemann se tiene
Z x Z φ(x)
0
lı́m I(Pn , φ) = φ(s)ds, lı́m S(Pn , ψ) = ψ(t)dt
n→∞ 0 n→∞ 0
de lo cual se deduce, utilizando (2.25), la fórmula (2.24).

De (2.24) resulta que para demostrar el teorema basta establecer que si y 6= φ(x),
entonces Z y
xy < ψ(t)dt > x(y − φ(x)),
φ(x)
de lo cual resulta que
xy = xφ(x) + x(y − φ(x))

Z x Z φ(x) Z y
< φ(s)ds + ψ(t)dt + ψ(t)dt
0 0 φ(x)
Z x Z y
= φ(s)ds + ψ(t)dt
0 0
por lo que se concluye que

Z x Z y
xy < φ(s)ds + ψ(t)dt.
0 0
Si y < φ(x), entonces

Z φ(x)
ψ(t)dt < x(φ(x) − y)
y
y por lo tanto
xy = xφ(x) − x(φ(x) − y)
Z x Z φ(x) Z φ(x)
< φ(s)ds + ψ(t)dt − ψ(t)dt
0 0 y
Z x Z y
= φ(s)ds + ψ(t)dt
0 0
en consecuencia Z Z
x y
xy < φ(s)ds + ψ(t)dt.
0 0
llegando ası́ a lo que se querı́a demostrar ¤
Teorema 21. (Desigualdad de Hölder) Sea (X, F, µ) un espacio de medida,

1 1
f, g ∈ M(X, F, C) y p, q > 1 tales que p
+ q
= 1. Entonces
Z µZ ¶1/p µZ ¶1/q
p q
|f ||g|dµ ≤ |f | dµ |g| dµ . (2.26)
X X X
Demostración Denotemos por α y β a los factores que están al lado derecho de

(2.26)
µZ ¶1/p µZ ¶1/q
p q
α := |f | dµ , β := |g| dµ .
X X
Si α = 0, entonces f = 0 en casi todas partes, y la desigualdad (2.26) se convierte

en la igualdad trivial 0 = 0. De manera similar se considera el caso cuando g = 0. Si
α > 0, β > 0 y α = ∞ o β = ∞, entonces el lado derecho de (2.26) es ∞, y (2.26) se
cumple de manera trivial.
Consideremos el caso principal cuando α, β ∈ (0, ∞). Denotemos por u y v a las

funciones f y g normalizadas de la siguiente manera
f g
u := , v := .
α β
Entonces
Z Z Z Z
p 1 p q 1
|u| dµ = p |f | dµ = 1, |v| dµ = q |g|q dµ = 1.
X α X X β X
Para todo x ∈ X aplicamos la desigualdad de Young a los números |u(x)| y |v(x)|

|u(x)|p |v(x)|q
|u(x)v(x)| ≤ + ,
p q
luego integramos ambos lados sobre X respecto a la medida µ
Z
1 1
|uv|dµ ≤ + = 1,
X p q
esto es,
Z
|f g|dµ ≤ αβ
X
Z
= |f g|dµ
X
µZ ¶1/p µZ ¶1/q
p q
≤ |f | dµ |g| dµ
X X
llegando al resultado deseado. ¤

Teorema 22. Sea f 00 : I ⊆ R → R una función absolutamente contı́nua en I 0 tal que

p
f 000 ∈ L[a, b], donde a < b. Si |f 000 |q , q = , es cuasi-convexa en [a, b], para algún
(p − 1)
p > 1, entonces la siguiente desigualdad se cumple:
¯Z b · µ ¶ ¸¯
¯ (b − a) a+b ¯
¯ f (x)dx − f (a) + 4f + f (b) ¯
¯ 6 2 ¯
a
µ "
¶1/p µ ½¯ µ ¶¯ ¾¶1/q #
2−1/p (b − a)4 Γ(p + 1)Γ(2p + 1) ¯ 000 a + b ¯q
≤ máx ¯¯f ¯ , |f 000 (b)|q
¯
48 Γ(3p + 2) 2
µ ¶1/p "µ ½¯ µ ¶¯ ¾¶1/q #
2−1/p (b − a)4 Γ(p + 1)Γ(2p + 1) ¯ 000 a + b ¯q
+ máx ¯¯f ¯ , |f 000 (a)|q
¯
48 Γ(3p + 2) 2
Sacando factor común se tiene que

µ ¶1/p "µ ½ µ ¶ ¾¶1/q
2−1/P (b − a)4 Γ(p + 1)Γ(2p + 1) 000 a + b q 000 q
máx |f | , |f (b)|
48 Γ(3p + 2) 2
µ ½¯ µ ¶¯ ¾¶¸
¯ 000 a + b ¯q
+ máx ¯¯f ¯ , |f (a)|
¯
000 q
2
"µ ½¯ µ ¶¯ ¾¶1/q
2−1/P (b − a)4 ¯ 000 a + b ¯q
= (B(p + 1, 2p + 1)) 1/p
máx ¯¯f ¯ , |f (b)|
¯
000 q
48 2
µ ½¯ µ ¶¯ ¾¶1/q #
¯ 000 a + b ¯q
+ máx ¯¯f ¯ , |f (a)|
¯
000 q
.
2
Demostración: Por el Lema 2 y la desigualdad de Hölder, se tiene que

¯Z b · µ ¶ ¸¯ Z 1
¯ (b − a) a + b ¯
¯ f (x)dx − f (a) + 4f ¯
+ f (b) ¯ ≤ (b − a)4
|p(t)f 000 (ta + (1 − t)b)|dt
¯ 6 2
a 0
por propiedad de valor absoluto

Z Z 1¯ µ ¶¯
4
1
000 (b − a)4 2 ¯¯ 2 1 ¯¯ 000
(b − a) |p(t)f (ta + (1 − t)b)dt| ≤ ¯t t − 2 ¯ |f (ta + (1 − t)b)|dt
0 6 0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2
usando la desigualdad de Hölder se tiene lo siguiente

Z 1¯ µ ¶¯
(b − a)4 2 ¯¯ 2 1 ¯¯ 000
6 ¯t t − 2 ¯ |f (ta + (1 − t)b)|dt +
0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2
ÃZ 1 · µ ¶¸p !1/p ÃZ 1 !1/q
(b − a)4 2 1 2
≤ t2 −t dt |f 000 (ta + (1 − t)b)|q dt
6 0 2 0
ÃZ · µ ¶¸ !1/p ÃZ !1/q
4 1 p 1
(b − a) 1
+ (t − 1)2 t − dt |f 000 (ta + (1 − t)b)|q dt
6 1
2
2 1
2
como f es cuasi-convexa, y usando la desigualdad de Hermite-Hadamard, se tiene que

Z 1 ½¯ µ ¶¯ ¾
2 ¯ 000 a + b ¯q
000 q ¯
|f (ta + (1 − t)b)| dt ≤ máx ¯f ¯ 000 q
2 ¯ , |f (b)| ,
0
y Z ½¯ µ ¶¯ ¾
1 ¯ 000 a + b ¯q
000 q ¯
|f (ta + (1 − t)b)| ≤ máx ¯f ¯ 000 q
1 2 ¯ , |f (a)|
2
Calculando la integral
Z 1· µ ¶¸p Z 1 µ ¶p
2
2 1 2
2 p 1
t −t dt = (t ) − t dt
0 2 0 2
Z 1 µ ¶p
2
2p 1
= t − t dt
0 2
1
como 0 ≤ t ≤ entonces 0 ≤ 2t ≤ 1 consideremos el siguiente cambio de variable,
2
du
u = 2t entonces 2dt = du y dt =
2
Z 1 ³ ´2p µ ¶p Z 1 2p
u 1 u du u (1 − u)p du
− = 2p
0 2 2 2 2 0 2 2p 2
Z 1
1
= 2p p u2p (1 − u)p du
2 22 0
sumando y restando 1 a los exponentes

Z 1
1 1
3p+1
u(2p+1)−1 (1 − u)(p+1)−1 du = 3p+1 B(2p + 1, p + 1)
2 0 2
1 Γ(2p + 1)Γ(p + 1)
= 3p+1 .
2 Γ(3p + 2)
Calculando de nuevo la integral

Z 1· µ ¶¸p Z 1 µ ¶p
2 1 2p 1
(t − 1) t − dt = (t − 1) t− dt
1
2
2 1
2
2
1
como 2
≤ t ≤ 1 entonces 0 ≤ 2t − 1 ≤ 1, realizando el cambio de variable
du
2t − 1 = u entonces 2dt = du luego dt =
2
Z 1 µ ¶ 2p µ ¶ p Z 1µ ¶2p ³ ´
u+1 u+1 1 du u−1 u p du
−1 − =
0 2 2 2 2 0 2 2 2
Z 1
1
= 2p p (u − 1)2p up du
2 22 0
Z 1
1
= 3p+1 (u − 1)2p up du
2 0
sumando y restando 1 a los exponentes, como en el caso anterior, se obtiene

Z 1
1 1
(3p+1)
(u − 1)(2p+1)−1 u(p+1)−1 du = (3p+1) B(2p + 1, p + 1)
2 0 2
1 Γ(2p + 1)Γ(p + 1)
= (3p+1)
2 Γ(3p + 2)
luego por definición de p(t), f 000 ∈ L[a, b] y la desigualdad de Hölder

Z 1¯ µ ¶¯
(b − a)4 2 ¯¯ 2 1 ¯¯ 000
6 ¯t t − 2 ¯ |f (ta + (1 − t)b)|dt
0
Z ¯ µ ¶¯
(b − a)4 1 ¯¯ 2 1 ¯¯ 000
+ ¯(t − 1) t − 2 ¯ |f (ta + (1 − t)b)|dt
6 1
2
ÃZ 1 · µ ¶¸p !1/p ÃZ 1 !1/q
(b − a)4 2 1 2
≤ t2 −t dt |f 000 (ta + (1 − t)b)|q dt
6 0 2 0
ÃZ · µ ¶¸p ! 1/p ÃZ !1/q
1 1
(b − a)4 1
+ (t − 1)2 t − dt |f 000 (ta + (1 − t)b)|q dt
6 1
2
2 1
2
resolviendo la integral se tiene lo siguiente

· µÃZ 1 ¶¸p !1/p ÃZ 1 !1/q
(b − a)4 1 2 2
t2 −t dt |f 000 (ta + (1 − t)b)|q dt
6 0 2 0
ÃZ · µ ¶¸p ! 1/p ÃZ !1/q
1 1
(b − a)4 1
+ (t − 1)2 t − dt |f 000 (ta + (1 − t)b)|q dt
6 1
2
2 1
2
µ ¶ µ ¶ ÃZ 1 !1/q
1/p 1/p
(b − a)4 1 Γ(2p + 1)Γ(p + 1) 2
000 q
= |f (ta + (1 − t)b)| dt
6 23p+1 Γ(3p + 2) 0
µ ¶1/p µ ¶1/p ÃZ 1 !1/q
(b − a)4 1 Γ(2p + 1)Γ(p + 1)
+ |f 000 (ta + (1 − t)b)|q dt
6 23p+1 Γ(3p + 2) 1
2
µ ¶ µ ¶ ÃZ 1 !1/q
1/p 1/p
(b − a)4 1 Γ(2p + 1)Γ(p + 1) 2
= |f 000 (ta + (1 − t)b)|q dt
6 23p 2 Γ(3p + 2) 0
µ ¶ µ ¶ ÃZ !1/q
1/p 1/p 1
(b − a)4 1 Γ(2p + 1)Γ(p + 1) 000 q
+ |f (ta + (1 − t)b)| dt
6 23p 2 Γ(3p + 2) 1
2
µ ¶1/p ÃZ 1 !1/q
(b − a)4 2−1/p Γ(2p + 1)Γ(p + 1) 2
= |f 000 (ta + (1 − t)b)|q dt
48 Γ(3p + 2) 0
µ ¶1/p ÃZ 1 !1/q
(b − a)4 2−1/p Γ(2p + 1)Γ(p + 1) 000 q
+ |f (ta + (1 − t)b)| dt
48 Γ(3p + 2) 1
2
como f es cuasi-convexa y por la desigualdad de Hermite-Hadamard se tiene

Z 1 ½¯ µ ¶¯ ¾
2 ¯ 000 a + b ¯q
|f (ta + (1 − t)b)| dt ≤ máx ¯¯f
000 q ¯ , |f (b)|
¯
000 q
0 2
y Z ½¯ µ ¶¯ ¾
1 ¯ 000 a + b ¯q
|f (ta + (1 − t)b)| dt ≤ máx ¯¯f
000 q ¯ , |f (a)|
¯
000 q
1
2
2
entonces sacando factor común

µ ¶1/p ÃZ 1 !1/q
2−1/p (b − a)4 Γ(2p + 1)Γ(p + 1) 2
000 q
|f (ta + (1 − t)b)| dt
48 Γ(3p + 2) 0
µ ¶1/p ÃZ 1 !1/q
2−1/p (b − a)4 Γ(2p + 1)Γ(p + 1)
+ |f 000 (ta + (1 − t)b)|q dt
48 Γ(3p + 2) 1
2
−1/p 4
µ ¶1/p "Z 1 #
2 (b − a) Γ(2p + 1)Γ(p + 1) 2
= |f 000 (ta + (1 − t)b)|q dt
48 Γ(3p + 2) 0
µ ¶ "µ ½¯ µ ¶¯ ¾¶1/q
1/p
2−1/p (b − a)4 Γ(2p + 1)Γ(p + 1) ¯ 000 a + b ¯q
≤ máx ¯¯f ¯ , |f (b)|
¯
000 q
48 Γ(3p + 2) 2
µ ½¯ µ ¶¯ ¾¶1/q #
¯ 000 a + b ¯q
+ máx ¯¯f ¯ , |f 000 (a)|q
¯
2
2.5.2 Desigualdad de Simpson para funciones Lipschitzianas
En esta sección se presentará la definición y propiedades de las funciones Lipchizianas,

para luego realizar un estudio de la cuadratura de Simpson para este tipo de funciones.
Las funciones Lipschitzianas se le conoce por ese nombre gracias al matemático

Rudolph Lipschitz, quien fué un matemático alemán, y profesor en las universidades de
Breslau y Bonn. Estudió las invariantes diferenciales, las propiedades de los subespacios
de Riemann, las series de Fourier, y la teorı́a de números.
Lipschitz también estaba muy interesado en las cuestiones fundamentales de la in-

vestigación matemática y de la instrucción matemática en las universidades. Reunió sus
estudios sobre estos temas en los dos volúmenes de Análisis de Grundtagen. Hasta en-
tonces un trabajo de este tipo nunca habı́a aparecido en alemán, aunque existı́an tales
libros en francés. El trabajo comienza con la teorı́a de los números enteros racionales y
pasa a las ecuaciones diferenciales y la teorı́a de funciones. La fundación de matemáticas
también se considera en términos de sus aplicaciones. En el análisis básico, Lipschitz

descubrió una condición que lleva su nombre, que es hoy dı́a tan importantes para prue-
bas de existencia y singularidad como la teorı́a de la aproximación. Si f es una función
definida en el intervalo [a, b], entonces se dice que f satisface la condición de Lipschitz
con el exponente α y el coeficiente M, si para cualquier par de valores x, y en [a, b], la
condición |f (x) − f (y)| ≤ L|x − y|α , con α > 0 se cumple, la cual es una generalización
de la siguiente definición
Definición 14. Se dice que una función f : I → R satisface la condición de Lipschitz

en el intervalo I si para todo x, y ∈ I existe una constante L > 0 tal que
|f (x) − f (y)| < L|x − y|.
La condición se consideró por primera vez por Lipschitz en [38] en su estudio de la

convergencia de la serie de Fourier de una función periódica f.
Observación 9. Cualquier función Lipschitz con L < 1 es, por definición, L-contractiva.
es decir, es aquella que contrae las distancias con una razón de contracción estrictamente
menor que la unidad.
A continuación se darán varios ejemplos de funciones que son Lipschitzianas y otras

que no lo son.
Ejemplo 19. La función f : R → R, f (x) = |x|, es Lipschitz en toda la recta real. Para
demostrarlo basta observar que |f (x) − f (y)| = ||x| − |y|| < 1|x − y| para todo x, y ∈ R.
Ejemplo 20. La funcion f : R → R, f (x) = x2 , no es Lipschitz en toda la recta real.

Lo demostraremos por reducción al absurdo. Supongamos que es Lipschitz en R para
alguna constante L > 0. Entonces, |f (x) − f (y)| < L|x − y|, para todo x, y ∈ R, como
|f (x) − f (y)|
la función es derivable en R, sabemos que lı́m = |f 0 (x)| para todo x, y ∈ R
y→x |x − y|
combinando la desigualdad de la condición Lipschitz con la identidad anterior, obtenemos
que L > |f 0 (x)| para todo x ∈ R lo cual es imposible, pues la derivada no está acotada:
lı́m |f 0 (x)| = 2 lı́m |x| = ∞.
|x|→∞ |x|→∞
Proposición 5. Sea un I un intervalo y sea f : I → R una función continua en I,

derivable en el int(I) y tal que su derivada es acotada. Entonces f es Lipschitz continua
en I.
Proposición 6. Sea f ∈ C 1 ([a, b]), esto es, f es derivable en [a, b] y f 0 es continua en

[a, b]. Entonces f es Lipschitz continua en [a, b].
Definición 15. (Integral de Riemann-Stieltjes) Dadas g, F : [a, b] → R, si existe

lı́m S(P, g, F ) = I, diremos que la integral Riemann-Stieltjes de g respecto a F en
||p||→0
el intervaloZ existe y vale
Z b I.
b
Notación: gdF = g(x)dF (x).
a a
Observación 10. En el caso particular en que F (x) = x, la definición coincide con la

definición de integral de Riemann en [a, b]
Teorema 23. Sea f : [a, b] → R una función L-Lipchiziana sobre [a, b]. Entonces
¯Z b · µ ¶¸¯
¯ b − a f (a) + f (b) a + b ¯¯ 5
¯ f (x)dx − + 2f ≤ L(b − a)2 .
¯ 3 2 2 ¯ 36
a
Demostración Usando la fórmula de integración por partes de Riemann-Stieltjes se

tiene Z · µ ¶¸ Z b
b
b − a f (a) + f (b) a+b
s(x)df (x) = + 2f − f (x)dx
a 3 2 2 a
donde
 ¢
 x− 5a+b
, x ∈ [ a, a+b ;
6 2
s(x) := £ ¤
 x− a+5b
, x ∈ a+b ,b .
6 2
En efecto
Z b Z a+b µ ¶ Z b µ ¶
2 5a + b a + 5b
s(x)df (x) = x− df (x) + x− df (x)
a a 6 a+b
2
6
·µ ¶ ¸ a+b ·µ ¶ ¸b Z b
5a + b 2 a + 5b
= x− f (x) + x− f (x) − f (x)dx
6 a 6 a+b a
·µ ¶ µ ¶ µ ¶ 2 ¸
a + b 5a + b a+b 5a + b
= − f − a− f (a)
2 6 2 6
·µ ¶ µ ¶ µ ¶¸ Z b
a + 5b a + b a + 5b a+b
+ b− f (b) − − f − f (x)dx
6 2 6 2 a
· µ ¶ µ ¶¸
3(a + b) − (5a + b) a+b 6a − (5a + b)
= f − f (a)
6 2 6
· µ ¶ µ ¶¸ Z b
6b − (a + 5b) 3(a + b) − (a + 5b) a+b
+ f (b) − f − f (x)dx
6 6 2 a
· µ ¶ µ ¶ ¸
3a + 3b − 5a − b a+b 6a − 5a − b
= f − f (a)
6 2 6
·µ ¶ µ µ ¶¶¸ Z b
6b − a − 5b 3a + 3b − a − 5b a+b
+ f (b) − f − f (x)dx
6 6 2 a
·µ µ ¶¶ µ ¶¸
2b − 2a a+b a−b
= f − f (a)
6 2 6
·µ ¶ µ µ ¶¶¸ Z b
b−a 2a − 2b a+b
+ f (b) − f − f (x)dx
6 6 2 a
µ ¶ µ ¶ Z b
b−a a+b b−a b−a b−a a+b
= f + f (a) + f (b) + f − f (x)dx
3 2 6 6 3 2 a
· µ ¶¸ Z b
b − a f (a) f (b) a+b
= + + 2f − f (x)dx
3 2 2 2 a
· µ ¶¸ Z b
b − a f (a) + f (b) a+b
= + 2f − f (x)dx.
3 2 2 a
Ahora supongamos que ∆n : a = xn0 < xn1 < · · · < xnn−1 < xnn = b es una secuencia
de divisiones con V (∆n ) 7→ 0 cuando n 7→ ∞ donde V (∆n ) := máx (xni+1 − xni ) y
{i∈0,...,n−1}
ξ n ∈ [xni − xni+1 ]. Si p : [a, b] → R es integrable Riemann sobre [a, b] y v : [a, b] → R es
Lipchiziana sobre [a, b], entonces
¯Z b ¯ ¯¯ n−1
X
¯
¯
¯ ¯ ¯ n ¯
¯ ¯
p(x)dv(x)¯ = ¯ lı́m n n
p(ξi )[v(xi+1 ) − v(xi )]¯
¯ ¯v(∆n )7→0 ¯
a i=0
por definición de valor absoluto

¯Z b ¯ ¯ ¯
¯ ¯ ¯ n−1
X ¯
¯ ¯ ¯ n n n ¯
¯ p(x)dv(x)¯ = ¯ lı́m p(ξi )[v(xi+1 ) − v(xi )]¯
a ¯v(∆n )7→0 ¯
i=0
n−1
X ¯ ¯
¯ v(x n
) − v(x n ¯
)
≤ lı́m |p(ξin )|(xni+1 − xni ) ¯¯ i+1
n n
i ¯
¯
v(∆n )7→0
i=0
x i+1 − x i
como v es Lipschitziana entonces

n−1 ¯ ¯ n−1
X ¯ v(xni+1 ) − v(xni ) ¯¯ X
lı́m |p(ξin )|(xni+1 − xni ) ¯¯ ¯ ≤ lı́m |p(ξin )|(xni+1 − xni )
v(∆n )7→0
i=0
xni+1 − xni v(∆n )7→0
i=0
Z b
= L |p(x)|dx (2.27)
a
realizando el cambio de variable p(x) = s(x), v(x) = f (x) se obtiene

¯Z b ¯ Z b
¯ ¯
¯ ¯
s(x)df (x)¯ ≤ L |s(x)|dx
¯
a a
calculando
Z ¯
Z a+b ¯ Z b ¯ ¯
b ¯ 5a + b ¯¯
2 ¯ a + 5b ¯¯
|s(x)|dx = ¯ ¯
¯x − 6 ¯ dx + a+b ¯x − 6 ¯ dx
a a 2
Z 5a+b µ ¶ Z a+b µ ¶
6 5a + b 2 5a + b
= − x dx + x− dx
a 6 5a+b
6
6
Z a+5b µ ¶ Z b µ ¶
6 a + 5b a + 5b
+ − x dx + x− dx
a+b
2
6 a+5b
6
6
definamos I1 I2 I3 e I4 de la siguiente forma

Z 5a+b µ ¶
6 5a + b
I1 = − x dx
a 6
Z a+b µ ¶
2 5a + b
I2 = x− dx
5a+b
6
6
Z a+5b µ ¶
6 a + 5b
I3 = − x dx
a+b
2
6
Z b µ ¶
a + 5b
I4 = x− dx
a+5b
6
6
procedemos a resolver I1
Z 5a+b µ ¶ Z 5a+b Z 5a+b
6 5a + b 6 5a + b 6
− x dx = dx − xdx
a 6 a 6 a
¯ 5a+b ¯ 5a+b
5a + b ¯¯ 6 x2 ¯¯ 6
= x¯ − ¯
6 a 2 a
·µ ¶µ ¶ µ ¶ ¸ " µ ¶2 #
5a + b 5a + b 5a + b 1 5a + b a2
= − a − −
6 6 6 2 6 2
µ ¶2 µ ¶ 2
5a + b (5a2 + ab) 1 5a + b a2
= − − +
6 6 2 6 2
2 2
µ ¶
25a + 10ab + b 5a + ab 1 25a + 10ab + b2
2 2
a2
= − − +
36 6 2 36 2
µ 2 2
¶ 2 2
1 25a + 10ab + b 5a + ab a
= − +
2 36 6 2
25a + 10ab + b − 60a − 12ab + 36a2
2 2 2
=
72
2 2
a − 2ab + b
=
72
(a − b)2
=
72
ahora de igual forma

Z a+b µ ¶
2 5a + b
I2 = x− dx
5a+b
6
6
por lo tanto
Z a+b µ ¶ Z a+b Z a+b
2 5a + b 2 5a + b
2
x− dx = xdx − dx
5a+b
6
6 5a+b
6
5a+b
6
6
¯ a+b ¯ a+b
x ¯¯2 2
5a + b ¯¯ 2
= − x¯
2 ¯ 5a+b 6 5a+b
" µ6 ¶2 µ
6
¶2 #
1 a+b 1 5a + b
= −
2 2 2 6
·µ ¶µ ¶ µ ¶µ ¶¸
5a + b a+b 5a + b 5a + b
− −
6 2 6 6
· 2 2
¸ · ¸
1 (a + b) 1 (5a + b) 1 2 2 1 2
= − − (5a + 5ab + ab + b ) − (5a + b)
2 4 2 36 12 36
· ¸ · ¸
1 2 1 2 1 2 2 1 2
= (a + b) − (5a + b) − (5a + 6ab + b ) − (5a + b)
8 72 12 36
1 1 1 1
= (a + b)2 − (5a + b)2 − (5a2 + 6ab + b2 ) + (5a + b)2
8 72 12 µ 36 ¶
2
1 2 1 2 2 2(5a + b) − (5a + b)2
= (a + b) − (5a + 6ab + b ) +
8 12 72
2
1 1 (5a + b)
= (a + b)2 − (5a2 + 6ab + b2 ) +
8 12 72
9(a + b) − 6(5a + 6ab + b ) + (5a + b)2
2 2 2
=
72
9(a2 + 2ab + b2 ) − 6(5a2 + 6ab + b2 ) + (25a2 + 10ab + b2 )
=
72
9a + 18ab + 9b − 30a − 36ab − 6b2 + 25a2 + 10ab + b2
2 2 2
=
72
4a2 − 8ab + 4b2
=
72
4(a − 2ab + b2 )
2
=
72
(a − b)2
= .
18
continuando con I3
Z a+5b µ ¶ Z a+5b Z a+5b
6 a + 5b 6 a + 5b 6
− x dx = dx − xdx
a+b
2
6 a+b
2
6 a+b
2
¯ a+5b ¯ a+5b
a + 5b ¯¯ 6 x ¯ 6
2
= x¯ − ¯¯
6 a+b 2 a+b
· µ2 ¶ 2 µ ¶¸
a + 5b a + 5b a + 5b a + b
= −
6 6 6 2
" µ ¶2 µ ¶2 #
1 a + 5b 1 a+b
− −
2 6 2 2
· ¸
1 2 1 2 2
= (a + 5b) − (a + ab + 5ab + 5b )
36 12
· ¸
1 2 1 2
− (a + 5b) − (a + b)
72 8
1 1 1 1
= (a + 5b)2 − (a2 + 6ab + 5b2 ) − (a + 5b)2 + (a + b)2
36 12 72 8
2
1 1 2(a + 5b) − (a + 5b)2
= (a + b)2 − (a2 + 6ab + 5b2 ) +
8 12 72
9(a + b)2 − 6(a2 + 6ab + 5b2 ) + (a + 5b)2
=
72
9(a + 2ab + b ) − 6(a2 + 6ab + 5b2 ) + (a2 + 10ab + 25b2 )
2 2
=
72
9a2 + 18ab + 9b2 − 6a2 − 36ab − 30b2 + a2 + 10ab + 25b2
=
72
2 2
4a − 8ab + 4b
=
72
4(a2 − 2ab + b2 )
=
72
2
(a − b)
= .
18
Procediendo igualmente con I4

Z b · µ ¶¸ Z b Z b
a + 5b a + 5b
x− dx = xdx − dx
a+5b
6
6 a+5b
6
a+5b
6
6
¯b ¯b
x2 ¯¯ a + 5b ¯¯
= − x¯
2 ¯ a+5b 6 a+5b
" 6
µ ¶2 # ·µ
6
¶ µ ¶µ ¶¸
1 2 1 a + 5b a + 5b a + 5b a + 5b
= b − − b−
2 2 6 6 6 6
· 2 ¸ · ¸
b 1 1 1
= − (a + 5b)2 − (ab + 5b2 ) − (a + 5b)2
2 72 6 36
2
b 1 1 1
= − (a + 5b)2 − (ab + 5b2 ) + (a + 5b)2
2 72 6 36
b2 1 (a + 5b)2
= − (ab + 5b2 ) +
2 6 72
36b − 12ab − 60b + a + 10ab + 25b2
2 2 2
=
72
a2 − 2ab + b2
=
72
(a − b)2
=
72
luego se tiene que

Z b
|s(x)|dx = I1 + I2 + I3 + I4
a
(a − b)2 (a − b)2 (a − b)2 (a − b)2
= + + +
72 18 18 72
2 2
2(a − b) 2(a − b)
= +
72 18
(a − b)2 (a − b)2
= +
36 9
(a − b) + 4(a − b)2
2
=
36
5(a − b)2
=
36
ahora usando la desigualdad (2.27)

¯Z b ¯ Z b
¯ ¯
¯ ¯
s(x)df (x)¯ ≤ L |s(x)|dx
¯
a a
y la identidad
Z b · µ ¶¸ Z b
b − a f (a) + f (b) a+b
s(x)df (x) = + 2f − f (x)dx
a 3 2 2 a
se deduce el resultado deseado

¯Z b · ¸¯
¯ b − a f (a) + f (b) a + b ¯¯ 5
¯ f (x)dx − + 2f ( ) ¯ ≤ L(b − a)2 . ¤
¯ 3 2 2 36
a
Corolario 2. Supongamos que f : [a, b] → R es una función diferenciable cuya derivada

está acotada en (a, b), es decir
kf 0 k∞ := sup |f 0 (x)| ≤ ∞
x∈(a,b)
entonces se tiene
¯Z b · µ ¶¸¯
¯ b − a f (a) + f (b) a + b ¯
¯ f (x)dx − + 2f ¯ ≤ 5 kf 0 k∞ (b − a)2 . (2.28)
¯ 3 2 2 ¯ 36
a
f (a) − f (b)
Demostración: Por definición f 0 = lı́m , por hipótesis, como la derivada
a→b a−b
f (a) − f (b)
es acotada en (a, b) existe L ∈ R finito tal que ≤ L ası́ mismo
a−b
f (a) − f (b) ≤ L|a − b| es decir, f es una función Lipschitz, como f 0 es acotada, la misma
tiene supremo, por lo que f (a) − f (b) ≤ L|a − b| ≤ sup |f 0 ||a − b| por lo tanto
L|a − b| ≤ ||f 0 ||∞ |a − b| (2.29)
ası́ por (2.29) y el teorema anterior, se tiene que

¯Z b · µ ¶¸¯
¯ b − a f (a) + f (b) a + b ¯
¯ f (x)dx − + 2f ¯ ≤ 5 ||f 0 ||∞ (b − a)2 . ¤
¯ 3 2 2 ¯ 36
a
Corolario 3. Sea f : [a, b] → R una función Lipchiziana sobre [a, b] e Ih una partición de
[a, b]. Entonces se tiene por la desigualdad de Simpson y la fórmula (2.15) que el término
resto Rs (f, Ih ) satisface la estimación:
n−1
5 X 2
|Rs (f, Ih )| ≤ L h. (2.30)
36 i=0 i
Comentario 1. Si la función f : [a, b] → R no es cuatro veces diferenciable ni la cuarta

derivada es acotada en (a, b), entonces no podemos aplicar la estimación clásica en la
fórmula de Simpson usando la cuarta derivada.
Se dan una clase de funciones que son Lipschitz y tienen cuarta derivada en el
intervalo dado. Sea fp : [a, b] → R, fp := (x − a)p donde p ∈ (3, 4). Entonces como f es
diferenciable podemos asegurar que
fp0 := p(x − a)p−1 , x ∈ (a, b)
es la constante de lipchizidad, procederemos a comprobarlo por definición de función

Lipschitz se tiene que
|fp (b) − fp (a)| = | − (b − a)p |
= (b − a)p
= (b − a)(b − a)p−1
≤ (b − a)(b − a)p−1 p
= (b − a)L
y
p(p − 1)(p − 2)(p − 3)
fp4 (x) = , x ∈ (a, b).
(x − a)4−p
Se puede notar que fp es Lipchiziana con la constante
L = p(b − a)p−1 < ∞
pero
lı́m fp(4) = +∞.
x7→a+
por lo tanto se demuestra que no se puede usar la desigualdad de Simpson, ya que la

función no está acotada.
2.6 Aplicaciones para Medias Especiales

En esta sección se presentarán algunas aplicaciones para medias especiales; que po-
drı́an considerarse extensiones de la media aritmética, media geométrica, media armónica,
media logarı́tmicas y media logarı́tmica generalizadas para los números reales positivos.
Definición 16. Consideremos R+ el conjunto de los números reales positivos. Una fun-
ción continua de dos variables, M : R2 → R es una medida sobre R+ si
mı́n{x, y} ≤ M (x, y) ≤ máx{x, y} x, y ∈ R+ .
2.6.1 Media Aritmética
La media aritmética denotada por A (también llamada promedio o simplemente

media) de un conjunto finito de números, es el valor caracterı́stico de una serie de datos
cuantitativos, objetos de estudio que parte del principio de la esperanza matemática, y
se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos.
Expresada de forma más intuitiva, podemos decir que la media aritmética es la can-
tidad total de la variable distribuida en partes iguales entre cada observación.
Una de las limitaciones de la media aritmética es que es una medida muy sensible
a los valores extremos; valores muy grandes tienden a aumentarla, mientras que valores
muy pequeños tienden a reducirla, lo que implica que puede dejar de ser representativa
de la población.
La media aritmética se calcula sumando todos los componentes y dividiendo el resul-
tado entre el número de componentes. El resultado es la media aritmética.
Dados los números a, b > 0 la media aritmética viene dada por
a+b
A = A(a, b) = .
2
Algunas de las propiedades de la media aritmética son las siguientes

Propiedades
1. La suma de las desviaciones con respecto a la media aritmética es cero.
2. La media aritmética de los cuadrados de las desviaciones de los valores de la vari-

ables con respecto a una constante cualquiera se hace mı́nima cuando dicha con-
stante coincide con la media aritmética.
3. Si a todos los valores de la variable se le suma una misma cantidad, la media

aritmética queda aumentada en dicha cantidad.
4. Si todos los valores de la variable se multiplican por una misma constante, la media
aritmética queda multiplicada por dicha constante.
5. La media aritmética de un conjunto de números positivos siempre es igual o superior

a la media geométrica es decir
√ a+b
ab ≤ .
2
6. La media aritmética está comprendida entre el valor máximo y el valor mı́nimo del
conjunto de datos
a+b
mı́n{a, b} ≤ ≤ máx{a, b}.
2
2.6.2 Media Armónica
La media armónica, denotada por H, de una cantidad finita de números es igual al

recı́proco, o inverso, de la media aritmética de los recı́procos de dichos valores.
Ası́, dados números a, b positivos la media armónica será igual a
2
H= 1 .
a
+ 1b
La media armónica es una de las tres medias de Pitágoras. Para todos los conjuntos
de datos positivos que contienen al menos un par de valores distintos, la media armónica
es siempre la menor de las tres medias, mientras que la media aritmética es siempre la
mayor de las tres y la media geométrica siempre está en el medio de ellas dos.
Algunas de las propiedades de la media armónica son las siguientes

Propiedades
1. La inversa de la media armónica es la media aritmética de los inversos de los valores

de la variable.
2. Siempre se puede pasar de una media armónica a una media aritmética transfor-
mando adecuadamente los datos.
3. La media armónica siempre es menor o igual que la media aritmética, ya que para
cualesquiera numeros reales positivos a, b > 0
2 a+b
1 1 ≤ .
a
+ b
2
2.6.3 Media Geométrica
La media geométrica denotada por G, de ciertos números positivos a, b, es la raı́s

cuadrada del producto de dichos números, es recomendado para datos de progresión
geométrica, para promediar razones, interés compuesto y números ı́ndices, el cual viene
dado de la siguiente manera
√
G= ab.
Relación con la media aritmética de logaritmos
Se puede obtener el mismo resultado de la media geométrica, usando el método

que involucra logaritmos. Mediante el uso de identidades logarı́tmicas para transformar
la fórmula, las multiplicaciones se pueden expresar como una suma, y las potencias como
una multiplicación.
Ã n !1/n " n #
Y 1X
ai = exp ln ai .
i=1
n i=1
Una de las aplicaciones de la media geométrica es el crecimiento proporcional, donde se

verifica que la media geométrica es más apropiada que la media aritmética para describir
el crecimiento proporcional y el crecimiento exponencial. En temas de negocios, la media
geométrica de crecimiento, es conocida como tasa de creciemiento anual compuesta.
Algunas propiedades de esta media son las siguientes:
Propiedades
1. El logaritmo de la media geométrica es igual a la media aritmética de los logaritmos

de los valores de la variable.
2. La media geométrica de un conjunto de números positivos es siempre menor o igual

que la media aritmética
√ a+b
ab ≤ .
2
2.6.4 Media Logarı́tmica
La media logarı́tmica denotada por L, de número positivos a, b, está definido por
xa − b
L(a, b) = , a 6= b.
ln a − ln b
L(a, a) = a.
De esta manera L es simétrica en a y b y continua en a = b.

Recientemente ha sido motivo de intensas investigaciones ya que la media log-
arı́tmica tiene aplicaciones importantes en la fı́sica, economı́a e incluso la metereologı́a.
(Ver [33], [46], [47]). Kählig y Matkowski estudia-ron una variante de la ecuación fun-
cional de Jensen que implica la media logarı́tmica, el cual aparece en un problema de
conducción del calor.
Propiedades
1. La media logarı́tmica separa a la media geométrica y a la media aritmética.
G(x, y) ≤ L(x, y) ≤ A(x, y). (V er[11]).
2. Si x y y son números positivos, entonces
∞
Y
L(x, y) = αm (x, y)
m=1
x2−m + y 2−m
donde αm (x, y) = . (Ver [11])
2
3. La media logarı́tmica también puede ser representada mediante la integral de la
siguiente forma (Ver [44])
Z 1
L(x, y) = xt y 1−t dt.
0
De igual manera la diferencia de temperatura de media logarı́tmica es usada

para determinar la fuerza que impulsa la transferencia de calor en el sistema de flujo,
particularmente en intercambio de calor.
Sabemos que Lp es monótona no decreciente con p ∈ R definiendo a L−1 := L y
L0 := I. En particular, se tiene las siguientes desigualdades
H ≤ G ≤ L ≤ I ≤ A.
En lo que sigue, haciendo uso del Teorema 23 mostraremos nuevas desigualdades que
fueron mencionadas anteriormente:
1. Sea f : [a, b] → R (0 < a < b), f (x) = xp , p ∈ R\{−1, 0}; entonces
Z b
1
f (x)dx = Lp (a, b)
b−a a
µ ¶
a+b
f = Ap (a, b),
2
f (a) + f (b)
= A(ap , bp ),
2
donde

 pbp−1 , si p ≥ 1;
||f 0 ||∞ = δp (a, b) :=
 |p|ap−1 , si p ∈ (−∞, 1)\{−1, 0}.
Usando la desigualdad (2.28) se tiene
¯ ¯
¯ p ¯
¯Lp (a, b) − A(a , b ) − A (a, b)¯ ≤ 5 δp (a, b)(b − a).
1 p p 2 p
¯ 3 3 ¯ 35
2. Sea f : [a, b] → R (0 < a < b), f (x) = x1 ; entonces
Z b
1
f (x)dx = L−1 (a, b),
b−a a
µ ¶
a+b
f = A−1 (a, b).
2
f (a) + f (b) 1
= H −1 (a, b), ||f 0 ||∞ = .
2 a2
Usando la desigualdad (2.28) se obtiene
5 b−a
|3HA − LA − 2LH| ≤ . LAH.
12 a2
3. Sea f : [a, b] → R (0 < a < b), f (x) = ln x, entonces
Z b
1
f (x)dx = ln I(a, b),
b−a a
µ ¶
a+b
f = ln A(a, b),
2
f (a) + f (b) 1
= ln A(a, b), ||f 0 ||∞ = .
2 a
Usando la desigualdad (2.28) se tiene que
¯ · ¸¯ µ ¶
¯ I ¯ 5 b − a
¯ln ¯≤ .
¯ G1/3 A2/3 ¯ 36 a
Observación 11. Otras medias de gran importancia y utilidad son la media de Stolarsky
y la media de Ginni, la cual mencionaremos a continuación (Ver [54],[55]):
a) Media Stolarsky
Consideremos r, s ∈ R y sean a, b > 0. La media Stolarsky denotada por Er,s (a, b) de

orden (r, s) de a, b con a 6= b se define como
 µ s s
¶

 r b − a

 . r , rs(r − s) 6= 0;

 sµ b − ar ¶

 r r
 exp − 1 + a ln a − b ln b ,

r = s 6= 0;
r r r
Er,s = µ ¶a − b

 1 b −ar r

 . , r 6= 0, s = 0;

 r ln b − ln a


 √ab,

r = s = 0.
con Er,s (a, a) = a.

b) Media Ginni
Consideremos r, s ∈ R y sean a, b > 0. La media Ginni denotada por Gr,s (a, b) de orden
(r, s) de a, b con a 6= b se define como
 µ ¶1/(s−r)

 as + bs

 , r 6= s;

 arµ+ br ¶
Gr,s (a, b) = ar ln a + br ln b
 exp , r = s 6= 0;

 ar + br

 √
 ab, r = s = 0.
CONCLUSIONES Y RECOMENDACIONES
En este trabajo especial de grado se realizó un estudio sobre la noción de funciones con-
vexas; basado en algunas de sus propiedades de regularidad y diferenciabilidad; además
de sus resultados tales como la desigualdad de Jensen (para el caso discreto y el caso
continuo), la desigualdad de Hermite-Hadamard y el Teorema del Sandwich.
Se estudiaron las funciones cuasi-convexas como un caso particular de las funciones

convexas, destacando algunas caracterizaciones y genera-lizaciones tales como que toda
función convexa es cuasi-convexa, pero el recı́proco no siempre es cierto, también pudimos
verificar las distintas operaciones con funciones convexas, cuasi-convexas y Teorema del
Sandwich.
Luego como punto neurálgico de este trabajo, se estudió la desigualdad de Simpson

y los distintos resultados, conocidos en la literatura para algunos espacios de funciones,
como lo es para funciones de variación acotada con primera y segunda derivada el cual
lo demostró S. S. Dragomir en el año 1999.
Se desarrolló la Desigualdad de Simpson para funciones cuasi-convexas, con tercera
118
Conclusiones y Recomendaciones 119
derivada.
Finalmete se realizó un estudio de la estimación del término residuo para la fórmu-

la de cuadratura de Simpson sobre funciones Lipschitzianas. Además utilizando dichos
resultados se presentaron algunas aplicaciones para medias especiales.
En el desarrollo de las investigaciones de este Trabajo Especial de Grado han surgido

diversos problemas, posiblemente problemas abiertos; a conti-nuación expondremos una
selección de aquellos que resultan más relevantes en el contexto de la tesis esperando que
determine futuras investigaciones:
1 Estudiar las posibilidad de conseguir estimaciones del error de la aproximación de

la desigualdad de Simpson, donde la tercera derivada es una:
1.1 Función de variación acotada generalizada en el sentido de Wiener, Riesz,

Young, Waterman, Koremblum, Schramm, etc.
1.2 Funciones fuertemente convexas o cóncavas con módulo c, fuertemente cuasi-

convexas o cuasi-cóncavas con módulo c, y fuertemente cóncava o convexa
conjunto valuada con módulo c.
2 Estudiar el comportamiento de las posibles estimaciones dadas en el punto anterior

para obtener aplicaciones en las distintas medias especiales vistas en el capı́tulo 2.
BIBLIOGRAFÍA
[1] M. Alomari, M. Darus, On some inequalities Simpson-type via quasi-convex function

with applications, Tran. J. Math. Mech., 2 (2010), 15-24.
[2] M. Alomari, M. Darus, U. S. Kirmaci, Refinements of Hadamard-type inequalities

for cuasi-convex functions with applications to trapezoidal formula and to special
means, Computers an Mathematics with applications, 59 (2010), 225-232.
[3] M. Alomari, S. Hussain, Two inequalities of Simpson type for quasi-convex functions
and applications, Applied Mathematics E-Notes, 11 (2011), 110-117.
[4] K. J. Arrow, K. J. Enthoven, Quasi-concave programming, Econometrica, 29 (1961)

779-800.
[5] K. Baron, J. Matkowski, K. Nikodem, A sandwich with convexity, Math. Pannonica

5/1 (1994), 139-144.
[6] E. F. Beckenbach, R. H. Bing, On generalized convex functions, Trans. Amer. Math.

Soc. 58 (1945), 220-230.
[7] M. Besenyei, Zs Páles, Hadamard-type inequalities for generalized convex functions,

Math Inequal. Appl 6/3 (2003), 379-392.
120
Bibliografı́a 121
[8] F. Bombal, La cuadratura del cı́rculo: Historia de una obsesión, Rev. Real Acad.
Exact. Fis. Nat. (Esp). Vol. 105, N◦ 2, 241-258. (2012).
[9] C. B. Boyer, A History of Mathematics, 2nd ed. rev. by Uta C. Merzbach, New York,
Wiley 1989.
[10] R. L. Burden, J. Douglas Faires, Análisis numérico, Thomson Learning, 2014.
[11] B. C. Carlson, The logarithmic mean. Am Math monthly 79, 615-618 (1972).
[12] D. Cruz-Uribe, C. J. Neugebauer, Sharp error bounds for the trapezoidal rule and
Simpson’s rule, Journal of inequalities in pure and applied mathematics, Vol. 3, Issue
4, Article 49, 2002.
[13] S. S. Dragomir, On Simpson’s quadrature formula for lipchitzian mappings and ap-
plications, Soochow Journal of Mathematics, Vol. 25, No.2 (1999) 175-180.
[14] S. S. Dragomir, On Simpson´s quadrature formula for mappings of bounded variation

and applications, Tamkang J. Math., 30(1)(1999), 53-58.
[15] S. S. Dragomir, C. E. M. Pearce, Selected Topics on Hermite-Hadamard In-

equalities and applications, RGMIA Monographs, Victoria University, 2002.(ON-
LINE:HTTP://rgmia.uv.edu..au/monographs/).
[16] S. S. Dragomir, J. E. Pecãric, S. Wang, The unified treatment of trapezoid, Simp-

son and Ostrowski type inequalities for monotonic mappings and applications, J. of
Inequal. Appl., 31(2000), 61-70.
[17] S. S. Dragomir, R. P. Agarwal, P. Cerone, On Simpson’s inequality and applications,

J. of Inequal. Appl., 5 (2000), 533-579.
[18] S. S. Dragomir, Th. M. Rassias, (Eds) Ostrowski type inequalities and applications
in numerical integration, Kluwer Academic Publishers, Dordrecht, Boston, London,
2002.
Bibliografı́a 122
[19] B. C. Escobar, Algunos Teoremas de Separación de Funciones, Tesis de Grado, Uni-

versidad Nacional Abierta, Vicerectorado Académico, Caracas, 2001.
[20] W. Fenchel, convex cones, sets and functions,(mimeographed lecture notes) Princeton
University Press, Princeton, New Jersey, 1953.
[21] I. Fedotov, S. S. Dragomir, An inequality of Ostrowski type and its applicationn

for Simpson´s rule and special means, Preprint, RGMIA Res. Rep. Coll., 2 (1999),
13-20. http://matilda, vu.edu.au/rgmia.
[22] B. De Finetti, Sulle stratificazioni convesse, Annali di Matematica Pura ed Applicata,

[4]30 (1949), 173-183.
[23] F. Garcı́a, A. Nevot, Métodos numéricos, Universidad Pontificia de Comillas,

Madrid, 1997.
[24] A. Ghizzetti, A. Ossicini, Quadrature formulae, International series of numerical

mathematics, Vol. 13, Birkhãuser Verlag Basel-Stutgart, 1970.
[25] H. J. Greenberg, W. P. Pierskalla, A Review of quasi-convex functions, Reprinted

from operations research, Vol. 19, No. 7, 1971.
[26] J. González, J. Ortega, Cálculo V (Análisis Numérico), Universidad Nacional Abier-

ta, Caracas, 1984.
[27] J. Hadamard, Étude sur les propriétés des fonctions entiéres et en particulier d’une
fonction considérée par Riemann, J. Math. Pures Appl. 58 (1893), 171-215.
[28] G. H. Hardy, J. E. Littlewood, G. Polya, Inequalities, Cambridge, Mathematical

Library, 2nd Edition, 1952, Reprinted 1988.
[29] P. J. H. Herrera, La historia del problema isoperimétrico clásico con geometrı́a ele-
mental, La Gaceta de la RSME, Vol. 15, (2012) 335-354.
[30] O. Hölder, Über einen Mittelwertsatz, Nachr. Ges. Wiss. Göettingen,(1889), 38-47.
Bibliografı́a 123
[31] J. L. Jensen, Om konvese Funktioner og Uligheder imellem Middlevaerdier, Nyt

Tidsskr. Math. 16B (1905), 49-69.
[32] J. L. Jensen, Sur les fonctions convexes et les inégalités entre les valeurs moyennes.
Acta Math. 30 (1906), 175-193.
[33] P. Kahlig, J. Matkowski, Functional Equations involving the logarithmic mean. Z.

Angew Math Mech 76(7), 385-390.
[34] D. Kincaid, W, Cheney,Análisis Numérico, Addison-Wesley Iberoamericana, Willm-

ington, 1994.
[35] P. K. Kythe, M. R. Schäferkotter, Handbook of computational methods for integra-

tion, Chapman and Hall/CRC. 2005.
[36] M. Kuczma, An Introduction to the Theory of Functional Equations and Inequalities.

Cauchy’s Equation and Jensen’s Inequality PWN-Uniwersytet Slaski, Warszawa-
Kraków-Katowice, 1985.
[37] G. F. Kuncir, Algorithm 103: Simpson’s Rule Integrator, Communications of the

ACM, Vol. 5, (1962) 347.
[38] R. Lipschitz, De explicatione per series trigonometricas isttuenda functionum unius

variablis arbitrarium, et praecipue earum, quae per variablis spatium finitum valorum
maximorum et minimorum habent infinitum disquisitio, J. Reine Angew. Math, 63
(1864) 296-308.
[39] N. Merentes, N. Nikodem, Remarks on strongly convex functions, Aequations Math-

ematicae, no.1-2, 80 (2010), 193-199.
[40] D. S. Mitrivic, I. B. Lackovic, Hermite and convexity, Aequationes Math. 28 (1985),

229-232.
Bibliografı́a 124
[41] C. P. Nicculescu, L. E. Person, Convex Functions and their Applications, A Contem-

porary Approach CMS Books in Mathematics vol. 23, Springer-Verlag, New York,
2006.
[42] J. Nieto, Una demostración sencilla y elemental de la desigualdad de Young, Revista

Colombiana de Matemáticas, (1974) 177-182.
[43] K. Nikodem, Zs. Páles, Generalized convexity and separation theorems, J. Conv.
Anal. 14/2 (2007), 239-247.
[44] C. E. M. Pearce, J. Pecaric, V. Simic On Weighted generalized logarithmic means

University of Houston, vol. 24, No. 3 (1998).
[45] J. Pecaric, S. Varosanec, A note of Simpsons inequality for functions of bounded

variation, Tamkang J. Math (2000), 239-242.
[46] A. O. Pittenger, The logarithmic mean i n variables. Am math Monthly. 92(2),

99-104 (1985).
[47] G. Pólya, G. Szego, Isoperometric inequalities in mathematical physics. Princeton

University, Press. Princeton (1951).
[48] H. R. Romero, Funciones Convexas, Trabajo Especial de Grado, Universidad Na-

cional Abierta (1999).
[49] G. Roa, Funciones Fuertemente Convexas y Fuertemente Midconvexas, Trabajo Es-

pecial de Grado Universidad Central De Venezuela (2011).
[50] W. F. Rob, K. Nikodem, Z. Páles, Separation by monotonic functions Mathematica

Pannonica 7/2 (1996), 191-196.
[51] A. W. Roberts, D. E. Varberg, Convex Functions, Academic Press, New York-

London, 1973.
Bibliografı́a 125
[52] J. M. Quesada, C. Sánchez, J. Jódar, J. Martı́nez, Análisis y métodos numéricos,

Publicaciones de la Universidad de Jaén, Jaén, 2004.
[53] E. Set, M. E. Özdemir, M. Z. Sarikaya, On New Inequalities of Simpson’s type for

cuasi-convex functions with applications, Tamkang Journal Of Mathematics, Vol. 43,
No. 3, (2012), 357-364.
[54] K. B. Stolarsky, Generalizations of the logarithmic mean, Math. Mag. 48 (1975),

87-92.
[55] K. B. Stolarsky, The power and generalized logarithmic means, Amer. Math. Month-
ly, 87 (1980), 545-548.
[56] E. Sülly, D. Mayers, An Introduction to Numerical Analysis, University of Oxford,

2003.
[57] W. H. Young, On classes of Summable Functions and their Fourier Series Preceed-
ings, Series B, No. 581, 1912.

Maestromate2.0 05.19.15

Cargado por

Copyright:

Formatos disponibles

Maestromate2.0 05.19.15

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Maestromate2.0 05.19.15

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD CENTRAL DE VENEZUELA

Trabajo Especial de Grado presentado ante la

Nosotros, los abajo firmantes, designados por la Universidad Central de Venezuela

Dr. José Luis Sánchez

Dr. Hugo Leiva

2.5.1 Desigualdad de Simpson para Funciones Cuasi-Convexas . . . . . 84

Conclusiones y Recomendaciones 118

Uno de los resultados mejor conocido en la integración numérica es la desigualdad

donde la función f : [a, b] → R se asume cuatro veces continuamente diferenciable

||f (4) ||∞ := sup |f (4) | < ∞.

En este trabajo (capı́tulo 2) la noción de cuadratura juega un importante rol.

La idea básica de la cuadratura numérica es aproximar el valor de I(f ) por la

La integración numérica es una herramienta de gran utilidad para obtener va-

En este capı́tulo se dará una breve introducción de la noción de convexidad y sus

1.1 Funciones Convexas

Definición 1. Sean I ⊂ R un intervalo y f : I → R una función. Se dice que f es

para todo x, y ∈ I y t ∈ [0, 1]. Si la desigualdad es estricta cuando x 6= y y t ∈ (0, 1), se

Definición 2. Sean I ⊂ R un conjunto abierto y convexo. Una función f : I → R es

Geométricamente, la definición de una función convexa f significa que para cua-

Figura 1.1: Función convexa, I = [x, y]

= tf (x) − (1 − t)f (y).

Además, como f es una función convexa, se verifica

f (z) = f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)

Figura 1.2: Función convexa, I = [x2 , x1 ]

Análogamente, si se invierte la desigualdad (1.2), se dice que f es cóncava. La función

Figura 1.3: Función cóncava, I = [x, y]

Ahora consideraremos algunos ejemplos de funciones convexas para ilustrar la

Ejemplo 1. f (x) = |x| sobre I = R.

Veamos que f (x) = |x| es convexa.

f (tx + (1 − t)y) = |tx + (1 − t)y|

≤ |tx| + |(1 − t)y|

= tf (x) + (1 − t)f (y)

Ejemplo 2. g(x) = x2 sobre I = R.

0 ≤ t(1 − t)(x − y)2

= t(1 − t)(x2 − 2xy + y 2 )

= tx2 (1 − t) + y 2 (1 − t) − 2t(1 − t)xy

= tx2 (1 − t) + y 2 (1 − t)(1 − 1 + t) − 2t(1 − t)xy

= tx2 (1 − t) + y 2 (1 − t)(1 − (1 − t)) − 2t(1 − t)xy

= tx2 + (1 − t)y 2 − t2 x2 − (1 − t)2 y 2 − 2t(1 − t)xy

= tx2 + (1 − t)y 2 − (t2 x2 + (1 − t)2 y 2 + 2t(1 − t)xy)

= tx2 + (1 − t)y 2 − (tx + (1 − t)y)2

en efecto g(x) = x2 es convexa.

Demostremos, que h es convexa

xy ≤ ty(tx + y − ty) + (1 − t)x(tx + y − ty)

xy ≤ t2 xy + ty 2 − t2 y 2 + tx2 + xy − txy − t2 x2 − txy + t2 xy

0 ≤ t2 xy + ty 2 − t2 y 2 + tx2 + xy − txy − t2 x2 − txy + t2 xy t>0

0 ≤ 2txy + x2 + y 2 − tx2 − 2xy − ty 2

0 ≤ (1 − t)(x + y)2 (1 − t) > 0

lo cual es cierto; por lo tanto, h es convexa.

Lema 1 (Ver [48]). Sean I ⊂ R un intervalo y f : I → R una función. Entonces, f es

Demostración: Para verificar la primera desigualdad, consideremos

z = x + λ(y − x), λ ∈ (0, 1),

f (z) ≤ f (x) + λ(f (y) − f (x)),

f (z) − f (x) f (y) − f (x)

f (z) ≤ f (y) + λ(f (x) − f (y)),

de donde se obtiene inmediatamente

f (z) − f (y) f (x) − f (y)

f (z) − f (x) f (y) − f (x)

f (x + λ(y − x)) ≤ f (x) + λ(f (y) − f (x)),