Funções Convexas
Funções Convexas
Funções Convexas
FUNÇÕES CONVEXAS
Curitiba
2008
VANESSA HLENKA
FUNÇÕES CONVEXAS
Curitiba
2008
Termo de Aprovação
Vanessa Hlenka
FUNÇÕES CONVEXAS
——————————————————–
Profa . Dra . Elizabeth Wegner Karas
——————————————————–
Profa . Dra . Ana Gabriela Martinez
——————————————————–
Profa . Dra . Lucelina Batista dos Santos
RESUMO
Introdução 1
1 Definições e exemplos 2
1.1 Convexidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Desigualdade de Jensen . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Função estendida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2 Propriedades 13
2.1 Primeiras Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Estabilidade sob operações funcionais . . . . . . . . . . . . . . . . . . 21
3 Continuidade 23
3.1 Continuidade no interior do domı́nio . . . . . . . . . . . . . . . . . . 23
3.2 Semi-continuidade inferior . . . . . . . . . . . . . . . . . . . . . . . . 25
Conclusão 40
Referências Bibliográficas 41
v
Introdução
Definições e exemplos
1.1 Convexidade
Os intervalos formam exemplos particularmente simples de subconjuntos
de IR. Um subconjunto I ∈ IR é um intervalo se e somente se, sempre que x0 e x1
pertencem a I, uma das seguintes propriedades vale:
(ii) para todo α ∈ [0, 1], o ponto αx0 + (1 − α)x1 pertence a I (definição usando a
estrutura de vetor de IR).
• Os intervalos limitados mas não fechados: [a, b), (a, b], (a, b) com a, b ∈ IR,
a < b;
• Os intervalos ilimitados: (−∞, b] e (−∞, b), [a, +∞) e (a, +∞) com a, b ∈ IR;
2
3
αx1 + (1 − α)x2 ∈ C.
Figura 1.1: Epigrafo de uma função f . O epigrafo de uma função convexa é um conjunto
convexo.
a u b
(α=0) (α=1)
f(x )
2
α f(x )+(1−α)f(x )
1 2
f(z)
f(x )
1
x z x
1 2
A Figura 1.4 sugere que, se u está entre x0 e x1 e Pu está abaixo de Px0 Px1 , a
inclinação de Px0 Pu (ou melhor: da reta que une Px0 e Pu ) é menor que a inclinação
de Px0 Px1 , que por sua vez é menor que a inclinação de Pu Px1 .
• α ∈ (0, 1),
• a ≤ x < x′ ≤ b,
5
f(x )
1 P
x
1
z
f(x0) P
P z
x
0
f(u)
P
u
x u x
0 1
• x′′ := αx + (1 − α)x′ ,
e chamemos
Φ := f (x′′ ) − αf (x) − (1 − α)f (x′ ),
que deve ser não-positiva (Φ ≤ 0), para que tenhamos
f (x′′ ) ≤ αf (x) + (1 − α)f (x′ ),
ou seja, queremos que f seja convexa.
Temos que
Φ = |x′′ | − α|x| − (1 − α)|x′ |.
Substituindo x′′ por αx + (1 − α)x′ , temos
Φ = |αx + (1 − α)x′ | − α|x| − (1 − α)|x′ |.
Aplicando a desigualdade triangular, obtemos
Φ ≤ |αx| + |(1 − α)x′ | − α|x| − (1 − α)|x′ |
= α|x| + (1 − α)|x′ | − α|x| − (1 − α)|x′ |
= 0.
Como Φ ≤ 0, concluimos que f é convexa.
Exemplo 1.7 Se ϕ é uma função crescente em um segmento [a, b], então a conve-
xidade da função Z x
[a, b] ∋ x 7−→ f (x) := ϕ(u)du
a
é facilmente estabelecida da equação (1.3).
6
|x|
De fato, tomemos
• α ∈ (0, 1),
• a ≤ x < x′ ≤ b,
• x′′ := αx + (1 − α)x′ ,
e chamemos
Φ := f (x′′ ) − αf (x) − (1 − α)f (x′ ),
que deve ser não-positiva (Φ ≤ 0), para que tenhamos
Z x′′ Z x Z x′
Φ = ϕ(u)du − (1 − α)
ϕ(u)du − α ϕ(u)du
a a a
Z x′′ Z x Z x′ Z x′
= ϕ(u)du − α ϕ(u)du − ϕ(u)du + α ϕ(u)du
a a a a
Z x′′ Z x′
= ϕ(u)du + α ϕ(u)du.
x′ x
7
Temos que a ≤ x < x′′ < x′ ≤ b. Como ϕ é crescente em [a, b], se u ∈ (x, x′′ ), então
ϕ(u) ≤ ϕ(x′′ ). Logo, vale
Z x′′ Z x′
Φ = α ϕ(u)du + (α − 1) ϕ(u)du
x x′′
Z x′′ Z x′
′′
≤ α ϕ(x )du + (α − 1) ϕ(x′′ )du.
x x′′
Temos que
Zx
1
log x = dt.
t
1
Então
Zx
1
− log x = − dt.
t
1
1
Sabemos que − é crescente em [1, ∞), portanto crescente em [1, b]; logo, do Exem-
t
plo (1.7), concluimos que − log x é convexa em [1, b].
8
−log(x)
Sabemos que exp(u) é crescente em [a, b], pois é crescente em IR. Logo, do Exemplo
1.7, a função exp(x) − exp(a) é convexa em [a, b]. Ao somarmos exp(a) a exp(x) −
exp(a), obtemos exp(x). Efetuando esta soma, não alteramos a forma do gráfico da
função, apenas o deslocamos verticalmente. Portanto, exp(x) também é convexa.
exp(x)
Então
k
X k−1
X
αi xi = ᾱ ᾱi xi + (1 − ᾱ)xk .
i=1 i=1
10
Pk−1
Nesta relação, o ponto x̄ := i=1 ᾱi xi está em I, isto é, entre o menor xi e o maior
xi . Aplicando (1.4), obtemos:
Xk
f( αi xi ) ≤ ᾱf (x̄) + (1 − ᾱ)f (xk )
i=1
= ᾱf (x̄) + αk f (xk ).
k
O conjunto descrito por (1.3) é chamado de simplex unitário de IR . Uma coleção
de αP
i ’s satisfazendo (1.3) é chamado de multiplicadores convexos e o correspondente
x = ki=1 αi xi é uma combinação convexa dos xi ’s.
Dizemos que a maioria das desigualdades úteis entre números reais são
conseqüências da desigualdade de Jensen acima, mesmo que nem sempre seja fácil
descobrir a função convexa latente. A seguir, alguns exemplos tı́picos.
Exemplo 1.11 Do Exemplo 1.8, sabemos que a função − log x é convexa em (0, +∞).
Então, vale a desigualdade de Jensen:
k
! k
X X
− log αi xi ≤ − αi log xi
i=1 i=1
Xk
= − log xαi i
i=1
k
!
Y
= − log xαi i ,
i=1
1
Observação 1.12 No caso particular em que αi = , i = 1, . . . , n, temos a
n
clássica desigualdade entre a média aritmética e a média geométrica:
√ x1 + · · · + xn
n
x1 x2 . . . xn ≤ .
n
11
Exemplo 1.13 Seja a função x log x, convexa em (0, +∞). Aplicando a desigual-
dade de Jensen, temos
k
! k
! k
X X X
αi xi log αi xi ≤ αi (xi log xi ),
i=1 i=1 i=1
k
!P ki=1 αi xi k
X X
log αi xi ≤ log xαi i xi
i=1 i=1
k
!
Y
= log xαi i xi .
i=1
k
!P ki=1 αi xi k
X Y
αi xi ≤ xαi i xi .
i=1 i=1
Propriedades
13
14
y1 x1 − y1 u − y0 x1 + y0 u ≤ y1 x1 − y1 x0 − vx1 + vx0 ,
vx1 − vx0 − x1 y0 ≤ −x0 y1 + y1 u − y0 u.
Somando x0 y0 em ambos os membros da desigualdade, obtemos
vx1 − vx0 − x1 y0 + x0 y0 ≤ x0 y0 − x0 y1 + y1 u − y0 u,
ou seja,
v(x1 − x0 ) − y0 (x1 − x0 ) ≤ u(y1 − y0 ) − x(y1 − y0 ).
Logo, como x1 − x0 > 0, temos
y1 − y0
v ≤ y0 + (u − x0 ).
x1 − x0
15
u = αx0 + (1 − α)x1 .
Então,
x1 − u
α=
x1 − x0
e
u − x0
1−α= .
x1 − x0
Substituindo em (4.3), obtemos
x1 − u u − x0
f (u) ≤ f (x0 ) + f (x1 ).
x1 − x0 x1 − x0
Como x1 − x0 > 0, então
f (x) = − log x,
g(x) = x log x
f (x) = exp(x),
21
Somando as desigualdades
m
P
ou seja, f := tj fj ∈ Conv IR.
j=1
pois f é convexa, por hipótese. Temos que f (I) ⊂ J. Também temos que g é não
decrescente, logo
ou seja,
g ◦ f ((1 − α)x + αx′ ) ≤ (1 − α)g ◦ f (x) + αg ◦ f (x′ ),
o que significa que g ◦ f é convexa.
Capı́tulo 3
Continuidade
Ao longo desta seção, utilizamos conceitos de análise que podem ser verifi-
cados em [5]. Os assuntos deste capı́tulo são: continuidade no interior do domı́nio e
semi-continuidade inferior.
Teorema 3.1 Seja uma função convexa f definida em (a, b). Então f é contı́nua.
Prova. Dado x ∈ (a, b), escolha δ > 0 tal que [x − δ, x + δ] ⊂ (a, b). Agora considere
um ponto z1 ∈ (x − δ, x). Aplicando a propriedade das inclinações crescentes para
os pontos x − δ, z1 , x, temos
23
24
Observação 3.2 Mais adiante, mostraremos que fé localmente Lipschitziana. Pre-
cisamos primeiro falar sobre as derivadas laterais de f , que serão de fundamental
importância para encontrarmos a constante de Lipschitz.
Proposição 3.3 Seja o domı́nio de f (f ∈ Conv IR) com interior não vazio e
chamemos de a ∈ IR seu extremo à esquerda. Então o limite à direita f (a+ ) :=
lim+ f (x) existe em IR ∪ {+∞}, e f (a) ≥ f (a+ ).
x→a
Similarmente, se b ∈ IR é o extremo à direita do Dom f , o limite à esquerda
f (b− ) existe em IR ∪ {+∞} e f (b) ≥ f (b− ).
Tomemos, então,
t1 > t2
e multipliquemos ambos os membros da desigualdade por d para obter
Temos que
f (x0 + dt1 ) − f (x0 ) f (x0 + dt2 ) − f (x0 )
< ,
(x0 + dt1 ) − x0 (x0 + dt2 ) − x0
pois funções inclinação são crescentes. Multiplicando ambos os membros da de-
sigualdade por d, chegamos a
f (x0 + dt1 ) − f (x0 ) f (x0 + dt2 ) − f (x0 )
> ,
t1 t2
logo
q(t1 ) > q(t2 ),
portanto q(t) é função crescente. A partir de
f (x0 + td) − f (x0 )
= q(t),
t
temos
Então coloquemos t → t−
0 na relação
f (a) − f (x0 )
q(t) ≤ q(t0 ) = ,
x0 − a
para todo t ∈]0, t0 [, para obter
f (a+ ) − f (x0 ) f (a) − f (x0 )
ℓ= ≤ ,
x0 − a x0 − a
logo f (a+ ) ≤ f (a).
f(a )
+
f(a)∈[−∞, f(a )]
−
a a a
(1) Contínua (2) Semi−contínua inferior (3) Ilimitada
ou seja, (x, t) ∈ epi f . Como (x, t) é ponto de aderência de epi f , temos que epi f é
um conjunto fechado.
(ii)→(iii): Tomemos xk ∈ Lt (f ) tal que xk → a. Precisamos provar que
a ∈ Lt (f ). Seja a seqüência (xk , t). Como xk ∈ Lt (f ), temos que f (xk ) ≤ t. Por
definição, (xk , t) ∈ epi f , pois t ≥ f (xk ). Como epi f é um conjunto fechado, por
hipótese, e (xk , t) → (a, t), então (a, t) ∈ epi f , ou seja, t ≥ f (a). Logo Lt (f ) é
fechado para todo t ∈ IR.
(iii)→(i): Suponhamos agora, por contradição, que f não é semi-contı́nua
inferior para algum x. Então existe uma seqüência {xk } convergindo para x tal
que f (xk ) converge para r < f (x) ≤ +∞. Consideremos t ∈ (r, f (x)). Quando k
é suficientemente grande, temos f (xk ) ≤ t < f (x), ou seja, Lt (f ) não contém seu
limite x. Então, Lt (f ) não é fechado.
27
Lt(f)
Exemplo 3.7 Seja f uma função convexa cujo domı́nio é todo o IR, e seja C um
intervalo fechado não-vazio. Então a “restrição convexa” de f a C:
f (x) para x ∈ C,
fC (x) :=
+∞ para x ∈ / C,
é fechada e convexa. Seu epigrafo é a intersecção do epi f com a barra vertical
gerada por C.
Teorema 3.10 Seja f ∈ Conv IR. Para todo x0 pertencente ao interior de seu
domı́nio, f admite uma derivada à direita e uma à esquerda, finitas:
Teorema 3.11 Se f ∈ Conv IR, então f é contı́nua no int Dom f . Além disso, para
cada intervalo compacto [a, b] ⊂ int Dom f , existe L ≥ 0 tal que
f (x) − f (a)
D+ f (a) ≤ ≤ D− f (x) ≤ D+ f (x)
x−a
f (x′ ) − f (x)
≤ ≤ D− f (x′ ) ≤ · · · ≤ D− f (b).
x −x
′
Então
|f (x) − f (x′ )| ≤ L|x − x′ |,
ou seja, que é a continuidade Lipschitziana de f em [a, b]. Em outras palavras, f é
localmente Lipschitziana no interior de seu domı́nio.
Capı́tulo 4
Caracterização de convexidade de
funções diferenciáveis
f ′′ (a)
′
p2 (x) = f (a) + f (a)(x − a) + (x − a)2 .
2!
Além disso,
f (x) − p2 (x)
lim = 0,
x→a (x − a)2
isto é, a diferença entre f (x) e p2 (x) vai para zero mais rapidamente do que (x−a)2 .
Em outras palavras,
f ′′ (a)
f (x) = f (a) + f ′ (a)(x − a) + (x − a)2 + R2 (a, x),
2!
com
R2 (a, x)
lim = 0.
x→a (x − a)2
29
30
Prova. Seja
p2 = α + βx + γx2 (4.1)
um polinômio do segundo grau. Então
p′2 (x) = β + 2γx
e
p′′2 (x) = 2!γ.
Queremos que p2 satisfaça
p′′2 (a) = f ′′ (a),
ou seja,
2!γ = f ′′ (a).
Então
f ′′ (a)
γ= .
2!
Também queremos que p2 satisfaça
p′2 (a) = f ′ (a),
ou seja,
β + 2γa = f ′ (a).
Logo, concluimos que
β = f ′ (a) − f ′′ (a)a.
E, por fim, desejamos que p2 satisfaça
p2 (a) = f (a),
isto é,
α + βa + γa2 = f (a).
Então encontramos
f ′′ (a)
α = f (a) − [f ′ (a) − f ′′ (a)a]a − a.
2!
Substituindo os valores encontrados para α, β, γ em (4.1), chegamos a
f ′′ (a)
p2 (x) = f (a) + f ′ (a)(x − a) + (x − a)2 .
2!
Agora, utilizando duas vezes a regra de L’Hôpital, temos
f (x) − p2 (x) f ′ (x) − p′2 (x)
lim = lim
x→a (x − a)2 x→a 2(x − a)
f (x) − p′′2 (x)
′′
= lim
x→a 2
f (a) − p2 (a)
′′ ′′
=
2
= 0,
isto é, o erro R2 (a, x) = f (x) − p2 (x) vai para zero mais rapidamente do que a
expressão (x − a)2 .
31
p1 (x) = 1 + x.
x2
p2 (x) = 1 + x + .
2
A Figura 4.1 mostra os gráficos de f , p1 e p2 .
x
e
Aproximação
quadrática Aproximação
linear
Além disso,
f (x) = p2 (x) + R2 (a, x), (4.2)
onde o erro R2 (a, x) satisfaz a propriedade:
isto é, o erro R2 (a, x) vai para zero mais rapidamente do que o quadrado da distância
entre a e x. A equação (4.2) é a chamada “fórmula de Taylor com resto infinite-
simal”.
Seja
f (t) = r(tv),
para 0 ≤ t ≤ 1. Então
f ′ (t) = ∇f (tv)v
n
X ∂f
= (tv)αi ,
i=1
∂x i
onde v = (α1 , . . . , αn ). Pelo Teorema do Valor Médio, temos que existe θ ∈ [0, 1] tal
que
f (1) − f (0) = f ′ (θ) 1,
n
X ∂r
r(v) − r(0) = (θv)αi .
i=1
∂xi
Então n
X ∂r
r(v) = (θv)αi
i=1
∂xi
e, portanto,
∂r ∂r
n (θv)αi X n (θv)
r(v) X ∂xi ∂xi αi
= = ,
|v|p+1
i=1
|v|p+1
i=1
|v|p |v|
αi
Temos que é sempre menor que ou igual a 1, em valor absoluto. (Basta tomar
|v|
em IRn a norma da soma.) Segue-se então que
r(v)
lim = 0,
v→0 |v|p+1
f(z)
y=f(x)+(z−x)t∇ f(x)
x z
αf (x) + (1 − α)f (y) ≥ f (z) + [α(x − z)t + (1 − α)(y − z)t ]∇f (z)
= f (z) + (αxt − αz t + y t − z t − αy t + αz t )∇f (z)
= f (z) + (αxt + y t − αy t − z t )∇f (z)
= f (z) + (αx + (1 − α)y − z)t ∇f (z).
ou seja,
αf (x) + (1 − α)f (y) ≥ f (z).
Logo, f é convexa, por definição.
Se a desigualdade (4.4) é estrita como enunciado na parte (ii) da proposi-
ção, então, ao tomarmos x 6= y e α ∈ (0, 1) acima, as desigualdades precedentes se
tornam estritas, assim mostrando a desigualdade estrita de f .
f(y)
f(z)+(y−z)t∇ f(z)
α f(x)+(1−α)f(y)
f(x)
f(z)
f(z)+(x−z)t∇ f(z)
x y
z=α x+(1−α)y
Prova.
(i) Suponhamos que ∇2 f (x) seja semidefinido positivo para todo x ∈ C.
Então, por definição, pt ∇2 f (x)p ≥ 0, para todo p ∈ IRn . Sejam x, y ∈ C.Como f é
continuamente duas vezes diferenciável sobre Rn , existe α ∈ (0, 1) tal que
1
f (x) = f (y) + ∇f t (y)(x − y) + (x − y)t ∇2 f (z)(x − y),
2
onde z é um ponto no segmento de reta que liga x em y, isto é,
z = αx + (1 − α)y.
(x − y)t ∇2 f (z)(x − y) ≥ 0.
Portanto,
f (x) ≥ f (y) + ∇f t (y)(x − y).
38
f(z)
f(x)+[f(x+α(z−x))−f(x)]/α
f(x)+(z−x)t∇ f(x)
x x+α(z−x) z
(ii) Suponhamos que ∇2 f (x) seja definido positivo para todo x ∈ C. Então,
por definição, pt ∇2 f (x)p > 0, para todo p 6= 0. Sejam x, y ∈ C, com x 6= y. Como
f é continuamente duas vezes diferenciável sobre Rn , existe α ∈ (0, 1) tal que
1
f (x) = f (y) + ∇f t (y)(x − y) + (x − y)t ∇2 f (z)(x − y),
2
onde z é um ponto no segmento de reta que liga x em y, isto é,
z = αx + (1 − α)y.
Então
g ′ (λ) = ∇f t (y + λd)d
e
g ′′ (λ) = dt ∇2 f (y + λd)d.
Para λ = 0, temos g(0) = f (y), o que implica que g é convexa no ponto 0. Logo,
Pela conservação de sinal, temos que existe δ > 0 tal que g ′′ (λ) < 0 para todo
λ ∈ (−δ, δ). Seja
δ
x = y + d.
2
Por Taylor, temos que existe α ∈ (0, 1) tal que
1
f (x) = f (y) + ∇f t (y)(x − y) + (x − y)t ∇2 f (z)(x − y),
2
onde
δ
z = y + α(x − y) = y + α d.
2
Então
t 1 δ t 2 δ δ
f (x) = f (y) + ∇f (y)(x − y) + d ∇ f y+α d d .
2 2 2 2
Temos que
1 δ t 2 δ δ
d ∇ f y+α d d < 0,
2 2 2 2
logo
f (x) < f (y) + ∇f t (y)(x − y),
o que, pela Proposição 4.6, contradiz a hipótese de que f é convexa sobre C.
f (x) = xt Qx + at x,
[4] E.L. Lima. Análise Real Volume 1: Funções de Uma Variável Real. Coleção
Matemática Universitária. IMPA, Rio de Janeiro, 2006.
[5] E.L. Lima. Curso de Análise Volume 1. Coleção Projeto Euclides. IMPA, Rio de
Janeiro, 2006.
[6] E.L. Lima. Curso de Análise Volume 2. Coleção Projeto Euclides. IMPA, Rio de
Janeiro, 2006.
41