KONVEKSNA ANALIZA
1
Sadrˇ
zaj
Konveksni skupovi
Definicija, primjeri, Konveksni omota´c,Topoloˇska svojstva, Projekcija,
Ekstremalne tacke, Teoreme razdvajanja, teoreme alternative, Polarni skupovi,
Poliedri
Konveksne funkcije
Zadaci
Konveksne funkcije i ekstremi
Zadaci
Rjeˇsenja
Literatura
Spisak pojmova
2
Uvod
Konveksna analiza se krajem 60 i poˇcetkom 70 ih... Neka je f realna funkcija
sa domenom D(f ) ⊆ Rn , i neka je S ⊆ D(f ) neprazan skup. Opˇsti (apstraktan)
problem matematiˇckog programiranja sastoji se u odred¯ivanju vrijednosti
π = inf f (x)
x∈S
i skupa
S ∗ = {x ∈ S : f (x) = π}.
Problem oznaˇcamo sa
(P A) :
min{ f (x) : x ∈ S}.
Ako je funkcija f konveksna, a tzv. dopustivi skup S konveksan skup, onda se
dobija problem konveksnog programiranja (konveksne optimizacije).
Tada se dopustivi skup najˇceˇs´ce zadaje pomo´cu konveksnih funkcija g1 , ..., gm
definisanih na konveksnom skupu C ⊆ Rn :
G = {x ∈ C : g1 (x) 6 0, ..., gm (x) 6 0}.
Taˇcka x∗ ∈ S je rjeˇsenje problema (PA) ako vrijedi
f (x) > f (x∗ ) ∀x ∈ S.
ˇ
U suˇstini, x∗ je taˇcka globalnog minimuma funkcije f na skupu S. Cesto
je
lakˇse, a nekad i jedino mogu´ce na´ci taˇcku minimuma date funkcije na nekom
podskupu skupa S. Zato kaˇzemo da je x∗ lokalno rjeˇsenje datog problema, ako
je to taˇcka lokalnog minimuma funkcije f na skupu S, tj. ako postoji okolina
O taˇcke x∗ takva da vrijedi
f (x) > f (x∗ )
∀x ∈ S ∩ O.
3


x1


Rn ... x =  ... , y > = (y1 , ..., yn ), hx, yi := x> y
xn
kxk :=
p
hx, xi =
à n
X
! 12
x2i
i=1
kx + yk 6 kxk + kyk
| kxk − kyk | 6 kx − yk
|hx, yi| 6 kxk kyk
2
kx − yk + kx + yk2 = 2(kxk2 + kyk2 )
(1)
B(x0 , r) = {x ∈ Rn : kx0 − xk < r},
B[x0 , r] = {x ∈ Rn : kx0 − xk 6 r}
d(x0 , S) = inf kx0 − xk
x∈S
S + T = {x + y : x ∈ S, y ∈ T }...αS = {αx : x ∈ S}
Primjer 1 B[x1 , r1 ] + B[x2 , r2 ] = B[x1 + x2 , r1 + r2 ] Zbog ... moˇzemo uzeti
x1 = x2 = 0. Inkluzija B[0, r1 ] + B[0, r2 ] ⊆ B[0, r1 + r2 ] vrijedi na osnovu
nejednakosti trougla. Neka je sada x ∈ B[0, r1 + r2 ], pri ˇcemu je r1 6 r2 . Ako
r2
2
semo x = x + 0.
je r2 < kxk stavljamo x = kxk−r
kxk x + kxk x. U suprotnom piˇ
S + T = T + S, S + {0} = S
1. α(S + T ) = αS + αT
2. (α + β)S ⊆ αS + βS.
3. S + (T ∪ U) = (S + T ) ∪ (S + U).
Analogna formula za ∩ ne vrijedi, ali je korisna sljede´ca relacija
4. (S + T ) ∩ U = ∅ ⇐⇒ S ∩ (U − T ) = ∅
T OP OL
Naveˇs´cemo neka svojstva operacija sa skupovima, posebno imaju´ci u vidu otvorene,
zatvorene te kompaktne podskupove u Rn .
Taˇcka x0 je unutraˇsnja taˇcka skupa S ako postoji broj ε > 0 tako da vrijedi
B(x0 , ε) ⊆ S. Skup svih unutraˇsnjih taˇcaka datog skupa je njegova unutraˇsnjost
(interior):
int S = {x ∈ S : ∃ε > 0 (x + εB) ⊆ S}.
(2)
4
Skup je otvoren ako mu je svaka taˇcka unutraˇsnja, tj. ako je int S = S.
Taˇcka x0 je graniˇcna taˇcka skupa S ako se u svakoj kugli B(x0 , ε) nalaze
taˇcka iz S i taˇcka iz njegovog komplementa Rn \S. Skup svih tih taˇcaka je
granica skupa S, a oznaˇcavamo ga sa bd S.
Zatvorenje skupa S definiˇsemo sa cl S := S ∪ bd S. Kaˇze se da je neki skup
zatvoren ako je njegov komplement otvoren skup. pokazuje se da su bd S i cl
S zatvoreni skupovi. Odatle izlazi da je cl S najmanji zatvoreni nadskup skupa
S, i to da je on je zatvoren ako i samo ako je cl S = S. Navedimo joˇs da je skup
S zatvoren ako i samo ako za svaki konvergentan niz (xk ), xk ∈ S vrijedi lim
xk ∈ S. Za karakterizaciju zatvorenja skupa osim
x0 ∈ cl S ⇐⇒ d(x0 , S) = 0,
koristi´cemo i sljede´cu
cl S =
\
(S + εB),
(3)
ε>0
koja slijedi iz ().
Uopˇste, vrijede formule:
int (S ∪ T ) ⊇ int S ∪ int T ,
cl (S ∪ T ) = cl S ∪ cl T ,
int (S ∩ T ) = int S ∩ int T ,
cl (S ∩ T ) ⊆ cl S ∩ cl T .
Mi ´cemo, zbog prirode konveksnih skupova, viˇse paˇznje posvetiti operacijama ∩
i +. Kao prvo, navedimo da u posljednjoj formuli ne mora da vrijedi jednakost.
Primjer 2 Za skupove S = {x ∈ R2 : x1 > 0, x2 > 0} ∪ {0}, T = [0, e1 ],
imamo cl (S ∩ T ) = {0}, dok je cl S ∩ cl T = T .
Primjedba 1 Tre´ca formula vrijedi i za konaˇcan broj skupova,Tali to nije tako
1
u sluˇcaju
T da ih je prebrojivo. Za Ck = [0, 1+ k ] imamo da je int k∈N Ck =]0, 1[,
dok je k∈N int Ck =]0, 1].
S obzirom da je S + T =
[
(x + T ), imamo da je suma dva skupa otvoren skup
x∈S
ako je jedan od njih (ovdje T ) otvoren.
5. Sada, iz int S+ int T ⊆ S + T slijedi int(int S+ int T ) ⊆ int (S + T ),
odnosno
int S + int T ⊆ int (S + T ).
Obratna inkluzija nije na snazi, bez dodatnih uslova. Na primjer:
S = [0, 1], T = S ∪ {2}, int S+ int T =]0, 2[ ⊂ int (S + T ) =]0, 3[.
6. Med¯utim, suma dva zatvorena
skupa ne mora
biti zatvorena. Na primjer,
©
ª
u R2 za zatvorene skupove S = (x, x1 ) : x > 0 , i T = R × {0} suma S + T =
5
R×]0, +∞[ je otvoren skup.
Ovo je i primjer da nije uvijek cl S+ cl T = cl (S + T ). Uvijek je
cl S + cl T ⊆ cl (S + T ),
a da bismo imali jednakost dovoljno je da je jedan od skupova kompaktan. To
slijedi iz sljede´ce ˇcinjenice.
7. Suma zatvorenog i kompaktnog skupa je zatvoren skup. Zaista, neka je z k
niz sa ˇclanovima iz S + T koji teˇzi z 0 . Vrijedi z k = xk + y k , xk ∈ S i y k ∈ T
za sve prirodne k. Neka su dati skupovi zatvoreni, i joˇs neka je T ograniˇcen (tj.
kompaktan). Niz (y k ) ima podniz koji teˇzi nekom y 0 ∈ T . Sada i odgovaraju´ci
podniz niza (xk ) ima graniˇcnu vrijednost, i to z 0 − y 0 ∈ S (S je zatvoren).
Dakle, z 0 = (z 0 − y 0 ) + y 0 ∈ S + T , pa je ova suma zatvoren skup.
6
Afini skupovi
1. Skup V 6= ∅ je potprostor ako je i sam vektorski prostor, u odnosu na iste
operacije. Za to je potrebno i dovoljno da vrijedi
αx + βy ∈ V
∀x, y ∈ V, α, β ∈ R,
ˇsto je ekvivalentno sa
αV + βV ⊆ V
∀ α, β ∈ R.
(4)
0
Zbir jednoˇclanog skupa {v } i potprostora V zove se linearna (afina) mnogostrukost L:
L = v 0 + V.
S obzirom da 0 ∈ V, to je v 0 ∈ L. Uzmimo neki drugi vektor v ∈ L. Imamo
v − v 0 ∈ V, pa je L − v = V − (v − v 0 ) = V. Znaˇci da za svaki v ∈ L je
L = v + V.
Dalje, zbog
L − L = v 0 + V − (v 0 + V) = V − V = V,
imamo, za svaki v ∈ L,
L − L = L − v.
(5)
Sliˇcno je (1 − λ)L + λL = (1 − λ)(v 0 + V) + λ(v 0 + V) = v 0 + (1 − λ)V + λV ⊆
v + V = L, tj. za sve λ ∈ R vrijedi
0
(1 − λ)L + λL ⊆ L.
(6)
Ova formula je i dovoljne da L bude linearna mnogostrukost. Zaista, uzmimo
vektore u, v ∈ L − L. Imamo u = u1 − u2 , v = v 1 − v 2 , gdje su svi sabirci iz L.
2
2
u1 +v 1
Vrijedi αu = u1 − ((1 − α)u1 + αu2 ) ⊆ L − L, i u+v
− u +v
∈ L − L.
2 =
2
2
Sada je u+v = 2 u+v
∈
L−L,
pa
je
ta
razlika
skupova
potprostor
i
koristi
se (4).
2
2. U sluˇcaju da je linearna mnogostrukost u prostoru Rn zva´cemo je ravan
R. Ako je potprostor R − R dimenzije k ∈ {1, ..., n − 1}, onda postoji linearno
nezavisan skup {x1 , ..., xk } ⊆ R takav da je R − R = lin (v 1 , ..., v k ). Dakle,
prema (4), za neki x0 ∈ R imamo
R = x0 + lin (x1 , ..., xk ),
i kaˇzemo da je ta ravan dimenzije k. Specijalno, prava je ravan dimenzije 1:
P = x0 + lin (v) = {x0 + λv : λ ∈ R},
v 6= 0.
Neka su x1 , x2 ∈ razliˇcite taˇcke sa prave. Tada je za neke razliˇcite skalare λ1 , λ2
x1 = x0 + λ1 v, x2 = x0 + λ2 v, x2 − x1 = (λ2 − λ1 )v, odakle je lin (v)= lin
7
(x2 − x1 ). Zakljuˇcno uzimaju´ci x1 umjesto x0 jednaˇcina prave kojoj pripadaju
raˇzliˇcite taˇcke x1 i x2 je
x = x1 + λ(x2 − x1 ),
λ ∈ R.
Ravan dimenzije n − 1
H = x0 + lin (x1 , ..., xn−1 )
zovemo hiperravan. Inaˇce svaka hiperravan je data sa
H(a, α) = {x ∈ Rn : ha, xi = α},
gdje je a ∈ Rn , a 6= 0 i α ∈ R. Za a = 0 dobijamo ∅ (ako je α 6= 0) ili ˇcitav
prostor (α = 0). Skup rjeˇsenja sistema
Ax = b,
gdje je A m × n matrica, b ∈ Rn , a x ∈ Rn je ravan dimenzije k = n − rang(A),
a vrijedi i obratno, svakoj ravni odgovara sistem ˇciji je skup rjeˇsenja.
3. Na kraju, odredimo najmanju ravan (poredak je dat relacijom ⊆) u kojoj
je neprazan skup S. Neka je x0 ∈ S, tada je {0} ⊆ S − x0 ⊆ Rn , pa postoji
najmanji potprostor ˇciji podskup je S − x0 , a to je presjek svih odgovaraju´cih
potprostora, tj. lin (S − x0 ). Transliraju´ci taj lineal za x0 dobijamo traˇzenu
ravan, koja se naziva afini omotaˇc skupa S
aff S = x0 + lin (S − x0 ).
Kao i dokazuje se da vrijedi
[
aff S =
{λ1 x1 + ... + λk xk : x1 , ..., xk ∈ S, λ1 + ... + λk = 1}
k∈N
Pod dimenzijom skupa S smatra´cemo dimenziju njegovog afinog omotaˇca. Ako
je ona k onda postoji skup {x0 , x1 , ..., xk } ⊆ S takav da je {x1 − x0 , ..., xk − x0 }
linarno nezavisan. Tada je
µ 0
¶
µ 0
¶
x x1 ... xk
x x1 − x0 ... xk−1 − x0
= rang
= k + 1,
rang
1
1 ... 1
1
0
...
0
i
x ∈ aff S ⇔ x =
k
X
i=0
λi xi ,
k
X
λi = 1.
(7)
i=0
Kaˇzemo da je {x0 , x1 , ..., xk } afino nezavisan, dok je vektor (λ0 , ..., λk ) jedinstven
i njegove koordinate nazivamo baricentriˇcnim.
8
FUNKCIJE
Vaˇzni skupovi koji su pridruˇzeni svakoj funkciji f : Df → R, Df ⊆ Rn su
nadgraf (epigraf), podgraf (hipograf) i nivoski (Lebegov) skup :
½µ
¶
¾
x
epi f =
∈ Df × R : α > f (x)
α
hypo f = −epi (−f ),
lev (f, α) = {x ∈ Df : f (x) 6 α} .
Umjesto domena funkcije moˇzemo uzeti neki njegov neprazan podskup S, tj.
posmtaramo restrikciju f |S . Tada se i gornje definicije modifikuju, pri ˇcemu se
umjesto epi (f, S) i lev (f, S, α) zadrˇzavaju stare oznake, a ako nema zabune
za nivoski skup imamo oznaku levα Limes inferior niza, odnosno limes inferior
funkcije definiˇsemo na sljede´ci naˇcin.
lim inf xn = sup inf xk
n x>n
lim inf
f (x) = lim
o
x→x
inf
ε↓0 0<kx−x0 k<ε
f (x)
Kaˇzemo da je funkcija f odozdo poluneprekidna u taˇcki x0 ∈ S ako vrijedi
lim inf
f (x) > f (x0 ).
o
x→x
Ovo je ekvivalentno sa
(∀ε > 0)(∃δ > 0)(∀x ∈ S ∩ B(x0 , δ)) f (x0 ) − ε < f (x),
odnosno sa uslovom da za svaki niz {xk }, xk ∈ S, xk → x0 vrijedi
f (x0 ) 6 lim inf f (xk ).
Teorema 1 (Vajerˇ
stras) Neka je realna funkcija f odozdo poluneprekidna na
zatvorenom ograniˇcenom skupu S ⊆ Rn . Tada postoji x∗ ∈ S takva da je
f (x∗ ) = min f (x).
x∈S
Dokaz. Po definiciji postoji niz sa ˇclanovima xk ∈ S takav da f (xk ) → inf
f (S). Zbog kompaktnosti skupa S uoˇceni niz ima podniz koji konvergira taˇcki,
na primjer x∗ , iz tog skupa. Niz slika tog podniza teˇzi ka infimumu, pa je
lim inf
f (x) 6 inf f (S). Na osnovu poluneprekidnosti imamo f (x∗ ) 6 lim inf
f (x),
∗
∗
x→x
x→x
pa slijedi f (x∗ ) 6 inf f (S). ¤
Dakle, pojam poluneprekidnosti je posebno vaˇzan, pa ´cemo mu posvetiti viˇse
paˇznje.
Teorema 2 Funkcija f je poluneprekidna odozdo na zatvorenom skupu S ⊆ Rn
ako i samo ako je svaki njen nivoski skup zatvoren, ili ako i samo ako je nadgraf
zatvoren skup.
9
µ
¶
xk
iz nadgrafa epi f odozdo polµ αk¶
x
. Tada imamo αk > f (xk ), xk →
uneprekidne funkcije f konvergira ka
α
µ
¶
x
k
x ∈ S i α = lim αk > liminf f (x ) > f (x). Znaˇci i
∈ epi f . Neka xk ∈
α
µ k ¶
x
levα , xk → x. Ako je nadgraf zatvoren skup, onda je i limes niza
α
u epi f, tj. f (x) 6 α, odnosno x ∈ levα . Na kraju, pretpostavimo da f
nije poluneprekidna odozdo u x. Postoji niz xk koji teˇzi toj taˇcki, dok je lim
f (xk ) = α < f (x). Skoro svi ˇclanovi niza {xk } su u lev (f, α+f2 (x) ), ali ne i x,
pa taj nivoski skup nije zatvoren. ¤
Dokaz. Uzmimo da niz sa ˇclanovima
Primjedba 2 Ako skup S nije zatvoren, onda za poluneprekidnost odozdo je
potrebna i dovoljna zatvorenost nadgrafa u S × R, odnosno zatvorenost svakog
nivoskog skupa u S.
Osim realnih funkcija definisanih na podskupu prostora Rn posmatra´cemo i
funkcije definisane na Rn , sa vrijednostima u proˇsirenom skupu realnih brojeva
R = R ∪ {±∞}. Na taj naˇcin svaka funkcija f : S → R, S ⊆ Rn moˇze se
dodefinisati tako da joj domen bude ˇcitav prostor
½
f (x),
x∈ S
e
f (x) =
(8)
+∞, x ∈ Rn \ S,
tako da vrijedi
min f (x) = minn fe(x).
x∈S
Skup
x∈R
dom(f ) = {x ∈ Rn : f (x) < +∞}
naziva se efektivni domen funkcije f Nas ´ce posebno zanimati funkcije koje ne
uzimaju vrijednost −∞, a identiˇcki nisu +∞, odnosno ako vrijedi
dom(f ) 6= ∅,
−∞ ∈
/ f (Rn ).
(9)
Nazivaju se sopstvene funkcije, a... Definicije iz ranijih razmatranja prenose
se i na funkcije f : Rn → R, uz uobiˇcajene operacije sa ±∞. Tako je f poluneprekidna odozdo u x0 ∈ Rn ako je
f (x0 ) 6 lim inf
f (x).
0
x→x
Ovdje uoˇcimo da iz neprekidnosti funkcije f ne slijedi da je (polu)neprekidna i
funkcija fe, data formulom (33) .
Na primjer, f (x) = x je neprekidna na ]0, +∞[, ali
½
x,
x>0
fe(x) =
+∞, x 6 0
nije ni poluneprekidna u 0.
10
Primjer 3 Karakteristiˇcna (indikatorna) funkcija skupa S
½
0,
x∈S
IS (x) =
+∞, x ∈
/S
Uoˇcimo da za funkciju fe datu sa (8), za sve x ∈ Rn , vrijedi
fe(x) = f (x) + IS (x).
11
KONVEKSNI SKUPOVI
Definicija i primjeri
Definicija 1 Skup C ⊆ Rn je konveksan ako za sve x1 , x2 ∈ C i sve λ ∈ [0, 1]
vrijedi
(1 − λ)x1 + λx2 ∈ C.
Primjedba 3 Geometrijski duˇz [x1 , x2 ] je skup taˇcaka x sa prave P za koje
vrijedi
kx1 − xk + kx − x2 k = kx1 − x2 k.
Ako je x1 6= x2 i x ∈ P imamo da je x = x1 + λ(x2 − x1 ), λ ∈ R. Odavde
je kx − x1 k = |λ|kx1 − x2 k, kx − x2 k = |1 − λ|kx1 − x2 k, tako da je polazna
jednakost ispunjena ako i samo ako je |λ| + |1 − λ| = 1, odnosno 0 6 λ 6 1.
Dakle, duˇz je skup
[x1 , x2 ] = {(1 − λ)x1 + λx2 : 0 6 λ 6 1}.
Prema tome skup je konveksan ako i samo ako mu je podskup svaka duˇz ˇcije
krajnje taˇcke su u njemu.
slika 1. C
Iz definicije slijedi da je skup C konveksan ako za svaki λ ∈ [0, 1] je
(1 − λ)C + λC ⊆ C,
(10)
a poˇsto vrijedi i obratna inkluzija (za proizvoljne skupove) to u prethodnoj
formuli moˇze da stoji znak =.
Primjedba 4 Stavljaju´ci da je 1 − λ = λ1 , λ = λ2 vidimo da je λ1 + λ2 = 1,
a uslov 0 6 λ 6 1 je isto ˇsto i λ1 , λ2 > 0, tako da uz nove uslove (8) postaje
λ1 C + λ2 C ⊆ C
Od osnovnih skupovnih operacija konveksnost ˇcuvaju sabiranje skupova i mnoˇzenje
realnim brojem. Isto tako vrijedi
Teorema 3 Neka su C1 i C2 konveksni skupovi. Tada su C1 ∩ C2 C1 + C2 i α · C1
konveksni skupovi.
Dokaz. Iz x1 , x2 ∈ C1 ∩ C2 , zbog konveksnosti datih skupova, slijedi [x1 , x2 ] ⊆ C1
i [x1 , x2 ] ⊆ C2 , pa je [x1 , x2 ] ⊆ C1 ∩ C2 . Dalje, zbog (1), za sve λ ∈ [0, 1] vrijedi
(1 − λ)(C1 + C2 ) + λ(C1 + C2 ) = (1 − λ)C1 + λC1 + (1 − λ)C2 + λC2 ⊆ C1 + C2 ,
kao i
(1 − λ)αC1 + λαC1 = α((1 − λ)C + λC) ⊆ αC.
¤
Napomenimo da je presjek i proizvoljno mnogo konveksnih skupova opet konveksan skup. Oˇcigledno je da unija dva konveksna skupa ne mora biti konveksan
skup.
12
Primjer 4 S obzirom da inkluzija (4) vrijedi za sve realne brojeve, taˇcna je i za
sve brojeve iz [0, 1], tako da je svaka ravan konveksan skup. Tu su ,specijalno,
ukljuˇceni jednoˇclani skupovi, potprostori kao i ˇcitav Rn .
Primjer 5 Svaka hiperravan H(a, α), a 6= 0 odred¯uje u Rn ˇcetiri poluprostora.
Zatvoreni poluprostori
H+ (a, α) = {x ∈ Rn : ha, xi > α}, H− (a, α) = {x ∈ Rn : ha, xi 6 α},
kao i otvoreni poluprostori
intH+ (a, α) = {x ∈ Rn : ha, xi > α}, int H− (a, α) = {x ∈ Rn : ha, xi < α}
su konveksni skupovi.
Ovo direktno slijedi iz jednakosti ha, (1 − λ)x1 + λx2 i = (1 − λ)ha, x1 i + λha, x2 i.
Nazivi poluprostora nisu sluˇcajni. Prvi je zaista zatvoren skup, ˇsto slijedi iz
neprekidnosti skalarnog mnoˇzenja (ha, xk i > α i xk → x0 povlaˇce ha, x0 i > α).
Posljednji je komplement prvog, pa je otvoren. Sliˇcno je za ostale.
Primjer 6 Neka su a1 , ..., am ∈ Rn i b1 , ..., bm realni brojevi. Presjek konaˇcnog
broja zatvorenih poluprostora (ovdje m) H− (ai , bi ) = {x ∈ Rn : hai , xi 6 bi }
i
zemo pisati
je konveksan skup. Naziva se poliedar. Umjesto ∩m
i=1 H− (a , bi ) moˇ
n
i
{x ∈ R : ha , xi 6 bi i = 1, ..., m} ili
{x ∈ Rn : Ax 6 b},
(11)
gdje jeTA matrica tipa m × n sa vrstama ai , dok je b = [b1 , ..., bm ]> . Specijalno,
n
Rn+ = i=1 H+ (ei , 0) je polieadar.
Primjer 7 Otvorena kugla sa centrom u x0 , polupreˇcnika r je konveksan skup.
Zaista, za x1 , x2 ∈ B(x0 , r), λ1 > 0, λ2 > 0, λ1 + λ2 = 1 imamo
kx0 −(λ1 x1 +λ2 x2 )k = kλ1 (x0 −x1 )+λ2 (x0 −x2 )k 6 λ1 kx0 −x1 k+λ2 kx0 −x2 k <
< λ1 r + λ2 r = r,
odnosno
λ1 x1 + λ2 x2 ∈ B(x0 , r).
Na isti naˇcin se vidi da je i zatvorena kugla B[x0 , r] konveksna. Moglo se i na
osnovu sljede´cih jednakosti (prva je iz primjera), koriste´ci (3)i teoremu 1,
(1 − λ)B[0, 1] + λB[0, 1] = B[0, 1],
Kao ˇsto znamo, zbir
B[x0 , r] = x0 + rB[0, 1].
λ1 x1 + · · · + λk xk
je linearna kombinacija vektora x1 , ..., xk ∈ S ako su λ1 , ..., λk ∈ R, a afina
kombinacija ako je λ1 + · · · + λk = 1 (formula (6)). Ako je λ1 > 0, ..., λk > 0,
onda kaˇzemo da je linearna kombinacija nenegativna. Konveksna kombinacija
je ona linearna kombinacija datih vektora je ona koja je afina i nenegativna.
13
Primjer 8 Skup svih konveksnih kombinacija konaˇcnog skupa vektora x1 , ..., xm
naziva se politop, a oznaˇcava sa co {x1 , ..., xm }. Svaki politop je konveksan skup:
x, y ∈ co {x1 , ..., xm } ⇒ x =
m
X
λi x i , y =
m
X
i=1
gdje je
Pm
i=1
λi = 1,
Pm
i=1
µi y i ,
i=1
µi = 1, xi > 0, yi > 0 (i = 1, ..., m). Sada je
(1 − λ)x + λy =
m
X
((1 − λ)λi + λµi )xi ∈ co {x1 , ..., xm },
i=1
zato ˇsto je
Pm
i=1 ((1
− λ)λi + λµi ) = (1 − λ)
Pm
i=1
λi + λ
Pm
i=1
µi = 1.
Politop se, za m > 1, naziva (m − 1)-dimenzionalni simpleks u Rn , ako je
{x , ..., xm } afino nezavisan. Jednoˇclane skupove smatramo simpleksima dimenzije 0. Specijalno,
∆n = co {0, e1 , ..., en }
1
je standardan n-simpleks u Rn , dok je
σ n = co {e1 , ..., en+1 }
n - dimenzionalni jediniˇcni simpleks u Rn+1
slika
Teorema 4 Neka su C, D konveksni skupovi i a : Rn → Rm afino preslikavanje.
Tada su skupovi a(C) i a−1 (D) konveksni.
Dokaz. Iz a((1 − λ)x1 + λx2 ) = (1 − λ)a(x1 ) + λa(x2 ) ∀ xn , x2 ∈ Rn λ ∈ [0, 1]
slijedi
(1 − λ)a(C) + λa(C) = a(C)
(1 − λ)a−1 (D) + λa−1 (D) ⊆ a−1 (D),
tako da su ovi skupovi konveksni po definiciji. ¤
Skup K ⊆ Rn naziva se konus ako vrijedi
x ∈ K, λ > 0 ⇒ λx ∈ K.
Ova implikacija je ekvivalentna sa
λK ⊆ K, ∀λ > 0.
(12)
Ako je konus konveksan skup onda se naziva konveksan konus. Za njihovu
karakterizaciju potrebna je i dovoljna prethodna formula i zatvorenost skupa K
u odnosu na sabiranje, tj.
K + K ⊆ K.
(13)
14
Fakat, iz ove dvije formule slijedi konveksnost:
(1 − λ)K + λK ⊆ K + K ⊆ K
∀λ ∈ [0, 1].
Obratno, pokaˇzimo da iz (8) i konveksnosti slijedi (9). Na osnovu 2K ⊆ K, je
K ⊆ 12 K, pa ako je konus konveksan imamo
K+K ⊆
1
1
K + K = K.
2
2
Primjer 9 Skup K = {x ∈ Rn : Ax 6 0}, 0 ∈ Rm , je konveksni konus, ˇsto
neposredno slijedi iz (8), (9) i svojstava matriˇcnog mnoˇzenja. U skladu sa Primjerom 5., naziva se homogeni poliedar, a moˇze i poliedarski konus.
Primjer 10 Skup svih nenegativnih linearnih kombinacija konaˇcnog skupa taˇcaka
x1 , ..., xm je, oˇcigledno, konveksan konus. Nazivamo ga konaˇcno generisanim,a
oznaka mu je cone .... Dakle,
cone {x1 , ..., xm } = {λ1 x1 + ... + λm xm : λ1 > 0, ..., λm > 0}.
(14)
Vaˇzan primjer je {Ax : x > 0} ⊆ Rm . On je konaˇcno generisan konus zato
ˇsto je K = cone {a∗1 , ..., a∗n }.
Primjer 11 Svakom konveksnom konusu K dodjeljuju se dva konusa
{y : hy, xi 6 0
∀x ∈ K} i {y : hy, xi > 0
∀x ∈ K}.
To su normalni konusi (negativan normalan i pozitivan). Prvi se najˇceˇs´ce zove
polaran konus, sa oznakom Ko . Pozitivan normalan konus zove se konjugovan
(dualan) konus konusa K, a oznaˇcava sa K∗ . jasno, vrijedi K◦ = −K∗ .
SLIKA
Konveksan omotaˇ
c
Ukoliko neki skup nije konveksan, moˇzemo mu dodijeliti najmanji konveksan
skup koji ga sadrˇzi. U tom cilju, za proizvoljan neprazan skup S ⊆ Rn posmatra´cemo sve njegove konveksne nadskupove. Jedan od njih je aff S, a presjek
im je neprazan (podskup mu je S) i konveksan. Nazivamo ga konveksni omotaˇc
skupa S i piˇsemo co S. Dakle,
\
co S =
C.
S⊆C
Na osnovu definicije, za prozvoljne skupove S, T i konveksan skup C vrijedi
S ⊆ T ⇒ co S ⊆ co T , C = co C,
15
co (co S) = co S .
Za svaki prirodan broj k, proizvoljnom nepraznom skupu S dodjeljujemo skup
svih konveksnih kombinacija svakih k njegovih elemenata (uniju svih politopa
generisanih taˇckama iz S):
[
cok S =
co {x1 , ..., xk },
x1 ,...,xk ∈S
(
cok S =
k
X
i
1
k
λi x : x , ..., x ∈ S, λ1 , ..., λk > 0,
i=1
k
X
)
λi = 1 .
i=1
Pomo´cu njih opisa´cemo konveksni omotaˇc skupa S.
Prije svega, za proizvoljne skupove S, T , konveksan skup C iz Rn , i sve
brojeve λ ∈ [0, 1] vrijedi:
S ⊆ T ⇒ cok S ⊆ cok T ,
(15)
(1 − λ)cop S + λcoq S ⊆ cop+q S,
(16)
cok C ⊆ C.
(17)
Posljednja inkluzija se dokazuje indukcijom:
co1 C = C, a co2 C ⊆ C je po definiciji konveksnog
skupa.
Pk+1
Ako je cok C ⊆ C i x ∈ cok+1 C, onda je x = i=1 λi xi za neke x1 , ..., xk+1 ∈
C, λ1 , ..., λk+1 ∈ [0, 1], λ1 + ... + λk+1 = 1. Ukoliko je tada λk+1 6= 1 imamo
x = λk+1 xk+1 + (1 − λk+1 )
k
X
i=1
λi
xi ∈ λk+1 C + (1 − λk+1 )C = C.
1 − λk+1
Ako je λk+1 = 1, onda je opet x = xk+1 ∈ C.
Dakle, cok C ⊆ C povlaˇci cok+1 C ⊆ C, za sve k ∈ N.
Teorema 5 Ako je S neprazan podskup od Rn , onda je
[
co S =
cok S.
k∈N
Dokaz. S = co1 S ⊆ ∪k∈N cok S, odakle je, prema (13), co S ⊆ co (∪k∈N cok S).
Poˇsto iz (14) slijedi da je posmatrana unija konveksan skup imamo
[
co S ⊆
cok S.
k∈N
Dalje, zbog S ⊆ co S vrijedi cok S ⊆ cok (co S), a na osnovu (15) je cok (co S) ⊆
co S, tako da imamo cok S ⊆ co S. Kako posljednja inkluzija vrijedi za sve
prirodne brojeve, to je
[
cok S ⊆ co S. ¤
k∈N
16
Ovaj rezultat se moˇze precizirati.
Teorema 6 (Karateodori, 1911) Ako je S ⊆ Rn neprazan skup vrijedi
co S =
n+1
[
cok S.
k=1
Dokaz. Neka je x ∈ co S. Prema prethodnom, tada je
x = λ1 x1 +· · ·+λk xk , za neke x1 , ..., xk ∈ S, λ1 > 0, ..., λk > 0, λ1 +···+λk = 1.
½µ i ¶
µ k ¶¾
x
x
linearno zavisan u Rn+1 .
Ako je k > n + 1, onda je skup
, ...,
1
1
Postoje realni brojevi α1 , ..., αk , koji nisu svi jednaki 0, takvi da je
α1 x1 + · + αk xk = 0,
α1 + · + αk = 0.
Bar jedan od njih je pozitivan (druga jednakost), pa neka je
Imamo
x=x−
λi
λj
= min
.
i:αi >0 αi
αj
¶
k
k
k µ
X
X
λj
λj X
λj
·0=
λi xi −
αi xi =
λi −
αi xi .
αj
αj i=1
αj
i=1
i=1
λj
αi > 0 (za i takvo da je αi 6 0 to je oˇcigledno, a za ostale
αj
´
Pk ³
λ
λ
zbog izbora indeksa j ) i i=1 λi − αjj αi = 1 − αjj · 0 = 1, dobili smo da je
Poˇsto je λi −
k
x konveksna kombinacija taˇcaka skupa {x1 , ..., xj−1 , xj+1
µ, ...,i x¶ }.
x
Postupak se nastavlja sve dok skup preostalih vektora
ne postane lin1
n+1
[
earno nezavisan, tj. dok ih ne ostane najviˇse n + 1. Tada je x ∈
cok S.
k=1
Dakle, co S ⊆
n+1
[
cok S. Obratna inkluzija izlazi iz prethodne teoreme. ¤
k=1
Primjedba 5 Zbog jasne veze cok S ⊆ cok+1 S tvrdnja Karateodorijeve teoreme svodi na jednakost
co S = con+1 S.
Isto tako moˇzemo primjetiti da je konveksni omotaˇc nekog skupa unija simpleksa
dimenzije (najviˇse) n, sa vrhovima iz tog skupa.
Primjer 12 Na osnovu Karateodorijeve teoreme dobijamo
σ n−1 = {x ∈ Rn :
n
X
i=1
17
xi = 1, xi > 0}.
za n - dimenzionalni standardni simpleks je
∆n = {x ∈ Rn :
n
X
xi 6 1, xi > 0}.
i=1
Dalje je
int ∆n = int H− (e, 1) ∩ int H+ (e1 , 0) ∩ ... ∩ int H+ (en , 0) =
n
= {x ∈ R :
n
X
xi < 1, x1 > 0, ..., xn > 0}.
i=1
1
1
Uoˇcimo joˇs da je ( n+1
, ..., n+1
)> ∈ int ∆n .
Pomo´cu konveksnog omotaˇca definiˇse se nova operacija koja ˇcuva konveksnost
C1 ∪ C2 := co (C1 ∪ C2 )
(18)
Slijede´ce jednakosti su korisne ne samo za konstrukciju konveksnog omotaˇca
sloˇzenijih skupova
co (S1 + S2 ) = co S1 + co S2 ,
(19)
C1 ∪ C2 = {(1 − λ)x1 + λx2 : x1 ∈ C1 , x2 ∈ C2 , λ ∈ [0, 1]}.
(20)
Dokaˇzimo prvu formulu, koja vrijedi za proizvoljne skupove. Poˇsto je konveksan
zbir konveksnih skupova imamo da iz S1 + S2 ⊆ co S1 + co S2 slijedi
co (S1 + S2 ) ⊆ co (co S1 + co S2 ) = co S1 + co S2 .
Za obratnu inkluziju koristimo Karateodorijevu teoremu. Za svaki xi ∈ S1 je
xi + co S2 = co (xi + S2 ) ⊆ co (S1 + S2 ).
Taˇcka x ∈ co S1 , je oblika x =
k
X
λi xi , xi ∈ S1 , λi > 0,
i=1
nakon mnoˇzenja sa λi i sabiranja, dobijamo
x+
k
X
i=1
λi co S2 ⊆
k
X
k
X
λi = 1, tako da,
i=1
λi co (S1 + S2 ).
i=1
Zbog konveksnosti omotaˇca, dalje je x + co S2 ⊆ co (S1 + S2 ), i to za sve
x ∈ co S1 , ˇsto znaˇci da je
co S1 + co S2 ⊆ co (S1 + S2 ).
Druga jednakost vaˇzi za konveksne skupove. Oznaˇcimo sa C skup sa desne
strane jednakosti (19), i neka je x ∈ co (C1 ∪C2 ). Ako je x ∈ C1 ili x ∈ C2 situacija
je jasna. Inaˇce x je konveksna kombinacija taˇcaka v 1 , ..., v k iz C1 ∪ C2 , tako da
su skupovi J2 = {i : v i ∈ C1 } i J1 = {i : v i ∈ C2 } neprazni. Stavljaju´ci za
18
odgovaraju´ce koeficijente λ1 , ..., λk da je λ = 1 −
0 < λ < 1. Tada je
x = (1 − λ)
X
i∈ J1
P
i∈J1
=
P
i∈J2
λi dobijamo
X λi
λi i
v +λ
v i ∈ (1 − λ)C1 + λC2 ⊆ C.
1−λ
λ
i∈ J2
Obratna inkluzija je trivijalna.
Za konveksni omotaˇc unije konveksnih konusa imamo preciznije
K1 ∪K2 = K1 + K2 .
(21)
Jasno, za sve λ > 0 je λK = K. Prema (20) imamo
[
[
K1 ∪ K 2 ) =
(1 − λ)K1 + λK2 = K1 +
(K1 + K2 ) + K2 = K1 + K2 .
06λ61
0<λ<1
Topoloˇ
ska svojstva
Kao prvo navedimo da se zatvorenje skupa moˇze zapisati kao
\
cl C =
(C + εB),
(22)
ε>0
dok je njegova unutraˇsnjost
int S = {x ∈ S : ∃ε > 0 (x + εB) ⊆ S}.
(23)
Teorema 7 Za svaki konveksan skup sa nepraznim interiorom vrijedi
x1 ∈ int C, x2 ∈ cl C =⇒ [x1 , x2 [ ⊆ int C.
Dokaz. Za svaki λ ∈]0, 1[ i svaki ε > 0, koriste´ci formulu za zatvorenje imamo
(1−λ)x1 +λx2 +εB ⊆ (1−λ)x1 +λ(C +εB)+εB ⊆ (1−λ)(x1 +
gdje je ε tako uzeto da je x1 +
λε
1−λ B
λε
B)+λC ⊆ C,
1−λ
⊆ C, ˇsto je mogu´ce, zbog x1 ∈ int C. ¤
Posljedica 1 Za konveksan skup sa nepraznim interiorom vrijedi
x ∈ int C ⇔ ∀v ∈ Rn ∃ε > 0 x + εv ∈ C.
(24)
Zaista, neka je x0 ∈ int C i x 6= x0 takav da vrijedi desna strana ekvivalencije.
Prema tome postoji ε > 0 za koji je x1 = x + ε(x − x0 ) ∈ C. Sada je x =
ε
1
0
1
0
1
1+ε x + 1+² x ∈]x , x [ ⊆ int C. Obratna implikacija je jasna.
Teorema 8 Unutraˇsnjost i zatvorenje konveksnog skupa su konveksni skupovi.
Dokaz. Za x1 , x2 ∈ int C, prema prethodnom, vrijedi [x1 , x2 ] = [x1 , x2 [ ∪{x2 } ⊆
int C ∪ {x2 } = int C. Drugo tvrd¯enje slijedi iz (5) i konveksnosti zbira i presjeka
konveksnih skupova. ¤
19
Teorema 9 Ako je int C =
6 ∅, onda je
int cl C = int C,
cl int C = cl C
Dokaz. Iz C ⊆ cl C slijedi int C ⊆ int cl C. Obratno, neka je x ∈ int cl C i
B(x, ε) ⊆ cl C. Za x 6= y ∈ int C postoji taˇcka z ∈ S(x, ε) takva da je x ∈]y, z[,
pa prema Teoremi 4 je x ∈ int C.
I u drugoj jednakosti jedna inkluzija je oˇcigledna, pa onda neka je x ∈ cl C i y ∈
int C. Tada je [y, x[⊆ int C, odakle je cl [y, x[⊆ cl int C, i x ∈ [x, y] ⊆ cl int C. ¤
Na osnovu ove teoreme neposredno slijede veze za dva konveksna skupa.
Teorema 10 Ako su C i D konveksni skupovi sa nepraznim interiorima onda
je
int C = int D ⇔ cl C = cl D.
Svaka od jednakosti ekvivalentna je sa
int C ⊆ D ⊆ cl C.
Dokaz. Na primjer, ako je D izmed¯u interiora i zatvorenja skupa C, slijedi da je
cl int C ⊆ cl D ⊆ cl C, ˇsto uz drugu jednakost iz Teoreme 6 je cl C = cl D. Iz int
C = int D dobijamo int C ⊆ D ⊆ cl D ⊆= cl int D = cl int C =cl C. Preostaje
da se dokaˇze prva ekvivalencija. ¤
Teorema 11 Neka je l : Rn → Rm linearno preslikavanje i C konveksan podskup od Rn sa nepraznim interiorom, tada vrijedi
int l(C) = l(int C).
Dokaz. Pokaˇzimo prvo da vrijedi dio ” ⊆ ”. U tom cilju ustanovimo da je
konveksan skup D = l(C) izmed¯u unutraˇsnjosti i zatvorenja skupa l(int C). Tada
´ce biti, na osnovu Teoreme 7, int D = int l(int C), odakle je int l(C) ⊆ l(int C).
Dakle, imamo uz jednakosti iz teoreme 6
int l(int C) ⊆ l(int C) ⊆ D ⊆ l(cl C) = l(cl int C) ⊆ cl l(int C).
Obratno, neka je y ∈ l(int C) i v ∈ Rm proizvoljan vektor. Postoje x ∈ intC,
u ∈ Rn i ε > 0 takvi da je y = l(x), v = l(u) i x + εu ∈ C. Sada je y + εv =
l(x) + εl(u) = l(x + εu) ∈ l(C). Prema posljedici 1. zakljuˇcujemo da je y ∈ int
l(C). ¤
Konveksnost skupova je dovoljna da vrijede jednakosti u ...
Teorema 12 int (C + D) = int C + int D.
Dokaz. Dosta je primjeniti teoremu 8. na funkciju l : Rn ×Rn → Rn , l(x1 , x2 ) =
x1 + x2 koja je je linearna, i za koju vrijedi l(C × D) = C + D. sada je
int l(C × D) = int (C + D),
l(int (C × D)) = l(int C × int D) = int C + int D. ¤
20
Teorema 13 Ako su C, D konveksni skupovi i ako je int (C ∩ D) 6= ∅, onda
vrijedi
cl (C ∩ D) = cl C ∩ cl D.
Dokaz. Neka je x ∈ cl C ∩ cl D. Za x0 ∈ int C ∩ int D vrijedi
[x0 , x[ ⊆ int C ∩ int D = int (C ∩ D),
odakle je x ∈ cl (C ∩ D).
¤
Primjedba 6 Formula vrijedi i za presjek proizvoljno mnogo konveksnih skupova,
uz odgovaraju´ci uslov (presjek njihovih unutraˇsnjosti je neprazan) i isti dokaz.
Uslov int C 6= ∅ jeste bitan, ali za konveksne skupove nije prirodan, nije ispunjen ve´c za duˇzi u ravni, krugove u trodimenzionom prostoru, kao i hiperravni.
Stoga ga je potrebno oslabiti, a to se postiˇze uopˇstavanjem pojma interiora.
Primjer 13 Za 2- dimenzioni simpleks σ 2 = co {e1 , e2 , e3 } u R3 imamo da je
int σ 2 = ∅. Med¯utim posmatraju´ci ovaj trougao u njegovom afinom omotaˇcu
aff (σ 2 ) = {x ∈ R3 : x1 + x2 + x3 = 1}, vidimo, na primjer, za x0 = ( 31 , 13 , 31 )
da je B(x0 , 13 ) ∩ aff ⊆ σ 2 . Kako je ovaj presjek otvoreni krug u posmatranoj
(hiper)ravni to je x0 unutraˇsnja taˇcka u odnosu na afini omotaˇc. Skup svih
takvih taˇcaka naziva se relativni interior, i piˇse ri T .
Uopˇste, relativni interior definiˇsemo sa
ri S = {x ∈ S : ∃ε > 0 (x + εB) ∩ aff S ⊆ S}.
Jasno ako je int C 6= ∅ onda je relint C = int C. Sada ´cemo dokazati osnovno
svojstvo relativnog interiora, po ˇcemu se i razlikuje od interiora.
Teorema 14 Ako je C ⊆ Rn neprazan konveksn skup, onda je ri C =
6 ∅.
Dokaz.
Primjedba 7 Za konveksne skupove C = {(1, 0, 0)} i D = σ 2 imamo C ⊆
D, ali ri C = C * ri D = {x ∈ R3 : x1 + x2 + x3 = 1, x1 , x2 , x3 > 0}. Inaˇce,
S ⊆ T ⇒ int S ⊆ int T .
Ostala svojstva ostaju na snazi a za dokaz se, umjesto karakterizacije ...koristi
x ∈ ri C ⇔ ∀y ∈ C ∃ λ > 1 : y + λ(x − y) ∈ C.
(25)
Posmatraju´ci re C umjesto int C, na snazi ostaju sve teoreme 4 - 10,
riC je konveksan,
ri C = ri D ⇔ ri C ⊆ D ⊆ C
riCC, riC = riC
ril(C = l(riC)) ri(C + D) = riC + riD
pri ˇcemu je u posljednjoj potreban dodatni uslov ri C ∩ ri D 6= ∅, kao ˇsto
pokazuje Primjer 2. Uz isti uslov je i
21
Teorema 15 ri (C ∩ D) = ri C ∩ ri D
Dokaz. Kao u dokazu Teoreme 10 je cl C∩ cl D ⊆ cl (ri C∩ ri D). Sada zbog ,
cl (ri C∩ ri D) ⊆ cl (C ∩ D) ⊆ cl C∩ cl D, slijedi jednakost
cl (riC ∩ riD) = cl(C ∩ D).
Na osnovu ... (relativan interior jednog je podskup drugog skupa) imamo
ri (C ∩ D) ⊆ ri C∩ ri D.
Neka je x0 u presjeku relativnih interiora, i y ∈ C ∩ D. Prema (15) postoje
λ > 1 i µ > 1 takvi da je y + λ(x0 − y) ∈ C i y + µ(x0 − y) ∈ D. Ako je, na
primjer, µ > λ, onda je y + λ(x0 − y) = µλ (y + µ(x0 − y)) + (1 − µλ )y ∈ D. Dakle,
y + λ(x0 − y) ∈ C ∩ D, pa je x0 ∈ ri (C ∩ D). Slijedi
ri C∩ ri D ⊆ ri (C ∩ D).
¤
omota´
ci
Jednostavno je dokazati da vrijedi
S otvoren =⇒ co S otvoren.
Na primjer, int co S je konveksan, a podskup mu je S, poˇsto je int S = S.
Dakle, po definiciji konveksnog omotaˇca, imamo da je co S ⊆ int co S.
S druge strane, konveksan omotaˇc zatvorenog skupa ne mora biti zatvoren:
S = {(x, 0) : x > 0} ∪ {(0, 1)},
co S = (R+ × [0, 1]) \ {(x, 1) : x > 0}.
Med¯utim dodaju´ci uslov da je posmatrani skup ograniˇcen dobijamo
Teorema 16 S kompaktan =⇒ co S kompaktan.
Dokaz. Posmatrajmo funkciju f datu sa
1
(λ1 , ..., λn+1 , x , .., x
n+1
) 7→
n+1
X
λi xi , λi ∈ R, xi ∈ Rn .
i=1
Ona je neprekidna funkcija i kompaktan preslikava u kompaktan skup. Preostaje
da se vidi da je, po Karateodorijevoj teoremi,
¡
¢
co S = f [0, 1] × ... × [0, 1] × S × ... × S . ¤
{z
} | {z }
|
n+1
n+1
Sada ´cemo izuˇciti osnovna svojstva nekih posebnih konveksnih skupova. Sljede´ce
imamo iz prethodne teoreme, s obzirom da je konaˇcan skup kompaktan.
Posljedica 2 Politop je kompaktan skup
22
Naravno, konaˇcno generisan konus nije kompaktan skup, ali
Teorema 17 Konaˇcno generisan konus je zatvoren skup.
Dokaz. Neka je K = cone {x1 , ..., xm }, pri ˇcemu je dati skup linearno nezavisan.
U suprotnom se, kao u dokazu Karateodorijeve teoreme, vrˇsi redukcija do linearno nezavisnog skupa. Preslikavanje l : Rm → lin (x1 , ..., xm ), l(λ1 , ..., λm ) =
λ1 x1 + ... + λm xm je linearno i bijektivno. Inverzno preslikavanje je neprekidno
1
m
tako da je slika zatvorenog skupa zatvoren skup. Dakle l(Rm
+ ) = cone {x , ..., x }
je zatvoren skup. ¤ Sada ...
Posljedica 3 Zbir politopa i konaˇcno generisanog konusa je zatvoren skup.
Neograniˇ
ceni konveksni skupovi
Teorema 18 Neka C konveksan zatvoren neograniˇcen. Za svaki x ∈ C postoji
v 6= 0 takav da vrijedi
{x + λv : λ > 0} ⊆ C.
(26)
Dokaz. Neka je x ∈ C i λ > 0. Postoji niz (xk ) taˇcaka iz C takav da kxk k → ∞,
k
0 6 kxλk k 6 1 i ( kxxk k ) konvergira, nekom v. Sada x+ kxλk k (xk −x) ∈ C konvergira
ka x + λv ∈ cl C = C. ¤
Primjedba 8 Ako konveksan skup skup nije zatvoren, onda ovo tvrd¯enje vaˇzi
za taˇcke iz ri C. Za ostale ne mora, na primjer nijedna poluprava sa vrhom u 0
nije podskup skupa C = ( R×]0, 1[ ) ∪ {0}.
Primjedba 9 Navedimo joˇs da u (13) za svaki x moˇzemo uzeti isti v. Zaista,
neka (13) vrijedi za x0 ∈ C i neka je x ∈ C proizvoljan. Tada, je k1 (x0 + λkv) +
(1 − k1 )x ∈ C, pa taj niz konvergira taˇcki x + λv ∈ cl C = C, za sve pozitivne λ.
Projekcija. Teoreme razdvajanja
0
−a,vi
Taˇcka y 0 = a + hxkvk
v je ortogonalna projekcija taˇcke x0 na pravu P =
2
{a + tv : t ∈ R}, zato ˇsto je hx0 − y 0 , vi = 0. Zbog toga,za bilo koju drugu taˇcku
y sa prave, imamo kx0 − yk > kx0 − y 0 k.
Uopˇste, taˇcku y 0 ∈ S zva´cemo projekcijom taˇcke x0 ∈ Rn na neprazan skup
S j Rn ako vrijedi
kx0 − y 0 k 6 kx0 − yk ∀y ∈ S.
Jasno, projekcija ne mora da postoji, kao na primjer na otvorenu kuglu iz
taˇcke van nje, a ako i postoji ne mora biti jedinstvena (unija dvije zatvorene
disjunktne kugle i sredina duˇzi koja spaja njihove centre).
Teorema 19 Svaka taˇcka iz Rn ima jedinstvenu projekciju na neprazan, zatvoren
konveksan C ⊆ Rn .
23
Dokaz. Kao prvo, ako je taˇcka x0 u C ona je sama sebi projekcija, jer kx0 −y 0 k =
kx0 − x0 k = 0. Za x0 ∈
/ C neka je r > 0 takav broj da je C ∩ B(x0 , r) neprazan
skup. On je kompaktan skup (kao presjek zatvorenog C i zatvorene kugle), pa
neprekidna funkcija
y 7→ ky − x0 k
dostiˇze na njemu minimum, u nekoj taˇcki y 0 . Dakle, za sve taˇcke y posmatranog
presjeka vrijedi ky − x0 k > ky 0 − x0 k. Za ostale taˇcke skupa C (van kugle) je
ky − x0 k > r > ky 0 − x0 k. Zakljuˇcno, za sve y ∈ C vrijedi ky − x0 k > ky 0 − x0 k.
Za dokaz jedinstvenosti koristimo jednakost paralelograma
ku + vk2 + ku − vk2 = 2(kuk2 + kvk2 ),
uzimaju´ci da je u = x0 − y 0 , v = x0 − y 1 , gdje su y 0 i y 1 projekcije taˇcke x0 .
Zbog kx0 − y 0 k = kx0 − y 1 k imamo
¶
µ
y0 + y1 2
1
0 2
0
0 2
0
ky − y k = 4 kx − y k − kx −
k 6 0,
2
0
1
budu´ci da je y +y
∈ C, zbog konveksnosti datog skupa. Iz prethodne nejed2
nakosti slijedi da je y 0 = y 1 . ¤
Sada vidimo da je na ovaj naˇcin definisana funkcija (x0 7→ y 0 ), koju nazivamo
(metriˇcka projekcija) i oznaˇcavamo sa PC . Dakle, za konveksan i zatvoren skup
C definisana je PC : Rn −→ C sa
y 0 = PC (x0 ) ⇐⇒ (∀y ∈ C) k x0 − yk > kx0 − y 0 k.
Osnovna svojstva su data nejednakostima, pri ˇcemu iz druge slijedi neprekidnost
ove funkcije.
Teorema 20 Za C 6= ∅ konveksan i zatvoren skup, x0 ∈ Rn i y 0 ∈ C vrijedi
a) y 0 = PC (x0 ) ako i samo
hx0 − y 0 , y − y 0 i 6 0
b)
∀y ∈ C,
kPC (x1 ) − PC (x0 )k 6 kx1 − x0 k
∀x1 , x0 ∈ Rn .
(27)
(28)
Dokaz. a) Kako je C konveksan i y 0 ∈ C, to za svaki y ∈ C i sve λ ∈]0, 1[ imamo
y 0 + λ(y − y 0 ) ∈ C, pa je
kx0 − (y 0 + λ(y − y 0 ))k2 > kx0 − y 0 k2 , tj. 2hx0 − y 0 , y 0 − yi + λky − y 0 k2 > 0.
Pri λ → 0+, dobijamo prvu nejednakost.
Iz (5) imamo redom (uzimamo da je y 0 6= x0 , inaˇce je nejednakost trivijalna)
hx0 −y 0 , x0 −y 0 +y−x0 i 6 0, kx0 −y 0 k2 6 hx0 −y 0 , x0 −yi, kx0 −y 0 k 6 kx0 −yk
24
i to za sve y ∈ C, ˇsto znaˇci da je y 0 = PC (x0 ).
b) Oznaˇcavaju´ci projekciju taˇcke x1 sa y 1 slijede nejednakosti: hx0 − y 0 , y 1 −
y i 6 0, hx1 − y 1 , y 0 − y 1 i 6 0, odakle je
0
hy 1 − y 0 + x0 − x1 , y 1 − y 0 i 6 0,
ky 1 − y 0 k2 6 hx1 − x0 , y 1 − y 0 i.
Preostaje da se opet iskoristi nejednakost Koˇsi-Bunjakovskog. ¤
Primjedba 10 Uzimaju´ci da je a = x0 − y 0 , iz prve nejednakosti, za sve y ∈ C
vrijedi
ha, yi 6 ha, y 0 i.
Ako je x0 6= y 0 , onda je a 6= 0, pa je odred¯ena hiperravan H(a, α), α = ha, y 0 i i
formula (5) znaˇci
y 0 ∈ H, i C ⊆ H− .
Ovo je motivacija za sljede´cu definiciju.
Definicija 2 H se naziva potporna hiperravan (hiperravan oslonca) nepraznog
skupa S ⊆ Rn u taˇcki x ∈ bd S, ako je x ∈ H i S ⊆ H− ili S ⊆ H+
Teorema 21 Zatvoren i konveksan skup u svakoj graniˇcnoj taˇcki ima potpornu
hiperravan.
Dokaz. Dovoljno je dokazati da je y 0 ∈ bd C projekcija neke druge taˇcke . Postoji
niz xk ∈ Rn \C koji teˇzi ka y 0 , pri ˇcemu moˇzemo uzeti da su svi xn ∈ B(y 0 , 1).
Prema teoremi 7. imamo niz projekcija y k = PC (xk ), kojem pridruˇzujemo niz
z k ∈ S(y 0 , 1) takav sa je xk ∈]y k , z k [. Vrijedi
ky k − y 0 k = kPC (xk ) − PC (y 0 )k 6 kxk − y 0 k,
odakle je y k → y 0 pa, zbog neprekidnosti projekcije, slijedi PC (y k ) → y 0 . Na
osnovu prvog dijela prethodne teoreme je PC (z k ) = y k . Niz (z k ) ima konvergentan podniz, za ˇciju graniˇcnu vrijednost z 0 ∈ S(y 0 , 1) je PC (z 0 ) = y 0 . ¤
Dakle, ako je x0 ∈ bd C, onda je x0 ∈ H, dok je C ⊆ H− . Za x0 ∈
/ C (Napomena
2) moˇzemo re´ci i viˇse. Naime, tada je x0 ∈ H+ , zbog ha, y 0 i < ha, x0 i. Ako
0
0
2
i
uzmemo α = ha,x i−ha,y
= kak
dobijamo za sve y ∈ C vrijedi ha, yi < α <
2
2
ha, x0 i, odnosno x0 ∈ int H+ i C ⊆ int H− .
Na osnovu ovog razmatranja, uzimaju´ci umjesto jednoˇclanog {x0 } proizvoljan
konveksan skup moˇzemo definisati pojam razdvojenih skupova.
Definicija 3 Konveksni skupovi C1 , C2 ⊆ Rn su razdvojeni ako postoje taˇcka
a ∈ Rn , a 6= 0 i realan broj α takvi da za sve x ∈ C1 i sve y ∈ C2 , vrijedi
ha, yi 6 α 6 ha, xi,
25
tj. C1 ⊆ H+ (a, α), C2 ⊆ H− (a, α),
Kaˇzemo da su razdvojeni skupovi potpuno razdvojeni ako nije
[
C1 C2 ⊆ H(a, α).
Skupovi C1 , C2 su strogo razdvojeni ako su u razliˇcitim otvorenim poluprostorima
( postoje a 6= 0, α takvi da za sve x ∈ C1 i sve y ∈ C2 vrijedi
ha, yi < α < ha, xi.
Navedimo joˇs jednom da je C razdvojen od taˇcke koja mu ne pripada, a ako
taˇcka nije u njegovom zatvorenju onda je od nje strogo razdvojen.
Teorema 22 Neka su C1 , C2 ⊆ Rn neprazni, disjunktni, konveksni i zatvoreni.
Ako je jedan od njih ograniˇcen, onda postoji hiperravan koja ih strogo razdvaja.
Dokaz. Razlika C1 − C2 datih skupova, po pretpostavkama, je konveksan i
zatvoren skup. Uz ovo, uslov C1 ∩ C2 = ∅ znaˇci da je 0 ∈
/ C1 − C2 . Prema
prethodnoj teoremi postoji a ∈ Rn , a 6= 0 i β > 0 tako da za sve x ∈ C1 i sve
y ∈ C2 vrijedi
ha, x − yi > β > 0,
odakle je
ha, xi > ha, yi + β > ha, yi.
Skup {ha, xi : x ∈ C1 } je ograniˇcen odozdo sa ha, yi + β, za proizvoljan fiksiran
y ∈ C2 . Sada je
inf ha, xi − β
x∈C1
gornja med¯a skupa {ha, yi : y ∈ C2 }, pa imamo
inf ha, xi > sup ha, yi + β > sup ha, yi.
x ∈ C1
y ∈ C2
y ∈ C2
Uzimaju´ci α izmed¯u uoˇcenog supremuma i infimuma slijede nejednakosti iz
definicije 2. ¤
Koriste´ci drugi dio teoreme 5, a ponavljaju´ci prethodni postupak, uz izbor
α ∈ [ sup ha, yi, inf ha, xi]
x∈C1
y∈C2
dobija se
Teorema 23 Neprazni, disjunktni i konveksni skupovi C1 i C2 su razdvojeni.
Posljedica 4 Ako je uz uslove teoreme 23, joˇs int C1 6= ∅, onda su C1 i C2
potpuno razdvojeni, pri ˇcemu je int C1 u otvorenom poluprostoru.
26
Dokaz. Iz prethodne teoreme slijedi da je ha, xi 6 α za sve x ∈ C1 . Ako bi bilo
a
ha, x0 i = α za neki x0 ∈ int C1 , onda (imaju´ci na umu da je i x0 + ε
∈ C1 ,
kak2
pri malom ε > 0) dobijamo
À
¿
a
= α + ε 6 α.
a, x0 + ε
kak2
Ovo nije mogu´ce, tako da preostaje ha, x0 i < α, pa x0 ∈
/ H(a, α) ¤
Jasno, strogo razdvojeni skupovi su i potpuno razdvojeni. Dakle, mi smo u
prethodnom tvrd¯enju pokazali i viˇse od potpune razdvojenosti, tj. da je unutraˇsnjost jednog skupa u otvorenom poluprostoru. Med¯utim pojam potpune
razdvojenosti je vaˇzan i zbog potpune karakterizacije.
Teorema 24 Neprazni konveksni skupovi C1 , C2 ⊆ Rn su potpuno razdvojeni
ako i samo ako vrijedi
ri C1 ∩ ri C2 = ∅.
Teorema 25 Neprazni konveksni skupovi C1 , C2 ⊆ Rn su strogo razdvojeni ako
i samo ako vrijedi
inf
kx − yk > 0.
x∈C1 ,y∈C2
Kao primjenu Teorma separacije dokaza´cemo dvije vaˇzne ...
Teorema 26 Ako su C i D konveksni, zatvoreni i ograniˇceni skupovi i za sve
vektore a ∈ Rn vrijedi
maxha, xi = maxha, xi,
x∈C
x∈D
onda je C = D.
Dokaz. Ako bi postojao x0 ∈ (C \D)∪(D\C), onda se ta taˇcka strogo razdvaja od
C ili D. Na primjer, ako je x0 ∈ D\C, onda postoji a takav da je ha, x0 i > ha, xi
za sve x ∈ C. Uvaˇzavaju´ci kompaktnost imamo
maxha, xi < ha, x0 i 6 maxha, xi,
x∈C
x∈D
ˇsto je suprotno uslovu teoreme. ¤
Alternativni sistemi linearnih (ne)jednaˇcina su oni kod kojih samo jedan ima
rjeˇsenje. Neka je A m × n matrica, b ∈ Rm dok su vektori 0, x i y u skladu s
tim.
Teorema 27 (Farkaˇ
s, 1902) Samo jedan od sljede´ca dva sistema ima rjeˇsenje:
Ax = b, x > 0,
(29)
A> y > 0, hb, yi < 0.
(30)
27
Dokaz. Uzmimo prvo da oba imaju rjeˇsenja i to x0 i y 0 . Mnoˇze´ci skalarno x0 > 0
sa A> y 0 > 0 dobijamo hx0 , A> y 0 i = hAx0 , y 0 i = hb, y 0 i > 0. Pretpostavimo da
prvi sistem nema rjeˇsenje. Znaˇci b ∈
/ K = {Ax : x ∈ Rn+ }, koji je konveksan
(teorema 4) i zatvoren (teorema 17). Posmatrani skup i {b} strogo razdvaja
neka hiperravan H(y, α), odnosno, za sve x > 0 vrijedi
hy, bi < α < hy, Axi.
(31)
Specijalno, za x = 0 dobijamo hb, yi < 0. Sada, za sve x > 0, vrijedi hA> y, xi =
hy, Axi > 0. Odatle je A> y > 0, tako da je vektor normale y rjeˇsenje drugog
sistema. ¤
Ekstremalne taˇ
cke
Definicija 4 Taˇcka x je vrh (ekstremalna taˇcka) nepraznog konveksnog skupa
C ⊆ Rn ako je x ∈ C i ne postoje razliˇcite taˇcke x1 , x2 ∈ C takve da vrijedi
x=
x1 + x2
.
2
Lako se vidi da je x vrh tog skupa ako i samo ako iz
x1 , x2 ∈ C, λ ∈]0, 1[, x = (1 − λ)x1 + λx2
slijedi x1 = x2 .
Primjer 14 krug-simplex-poliedar
Vidimo da ˇsto se tiˇce broja vrhova situacija je razliˇcita. Konveksan skup ne
mora imati vrhove, a moˇze i biti neprebrojivo. Za poliedre imamo sljede´ce.
Primjedba 11 Neka je H = H(a, α) potporna hiperravan skupa C ⊆ H+ i
C1 = C ∩ H neprazan skup. Tada je ext C1 ⊆ ext C. Zaista, neka je v 0 ∈ ext C1 ,
ali nije u ext C. Postoje razliˇciti v 1 , v 2 ∈ C takvi da je 2v 0 = v 1 + v 2 . S obzirom
na ha, v 1 i > α = ha, v 0 i, dobijamo ha, v 1 − vi > 0, i na isti naˇcin ha, v 2 − vi > 0.
No, ha, v 1 − vi + ha, v 2 − vi = 0, pa mora da bude v 1 , v 2 ∈ H, te je v 1 , v 2 ∈ C1 ,
a to je u suprotnosti s v ∈ ext C1 .
Teorema 28 Zatvoren konveksan skup C ⊆ Rn ima vrh ako i samo ako ne
postoji prava P ⊆ C.
Dokaz. Neka je {x0 + λv : λ ∈ R} ⊆ C, za neku x0 ∈ C i v 6= 0. Prema Teoremi...
za svaki x ∈ C je {x + λv : λ ∈ R} ⊆ C. Sada moˇzemo uzeti x = x+v+x−v
, pa
2
zbog v 6= 0 taˇcka x nije vrh skupa C. Obratno, koristimo indukciju po dimenziji
skupa. Za jednoˇclane skupove situacija je jasna. U induktivnom koraku uzmimo
da je n dimenzija skupa C, a tvrd¯enje vrijedi za sve konveksne skupove dimenzije
6 n−1, kojima nijedna prava nije podskup. Svaka prava odred¯ena sa dvije taˇcke
iz posmatranog skupa ima neprazan presjek sa bd C. Potporna hiperravan u toj
taˇcki je dimenzije n − 1, pa rezultat izlazi iz prethodne napomene. ¤
Teorema 29 Poliedar ima najviˇse konaˇcan broj vrhova.
28
Dokaz. Neka je x0 vrh nekog poliedra. Jasno, postoji J ⊆ {1, ..., m} takav
da je hai∗ , xi = bi za indekse iz uoˇcenog podskupa, a hai∗ , xi < bi za ostale.
Za neku drugu taˇcku x sa istim svojstvom stavimo x1 = x0 + λ(x − x0 ) i
x1 = x0 − λ(x − x0 ). Imamo hai∗ , x1 i = hai∗ , x2 i = bi , za i ∈ J i hai∗ , x1 i <
bi + λhai∗ , x − x0 i < bi , i hai∗ , x2 i < bi , za dovoljno malu vrijednost λ. Prema
1
2
tome x1 i x2 su u poliedru, uz x0 = x +x
. Ovo nije mogu´ce, pa svakom skupu
2
J odgovara najviˇse jedan vrh, a takvih je konaˇcan broj. ¤
Vidjeli smo da neograniˇceni, zatvoreni konveksni skupovi ne moraju imati
vrhove. Situacija je drukˇcija ako je skup ograniˇcen.
Teorema 30 Neprazan, konveksan, kompaktan skup C ⊆ Rn ima bar jedan vrh.
Dokaz...
Kao jednu primjenu ove teoreme pokaˇzimo da linearna funkcija l : Rn →
R, l(x) = hc, xi dostiˇze minimum i maksimum na kompaktnom, konveksnom
skupu C u njegovom vrhu.
Prije svega, postoji x∗ ∈ C takva da je minx∈C l(x) = l(x∗ ). Jasno, skup
C ∗ = {x ∈ C : l(x) = l(x∗ } je konveksan i kompaktan, pa ima vrh x0 . Pokaˇzimo
da je on vrh i skupa C. Ako nije, postoje razliˇcite taˇcke x1 , x2 iz C, od kojih
bar jedna nije u C ∗ , takve da je 2x0 = x1 + x2 . Poˇsto {x1 , x2 } * C ∗ mora biti
l(x1 ) + l(x2 ) > 2l(x0 ), a zbog linearnosti funkcije l to je nemogu´ce. ¤
Ova primjedba ima poseban znaˇcaj u linearnom programiranju. Mi ´cemo je
iskoristiti za precizniji opis konveksnog omotaˇca. Naime, u izgradnji konveksnog
omotaˇca kompaktnog, konveksnog skupa ne sudjeluju, u suˇstini, sve njegove
taˇcke, nego samo vrhovi. U narednoj teoremi ext C oznaˇcava skup svih vrhova
skupa C.
Teorema 31 (Minkovski, 1911) Neka je C ⊂ Rn neprazan, konveksan, kompaktan skup. Tada
C = co (ext C).
Dokaz. Zbog konveksnosti skupa C vrijedi ext C ⊆ C ⇒ co ext C ⊆ C.
Obratna inkluzija se dokazuje indukcijom, po dimenziji skupa. Za n = 1 jedini
neprazni konveksni kompaktni skupovi su zatvoreni intervali [α, β], α 6 β, a za
njih je [α, β] = co {α, β}.
Za induktivni korak neka je dim C = n, a tvrdjenje taˇcno za sve konveksne
kompaktne skupove manje dimenzije. Uzmimo x ∈ C i taˇcke x1 , x2 ∈ bd C
takve da je x ∈ [x1 , x2 ]. Prema Teoremi 17 postoje potporne hiperravni H1 i
H2 , za koje je x1 ∈ H1 ∩ C, x2 ∈ H2 ∩ C. Ti presjeci, npr. C1 i C2 , su u (n − 1)−
dimenzionalnim hiperravnima, pa iz C1 ⊆ co ext C1 i C2 ⊆ co ext C2 , na osnovu
ˇcinjenice da su vrhovi skupova C1 i C2 ujedno vrhovi i skupa C, slijedi
x ∈ [x1 , x2 ] ⊆ co (C1 ∪ C2 ) ⊆ co (co ext C1 ∪ co ext C2 ) ⊆ co ext C.
Zakljuˇcno, x ∈ C ⇒ x ∈ co ext C.
¤
29
Primjedba 12 U proizvoljnim normiranim prostorima ne vrijedi ova teorema
ve´c njena posljedica koju su dokazali Krejn i Milman, (1940), a glasi Za neprazan,
konveksan, kompaktan skup vrijedi
C = cl (co (ext C)).
Ilustrujmo dokaz na inkluziji C ⊆ cl (co (ext C)). Pretpostavimo da ona nije
taˇcna, tj. da postoji x0 ∈ C koji ne pripada skupu cl (co (ext C)). Ovaj skup
je konveksan i zatvoren, pa je strogo razdvojen od x0 . Postoji a 6= 0 tako
da za sve x ∈ ext C vrijedi ha, x0 i < ha, xi. Prema tome linearna funkcija data
sa l(x) = ha, xi ne dostiˇze minimum u vrhu konveksnog kompaktnog skupa . ¤
Polarni skupovi
Vidjeli smo kako se proizvoljnom nepraznom skupu S ⊆ Rn dodjeljuje konveksan skup (S 7→ co S). Drugi naˇcin sastoji se u sljede´cem... Neka je C konveksan, zatvoren skup u Rn u kome se nalazi 0. Tada je pomo´cu duˇzi [0, x]
opisan taj skup: C = ∪x∈C [0, x]. Svakim vektorom x ∈ C odred¯ena je hiperravan H(x, 1). Presjek svih poluprostora H+ (x, 1) je neprazan (u njemu je bar 0),
naziva se polaran skup skupa C i oznaˇcava sa C ◦ . Dakle,
C o = ∩x∈C {y ∈ Rn : hy, xi 6 1}.
(32)
SLIKA 1, slika B
Primjer 15 {0}◦ = Rn , {c}◦ = H+ (c, 1)
Primjer 16 B ◦ = B
Moˇzemo pisati
C ◦ = {y ∈ Rn : hy, xi 6 1 ∀x ∈ C} = {y : SC (y) 6 1} = lev(SC , 1).
Sada, za proizvoljan neprazan S ⊆ Rn polaran skup definiˇsemo sa
S o = {y ∈ Rn : hy, xi 6 1 ∀x ∈ S}.
Odmah vidimo da vrijedi
S ⊆ T =⇒ T ◦ ⊆ S ◦
S ⊆ T ⇒ SS 6 ST , y ∈ T ◦ ⇒ ST (y) 6 1 ⇒ SS (y) 6 1 ⇒ y ∈ S ◦ .
1
rS ◦ = ( S)◦ , r > 0.
r
Specijalno,
1
B ◦ [0, r] = B[0, ].
r
30
(33)
Iz definicije vidimo da je polarni skup konveksan, zatvoren i da mu pripada
0. Da bismo dali karakterizaciju skupova sa navedenim svojstvima definiˇsemo
polarni skup polarnog skupa (tzv. bipolarni skup)
S ◦◦ = (S ◦ )◦ = {x ∈ Rn : hx, yi 6 1 ∀y ∈ S ◦ }.
Sada, zbog hx, yi 6 1, za sve x ∈ S i sve y ∈ S ◦ zakljuˇcujemo
S ⊆ S ◦◦ .
Obratno ne mora da bude uvijek, ali vrijedi sljede´ca jednakost, odakle je jasna
veza izmed¯u skupova S i S ◦◦ .
Teorema 32 Za svaki neprazan skup S ⊆ Rn vrijedi
S ◦◦ = cl co (S ∪ {0}).
Dokaz. Stavimo C = cl co (S ∪ {0}). U suˇstini, ve´c smo vidjeli da je C ⊆ S ◦◦ .
Ako x0 ∈
/ C, onda (Teorema separacije 20.) postoje a 6= 0 i realan broj α tako da
je ha, xi > α > ha, x0 i, za sve x ∈ C. Kako je 0 ∈ C slijedi α < 0, pa stavljaju´ci
da je a0 = αa imamo ha0 , xi < 1 za sve S ⊆ C i ha0 , x0 i > 1. To znaˇci da je
a0 ∈ S ◦ i nije ha0 , x0 i 6 1, tako da x0 ne moˇze biti u S ◦◦ . Dakle, C = S ◦◦ . ¤
Posljedica 5 Skup S ⊆ Rn je zatvoren konveksan skup i 0 ∈ S ako i samo ako
S ◦◦ = S
Dokaz. Uz pretpostavke imamo S ◦◦ = cl co (S ∪ {0}) = cl co S = cl S = S.
S druge strane ako je taˇcna jednakost skup preuzima svojstva odgovarajuˇceg
bipolarnog skupa. ¤
Pojam polarnosti se moˇze iskoristiti i za karakterizaciju ograniˇcenosti nekih
konveksnih skupova.
Teorema 33 Neka je skup S zatvoren i neka mu pripada 0.Tada je je taj skup
ograniˇcen ako i samo ako 0 ∈ int S ◦ .
Dokaz. Prvo, neka je skup ograniˇcen. Postoji broj r > 0 takav da je S ⊆ rB,
odakle je (rB)◦ ⊆ S ◦ , 1r B ⊆ S ◦ ˇsto znaˇci da je 0 ∈ int S ◦ . Na isti naˇcin se
dokazuje da ako je 0 u unutraˇsnjosti nekog skupa, onda mu je polaran skup
ograniˇcen. Sada imamo, zbog Posljedice 5., da 0 ∈ int S povlaˇci ograniˇcenost
skupa (S ◦ )◦ = S. ¤
Sada ´cemo dati neke formule koje povezuju...
Teorema 34
(C ∪ D)o = C o ∩ Do
o
o
(C + D) = C ¢ D
31
o
(34)
(35)
DOKAZ. Imamo iz C, D ⊆ C∪D da je (C∪D)◦ ⊆ C ◦ i (C∪D)◦ ⊆ D◦ , odakle je
(C∪D)◦ ⊆ C ◦ ∩ D◦ . Neka je sada y ∈ C ◦ ∩ D◦ . Za sve c ∈ C, d ∈ D, λ ∈ [0, 1]
vrijedi hy, (1 − λ)c + λdi 6 1. Prema (19) je y ∈ (C∪D)◦ .
U drugoj formuli inkluzija ” ⊇ ” je trivijalna. Uzmimo da y ∈
/ C ◦ ¢ D◦ i
1 ◦
1 ◦
◦
pokaˇzimo da y ∈
/ (C + D) . Dakle, ako je y ∈
/ 2 C ∩ 2 D , onda postoje (stroga
separacija) vektori c0 , d0 6= 0 i pozitivni brojevi γ i δ takvi da za sve c ∈ C ◦ i
sve d ∈ D◦ vrijedi
hco , 2yi > γ, hc0 , ci 6 γ, hdo , 2yi > δ, hdo , di 6 δ.
odavde je
co
γ
∈ C oo = C i sliˇcno
h
do
δ
∈ D. No, sada imamo
co
do
+ , yi > 1,
γ
δ
tako da y nije u skupu (C + D)◦ . ¤
Primjer 17 Polarni skup konveksnog konusa K je upravo njegov polarni konus
(Primjer 10.) Zaista, K◦ = {y ∈ Rn : hy, xi 6 1 ∀x ∈ K}. S obziroma da za
sve λ > 0 i x ∈ K imamo λx ∈ K, to za proizvoljan y ∈ K◦ vrijedi hy, xi 6 λ1 ,
odakle je hy, xi 6 0. K◦ ⊆ {y ∈ Rn : hy, xi 6 0 ∀x ∈ K}. Obratna inkluzija je
oˇcigledna.
Formula ...
(K1 + K2 )∗ = K!∗ ∩ K2∗
(36)
Primjer 18 Odredimo polaran konus konaˇcno generisanog konusa K = {Ax :
x > 0} (Primjer 9.) :
{Ax : x > 0}0 = {y : hy, Axi 6 0
∀ x > 0} = {y : hA> y, xi 6 0
∀x 6 0} =
= {y : A> y 6 0}.
Dakle, dobili smo homogen poliedar.
Primjer 19 Naka je X matrica sa kolonama xi , i = 1, ..., m. Vrijedi
(co{x1 , ..., xm })◦ = {y : y > X 6 1> }.
Pk
Pm
Fakat, za svaki x = i=1 λi xi , i=1 λi = 1, λ1 > 0, ..., λm > 0, uslov hy, xi 6 1
je ispunjen ako i samo ako je hxi , yi 6 1, i = 1, ..., k
Primjer 20 Polaran skup zbira politopa i konaˇcno generisanog konusa je poliedar.
Dokaz. Prema (35)
(co {x1 , ..., xm } + {Ax : x 6 0})◦ = ∪λ λ{y : y > X 6 1} ∩ (1 − λ){y : y > A 6 0} =
= {y : y > A 6 0} ∩ (∪λ {y : y > X 6 λ1}) = {y : y > A 6 0} ∩ {y : y > X 6 1}) =
= {y : y > (X|A) 6 (1, 0)> }).
32
Poliedri
Ovdje ´cemo pokazati da ... dio toga smo mogli i ranije , no kako koristimo i
polarnost to je na jednom mjestu.
Teorema 35 Ograniˇcen poliedar je politop.
Dokaz. Svaki poliedar je zatvoren (primjer 5.) pa je u naˇsem sluˇcaju ,zbog
ograniˇcenosti, kompaktan. Prema teoremi Minkovskog on je konveksni omotaˇc
svojih vrhova, a taj skup je konaˇcan (Posljedica 3). Dakle, ograniˇcen poliedar
je politop. ¤
Teorema 36 (Minkovski) Homogeni poliedar je konaˇcno generisan konus.
Dokaz. Presjek homogenog poliedra K i jediniˇcne kugle B1 je ograniˇcen poliedar,
pa je prema ve´c dokazanom politop, tj. oblika je co (x1 , ..., xk ), x1 , ...xk ∈ K.
Konaˇcno generisani konus cone (x1 , ..., xk ) je K. Zaista, neka je x ∈ K. Jasno,
Pk
Pk
postoji λ > 0 takav da λx ∈ co (x1 , ..., xk ). Sada, iz λx = i=1 λi xi , i=1 λi =
Pk λi i
1, λ1 > 0, ..., λk > 0, slijedi da je x = i=1 λ x ∈ cone (x1 , ..., xk ). Obratno je
oˇcigledno. ¤
Teorema 37 Poliedar je zbir politopa i konaˇcno generisanog konusa.
Dokaz. Sistemu Ax 6 b, kojim je odred¯en poliedar, dodijelimo sistem nejednaˇcina Ax 6 ξb, ξ > 0. Jasno,
µ
0
n
x ∈ {x ∈ R : Ax 6 b} ⇔
x0
1
¶
½µ
∈
x
ξ
¶ µ
A
:
0
−b
−1
¶µ
x
ξ
¶
¾
60 .
Drugi skup je homogeni poliedar u Rn+1 , pa je prema teoremi Minkovskog
x1
xm
jednak nekom cone {(
), ..., (
)}.
ξ1
ξm
Neka su ξ1 > 0, ..., ξk > 0, a ostali ξi = 0. Sada ovaj konaˇcno generisani konus
je
v1
vm
vk
v k+1
cone {(
), ..., (
), (
), ..., (
)}, gdje je v i = ξ1i xi za ξi > 0, dok
1
0
1
0
i
je v i =
Prema tome, x0 pripada poliedru ako
Pk i samo ako
Pxk za ostalePindekse.
m
x0 = i=1 λi v i + i=k+1 λi v i , pri ˇcemu je λ1 > 0, ..., λm > 0, i=1 λi = 1, a
odavde slijedi tvrd¯enje. ¤
Dokaza´cemo da vrijede i obrati ovih teorema i time dati reprezentaciju
poliedara.
Teorema 38 Zbir politopa i konaˇcno generisanog konusa je poliedar.
Dokaz. Neka je posmatrani zbir P + K. Tada je (P + K)◦ poliedar, prema
Primjeru 19., a prema Teoremi 33. to je zbir politopa i KGK, tako da je i
(P + K)◦◦ poliedar. Ako pretpostavimo da 0 ∈ P + K, tada je zbog zatvorenosti
33
(...) i konveksnosti zbira (P +K)◦◦ = P +K (posljedica 5.). Ukoliko 0 ne pripada
zbiru, onda za proizvoljnu njegovu taˇcku x0 je 0 ∈ P − x0 + K. S obzirom da
je i P − x0 politop dobili smo poliedar, na primjer {x : Ax 6 b}, tako da je
P + K = {x : Ax 6 b + Ax0 }. ¤
Teorema 39 (Vejl) Konaˇcno generisan konus je homogen poliedar.
Dokaz. cone {...} = (cone {...})◦◦ = (hompol)◦ = (kgk)◦ = hompol
Teorema 40 Politop je ograniˇceni poliedar.
Dokaz. Prema Teoremi 34., politop P = P+ cone {0} je poliedar, a poˇsto je
kompakatan on je ograniˇcen poliedar. ¤
34
KONVEKSNE FUNKCIJE
....
1. Definicija, vrste i osnovni primjeri
Definicija 5 Funkcija f je konveksna ako je epi f konveksan skup. Funkcija je
konveksna na konveksonm skupu C ⊆ Df ako je njena restrikcija na C konveksna
funkcija.
Neka je f realna funkcija definisana na skupu D(f ) ⊆ Rn , i C ⊆ D(f ) neprazan,
konveksan skup.
Teorema 41 Funkcija f je konveksna na C ako i samo ako za sve x1 , x2 ∈ C i
svaki λ ∈ [0, 1] vrijedi
¡
¢
f (1 − λ)x1 + λx2 6 (1 − λ)f (x1 ) + λf (x2 ).
(37)
Dokaz. Neka su x1 , x2 ∈ µC i neka¶je µodgovaraju´
¶ ci nadgraf konveksan skup.
x1
x2
Poˇsto mu pripadaju taˇcke
,
, onda za sve λ ∈ [0, 1] mora
f (x1 )
f (x2 )
da bude
µ
¶
µ
¶ µ
¶
x1
x2
(1 − λ)x1 + λx2
(1 − λ)
+λ
=
∈ epi f,
f (x1 )
f (x2 )
(1 − λ)f (x1 ) + λf (x2 )
a ovo znaˇci daµvrijedi¶nejednakost
µ 2 ¶ (37).
x1
x
Uzmimo sada
,
∈ epi (f |C ), λ ∈ [0, 1]. Kako je C konveksan i
α1
α2
f ((1 − λ)x1 + λx2 )) 6 (1 − λ)f (x1 ) + λf (x2 ) 6 (1 − λ)α1 + λα2 ,
µ
¶
(1 − λ)x1 + λx2
slijedi da je
∈ epi (f |C ), te je ovaj skup konveksan. ¤
(1 − λ)α1 + λα2
Ako je u nejednakosti (37) znak < umjesto 6, za sve x1 6= x2 i svaki λ ∈]0, 1[,
kaˇzemo da je f strogo konveksna funkcija. Funkcija f je konkavna ako je -f
konveksna, tj. ako umjesto (37) vrijedi
¡
¢
f (1 − λ)x1 + λx2 > (1 − λ)f (x1 ) + λf (x2 ).
Primjer 21 Afina funkcija a(x) = ha, xi + α je konveksna na C = Rn . Njen
nadgraf je poluprostor Ona je i konkavna na tom skupu. Afine funkcije su jedine
koje su konveksne i konkavne.
Primjer 22 Ako je nadgraf funkcije h : Rn → R konveksan konus, ona je
konveksna i pozitivno homogena, ˇsto je, prema (12) i (13), ekvivalentno sa
h(x + y) 6 h(x) + h(y),
h(αx) 6 αh(x)
35
∀x, y ∈ Rn , α > 0.
Odmah vidimio da je h(0) = 0, zbog h(0) = h(0 + 0) 6 h(0) + h(0) i h(0) 6 0.
Uoˇcimo joˇs da je za α > 0 h(x) = h(α α1 x) 6 α1 h(αx), tj. αh(x) 6 h(αx), pa
vrijedi jednakost h(αx) = αh(x), za sve x ∈ Rn , α > 0. Isto tako lako se dobije
da je
h(−x) = −h(x)
i
h(
m
X
αi xi ) 6
i=1
m
X
αi h(hi ).
i=1
Sljede´ca dva su primjeri pozitivno homogenih konveksnih funkcija.
Primjer 23 (Funkcija Minkovskog) Neka je 0 ∈ C. Tada je domen funkcije
MC (x) = inf {α > 0 : x ∈ αC}
(38)
S
αC, a ako je 0 unutraˇsnja taˇcka skupa C onda je efektivni domen ˇcitav
ˇ
R . Funkcija Minkovskog je konveksna pozitivno homogena funkcija. Staviˇ
se,
vrijedi jednakost M (αx) = αM (x) za sve x i α > 0. Jasno M (0x) = M (0) =
0 = 0M (x), a za α > 0 imamo
α>0
n
M (αx) = inf {β > 0 : αx ∈ βC} = α inf {
β
β
: x ∈ ∈ C} = αM (x).
α
α
Joˇs je, zbog 0 ∈ int C, x ∈ (M (x) + ε)C i y ∈ (M (y) + ε)C, za sve ε > 0. slijedi
x + y ∈ (M (x) + M (y) + 2ε)C, odakle je M (x + y) 6 M (x) + M (y) + 2ε. Dakle
M (x + y) 6 M (x) + M (y).
Primjer 24 Ako u prethodnom primjeru uzmemo da je C jediniˇcna kugla B
dobijamo da je euklidska norma x 7→ kxk konveksna na Rn , s obzirom da je
kxk = MB (x). Ovo slijedi i direktno iz svojstava norme i teoreme 40. Med¯utim,
ako je int C =
6 ∅, x1 ∈ int C, x2 = (1 + t)x1 (t malo, dovoljno da bude x2 ∈ C)
1
i λ = 2 , onda (37) postaje jednakost. Dakle, norma nije strogo konveksna na C
sa nepraznom unutraˇsnoˇs´cu.
Primjer 25 Poˇsto vrijedi
k(1 − λ)x1 + λx2 k2 = (1 − λ)kx1 k2 + λkx2 k2 − (1 − λ)λkx1 − x2 k2
vidimo da je f (x) = kxk2 strogo konveksna na Rn .
U konveksne spadaju jako konveksne funkcije, za koje vaˇzi jaˇca nejednakost od
(37):
¡
¢
f (1 − λ)x1 + λx2 6 (1 − λ)f (x1 ) + λf (x2 ) − λ(1 − λ)αkx1 − x2 k2 ,
za neki α > 0 i sve x1 , x2 ∈ C, λ ∈ [0, 1]. Jasno, svaka jako konveksna funkcija
je i strogo konveksna. Na osnovu jednakosti iz primjera vidi se da je funkcija f
jako konveksna ako i samo ako je f − αk k2 konveksna, za neki α > 0. Samim
tim x 7→ kxk2 je jako konveksna sa α = 1.
36
Primjer 26 Kvadratna forma q(x) = hCx, xi + hc, xi je konveksna na svakom
C ⊆ Rn , ako i samo ako je simetriˇcna matrica C pozitivno semidefinitna. Ovo
slijedi iz
(1 − λ)q(x1 ) + λq(x2 ) − q((1 − λ)x1 + λx2 ) = λ(1 − λ)hC(x1 − x2 ), x1 − x2 i.
Kvadratna forma je jako konveksna ako i samo ako je C pozitivno definitna. Za
α moˇzemo uzeti njenu najmanju sopstvenu vrijednost.
2. Osnovna svojstva, neke nejednakosti
Teorema 42 Funkcija f je konveksna na C ⊆ Rn ako i samo ako je funkcija
¡
¢
ϕ(λ) = f x1 + λ(x2 − x1 )
konveksna na intervalu [0, 1], za sve x1 , x2 ∈ C.
Drugim rijeˇcima f je konveksna na C ⊆ Rn ako i samo ako je konveksna njena
restrikcija na svakoj duˇzi iz C.
Jasno, f je konkavna ako i samo ako je hypo f konveksan skup. Poˇsto je
lev(f, α) ortogonalna projekcija na Rn skupa
¡
¢
epi f ∩ H en+1 , α ,
imamo da je za konveksnu funkciju f svaki nivoski skup (ukljuˇcuju´ci ∅) konveksan. I na osnovu nejednakosti (37) dokaz je trivijalan.
Jensenova nejednakost A-G nejednakostJensenova nejednakost A-G
nejednakost
Teorema 43 Neka je funkcija f konveksna na C. Tada, za svaki m ∈ N i sve
x1 , ..., xm ∈ C, λ1 > 0, ..., λm > 0, takve da je λ1 + · · · + λm = 1, vrijedi
f (λ1 x1 + · · · + λm xm ) 6 λ1 f (x1 ) + · · · + λm f (xm ).
(39)
Dokaz. Neka su m ∈ N i x1 , ..., xm ∈ C proizvoljni. Tada, zbog konveksnoti
x1
xm
nadgrafa i formule (15) vrijedi co {(
)} ⊆ epi (f |C ), za sve
1 ), ..., (
f (x )
f (xm )
nenegativne λ1 , ..., λm ˇciji zbir je 1. To znaˇci da je
µ
¶
λ1 x1 + ... + λm xm
∈ epi (f |C ),
λ1 f (x1 ) + ... + λm f (xm )
odnosno (33).
¤
Primjer 27 Funkcija jedne promjenljive f (x) = −P
ln x je konveksna
Pn na ]0, +∞[.
n
Jensenova nejednakost u ovom sluˇcaju glasi − ln i=1 λi xi 6 i=1 −λi ln xi .
Ova nejednakost, zapisana u obliku
n
Y
i=1
xλi i 6
n
X
i=1
37
λi x i ,
(40)
Pn
za sve x1 , ..., xn > 0, λ1 , ..., λn > 0,
¯u
i=1 λi = 1 naziva se nejednakost izmed
aritmetiˇcke i geometrijske sredine. Uzimaju´ci da su svi brojevi λi = n1 , imamo
√
n
x1 + ... + xn
.
n
x1 ...xn 6
Primjer 28 (Helder) Polaze´ci od toga da je eksponencijalna funkcija konveksna, za pozitivne brojeve ξ i η i brojeve p > 1, q > 1 takve da je p1 + 1q = 1 dobija
se, iz Jensenove nejednakosti za m = 2, nejednakost
1
ξη 6 e p ln ξ
p
+ q1 ln η q
odnosno
ξη 6
6
1 ln ξp 1 ln ηq
e
+ e
,
p
q
ξp
ηq
+ .
p
q
xi
1 i η
P
p p
( n
i=1 xi )
1
1
1 6 p + q =
q
i=1 yi ))
Stavljaju´ci, za sve i = 1, ..., n, ξ =
Pn
i
dobijamo i=1 Pn p x1i yP
q
n
(
i=1
xi ) p (
(41)
=
yi
1
P
q q
( n
i=1 yi )
, nakon sumiranja
1, tj.
hx, yi 6 kxkp kykq .
3. Prirodna svojstva konveksnih funkcija Konveksne funkcije imaju vaˇzno
svojstvo da su neprekidne na otvorenom skupu. Preciznije, vrijedi
Teorema 44 Neka je C ⊆ Rn konveksan skup sa nepraznim interiorom i neka
je f : C → R konveksna funkcija. Tada je f neprekidna na int C.
Dokaz. Neka je g(x) = f (x + x0 ) − f (x0 ), x0 ∈ int C. Tada je g konveksna i
g(0) = 0. Treba dokazati da je g neprekidna u 0. Prije svega postoji t > 0 takav
da je zatvorena kugla
tB1 ⊆ C − {x0 },
i g je ograniˇcena na toj kugli. Ograniˇcenost slijedi iz Teoreme 27 (Minkovskog)
i Jensenove nejednakosti. Neka je sada ε ∈]0, 1[. Za sve x ∈ εtB1 vrijedi
µ
µ ¶¶
µ ¶
1
1
g(x) = g (1 − ε)0 + ε
x
6 (1 − ε)g(0) + εg
x 6 εM.
ε
ε
Isto tako, iz zapisa
1
ε
0=
x+
1+ε
1+ε
µ
¶
1
− x ,
ε
dobijamo g(x) > −εM. Dakle, za svaki ε > 0 postoji δ > 0 takav da za sve
x ∈ δB1 vrijedi
|g(x) − g(0)| 6 εM. ¤
Situacija se mijenja ako se neprekidnost posmatra na ˇcitavom C, koji nije
otvoren skup.
38
½
1, x = 0
je konveksna, ali u 0
0, x > 0
nije neprekidna, ˇcak ni poluneprekidna odozdo. Uoˇcimo da je njen nivoski skup
lev( 12 ) =]0, +∞[ otvoren.
Primjer 29 f data na [0, 1] sa f (x) =
Postoje odozdo poluneprekidne konveksne funkcije koje nisu neprekidne.

x2

x1 > 0
x1 + 2 ,
Primjer 30 f (x1 , x2 ) =
x1

0,
(x1 , x2 ) = (0, 0)
je konveksna (nejednakost (37) pri x1 = (ξ1 , η1 ) x2 = (ξ2 , η2 ) svodi se na 0 6
(ξ1 η2 − ξ2 η1 )2 ), poluneprekidna odozdo ( nivoski skupovi su zatvoreni: ∅, {0} i
B[( α2 , 0), α2 ]), ali nije neprekidna u 0, zbog f ( n12 , n1 ) 9 f (0, 0).
Drugo vaˇzno svojstvo je postojanje izvoda po pravcima.
Neka su v 1 , v 2 dopustivi pravci skupa C u taˇcki x0 . Postoje pozitivni brojevi
t1 i t2 takvi da za i = 1, 2 vrijedi
x0 + tv i ∈ C,
∀t ∈]0, ti [.
Sada, za sve pozitivne t manje od 2 min{t1 , t2 } imamo
x0 + t(v 1 + v 2 ) =
¢ 1¡ 0
¢ 1
1¡ 0
1
x + tv 1 +
x + tv 2 ∈ C + C = C,
2
2
2
2
tako da je i v 1 +v 2 dopustiv pravac. Jasno, za svaki dopustivi pravac v i sve α > 0
pravac αv je dopustiv. Ukljuˇcuju´ci ovdje i nula vektor dobijamo konveksan
konus V(x0 , C). Konveksnost ne garantuje postojanje parcijalnih izvoda, ˇsto
vidimo ve´c na primjeru euklidske norme. Med¯utim, ako postoje parcijalni izvodi
oni su neprekidni. (Zadatak ...) Mi ´cemo ustanoviti da konveksna funkcija f u
unutraˇsnjoj taˇcki x0 domena, u svakom pravcu v, ima (jednostrani) izvod :
¡
¢
f x0 + tv − f (x0 )
0 0
f (x ; v) = lim
x→0+
t
Naime, postoji ε > 0 takav da je x0 +tv ∈ C za sve |t| 6 ε. Funkcija g :]0, ε] → R,
g(t) =
f (x0 + tv) − f (x0 )
t
je neopadaju´ca, jer za 0 < t1 < t2 6 ε nejednakost g(t1 ) 6 g(t2 ) glasi
¶
µ
¢
t1 ¡
t1
f (x0 ) + f x0 + t2 v ,
f (x0 + t1 v) 6 1 −
t2
t2
a ova vrijedi zbog konveksnosti funkcije f . Slijedi da postoji lim g(t), koji je
x→0+
konaˇcan, budu´ci da je g(t0 ) 6 g(t) za sve t ∈]0, ε[ i fiksiran t0 ∈] − ε, 0[. Dakle,
f 0 (x0 ; v) = lim g(t) = inf g(t).
x→0+
39
0<t6ε
Specijalno, za svaki x ∈ C vektor v = x − x0 je dopustiv pravac, pri ˇcemu je
ε = 1. Sada iz prethodne formule dobijamo
f 0 (x0 ; x − x0 ) = inf g(t) 6 g(1),
0<t61
odnosno vaˇznu nejednakost
f 0 (x0 ; x − x0 ) 6 f (x) − f (x0 ).
(42)
Neka je f konveksna na otvorenom C. Tada je funkcija
v 7→ f 0 (x0 ; v)
konveksna, pozitivno homogena na Rn i vaˇzi jednakost f 0 (x0 ; −v) = −f 0 (x0 ; v).
(f1 + f2 )0 (x; v) = f10 (x; v) + f20 (x; v)
(f1 ∨ f2 )0 (x; v) = max (f10 (x; v), f20 (x; v))
(43)
4. Operacije koje ˇ
cuvaju konveksnost, primjeri
1. Prije svega zbir dvije konveksne funkcije je konveksna funkcija. Proizvod
konveksne funkcije nenegativnim realnim brojem je, opet, konveksna funkcija.
Ovo se jednostavno dokazuje pa ´cemo samo navesti tvd¯enje. Prije toga recimo
da je za konveksnu funkciju f funkcija −f konveksna jedino u sluˇcaju da je
funkcija afina. Ovo znaˇci da skup svih konveksnih funkcija (na istom C) nije
potprostor, ali jeste konus, u prostoru realnih funcija.
Teorema 45 Neka su f1 , ..., fm konveksne na C ⊆ Rn , i α1 , ..., αm nenegativni
realni brojevi. Tada je f = α1 f1 + · · · + αm fm konveksna funkcija na C.
Primjer 31 (Lagranˇ
zova funkcija) U vezi sa problemom konveksne optimizacije
posmatra se Lagranˇzova funkcija definisana sa L(x, u) = f (x) + hu, g(x)i na
C × Rm
cemu je g = (g1 , ..., gm ). Prema prethodnoj teoremi x 7→ L(x, u) je
+ , pri ˇ
konveksna na C, za svaki fiksiran u > 0. u 7→ ϕ(u) = inf L(x, u) je konkavna
x∈C
na Rm
+.
2. Kompozicija dvije konveksne funkcije je konveksna, ali uz dodatne uslove
... Na osnovu definicije konveksne funkcije, pomo´cu operacija sa konveksnim
skupovima dobi´cemo nove konveksne funkcije. To nam omogu´cuje
Teorema 46 Neka je C ⊆ Rn+1 konveksan skup. Funkcija f,
½
µ
¶
¾
x
f (x) = inf ξ ∈ R :
∈C
ξ
je konveksna na skupu D ⊆ Rn taˇcaka x u kojima je infimum konaˇcan.
40
(44)
Dokaz. Prvo, skup D = {x : C ∩ ({x} × R)je ogranicen odozdo} je konveksan.
Neka je ε > 0 po volji. Postoje (x1 , ξ1 )> , (x2 , ξ2 )> , x1 , x2 ∈ D takvi da vrijedi
f (x1 ) 6 ξ1 < f (x1 ) + 2ε , i f (x2 ) 6 ξ2 < f (x2 ) + 2ε . Zbog konveksnosti skupa C
je (λ1 x1 + λ2 x2 , λ1 ξ1 + λ2 ξ2 ) ∈ C, odakle je f (λ1 x1 + λ2 x2 , λ1 ) 6 λ1 ξ1 + λ2 ξ2 6
λ1 f (x1 ) + λ2 f (x2 ) + ε. ¤
Primjedba 13 Jedan uslov da je infimum konaˇcan je da postoji nevertikalna
hiperravan u Rn+1 , H((a, −1)> , α), takva da je C ⊆ H− . Tada je ξ > ha, xi − α,
za fiksiran x i sve ξ uz (x, ξ) ∈ C.
3. Supremum (maksimum) konveksnih funkcija. Vaˇzan primjer ovkve funkcije je
x 7→ |x| = max {−x, x}. Njen nadgraf je konus dobijen u presjeku dva poluprostora. Za bilo koje dvije konveksne funkcije f1 i f2 definisane na C ⊆ Rn skup
epi f1 ∩ epi f2 je konveksan skup u Rn+1 . Jasno, to je nadgraf funkcije
C 3 x 7→ max {f1 (x), f2 (x)},
koja je konveksna prema prethodnoj teoremi. Oznaˇcavamo je sa f1 ∨f2 . Ovo vrijedi za funkciju f datu sa f (x) = maxi=1,...,m fi (x), x ∈ C, kao i za proizvoljno
konveksnih funkcija, zahvaljuju´ci tome ˇsto je presjek mnogo proizvoljno konveksnih skupova konveksan skup. To se moˇze dokazati i direktno.
Teorema 47 Neka je C ⊆ Rn konveksan, S ⊆ Rm i neka je funkcija F : C×S →
R konveksna na C za svaki y ∈ S i ograniˇcena na S za svaki x ∈ C. Tada je na
skupu C konveksna funkcija f data sa
f (x) = sup F (x, y).
y∈S
Dokaz.
Primjer 32 (supremum afinih minoranti) Uskladu sa Primjedbom 13. prirodno
je vidjeti ˇsta se moˇze odrediti pomo´cu skupa svih afinih minoranti date funkcije
f . Jasno, taj skup moˇzemo identifikovati sa
Af = {(a, α) ∈ Rn × R : ha, xi − α 6 f (x) ∀x ∈ C}.
Sada formalno moˇzemo definisati funkciju f na sljede´ci naˇcin:
f (x) =
sup (ha, xi − α).
(45)
(a,α)∈Af
Naravno, za proizvoljnu funkciju skup afinih minoranti Af moˇze biti prazan,
kao ˇsto se vidi na primjeru funkcije x 7→ x3 , x ∈ R. Ako je taj skup neprazan,
prema prethodnoj teoremi, dobijamo konveksnu funkciju. Pokaˇzimo joˇs da ako
je f konveksna funkcija na C onda je Af neprazan. Zaista, uzmimo prvo da je
int C ©=
6 ∅ i da mu pripada x0 .
ª
Skup (x, xn+1 )> : x ∈ int C, xn+1 > f (x) je konveksan, otvoren (f je neprekidna
na int C) i ne pripada mu (x0 , f (x0 )> . Postoje (Posljedica 4) (a, α) 6= 0 i β,
41
­
®
takvi da za sve x ∈ int C vrijedi a, x0 + αf (x0 ) 6 β < ha, xi + αxn+1 . Za
x = x0 i x­n+1 = ®f (x0 ) + 1 dobijamo α > 0, a za xn+1 = f (x) + ε (ε → 0+)
β
je a(x) = − αa , x + α
6 f (x) ∀x ∈ int C. Jasno, a(x0 ) = f (x0 ), pa za os0
0
0
(x)
tale taˇcke iz C, zbog [x0 , x[ ⊆ int C imamo a( x 2+x ) 6 f ( x 2+x ) 6 f (x )+f
,
2
0
x +x
0
2a( 2 ) − a(x ) 6 f (x), a(x) 6 f (x).
Dakle, za sve x ∈ C vrijedi a(x) 6 f (x), odnosno H((a, α)> , αf (x0 ) + ha, x0 i)
sadrˇzi taˇcku (x0 , f (x0 ))> , a nalazi se ispod nadgrafika epi f . U sluˇcaju da je x0
rubna taˇcka domena opet postoji potporna hiperravan nadgrafika, u (x0 , f (x0 )> ),
ali moˇze biti okomita na Rn (Primjer .., x0 = 0, H = H(e1 , 0)). Ovdje, ako je
epi f zatvoren i konveksan, a x0 rubna taˇcka zatvorenog C, onda nakon strogog
razdvajanja skupova epi f i {(x0 , ξ)> }, ξ < f (x0 ), dobijamo afinu minorantu
datu sa a(x) = h− αa , x − x0 i + ξ, za koju vrijedi a(x) 6 f (x), za sve x ∈ C, i
a(x0 ) = ξ.
Qn
i
Primjer 33 (Kob-Daglasova funkcija) Funkcija f (x) = − i=1 xα
koni
n
n−1
veksna je na R+ za svaki
(α
,
...,
α
)
∈
σ
.
1
n
Qn
Pn
Stavimo da je S = {y : i=1 yiαi = 1}, i F (x, y) = − i=1 αi xi yi , za x > 0, y ∈
S. Pomo´cu A-G nejednakosti dobijamo
f (x) = −
n
Y
(xi yi )αi > −
i=1
n
X
αi xi yi = sup F (x, y).
y∈S
i=1
S jedne strane svaka od funkcija x 7→ F (x, y), y ∈ S je konveksna (linearna),
a supremum se dostiˇze na kompaktnom S, (npr. u taˇcki (− fx(x)
, ..., − fx(x)
)> ).
1
n
Dakle, prema prethodnoj teoremi funkcija f je konveksna.
Primjer 34 (potporna funkcija skupa) Ako skup C ograniˇcen onda je sa
SC (x) = sup hx, yi
y∈C
definisana na Rn funkcija, koja je oˇcigledno konveksna i pozitivno homogena
(SC (αx) = αSC (x), α > 0). Uzmimo da je x0 6= 0 taˇcka iz Rn . Tada za konveksan C postoje dvije potporne hiperravni H(x0 , α) i H(x0 , β). Za α 6 β vrijedi
hx0 , xi 6 β za sve x ∈ C, te je SC (x0 ) = β, pa je H(x0 , SC (x0 )) jedna potporna
hiperravan skupa C, normalna na vektor x0 6= 0. Druga takva hiperravan je
H(−x0 , SC (−x0 )), zbog α = inf hx0 , xi = − sup h−x0 , xi = −SC (−x0 ). Odavde
x∈C
x∈C
je i izvedeno ime za ovu funkciju.
Primjer 35 (konjugovana funkcija) Svakoj funkciji f : D(f ) → R dodjeljuje se konjugovana funkcija f ∗ : D(f ∗ ) → R,
f ∗ (y) = sup (hy, xi − f (x)),
(46)
x∈D(f )
gdje je D(f ∗ ) skup taˇcaka za koje je supremum konaˇcan. Svaka konjugovana
funkcija je konveksna.
42
4. Infimum konveksnih funkcija
¡
­
®¢
ϕ(λ1 u1 + λ2 u2 ) = inf f (x) + λ1 u1 + λ2 u2 , g(x) =
x
¢
λ1 f (x) + λ1 hu1 , g(x)i + λ2 f (x) + λ2 hu2 , g(x)i >
¡
¢
¡
¢
> λ1 inf f (x) + hu1 , g(x)i + λ2 inf f (x) + hu2 , g(x)i =
= inf
¡
x
x
x
= λ1 ϕ(u1 ) + λ2 ϕ(u2 ), za sve λ1 , λ2 > 0, λ1 + λ2 = 1.
Primjer 36 (zatvorenje) Funkcija cl f, zvana zatvorenje funkcije f definiˇse
se sa
epi(cl f ) := cl(epi f ).
Kaˇzemo da je neka funkcija zatvorena ako je jednaka svom zatvorenju, tj.
f = cl f.
Prema teoremi 2. f je zatvorena na zatvorenom skupu ako i samo ako je odozdo
poluneprekidna funkcija. Ako je f konveksna onda je i cl f konveksna funkcija
(Teorema 6.) Ovim vaˇznim funkcijama posveti´cemo viˇse paˇznje kasnije i izmed¯u
ostalog pokaza´cemo, u konveksnom sluˇcaju, da je zatvorenje supremum afinih
minoranti date funkcije.
5.Infimalna konvolucija
Neka su f1 i f2 konveksne funkcije na Rn , sa zajedniˇckom afinom minorantom.
Odredimo funkciju f1 ⊕ f2 primjenjuju´ci teoremu ... na zbir nadgrafa datih
funkcija. Dakle, pod¯imo od problema minimizacije
½ µ
¶
¾
x
inf α :
∈ epi f1 + epi f2 =
α
©
ª
inf α1 + α2 : α1 > f1 (x1 ), α2 > f1 (x1 ), x = x1 + x2 .
Nakon eliminacije α1 i α2 imamo
(f1 ⊕ f2 )(x) =
inf
x=x1 +x2
¡
¢
f1 (x1 ) + f2 (x2 ) ,
(47)
a moˇzemo pisati i
(f1 ⊕ f2 )(x) = infn (f1 (y) + f2 (x − y)).
y∈R
Prema konstrukciji je epi (f1 )+epi (f2 ) ⊆ epi (f1 ⊕f2 ). Za (x, α)> ∈ epi (f1 ⊕f2 ),
gdje je α > 0, postoje v i ε > 0 takvi da je f1 (v) + f2 (x − v) + ε = α i
¶ µ
¶
µ
¶ µ
x−v
x
v
+
∈ epi f1 + epi f2 .
=
f2 (x − v) + 2ε
α
f1 (v) + 2ε
Vidimo da vrijedi
{(x, α) : (f1 ⊕ f2 )(x) < α} ⊆ epi f1 + epi f2 ⊆ {(x, α) : (f1 ⊕ f2 )(x) 6 α},
a dalje ne´ce mo´ci:
43
Primjer 37 f1 (x) = ex , f2 (x) = 0, (f1 ⊕ f2 )(x) = 0, ...
5.
Konveksni omota´c minimuma
Ovdje ´cemo, prvo, proizvoljnoj funkciji f dodijeliti blisku joj konveksnu funkciju,
uzimaju´ci u Teoremi 41, da je C = co epi f . Opet pretpostavljamo da f ima
afinu minorantu ... Imamo
½ µ
¶
¾
x
co f := inf α :
∈ co epi f .
(48)
α
SLIKA
Na ovaj naˇcin moˇze se definisati operacija sa konveksnim funkcijama f1 co∨ f2 =
co (f1 ∨ f2 ). Mi ´cemo kra´ce pisati f1 M f2 za ovu operaciju.
Pk
Neka je x = i=1 λi xi , konveksna kombinacija taˇcaka iz domena funkcije f .
Pk
Pk
Tada je (xi , f (xi )) ∈ epi f , i i=1 λi (xi , f (xi )) = (x, i=1 λi f (xi )) ∈ co epi f ,
k
X
zbog epi f ⊆ co epi f . Sada je co f (x) 6
λi f (xi ), po definiciji, i na kraju
i=1
co f (x) 6 inf
( k
X
i
i
λi f (x ) : k ∈ N, x ∈ D(f ), λ ∈ σ
k−1
,x =
i=1
k
X
)
i
λi x ,
. (49)
i=1
Neka su sada x i ε > 0 proizvoljni. Postoji α takav da je (x, α) ∈ co epi f i
Pk
Pk
α < co f (x) + ε. Znaˇci da je x = i=1 λi xi , f (xi ) 6 αi , i=1 λi αi = α, za
odgovaraju´ce taˇcke xi i brojeve αi , λi . Slijedi
k
X
i
λi f (x ) 6
i=1
k
X
λi αi = α < co f (x) + ε,
i=1
pa izlazi da u (41) stoji znak jednakosti. Zbog (17)
(f1 M f2 )(x) =
(f1 M f2 )(x) =
inf
x=(1−λ)u+λv,λ∈[0,1]
((1 − λ)f (u) + λf (v))
inf
((1 − λ)f (u) + λf (v)).
x = (1 − λ)u + λv
λ ∈ [0, 1]
(50)
(51)
pojam konveksnih vektorskih funkcija. Za funkciju g : Rn → Rm , g =
(g1 , ..., gm ) kaˇzemo da je konveksna vektorska funkcija, ako su sve komponentne
funkcije gi konveksne. U tom sluˇcaju prirodno, nivoski skup {x ∈ Rn : g(x) 6
a}, a = (a1 , ..., am ) je presjek nivoskih skupova lev(gi , ai ).
Poluneprekidnost i zatvorenost
44
U konveksnoj optimizaciji je vaˇzan pojam poluneprekidnosti odozdo. Opisa´cemo
takve funkacije pomo´cu afinih minoranti, a koriste´ci i pojam zatvorenja funkcije.
Teorema 48 Ako je funkcija f konveksna na zatvorenom konveksnom skupu C
onda vrijedi
cl f (x) = sup (ha, xi − α).
(52)
(a,α)∈Af
Dokaz. Oznaˇcili sa f funkciju datu supremumom afinih minoranti funkcije f .
Kako je cl epi f ⊆ epi f uvijek vrijedi f 6 cl f . Neka je cl f (x0 ) > f (x0 ),
0
0
za neki x0 ∈ C. Tada je i cl f (x0 ) > ξ = cl f (x 2)+f (x ) . Poˇsto je epi cl f
zatvoren skup, imamo da postoji afina minoranta a funkcije cl f takva da je
0
0
a(x0 ) = cl f (x 2)+f (x ) . Med¯utim, to je afina minoranta i funkcije f , pa zbog
f (x0 ) > a(x0 ) mora da je f (x0 ) > cl f (x0 ), ˇsto je suprotno pretpostavci. ¤
Posljedica 6 Funkcija f je konveksna i odozdo poluneprekidna na konveksnom
skupu C ako i samo ako je supremum svojih afinih minoranti zatvorena.
DOKAZ. Neka je vrijedi formula f (x) = sup(a,α)∈Af (ha, xi − α) Prema teoremi 47 i primjeru 21 f je konveksna. Pokaˇzimo da je i poluneprekidna odozdo.
Za to je dovoljna zatvorenost nivoskih skupova (Teorema 2). Neka je xk ∈ lev
(f, α) i xk → x0 . Skup C je zatvoren tako da je x0 ∈ C. Dalje, imamo redom,
za sve prirodne brojeve k f (xk ) = f (xk ) 6 α, sup a(xk ) 6 α, a(xk ) 6 α.
a∈Af
Slijedi a(x0 ) 6 α, i x0 ∈ lev (f, α). Obratno, poluneprekidna odozdo funkcija je
zatvorena, pa se u (53) piˇse f umjesto cl f . ¤
Konveksnost diferencijabilnih funkcija
Sljede´ce dvije teoreme sadrˇze kriterijume konveksnosti diferencijabilnih funkcija.
Uzimaju´ci u prethodnoj nejednakosti da je x = x2 i x1 umjesto x0 dobijamo
ˇ
(53). Staviˇ
se uslov x1 ∈ int C je suviˇsan.
Teorema 49 Nejednakosti
­
®
f (x2 ) > f (x1 ) + ∇f (x1 ), x2 − x1 ,
­
1
∇f (x2 ) − ∇f (x1 ), x2 − x
®
1
>0
(53)
(54)
2
vrijede, za sve x , x ∈ C, ako i samo ako je f je konveksna na C.
Dokaz. Neka je f diferencijabilna konveksna funkcija, x1 , x2 ∈ C i λ ∈]0, 1].
1
2
1
))−f (x1 )
Tada iz (37) dobijamo f (x +λ(x −x
6 f (x2 ), odakle pri λ → 0+ izlazi
λ
(53). U drugom smjeru imamo
­
®
f (x1 ) − f ((1 − λ)x1 + λx2 )) > ∇f ((1 − λ)x1 + λx2 ), λ(x1 − x2 ) ,
45
f (x2 ) − f ((1 − λ)x1 + λx2 )) > h∇f ((1 − λ)x1 + λx2 ), (1 − λ)(x2 − x1 )i,
pa mnoˇzenjem prve nejednakosti sa 1 − λ, a druge sa λ i sabiranjem izlazi
definiciona nejednakost (37). Sabiranjem odgovaraju´cih strana nejednakosti
(53) i nejednakosti h∇f (x2 ), x1 − x2 i 6 f (x1 ) − f (x2 ) dobija se (54). Na kraju
pokaˇzimo da taˇcnost nejednakosti (54) na C povlaˇci (53). Zaista, na osnovu
formule za srednju vrijednost, za neki θ ∈]0, 1[ vrijedi
f (x2 ) − f (x1 ) = h∇f (x1 + θ(x2 − x1 )), x2 − x1 i.
Ako vrijedi (54) imamo h∇f (x1 +θ(x2 −x1 ))−∇f (x1 ), θ(x2 −x1 )i > 0, odnosno
h∇f (x1 + θ(x2 − x1 )), x2 − x1 i > h∇f (x1 ), (x2 − x1 )i,
ˇsto uz prethodnu jednakost znaˇci (53). ¤
Inaˇce ova teorema moˇze se dokazati pomo´cu Teoreme ?. i ˇcinjenica da je
grafik konveksne funkcije jedne promjenljive iznad tangente, odnosno da je izvod
neopadaju´ca funkcija. Navedenu teoremu iskoristimo za dokaz kriterijuma konveksnosti drugog reda.
Teorema 50 Neka je f neprekidna na C i dva puta neprekidno diferencijabilna
na int C 6= ∅. Tada, f je konveksna na C ako i samo ako za sve x ∈ int C, v ∈ Rn
h∇2 f (x)v, vi > 0.
(55)
Dokaz. Neka je x ∈ int C, v ∈ Rn i t > 0 takav da je x + tv ∈ C. Stavljaju´ci u
(14) da je x1 = x i x2 = x + tv, dobija se
ϕ00 (t) = t2 h∇2 f (x)v, vi.
Konveksnost funkcije f povlaˇci konveksnost ϕ odakle izlazi ϕ00 (t) > 0, odnosno
(18), za x ∈ int C, v ∈ Rn . Obratno, za svaki x1 , x2 ∈ C i neki θ ∈]0, 1[
h∇f (x2 ) − ∇f (x1 ), x2 − x1 i = h∇2 f (x2 + θ(x2 − x1 ))(x2 − x1 ), x2 − x1 i
pa vidimo da (54) povlaˇci (55), tj. konveksnost funkcije f na int C. Sada zbog
neprekidnosti slijedi da je ta funkcija na konveksna i na C. ¤
Primjer 38 f (x) = x11 − x22 je konveksna na C = {x ∈ R2 : x2 = 0}, ali za
v = e2 je h∇2 f (x)v, vi = −2. Ovdje je int C = ∅.
Primjer 39 Kob-Daglasova funkcija
αn
n
1
f (x) = α0 xα
1 · · · xn , x ∈ R+ , α0 < 0, α1 > 0, ..., αn > 0
je konveksna za
n
X
αi 6 1.
i=1
46
Zaista,
­

Ã
!2
n
n
2
X
X
v
v
i
∇2 f (x)v, v = f (x) 
αi
−
αi i2  ,
x
xi
i
i=1
i=1
®
tako da iz nejednakosti Koˇsi-Bunjakovskog je h∇2 f (x) v, v i > 0.
n
X
Ako je
αi > 1, f nije konveksna, jer stavljaju´ci 1 = (1, ..., 1) imamo
i=1
µ
f
0+1
2
¶
n
X
−
= α0 2
i=1
αi
> α0 2−1 =
³
´
1 = α 2− Pni=1 αi > α 2−1 =
f 0+
0
0
³
´2
(1)
1 = Pnα0
.
f 0+
> α20 = f (0)+f
α
2
2
i=1 i
f (0) + f (1)
.¤
2
f (0)+f (1)
.
2
2
Subdiferencijali
Imamo, prema nejednakosti (53), da za diferencijabilnu konveksnu funkciju, za
fiksiran x0 ∈ C i sve x ∈ C vrijedi
­
®
f (x) − f (x0 ) > ∇f (x0 ), x − x0 .
Ovo daje mogu´cnost uopˇstavanja pojma gradijenta.
Definicija 6 Subgradijent funkcije f : S → R, S ⊆ Rn u taˇcki x0 ∈ S je vektor
y 0 ∈ Rn takav da za sve x ∈ S vrijedi
f (x) − f (x0 ) > hy 0 , x − x0 i.
(56)
Skup svih subgradijenata funkcije f u x0 naziva se subdiferencijal i oznaˇcava sa
∂f (x0 ). Dakle,
©
­
®
ª
∂f (x0 ) = y 0 : f (x) − f (x0 ) > y 0 , x − x0
∀x ∈ S .
Za pozitivno homogene konveksne funkcije izdvaja se subdiferencijal u 0 :
∂h = {y ∈ Rn : hy, xi 6 h(x) ∀x}.
Primjedba 14 Geometrijski, hiperravan u Rn+1 data sa
xn+1 = hy 0 , x − x0 i + f (x0 )
0
0
je hiperrvan
µ oslonca
¶ za epi f u taˇcki (x , f (x )). Kako je njen vektor nory0
male a =
ta hiperravan nije ortogonalna na Rn . Jasno je i obratno,
−1
ako je hiperravan H(a, f (x0 ) − hy 0 , x0 i) potporna za epi f u (x0 , f (x0 )) i nev0
0
0
ertikalna,
 onda
 je y subgradijent funkcije f u x . Tada je an+1 6= 0 i y =
a1


− a 1  ...  ∈ ∂f (x0 ).
n+1
an
47
slika
Na datoj slici je grafik konveksne funkcije date sa
√
½
1 − 1 − x2 , −1 6 x 6 0
f (x) =
x
06x<1
1−x ,
√
Primjer 40 Za funkciju f datu sa f (x) = − x, x > 0 jedina potporna prava
na nadgrafik, u (0, 0) je vertikalna,
√ pa je√subdiferencijal prazan. Ovo se vidi i
iz definicije: y ∈ ∂f (0), povlaˇci x − (− 0) > y(x − 0), za sve x > 0. Odavde
je − √1x > y za sve x > 0, ˇsto nije mogu´ce, pa je ∂f (0) = ∅. Funkcija f je
konveksna i diferencijabilna za x > 0, pa na osnovu nejednakosti (56) imamo
1
∂f (x) = {− 2√
}.
x
slika
Uslov ∂f (x) 6= ∅ je vaˇzan pa ´cemo ga posebno istaknuti.
Definicija 7 Funkcija f je subdiferencijabilna u x0 ∈ D(f ) ako je ∂f (x0 ) 6= ∅.
Izloˇzi´cemo osnovna svojstva subdiferencijala, kao i neke formule subdiferencijalnog raˇcuna.
Teorema 51 Subdiferencijal je zatvoren i konveksan skup.
Dokaz. Neka je ∂f (x0 ) 6= ∅. Prvi dio tvrdnje slijedi iz neprekidnosti skalarnog
proizvoda u nejednakosti iz definicije. Dalje, uzmimo y 0 , y­1 ∈ ∂f (x0 )®i λ ∈ [0, 1].
Kako za sve x ∈ D(f ), i za i = 0, 1 imamo f (x)−f (x0 ) > y i , x − x0 , to nakon
mnoˇzenja sa 1 − λ (za i = 0), a sa λ (za i = 1), te sabiranja dobijamo
­
®
f (x) − f (x0 ) > (1 − λ)y 0 + λy 1 , x − x0 .
Dakle, (1 − λ)y 0 + λy 1 ∈ ∂f (x0 ). ¤
Vidjeli smo da ni konveksna funkcija ne mora biti subdiferencijabilna u svim
taˇckama (npr. iz bd C). Za ostale taˇcke situacija je drukˇcija.
Teorema 52 Neka je f konveksna funkcija i x0 ∈ int C. Tada je ∂f (x0 )
neprazan kompaktan skup.
Dokaz. Za v 6= 0 postoji t0 > 0 takav da je x0 +tv ∈ C, za sve t ∈ [0, t0 ]. Skupovi
x
C1 =int epi f i C2 = {(
) : x = x0 + tv, ξ = f (x0 ) + tf 0 (x0 , v), t ∈ [0, t0 ]}
ξ
su konveksni kao interior nadgrafa konveksne funkcije, dok je C2 duˇz u Rn+1 .
Prema nejednakosti (42) ovi skupovi su disjunktni. Sada po Posljedici 4. postoje
a
vektor (
) 6= 0 i broj β, takvi da vrijedi
α
¿µ
¶ µ
¶À
¿µ
¶ µ
¶À
a
x
a
x0 + tv
,
<β6
,
,
α
ξ
α
f (x0 ) + tf 0 (x0 , v)
48
za sve x ∈ int C, ξ > f (x) i t ∈ [0, t0 ]. Uzimaju´ci da je x = x0 , ξ = f (x0 )+1 i t =
0 dobijamo da je α < 0. Dijeljenjem sa α, uz graniˇcni proces ξ = f (x)+ε, ε → 0+
izlazi nejednakost
D a E D a
E
f (x) − f (x0 ) + t − , v > − , x − x0 + tf 0 (x0 , v).
(57)
α
α
Na kraju, pri t = 0, dobijamo da je − αa ∈ ∂f (x0 ). Neka je¡sada y 0 ¢subgradijent
¡ ¢
pravac.
Tada,
za sve® t ∈]0, t0 [ imamo f x0 + tv − f x0 >
­i v0 proizvoljan
®
¡
¢
­
y , tv , odakle je f 0 x0 ; v > y 0 , v . Dalje slijedi
sup hy, vi 6 f 0 (x0 ; v).
y∈∂(x0 )
Kako je x0 ∈ int C, onda je funkcija v 7→ f 0 (x0 ; v) konveksna na Rn . Zbog
neprekidnosti ona je ograniˇcena na jediniˇcnoj kugli, pa za sve subgradijente
y
y
y ∈ ∂f (x0 ), y 6= 0 vrijedi hy, kyk
i 6 f 0 (x0 ; kyk
) 6 M, tj. kyk 6 M. Znaˇci,
0
∂f (x ) je ograniˇcen skup, a ve´c smo vidjeli da je zatvoren . ¤
Ustanovimo vezu izmed¯u subdiferencijala i jednostranih izvoda.
Teorema 53 Neka je f konveksna na C ⊆ Rn , x0 ∈ int C. Tada vrijedi
max hy, vi = f 0 (x0 ; v).
y∈∂f (x0 )
Dokaz. Prethodna nejednakost postaje
x = x0 vidimo da se maksimum dostiˇze
Primjedba 15
(58)
max hy, vi 6 f 0 (x0 ; v). Iz (57) za
y∈∂f (x0 )
u − αa . ¤
f 0 (x; v) = S∂f (x) (v),
(59)
Specijalno, za pozitivno homogene funkcije imamo
h(v) = h0 (0; v) = S∂h(0) (v),
kra´ce
h = S∂h .
Teorema 54 Konveksna funkcija f je diferencijabilna u x0 ∈ int C ako i samo
ako je ∂f (x0 ) jednoˇclan skup.
Dokaz. Ako je ∂f (x0 ) = {y 0 }, onda je prema (58) f 0 (x0 ; v) = hy 0 , vi, za sve
v ∈ Rn . Funkcija v 7→ f 0 (x0 , v) je linearna, ˇsto uz Lipˇsic neprekidnost f u x0
povlaˇci diferencijabilnost. Obratno, neka postoji ∇f (x0 ), i neka je y 0 subgradijent funkcije f u taˇcki x0 . Za sve vektore v mora biti hy 0 , vi 6 h∇f (x0 ), vi,
odakle je h∇f (x0 ) − y 0 , vi > 0, pa je ∇f (x0 ) = y 0 . ¤
Za raˇcunanje subdiferencijala vaˇzna su naredna tvrd¯enja.
49
Teorema 55 (Moro-Rokafelar) Neka su f1 , f2 konveksne funkcije na skupu
C sa nepraznim interiorom. Tada za sve x0 ∈ C vrijedi
∂(f1 + f2 )(x0 ) = ∂f1 (x0 ) + ∂f2 (x0 ).
(60)
Dokaz.
Iz
(f1 + f2 )0 (x0 ; v) = f10 (x0 ; v) + f20 (x0 ; v)
i ...slijedi
max
ha, vi =
a∈∂(f1 +f2 )(x0 )
max
a∈(∂f1 (x0 )+∂f2 x0 )
ha, vi
Primjedba 16 Za α > 0 imamo
∂(αf )(x) = α∂f (x),
­ 0
®
0
0
0
0
0
poˇ
­ s0to je αf0 ®(x) − αf (x ) > y , x − x isto ˇsto i y = αz i f (x) − f (x ) >
z , x−x .
Poznato je da iz diferencijabilnosti konveksnih funkcija f1 i f2 ne slijedi
diferencijabilnost konveksne funkcije f1 ∨ f2 u taˇckama x0 za koje je
f1 (x0 ) = f2 (x0 ).
Zato je, u tom sluˇcaju, potrebno odrediti, njen subdiferencijal.
Teorema 56 (Dubovicki - Miljutin) Neka su f1 i f2 konveksne funkcije na
konveksnom skupu C ⊆ Rn i neka je f1 (x0 ) = f2 (x0 ), x0 ∈ int C. Tada vrijedi
∂(f1 ∨ f2 )(x0 ) = ∂f1 (x0 ) ∪ ∂f2 (x0 ).
(61)
Dokaz
(f1 ∨ f2 )0 (x0 , v) = max (f10 (x0 , v), f20 (x0 , v)) = max (λf10 (x0 , v) + (1 −
06λ61
λ)f20 (x0 , v)) = max (λ
06λ61
max
max
max 0 ha, vi) + (1 − λ)
a∈∂f1 (x )
hλa + (1 − λ)b, vi =
06λ61 a∈∂f1 (x0 ),b∈∂f2 (x0 ))
max hb, vi) =
b∈∂f2 (x0 )
max
c∈∂f1 (x0 )∪∂f2 (x0 )
S druge strane
(f1 ∨ f2 )0 (x0 , v) =
max
c∈∂(f1 ∨f2 )(x0 )
hc, vi,
pa na osnovu...¤
Primjer 41 Odredimo ∂h(x), ako je h(x) = |x|, x ∈ R, i ∂k · k
50
hc, vi.
Za x 6= 0 funkcija f je diferencijabilna, pa je stvar jasna. Stavimo h1 (x) =
−x, h2 (x) = x. Sada je h = h1 ∨ h2 , h1 (0) = h2 (0), tako da imamo
∂(h1 ∨ h2 )(0) = ∂h1 (0) ∪ ∂h2 (0) = {−1} ∪ {1} = [−1, 1].
U opˇstem sluˇcaju za h(x) = kxk, x ∈ Rn vrijedi ∂h = B.
Zaista, y ∈ B, x ∈ Rn povlaˇci hy, xi 6 kxk kyk 6 kxk, odnosno nejednakost
hy, x − 0i 6 kxk − k0k, pa je y ∈ ∂h.
Na drugu stranu imamo y ∈ ∂h ⇒ y ∈ B, budu´ci da iz kxk > hy, xi, za sve
x ∈ Rn , pri x = y slijedi 1 > kyk.
Konjugovane funkcije
Konjugovane funkcije smo ve´c definisali (primjer ), a ovdje ´cemo ukazati na
njihov znaˇcaj. Problem minimizacije
x ∈ S ⊆ Rn
min f (x),
je ekvivalentan sa
−max (−f (x)),
x ∈ S.
U vezi s njima korisno je razmotriti skup problema
max {hy, xi − f (x) : x ∈ S}, y ∈ Rn .
Vidimo da se ovdje javlja nova funkcija vezana za f :
y 7→ max (hy, xi − f (x)).
x∈C
koja nije niˇsta drigo do njena konjugovana funkcija. Navedimo joˇs da ako znamo
funkciju f ∗ , onda je vrijednost −f ∗ (0) optimalna za dati problem minimizacije.
S druge strane, u teoretskim razmatranjima, linearan dodatak hy, xi ne name´ce
posebne zahtjeve.
Do istog pojma se dolazi ako nas zanima najmanja realna vrijednost koju uzima
α takvo da je x 7→ hy 0 , xi − α afina minoranta funkcije f na Df , odnosno da za
sve x ∈ Df vrijedi hy 0 , xi − f (x) 6 α. Jasno, to je
α0 = sup (hy 0 , xi − f (x)).
x∈Df
tako da dobijamo preslikavanje y 0 7→ α0 , koje je f ∗ .
na kraju odredimo potpornu funkciju za nadgraf funkcije f . Imamo
Sepi f (
y
)=
η
sup
(
x
ξ
)∈epif
51
(hx, yi + ξη).
Jasno, ako je η > 0, onda (
Sepi f (
y
)=
−1
y
)∈
/ D(Sepif ). Uzmimo da je η = −1. Sada je
η
sup
(hx, yi − ξ) = sup (hx, yi − f (x)) = f ∗ (y).
x∈D(f )
x ∈ D(f )
ξ > f (x)
.
Primjedba 17 Situcija u kojoj je D(f ∗ ) = ∅ nije iskljuˇcena, ˇsto pokazuje
primjer funkcije f (x) = x3 , Df = R. Ovdje je sup (yx − x3 ) = +∞, za sve
x∈R
y ∈ R.
Primjer 42 Ako je f diferencijabilna konveksna funkcija jedne promjenljive,
ˇciji izvod je invertibilan, onda vrijedi
¡
¢
f ∗ (y) = y(f 0 )−1 (y) − f (f 0 )−1 (y) .
Dovoljno je uoˇciti da je y 7→ xy − f (x) konkavna funkcija, pa se maksimum
nalazi medju taˇckama za koje vrijedi x = f 0 (y). Specijalno za funkciju
f (x) = ex , x ∈ R imamo f ∗ (y) = y ln y − y, y > 0.
Naravno, treba vidjeti i sljede´ce: f ∗ (0) = sup(0 · x − ex ) = 0, a za y < 0 je
sup(y · x − ex ) = +∞. Znaˇci Df ∗ = [0, +∞[.
x
x
Primjer 43 Za afinu funkciju f (x) = ha, xi − β vrijedi
Df ∗ = {a},
f ∗ (a) = β.
Zaista, supx∈Rn (hy, xi − ha, xi + β) = supx ∈ Rn hy − a, xi + β je konaˇcan samo
za y = a, dok za x = t(y − a) 6= 0 imamo supx∈Rn hy − a, xi > supt>0 tky − ak2 =
+∞.
Primjer 44 Neka je h pozitivno homogena funkcija na Rn . Vrijedi
Dh∗ = {y ∈ Rn : hy, xi 6 h(x) ∀x ∈ Rn } = ∂h,
h∗ (y) = 0.
Uzmimo da je hy, x0 i > h(x0 ), za neki x0 ∈ Rn . Slijedi
sup (hy, xi − h(x)) > sup(hy, αx0 i − h(αx0 )) > sup α(hy, x0 i − h(x0 )) = +∞,
x∈Rn
α>0
α>0
tako da y nije u Dh∗ . Neka je sada hy, xi 6 h(x), za sve x ∈ Rn Imamo
0 > sup (hy, xi − h(x)) > hy, 0i − f (0) = 0.
x ∈ Rn
Uzmimo specijalno ga je h = k · k. Tada je, prema primjeru 41, domen konjugovane ∂h = B, pa moˇzemo pisati
k · k∗ = I B .
(62)
¤
Ako je domen konjugovane funkcije neprazan moˇzemo odmah ustanoviti neka
njena bitna svojstva.
52
Teorema 57 Neka je f proizvoljna funkcija za koju je Df ∗ 6= ∅. Tada je Df ∗
konveksan skup, a f ∗ zatvorena konveksna funkcija.
Dokaz. Za y 1 , y 2 ∈ D(f ∗ ), λ ∈ [0, 1] vrijedi sup (h(1 − λ)y 1 + λy 2 , xi − f (x)) 6
x∈Df
6 (1 − λ) sup (hy 1 , xi − f (x)) + λ sup (hy 2 , xi − f (x)) < +∞, te je (1 − λ)y 1 +
x∈Df
x∈Df
λy 2 ∈ D(f ∗ ), i f ∗ ((1−λ)y 1 +λy 2 ) 6 (1−λ)f ∗ (y 1 )+λf ∗ (y 2 ). Uostalom, nadgraf
epi f ∗ je zatvoren i konveksan skup (Primjer 29.). ¤
Iz definicije direktno slijedi da za sve x ∈ D(f ) i sve y ∈ D(f ∗ ) vrijedi
f (x) + f ∗ (y) > hx, yi.
(63)
Ova nejednakost se zove Fenhelova ili Jang-Fenhelova.
Teorema 58 Ako je f proizvoljna, α > 0 i l invertibilno linerno preslikavanje
na Rn , onda funkcije definisane izrazima zdesna su konjugovane onima ˇcije
formule su slijeva.
αf (x) + ha, xi + β
f ◦l
f (x − x0 )
αf ∗ ( y−a
α )−β
f ∗ ◦ (l−1 )∗ .
f ∗ (y) + hy, x0 i
DOKAZ.
Teorema 59
(inf fi ))∗ = sup fi∗
i
(64)
Prirodno je definisati konjugovanu funkciju funkcije f ∗ , i ustanoviti njenu vezu
sa f . Umjesto (f ∗ )∗ piˇsemo f ∗∗ , i to je bikonjugovana funkcija funkcije f . Dakle
f ∗∗ (x) = sup (hx, yi − f ∗ (y)).
(65)
y∈Df ∗
Koriste´ci Fenhelovu nejednakost
f (x) > hy, xi − f ∗ (y)
na osnovu (65) dobijamo da za sve x ∈ D(f ) vrijedi
f (x) > f ∗∗ (x).
slike f...
53
(66)
Neka je D(f ∗ ) 6= ∅. Iz Fenhelove nejednakosti slijedi da f ima afinu minorantu
x 7→ ha, xi − α. Dalje je, redom, ha, xi − f (x) 6 α, a ∈ D(f ∗ ), f ∗ (a) 6 α,
ha, xi − α 6 ha, xi − f c (a), odakle je
sup (ha, xi − α) 6 sup (ha, xi − f ∗ (a)),
a∈Af
a∈D(f )
cl f (x) 6 f ∗∗ (x).
(67)
Odgovor na pitanje kada su funkcija i njena bikonjugovana funkcija jednake
direktno izlazi iz nejednakosti (66) i (67)
Teorema 60 (Fenhel-Moro) Funkcija f je odozdo poluneprekidna i konveksna na zatvorenom C ako i samo ako je
f = f ∗∗ .
(68)
∗∗
Dokaz. Iz jednakosti slijedi da je f konveksna, i poluneprekidna odozdo (f je
konveksna i zatvorena). Obratno, iz konveksnosti i poluneprekidnosti je f = cl
f. Kako joˇs imamo cl f 6 f ∗∗ 6 f, slijedi f = f ∗∗ . ¤
Veza izmed¯u subdiferencijala funkcije f i njene konjugovane funkcije data je
sljede´cim tvrd¯enjima.
Teorema 61 Neka je f proizvoljna funkcija i x0 ∈ Df . Tada vrijedi
­
®
y 0 ∈ ∂f (x0 ) ⇐⇒ f ∗ (y 0 ) + f (x0 ) = y 0 , x0 ,
(69)
¡
¢
y 0 ∈ ∂f (x0 ) =⇒ x0 ∈ ∂f ∗ y 0 .
(70)
Ako je f konveksna i zatvorena u x0 , onda vrijedi i obratna implikacija.
­
®
Dokaz. y 0 ∈ ∂f (x0 ) povlaˇci f (x) − f (x0 ) > y 0 , x − x0 , odnosno
­ 0 0®
­
®
y , x − f (x0 ) > y 0 , x − f (x),
­
®
za sve x ∈ Df , ˇsto znaˇci da je y 0 ∈ D(f ∗ ) i­ y 0 , x0® − f (x0 ) > f ∗¡(y 0 ).
¢
Pomo´cu Fenhelove nejednakosti dobijamo y 0 , x0 = f (x0 ) + f ∗ y 0 .
Na drugu stranu, iz ove jednakosti imamo
hy 0 , x0 i − f (x0 ) = f ∗ (y 0 ) > hy 0 , xi − f (x),
tj. za sve x ∈ Df vrijedi hy 0 , x − x0 i 6 f (x) − f (x0 ), i y 0 ∈ ∂f (x0 ).
U dokazu druge formule pod¯imo od y 0 ∈ ∂f (x0 ). Prema ve´c dokazanom je
f ∗ (y 0 ) − hx0 , y 0 − yi = hy, x0 i − f (x0 ) 6 f ∗ (y).
Znaˇci, za sve y ∈ Df ∗ imamo f ∗ (y) − f ∗ (y 0 ) > hx0 , y − y 0 i, tj. x0 ∈ f ∗ (y 0 ).
Obratno, iz prve ekvivalencije i Moro-Fenhelove teoreme (tj. f (x0 ) = f ∗∗ (x0 ))
slijedi
x0 ∈ f ∗ (y 0 ) =⇒ f ∗∗ (x0 ) + f ∗ (y 0 ) = hx0 , y 0 i =⇒
f (x0 ) + f ∗ (y 0 ) = hx0 , y 0 i =⇒ y 0 ∈ ∂f (x0 ). ¤
54
½
1, x = 0
, je konveksna, i ∂f (0) = ∅.
0, x ∈]0, 1]
½
0, y 6 0
Njena konjugovana funkcija je f c (y) =
, dok je ∂f c (0) = [0, 1].
y, y > 0
Uoˇcimo da f nije zatvorena u 0. Ako modifikujemo f tako da je f (x) = 0 za
x > 0, onda je isto ∂f (0) = ∅, dok je domen konjugovane ] − ∞, 0], f ∗ (y) = 0,
a ∂f ∗ (0) = [0, +∞[
Primjer 45 Funkcija f (x) =
Primjer 46 Pomo´cu formule (69) moˇzemo da odred¯ujemo konjugovane funkcije.
Tako za diferencijabilne konveksne funkcije viˇse promjenljivih vrijedi
f ∗ (∇f (x)) = h∇f (x), xi − f (x).
Sada, ako je C simetriˇcna PsemiD matrica reda n, q(x) =
onda je konjugovana funkcija q ∗ data sa
1
2 hCx, xi, x
∈ Rn ,
q ∗ (Cx) = 21 hCx, xi, x ∈ Rn .
U sluˇcaju da je C P D matrica, iz ∇q(x) = Cx = y dobijamo x = C−1 y, i
q ∗ (y) = hy, C−1 yi − 12 hy, C−1 y, i = 12 hC−1 y, yi, y ∈ Rn .
Pokaˇzimo da je Dq∗ = {Cx : x ∈ Rn } ako C jeste P semiD, ali ne i P D matrica.
Zaista, iz y ∈ Dq∗ slijedi
µ
¶
α2
q ∗ (y) = sup (hy, xi − f (x)) > sup hy, αx0 i −
hCx0 , x0 i ,
2
α∈R
x∈Rn
za fiksiran x0 6= 0, koji ´cemo izabrati tako da bude hCx0 , x0 i = 0. Sada je
q ∗ (y) > sup αhy, x0 i, odakle proizilazi jednakost hy, x0 i = 0. Znaˇci da je y orα∈R
togonalan na {x : Cx = 0}, pa se nalazi u {Cx : x ∈ Rn }.
Inaˇce, po samoj definiciji, za y = Cx imamo
µ
¶
1
1
1
∗
q (Cx) = sup hCx, vi − hCv, vi = hCx, xi −
inf hC(v − x), v − xi =
n
2
2
2 v∈Rn
v∈R
1
hCx, xi.
2
Specijalno, za C = I dobija se rezultat za euklidsku normu. ¤
=
55
Konveksne funkcije sa vrijednostima u
Posmatra´cemo sada funkcije f : Rn → R. Kaˇzemo da je takva funkcija
konveksna ako je njen nadgrafik konveksan skup, ˇsto je ekvivalentno sa
¡
¢
f (1 − λ)x1 + λx2 6 (1 − λ)α + λβ,
za sve x1 , x2 ∈ Rn , α > f (x1 ), β > f (x2 ) i sve λ ∈ [0, 1]. Konveksnost funkcije
sa konveksnog skupa C prenosi se na Rn tako ˇsto se na Rn \ C dodefinise sa +∞.
Efektivni domen dom (f ) = {x ∈ Rn : f (x) < +∞} konveksne funkcije f je
konveksan skup.
Ako konveksna funkcija nije svojstvena, tj. ako nije ispunjen uslov (9) (dom
f 6= ∅, −∞ ∈
/ f (Rn ), onda moˇze biti konaˇcna jedino na rubu svog efektivnog
domena. Zaista, ako je x ∈ int dom(f ), f (x1 ) = −∞, postoje x2 ∈ dom(f ), λ ∈
]0, 1[, za koje je x = (1 − λ)x1 + λx2 , i pri tome vrijedi
f (x) 6 (1 − λ)f (x1 ) + λf (x2 ) = −∞.
Primjer jedne takve funkcije je f = sgn ·I{0} , odnosno

 −∞, x < 0
0,
x=0
f (x) =

+∞, x > 0.
Primjer 47 Indikatorna funkcija nepraznog konveksnog skupa C
½
0,
x∈C
IC (x) =
+∞, x ∈
/C
je konveksna. Vrijedi i obratno, a to je jasno s obzirom da je epi IC = C × R.
Za operacije sa (konveksnim) funkcijama imamo da vrijedi
IS + IT = IS∩T ,
IS ∨ IT = IS∩T ,
IS ⊕ IT = IS+T ,
IS M IT = IS∪T (71)
Na primjer jednakost (S × R) + (T × R) = (S + T ) × R je ekvivalentna tre´coj
formuli.
Vektor y 0 ∈ Rn je subgradijent funkcije f u x0 ako za sve x ∈ Rn vrijedi
f (x) > f (x0 ) + hy 0 , x − x0 i.
Neposredno slijedi da f (x0 ) = −∞ povlaˇci ∂f (x0 ) = Rn , kao i da je f ≡ −∞.
U suprotnom imamo vaˇzno tvrd¯enje, koje se dokazuje kao teorema 26.
Teorema 62 Ako je konveksna funkcija f konaˇcna u taˇcki x0 onda vrijedi
∂f (x0 ) = {y 0 : f 0 (x0 ; v) > hy 0 , vi
56
∀v}.
S druge strane imamo da, ako je f (x0 ) konaˇcan i ∂f (x0 ) 6= ∅, onda je f
konveksna i vrijedi (34).
Konjugovana funkcija za f : Rn →] − ∞, +∞ ] definiˇse se sa
f ∗ (y) =
sup (hy, xi − f (x)).
x∈domf
Pri tome, ako f (x) 6= +∞, za neki x ∈ Rn onda je f ∗ (x) > −∞, za sve x.
S druge strane, ako f ima afinu minorantu na Rn , onda je dom f ∗ 6= ∅.
Drugim rijeˇcima f ∗ je sopstvena funkcija. Mi ´cemo redovno posmatrati konveksne funkcije uz navedena dva uslova. Imaju´ci ovo u vidu, kao i ...
Teorema 63 Funkcija f koja nije identiˇcki +∞ i ima afinu minorantu je sopstvena, zatvorena i konveksna.
Teorema 64 f ∗ (y) = Sepif (y, −1).
Primjer 48 Prema primjeru 43. za linearnu funkciju l(x) = ha, xi, a 6= 0, na
Rn imamo
l∗ = I{a} .
Primjer 49
IC∗ = SC .
(72)
Rezultat slijedi direktno iz definicije.
Primjenjuju´ci Fenhel-Moroovu teoremu, iz prethodne formule, budu´ci da u
suˇstini u Primjeru 44. imamo
h∗ = I∂h ,
(73)
dobijamo (opet) da je svaka ...
h = S∂h .
Primjer 50 Za zatvoren konveksan skup C vrijedi.
SC∗ = IC .
(74)
Zaista, SC∗ = IC∗∗ = IC .
Pri tome je domen ove homogene funkcije ∂SC = C, zbog (75) i (76).
Primjer 51 Za funkciju Minkovskog vrijedi
MC∗ = IC ◦ .
(75)
Poˇsto je i ovo konveksna pozitivno homogena funkcija potrebno je odrediti samo
domen njene konjugovane funkcije tj. skup ∂MC . Neka prvo y ∈
/ C ◦ . Tada postoji
x ∈ C takav da je hx, yi > 1. Poˇsto je MC (x) 6 1, dobijamo
MC∗ (y) > sup(hαx, yi − MC (αx)) = sup α(hx, yi − MC (x)) = ∞.
α>0
α>0
Ako je y ∈ C ◦ onda za sve x ∈ dom MC i sve α ∈ Sx imamo h αx , yi 6 1, odakle
je hx, yi − MC (x) 6 0, pa je MC∗ (y) 6 0. Dakle, ∂MC = C ◦ .
57
Teorema 65
(f1 ⊕ f2 )∗ = f1∗ + f2∗
(76)
(f1 M f2 )∗ = f1∗ ∨ f2∗
(77)
DC∗ = IB + SC .
(78)
DOKAZ.
Primjer 52
Uoˇcimo da je DC = f1 ⊕ f2 , gdje je f1 (x) = kxk, a f2 (x) = IC (x). Sada je,
prema prethodnoj teoremi
DC∗ (y) = f1∗ (y) + f2∗ (y) = IB (y) + IC∗ (y) = IB (y) + SC (y).
SS + ST = SS+T ,
SS ∨ ST = SS∪T ,
SC ⊕ SD = SS M ST = SC∩D
MS ∨ MT = MS∩T ,
MS M MT = MS∪T
MS + MT = MS¢T ,
MS ⊕ MT = MS∪T ,
NEKE PRIMJENE
Dokaˇzimo neke poznate ali vaˇzne ˇcinjenice. Ako je C konveksan, zatvoren
skup i 0 ∈ C tada
∗
= IC .
IC ◦◦ = MC∗ ◦ = SC
Iz jednakosti indikatornih funkcija slijedi jednakost skupova C i C ◦◦ .
K1 i K2 zatvoren konvekni konusi, int K1 ∩ K2 6= ∅ tada vrijedi formula...
I(K1 ∩K2 )◦ = SK1 ∩K2 = SK1 ⊕ SK2 = IK1◦ ⊕ IK2◦ = IK1◦ +K2◦ .
Dakle, (K1 ∩ K2 )∗ = −(K1 ∩ K2 )◦ = −(K1◦ + K2◦ ) = −K1◦ + (−K2◦ )) = K1∗ + K2∗ .
KONVEKSNE FUNKCIJE I EKSTREMI
Konveksne funkcije imaju niz svojstava koja olakˇsavaju odred¯ivanje ekstrema:
Svaki lokalni minimum je globalni minimum.
Skup taˇcaka minimuma je konveksan skup, a ako je f strogo konveksna, taj
skup je najviˇse jednoˇclan.
58
40. Neka je f diferencijabilna jako konveksna funkcija. Pokazati da je svaki
skup L(x0 ) = {x : f (x) 6 f (x0 )} ograniˇcen, i da f ima jedinstvenu taˇcku
minimuma. 11. Iz
¡
¢
f (1 − λ)x1 + λx2 6 (1 − λ)f (x1 ) + λf (x2 ) − α(1 − λ)λkx1 − x2 k2 slijedi
f ((x0 +λ(x−x0 ))−f (x0 )
6 f (x) − f (x0 ) − α(1 − λ)kx0 − xk2 , i
λ
h∇f (x0 ), x0 − xi > f (x0 ) − f (x) + αkx0 − xk2 .
Na osnovu nejednakosti Koˇsi-Bunjakovskog, za x, za koje je f (x) 6 f (x0 )
dobijamo
kx − x0 k 6
1
k∇f (x0 )k.
α
Ta funkcija je neprekidna na kompaktnom skupu L(x0 ), pa ima minimum (ˇcak
globalan), koji je jedinstven zbog stroge konveksnosti.
Taˇcka strogog maksimuma konveksne funkcije nije u skupu int Df .
x∗ je taˇcka globalnog minimuma diferencijabilne konveksne funkcije f na konveksnom skupu C ako i samo ako vrijedi
h∇f (x∗ ), x − x∗ i > 0
za sve x ∈ C.
(79)
Ako f nije diferencijabilna prethodna nejednakost se zamjenjuje sa
0 ∈ ∂f (x∗ ).
(80)
Dokaˇzimo prvo tvrd¯enje. Neka je f (x∗ ) minimum funkcije f na Df ∩ B(x∗ , ε)
i neka je x ∈ Df . Postoji broj λ takav da je λx + (1 − λ)x∗ ∈ B(x∗ , ε) ( npr.
ε
ako je x van te kugle, dovoljno je uzeti neki λ ∈] 0, kx−x
∗ k [.) Sada je, zbog
∗
∗
konveksnosti funkcije f , f (x ) 6 f ((1 − λ)x + λx) 6 (1 − λ)f (x∗ ) + λf (x),
odakle je f (x∗ ) 6 f (x) za sve x ∈ Df .
Ako bi konveksna funkcija imala strogi maksimum u x∗ ∈ int Df , za neke taˇcke
x1 , x2 ∈ B(x∗ , ε) ⊆ int Df bilo bi
µ 1
¶
x + x2
f (x1 ) + f (x2 )
2x∗ = x1 + x2 , i f (x∗ ) = f
6
< f (x∗ ).
2
2
U vezi sa maksimumom konveksne funkcije navedimo sljede´ce. Ako je C ⊂ int Df
kompaktan skup, onda postoji x∗ ∈ C, taˇcka globalnog maksimuma, poˇsto je
f neprekidna. Kompaktan, konveksan C je konveksni omotaˇc Ã
svojih vrhova,
!
s
s
s
X
X
X
i
i
pa je x∗ =
λi v ,
λi = 1, λi > 0. Dalje je f (x∗ ) = f
λi v
6
s
X
i=1
i=1
s
X
λi f (v i ) 6
i=1
i=1
λi
max
i=1
i∈{1,...,s}
f (v i ) =
max
i∈{1,...,s}
max
i∈{1,...,s}
f (v i ) 6 f (x∗ ). Dakle, vrijedi
f (v i ) = f (x∗ ),
59
tako da postoji vrh skupa C u kojem f dostiˇze maksimum na C. Posljednje
tvrd¯enje slijedi direktno iz nejednakosti (53), odnosno (56). Inaˇce uslov (79)
moˇzemo zamijeniti sa
h∇f (x∗ ), vi > 0 za sve dopustive pravce v u x∗ .
(81)
Zaista, iz x∗ , x ∈ C slijedi x∗ + λ(x − x∗ ) ∈ C, za sve λ ∈]0, 1[, tako da je x − x∗
dopustiv pravac, za sve x ∈ C. Obratna implikacija je jasna.
Kun - Takerova teorema
Mi ´cemo problemu konveksnog programiranja (3)da dodijelimo Lagranˇzovu funkciju
L(x, y) = f (x) + hy, g(x)i
na skupu D × Rm
+.
Teorema 66 (Kun, Taker) Neka su funkcije f , gi (i ∈ J ) konveksne i neka
je skup G regularan po Slejteru. Tada je dopustiva taˇcka x∗ rjeˇsenje problema
(KP) ako i samo ako postoji y ∗ > 0 takav da vrijedi
L(x, y ∗ ) > L(x∗ , y ∗ )
∀x ∈ C
hy ∗ , g(x∗ )i = 0.
(82)
(83)
Dokaz. ” ⇔ ”. Neka je x ∈ G. Tada je hy ∗ , g(x∗ )i 6 0, pa imamo f (x) > f (x) +
hy ∗ , g(x)i = L(x, y ∗ ). Odavde je, zbog uslova (82) i (83), f (x) > L(x∗ , y ∗ ) =
f (x∗ ). Dakle, f (x) > f (x∗ ) za sve x ∈ G.
” ⇒ ” Oznaˇcimo sa Gi nivoske skupove lev (gi , 0) i definiˇsimo funkciju
F1 = f + IC + IG1 + ... + IGm .
Prema () x∗ je rjeˇsenje problema (KP) ako i samo ako je 0 ∈ ∂F1 (x∗ ). Za taˇcku
x0 iz Slejterovog uslova vrijedi i x0 ∈ int dom f , ∈ int dom IGi , pa na osnovu
Moro - Rokafelarove teoreme i Primjera dobijamo
X
0 ∈ ∂f (x∗ ) + ∂IC +
yi∗ y i , y i ∈ ∂gi (x∗ ).
i∈J (x∗ )
Neka je vektor y ∗ takav da za preostale koordinate, tj. yi∗ za i ∈
/ J ∗ , ima
vrijednost 0. Samim tim je ispunjen uslov (83). Pokaˇzimo da je ispunjen i prvi
uslov. U tom cilju definiˇsimo funkciju F2 : C → R,
F2 (x) = L(x, y ∗ ) + IC (x).
Sada je
∂F (x∗ ) = ∂f (x∗ ) + ∂IC +
X
i∈J (x∗ )
60
yi∗ ∂gi (x∗ ),
pa vidimo da je i 0 ∈ ∂F2 (x∗ ). Dakle, x∗ je taˇcka minimuma funkcije x 7→
F (x, y ∗ ), na skupu C. Prema tome vrijedi (82). Drugi uslov je oˇcgledan, s
obzirom da je po konstrukciji
yi∗ gi (x∗ ) = 0,
i = 1, ..., m.
(84)
¤
Ako su f i g diferencijabilne, onda imamo uslov (82) postaje
∇x L(x∗ , y ∗ ) := ∇f (x∗ ) + hy ∗ , ∇g(x∗ )i = 0.
Primjer 53 Na´ci potreban i dovoljan uslov za postojanje rjeˇsenja zadatka linearnog programiranja min {hc, xi : Ax = b, x > 0},
Definicija 8 Taˇcka (x∗ , y ∗ ) ∈ C × R+ naziva se sedlasta taˇcka Lagranˇzove
funkcije ako za sve (x, y) ∈ C × R+ vrijedi
L(x∗ , y) 6 L(x∗ , y ∗ ) 6 L(x, y ∗ ).
(85)
Primjedba 18 (x∗ , y ∗ ) ∈ C × R+ je sedlasta taˇcka funkcije L ako i samo ako
je x∗ ∈ G i vrijede (82) i (83). Neka je (x∗ , y ∗ ) sedlasta taˇcka funkcije L. Poˇsto
vrijedi (82) preostaje da se ustanovi drugi uslov. Prije svega, uzimaju´ci u lijevoj
nejednakosti
f (x∗ ) + hy, g(x∗ )i 6 f (x∗ ) + hy ∗ , g(x∗ )i
da je y = y ∗ + ei , redom za sve i ∈ J , dobijamo hei , g(x∗ )i 6 0, odakle je
g(x∗ ) 6 0, tj. x∗ ∈ G. Sada je hy ∗ , g(x∗ )i 6 0, a pri y = 0 imamo hy ∗ , g(x∗ )i >
0. Slijedi hy ∗ , g(x∗ )i = 0.
Neka sada za neki par (x∗ , y ∗ ) ∈ C × R+ vrijede tri navedena uslova. Pokaˇzimo
da je ta taˇcka sedlasta. Za proizvoljan y > 0 imamo
hy ∗ − y, g(x∗ )i = −hy, g(x∗ )i > 0,
odnosno hy, g(x∗ )i 6 hy, g(x∗ )i. Dodaju´ci na obje strane f (x∗ ) dobija se lijeva
nejednakost u (85).
Sada ...
Teorema 67 Neka su f i gi , i ∈ J konveksne funkcije, skup G regularan po
Slejteru. Tada je x∗ taˇcka minimuma funkije f na G ako i samo ako postoji
y ∗ > 0 takva da je (x∗ , y ∗ ) sedlastu taˇcka funkcije L na C × Rm
+.
Primjedba 19 Bez ikakvih posebnih uslova, iz postojanja sedlaste taˇcke slijedi
rjeˇsivost problema minimizacije, tj. ako Lagranˇzova funkcija L ima sedlastu
∗
taˇcku (x∗ , y ∗ ) na skupu C × Rm
cka globalnog minimuma funkcije
+ , onda je x taˇ
f na G. tako da desna nejednakost u (69) postaje
f (x∗ ) 6 f (x) + hy ∗ , g(x)i.
61
Kako je y ∗ > 0, g(x) 6 0 na skupu G, to je na njemu i f (x∗ ) 6 f (x).
¤
Sedlaste taˇ
cke i minimaks
Postojanje sedlaste taˇcke funkcije F neposredno povlaˇci jednakost
min F (x, y 0 ) = max F (x0 , y),
x∈X
(86)
y∈Y
pri ˇcemu su te vrijednosti jednake F (x0 , y 0 ). Obratno, iz ove jednakosti izlazi
da za sve (x, y) ∈ X × Y vrijedi
F (x0 , y) 6 max F (x0 , y) = min F (x, y 0 ) 6 F (x, y 0 ),
y
x
odakle, uzimaju´ci x = x0 , y = y 0 slijedi F (x0 , y 0 ) = max F (x0 , y). Tako dobiy
jamo nejednakosti (63) iz definicije sedlaste taˇcke.
Jednakost (65) navodi nas na pomisao da tada vaˇzi i jednakost
min max F (x, y) = max min F (x, y),
x∈X y∈Y
y∈Y x∈X
a da je zaista tako vidimo iz sljede´ce teoreme.
Teorema 68 Funkcija F : X × Y → R, X ⊆ Rn , Y ⊆ Rm ima sedlastu taˇcku
na skupu X × Y, ako i samo ako vrijedi
min max F (x, y) = max min F (x, y).
x∈X y∈Y
(87)
y∈Y x∈X
Dokaz. Za sve (x, y), (x0 , y 0 ) ∈ X × Y vrijede nejednakosti
sup F (x, y) > F (x, y) > inf F (x, y),
x∈X
y ∈ Y
inf sup F (x, y) > sup inf F (x, y),
x
y
y
x
sup F (x0 , y) > inf sup F (x, y) > sup inf F (x, y) > inf F (x, y 0 ).
x
y
y
y
x
x
Ako F ima u (x0 , y 0 ) sedlastu taˇcku posljednje nejednakosti, uz (65), povlaˇce
inf sup F (x, y) = sup inf F (x, y) (= F (x0 , y 0 )),
x
y
y
x
tj, (66). Neka su sada, x0 i y 0 taˇcke minimuma, odnosno maksimuma odgovaraju´cih funkcija iz (66). Vrijedi max F (x0 , y) = min F (x, y 0 ), a to je (65). ¤
y
x
Uslovi koji obezbjed¯uju jednakost (66) sadrˇzani su u teoremama o minimaksu.
Prvu od njih, za standardne simplekse i bilinearnu funkciju F (x, y) = x> Ay,
dokazao je von Nojman (1928), a potom je dao i njeno uopˇstenje 1937.
62
Teorema 69 Neka je neprekidna funkcija (x, y) 7→ F (x, y) konveksna po x ∈
X, konkavna po y ∈ Y, pri ˇcemu su ovi skupovi konveksni i kompaktni. Tada
vrijedi
min max F (x, y) = max min F (x, y).
x∈X y∈Y
y∈Y x∈X
Dokaz. Oznaˇcimo lijevu stranu minimaks jednakosti sa α, a desnu sa β. Zbog
neprekidnosti i kompaktnosti ove vrijednosti postoje. Pokaˇzimo da je α = β.
Jasno, iz F (x, y) > min F (x, y), za sve y ∈ Y, slijedi
x∈X
max F (x, y) > max min F (x, y) = β,
y∈Y
y∈Y x∈X
za sve x ∈ X, pa je
α = min max F (x, y) > β.
x∈X y∈Y
Pretpostavimo da je α > β, i definiˇsimo funkcije
Fy : x 7→ F (x, y),
za svaki y ∈ Y. Tada, zbog max F (x, y) > α za sve x ∈ X, presjek svih nivoskih
y∈Y
skupova lev (Fy , α+β
2 ) je prazan. Zbog kompaktnosti skupa X i zatvorenosti
nivoskih skupova postoji konaˇcno vektora y 1 , ..., y m tako da je
m
\
¡
α +β¢
lev Fyi ,
= ∅.
2
i=1
Samim tim, uz oznaku G = (Fy1 −
α+β
m
2 , ..., Fy
−
α+β >
2 )
vrijedi
{x ∈ X : G(x) < 0} = ∅.
Sve komponentne funkcije su konveksne po pretpostavci, tako da po Fan Gliksberg Hofmanovoj teoremi postoji p = (p1 , ..., pm ) 0 takav da za sve x ∈ X
je
µ
¶
m
X
¡
¢ α+β
i
pi F x, y −
> 0.
2
i=1
pi
Stavljaju´ci da je λi = p1 +...+p
, iz konkavnosti polazne funkcije po y, za sve
m
x ∈ X slijedi
à m
!
m
X
X
α+β
i
i
6
λi F (x, y ) 6 F x,
λi y .
2
i=1
i=1
Odavde je
α+β
6 min F
x∈X
2
Ã
x,
m
X
!
λi y
i
i=1
6 max min F (x, y) = β,
y∈Y x∈X
odnosno α 6 β. To je u suprotnosti sa pretpostavkom α > β, pa nam preostaje
jednakost. ¤
63
ZADACI
1. Razdvojiti skupove :
C1 = {x ∈ Rn :
n
X
x2i 6 1}, C2 = {x ∈ Rn :
n−1
X
i=1
x2i + 1 6 xn }.
i=1
2. Odrediti sve konveksne zatvorene skup C ⊆ Rn takave da vrijedi
SC = k · k
3. Pokazati
da skup
C = co (S ∪ {e1 + e3 , e1 − e3 }),

 ext C, gdje je 
 x1

S =  x2  : x21 + x22 = 1 nije zatvoren u R3 .


0
4. Na´ci projekciju taˇcke x na C = {x ∈ Rn : Ax = b}.
5. Pokazati da je x ∈ C je vrh konveksnog skupa C ako i samo ako C \ {x} je
konveksan.
6. Polaran skup potprostora V ⊆ Rn je njegova ortogonalna dopuna.
7. Pomo´cu polarnih skupova dokazati Farkaˇsevu teoremu.
½
8. Skup
(x, y) ∈
£1
3 , +∞
£
×
£1
2 , +∞
£
¾
2
3
3
: x +y >x +y
4
je konveksan.
9. Svaki nivoski skup funkcije f : C −→ R C ⊆ Rn je konveksan ako i samo ako
za sve x1 , x2 ∈ C i sve λ ∈ [0, 1] vrijedi
f ((1 − λ)x1 + λx2 ) 6 max{f (x1 ), f (x2 )}.
99 [Fan, Gliksberg, Hofman] Neka je g = (g1 , ..., gm ) konveksna vektorska
m
\
funkcija na konveksnom skupu C ⊆
D(gi ). Tada vrijedi
i=1
{x ∈ C : g(x) < 0} = ∅ ⇐⇒ (∃u 0)(∀x ∈ C) hu, g(x)i > 0.
10. Neka su A, G, H aritmetiˇcka, geometrijska i harmonijska sredina koordinata
taˇcke x ∈ Rn . Pokazati da su x 7→ A(x), G(x), H(x) konkavne funkcije,
na skupovima Rn , Rn+ , int Rn+ , redom.
p
11. Pokazati da je funkcija R 3 x → f (x) = (1 + kxk ) 2 konveksna za p > 1.
n
2
64
12. Pokazati da je, za ai ∈ int Rn+ , funkcija Rn+ \ {0} 3 x 7→ f (x) =
m
X
i=1
konveksna .
1
hai , xi
13. Neka je f pozitivna i konkavna na konveksnom skupu C ⊆ Rn . Dokazati da
1
je reciproˇcna funkcija konveksna. Mogu li konveksnost i konkavnost da
f
zamjene uloge?
14. Ako je f konveksna na Rm , a g konveksna na Rn , onda su konveksne i
funkcije (f A)(x) := f (Ax), (Ag)(y) := inf Ax=y g(x).
15. Na´ci potporne funkcije skupova: x0 + B, B1 , {x > 0 :
{(x1 , x2 ) : x1 +
x22
2
Pn
i=1
xi = 1} i
6 0}.
16. Na´ci f1 ⊕ f2 , f1 (x) =
pozitivno definitne.
1
2 hA1 x, xi, f2 (x)
=
1
2 hA2 x, xi,
matrice A1 , A2 su
17. Ako konveksna funkcija ima parcijalne izvode, oni su neprekidni.
18. Odrediti f ∗ ako je



x
− ,
2
f (x) =
x(2 − x),


x − 2,
19. Za funkciju
½
f (x) =
√
− 1 + x,
x2 − 1,
−2 6 x < 0
06x62
26x
−1 6 x 6 0
0 6 x 6 1,
odrediti konjugovanu funkciju. Uporediti njihovu diferencijabilnost i konveksnost.
√
20. Pokazati da je funkcija x 7→ f (x) = − x1 x2 konveksna na R2+ , i na´ci njenu
konjugovanu funkciju.
21. Odrediti f ∗ za funkciju f : [1, +∞[×[0, +∞[−→ R,
65
f (x1 , x2 ) = x22 −
p
x21 − 1.
22. Neka je C = H(1; 1)∩ int Rn+ . Na´ci f ∗ za C 3 x 7→ f (x) =
23. Na´ci f ∗ funkcije f (x) =
1
p
n
X
Pn
i=1
xi ln xi .
|xi |p , p > 1.
i=1
24. Odrediti konjugovanu funkciju za f : Rn → R, f (x) = max {0, ha, xi + α}.
25. Na´ci konjugovanu funkciju za Rn 3 x 7→ f (x) = max kx − ai k, gdje su
i=1...m
a1 , ..., am ∈ Rn .
26. Neka je f = f ∗ na Rn . Tada je f (x) = 12 kxk2 .
27. Neka gradijent konveksne funkcije f ispunjava Lipˇsicov uslov na Rn . Pokazati
da je f ∗ jako konveksna funkcija na skupu C ⊆ {x ∈ Rn : ∂f ∗ (x) 6= ∅}.
28. Konveksna funkcija je subdiferencijabilna u x0 ∈ C ako i samo ako postoji
s > 0 takav da za sve x ∈ C vrijedi f (x0 ) 6 f (x) + skx − x0 k.
29. Dokazati da je funkcija data sa
q
f (x1 , ..., xn ) =
x21 + ... + x2k + x4k+1 + ... + x4n
konveksna na Rn , klase C 1 na Rn \ {0} i odrediti ∂f (0).
30. Na´ci subdiferencijale funkcija n promjenljivih datih izrazima :
max {xi : i = 1, ..., n},
max {|xi | : i = 1, ..., n}.
31. f konveksna h : v → f 0 (x0 , v). Tada ∂f (x0 ) = ∂h(0).
66
32. Za funkciju
f (x) = ||x| − 1|, x ∈ R
na´ci f ∗ , f ∗∗ , ∂f, ∂f ∗ .
33. Neka je f diferencijabilna i konveksna funkcija na Rn . Moˇze li da bude
inf f (x) = −∞?
x>0
34. Neka je f konveksna funkcija i ∇f (x0 ) > 0 za neki x0 ∈ Rn . Pomo´cu tih
vektora odrediti donju granicu vrijednosti π u problemu
min f (x),
h1, xi 6 1, x > 0.
35. Neka je f diferencijabilna na Rn . Tada je x∗ taˇcka njenog globalnog minimuma ako i samo ako
∇f (x∗ ) = 0, f (x∗ ) = f ∗∗ (x∗ ).
36. Na´ci min f (x), x ∈ R, f (x) =
brojevi (a1 < ... < an ).
Pn
i=1
|x − ai |, pri ˇcemu ai su dati realni
37. Za date vektore v 1 , ..., v m ∈ Rn , na kugli x ∈ B1 , na´ci minimum funkcije
f (x) =
m
X
kx − v i k 2 .
i=1
38. Na´ci projekciju taˇcke T (0, 1) na poliedar dat sistemom nejednaˇcina:
x1 + 3x2 > 3, 3x1 + 2x2 > 6, −x1 + x2 6 1.
39. Na´ci min
à n
X
!
|xi − ai | , ako je x ∈ Rn i
i=1
n
X
xi = 0.
i=1
ˇ
” RJESENJA”
1. Hiperravan H(en ; 1) razdvaja date skupove, poˇsto za sve x ∈ C1 vrijedi
hen , xi 6 ken kkxk 6 1,
dok za sve x ∈ C2 imamo
hen , xi = xn > 1 + x21 + · · · + x2n−1 > 1.
Ovdje je C1 ∩ C2 6= ∅, ali (int C1 ) ∩ C2 = ∅.
67
2. Iz supc∈ C hc, xi = kxk. slijedi hc, xi 6 kxk, za proizvoljan c ∈ C i sve x,
pa uzimaju´ci c = x imamo hx, xi 6 kxk, ˇsto znaˇci da je taˇcno c ∈ C ⇒ kck 6 1,
odnosno C ⊆ K(0, 1).
Pokaˇzimo da je taˇcna i suprotna inkluzija. Ako postoji c0 ∈
/ C, kc0 k 6 1, onda
(stroga separacija) postoje i vektor a 6= 0 i broj α takvi da vrijedi ha, c0 i > α >
ha, ci, za sve c ∈ C. Tada je supc∈C ha, ci 6 α < ha, c0 i 6 kakkc0 k 6 kak. Znaˇci
SC (a) < kak, ˇsto ne moˇze po uslovima zadatka, tako da je C ⊇ K(0, 1).
3. ext C = {e1 + e3 , e1 − e3 } ∪ (S \ {e1 }) nije zatvoren skup.
4. PC (x) = x − A> (AA> )−1 (Ax − b)
5. x ∈ C je vrh konveksnog skupa C ako i samo ako C \ {x} je konveksan.
Zaista, neka su x1 , x2 u C \ {x}, koji je konveksan. Tada je [x1 , x2 ] ⊆ C \ {x} pa
x∈
/ [x1 , x2 ], i x nije vrh. Ako x jeste vrh, a x1 , x2 ∈ C \ {x} su proizvoljni, tada
x∈
/ [x1 , x2 ] ⊆ C. Stoga je [x1 , x2 ] ⊆ C \ {x}.
6. Kao i ...hy, xi 6 0, ali i hy, −xi 6 0 za sve x ∈ V, tako da je V ◦ = V ⊥ .
7. Koristimo uz K◦◦ = K i teoreme 2. i 15.
{x : Ax = b, x > 0} 6= ∅ ⇔ b ∈ {Ax : x > 0} = {Ax : x > 0}◦◦
⇔ hb, ui 6 0
∀ u ∈ {Ax : x > 0}◦
⇔ hb, ui 6 0
∀ u ∈ {y : A> y > 0}
⇔ A> y > 0 ⇒ hb, yi 6 0.
Uoˇcimo da smo u suˇstini koristili ˇcinjenicu da je polaran konus konaˇcno generisanog konusa homogen konus.
8. Za funkciju f : R2 → R, f (x, y) = −x2 + x3 − y 3 + y 4 vrijedi
¿µ
¶
À
­ 2
®
3x − 1
0
∇ f (x)v, v = 2
v,
v
= 2(3x − 1)v12 + 6(2y 2 − y)v22 .
0
6y 2 − 3y
£1
£ £1
£
Matrica ∇2 f je PsemiD
na
,
+∞
×
,
+∞
pa je
3
2
©
£1
£ £1
£ . Znaˇci f je konveksna,
ª
njen nivoski skup (x, y) ∈ 3 , +∞ × 2 , +∞ : f (x, y) 6 0 , odnosno dati
skup, konveksan.
9...
68
99. Skup C1 = {y ∈ Rm : g(x) < y, za neki x ∈ C} je konveksan i
neprazan. Ako je skup {x ∈ C : g(x) < 0} prazan, onda 0 ne pripada
skupu C1 . Prema Teoremi separacije . postoji u ∈ Rm \ {0}, takav da vrijedi hu, yi > 0. Kako za svaki fiksiran x ∈ C, i svaki realan broj ε > 0 imamo
g(x) + εe ∈ C1 , to je hu, g(x) + εei > 0. Sada, pri ε → 0, dobijamo nejednakost hu, g(x)i > 0, za svaki x ∈ C. Pokaˇzimo joˇs da je u > 0. Ako bismo
imali da je neki uj < 0, uzimaju´ci y k = g(x) + εe + kej , k ∈ N dobili bismo
limk hu, y k i = −∞. Obratno tvrdjenje imamo kontrapozicijom na osnovu implikacije g(x0 ) < 0, u 0 ⇒ hu, g(x0 )i < 0.
1
h1, xi je na Rn je linearna funkcija. x 7→ G(x) je Kob n
Daglasova funkcija, pri α = 1, αi = n1 , i = 1, n, a ona je tada konkavna. Za
n
int Rn+ 3 x 7→ H(x) = 1 +···+
vrijedi
1
10. A(x) =
x1
xn


x−2
1
¢ 2 2
2

¡
−3
−2
− H (x)Diag(x−3
∇2 H(x) = 2 H 3 (x)  ...  x−2
1 , ..., xn ).
1 , ..., xn
n
n
x−2
n
Nejednakost h∇2 H(x)v, vi 6 0, za sve v ∈ Rn , x ∈ int Rn+ ekvivalentna je sa
³P
´2
Pn 1 Pn vi2
n
vi
6
si-Bunjakovskog za
i=1 x2i
i=1 xi
i=1 x3i , a ovo je najednakost Koˇ
¶
³
´ µ
√1 , ..., √1
√v1 3 , ..., √vn3 .
x1
xn ,
x1
xn
11. Za Heseovu matricu date funkcije f vrijedi, za sve x, v ∈ Rn .
­ 2
®
¡
¢ p−2 ¡
¢
∇ f (x)v, v = p 1 + kxk2 2 1 + (p − 1)kxk2 kvk2 > 0,
Konveksnost slijedi i iz ˇcinjenice da je kompozicija konveksne funkcije sa rastu´com
konveksnom funkcijom takod¯e konveksna. Ovdje je prva funkcija norma, a druga
p
t 7→ (1 + t2 ) 2 .
12. Budu´ci da je t 7→ 1t , t > 0 konveksna funkcija, imamo da za sve αi , βi >
0, λ ∈ [0, 1] vrijedi
1
1−λ
λ
6
+ ,
(1 − λ)αi + λβi
αi
βi
pa uz αi = hai , xi, βi = hai , yi, i = 1, ..., m, nakon sumiranja, dobijamo
m
X
i=1
m
m
X
X
1
1
1
6
(1
−
λ)
+
λ
,
i , xi
i , yi
hai , (1 − λ)x + λyi
ha
ha
i=1
i=1
ˇsto znaˇci da je f konveksna.
69
13. Koristi se ista nejednakost kao u ... Konveksnost i konkavnost ne mogu
da zamjene uloge. Npr. f (x) = x2 + 1 je konveksna funkcija na R, ali f1 nije
konkavna.
14...
15...
−1 −1
16. (A−1
1 + A2 )
17...
18. Za y > 1 vrijedi sup(xy − f (x)) > sup(xy − f (x)) = sup(2 + x(y − 1)) =
x>2
x∈R
x>2
+∞. Za y 6 1. maksimum izraza 2 + x(y − 1) je 2y.
x
Preostale mogu´cnosti za xy −f (x) su xy + , za−2 6 x < 0, sa maksimumom 0,
2
ili −2(y+ 12 ), i xy−x(2−x), pri 0 6 x < 2. Za posljednji izraz, p(x) = x2 +(y−2)x
vrijedi p(0) = 0, p(2) = 2y. Porede´ci ove vrijednosti zakljuˇcujemo

y 6 − 12
 −2y − 1,
c
1
0,
−2 6 y 6 0
f (y) =

2y,
06y61
19.
∗
f (y) =

1

−y − ,


4y




1,

y2


1+ ,


4


y,
y 6 − 12
− 21 6 y 6 0
06y62
y>2
.
f je strogo konveksna funkcija, ali nije diferencijabilna. Njena konjugovana
funkcija je diferencijabilna, ali nije strogo konveksna. Uopˇste, stroga konveksnostfunkcije f povlaˇci diferencijabilnost funkcije f c .
20. Za konveksnost ove funkcije vidjeti zadatak 10., uz α = −1, n = 2, α1 =
α2 = 12 . f je pozitivno homogena funkcija pa je
f c (y) = 0
na D(f c ).
Odredimo D(f c ) = {y ∈ R2 : hy, xi 6 f (x) ∀x ∈ R2+ }. Za sve (x1 , x2 ) ∈ R2+ i
√
y = (y1 , y2 ) treba da vrijedi y1 x1 + y2 x2 6 − x1 x2 . Mora biti y1 < 0, y2 < 0,
70
pa uzimaju´ci y1 = y2 = −x1 , x1 = x2 izlazi −2y12 6 y1 , tj. −2y1 > 1. Isto je i
za drugu koordinatu, pa slijedi y1 y2 > 14 .
p
2 )x2
Neka su y1 , y2 < 0 i y1 y2 > 14 . Imamo 2 (−y1 )x1 +(−y
> 2 (−y1 )(−y2 )x1 x2 >
2
√
√
x1 x2 , tj. y1 x1 + y2 x2 6 − x1 x2 .
½
0,
y1 < 0, y2 < 0, 4y1 y2 > 1
f ∗ (y) =
+∞,
inaˇce
21. Za f (x1 , x2 ) = f1 (x1 ) + f2 (x2 ), je f c (y1 , y2 ) = f1c (y1 ) + f2c (y2 ). Zadatak
se svodi na odred¯ivanje konjugovane funkcije za funkciju jedne
p promjenljive (uz
upotrebu diferencijalnog raˇcuna). Za funkciju f1 (x1 ) = (
− x21 − 1, x1 > 1,
p
0,
y2 < 0
dobija se f1c (y1 ) = − y12 − 1, y1 6 −1, dok je f2c (y2 ) =
za
y22
4 , y2 > 0 .
f2 (x2 ) = x22 , x2 > 0.
 2 p
 y2 − y 2 − 1, y1 6 −1, y2 > 0,
1
4
f c (y1 , y2 ) =
 −py 2 − 1,
y 6 −1, y 6 0 .
1
1
2
22...
23...
24. Za a = 0 f je konstantna, pa je D(f c ) = {0}, i f c (0) = −max{0, α}.
Uzmimo da je a 6= 0, i npr. a1 6= 0. Za y ∈ [0, a], tj. y = λa, 0 6 λ 6 1 vrijedi
sup{hλa, xi − f (x)} 6 max{
x
sup
λha, xi,
ha,xi6−α
sup
(λ − 1)ha, xi − α} = −λα.
ha,xi>−α
−α
Dakle, [0, a] ⊆ D(f c ),a kako za x1 = 1 e1 vrijedi hλa, x1 i − f (x1 ) = −λα, to
a
je
f c (λa) = −λα.
Dokaˇzimo joˇs da je
D(f c ) = [0, a].
Neka y ∈ dom(f c )\[0, a]. Taˇcka y moˇze se strogo razdvojiti od intervala. Postoji
c 6= 0 takav da je hc, yi > hc, λai za sve λ ∈ [0, 1]. Uzimaju´ci λ = 0, pa λ = 1 doα
bijamo hc, yi > 0, i hc, yi > hc, ai+ , za sve vrijednosti t ve´ce od nekog t0 . Sada
t
³
n
α o´
je sup(hy, xi−f (x)) > sup(hy, tci−f (tc)) > sup t hy, ci − max 0, ha, ci +
=
t
x
t>t0
t>0
+∞. Zakljuˇcno
f c (y) = −y, y ∈ [0, a].
71
25...
26...
0
0
0
27. Neka su y, y 0 ∈ C, i neka je x0 ­∈ ∂f ∗ (y 0 ). Tada
® y L∈ ∂f (x 0),2tj.y =
0
0
0
0
∇f (x ). Za f vrijedi f (x) 6 f (x ) + ∇f (x ), x − x + 2 kx − x k . Zbog
f (x0 ) + f c (y 0 ) = hx0 , y 0 i dobijamo hy, xi − f (x) > f c (y 0 ) + hy − y 0 , xi − L2 kx −
x0 k2 . Dalje je
¾
½
­
® L
c 0
0
0 2
sup {hy, xi − f (x)} > f (y ) + sup y − y , x − kx − x k .
2
x
x
Stavljaju´ci q(x) =
L
2 kx
− x0 k2 , imamo f c (y) > f c (y 0 ) + q c (y − y 0 ). Kako je
q c (y) =
1
k y k2 + hy, x0 i,
2L
­
® 1
izlazi f c (y) > f c (y 0 )+ x0 , y − y 0 + 2L
ky −y 0 k2 . za sve y ∈ C. Ova nejednakost
je isto ˇsto i
¿
À
1
1 0 2
1
f c (y) −
kyk2 > f c (y 0 ) −
ky k + x0 − y 0 , y − y 0 ,
2L
2L
L
tako da posmatrana funkcija ima subgradijent u taˇcki y 0 (i to x0 − L1 y 0 ) Subdiferencijabilnost funkcije u svakoj taˇcki skupa povlaˇci njenu konveksnost.
28...
29. Funkcija je konveksna ako i samo ako je njena restrikcija na svaku duˇz
iz domena konveksna. Zbog neprekidnosti date funkcije dovoljno je ustanoviti
konveksnost na svakom otvorenom poluprostoru.
∇2 (f · f )(x) = 2f (x)∇2 f (x) + 2(∇f (x))> ∇f (x)
­
®
2
+
f 3 (x) ∇2 f (x)v, v = (x21 + ... + x2k + x4k+1 + ... + x4n )(v12 + ... + vk2 + 6x2k+1 vk+1
3
2
2
2 2
3
... + 6xn vn ) − (x1 v1 + ... + xk vk + 2xk+1 vk+1 + ... + 2xn vn ) > 2(x1 + ... + x2k +
2
x4k+1 + ... + x4n )(x2k+1 vk+1
+ ... + x2n vn2 ) > 0, za sve v ∈ Rn . ∇2 f je pozitivno
definitna na pomenutim poluprostorima.
Odredimo jednostrani izvod funkcije f u 0, u pravcu v:
f (0 + tv) − f (0)
=
t→0+
t
f + (0; v) = lim
72
q
v12 + ... + vk2 .
­ ®
Pomo´cu formule y 0 ∈ ∂f (0) ⇔ f + (0; v) > y 0 v ∀ v, dobija se
©
ª
∂f (0) = x ∈ Rn : x21 + ... + x2k 6 1, xk+1 = ... = xn = 0 .
30. Za f (x) = max fi (x), gdje su fi konveksne, vrijedi
i=1,...,n
[
∂f (x) = co
∂fi (x), J (x) = {i : fi (x) = f (x)}.
i ∈ J (x)
U prvom sluˇcaju je fi (x) = xi , ∇fi (x) = ei , ∂fi (x) = {∇fi (x)},
∂f (0) = co {e1 , ..., en } = σ n .
Za f (x) = kxk∞ vrijedi ∂f (0) = co
n
[
[−ei , ei ] = B1 (0, 1).
i=1
31...
32. Funkcija f ∗ moˇze se dobiti direktno. Med¯utim, uoˇcimo da je f = f1 ∧f2 ,
f1 (x) = |x − 1|, f2 (x) = |x + 1|. Pri tome je
D(f1∗ ) = D(f2∗ ) = [−1, 1],
f1∗ (y) = y,
f2∗ (y) = −y.
Sada, zbog (f1 ∧ f2 )∗ = f1∗ ∨ f2∗ , imamo
f ∗ (y) = max{−y, y} = |y|,
y ∈ [−1, 1].
Dalje, f ∗∗ (x) = 0na intervalu [−1, 1], a za ostale vrijednosti je f cc = f .
Funkcija f je diferencijabilna, osim u taˇckama: -1, 0, 1. Na primjer, ∂f (1) =
[f 0 − (1), f 0 + (1)] = [0, 1], ∂f (0) = ∅.
33...
34. Zbog ∇f (x0 ) > 0, imamo da je
­
® ­
®
minn ∇f (x0 ), x = ∇f (x0 ), 0 = 0.
x∈σ
­
® ­
®
Iz konveksnosti funkcije f na Rn slijedi f (x)−f (x0 ) > ∇f­ (x0 ), x − ∇f
(x0 ), x0 ,
®
pa za sve x ∈ σ­n vaˇzi nejednakost
f (x) − f (x0 ) > 0 − ∇f (x0 ), x0 , odnosno
®
f (x) > f (x0 ) − ∇f (x0 ), x0 ,
35. Neka je x∗ taˇcka minimuma funkcije f , koja je u njoj diferencijabilna.
Uslov ∇f (x∗ ) = 0 je poznat. Dalje, kako je uvijek f cc = f 6 f , to je i
f cc (x∗ ) 6 f (x∗ ).
73
Konstantna funkcija
a : x 7→ f (x∗ )
je afina minoranta funkcije f , pa je
a 6 f , i specijalno vrijedi
f (x∗ ) 6 f (x∗ ),
odnosno
f (x∗ ) 6 f cc (x∗ ).
Pretpostavimo sada da je
∇f (x∗ ) = 0, i f (x∗ ) = f cc (x∗ ),
pa dokaˇzimo da je x∗ taˇcka minimuma funkcije f cc . Tada ´ce zbog
f (x∗ ) = f cc (x∗ ) 6 f cc (x) 6 f (x) ∀ x ∈ Rn ,
x∗ da bude taˇcka minimuma funkcije f . Dalje, poˇsto je f cc konveksna funkcija
dosta je dokazati da je njen gradijent u x∗ nula vektor. Dakle, za t > 0 vrijedi
f cc (x∗ + tek ) − f cc (x∗ )
f (x∗ + tek ) − f (x∗ )
6
.
t
t
Odavde , na osnovu pretpostavke ∇ f (x∗ ) = 0 dobijamo
(f cc )0+ (x∗ , ek ) 6 0.
Isto je i za pravac −ek , te za sve k=1,...,n vrijedi
0 6 (−f cc )0+ (x∗ , −ek ) 6 (f cc )0+ (x∗ , ek ) 6 0,
odakle slijedi
∇f cc (x∗ ) = 0.
Primjedba. Ovo je uopˇstenje Fermaove teoreme. Primjetimo da za funkcije
konveksne i diferencijabilne na Rn drugi uslov je ispunjen, tako da je tada
f (x∗ ) = minf (x) ⇔ ∇f (x∗ ) = 0.
36. Data funkcija je konveksna, ali nije diferencijabilna pa ´cemo koristiti
sljede´ce:
f (x∗ ) = minf (x) ⇔ 0 ∈ ∂ f (x∗ )
Uzmimo: f (x) =
je
n
X
fk (x), fk (x) = |x − ak |. Tada je ∂f (x) =
k=1
n
X
k=1

 {−1},
[−1, 1] ,
∂fk (x) =

{1},
74
x < ak
x = ak
x > ak .
∂fk (x), gdje
Slijedi ∂f (ak ) = [2k − n − 2, 2k − n], i ∂f (x) = {2k − n}, za ak < x < ak+1 .
U sluˇcaju da je n neparan vrijedi ∂f (a n+1 ) = [−1, 1], dok pri parnom n imamo
2
∂f (a n2 ) = [−2, 0], ∂f (a n2 +1 ) = [0, 2], i ∂f (x) = {0}, za sve x ∈ (a n2 , a n2 +1 ). U
svim ostalim sluˇcajevima 0 nije u subdiferencijalu. Dakle, za neparan n je
x∗ = a n+1 ,
2
a za parne vrijednosti skup taˇcaka minimuma je
£
¤
a n2 , a n2 +1 .
37. G = {x ∈ Rn hx, xi 6 1}, L(x, α) =
m
X
kx − v i k2 + α(hx, xi − 1). KKT
i=1
uslovi su:
m
X
(x − v i ) + αx = 0,
α(kxk2 − 1) = 0, α > 0,
kxk 6 1.
i=1
v1 + · · · + vm
, dobijamo za prvu jednaˇcinu (m + α)x = mv 0 .
m
¡
¢
U sluˇcaju da je kv 0 k 6 1, KKT taˇcka je v 0 , 0 uz α = 0. Ako je kv 0 k > 1,
α+m
, tako da je
onda mora biti α > 0, kxk = 1 (druga jednaˇcina) i kv 0 k =
m
µ 0
¶
v
, m(kv 0 k − 1) odgovaraju´ca KKT taˇcka.
kv 0 k
Zadatak je konveksne optimizacije pa je njegovo optimalno rjeˇsenje

0
kv 0 k 6 1
 v ,
∗
x =
v0

, kv 0 k > 1.
kv 0 k
Stavljaju´ci v 0 =
38. Neka je P dati poliedar. Za traˇzenu projekciju x∗ = PP (e2 ) vrijedi
q
ke2 − x∗ k = min x21 + (x2 − 1)2 .
x∈P
Korjena funkcija strogo raste pa dovoljno je rijeˇsiti problem kvadratne minimizacije:
min x21 + (x2 − 1)2 , x ∈ P.
¶
µ
¶
µ
¶
µ
8
12 21
12 21
,
, y ∗ = 0, , 0, 0, 0 , PP (e2 ) =
,
.
x∗ =
13 13
13
13 13
39...
75
LITERATURA
[1 ] V.M. Alekseev, E.M. Galeev, V.M. Tihomirov. Sbornik zadaˇc po optimizacii. Nauka, Moskva, 1984.
[2 ] J.M. Borwein, A.S. Lewis. Convex Analysis and Nonlinear Optimization.
Springer, New York, 2000.
Borwein J., Vanderwerff J. Convex functions: Constructions, characterizations and counterexamples CUP, 2010
[3 ] S. Boyd, L. Vanderberghe. Convex Optimization. Cambridge University
Press, 2004.
[4 ] K-H. Elster, R. Reinhardt, M. Sch¨auble, G. Donath. Einf¨
uhrung in die
nichtlineare optimierung. Teubner, Leipzig, 1977.
[5 ] P.M. Gruber. Convex and Discrete Geometry. Springer-Verlag, BerlinHeidelberg, 2007.
[6 ] J-B. Hiriart-Urruty; C. Lemarchal. Fundamentals of convex analysis. SpringerVerlag, Berlin, 2001.
[7 ] L. H¨ermander. Notions of convexity. Birkhauser, 1994
[8 ] M. Jovanovi´c. Diferencijalni raˇcun na Rn , Konveksne funkcije, Ekstremi.
Prirodno-matematiˇcki fakultet, Banja Luka, 2001.
Magaril-Il’yaev G.G., Tikhomirov V.M. Convex analysis: theory and applications TMM222, AMS, 2003
[9 ] M. Moszynska, Selected Topics in Convex Geometry. Birkh¨auser, boston,
2006.
Niculescu C.P., Persson L.-E. Convex functions and their applications: A
contemporary approach Springer, 2006
10. A. W. Roberts, D.E. Varberg. Convex functions. Academic Press, New
York and London, 1973.
11. R. T. Rockafellar. Convex Analysis. Princeton, New Yersey, Princeton
University Press, 1997.
. Stoer Witzgal Convexity
12. A. G. Suharev, A.V. Timohov, V.V. Fedorov. Kurs metodov optimizaciji.
Nauka, Moskva, 1986.
[.] J. van Tiel.
[.] F. Valentine.
13. F. P. Vasilev. Metodi Optimizacii. Faktorial Press, Moskva, 2002.
14. S. Vre´cica. Konveksna Analiza. Mat. fak. , Beograd, 1993
76
15. W. Weil. A Course on Convex Geometry. University of Karlsruhe, 2005.
16. R. Webster. Convexity. University Oxford Press Inc., New York, 1994.
77
Download

konveksna analiza 1