• Rezultati Niso Bili Najdeni

Konveksne funkcije MAGISTRSKO DELO

N/A
N/A
Protected

Academic year: 2022

Share "Konveksne funkcije MAGISTRSKO DELO"

Copied!
54
0
0

Celotno besedilo

(1)

UNIVERZA V LJUBLJANI PEDAGOˇ SKA FAKULTETA

Studijski program: Predmetno pouˇˇ cevanje

Marko Obid

Konveksne funkcije MAGISTRSKO DELO

Ljubljana, 2018

(2)

UNIVERZA V LJUBLJANI PEDAGOˇ SKA FAKULTETA

Studijski program: Predmetno pouˇˇ cevanje

Marko Obid

Konveksne funkcije MAGISTRSKO DELO

Mentor: izr. prof. dr. Marko Slapar

Ljubljana, 2018

(3)
(4)

Povzetek

V prvem delu magistrskega dela je obravnavana konveksnost funkcij ene spremen- ljivke. Definiciji konveksnosti in osnovnim lastnostim le-te, sledi uvedba pomemb- nega pojma Jensenove neenakosti. Obravnavana je zveznost in odvedljivost konve- ksnih funkcij ter dokazana povezava med konveksnostjo in drugim odvodom neke funkcije. Sledi obravnava polkonveksnosti in kvazikonveksnosti, za zakljuˇcek prvega dela pa je predstavljena ˇse funkcija Γ v povezavi s konveksnostjo. V drugem delu je obravnavana konveksnost funkcij veˇc spremenljivk, pri ˇcemer je poudarek na pove- zavi med konveksno mnoˇzico in konveksno funkcijo ter med lastnostmi obeh. Zadnje poglavje se znova ukvarja z Jensenovo neenakostjo in z izpeljavo drugih neenakosti.

Kljuˇcne besede: konveksnost, konveksna mnoˇzica, konveksna funkcija, Jensenova neenakost, zveznost, odvod

Abstract

In the first part of this master’s thesis, a convexity of functions of one variable is discussed. Following the definition and basic facts of convexity, the concept of Jensen’s inequality is introduced, followed by the continuity and differentiability of convex functions, where also a connection between the convexity and a second derivative of the function is proved. Then a concept of semi-convexity and quasi- convexity is introduced. The first part is concluded by presentation of the Γ function in connection with convexity. In the second part of thesis, the convexity of functions of more variables, or better, the convexity in a finite dimensional vector space is discussed. The emphasis is on the connection between convex sets and convex functions, where the properties of both are connected. The last section deals again with Jensen’s inequality and the other inequalities, derived from it.

Keywords: convexity, convex set, convex function, Jensen’s inequality, continuity, derivative

(5)
(6)

Kazalo

Poglavje 1. Uvod 1

Poglavje 2. Konveksnost funkcij ene spremenljivke 2

2.1. Definicije konveksnosti in osnovne lastnosti 2

2.2. Zveznost in odvedljivost konveksnih funkcij 8

2.3. Konveksnost funkcij in drugi odvod 15

2.4. Stroga konveksnost 20

2.5. Polkonveksne in kvazikonveksne funkcije 23

2.6. Funkcija ”Gama” 27

Poglavje 3. Konveksnost v veˇc dimenzijah 30

3.1. Afine in konveksne mnoˇzice 30

3.2. Konveksne funkcije v veˇc dimenzijah 35

3.3. Zveznost in odvedljivost konveksnih funkcij veˇc spremenljivk 40

3.4. Nekaj sploˇsnih neenakosti 44

Literatura 47

(7)
(8)

POGLAVJE 1

Uvod

Pojem konveksnosti sreˇcamo prviˇc ˇze v osnovni ˇsoli. Le da ne v kontekstu ma- tematike, temveˇc fizike oz. naravoslovja. Seveda gre za optiko oz. konveksne in konkavne leˇce. Pridevnik konveksne, ki izvira iz latinskega convexio, pomeni ”nav- zven zaobljen”, kar nam asociira obliko zbiralne leˇce. Pri matematiki se s poj- mom sreˇcamo pri obravnavi lastnosti funkcij, kjer poleg tistih osnovnih lastnosti (naraˇsˇcanje, padanje, definicijsko obmoˇcje in zaloga funkcije, niˇcle, poli, asimptote itd.) naletimo tudi na pojem konveksne oz. konkavne funkcije. Dijaki takrat sliˇsijo zelo poenostavljeno definicijo, da je ”funkcija na intervalu konveksna, ˇce daljica, ki povezuje poljubni toˇcki na grafu, na tem intervalu leˇzi nad grafom funkcije”. Kljub temu da se s pojmom konveksnosti znova sreˇcajo v zadnjih letnikih srednje ˇsole oz.

gimnazije, ko se v sklopu diferencialnega raˇcuna obravnava povezava med drugim odvodom funkcije in konveksnostjo, pa ta pojem skoraj vedno ostane kot nekakˇsna lastnost, ki se jo v ˇsoli sicer omeni, njenega dejanskega pomena za matematiko pa se ne prikaˇze, torej v primerjavi z drugimi ostane kar nekako izloˇcena, obstranska.

Seveda, saj je za razumevanje konveksnosti potrebno nekoliko globlje znanje mate- matike.

V tem magistrskem delu bomo skuˇsali prikazati konveksnost kot nepogreˇsljiv del matematiˇcne analize. Zaˇceli bomo s stroˇzjo matematiˇcno definicijo konveksno- sti, obravnavali njene lastnosti, zveznost in odvedljivost ter v prejˇsnjem odstavku omenjeno povezavo med konveksnostjo in drugim odvodom tudi dokazali. Po obrav- navi nekaj posebnih oblik konveksnosti, posebnih konveksnih funkcij in konjugacije bomo konveksnost ˇse razˇsirili v konˇcno dimenzionalne vektorske prostore (toˇcneje Rn). Neizogibno bo pri tem uvesti pojem konveksne mnoˇzice, s ˇcimer bomo pojem konveksnosti s funkcij razˇsirili ˇse na mnoˇzice. Na koncu bomo obravnavali nekaj osnovnih neenakosti, ki se razvijejo iz konveksnosti. Omeniti je seveda treba, da bo predstavljena zgolj osnovna konveksnost, kajti ta pojem je mogoˇce ˇse bistveno bolj razˇsiriti.

(9)

POGLAVJE 2

Konveksnost funkcij ene spremenljivke

2.1. Definicije konveksnosti in osnovne lastnosti

Konveksnost kot lastnost funkcije obiˇcajno prviˇc sreˇcamo v srednji ˇsoli, kjer reˇcemo, da je funkcija konveksna, ˇce na vsakem intervalu [x, y] graf leˇzi pod daljico, ki jo doloˇcata toˇcki A(x, f(x)) in B(y, f(y)). Na ta naˇcin se konveksnost nekako najbolj pribliˇza dijaku, saj je ta definicija dovolj ”vizualna”in pomaga razumeti to, sicer precej abstraktno lastnost funkcije. Definicija le-te nam sicer, kot bomo videli, posploˇsi zgornjo vizualizacijo.

Definicija 2.1. Funkcija je konveksna na intervalu I, ˇce za vsak par a, b∈ I, a < b in za vsak x∈(a, b) velja neenakost [3]:

f(x)≤f(a) + f(b)−f(a)

b−a (x−a).

V zgornji definiciji lahko piˇsemo t = x−ab−a, pri ˇcemer leˇzi t zagotovo na intervalu [0,1]. Tako dobimo naslednjo, bolj pogosto obliko:

f(tb+ (1−t)a)≤tf(b) + (1−t)f(a) oziroma, ˇcea in b nadomestimo z x iny:

f(tx+ (1−t)y)≤tf(x) + (1−t)f(y).

Ce si pozorno (geometrijsko) ogledamo stvar, ugotovimo, da si s pogojem (txˇ + (1−t)y) zagotovimo, da toˇcka leˇzi natanko na intervalu med x in y. Spomnimo se sedaj linearne algebre: preslikavi reˇcemo linearna, ˇce velja:

f(Ax+By) = Af(x) +Bf(y).

Takˇsen zapis bi dobili, ˇce bi neenakost v zgornji definiciji nadomestili z enakostjo.

Da linearnost v geometrijskem pomenu pomeni premico (oziroma, v naˇsem primeru, daljico med krajiˇsˇcema intervala), menda ni potrebno posebej poudarjati. Definicija konveksnosti nam torej pove, da je funkcijska vrednost na vsakem intervalu manjˇsa od pogoja za linearnost (desna stran neenakosti). Konveksni funkciji bi zato lahko rekli tudi sublinearna funkcija. Oglejmo si ˇse enkrat srednjeˇsolsko definicijo; naˇs zapis v definiciji 2.1. torej pomeni, da graf naˇse funkcije leˇzi pod daljico, ki jo

(10)

doloˇcata toˇcki na krajiˇsˇcih intervala oz. leˇzi ta daljica nad grafom naˇse funkcije. S tem smo nekako ”dokazali”enakovrednost obeh definicij.

Slika 1. Pogoj za konveksnost funkcije

Ob tem se je vredno vpraˇsati, ali je linearna funkcija (premica) konveksna ali konkavna. Odgovor je: oboje. Za njo paˇc v neenakosti iz definicije 2.1. velja enakost.

Ce smo ˇˇ ze omenili konkavnost, jo ˇse definirajmo:

Definicija 2.2. Funkcijo f imenujemo konkavna, ˇce je funkcija −f konveksna.

Ob tem velja omeniti, da funkcije veˇcinoma niso niti konveksne niti konkavne na celotnem definicijskem obmoˇcju. Tako nas pogosto zanima, na katerem delu definicijskega obmoˇcja je funkcija konveksna ali konkavna.

Omeniti velja ˇse definicijo, ki jo je zapisal ˇsvedski matematik Lars H¨ormander (1931-2012) v svojem delu Notions of Convexity [5] kot definicijo konveksnosti. Mi jo bomo zapisali kot trditev in si ogledali, da je H¨ormandrova definicija ekvivalentna zgornji, osnovni definiciji konveksnosti.

Trditev 2.3 (H¨ormander). Naj boI ⊂Rinterval na realni osi in f realna funk- cija, definirana na I. Funkcijo f je konveksna natanko tedaj, ko za vsak kompakten interval J ⊂I z robom ∂J in za vsako linearno funkcijo L velja:

sup

J

(f −L) = sup

∂J

(f −L).

V tem primeru torej gledamo natanˇcno zgornjo mejo (supremum) razlike med funkcijo f in linearno funkcijo L, ki jo geometrijsko predstavlja daljica. Na robu naˇsega intervala bi torej moral biti supremum najmanjˇsi. Ali to drˇzi? Privzemimo, da sta robova naˇsega intervala J preseˇciˇsˇci funkcij f in L. Na robovih je torej razlika med funkcijama enaka 0. KerLna tem intervalu leˇzi nadf, je razlika f−L

(11)

negativna, torej je njen supremum ˇse vedno enak 0, torej ˇse vedno enak kot na robu intervala, kar odgovarja H¨ormandrovi definiciji. Oglejmo si to ˇse v formalnem dokazu:

Dokaz. (⇒) Pokazati moramo, da za vsako linearno funkcijo L velja supJ(f− L) = sup∂J(f −L). Naj bo L1 = f(a) + f(b)−f(a)b−a (x−a) linearna funkcija. Po definiciji konveksnosti velja f(x) ≤ f(a) + f(b)−fb−a(a)(x−a), torej f(x) ≤ L1. Iz te neenakosti dobimo, da je supJ(f−L)≤supJ(L1−L) = sup∂J(L1−L). Poslediˇcno zaradi te neenakosti velja tudi supJ(f −L) = sup∂J(f−L).

(⇐) Oˇcitno, saj za L vzamemoL1 =f(a) + f(b)−fb−a(a)(x−a).Ker je supJ(f(x)− L1) = sup∂J(f(x)−L1) = 0, sledi, da je f(x)−L1 ≤ 0, torej je f(x)−f(a) +

f(b)−f(a)

b−a (x−a)≤0 in poslediˇcnof(x)≤f(a)+f(b)−f(a)b−a (x−a), s ˇcimer je konveksnost

dokazana.

Oglejmo si ˇse nekaj najosnovnejˇsih lastnosti konveksnih funkcij, in sicer nas zanima, katere operacije ohranjajo konveksnost oz. kako je z vsotami, razlikami in kompozitumi konveksnih funkcij.

Trditev 2.4. Za operacije med konveksnimi funkcijami veljata naslednji trditvi:

(1) Vsota konveksnih funkcij je konveksna funkcija.

(2) Produkt konveksne funkcije s pozitivno konstanto je konveksna funkcija.

Dokaz. Dokaˇzimo najprej prvo trditev. Naj bostaf ing konveksni funkciji. Po definiciji le-teh velja:

(f+g)(tx+ (1−t)y) = f(tx+ (1−t)y) +g(tx+ (1−t)y)

≤ tf(x) + (1−t)f(y) +tg(x) + (1−t)g(y)

= t(f +g)(x) + (1−t)(f +g)(y), kar zakljuˇci dokaz. Naj bo sedaj λ≥0 in f konveksna. Potem velja

(λf)(tx+ (1−t)y) ≤ λ(tf(x) + (1−t)f(y))

= t(λf)(x) + (1−t)(λf)(y).

Iz toˇcke (1) lahko tudi hitro izpeljemo posledico, da je vsota poljubnega ˇstevila konveksnih funkcij tudi konveksna funkcija. Pokaˇzemo pa lahko tudi izrek za ne- skonˇcne vsote in za limite konveksnih funkcij.

Izrek 2.5. Naj bodo fn konveksne funkcije na intervalu I in naj zaporedje {fn} konvergira po toˇckah proti funkciji f :I →R. Potem je f konveksna funkcija na I.

(12)

Dokaz. Za vsak n velja

fn(x)≤fn(a) + fn(b)−fn(a)

b−a (x−a), ˇce so a < x < btoˇcke iz I. Zato je

f(x) = lim

n→∞fn(x)≤ lim

n→∞fn(a) + fn(b)−fn(a)

b−a (x−a)

= lim

n→∞fn(a) + lim

n→∞

fn(b)−fn(a)

b−a (x−a)

=f(a) + f(b)−f(a)

b−a (x−a).

Izrek 2.6. Naj bodo fn konveksne na intervaluI in naj vsotaP

n=1fnkonvergira po toˇckah na I. Potem je f =P

n=1fn konveksna funkcija na I.

Dokaz. Dokaz sledi iz zgornje trditve, saj je f limita konveksnih delnih vsot

sn=f1+f2+· · ·+fn.

Izrek 2.7. Naj bodo {fα} druˇzina konveksnih funkcij v intervalu I in naj bo J mnoˇzica toˇck x∈ I, tako da je f(x) = supfα(x) manjˇsi od ∞. Tedaj je J interval (morda prazen) in f konveksna funkcija na njem.

Dokaz. Naj bosta ainb dve toˇcki, v katerih je supfα ≤ ∞ in naj boλ∈[0,1].

Za vsako funkcijo fα velja

fα((1−λ)a+λb)≤(1−λ)fα(a) +λfα(b), zato velja tudi

fα((1−λ)a+λb)≤(1−λ)f(a) +λf(b) in ˇce zopet pogledamo supremum,

f((1−λ)a+λb)≤(1−λ)f(a) +λf(b).

S tem smo hkrati pokazali, da je mnoˇzica, na kateri je supremum konˇcen, interval

in da je na njem funkcija f konveksna.

Opomba 2.8. Razlika dveh konveksnih funkcij seveda ni nujno konveksna. Vze- mimo primer funkcije f(x) = x2 −x4. Gre za razliko dveh konveksnih funkcij, a funkcija sama je konveksna le na intervalu [−1

6,1

6], zunaj tega intervala pa je kon- kavna. Podobno tudi produkt dveh konveksnih funkcij ni nujno konveksna funkcija, kot lahko vidimo iz primera x3 =x·x2.

(13)

Izrek 2.9. Naj bo f realna funkcija ene spremenljivke, definirana na intervalu I, in naj bo ϕfunkcija definirana na drugem intervalu J z vrednostmi v I. Tedaj je kompozitum funkcij f◦ϕ konveksna funkcija za vsak konveksen f, ˇce in samo ˇce je ϕafina funkcija. Prav tako je f ◦ϕ konveksna funkcija za vsak konveksen ϕ, ˇce in samo ˇce je f konveksna in naraˇsˇcajoˇca funkcija.

K temu izreku velja pripomniti, da je izraz ”afina funkcija”drugi oz. sploˇsnejˇsi, ˇce ne celo analitiˇcno pravilnejˇsi izraz za linearno funkcijo. Kot linearnost namreˇc obiˇcajno razumemo pojem iz linearne algebre, tj. da je preslikava A linearna, ko velja A(λx+µy) = λAx+µAy. Afina funkcija je sicer (algebrsko) linearna, ko gre njen graf (premica) skozi koordinatno izhodiˇsˇce. Zatorej bomo v nadaljevanju funkciji, katere osnovna enaˇcba je f(x) = ax+bin katere graf je premica, rekli afina funkcija.

Dokaz. Ce jeˇ f ◦ϕkonveksna funkcija za f(x) =x in f(x) = −x, je ϕ hkrati konveksna in konkavna, torej afina funkcija. V obratni smeri velja, daf◦ϕpodeduje lastnost konveksnosti od f, torej je konveksen, ko je ϕ afina funkcija. Prvega dela izreka torej ni bilo teˇzko dokazati. Sedaj pa drugi del. Naj bo f ◦ϕ konveksna za vsako konveksno funkcijoϕ. ˇCe vzamemoϕ(x) =x, sledi, da mora biti f konveksna funkcija. ˇCe sta y1 < y2 toˇcki v I, velja, da je ϕ(x) = y1+ (y2 −y1)|x| konveksna funkcija na intervalu [−1,1]; ˇce pa je ˇse f ◦ϕ konveksna, sledi iz predpostavk f ◦ ϕ(±1) = f(y2) in f ◦ϕ(0) = f(y1), da je f(y1) < f(y2), torej je f naraˇsˇcajoˇca funkcija. V obratni smeri pa iz predpostavke, da je f naraˇsˇcajoˇca in konveksna, sledi:

f(ϕ(λ1x12x2))≤f(λ1ϕ(x1) +λ2ϕ(x2))≤λ1f ϕ(x1) +λ2f ϕ(x2),

pri ˇcemer velja x1, x2 ∈ I, λ1, λ2 ≥ 0 in λ12 = 1. Prva neenakost velja, ker je ϕ konveksna in f naraˇsˇcajoˇca funkcija, druga pa sledi iz konveksnosti f, obe neenakosti pa po eni od definicij konveksnosti potrdita konveksnost zaf ◦ϕ.

Za konec tega razdelka si oglejmo ˇseJensenovo neenakost, ki bi jo lahko dokazali z indukcijo naniz definicije 2.2., ˇce bi v njej izrazatin 1−tzamenjali s pozitivnima λ1 inλ2, katerih vsota je 1.

Izrek 2.10. Naj bo funkcijaf konveksna na intervaluI in naj bodo toˇckex1, x2, ..., xn∈ I. Velja:

f

n

X

1

λjxj

!

n

X

1

λjf(xj);

ˇce je λ1, λ2, ..., λn≥0 in Pn

1λj = 1.

(14)

Zakaj je ta izrek tako pomemben? Zato, ker konveksnost v kombinaciji z Jense- novo neenakostjo daje nekatere najpomembnejˇse neenakosti v matematiˇcni analizi, kot so H¨olderjeva neenakost, neenakost med geometrijsko in aritmetiˇcno sredino ter neenakost Minkowskega.

(Glavni viri v tem razdelku so bili [3], [5], [8] in [9].)

(15)

2.2. Zveznost in odvedljivost konveksnih funkcij

V prvem razdelku smo si ogledali, kaj konveksnost sploh pomeni oz. kako je definirana ter katere operacije jo ohranjajo. Sedaj pa si oglejmo povezavo med konveksnostjo in zveznostjo funkcij. V tem razdelku si bomo ogledali najosnovnejˇsi izrek o zveznosti konveksnih funkcij in njegov dokaz. Kasneje bomo spoznali, da je zveznost konveksnih funkcij posebne vrste. Najprej pa ponovimo osnovne pojme o zveznosti. Glavna vira v tem razdelku bosta [2] in [5].

Definicija 2.11. Funkcijaf je zvezna v toˇckia, ˇce za vsakε >0 obstajaδ >0, da velja|f(x)−f(a)|< ε, ˇce velja|x−a|< δ.

Povedano drugaˇce, ˇce je x dovolj blizu a, potem je tudi f(x) dovolj blizu f(a).

Zveznost lahko definiramo tudi z limito: ˇce le-ta v toˇcki a obstaja in je enaka vrednosti funkcije v tej toˇcki, ki je f(a), potem je funkcija f v toˇckia zvezna.

Zveznosti je veˇc vrst, zgornja definicija se nanaˇsa na zveznost v toˇcki, ki nas bo v nadaljevanju najbolj zanimala. Imamo tudi enakomerno zveznost, levo in desno zveznost itd. Oglejmo si zadnja dva omenjena pojma, ki ju bomo tudi v nadaljevanju potrebovali:

Definicija 2.12. Naj bo f funkcija, definirana na odprtem intervalu (b, a).

Limito A = limx→af(x) imenujemo leva limita funkcije f v toˇcki a, ˇce za vsak ε >0 obstaja δ >0, da je |f(x)−A|< ε, ko je a−δ < x < a.

V tej definiciji smo uporabili odprti interval, saj za definicijo limite vrednost funkcije v toˇcki a ni pomembna in je povsem vseeno, ali je f v tej toˇcki sploh definirana. Paˇc pa je omenjena vrednost pomembna, ko gre za zveznost. Ce jeˇ limx→af(x) = f(a), pravimo, da je funkcija zvezna z leve. Na analogen naˇcin definiramo tudi desno limito in zveznost z desne:

Definicija 2.13. Naj bo f funkcija, definirana na odprtem intervalu (a, b).

Limito A = limx→a+f(x) imenujemo desna limita funkcije f v toˇcki a, ˇce za vsak ε >0 obstaja δ >0, da je |f(x)−A|< ε, ko je a < x < a+δ.

Znova velja, ˇce je limx→a+f(x) = f(a), je funkcijazvezna z desne. In seveda: ˇce je funkcija zvezna tako z leve kot z desne, je zvezna. V tem primeru je leva limita enaka desni in je hkrati limita funkcije v toˇcki a, ki je enaka f(a). Vse to bomo potrebovali pri dokazu zveznosti konveksnih funkcij.

Oglejmo si ˇse primer posebne oblike zveznosti, ki jo imenujemo Lipschitzova zveznost po nemˇskem matematiku Rudolfu Lipschitzu (1832-1903) in velja za ”naj- lepˇso”obliko zveznosti.

(16)

Definicija 2.14. Realna funkcija f :R→R je Lipschitzovo zvezna, ˇce obstaja pozitivna realna konstanta K tako, da za vsak par realnih ˇstevil x1 inx2 velja:

|f(x2)−f(x1)| ≤K|x2−x1|.

Sam pojem Lipschitzove zveznosti ima sicer svoj izvor v metriˇcnih prostorih (dy(f(x1), f(x2)) ≤ Kdx(x1, x2)). Posebna oblika Lipschitzove zveznosti je v tem primeru skrˇcitev (kontrakcija), ki pripelje do znanega Banachovega izreka o fiksni toˇcki (Banachovo skrˇcitveno naˇcelo).

Zdaj pa se posvetimo zveznosti konveksnih funkcij. ˇSe prej si poglejmo naslednjo trditev.

Trditev 2.15. Naj bo f konveksna funkcija na intervalu I in a, b, c ∈ I, a <

b < c. Potem velja

f(b)−f(a)

b−a ≤ f(c)−f(a)

c−a ≤ f(c)−f(b) c−b .

Dokaz. Zaradi konveksnosti imamo

f(b)≤f(a) + f(c)−f(a)

c−a (b−a) (1)

in zato

f(b)−f(a)

b−a ≤ f(c)−f(a) c−a . Po drugi strani iz (1) dobimo

f(c)−f(b)

c−b ≥ f(c)−f(a)− f(c)−f(a)c−a (b−a) c−b

= (f(c)−f(a))(c−a)−(f(c)−f(a))(b−a) (c−a)(c−b)

= f(c)−f(a) c−a .

S tem je trditev dokazana.

Izrek 2.16. Konveksna funkcija, definirana na odprtem intervalu, je na tem intervalu zvezna.

Dokaz. Poglejmo si nekoliko bolj grafiˇcen dokaz. Eksaktneje bomo ˇse stroˇzjo obliko zveznosti pokazali v nadaljevanju. Naj bodo a < b < c toˇcke iz intervala, na katerem je funkcija definirana. Zgornja trditev nam pove, da se toˇcka (c, f(c)) nahaja nad premico skozi (a, f(a)) in (b, f(b)). Podobno se toˇcka (a, f(a)) nahaja nad premico skozi (b, f(b)) in (c, f(c)). Zaradi konveksnosti se graf konveksne funkcije

(17)

vedno nahaja pod sekanto, zato graf funkcije nujno leˇzi v obarvanem obmoˇcju (glej Sliko 2). Funkcija je zato zvezna v b.

Slika 2. Zveznost konveksne funkcije

V primeru, ko je konveksna funkcija definirana na zaprtem intervalu [a, b], ni nujno zvezna v robnih toˇckah, kot lahko vidimo z naslednje Slike 3.

Slika 3. Konveksna funkcija, nezvezna v krajiˇsˇcih intervala

Izrek 2.17. Funkcija f je konveksna na intervalu I natanko tedaj, ko je za vsak x∈I diferenˇcni koliˇcnik f(x+h)−f(x)

h naraˇsˇcajoˇca funkcija spremenljivke h.

Dokaz. Dokaz, da je diferenˇcni koliˇcnik naraˇsˇcajoˇca funkcija, sledi neposredno iz trditve 2.15. Naj bo x∈I in h1 < h2, tako da stax+h1 inx+h2 vsebovana v

(18)

intervalu I. Potem imamo

f(x+h1)−f(x)

h1 ≤ f(x+h2)−f(x)

h2 ,

kar dokaˇze izrek. Obratno lahko vidimo, da je neenakost f(x)≤f(a) + f(b)−f(a)

b−a (x−a) ekvivalentna neenakosti

f(x)−f(a)

x−a ≤f(a) + f(b)−f(a) b−a ,

kar sledi iz predpostavke, da je smerni koliˇcnik za a naraˇsˇcajoˇca funkcija.

Naslednji, v analizi dobro poznan izrek (nekateri ga sicer zapisujejo v obliki dveh posebnih izrekov), nam bo pomagal priti do Lipschitzove zveznosti pri konveksnih funkcijah ter obravnavati njihovo odvedljivost.

Izrek 2.18. Naj bo realna funkcijaf monotona na zaprtem intervalu[a, b]. Tedaj jef zvezna, razen morda v ˇstevno mnogo toˇckah; v vsaki toˇcki obstajata leva in desna limita.

Dokaz. Brez ˇskode za sploˇsnost lahko predpostavimo, da bof naraˇsˇcajoˇca funk- cija. Imejmo toˇcko c tako, da velja a < c < b. Velja, da je f(x) ≤ f(c) za vsak x < c. Oznaˇcimo z A supremum mnoˇzice {f(x);x < c}. Za vsak ε >0 imamo nek x0, a ≤ x0 < c tako, da je A−ε < f(x0). Zaradi monotonosti funkcije f za vsak x med x0 in c velja A−ε < f(x) ≤ A. Naj bo sedaj c−x0 = δ. Tedaj prejˇsnja neenakost velja za vsakxmedc−δinc. Torej imaf levo limito v toˇckic, oznaˇcimo jo z f(c−0) = A. Ker za vsak a ≤ x < c velja f(x) ≤ f(c), je f(c−0) ≤ f(c).

Podobno bi dokazali tudi obstoj desne limite. ˇCe sta leva in desna limita enaki, je seveda funkcija v toˇcki c zvezna.

Naj bo N njena mnoˇzica toˇck nezveznosti na intervalu [a, b]. Torej imamo neko toˇcko nezveznostic,c∈N, za katero velja a < c < b. Tedaj obstaja neko racionalno ˇstevilorc, za katero veljaf(c−0)< rc< f(c+ 0). Imejmo ˇse eno toˇcko nezveznosti d, veˇcjo od c. Zaradi monotonosti f veljarc < f(c+ 0) ≤f(c+d2 )≤ f(d−0)< rd, torej rc 6=rd. Dobimo injektivno preslikavo iz N v racionalna ˇstevila, kar pomeni, da ima N enako ali manjˇso moˇc od mnoˇzice racionalnih ˇstevil Q, ki je ˇstevna, kar pomeni, da je tudi mnoˇzica toˇck nezveznosti funkcije f kveˇcjemu ˇstevna[3].

Naj bof funkcija, ki je definirana v okolici toˇckex. Potem definiramo levi odvod funkcijef kot levo limito (ˇce seveda obstaja)

fl0(x) = lim

h→0

f(x+h)−f(x) h

(19)

in desni odvod v x kot desno limito (ˇce seveda obstaja) fr0(x) = lim

h→0+

f(x+h)−f(x)

h .

Levi odvod lahko definiramo tudi v desnem krajiˇsˇcu definicijskega intervala, desni odvod pa v levem krajiˇsˇcu.

Izrek 2.19. Ce jeˇ f konveksna funkcija, definirana na odprtem intervalu I, potem obstajata levi in desni odvod funkcije f v vsaki toˇcki intervala I. Funkciji fl0 in fr0 sta naraˇsˇcajoˇci na I. ˇCe sta x1 < x2 poljubni toˇcki iz I, velja

fl0(x1)≤fr0(x1)≤ f(x2)−f(x1) x2−x1

≤fl0(x2)≤fr0(x2).

Nadalje velja, da je fr0 zvezna z desne, fl0 pa zvezna z leve.

Dokaz. Naj bo I = (a, b) odprti interval. Naj bo x ∈ I. Vzemimo δ > 0, da bo x±δ ∈ I. Po trditvi 2.15 velja, da je f(x)−f(x−δ)

δf(x+h)−f(x)h , ko je h ∈ (x, δ).

Ker je na intervalu (0, δ) funkcijah→ f(x+h)−f(x)

h naraˇsˇcajoˇca, obstaja desna limita diferenˇcnega koliˇcnika, ko gre h proti 0, torej desni odvod. Velja tudi:

f(x)−f(x−δ)

δ ≤fr0(x) = lim

h→0+

f(x+h)−f(x)

h .

Dokaz za obstoj levega odvoda je analogen. Naj bo sedaj δ > 0 tako, da je x1−δ ∈ I in x2 +δ ∈ I ter x1+δ < x2−δ. Torej za 0 < h < δ, spet po trditvi 2.15, velja:

f(x1)−f(x1−h)

h ≤ f(x1+h)−f(x1)

h ≤ f(x2)−f(x2−h)

h ≤ f(x2+h)−f(x2)

h .

Z limitami diferenˇcnega koliˇcnika, ko greh→0+, dobimo ˇzeleni rezultat. Pokaˇzimo ˇse, da je fr0 zvezna z desne (dokaz, da je fl0 zvezna z leve, je podoben). Naj bo x poljubna toˇcka ter x < x1 < x2. Pokazali smo, da velja

fr0(x1)≤ f(x2)−f(x1) x2−x1 . Zato v limiti dobimo

lim

x1→x+fr0(x1)≤ f(x2)−f(x) x2−x . Ce vzamemo desno limitoˇ x2 →x+, dobimo

lim

x1→x+fr0(x1)≤fr0(x).

Ker je fr0 naraˇsˇcajoˇca, je torej lim

x1→x+fr0(x1) =fr0(x),

kar pomeni desna zveznost.

(20)

Seveda konveksna funkcija na zaprtem intervalu nima nujno enostranskih odvo- dov v robnih toˇckah, saj v robnih toˇckah ni nujno zvezna.

Izrek 2.20. Konveksna funkcija f, definirana na odprtem intervalu I, je na vsakem zaprtem intervalu [a, b]⊂I Lipschitzovo zvezna.

Dokaz. Naj box1, x2 ∈[a, b]. x1 < x2. Vzemimo tak δ >0, da veljaa+δ < x2 inb−δ > x1. Po trditvi 2.15 dobimo za vsakh ∈(0, δ):

f(a+h)−f(a)

a ≤ f(x2)−f(x1)

x2−x1 ≤ f(b)−f(b−h)

h .

Ce sedaj to limitiramo zaˇ h→0+, dobimo:

fr0(a)≤ f(x2)−f(x1)

x2−x1 ≤fl0(b).

Poslediˇcno, ˇce doloˇcimo K = max{|fr0(a)|,|fl0(b)|}, dobimo:

|f(x2)−f(x1)| ≤K|x2−x1|,

s ˇcimer je dokazana Lipschitzova zveznost.

Izrek 2.21. Konveksna funkcija f je odvedljiva povsod, razen morda v ˇstevno mnogo toˇckah.

Dokaz. Naj bo Nf ={x∈I; fl0(x)< fr0(x)}. Iz izreka 2.19 sledi, da sta za dve razliˇcni toˇcki x1, x2 ∈ Nf intervala (fl0(x1), fr0(x1)) in (fl0(x2), fr0(x2)) disjunktna.

Zato imaNf lahko najveˇc ˇstevno mnogo toˇck, saj na vsakem takem intervalu lahko

izberemo neko racionalno ˇstevilo.

Izrek 2.22. Naj bo f odvedljiva funkcija na intervalu I ⊂ R. Potem je f konveksna funkcija na I natanko tedaj, ko je f0 naraˇsˇcajoˇca funkcija na I.

Dokaz. Ce jeˇ f konveksna in odvedljiva, potem je f0(x) = fl0(x) = fr0(x) v vsaki toˇckix∈I. Torej jef0 naraˇsˇcajoˇca. Poglejmo ˇse obrat. Naj bof0 naraˇsˇcajoˇca funkcija naI in predpostavimo, dafni konveksna. Potem obstajajo toˇckea < x < b, da toˇcka (x, f(x) leˇzi strogo nad sekanto skozi (a, f(a)) in (b, f(b)). Zato je smerni koeficient premice skozi (a, f(a)) in (x, f(x)) strogo veˇcji od smernega koeficienta premice skozi (x, f(x)) in (b, f(b)) (glej Sliko 4).

(21)

Slika 4. Primerjava smernih koeficientov

Po Lagrangeovem izreku obstajata ξ1 ∈(a, x) in ξ2 ∈(x, b), da velja f01) = f(x)−f(a)

x−a > f(b)−f(x)

b−x =f02).

Ker je ξ1 < ξ2, smo dobili protislovje s predpostavko, da je f0 naraˇsˇcajoˇca.

(22)

2.3. Konveksnost funkcij in drugi odvod

Sedaj pa si oglejmo povezave med drugim odvodom funkcije in konveksnostjo, znane ˇze iz srednje ˇsole, v nekoliko bolj matematiˇcni obliki. V srednji ˇsoli se dijaki obiˇcajno uˇcijo, da je funkcija konveksna takrat, ko je njen drugi odvod pozitiven. V nadaljevanju si oglejmo matematiko, ki stoji za to srednjeˇsolsko trditvijo. Glavna vira sta [3] in [5].

Posledica 2.23. Naj bo f dvakrat odvedljiva funkcija na odprtem intervalu I.

Tedaj jef konveksna na tem intervalu natanko tedaj, ko jef00(x)≥0za vsak x∈I.

Dokaz. Dokaz sledi iz znane posledice Lagrangeovega izreka, ki pravi, da je funkcija naraˇsˇcajoˇca naI natanko tedaj, ko je njen odvod pozitiven. Torej, f00(x)≥ 0 natanko tedaj, ko je jef0 naraˇsˇcajoˇca funkcija in v kombinaciji s prejˇsnjim izrekom dokaˇzemo, da je to natanko tedaj, ko je f konveksna.

Po zgornji posledici je npr. funkcija f(x) =eax konveksna za vsak a∈ R. Prav tako je f(x) =xr konveksna, ˇce jer ≥1 in x≥0.

Poglejmo si sedaj, kako lahko pojem drugega odvoda posploˇsimo za sploˇsne kon- veksne funkcije.

Naj bo f konveksna funkcija, definirana na odprtem intervaluI. Potem za vsak x∈I definirajmo

δf(x) = [fl0(x), fr0(x)].

δf lahko razumemo kot preslikavo iz I v potenˇcno mnoˇzico realnih ˇstevil, P(R).

Izrek 2.21 nam pove, da je δf(x) pravi interval le za morda ˇstevno mnogo toˇck, v vseh ostalih toˇckah pa jeδf(x) ena sama toˇcka. Vsako funkcijoφ :I →R, za katero za vsakx∈I veljaφ(x)∈δf(x), imenujemo selektor za δf.

Primer 2.24. Poglejmo si funkcijo f(x) = x22 +|x|.

Slika 5. Funkcija f(x) = x22 +|x|

(23)

Funkcija je konveksna, njen levi odvod je enak fl0(x) =

( x−1 ;x≤0 x+ 1 ;x >0, desno odvod pa

fr0(x) =

( x−1 ;x <0 x+ 1 ;x≥0.

Torej je

∂f(x) =





{x−1} ;x <0 [−1,1] ;x= 0 {x+ 1} ;x >0.

Selektor za∂f je vsaka funkcija, ki je enakax−1 za negativne x,x−1 za pozitivne xin ima v 0 vrednost med −1 in 1. Na primer

ϕ(x) =





x−1 ;x <0 0 ;x= 0 x+ 1 ;x >0.

Slika 6. Primer selektorja za ∂f

Naslednja trditev nam pove razliˇcne, ekvivalentne naˇcine, kako lahko definiramo drugi odvod za sploˇsne konveksne funkcije. Dokaz trditve je precej tehniˇcen in ga bomo izpustili. Bralec si ga lahko ogleda v [9].

Trditev 2.25. Naj bo f konveksna funkcija na odprtem intervalu I, x0 ∈I in

∆∈R. Naslednje trditve so ekvivalentne:

(24)

(i) Funkcija f je odvedljiva v x0 in ˇce je Df mnoˇzica toˇck iz I, v katerih je f odvedljiva, za vsako zaporedje {xn} ∈Df\{x0}, ki konvergira proti x0 velja

f0(xn)−f0(x0) x−x0 = ∆.

(ii) Funkcija fl0 je odvedljiva v x0 in velja (fl0)0(x0) = ∆.

(iii) Funkcija fr0 je odvedljiva v x0 in velja (fr0)0(x0) = ∆.

(iv) Neki selektor ϕ za ∂f je odvedljiv vx0 in velja ϕ0(x) = ∆.

(v) Za vsak selektor ϕ za ∂f je odvedljiv v x0 in velja ϕ0(x) = ∆.

(vi) Funkcija f je diferenciabilna v x0 in velja f(x0+h) =f(x0) +f0(x0)h+ ∆h2

2 +o(h2), kjer je limh→0 o(h2)

h2 = 0.

Definicija 2.26. Naj bof konveksna funkcija na odprtem intervaluI inx0 ∈I.

Ce velja eden izmed ekvivalentnih pogojev iz prejˇsnje trditve, reˇˇ cemo, da jef v x0 dvakrat odvedljiva in oznaˇcimo f00(x0) = ∆.

Ker je fr0 naraˇsˇcajoˇca funkcija, je v vsaki toˇcki, v kateri je fr0 odvedljiva, njen odvod pozitiven. Za konveksno funkcijo je torej drugi odvod pozitiven povsod, kjer le-ta obstaja. Ker sta levi (oziroma desni) odvod konveksne funkcije naraˇsˇcajoˇci funkciji, imamo kot posledico Lebesgueovega izreka ([7]) naslednji izrek:

Izrek 2.27. Vsaka konveksna funkcija je dvakrat odvedljiva skoraj povsod na svojem definicijskem obmoˇcju.

Primer 2.28. Naj bodoq1, q2, q3, . . .zaporedje, ki vsebuje vsa racionalna ˇstevila iz (−1,1), vsako natanko enkrat. Tako zaporedje seveda obstaja, saj so racionalna ˇstevila ˇstevna mnoˇzica. Definirajmo funkcijo

f(x) =

X

n=1

1

2n|x−qn|.

Funkcija je dobro definirana in zvezna na (−1,1) po Weierstrassovem kriteriju, saj je

1

2n|x−qn| ≤ 1 2n−1.

Funkcija f je konveksna, ker je vsota konveksnih funkcij. Poglejmo, da je za vsak iracionalenx funkcija f odvedljiva in njen odvod enak

f0(x) =

X

n=1

1

2nsign (x−qn).

(25)

Naj bo h > 0 majhen in x ∈ (−1,1) poljuben. Naj Q1 mnoˇzica tistih racionalnih qi, ˇstevil, za katere je x ≥ qi, Q2 mnoˇzica tistih racionalnih ˇstevil qi, za katere je qi ≥x+h inQ3 mnoˇzica tistih racionanih ˇstevil, da je x < qi < x+h. Potem je

f(x+h)−f(x)

h = X

qn∈Q1

1 2n

|x+h−qn| − |x−qn| h

+ X

qn∈Q2

1 2n

|x+h−qn| − |x−qn| h

+ X

qn∈Q3

1 2n

|x+h−qn| − |x−qn| h

= X

qn∈Q1

1

2n − X

qn∈Q2

1

2n + X

qn∈Q3

1 2n

2x+h−2qn

h .

Torej je

X

qn∈Q1

1

2n − X

qn∈Q2

1

2n − X

qn∈Q3

1

2n ≤ f(x+h)−f(x)

h ≤ X

qn∈Q1

1

2n − X

qn∈Q2

1 2n oziroma

X

qn≤x

1

2n − X

qn>x

1

2n ≤ f(x+h)−f(x)

h ≤ X

qn∈Q1

1

2n − X

qn∈Q2

1 2n. Ker greP

qn∈Q3

1

2n proti 0, ko grehproti 0 (indeksi elementov zaporedja racionalnih ˇstevil postajajo vedno veˇcji, bolj ko ˇzelimo natanˇcno aproksimiratix), je torej desni odvod enak

fr0(x) = X

qn≤x

1

2n − X

qn>x

1 2n. Analogno je levi odvod enak

fl0(x) = X

qn<x

1

2n − X

qn≥x

1 2n. V iracionalnih ˇstevilihx se odvoda ujemata in velja

f0(x) =

X

n=1

1

2nsign (x−qn), zax=qn pa imamo

fr0(qn)−fl0(qn) = 1 2n−1.

Zanimivo bi bilo videti, kako je z drugim odvodom funkcije. Zagotovo drugi odvod ne odbstaja v racionalnih toˇckah, po drugi strani pa vemo, da drugi odvod obstaja skoraj povsod. Na ˇzalost nam ni uspelo dokazati in prav tako nam ni uspelo najti v literaturi odgovorov na naslednja vpraˇsanja. Ali je funkcija dvakrat odvedljiva v

(26)

vseh iracionalnih ˇstevilih? Ali je drugi odvod enak 0 v vseh toˇckah, v katerih le ta obstaja? Ali je odvedlivost kaj odvisna od samega zaporedjaq1, q2, . . .?

(27)

2.4. Stroga konveksnost

Poseben razdelek bomo posvetili strogi konveksnosti. Ogledali si bomo dve, nekoliko razliˇcni si definiciji stroge konveksnosti. Prva, in verjetno najbolj naravna definicija stroge konveksnosti, je naslednja:

Definicija 2.29. Funkcija je strogo konveksna na intervalu I, ˇce za vsak par a, b∈I, a < b velja neenakost:

f(x)< f(a) + f(b)−f(a)

b−a (x−a).

Torej, v definiciji konveksnosti nadomestimo neenakost s strogo neenakostjo in dobimo strogo konveksno funkcijo. V prejˇsnjih dveh razdelkih smo pokazali, da je funkcija konveksna natanko tedaj, ko je odvod funkcije, ˇce seveda obstaja, naraˇsˇcajoˇca funkcija. Velja naslednja trditev.

Trditev 2.30. Naj bo funkcija f odvedljiva na odprtem intervalu I. Potem je f strogo konveksna natanko tedaj, ko je f0 strogo naraˇsˇcajoˇca funkcija.

Dokaz. Predpostavimo, da je f0 strogo naraˇsˇcajoˇca. Potem je f konveksna funkcija na intervalu I. Predpostavimo, da f ni strogo konveksna. Potem obstaja trojica toˇck a < x < b, da je

f(x) = f(a) + f(b)−f(a)

b−a (x−a),

kar pomeni, da toˇcka (x, f(x)) leˇzi na sekanti skozi (a, f(a)) in (b, f(b)). Potem seveda velja

f(x)−f(a)

x−a = f(b)−f(x)

b−x . (2)

Po Lagrangejevem izreku je f(x)−fx−a(a) =f01) in f(b)−f(x)b−x =f02), kjer jeξ1 ∈(a, x) inξ2 ∈(x, b). Ker je f0 strogo naraˇsˇcajoˇca, je f01)< f02), kar pa je v protislovju z (2). Predpostavimo sedaj, da je f strogo konveksna. Podobno, kot pri dokazu trditve 2.15, lahko pokaˇzemo, da za poljubne tri toˇcke a < b < c velja stroga neenakost

f(b)−f(a)

b−a < f(c)−f(b) c−b

in poslediˇcno za poljubne ˇstiri toˇcke a < b1 < b2 < b3 < c velja f(a+h)−f(a)

h < f(b2)−f(b1)

b2−b1 < f(b3)−f(b2)

b3−b2 < f(c)−f(c−h)

h ,

ˇce jeh dovolj majhen, da je a+h < b1 inc−h > b3. V limiti h→0+ dobimo f0(a)≤ f(b2)−f(b1)

b2 −b1 < f(b3)−f(b2)

b3−b2 ≤f0(c).

Ker staa < c lahko poljubni toˇcki, je f0 strogo naraˇsˇcajoˇca.

(28)

Pri karakterizaciji konveksnosti z drugim odvodom smo videli, da je dvakrat odvedljiva funkcija konveksna natanko tedaj, ko je drugi odvod nenegativen. V tem primeru imamo nekoliko ˇsibkejˇso trditev.

Trditev 2.31. Naj bo funkcijaf dvakrat odvedljiva na odprtem intervaluI. ˇCe je f00 strogo pozitiven na I, je f strogo konveksna na I.

Dokaz. Dokaz sledi neposredno iz dejstva, da strogo pozitiven drugi odvod

implicira strogo naraˇsˇcajoˇci prvi odvod.

Da v zgornji trditvi nimamo obrata, vidimo preprosto na primeru funkcijef(x) = x4, ki je strogo konveksna, nima pa povsod strogo pozitivnega drugega odvoda. V naˇsem posebnem primeru gre za koordinatno izhodiˇsˇce, f00(0) = 0.

Slika 7. Funkcija f(x) = x4

Kako se tej dilemi izogniti? Pogosto zato za strogo konveksnost vzamemo nasle- dnjo definicijo:

Definicija 2.32 (stroˇzja definicija stroge konveksnosti). Funkcijaf na intervalu I je strogo konveksna v toˇcki a, a ∈ I, ˇce obstaja ε > 0, tako da je f −ε(x−a)2 konveksna v okolicia.

Funkcija f(x) = x4 po tej definiciji ni strogo konveksna. Upoˇstevamo, da je a= 0 in dobimo:

(f −εx2)00=f00(x)−2ε.

Ce sedaj vstavimo naˇso funkcijoˇ f(x) =x4, dobimo:

(x4−εx2)00= (x4)00−2ε= 12x−2ε.

Ce vstavimoˇ x=a= 0,vidimo, da je le izraz negativen za vsak ε.

(29)

Trditev 2.33. Dvakrat zvezno odvedljiva funkcija f, definirana na odprtem in- tervalu I, je strogo konveksna po definiciji 2.32 natanko tedaj, ko je f00(x) > 0 za vsak x∈I.

Dokaz. Predpostavimo, da je dvakrat odvedljiva funkcija f strogo konveksna po definiciji 2.32 in naj boa ∈I. Naj boε >0 tak, da je f−ε(x−a)2 konveksna.

Potem je

f −ε(x−a)200

x=a=f00(a)−2ε≥0,

iz ˇcesar sledif00(a)>0. Obratno predpostavimo, da jef00(x)>0 za vsakx∈I. Naj boa∈I poljuben. Naj boδ >0 tak, da jef00(x)> f00(a)/2 za vsakx∈(a−δ, a+δ).

Taka δ obstaja, saj smo predpostavili, da je drugi odvod zvezen. Za ε sedaj lahko vzamemof00(a)/4, saj za x∈(a−δ, a+δ) velja

f(x)− f00(a)

4 (x−a)2 00

=f00(x)−f00(a) 2 >0.

(30)

2.5. Polkonveksne in kvazikonveksne funkcije

V tem razdelku si bomo ogledali ˇse definiciji polkonveksnih in kvazikonveksnih funkcij, ki posploˇsujeta pojem konveksnosti. ˇSe prej si oglejmo definicijo navzdol polzveznosti. Vir razdelka je [5].

Definicija 2.34. Funkcija f :I →Rje navzdol polzvezna natanko tedaj, ko za vsak x∈Rvelja:

lim inf

y→x f(y) = lim

→0(inf{f(y);y∈(a−, a+)∩I}) =f(x).

Slika 8. Navzdol polzvezna funkcija

Definicija 2.35. Naj bo f : I → R funkcija, definirana na intervalu I. ˇCe je f navzdol polzvezna in za vsak kompakten interval J ⊂ I z robom ∂J in za vsako naraˇsˇcajoˇco linearno funkcijo L velja:

sup

J

(f −L) = sup

∂J

(f −L), reˇcemo, da je f polkonveksna funkcija na I.

Razlika med konveksnostjo in polkonveksnostjo je torej v tem (ˇce odmislimo dodaten pogoj navzdol polzveznosti), da so linearne funkcije, ki nastopajo v pogoju iz definicije pri polkonveksnih funkcijah naraˇsˇcajoˇce.

Izrek 2.36. Funkcija f je na intervalu I polkonveksna, ˇce in samo ˇce:

(1) je padajoˇca in zvezna iz desne.

(2) je naraˇsˇcajoˇca in konveksna.

(3) obstaja toˇcka a ∈ I tako, da za funkcijo f velja (1) na intervalu I ∩ (−∞, a)in (2) na intervalu I∩(a,∞), velja pa tudif(a) = limx→a+f(x)≤ limx→af(x).

(31)

Prvi dve toˇcki iz izreka sta jasni in ju ni potrebno dokazovati, saj sledita nepo- sredno iz definicije. Zato bomo dokazali le tretjo toˇcko.

Dokaz. Da sta (1) in (2) zadostna pogoja, je jasno. Predpostavimo, da (3) drˇzi in da imamo afino naraˇsˇcajoˇco funkcijo L, kjer na robu∂J veljaL≥f. Torej velja tudi L(t)≥f(t), ko je a > t∈ J, saj razlika f −L po definiciji konveksnosti pada.

Torej je f(a) = limx→a+f(x) ≤ L(a), ˇce je a ∈ J, konveksnost pa nam pove, da je f ≤L, ko je a < t∈J.

Imejmo sedaj monotono funkcijo f in dokaˇzimo tudi potrebnost pogojev. Vze- mimo sedaj toˇckit1 int2 tako, da jet1 < t2 inf(t1)> f(t2). ˇCe imamo sedajt < t1, mora veljati f(t) ≥ f(t1), saj je v nasprotnem primeru izraz f(t) < f(t1) > f(t2) protisloven z definicijo in nima smisla. Naj bo sedaj naˇsa toˇcka a supremum vseh t1 ∈ I, za katere velja f(t1) > f(t2) pri nekaterih t2 > t1 iz I. To pomeni, da funkcija f naraˇsˇca desno in pada levo od a. Iz spodnje polkonveksnosti dobimo:

f(a)≤min{limx→a+f(x),limx→af(x)}. ˇCe je f(a)<limx→a+f(x), dobimo proti- slovje: ˇce je namreˇc a < t izI in f(t)≥f(a), potem za neki ε→+0 velja:

f((1−ε)a+εt)≤(1−ε)f(a) +εf(t),

pri ˇcemer gre vse skupaj protif(a), ko gre ε proti 0.

Slika 9. Primer polkonveksne funkcije

Tudi polkonveksnost je lokalna lastnost funkcije, kar lahko celo dokaˇzemo.

Izrek 2.37. Polkonveksnost je lokalna lastnost. ˇCe je f definirana na odprtem intervalu I ⊂R in za vsako toˇcko x ∈ I obstaja odprt interval J, za katerega velja x ∈ I ⊂ J in je na njem funkcija f polkonveksna, potem velja polkonveksnost tudi za I.

(32)

Dokaz. Naj bo J najveˇcji moˇzen odprt podinterval I, v katerem je f strogo naraˇsˇcajoˇca in konveksna funkcija. ˇCe jeJ neprazen interval, potem je desna robna toˇcka - oznaˇcimo jo z x0 - ista kot desna robna toˇcka intervala I. ˇCe bi bil namreˇc x0 ∈I, jef ˇze po predpostavki polkonveksna v okolici te toˇcke, zato bi bila funkcija f po zgornjem izreku konveksna na veˇcjem intervalu. Torej lahko obstaja en sam tak maksimalen intervalJ,levo od tega intervala pa mora biti funkcija padajoˇca.

Iz zaˇcetka dokaza izreka 2.20 lahko izpeljemo ˇse eno posebno varianto konve- ksnosti, ki je ˇse ˇsibkejˇsa od polkonveksnosti.

Definicija 2.38. Naj bo f : I → R funkcija, definirana na intervalu I. ˇCe je f navzdol polzvezna in za vsak kompakten interval J ⊂ I z robom ∂J in za vsako konstantno funkcijoL velja:

sup

J

(f −L) = sup

∂J

(f −L), reˇcemo, da je f kvazikonveksna funkcija naI.

Slika 10. Kvazikonveksna funkcija

Tudi za kvazikonveksnost obstaja podoben izrek, kot za polkonveksnost. Za- dostnost pogojev je oˇcitna, potrebnost pogojev pa smo ˇze pokazali kot del dokaza izreka za karakterizacijo polkonveksnosti.

Izrek 2.39. Funkcija f je na intervalu I ⊂R kvazikonveksna, ˇce in samo ˇce:

(1) je padajoˇca in zvezna proti desni.

(2) je naraˇsˇcajoˇca in zvezna proti levi.

(3) obstaja toˇckaa∈I tako, da za funkcijof velja (1) na intervaluI∩(−∞, a) in (2) na intervalu I∩(a,∞) ter f(a)≤min{limx→a+f(x),limx→af(x)}.

(33)

V nasprotju s polkonveksnostjo kvazikonveksnost ni lokalna lastnost. Funkcija, ki je lokalno kvazikonveksna, je lahko monotona v razliˇcnih intervalih, ki so med seboj loˇceni z intervali, v katerih je funkcija konstantna. ˇCe pa je funkcija lokalno kvazikonveksna in nikjer, v nobenem odprtem intervalu konstantna, potem je taka funkcija kvazikonveksna.

Slika 11. Lokalno kvazikonveksna funkcija, ki ni kvazikonveksna

(34)

2.6. Funkcija ”Gama”

Za konec tega poglavja se bomo posvetili ˇse tako imenovani ”Eulerjevi funkciji Gama”(Γ), eni od mnogih matematiˇcnih stvaritev, poimenovanih po ˇsvicarskemu matematiku Leonhardu Eulerju (1707-1783), ˇceprav je zamisel zanjo imel ˇze Legen- dre. Funkcija sicer izvira iz kompleksne analize in pomeni razˇsiritev pojma fakultete (n!) na kompleksna ˇstevila, tu pa jo bomo predstavili z oˇcmi realne analize in kon- veksnosti. Vir razdelka je [5].

Definicija 2.40. Funkcija, ki je definirana z integralom:

Γ(x) = Z

0

e−ttx−1dt,

ko jex >0, se imenuje Eulerjeva Γ (Gama) funkcija.

Slika 12. Funkcija Γ(x)

Oglejmo si nekaj sploˇsnih lastnosti funkcije. Z integracijo po delih (”per partes”) dobimo rekurzivno enaˇcbo Γ(x+ 1) =xΓ(x), seveda ˇse vedno za x >0:

Γ(x+ 1) = lim

b→∞

Z b 0

txe−tdt

= lim

b→∞

−txe−t|b0+x Z b

0

tx−1e−tdt

= lim

b→∞

−bx

eb +x lim

b→∞

Z b 0

tx−1e−tdt

=xΓ(x).

(35)

Velja tudi, da je

Γ(1) = Z

0

e−tdt =−e−t|0 = 1 in zato za vsako pozitivno celo ˇstevilo velja

Γ(n) = (n−1)!.

Naˇsa naloga seveda ni, da bi v globine raziskovali Γ funkcijo, temveˇc da jo poveˇzemo s konveksnostjo. Za funkcijof reˇcemo, da je logaritmsko konveksna, ˇce je logf konveksna funkcija.

Izrek 2.41. Funkcija Γ je edina logaritemsko konveksna funkcija na pozitivni realni osi, ki zadoˇsˇca pogojema Γ(1) = 1 in Γ(x+ 1) =xΓ(x).

Pri dokazovanju izreka si bomo pomagali s trditvijo:

Trditev 2.42. Ce jeˇ g pozitivna funkcija, definirana na intervalu I, je logg konveksna funkcija na I natanko tedaj, ko za vsak c ∈ R velja, da je t → ectg(t) konveksna funkcija na I.

Dokaz. Predpostavimo, da je logg konveksna funkcija. Potem je tudi t → ct+logg(t) konveksna. Po izreku 2.9 je funkcijat →ectg(t) konveksna, ker jeu→eu naraˇsˇcajoˇca in konveksna. Pokaˇzimo ˇse obrat. Predpostavimo, da je t → ectg(t) konveksna funkcija za vsak c. Torej je v vsakem kompaktnem intervalu J ⊂ I maksimum ectg(t) za t ∈J takrat, ko je t ∈ ∂J. To pomeni, da je tudi maksimum ct+ logg(t) takrat, ko je t∈∂J, torej je logg konveksna funkcija.

Slika 13. Funkcija log Γ(x)

(36)

Dokaz. (izreka 2.41.) Konveksnost dokaˇzemo z uporabo trditve 2.26, s katero pokaˇzemo, da je x→ecxΓ(x) konveksna za vsak c∈R. To dokaˇzemo z dvakratnim odvajanjem:

d2

dx2(ecxΓ(x)) = Z

0

e−t(c+ logt)2ecxt(x−1)dt.

Kar dobimo, je zagotovo veˇcje od 0, torej imamo konveksnost dokazano. Pokaˇzimo ˇse, da je logaritemska funkcija res edina, ki zadoˇsˇca tem lastnostim. Zapiˇsimo eno od njenih prej zapisanih lastnosti nekoliko drugaˇce:

log Γ(x+ 1)−log Γ(x) = logx.

Vidimo, da je na desni strani konkavna funkcija. Da je naˇsa funkcija log Γ res edina konveksna, sledi iz naslednjega izreka, ki ga ne bomo dokazovali:

Izrek 2.43. Naj bo h(x) konkavna funkcija za pozitivne realne x tako, da velja

h(x)

x →0, ko gre x→ ∞. Tedaj ima diferenˇcna enaˇcba g(x+ 1)−g(x) =h(x) eno in edino konveksno reˇsitevg(1) = 0.

Vidimo, da naˇsa enaˇcba ustreza toˇcno enaˇcbi iz izreka, torej je dokaz konˇcan.

(37)

POGLAVJE 3

Konveksnost v veˇ c dimenzijah

3.1. Afine in konveksne mnoˇzice

V prvem poglavju smo obravnavali konveksnost funkcij ene spremenljivke. Kon- veksnost smo vedno definirali na intervalih. Sedaj, ko razˇsirimo pojem konveksnosti na veˇc dimenzij, je treba pojem intervala razˇsiriti. V konˇcnorazseˇznem vektorskem prostoru zato ne moremo veˇc govoriti o konveksnosti znotraj intervalov, temveˇc na mnoˇzicah, ki jih imenujemokonveksne mnoˇzice. Glavni viri so [4], [6] in [8].

Definicija 3.1. Naj bo C ⊂ Rn. ˇCe za vsaka nenegativna λ1, λ2; λ12 = 1 in vsakax1, x2 ∈C velja:

λ1x12x2 ∈C.

imenujemo tako mnoˇzico konveksna mnoˇzica.

Iz definicije konveksnosti sledi, da vsaka premica seka konveksno mnoˇzico v in- tervalu, toˇcki, ali pa je presek prazen. Tako dobimo naslednjo trditev, ki velja, ker so to edine povezane podmnoˇzice R.

Trditev 3.2. Mnoˇzica C ⊂ Rn je konveksna natanko tedaj, ko je presek C s poljubno realno premico povezana mnoˇzica.

Definicija 3.3. Vsoto vektorjevPn

j=1λjxj imenujemo konveksna kombinacija vektorjevx1, . . . , xn takrat, ko so vsi koeficienti λj nenegativni, njihova vsota pa je 1.

S pomoˇcjo tega pojma lahko konveksno mnoˇzico prikaˇzemo na drugaˇcen naˇcin.

Izrek 3.4. Mnoˇzica C ⊂ Rn je konveksna natanko tedaj, ko vsebuje vse konve- ksne kombinacije svojih elementov.

Dokaz. Pokazati moramo, da je definicija konveksne mnoˇzice ekvivalentna dej- stvu, da je konveksna mnoˇzica zaprta za konveksne kombinacije veˇc kot dveh svojih elementov. Vzemimo n > 2 in predpostavimo, da je C zaprta za konveksne kombi- nacije z n−1 vektorji. Imejmo konveksno kombinacijo x= λ1x1+..+λnxn. Vsaj eden od skalarjev λj je razliˇcen od 1, saj mora biti vsota koeficientov λj enaka 1.

Imenujmo gaλ1 in naj bo:

y =λ02x2 +..+λ0nxn,

(38)

pri ˇcemer velja, da jeλ0j = 1−λλj

1. Sledi, da je λj ≥0 za j = 2, ..., n, torej je λ02+...+λ0n= λ2+...+λn

λ2+...+λn = 1.

Iz tega sledi, da jey konveksna kombinacijan−1 elementov mnoˇzice C in tudi, da je y∈C. Poslediˇcno velja tudix∈C, saj je x= (1−λ1)y+λ1x1. Namenimo nekaj besed ˇse operacijam med konveksnimi mnoˇzicami, njihovi al- gebri.

Trditev 3.5. Naj bo {Cα}α poljubna druˇzina konveksnih mnoˇzic v Rn. Potem je T

αCα konveksna mnoˇzica.

Dokaz. Naj bosta x, y ∈ T

αCα in 0 ≤ λ ≤ 1. Ker so vse Cα konveksne, je (1−λ)x+λy∈Cα za vsak α. Zato je (1−λ)x+λy ∈T

Cα.

Trditev 3.6. Naj bosta C1 in C2 konveksni mnoˇzici v Rn in λ1, λ2 ∈R. Potem je λ1C12C2 konveksna.

Dokaz. Naj bosta x, y ∈ λ1C12C2 in 0 ≤ λ ≤ 1. Potem sta x in y oblike x=λ1x12x2,y =λ1y12y2, kjer sta x1, y1 ∈C1 in x2, y2 ∈C2. Zato je

(1−λ)x+λy= (1−λ)(λ1x12x2) +λ(λ1y12y2)

1((1−λ)x1+λy1) +λ2((1−λ)x2+λy2)∈λ1C12C2.

Iz trditve seveda sledi, da je tudi λC konveksna, ˇce jeC konveksna inλ∈R, saj lahko za drugo mnoˇzico vzamemo kar prazno mnoˇzico.

Naslednja trditev ne velja za poljubne mnoˇzice, velja pa v primeru konveksnih mnoˇzic.

Trditev 3.7. Naj bo K konveksna mnoˇzica. Tedaj za λ1, λ2 ≥0 velja:

12)K =λ1K +λ2K.

Dokaz. Da sta mnoˇzici enaki, morata biti podmnoˇzici ena drugi. Brez konve- ksnosti oˇcitno velja (λ12)K ⊂ λ1K +λ2K - neke vrste trikotniˇska neenakost.

Ker pa imamo konveksno mnoˇzico, zaλ1, λ2 ≥0 in x1, x2 ∈K, velja tudi:

λ1

λ12K + λ2

λ12K ⊂K.

(39)

Definicija 3.8. Naj bodo K1, K2, . . . , Km konveksne mnoˇzice. Linearna kom- binacija takih mnoˇzic

K =λ1K12K2+· · ·+λmKm

se imenujekonveksna kombinacija mnoˇzic K1,· · · , Km, ˇce velja, da so vsi λi ≥0 in je njihova vsota 1.

Oglejmo si ˇse karteziˇcni produkt konveksnih mnoˇzic.

Trditev 3.9. Ce staˇ A ⊂ Rm in B ⊂ Rn konveksni mnoˇzici, je tudi njun karteziˇcni produkt A×B konveksna mnoˇzica v Rm+n.

Dokaz. Naj bosta (x1, y1),(x2, y2)∈A×B in 0 ≤λ≤1. Potem je (1−λ)(x1, y1) +λ(x2, y2) = ((1−λ)x1+λx2,(1−λ)y1+λy2)∈A×B.

Definicija 3.10. Naj bo C podmnoˇzica Rn. Konveksna ogrinjaˇca mnoˇzice C je najmanjˇsa konveksna mnoˇzica v Rn, ki vsebuje C. Oznaˇcujemo jo s ConvC.

Ker je presek konveksnih mnoˇzic konveksna mnoˇzica, dobimo konveksno ogri- njaˇco mnoˇzice C kot presek vseh konveksnih mnoˇzic, ki vsebujejo C.

Izrek 3.11. Naj bo M ⊂Rn. Konveksna ogrinjaˇca mnoˇzice M je sestavljena iz vseh konveksnih kombinacij elementov iz M.

Dokaz. Ze iz prejˇsnjega izreka je znano, da tako elementiˇ M kot konveksne kombinacije le-teh pripadajo ConvM. ˇCe torej s C oznaˇcimo mnoˇzico vseh kon- veksnih kombinacij elementov iz M, velja C ⊂ ConvM. Da pokaˇzemo obrat, je dovolj, da pokaˇzemo, da jeC konveksna mnoˇzica. Naj bostax=λ1x1+· · ·+λmxm iny=µ1y1+· · ·+µnyn elementa iz C in 0≤λ ≤1. Potem je

(1−λ)x+λy= (1−λ)λ1x1+· · ·+ (1−λ)λmxm+λµ1y1+· · ·+λµnyn. Ker je

(1−λ)(λ1+· · ·+λm) +λ(µ1+· · ·+µn) = (1−λ) +λ= 1,

je (1−λ)x+λy element C. S tem smo izrek dokazali.

Posledica 3.12. Naj boA={a0, a1, ..., an}konˇcna podmnoˇzicaRn. Konveksna ogrinjaˇca ConvA je sestavljena iz vseh vektorjev oblikeλ0a0+...+λnan, kjer so vsi λi ≥0 in je njihova vsota 1.

V nadaljevanju bomo potrebovali naslednji izrek.

Reference

POVEZANI DOKUMENTI

Doloˇ ci definicijsko obmoˇ cje in zalogo vrednosti funkcije. Zapiˇsi graf mnoˇ zice... b) Naj bo A mnoˇ zica vseh praˇstevil, manjˇsih

• Dovoljeni pripomoˇ cki so: kemiˇ cni svinˇ cnik, svinˇ cnik, radirka, kalkulator, matematiˇ cni priroˇ cnik in en roˇ cno zapisan list

• Dovoljeni pripomoˇ cki so: kemiˇ cni svinˇ cnik, svinˇ cnik, radirka, kalkulator, matematiˇ cni priroˇ cnik in en roˇ cno zapisan list

[25] Naj bo A mnoˇ zica vseh podmnoˇ zic od R , ki vsebujejo mnoˇ zico N ter B mnoˇ zica vseh zaporedij kompleksnih ˇstevil. Doloˇ ci moˇ ci mnoˇ zic A in B (pri tem

• Dovoljeni pripomoˇ cki so: kemiˇ cni svinˇ cnik, svinˇ cnik, radirka, kalkulator, matematiˇ cni priroˇ cnik in en roˇ cno zapisan list

• Dovoljeni pripomoˇ cki so: kemiˇ cni svinˇ cnik, svinˇ cnik, radirka, kalkulator, matematiˇ cni priroˇ cnik in en roˇ cno zapisan list

Po Tarskem je mnoˇ zica S konˇ cna tedaj in samo tedaj, kadar ima vsaka neprazna druˇ zina podmnoˇ zic mnoˇ zice S vsaj en minimalen element glede na relacijo stroge inkluzije ⊂..

V prispevku predstavimo matriˇ cno konveksne mnoˇ zice, ki so naravna posploˇ sitev konveksnosti za matriˇ cne prostore.. Ogledali si bomo ustrezno razliˇ cico matriˇ cnega