Pod omenjenimi predpostavkami za volatilnost (tipično σ ni odvisen od kontrole α in je obrnljiv) predstavimo specifično konstrukcijo stohastičnega razvoja sistema, ki je uporabna pri mnogih oblikah stohastične kontrole. V tem modelu α lahko vpliva na tendenco dinamike. Pri računanju J(α) bomo uporabili izrek Girsanova.
2.6.1 Predpostavka difuzijskega koeficienta dinamike stanja
Predpostavimo, da je d=m in je volatilnost dana s funkcijo σ: [0, T]×Ω×Rd↪→ Rd×d, ki zadošča spodnjim predpostavkam
(A1) σ je progresivno merljiv (P-merljiv) (A2) Obstaja konstanta c >0tako, da velja
(a) ∀t∈[0, T],∀ω ∈Ω,∀x, x′ ∈Rd,|σ(t, ω, x)−σ(t, ω, x′)| ≤c|x−x′|;
(b) ∀(t, ω, x)∈[0, T]×Ω×Rd, σ je obrnljiva in σ(t, ω, x)−1 zadošča
|σ(t, ω, x)−1| ≤K(1 +|x|δ) za nek δ >0 inK >0 neodvisno odt, ω;
(c) ∀t∈[0, T], ∀ω∈Ω, ∀x∈Rd, |σ(t, ω, x)| ≤c(1 +|x|)
Pod zgornjimi predpostavkami izrek 1.21 pravi, da obstaja enolična krepka rešitev X0 = (Xt0)0≤t≤T SDE
dXt =σ(t, Xt)dWt, 0≤t≤T, X0 =x, (106) ki ima enakomerno omejene momente v smislu, da
∀p≥1, E[ sup
0≤t≤T
|Xt0|p]
<∞ 2.6.2 Predpostavka tendence dinamike stanja
Tendenca je dana s funkcijob : [0, T]×Rd×A ↪→Rd, ki zadošča naslednjemu pogoju (A3) Za vsak α ∈A in x∈ Rd, je proces (b(t, x, α))0≤t≤T P-merljiv in ∃c >0,∀t ∈
[0, T],∀ω ∈Ω,∀x∈Rd,|b(t, x, ω, α)| ≤c(1 +|x|)
Pod zgornjimi predpostavkami lahko za vsak dopusten α ∈A definiramo novo ver-jetnostno mero Pα z gostoto
dPα dP =E
(∫ · 0
σ(s, Xs0)−1b(s, Xs0, αs)dWs )
T
glede na P. Z E(M) označimo Doléansov eksponent martingala M, torej E(Mt) = exp
[
Mt− 1 2⟨Mt⟩
]
, 0≤t≤T.
Opazimo, da je zaradi predpostavke o tendenci b in zaradi omejitve rasti inverza difuzijske matrike σ, Doléansov eksponent martingal in Pα verjetnostna mera ekvi-valentna P.
2.6.3 Dinamika kontrolnega sistema
Za vsako dopustno kontroloα ∈A,
dXt0 =b(t, Xt0, αt)dt+σ(t, X0)dWtα, 0≤t≤T, X0 =x, kjer proces Wα, definiran kot
Wtα =Wt−
∫ t 0
σ(s, Xs0)−1b(s, Xs0, αs)ds, 0≤t≤T,
je po izreku GirsanovaWαBrownovo gibanje pod verjetnostno meroPα. V splošnem X0 = (Xt0)0≤t≤T ni prilagojen filtraciji, generirani zWα = (Wtα)0≤t≤T, zato ne more biti krepka rešitev SDE (89), ampak je šibka rešitev.
2.6.4 Stroškovni funkcional
Predpostavimo, da je dana funkcija g : Ω × Rd ∋ (σ, x) ↪→ g(σ, x) ∈ R, tako da je g(x) FT-merljiva slučajna spremenljivka za vsak x ∈ Rd, in funkcija f : [0, T]×Ω×Rd× A ↪→R, ki zadošča predpostavki(A3)kot tendenca b. Stroškovni funkcionalJ je definiran
J(α) =EP
α[∫ T
0
f(s, Xs0, αs)ds+g(XT0) ]
, α∈A.
Predpostavimo še, da je funkcija f omejena. Kot smo že prej omenili, je cilj stoha-stičnega kontrolnega problema ta, da najdemo tako dopustno α ∈A, ki minimizira stroškovni funkcionalJ(α).
Poglejmo si naslednje primere.
Primer 2.3. Recimo, da imamo ekonomski model z eno dobrino, ki naj bo elek-trika. Njena proizvodnja naj bo vir negativnih toplogrednih plinov. Ceno elektrike definiramo kot(Pt)0≤t≤T in se razvija glede na Itôvo stohastično diferencialno enačbo
dPt
Pt =µ(Pt)dt+σ(Pt)dWt, (107) kjer predpostavimo, da sta deterministični funkciji µ in σ omejeni in v C1. Ob vsakem časut∈[0, T]podjetje izbere trenutno količino proizvodnjeqtin pripadajoče
stroške proizvodnje c(qt), kjer je c funkcija c : R+ ↪→ R, za katero predpostavimo, da je C1 in strogo konkavna. Dobiček in izguba proizvodnje ob koncu periode [0, T] sta dana z integralom
J(qt) =
∫ T 0
[Ptqt−c(qt)]dt. (108) Pravilo izpusta toplogrednih plinov je, da se ob koncu periode [0, T] izmeri komu-lativna emisija vsakega podjetja, ki vpliva na stroške. Za vsako emisijsko enoto lahko podjetje uporabi eno emisijsko dovoljenje. Definirajmo (Yt)0≤t≤T kot proces, ki poda ceno enega emisijskega dovoljenja ob času t. Da bo primer bolj enostaven predpostavimo, da je komulativna emisija Et do časa t porporcionalna proizvodnji tako, da velja Et =ϵQt. Pozitivno število ϵ predstavlja stopnjo emisij v tehnologiji proizvodnje, ki jo uporablja podjetje, Qt pa označuje komulativno proizvodnjo do vključno časa t kot
Qt =
∫ t 0
qsds.
Ob koncu časovnega intervala je strošek podjetja, ki nastane zaradi pravil glede toplogrednih plinov, enak ETYT = ϵQTYT. Podjetje lahko kupi dovoljenja in z θt označimo število dovoljenj, ki jih ima podjetje v času t. Predpostavimo, da obstaja trg, kjer lahko trgujemo z emisijskimi dovoljenji po ceni Ytv časut. Pod navedenimi pogoji je končno premoženje podjetja dano z
XT =XTq,θ =x+
∫ T 0
θtdYt+
∫ T 0
[Ptqt−c(qt)]dt−ϵQTYT, (109) kjer z x označimo začetno premoženje. Prvi integral dobimo iz trgovanja dovoljenj, drugi pojem pride iz dobička proizvodnje in na koncu odštejemo strošek emisijskega pravila. Predpostavimo, da je podjetje nagnjeno k tveganju s koristnostno funkcijo U :R→R, ki jeC1, naraščajoča in strogo konkavna ter zadošča pogojema
(U)′(−∞) = +∞ in (U)′(+∞) = 0.
Optimizacijski problem podjetja lahko zapišemo kot V(x) := sup
(q,θ)∈A
EU(XTq,θ),
kjer E označuje pričakovano vrednost pod zgodovinsko mero P in A je množica dopustne proizvodnje in trgovalnih strategij (q, θ). Da bodo kontrole dopustne, morata biti q in θ prilagojena procesa, ki zadoščata integrabilnosti iz pogoja (92).
Pokažimo, da je optimalna proizvodna strategija podjetja dana z qt∗ = (c′)−1(Pt−ϵYt).
Optimalna proizvodna strategija q∗ je neodvisna od nenaklonjenosti tveganju pod-jetja. Ko podjetje preuči obe ceni Pt in Yt, izračuna ceno, po kateri lahko proda dobrino minus strošek, ki ga bo moralo plačati zaradi emisijskega pravila. Podjetje nato uporabi popravljeno ceno, da izbere optimalno ceno proizvodnje. Integrirajmo po delih in upoštevajmo, da ima Qt omejeno totalno variacijo
QTYT =
∫ T 0
YtdQt+
∫ T 0
QtdYt =
∫ T 0
Ytqtdt+
∫ T 0
QtdYt. (110)
Lahko zapišemo XT =AθT˜ +BTθ˜, kjer sta AθT˜ =
∫ T 0
θ˜tdYt in θ˜t =θt−ϵi
∫ t 0
qsds, odvisna le od θ˜ter
BTq =x−
∫ T 0
[(Pt−ϵYt)qt−c(qt)]dt,
kar pa je odvisno od q in θ˜posebej. Recimo, da fiksiramo θ˜in optimiziramo glede na q˜ preden maksimiziramo rezultat glede na θ. Dokaz je končan, ko opazimo,˜ da U narašča in za vsak t ∈ [0, T] in ω ∈ Ω količino BTq maksimiziramo s q∗ = (c′)−1(Pt−ϵYt).
Primer 2.4. Predpostavimo, da imamo poln finančni trg z eno obveznico brez tveganja ter z enim vrednostnim papirjem, ki ju modeliramo s pripadajočo SDE
{ dPt0 =rtPt0, obveznica
dPt=Ptbtdt+PtσtdWt, delnica, (111) kjer je r obrestna mera obveznice, b stopnja rasti delnice ter σ volatilnost delnice.
Predpostavimo, da imamo evropsko opcijo z izvršno ceno K ter časom zapadlosti T. Označimo dobiček imetnika opcije z (PT −K)+, kar je FT merljivo. Zanima nas, kako bi določili premijo v času 0. Z Yt označimo premoženje prodajalca opcije v času t. Predpostavimo, da prodajalec proda opcijo po ceni y v času t = 0, torej Y0 =y. Potem prodajalec investira v delnico delež njegovega premoženja πt, ki ga imenujemo portfelj, in ostalo Yt−πt v obveznico. Predpostavimo še to, da lahko prodajalec tudi zapravi svoje premoženje in z Ct označimo vse, kar je zapravil do časat. Ta proces jeFt-prilagojen in nepadajoč. Dinamiko premoženja zapišemo kot { dYt= [rtYt+Ztθt]dt+ZtdWt−dCtY0 =y, (112) kjer je Zt = πtσt ter θt = σt−1[bt −rt] imenovan proces tvegane premije. Naloga prodajalca opcije je izbrati par(π, C)tako, da za vsako pogojno terjatevH ∈L2(FT) velja YT ≥ H. V primeru, da ta par (π, C) obstaja, rečemo da je to strategija varovanja pred tveganjem H. Poštena cena za to pogojno terjatev je najmanjša možna vrednost, za katero ta strategija obstaja in jo definiramo kot
y∗ = inf{y=Y0; ∃(π, C)⇒YTπ,C ≥H}.
Zdaj pa predpostavimo, da je prodajalec zelo pazljiv in nič ne zapravi, torej je C = 0. V tem primeru lahko izbere portfelj π tako, da je YT = H in H lahko zapišemo eksplicitno kot H =g(PT). Dan problem lahko zdaj zapišemo kot
⎧
⎨
⎩
dPt=Ptbtdt+PtσtdWt
dYt= [rtYt+Ztθt]dt+ZtdWt P0 =p, YT =g(PZ),
(113) kar pa je BSDE.